TAntispam Bot Блог разработчика
31 subscribers
15 photos
6 links
🛡 Официальный канал TAntispam Bot (TAB)
Новости разработки, обновления и руководства по защите чатов от спама.

🤖 Бот: @tantispam_bot
Download Telegram
Заметил что бот очень часто срабатывает на сообщения о размерах шин, например: "215/65 17" , всевозможных сообщениях про суммы денег "1200 р" ит.д. Этот вопрос в процессе решения. На днях выпущу обновление, там будет изменена структура модели нейросети и переобучена на новых наборах данных. Должно меньше стать подобных ложных срабатываний.
Начну новую рубрику: "Виды спама". Думаю интересно будет глянуть вам =)

Baканcия для Myжчин 🔥🔥
Любoвник нa Hoчь 🤑🤑🤑
Hужнo пpoвoдить вpемя c жeнщинaми 💵💵💵
Зaxoди yслoвиe тyт ⬇️⬇️⬇️
HАЖИMАЙ CЮДА

#топспама
❗️Состоялся релиз новой версии TAB 4.0❗️

Что нового:
🔹 Обновлена структура модели нейронной сети. Теперь бот должен лучше погружаться в контекст сообщения.
🔹 Бот перестал ругаться на сообщения от имени чата/группы (раньше, если считал сообщение от имени чата/группы спамом, то подсвечивал его).
🔹 Бот стал еще больше оптимизирован для масштабирования проекта.
🔹 Исправлены ошибки и недочеты в коде.

Вроде всего 4 пункта, но работы было много. Много было тестов. Наверняка я все не учел, поэтому могут быть баги. Но всегда помним, что это не баг а фича)
Please open Telegram to view this post
VIEW IN TELEGRAM
Некоторые пишут что бот не работает когда ему пишешь напрямую. Напоминаю, что бот работает только в группах. В личке бот не отвечает. Это сделано намеренно, во избежании лишней нагрузки. Ибо какой может быть спам в личке?
❗️Обновление до версии 4.1❗️
🔹 Добавлена обработка и проверка на спам при изменении текста сообщения
читайте !!!! Новая услуга для Vip клиентов. ЭРОТИЧЕСКАЯ УБОРКА КВАРТИР. Молодой ,энергичный, коменикабельный, с отличной задницей домашний помошник Ромэо медленно и эротично приведёт в порядок вашу квартиру в вашем присутствии.Не интим, Не шутка. Дорого! 

#топспама
😁1
Посοбирать бычки возле библиοтеκи - 5500₽ и небοльшοй бοнус по завеρшению.

Ну тут явно речь не про бычки)

#топспама
Боль после долгой ходьбы — сигнал организма о проблемах с суставами. Но решение рядом... 

Казалось бы, что тут не так? И да, это реклама онлайн казино. Ссылку на него я по понятным причинам удалил из этого сообщения. Но вопрос остался: причем тут суставы и казино?😄
#топспама
Помогите искупать котика, очень больно царапается.
Финансово отблагодарю! 🐾💦

😺
#топспама
1😁2
У меня течет кран дома, я уже все пробовала 🤬 Помогите что-то там закрутить, заплачу 5000 рублей 🥺

#топспама
😁1
Нужен человек для погрузки стройматериалов, 5.000 в день. Вечером будет шашлык и холодное пиво!



Ну тут мб стоит написать)))
#топспама
👍1
Готовится большое обновление модели. Датасет увеличен в 3 раза!
👍1
TAntispam Bot Блог разработчика
Вот как выглядит это сообщение. При нажатии на спам, пользователь блокируется, а его сообщение удаляется. ❗️Как видите, в сообщении бота вызываются по username админы чата/группы для реагирования. Есть три условия при которых админы чата/группы отображаются…
Сейчас бот работает по такому принципу.
Но получил обратную связь, что это не всегда удобно.
Есть предложение сделать это опцией: К примеру, написав команду боту в чат, чтобы отключить упоминание админов.
Предлагаю это обсудить в комментариях под постом👇
💖 Мyжчины, у нaс еcть прeдложение! Используйте свои навыки в эcкорт-аrентстве! 💰 Прuмеряйте новую роль и зapабатывайте по вcей cтране!


Чтож...
#топспама
👍1
TAntispam Bot Блог разработчика
Готовится большое обновление модели. Датасет увеличен в 3 раза!
❗️Дообучил модель антиспам бота на обновленном большом датасете❗️

На представленной метрике показана Матрица Ошибок для тестового набора данных.
Всего в выборке было представлено 1272 сообщений типа "not spam" и 1313 сообщений типа "spam"

Каждая ячейка показывает количество прогнозов, попадающих в определенную категорию.

🔸Верхний левый квадрат (со значением равным 1221) - это истинно-негативные значения. Это правильные значения "not spam", те что модель правильно предсказала как "не спам".
🔸Верхний правый квадрат (со значением равным 51) - это ложно-позитивные значения. Это неправильные значения "not spam", те что модель предсказала как "спам". На языке математики это называется ошибкой первого рода.

🔹Нижний левый квадрат (со значением равным 179) - это ложно-негативные значения. Это неправильные значения "spam", те которые модель ошибочно предсказала как "не спам". Это называется ошибкой второго рода.
🔹Нижний правый квадрат (значение 1134) - истинно-позитивные значения которые модель правильно предсказала как "спам".

Какие выводы можно сделать из данного графика (метрики)? То что из общего числа сообщений 2585, количество правильных предсказаний (Accuracy) составляет ≈ 91.1%.
Также видно, что модель чуть чаще пропускает спам сообщения, чем не спам.

Итог.
Матрица Ошибок показывает, что модель обладает неплохой точностью. Но часть спама пропустит. А вот количество ложных срабатываний будет чуть меньше. Для конечного пользователя это тоже хорошо: бот должен меньше ругаться на ваши сообщения. Но одно дело анализ после обучения, а другое практика. Именно она самый суровый судья.
👍1🔥1
Ребят срочно!!!
Кто знает хороший заработок😶‍🌫️ мне надо срочно!
Я взяла из тайника деняг у родителей 3500р А эти деньгр были на памятник бабушке я не знала!!! Папа сказал если не верну выгонет из дома😰 ПОЖАЛУЙСТА ПОМОГИТЕ...

#топспама
😱1
Такое дело. Нашел ошибку в моделе... Причем принципиальную. Если вкратце, то тот слой что отвечает за механику запоминания контекста - не работает. Это напрямую связано с ложными срабатываниями.
Решение проблемы - переписывание кода моей библиотеки на которой написана основная логика классификации сообщений. На это нужно время. А пока, как временное решение - постоянное дообучение на ложноположительных данных. Это не решит проблему, но мб хотя бы снизит их количество.
Сейчас пошло много подобного рода спам-сообщений:

Слушай, бывают такие моменты когда нас что-то сильно сбивает с курса 🙃. Но не стоит забывать что образование открывает много дверей и знания всегда пригодятся. А если ты запутался в своих мыслях, рекомендую заглянуть к @**********. Там помогут разобраться и найти свою мотивацию!


Бот не отреагировал на пару подобных. Все из за новых паттернов. Но ничего. Уже переобучил)
Выше я уже приводил пример спам сообщений про мужской эскорт. Заметил, что активность такого рода спама за последний месяц прям выросла😒
❗️Как добавить бота в чат?
(Пост актуален и обновляется по мере обновления бота и добавления новых фич)

Все просто:

1. 🔍 Находим бота @tantispam_bot в поиске.
2. Добавляем бота @tantispam_bot в свою группу/чат и т.д.
3. 👮 Предоставьте боту права администратора на удаление сообщений и возможность блокировки пользователя.
И все! Бот работает.

🔹У бота есть два режима работы:

- СТАНДАРТНЫЙ Режим (по умолчанию при добавлении бота).
Вызов командой
/handbot
в группе/чате. Права смены режима доступны только модераторам чата.

Принцип работ СТАНДРАТНОГО режима:
Каждое сообщение прогоняется через нейронку. Она выдает свой вердикт: спам или не спам. При подозрении на спам появляется сообщение в чате с просьбой модераторам чата/группы проверить это сообщение и принять решение. Сообщение выглядит так: https://t.me/tantispam/9
Если имело место ложное срабатывание, то нажав на инлайн кнопку "Это не спам", сообщение пользователя остается, а в датасет заносится запись ложного срабатывания для дальнейшего дообучения модели.
При нажатии "Это спам" сообщение удаляется, а пользователь блокируется.
Бот может удалять сообщения автоматически если выполняется ряд условий одновременно: пользователь находится в базе спамеров и его сообщение нейронка определила как спам. Это позволяет избежать ложных банов.

- АВТОМАТИЧЕСКИЙ Режим (БЕТА тест).
Вызов командой
/autobot
в группе/чате. Права смены режима доступны только модераторам чата.

Принцип работы АВТОМАТИЧЕСКОГО режима:
Каждое сообщение прогоняется через нейронку. Она выдает свой вердикт: спам или не спам. Если модель определила ваше сообщение как спам, то оно удаляется, без занесения пользователя в банлист.
Бот может удаляет и банит одновременно только в том случае, если выполняется ряд условий одновременно: пользователь находится в базе спамеров и его сообщение нейронка определила как спам.

🔹Для нераспознанных спам сообщений есть команда /spam. Пометьте подозрительное сообщение и модераторам чата/группы вылезет сообщение о принятии решения спам/не спам.

🔹Напоминаю, что боту бесполезно писать в ЛС. Он не обрабатывает личку. Бот создан для групп и чатов.

🔹И да, бот бесплатный😄

По всем вопросам пишите сюда в комментарии.

Официальный канал TANTISPAM бота
Подпишись!
1🔥1