TAntispam Bot Блог разработчика
31 subscribers
15 photos
6 links
🛡 Официальный канал TAntispam Bot (TAB)
Новости разработки, обновления и руководства по защите чатов от спама.

🤖 Бот: @tantispam_bot
Download Telegram
Нужен человек для погрузки стройматериалов, 5.000 в день. Вечером будет шашлык и холодное пиво!



Ну тут мб стоит написать)))
#топспама
👍1
Готовится большое обновление модели. Датасет увеличен в 3 раза!
👍1
TAntispam Bot Блог разработчика
Вот как выглядит это сообщение. При нажатии на спам, пользователь блокируется, а его сообщение удаляется. ❗️Как видите, в сообщении бота вызываются по username админы чата/группы для реагирования. Есть три условия при которых админы чата/группы отображаются…
Сейчас бот работает по такому принципу.
Но получил обратную связь, что это не всегда удобно.
Есть предложение сделать это опцией: К примеру, написав команду боту в чат, чтобы отключить упоминание админов.
Предлагаю это обсудить в комментариях под постом👇
💖 Мyжчины, у нaс еcть прeдложение! Используйте свои навыки в эcкорт-аrентстве! 💰 Прuмеряйте новую роль и зapабатывайте по вcей cтране!


Чтож...
#топспама
👍1
TAntispam Bot Блог разработчика
Готовится большое обновление модели. Датасет увеличен в 3 раза!
❗️Дообучил модель антиспам бота на обновленном большом датасете❗️

На представленной метрике показана Матрица Ошибок для тестового набора данных.
Всего в выборке было представлено 1272 сообщений типа "not spam" и 1313 сообщений типа "spam"

Каждая ячейка показывает количество прогнозов, попадающих в определенную категорию.

🔸Верхний левый квадрат (со значением равным 1221) - это истинно-негативные значения. Это правильные значения "not spam", те что модель правильно предсказала как "не спам".
🔸Верхний правый квадрат (со значением равным 51) - это ложно-позитивные значения. Это неправильные значения "not spam", те что модель предсказала как "спам". На языке математики это называется ошибкой первого рода.

🔹Нижний левый квадрат (со значением равным 179) - это ложно-негативные значения. Это неправильные значения "spam", те которые модель ошибочно предсказала как "не спам". Это называется ошибкой второго рода.
🔹Нижний правый квадрат (значение 1134) - истинно-позитивные значения которые модель правильно предсказала как "спам".

Какие выводы можно сделать из данного графика (метрики)? То что из общего числа сообщений 2585, количество правильных предсказаний (Accuracy) составляет ≈ 91.1%.
Также видно, что модель чуть чаще пропускает спам сообщения, чем не спам.

Итог.
Матрица Ошибок показывает, что модель обладает неплохой точностью. Но часть спама пропустит. А вот количество ложных срабатываний будет чуть меньше. Для конечного пользователя это тоже хорошо: бот должен меньше ругаться на ваши сообщения. Но одно дело анализ после обучения, а другое практика. Именно она самый суровый судья.
👍1🔥1
Ребят срочно!!!
Кто знает хороший заработок😶‍🌫️ мне надо срочно!
Я взяла из тайника деняг у родителей 3500р А эти деньгр были на памятник бабушке я не знала!!! Папа сказал если не верну выгонет из дома😰 ПОЖАЛУЙСТА ПОМОГИТЕ...

#топспама
😱1
Такое дело. Нашел ошибку в моделе... Причем принципиальную. Если вкратце, то тот слой что отвечает за механику запоминания контекста - не работает. Это напрямую связано с ложными срабатываниями.
Решение проблемы - переписывание кода моей библиотеки на которой написана основная логика классификации сообщений. На это нужно время. А пока, как временное решение - постоянное дообучение на ложноположительных данных. Это не решит проблему, но мб хотя бы снизит их количество.
Сейчас пошло много подобного рода спам-сообщений:

Слушай, бывают такие моменты когда нас что-то сильно сбивает с курса 🙃. Но не стоит забывать что образование открывает много дверей и знания всегда пригодятся. А если ты запутался в своих мыслях, рекомендую заглянуть к @**********. Там помогут разобраться и найти свою мотивацию!


Бот не отреагировал на пару подобных. Все из за новых паттернов. Но ничего. Уже переобучил)
Выше я уже приводил пример спам сообщений про мужской эскорт. Заметил, что активность такого рода спама за последний месяц прям выросла😒
❗️Как добавить бота в чат?
(Пост актуален и обновляется по мере обновления бота и добавления новых фич)

Все просто:

1. 🔍 Находим бота @tantispam_bot в поиске.
2. Добавляем бота @tantispam_bot в свою группу/чат и т.д.
3. 👮 Предоставьте боту права администратора на удаление сообщений и возможность блокировки пользователя.
И все! Бот работает.

🔹У бота есть два режима работы:

- СТАНДАРТНЫЙ Режим (по умолчанию при добавлении бота).
Вызов командой
/handbot
в группе/чате. Права смены режима доступны только модераторам чата.

Принцип работ СТАНДРАТНОГО режима:
Каждое сообщение прогоняется через нейронку. Она выдает свой вердикт: спам или не спам. При подозрении на спам появляется сообщение в чате с просьбой модераторам чата/группы проверить это сообщение и принять решение. Сообщение выглядит так: https://t.me/tantispam/9
Если имело место ложное срабатывание, то нажав на инлайн кнопку "Это не спам", сообщение пользователя остается, а в датасет заносится запись ложного срабатывания для дальнейшего дообучения модели.
При нажатии "Это спам" сообщение удаляется, а пользователь блокируется.
Бот может удалять сообщения автоматически если выполняется ряд условий одновременно: пользователь находится в базе спамеров и его сообщение нейронка определила как спам. Это позволяет избежать ложных банов.

- АВТОМАТИЧЕСКИЙ Режим (БЕТА тест).
Вызов командой
/autobot
в группе/чате. Права смены режима доступны только модераторам чата.

Принцип работы АВТОМАТИЧЕСКОГО режима:
Каждое сообщение прогоняется через нейронку. Она выдает свой вердикт: спам или не спам. Если модель определила ваше сообщение как спам, то оно удаляется, без занесения пользователя в банлист.
Бот может удаляет и банит одновременно только в том случае, если выполняется ряд условий одновременно: пользователь находится в базе спамеров и его сообщение нейронка определила как спам.

🔹Для нераспознанных спам сообщений есть команда /spam. Пометьте подозрительное сообщение и модераторам чата/группы вылезет сообщение о принятии решения спам/не спам.

🔹Напоминаю, что боту бесполезно писать в ЛС. Он не обрабатывает личку. Бот создан для групп и чатов.

🔹И да, бот бесплатный😄

По всем вопросам пишите сюда в комментарии.

Официальный канал TANTISPAM бота
Подпишись!
1🔥1
TAntispam Bot Блог разработчика pinned «❗️Как добавить бота в чат? (Пост актуален и обновляется по мере обновления бота и добавления новых фич) Все просто: 1. 🔍 Находим бота @tantispam_bot в поиске. 2. Добавляем бота @tantispam_bot в свою группу/чат и т.д. 3. 👮 Предоставьте боту права администратора…»
Готовлю масштабное обновление бота.

Будет добавлено два режима работы☝️

Все ближе к выходным😎
1🔥1
❗️Обновление до версии 5.0❗️

То о чем говорилось - свершилось.

Что нового:
🔹Добавлено два режима работы бота:
- СТАНДАРТНЫЙ Режим (по умолчанию). Вызов командой /handbot в группе/чате. Права смены режима доступны только модераторам чата.
Каждое сообщение прогоняется через нейронку. Она выдает свой вердикт: спам или не спам. При подозрении на спам появляется сообщение в чате с просьбой модераторам чата/группы проверить это сообщение и принять решение. Сообщение выглядит так.
Если имело место ложное срабатывание, то нажав на инлайн кнопку "Это не спам", сообщение пользователя остается, а в датасет заносится запись ложного срабатывания для дальнейшего дообучения модели.
При нажатии "Это спам" сообщение удаляется, а пользователь блокируется.
Бот может удалять сообщения автоматически если выполняется ряд условий одновременно: пользователь находится в базе спамеров и его сообщение нейронка определила как спам. Это позволяет избежать ложных банов.

- АВТОМАТИЧЕСКИЙ Режим (БЕТА тест). Вызов командой /autobot в группе/чате. Права смены режима доступны только модераторам чата.
Каждое сообщение прогоняется через нейронку. Она выдает свой вердикт: спам или не спам. Если модель определила ваше сообщение как спам, то оно удаляется, без занесения пользователя в банлист.
Бот может удаляет и банит одновременно только в том случае, если выполняется ряд условий одновременно: пользователь находится в базе спамеров и его сообщение нейронка определила как спам.

🔹Переобучена модель нейронной сети на обновленном датасете и с новыми гиперпарметрами.

🔹Появилась команда /help

🔹Всевозможные мелкие исправления по всему коду.

При выборе режима советую подумать. Все зависит от вашей группы/чата и аудитории в ней. Многих пугает плашка "Это спам?". Если так, то выбирайте АВТОМАТИЧЕСКИЙ режим работы. (По умолчанию при добавлении бота стоит СТАНДАРТНЫЙ режим).

Инструкция "Как добавить бота в чат" доступна по ссылке.
Работы как обычно много еще. Совершенству нет предела. Багов не бывает, это все фичи!

Поддержите мой проект подпиской на официальный канал TANTISPAM бота. Все последние новости и обновления тут.
1👍2
📊 Немного статистики и тестов.

Последняя модель была переобучена в прошедший понедельник. Структура модели не поменялась, а вот датасет удалось увеличить в два (!) раза. И это не синтетические данные, а реальные сообщения.

Теперь о тестах.
Мне удалось спарсить комментарии одного регионального паблика и прогнать через модель. Было интересно, какой процент ложных срабатываний будет на реальных данных.
Результат приятно удивил.
Из 181364 (не спам) сообщений 1021 ложных срабатываний. Это 0.6%. Получается 6 из 1000 обычных сообщений определяет как ложноположительные.
Вполне достойный результат считаю.
1🔥1
Обновил модель! Посмотрим что получится)
1
Уважаемые участники чатов, а также владельцы! Это пост для вас😃
Наш антиспам бот @tantispam_bot по умолчанию работает в стандартном (полуавтоматическом) режиме. Он блокирует явных спамеров, анализируя их сообщения. Его алгоритмы написаны таким образом, чтобы исключить возможность случайной блокировки (именно поэтому вы видите в чате сообщение: " Это спам?".
Иногда такое сообщение вылезает на обычные сообщения. Это ложные срабатывания (Бот под капотом имеет модель нейросети, которая анализирует сообщения). Ложные срабатывания это погрешность. В данном случает погрешность составляет около 6 ложноположительных срабатываний на 1000 сообщений.

Прошу не волноваться если ваше сообщение было помечено ботом. Модераторы и администраторы чатов в таком случае вручную анализируют его и принимают решение.

За полгода работы бота в более чем в 20 чатах был только один случай ложной автоматической блокировки. И то, потому что сошлось множество уникальных факторов. Человека сразу же разбанили естественно и все с ним хорошо. Над этой проблемой работаем. Будет фикс. Аккаунты для связи указаны в описании канала. Всем добра👍
До конца года планирую сделать большой тест бота на выявление спама, ложноположительных срабатываний и выкатить подробную статистику работы за 2025 год. Подведем итоги года так сказать)
Год подходит к концу, а значит самое время подвести итоги!

ЧАСТЬ 1. Общая статистика

Бот начал свою миссию весной в режиме бета тестирования.
Полноценный релиз состоялся 1 июня 2025 года.

На сегодняшний день:
🔹 Бот модерирует 19 чатов 💬
🔹 Обнаружено 4️⃣2️⃣0️⃣3️⃣ спам - сообщений 🗑
🔹 Заблокировано 3️⃣5️⃣8️⃣2️⃣ спамера 🚫👤
Год подходит к концу, а значит самое время подвести итоги!

ЧАСТЬ 2. Статистика по месяцам. Динамика

Как видно из графиков, количество спамеров только растет в течении года. Июль, правда, почему-то выбивается из тренда😐