TAntispam Bot Блог разработчика
31 subscribers
15 photos
6 links
🛡 Официальный канал TAntispam Bot (TAB)
Новости разработки, обновления и руководства по защите чатов от спама.

🤖 Бот: @tantispam_bot
Download Telegram
Матрица ошибок. Февраль 2026
🔥 Обновления февраля. Часть 2 (Техническая)

1) Исправил ошибку связанную с неудалением спам-картинки с подписью. Бот распознавал такие сообщения, но не удалял (некоторые модераторы чатов жаловались на это). Косяк исправлен😊

2) Доделал дашборд со статистикой. В целом готов запустить в общий доступ как сайт, но пока не выбрал домен: жаба душит платить за него)

Как выглядит дашборд можете увидеть под постом👇
Please open Telegram to view this post
VIEW IN TELEGRAM
TAntispam Bot Блог разработчика
🔥 Обновления февраля. Часть 2 (Техническая) 1) Исправил ошибку связанную с неудалением спам-картинки с подписью. Бот распознавал такие сообщения, но не удалял (некоторые модераторы чатов жаловались на это). Косяк исправлен😊 2) Доделал дашборд со статистикой.…
👆 Стоит отметить, что еще в начале января Процент ложных срабатываний (отношение ложноположительных сообщений определённых моделью как "спам" к количеству всех сообщений которые обработала модель, в процентах) был равен 0.52%. (напомню, в июне 2025 он был равен 2.7%!)
Channel name was changed to «TAntispam Bot Блог разработчика»
🔥 Обновление марта.

- Модель
Дообучена на дополнительных данных, накопившихся за месяц с чатов.
Матрица ошибок на валидационном наборе представлена ниже👇. Можно сравнить визуально с февралём и январём.

- Код
Оптимизирована часть кода отвечающая за быстроту обработки запросов в БД.

- Логика
Спамеры не стоят на месте. В последние дни появился новый формат сообщений. Суть в том, что основное сообщение представляет собой ссылку на канал, но ссылку не простую, а через сущность message.external_reply. До сегодняшнего дня, данный объект не обрабатывался ботом. Теперь этот недочёт исправлен.

Выводы.
Заметно меньше стало ложных срабатываний. Датасет постоянно увеличивается и пополняется новыми примерами сообщений.
Впереди много нового ждет проект. Но об этом чуть позже в дальнейших постах 😉
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
TAntispam Bot Блог разработчика
В последние дни появился новый формат сообщений.
Вот такая штука.
Ботом обрабатывалась только часть содержащая «Спаасибо!!!»

Таких сообщений несколько уже. Само сообщение представляет собой ссылку на канал.
Переходить не стоит
👍1
😐Сегодня ночью лёг бот...
Все оказалось банально просто: Сервер перестал общаться с телегой (я думаю тут все ясно почему).
Решение было найдено и к сегодняшнему часу бот живее всех живых!
TAntispam Bot Блог разработчика
Вот такая штука. Ботом обрабатывалась только часть содержащая «Спаасибо!!!» Таких сообщений несколько уже. Само сообщение представляет собой ссылку на канал. Переходить не стоит
Не все так просто оказалось с подобными сообщениями...

Я так и не нашел через какой объект Telegram API передается верхняя часть сообщения. Из message. text получаем только "Спасибо!!!". Верхнюю часть сообщения не видно🤷‍♂️.
Смоделировать похожее сообщение я также не смог. Поиск в интернете ничего не дал, нейронки типа qwen, cloude толкого ничего не выдают. Пытался через HTML редактор даже разбирать. Все тщетно. Не нашел объект в Telegram API который бы это описывал.

Есть конечно подозрения что это URL как то хитро вшит через message.entites но проверить я это не могу, так как не могу повторить это сообщение😐
Вот такой замкнутый круг)
🔥 Обновление. Апрель 2026

Модель.
Очередное дообучение на данных накопленных с 30.03.2026 по 30.04.2026.
Датасет увеличен и приближается к пороговой отметке в 30000 записей. Модель ведет себя более стабильно: минимизируются ложные срабатывания.

➡️Из нововведений - цветные кнопки. Начиная с версии 9.4 у Bot API Telegram это стало возможным.

Вот. Коротким получился ежемесячный отчет =)
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍1
Всем привет! Поддержите подпиской мой второй (более глобальный) блог на тему машинного обучения.

https://t.me/markovstate

Тематика будет перекликаться в том числе и с TAB
Сегодня с 13.00 по 21.00 бот временно не работал. Проблема была в сервере. На данный момент все починил😃
1
За этот месяц поступило много обратной связи по поводу того, что бот не реагирует на ряд спам сообщений. В ближайшее время проанализирую все и выпущу отдельный пост.
👍1
🔥 Обновление. Май 2026

Немного запоздалое обновление, обычно стараюсь сделать все к последнему дню месяца.

Итак.
1. Произведено очередное дообучение. Структура модели не изменилась. Датасет обновлен.

2. Приятно удивлен тем, что количество ложных срабатываний за май было минимальным.
Сравнить с началом года можно тут.

3. Получил обратную связь от нескольких человек на предмет игнорирования ботом части сообщений. Удивлён был тем что модель их пропускала как not spam. Включил в датасет. Но примеров сообщений немного. Задумался над синтетикой (синтетический набор данных сгенерированный нейронкой).

Итог.
Бот стабилен. Свою задачу выполняет. По всем вопросам пишите на почту:
lancetFPV@yandex.ru.
Ну либо в комменты. Всегда рад обратной связи.

======================================

Я на Хабре | Марковское состояние | TAB
👍21
Конец июня. Я наконец доделал дашборд со статистикой работы бота с 01.06.2025.

https://tab.lancetnic.ru/

Теперь она доступна вам 24/7. Дашборд висит на моем недавно запущенном сайте библиотеки LANCETNIC. Именно на ней я обучал модель нейронной сети на которой работает бот.

Что касаемо дообучения модели на последних данных. Так как за месяц бота добавили с десяток групп, то объем данных существенно вырос. Выросли и потребности в мощностях дообучения. Пока этот вопрос решаю оптимизацией кода библиотеки. Так то дообучение на паузе) Отпишусь как обновиться модель