Новостной ML-агент на n8n.
Вот-вот откроется велосезон, а у меня уже работает система, которая мониторит рынок за меня пока я занимаюсь другими делами. Архитектура универсальная, в принципе, можно запустить на любой нише, если у тебя свой бизнес.
Каждые 8 часов обрабатывает 350-500 статей из 20-30 источников, оценивает каждую по формуле и показывает мне топ-5 с кнопками опубликовать/пропустить.
hotScore = keyword_re х 0.35 + freshness х 0.30 + cross_bonus х 0.25 + history_bonus х 0.10
Дедупликация реализована через HDBSCAN и all-MiniLM-L6-v2. В отличие от k-means не нужно знать заранее сколько уникальных тем придёт.
После 30 лайков/скипов в Слэке обучается логистическая регрессия на эмбеддингах text-embedding-3-small. Прогнал на 100 примерах и получил AUC = 0.675, std = 0.123. Система уже начинает принимать решения за меня😊
Получилось ~3к строк на Python и 1 json-воркфлоу на n8n. Всё это крутится 24х7 на домашнем сервере в Docker.
#n8n #python #ML #автоматизация #петпроект #embeddings
Вот-вот откроется велосезон, а у меня уже работает система, которая мониторит рынок за меня пока я занимаюсь другими делами. Архитектура универсальная, в принципе, можно запустить на любой нише, если у тебя свой бизнес.
Каждые 8 часов обрабатывает 350-500 статей из 20-30 источников, оценивает каждую по формуле и показывает мне топ-5 с кнопками опубликовать/пропустить.
Дедупликация реализована через HDBSCAN и all-MiniLM-L6-v2. В отличие от k-means не нужно знать заранее сколько уникальных тем придёт.
После 30 лайков/скипов в Слэке обучается логистическая регрессия на эмбеддингах text-embedding-3-small. Прогнал на 100 примерах и получил AUC = 0.675, std = 0.123. Система уже начинает принимать решения за меня
Получилось ~3к строк на Python и 1 json-воркфлоу на n8n. Всё это крутится 24х7 на домашнем сервере в Docker.
#n8n #python #ML #автоматизация #петпроект #embeddings
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥2