Интересное что-то
517 subscribers
2.72K photos
253 videos
139 files
4.52K links
Материалы и мысли, понадерганные отовсюду
Блог: https://t.me/asisakov_channel
Чат: https://t.me/youknowds_chat
Download Telegram
Forwarded from РИСЕРЧОШНАЯ
📱 СЕМЕЙСТВО GPT [2]

Кратко ➡️ Токены и процесс Byte Pair Encoding (BPE) помогают эффективной токенизации. Генерализация улучшает обобщающую способность моделей с использованием принципа MDL. Важность представления слов и их значимости в NLP. Дополнительные ссылки на материалы по темам включены.

Подробно ➡️ Конспект на notion

Видео ➡️ На канале Игоря Котенкова

#LLM #NLP #NOTION
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from РИСЕРЧОШНАЯ
📱 БАЗОВЫЕ RECSYS МОДЕЛИ И ПОЗИЦИОННОЕ КОДИРОВАНИЕ В GPT

Кратко ➡️ (Alternating Least Squares) и KNN (K-Nearest Neighbors) — это базовые модели рекомендательных систем, которые стоит освоить. ALS эффективно работает с разреженными матрицами пользователь-товар, а KNN ищет ближайших соседей для рекомендаций. Так же обновлена страничка с Позиционным кодированием!

Подробно ➡️ Доступно по данной ссылке

#RECSYS #NOTION
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Александр
нашел очень красивые lecture notes: https://archives.leni.sh/stanford/CS224w.pdf
Forwarded from 🇻 🇱 🇦 🇩
Без видео
Есть слайды:
https://web.stanford.edu/class/cs224w/slides/07-theory2.pdf

И доп чтение (статьи)
1 Identity-aware Graph Neural Networks
https://arxiv.org/pdf/2101.10320
2 Graph Neural Networks are More Powerful than We Think
https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=10447704
3 Counting Graph Substructures with Graph Neural Networks
https://openreview.net/pdf?id=qaJxPhkYtD
4 Position-aware Graph Neural Networks
https://arxiv.org/pdf/1906.04817
Forwarded from Dealer.AI
Про all-in на агентов.
Продолжаем наш "крестовый поход" в этот раз в стан агентов.

Из каждого утюга нонче идет,что 2025 - это год агентов. Как в опере Фигаро агенты тут, агенты там, агенты здесь, здесь все Дюша, Стас... Простите.

Тут, кстати, пояснять будет полегче т.к. антропики запилили ИМО лучший тлдр по полочкам, что такое агенты (и не обязательно LLM-based), где их и когда применять и т.п. и т.д. И всем канальям манагерам, в т.ч. тем, кто продают борду очередную ИИ стратегию хорошо бы это почитать. Если ты tupoy и не умеешь переводить с англосакского на русский вот тебе перевод адаптация.

Прочел? И чтобы Дядя больше не слышал потом, что у тебя агентская система, ибо агентский может быть только договор. И если у тебя последовательность действий с LLM это ещё не значит, что у тебя агент, возможно это все еще LLM+workflows. Кстати, именно последнее всякие ребятки с компаний выдают за агентов. Ну а че, сверху партия спустила "пересесть везде на агентов" вот и называют любой pipeline, где есть LLM теперь агентами, и закрывают плашки КПЭ.
А у вас какие были корки на работе с агентами? Пишите в комментариях.
Закат классной модели

Все мы любим делать клевые ML-модели, которые несут пользу бизнесу, и катить их в прод. Но если дополнительно ничего не делать, то рано или поздно (скорее рано) наступает «закат» модели: она перестает нести доп метрики. Почему?

1. Развиваются другие куски ml-системы
Классика в прогнозе кучи временных рядов: сначала прогноз каждого из них неплох, а в сумме все оч грустно. Поэтому добавляют модель-нормировщика: она прогнозирует сумму рядов (допустим, продажи категории товаров) и нормирует индивидуальные модели. Со временем мы добавим в индивидуальные модели сезонность, тренды, промо - они и без нормировок в сумме по категории будут работать хорошо

2. Меняется среда, для душных distribution shift
Модели антифрода устаревают мгновенно: мошенники быстро подстраиваются под них. Рекомендательные системы бьет feedback loop. К моделям прайсингам и скидок люди привыкают и начинают покупать только по скидке. Примеров много)

3. Баги
Отвалилась часть событий на фронте, кто-то поменял структуру таблиц с данными, завели новый фича тоггл, который все поломал и тд

Так что делать?
Чтобы закат модели случился попозже и не внезапно, хорошо бы:

Настроить графики мониторинга и алерты на перформанс модели. И регулярно за ними следить! Они ведь тоже устаревают)

Раз в полгода проводить обратные АВ-тесты с отрывами моделей. Я регулярно нахожу что-то, что кажется незыблемо полезным, но на самом деле уже нет

Есть и третий путь. С комфортом устроиться на берегу моря или в уютном кресле и наблюдать за закатом ml-модели. Часто это неизбежно (и нормально!), так что иногда можно просто позволить этому случиться

P.S. На фотках с кайфом наблюдаю за закатами (и иногда рассветами) солнца и мл-моделей последний год