Интересное что-то

🤖

Как с помощью GPT я читаю и запоминаю посты из 100 Telegram каналов и не схожу с ума

🔥

Ребята, хочу рассказать как за новогодние я хакнул свое обучение. С Gemini (или СhatGPT) и NotebookLM я теперь читаю сотню Telegram-каналов за 2 часа в неделю и держу под рукой структурированные знания, которые постоянно обновляются.

Делюсь с вами лайфхаком по бусту чтения и запоминания тысяч постов из каналов, книг и курсов в 2025 🏄

Как мы с GPT читаем и запоминаем тысячи ранее опубликованных постов из Telegram-каналов

1️⃣ Через «Экспорт истории чатов» я выгрузил в HTML все посты из каналов, которые считаю интересными (список, ссылки и описание каналов, которые я читаю).

2️⃣ В Яндекс Браузере перевел HTML в PDF и загрузил их в NotebookLM (для работы из РФ понадобится VPN).

3️⃣ Задаю NotebookLM вопросы по интересующим темам, в ответах получаю в том числе ссылки на источники — посты в каналах. Если хочется разобраться глубже, то иду в Telegram и нахожу пост через поиск по цитате из ответа.

4️⃣ Вытягиваю нужные тексты из NotebookLM в свои доки по темам и дополняю личными знаниями. Так получается единое хранилище: мой опыт + знания от сотни авторов интересных мне каналов.

Фишки для буста моего обучения с NotebookLM

🔴

Аудиоподкаст и голосовое общение с GPT. На основе загруженных постов NotebookLM создает подкаст с двумя ведущими, которые обсуждают заданную мной тему. Говорю с ними вслух, что помогает лучше усваивать материал, прокачивать язык и получать новые идеи.

🔴

Проверка усвоения. С помощью специального промпта для GPT (пришлю его в коммент к посту) можно провести проверку моих знаний по добавленному материалу из постов. GPT создает тест, проверяет меня на ошибки, объясняет и подсказывает, о чём надо помнить, чтобы дать правильный ответ.

🔴

Объединение знаний с собственными документами, топовыми книгами и курсами. В свои блокноты Notebook LM я также добавляю конспекты из книг, курсов и идеи из Telegram-каналов накладываются на фундаментальные знания. Итогом получается ещё более целостная картина.

Как мы с GPT еженедельно читаем и запоминаем сотни новых постов из Telegram-каналов

1️⃣ Я подключил @thecronicabot, который собирает новый контент из выбранных мной каналов в отдельный чат, чтобы не собирать все руками.

2️⃣ Каждую пятницу делаю «Экспорт историю чата» в новый HTML, загружаю его в GPT и через специальный промпт спрашиваю, что интересного появилось во всех каналах и по разным темам отдельно. В ответ GPT дает подборки и ссылки на посты для более глубокого изучения.

3️⃣Конвертирую HTML в PDF и добавляю его NotebookLM. Чтобы вся база из старых и новых постов оставалась в едином месте, я добавляю новые PDF-файлы в NotebookLM каждую неделю.

🔍 Подробный разбор и примеры для каждого упомянутого мной выше пункта — в моей статье на vc.ru.

💭 Уметь постоянно учиться — это отдельный скилл, с которым связан потенциал для развития каждого из нас. А этот потенциал всегда рассматривается при любых кадровых решениях и часто влияет на финальный выбор даже директоров крупных компаний.

Надеюсь, что мой пост поможет вам забустить скилы обучения. А 2025 будет для вас топовым, в том числе потому, что вы сможете еще быстрее прокачивать знания и навыки.

❤️ и 👍 - если пост полезен и вам интересно посмотреть все промпты, примеры по теме чтения и обучения с GPT
💬 - поделитесь опытом как справляетесь с объёмными постами, книгами и курсами. Какие у вас лайфхаки по быстрому чтению и запоминанию? Мне интересно 🙂

Мальцев: Карьера. Маркетинг. AI.

Please open Telegram to view this post

VIEW IN TELEGRAM

vc.ru

Как с помощью GPT я читаю и запоминаю посты из сотни Telegram каналов и не схожу с ума

Я отвечаю за маркетинг Яндекс Браузера (ex CMO Яндекс Путешествия, Playrix, eBay и консультант League of Legends, Tinkoff, Sber, VK). Подпишитесь на мой telegram-канал «Мальцев: Карьера. Маркетинг. AI», где я делюсь своим опытом по применению нейросетей для…

74 views18:49

Интересное что-то

#ml #competition

57 views07:29

Интересное что-то

Forwarded from adapt compete evolve or die

Закончилось соревнование Jane Street Real-Time Market Data Forecasting где надо было предсказывать не пойми что на не пойми каких фичах 🤷 Однако, какой-то гений из MIT отреверсинжинирил, что это не совсем не пойми чо, а простое скользящее среднее 20 подряд не пойми чего. Техника, которой он это сделал, интересная, мне понравилось. Никак мне не помогло, хотя я пару дней очень пытался из этого что-то выжать.

В соревновании был специфический для временных рядов способ принимать ответы - признаки, соответствующие последовательным моментам времени давались друг за другом и тебе не давали следующую порцию, пока не дал ответ к предыдущей. Временное ограничение - 1 минута. Но суммарный лимит 9ч, что приводит к тому, что надо давать ответы в среднем за 0.2сек. Раз в 968 шагов, что соответствует одному торговому дню, давали ответы за весь предыдущий день. Что давало интересные возможности, о которых ниже.

В последний день злодеи выкинули меня из золота паблика, хотя я тоже сделал свой лучший сабмит, исправив ошибки, как водится. Ну ничего, прайват будет настигать нас инкрементальными обновлениями аж до июля.

Я не придумал ни одной работающей идеи, но вот что мне помогло финишировать в топ-20:
1) Online learning. Нейронки отлично учатся на новых данных, самый лучший сетап - просто скормить им день как батч с низким lr. Деревья неожиданно тоже учатся и в итоговый ансамбль вошел lightgbm, для которого использовал метод refit для обновления. В среднем онлайн обучение давало маленький, но довольно надежный бонус к скору. Учится быстро (около 3 секунд суммарно на все мои модели раз за день)
2) Online ансамбль. Ну а почему бы и нет, раз уж мы модели можем дообучать, то и однослойный mlp с весами моделей в ансамбле тоже можем. Не смотря на метрику соревнования (weighted R2 ~ MSE) лучшим лоссом для ансамбля у меня был MAE.
3) TabM! Открытие ушедшего года, супер-модель, которая без всяких хитрых эмбеддингов, хотя она умеет и это, бьет на всех моих около-табличных бенчмарках все остальное, а кое-где и бусты. Без всяких наворотов, соло-модель на дефолтных фичах с онлайн обучением (и даже без) обгоняло лучший публичный ансамбль. Удивительно! Единственное что я сделал - странный лосс и отказ от использования категориальных фичей (с низкой кардинальностью). Использовал их как числа, отнормализовав в [0,1].
4) SWA спасение от стохастики в выборе гиперпараметра - сколько эпох учить. Вытягивает максимум за заданное число эпох
5) Валидация. Последние 120 дней, размером как паблик. Ну такое. Чем ближе к паблику, тем лучше бьются числа, но корреляция слабая. Однако! Лучшие гиперпараметры на валидации как-будто воспроизводят и лучший паблик. Использовал количество эпох для обучения как гиперпараметр и учил на полном датасете (включая бывшую валидацию)
6) Трансформер. Послабее чем TabM, но забустил скор в ансамбле. Нам дан не один ряд, а много рядов, соответствующих каким-то торговым тикерам. Крипта, фьючерсы или стоки - не так важно. Используем кросс-аттеншн чтобы спроецировать фичи с учетом других тикеров и на получившихся фичах гоняем RNN по времени. Трансформер по времени очень жруч по ресурсам, я даже не смог его довести до сабмита, а RNN позволяет сохранять стейт и применяться только к текущей порции данных. Возможно, тут я и проиграл и трансформер по времени был ключем для победы.
7) Хитрый лосс. MSE почему-то не коррелировал особо с R2. а вот MSE / var(y) коррелировал. Почти все модели обучены с ним.
8 ) Чего-то по мелочи, одна из моделей предсказывает вместо таргета целый ряд, на который сообразно реверс-инжинирингу накладываем лоссы из известных SMA. Не зашло, но чуть-чуть забустило ансамбль.

Смотрю на возможный шейкап позитивно, модель 6 обладает некоей сезонностью и паблик для нее плохое время, а потом (приват) должно быть хорошим 😂 Надеюсь, онлайн ансамбль вытянет. Паблик был намного стабильнее моей валидации, так что большого шейкапа не жду, буду удивлен, если он случится.

56 views07:29

Интересное что-то

#ml #dl

58 views07:32

Интересное что-то

Forwarded from Data Blog

📈 Привет, друзья!

Сейчас работаю над обзором по explainable AI для мультимодальных моделей (задачка со звездочкой, не скажу, что закончу скоро, но стараюсь!)

Наткнулась на любопытную статью: Mapping the Mind of an Instruction-based Image Editing using SMILE.

Суть: товарищи представляют интерпретируемость на основе локальной модели — метод LIME на максималках — для построения тепловой карты влияния текстовых элементов на созданное изображение.

Что делают:
* Разбивают текстовую команду на ключевые слова.
* Генерируют изображения, изменяя команды, чтобы выявить влияние каждого слова.
* Создают визуальные тепловые карты (heatmaps), отображающие вес каждого слова в процессе редактирования изображения.

Фишка SMILE: вместо простого расстояния (например, косинусного, как у классического LIME) используют расстояние Васерштейна (и дотягивают к нему модель, обученную на извлечение признаков).

Что примечательно: LIME, в контексте XAI — пионер, он был предложен 2016 году, в статье ""Why Should I Trust You?" Explaining the Predictions of Any Classifier". Уникальность LIME — в качестве результата не коэффициенты влияния или графики, а суррогатная модель, объясняющая, как работает чёрный ящик.

С того времени LIME активно адаптировали: есть версии для временных рядов, графов, звука — карточки из статьи прикрепляю к посту. И вот мы дошли до генерации. Ну, красота.

На что хочу обратить внимание? Классические методы вроде LIME всё ещё мощный инструмент. Их потенциал огромный, особенно если адаптировать под задачи! Прямо рекомендую добавить их в свой XAI-инструментарий.

Меня это прям восхищает.

Не запланировано овладела большим количеством свободного времени и сейчас делаю ещё два материала. Первый — открытый (бесплатный) курс на степике по интерпретируемым моделям. Большой курс у меня уже есть (и он тоже растет), решила сделать поменьше)

Второй — обзорный курс на механистическую интерпретируемость. Тоже будет открытым.

Как только доделаю, будут ссылки! 😌

До встречи!
Ваш, Дата-автор!

66 views07:32

Интересное что-то

#llm

64 views07:34

Интересное что-то

Forwarded from Dealer.AI

RStaR - с лучших решений по нитке Small-LM на ~~колпак~~ рассуждения соберем.

Всех с началом нового рабочего года.

Daily top papers на huggingface за 8.01.2025 статья про то как бустануть рассуждения моделек на уровне бОльших конкурентов.

На самом деле, собрали все самое лучшее, что сработало воедино и нормально затюнили:

1. STaR концепт для просеивания/фильтрации лучших рассуждений. Упоминается Дядей тут.

2. Используется augmented-ToT. Похожий концепт мне рассказывал один kaggle GM в сореве по решению математических олимпиад. Суть в том,чтобы делать генерации рассуждений/решений задач в путон коде. Далее запускать такое и нерабочие имплементации забанить, попросив дебагнуть LMку. Топ-1 решение соревы тут.

3. Process preference model (PPM) в пику dpo и прочим rlhf работает на оценке предпочтения веток полученных с Q-values поиска по дереву из другой топовой статьи по ToT для решения мат.задач с MCTS. Пример расчета и формулы в этой статье.
На этих знаниях лучше или хуже развилка рассуждений учим pair ranking model. Забавно,что кому-то в 2023 году Дядя предлагал в nli формате делать контрастив поиск веток рассуждений.

4. Это self-evolution подходы для обучения. О похожих концептах Дядя писал тут и тут. Подобно spin или rest подходам хорошие стратегии возвращаются для самоулучшения в сет обучения, как хорошие примеры.

В итоге, авторы получили суп из рабочих хаков в той или иной задаче вокруг рассуждений и решений math problem. Получили жОский ап и влетели в топ по бенчам, догнав топовых конкурентов с большим размером моделей.

huggingface.co

Paper page - rStar-Math: Small LLMs Can Master Math Reasoning with Self-Evolved Deep
Thinking

Join the discussion on this paper page

61 views07:34

Интересное что-то

Forwarded from Dealer.AI

А теперь взгляните. У нас есть StAR, есть Q-values с MCTS на основе self-rewarding в состоянии ветки S, есть самоэволюция и все это не тот ли самый магический и легендарный Q-star? 🤔🤔🤔

OpenAI Developer Community

OpenAI Rumors: Q* is Now a Reasoning Engine Called 'Project Strawberry'

According to leaks reported by Bloomberg and Reuters, OpenAI is making progress in enabling AI models to plan ahead before providing answers. On Tuesday at an internal all-hands meeting, OpenAI showed a demo of a research project that it claimed had new…

62 views07:34

Интересное что-то

#cv #gan #code

64 views07:40

Интересное что-то

Forwarded from Tensor Banana