Forwarded from Ebout Data Science | Дима Савелко
разбираем рынок DS в 2026 и реальную работу изнутри - запускаем серию эфиров с жёстким гостем Короче, я позвал к себе Сашу Ледовского - ex-lead Data Science в Авито, руководил кучей команд, строил процессы, короче человек с мощнейшим опытом в ML/DS на практике. Сейчас он Head of AI в ecomm стартапе, и ему есть что рассказать как про корпорат, так и про стартаповский хаос
Мы решили сделать два эфира, и вот что вас ждёт:
Эфир 1 - открытый для вас всех!
Когда: 1 апреля в 19:00 (по МСК)
Тема: Обзор рынка DS/ML 2026: тренды, зарплаты, куда всё катится
Эфир 2 - внутри менторства
Когда: 7 апреля в 19:00 (по МСК)
Тема: Как устроена работа DS/ML изнутри: типичный день, задачи, ожидания
Этот эфир будет доступен только участникам менторства
Ставьте 🔥, если придёте на первый эфир, чтобы я понимал, сколько нас будет, поэтому работаем братья!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥15🤨7😁3❤1
Плохая новость - я приболел. Хорошая - теперь на ии фото я с улыбкой 😀
😁8
Forwarded from Ebout Data Science | Дима Савелко
разбираем рынок DS в 2026 и реальную работу изнутри - перенос эфираСаша заболел, поэтому новые даты:
Эфир 1 - Обзор рынка DS/ML 2026: тренды, зарплаты, куда всё катится
Когда: 7 апреля в 19:00 (по МСК)
Эфир 2 - Как устроена работа DS/ML изнутри: типичный день, задачи, ожидания
Когда: 14 апреля в 19:00 (по МСК)
PS: На фотках Саша здоровый, уже улыбается, а я вместе с ним, так как все живы и здоровы)
Поставьте 🔥 на благо здоровья Саши!
🔥21❤3🤨3
А сегодня хочу рассказать про еще одну замечательную конференцию - AI Conf.
Я был на ней в 2024 году. Мы даже делали стенд командой Авито. На AI conf нужно покупать билет. Это отлично организованная конференция с высоким качеством докладов и подготовки спикеров. На ней собираются много опытных специалистов и в целом хороший нетворкинг. Уже обещают 400+ участников.
Программа достаточно сбалансирована: обычные ML доклады, LLM, инфра и воркшопы. Думаю каждый себе что-то найдет.
🎟 Билеты и подробности — на сайте конференции.
Реклама: ООО "Конференции Олега Бунина", ИНН 7733863233, erid: 2W5zFGUTFJH
Я был на ней в 2024 году. Мы даже делали стенд командой Авито. На AI conf нужно покупать билет. Это отлично организованная конференция с высоким качеством докладов и подготовки спикеров. На ней собираются много опытных специалистов и в целом хороший нетворкинг. Уже обещают 400+ участников.
Программа достаточно сбалансирована: обычные ML доклады, LLM, инфра и воркшопы. Думаю каждый себе что-то найдет.
🎟 Билеты и подробности — на сайте конференции.
Реклама: ООО "Конференции Олега Бунина", ИНН 7733863233, erid: 2W5zFGUTFJH
🔥6🗿6😁3💔1
Кто должен делать агентов: DS или разработчик
👴 Когда-то очень давно DS/ML занимались разрабочики, Software Engineers
Это типа Яндекс 2010 года. Потом специальности разделились. От DS-ов стали требовать специализированного образования по машинному обучению. Разрабочику влететь в настоящий DS стало очень и очень непросто.
Однако если посмотреть характер работы, то Data Scientist - это тот, кто идет по циклу "возьми данные - построй алгоритм - получи оценку - повтори".
🦀 Что стало происходить потом
Сначала мы стали использовать больше предобученных моделей. Стало нужно больше строить обвязки вокруг модели, тюнить, дообучать и выстраивать систему оценки и улучшения.
А потом мы дошли до LLM и агентов. И теперь знаний ML при работе с ними больше не нужно. А нужно писать мнооого обвязки, тюнить промпты и выстраивать систему оценки и улучшения.
🙈 И в этом момент оказывается, что эту работу может делать и разработчик
И часто лучше чем DS: за счет инженерных скиллов и системного мышления, которое не всегда есть у творческого дата сайнтиста🤪
Так профессии опять встретились. Я думаю, что распространение получит новая только появляющаяся в вакансиях профессия "AI инженер". Она будет означать человека, который работает над AI системой, но не обязательно знает ML.
Что думаете? Кто должен работать над созданием агентов - DS-ы или разработчики? =) Как всегда, жду вас в комментариях🔽
Это типа Яндекс 2010 года. Потом специальности разделились. От DS-ов стали требовать специализированного образования по машинному обучению. Разрабочику влететь в настоящий DS стало очень и очень непросто.
Однако если посмотреть характер работы, то Data Scientist - это тот, кто идет по циклу "возьми данные - построй алгоритм - получи оценку - повтори".
🦀 Что стало происходить потом
Сначала мы стали использовать больше предобученных моделей. Стало нужно больше строить обвязки вокруг модели, тюнить, дообучать и выстраивать систему оценки и улучшения.
А потом мы дошли до LLM и агентов. И теперь знаний ML при работе с ними больше не нужно. А нужно писать мнооого обвязки, тюнить промпты и выстраивать систему оценки и улучшения.
🙈 И в этом момент оказывается, что эту работу может делать и разработчик
И часто лучше чем DS: за счет инженерных скиллов и системного мышления, которое не всегда есть у творческого дата сайнтиста
Так профессии опять встретились. Я думаю, что распространение получит новая только появляющаяся в вакансиях профессия "AI инженер". Она будет означать человека, который работает над AI системой, но не обязательно знает ML.
Что думаете? Кто должен работать над созданием агентов - DS-ы или разработчики? =) Как всегда, жду вас в комментариях
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥20❤6🤨1
В 19-00, через 10 минут мы начинаем с Димой стрим про обзор рынка DS/ML. Ссылку выложу отдельно! Подключайтесь 🙂
🔥6🤨3🤔1
С Data Fusion 2026
Сейчас на конференции. Она получилась отличной. Хорошие треки, было что послушать. Традиционно сделали селфи с Никитой и другими ребятами.
Была интересная сессия про context multi-armed bandits. Там рассказывали про исследование, что можно использовать бандитов для холодного старта рекомендаций. Типа на 100к айтемов. Чтобы такое завести нужно применить кое-какие матричные разложения, но это работает. Интересно насколько это применимо на практике.
Сейчас на конференции. Она получилась отличной. Хорошие треки, было что послушать. Традиционно сделали селфи с Никитой и другими ребятами.
Была интересная сессия про context multi-armed bandits. Там рассказывали про исследование, что можно использовать бандитов для холодного старта рекомендаций. Типа на 100к айтемов. Чтобы такое завести нужно применить кое-какие матричные разложения, но это работает. Интересно насколько это применимо на практике.
❤10🔥4
Как ассистенты ухудшили существующие продукты
Желание менеджеров сделать AI во чтобы то ни стало не приводит ни к чему хорошему🤮
У меня есть два примера плохого на мой взгляд использования ассистентов.
Первый - это Госуслуги. Там просто отключили обычный поиск, оставив только ассистента.
Второй - Сбербанк онлайн. Там оставили обычный поиск, но если ты нажимаешь на запрос из истории, то все равно попадаешь в ассистента (например, вместо кабинета самозанятого попадаешь в диалог про самозанятость).
Ну и плюс Сбер закрыл доступ к человеческой поддержке. Для премиальных клиентов (премьер, первый) она осталась, но тебя все равно пытаются задушить AI. Поэтому я лично хожу в отделение ногами.
Оба ассистента в целом хорошие. Но они медленные. И с ними невозможно договориться, когда что-то пошло не так (=любой непопулярный запрос, обычно у меня такой, т.к. все простые вещи я и так знаю как делать).
Короче спорные решения. Создают большую когнитивную нагрузку пользователю, где этого не ожидаешь. Я вот недавно думал про добавление LLM в наш поиск, но посмотрев эти кейсы понимаю, что просто так делать лейтенси в 5 секунд нельзя🔫
Желание менеджеров сделать AI во чтобы то ни стало не приводит ни к чему хорошему
У меня есть два примера плохого на мой взгляд использования ассистентов.
Первый - это Госуслуги. Там просто отключили обычный поиск, оставив только ассистента.
Второй - Сбербанк онлайн. Там оставили обычный поиск, но если ты нажимаешь на запрос из истории, то все равно попадаешь в ассистента (например, вместо кабинета самозанятого попадаешь в диалог про самозанятость).
Ну и плюс Сбер закрыл доступ к человеческой поддержке. Для премиальных клиентов (премьер, первый) она осталась, но тебя все равно пытаются задушить AI. Поэтому я лично хожу в отделение ногами.
Оба ассистента в целом хорошие. Но они медленные. И с ними невозможно договориться, когда что-то пошло не так (=любой непопулярный запрос, обычно у меня такой, т.к. все простые вещи я и так знаю как делать).
Короче спорные решения. Создают большую когнитивную нагрузку пользователю, где этого не ожидаешь. Я вот недавно думал про добавление LLM в наш поиск, но посмотрев эти кейсы понимаю, что просто так делать лейтенси в 5 секунд нельзя
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
💯26🔥6🤗5
Вакансии в аналитику
Всем, привет!
Я уже рассказывал про свою новую компанию и про Data Science вакансии. Но я знаю, что меня читают не только DS, но и много аналитиков. Поэтому сегодня расскажу про вакансии в аналитику.
Head of Analytics - Юра Фандеев. Юра проработал в Авито много лет и был одним из тех, кто создал мнение про аналитику Авито, как лучшую на рынке. Команда у Юры отличная. С Женей Мурзаевой, руководителем одной из команд, мы когда-то запускали в Авито продвижение за бюджет (вы его видите, когда подаете объявления в товарах). Дальше описание от Юры.
—
Ищем продуктовых аналитиков в нашу команду. Уровень middle/middle+.
Что вы там делаете в аналитике? У вас же продукт еще не запущен, данных нет
Выстраиваем аналитику продукта с нуля, чтобы быть максимально готовыми к запуску.
От логирования до витрин, от метрик до дашбордов – всё это создается и прорабатывается прямо сейчас.
Вам не придется работать с легаси.Вы сами будете создателем легаси.
Кроме того, мы помогаем бизнесу и продукту готовиться к выходу на рынок, помогая находить ответы на самые открытые и сложные вопросы.
А сколько у нас будет юзеров через N месяцев? А как нам монетизировать продукт? А какие локации плохо покрыты подключенными службами доставки? А как управлять балансом спроса и предложения?
Сегодня вы прорабатываете логирование с разработчиками поиска, завтра играетесь с катбустом, послезавтра анализируете конкурента.
Какая команда?
У нас пока две команды аналитики. Тимлиды – Маша Новикова и Женя Мурзаева. Вы могли видеть их в "Коммуналке аналитиков Авито" (а у Жени также есть свой канал)
Еще из плюсов – команды только формируются, и за аналитиками не закреплены конкретные стримы. Вы можете успеть поработать с разными направлениями и выбрать то, что больше по душе.
Какой стек?
СУБД – Clickhouse + Trino
Визуализация – Redash
АБ-тестирование – Trisigma
Приветствуем осознанное применении ИИ-агентов (есть компенсация подписки)
Условия работы
Предпочитаем гибрид (периодически встречаемся командой вживую), но нанимаем и на полную удаленку.
Офис на Менделеевской.
Приходите. У нас весело как в стартапе, а зп как в корпорации.
—
Присылайте резюме и задавайте вопросы в лс @GeorgeFandeev
Репосты приветствуются!
Всем, привет!
Я уже рассказывал про свою новую компанию и про Data Science вакансии. Но я знаю, что меня читают не только DS, но и много аналитиков. Поэтому сегодня расскажу про вакансии в аналитику.
Head of Analytics - Юра Фандеев. Юра проработал в Авито много лет и был одним из тех, кто создал мнение про аналитику Авито, как лучшую на рынке. Команда у Юры отличная. С Женей Мурзаевой, руководителем одной из команд, мы когда-то запускали в Авито продвижение за бюджет (вы его видите, когда подаете объявления в товарах). Дальше описание от Юры.
—
Ищем продуктовых аналитиков в нашу команду. Уровень middle/middle+.
Что вы там делаете в аналитике? У вас же продукт еще не запущен, данных нет
Выстраиваем аналитику продукта с нуля, чтобы быть максимально готовыми к запуску.
От логирования до витрин, от метрик до дашбордов – всё это создается и прорабатывается прямо сейчас.
Вам не придется работать с легаси.
Кроме того, мы помогаем бизнесу и продукту готовиться к выходу на рынок, помогая находить ответы на самые открытые и сложные вопросы.
А сколько у нас будет юзеров через N месяцев? А как нам монетизировать продукт? А какие локации плохо покрыты подключенными службами доставки? А как управлять балансом спроса и предложения?
Сегодня вы прорабатываете логирование с разработчиками поиска, завтра играетесь с катбустом, послезавтра анализируете конкурента.
Какая команда?
У нас пока две команды аналитики. Тимлиды – Маша Новикова и Женя Мурзаева. Вы могли видеть их в "Коммуналке аналитиков Авито" (а у Жени также есть свой канал)
Еще из плюсов – команды только формируются, и за аналитиками не закреплены конкретные стримы. Вы можете успеть поработать с разными направлениями и выбрать то, что больше по душе.
Какой стек?
СУБД – Clickhouse + Trino
Визуализация – Redash
АБ-тестирование – Trisigma
Приветствуем осознанное применении ИИ-агентов (есть компенсация подписки)
Условия работы
Предпочитаем гибрид (периодически встречаемся командой вживую), но нанимаем и на полную удаленку.
Офис на Менделеевской.
Приходите. У нас весело как в стартапе, а зп как в корпорации.
—
Присылайте резюме и задавайте вопросы в лс @GeorgeFandeev
Репосты приветствуются!
Telegram
Big Ledovsky | AI изнутри
Вакансия 🚀
Набираю ребят международный ecom стартап, где я отвечаю за DS/AI. Искренне считаю, что это один из лучших проектов на рынке. Будет масштабный запуск, у нас большие планы и взрослые инвестиции. Пусть слово стартап не вводит вас в заблуждение 🙂…
Набираю ребят международный ecom стартап, где я отвечаю за DS/AI. Искренне считаю, что это один из лучших проектов на рынке. Будет масштабный запуск, у нас большие планы и взрослые инвестиции. Пусть слово стартап не вводит вас в заблуждение 🙂…
🔥16❤7 5
Хочу прорекламировать Толино соревнование по рекомендациям.
Датасет - на 170 млн айтемов и 5 млрд взаимодействий. Это очень серьезно. А данные Авито очень интересные.
На мой взгляд одно из топовых ds-соревнований последних месяцев. Если хотели где-то поучаствовать, сейчас самое время.
Датасет - на 170 млн айтемов и 5 млрд взаимодействий. Это очень серьезно. А данные Авито очень интересные.
На мой взгляд одно из топовых ds-соревнований последних месяцев. Если хотели где-то поучаствовать, сейчас самое время.
❤5🔥2
Forwarded from Б/У ml
Всем привет!
Хочу поделиться запуском соревы - https://ods.ai/competitions/avitotechmlcup2026
Так как времени не так много, а соревы я люблю то нашел такое хобби:
запускать соревы самому
В этот раз вложились гораздо больше чем год назад (задача про ноды):
1) Большой относительно рекомендаций объем данных - в 20 раз больше с прошлым годом
2) Более продуманная метрика - есть баланс по вертикалям + геп. В прошлый раз был весьма обрезанный датасет
3) Гораздо ближе к текущему проду чем в прошлом году - завязываемся на item_id, а не на ноды
Залетайте в соревку и делитесь инсайдами :)
PS это сорева сделана полностью на добровольных началах из за любви к ds. Ну почти - мне еще дадут мерчь :)
Хочу поделиться запуском соревы - https://ods.ai/competitions/avitotechmlcup2026
Так как времени не так много, а соревы я люблю то нашел такое хобби:
запускать соревы самому
В этот раз вложились гораздо больше чем год назад (задача про ноды):
1) Большой относительно рекомендаций объем данных - в 20 раз больше с прошлым годом
2) Более продуманная метрика - есть баланс по вертикалям + геп. В прошлый раз был весьма обрезанный датасет
3) Гораздо ближе к текущему проду чем в прошлом году - завязываемся на item_id, а не на ноды
Залетайте в соревку и делитесь инсайдами :)
PS это сорева сделана полностью на добровольных началах из за любви к ds. Ну почти - мне еще дадут мерчь :)
❤4🔥4
Что я поменял в DS работе
Я не люблю Jupyter ноутбуки как результат DS работы🔫 Отдельно можно поговорить почему. Но так или иначе раньше отказаться от них не получалось
Появление кодинговых агентов все поменяло. Мы с командой постепенно переходим на следующую схему
- Python скрипты
- Оформление выводов в маркдаун а затем сразу на конфлюенс
- Визуализация в streamlit
Почему
1. Выяснилось, что удобная механика «запустил ячейку, получил вывод» заменяется на «агент запустил скрипт и красиво оформил результат в markdown»
2. Клод нереально быстро клепает стримлит. А стримлит это полноценный дашборд / data app. Для каждого проекта я делаю свой стримлит, как полноценный сервис в кубере. Выкатывается одной командой и сразу доступен коллегам
Ноутбуки остаются только как средство вручную что-то покопать. Для чего они и нужны😌
Я не люблю Jupyter ноутбуки как результат DS работы
Появление кодинговых агентов все поменяло. Мы с командой постепенно переходим на следующую схему
- Python скрипты
- Оформление выводов в маркдаун а затем сразу на конфлюенс
- Визуализация в streamlit
Почему
1. Выяснилось, что удобная механика «запустил ячейку, получил вывод» заменяется на «агент запустил скрипт и красиво оформил результат в markdown»
2. Клод нереально быстро клепает стримлит. А стримлит это полноценный дашборд / data app. Для каждого проекта я делаю свой стримлит, как полноценный сервис в кубере. Выкатывается одной командой и сразу доступен коллегам
Ноутбуки остаются только как средство вручную что-то покопать. Для чего они и нужны
Please open Telegram to view this post
VIEW IN TELEGRAM
streamlit.io
Streamlit • A faster way to build and share data apps
Streamlit is an open-source Python framework for data scientists and AI/ML engineers to deliver interactive data apps – in only a few lines of code.
❤18🔥14
This media is not supported in your browser
VIEW IN TELEGRAM
Собираюсь на Inside AI Meetup от Wildberries & Russ
Программа очень интересная: LLM, поиск, рекомендации, модерация, ML инфра. Собираюсь пойти сам и готов порекомендовать остальным. Вот чуть более подробное описание.
—
На митапе обсудят реальные кейсы: от высоконагруженной модерации с векторным поиском и AIOps-подходов к управлению ML-сервисами до практики построения RAG-систем, тонкостей реранкинга и реальных этапов запуска LLM-продуктов.
▫️Выступать будут: эксперты Wildberries & Russ, MWS, Avito, Сбера, Альфа-Банка, red_mad_robot.
▫️Кому будет интересно: senior ML/AI инженерам, MLE, DS, инженерам платформ и всем, кто строит или масштабирует AI-системы в продакшене.
▫️Когда и где: 20 мая, старт в 15:00. Москва + онлайн-трансляция.
Регистрируйтесь и приглашайте коллег! Подробности — на сайте.
Программа очень интересная: LLM, поиск, рекомендации, модерация, ML инфра. Собираюсь пойти сам и готов порекомендовать остальным. Вот чуть более подробное описание.
—
На митапе обсудят реальные кейсы: от высоконагруженной модерации с векторным поиском и AIOps-подходов к управлению ML-сервисами до практики построения RAG-систем, тонкостей реранкинга и реальных этапов запуска LLM-продуктов.
▫️Выступать будут: эксперты Wildberries & Russ, MWS, Avito, Сбера, Альфа-Банка, red_mad_robot.
▫️Кому будет интересно: senior ML/AI инженерам, MLE, DS, инженерам платформ и всем, кто строит или масштабирует AI-системы в продакшене.
▫️Когда и где: 20 мая, старт в 15:00. Москва + онлайн-трансляция.
Регистрируйтесь и приглашайте коллег! Подробности — на сайте.
🔥6 3