Kantor.AI
11.1K subscribers
138 photos
11 videos
5 files
178 links
Канал Виктора Кантора про Data Science, образование и карьеру в сфере анализа данных. По вопросам сотрудничества: @mariekap

РКН: 5140322136
Download Telegram
Kantor.AI
Why_L1_makes_sparse.pdf
К вопросу о том, нужна ли математика, чтобы заниматься машинным обучением. Этот пример очень хорошо иллюстрирует ситуацию: если вы хотите понимать, почему все работает так, как работает - нужна. Если вы хотите использовать как черный ящик - достаточно очень базовых понятий. И я не топлю ни за один, ни за другой вариант: есть тысячи людей по всему миру, которые успешно обучают ML-модели, не владея математическим аппаратом достаточным для понимания pdf из поста выше, отлично себя чувствуют, и модели их ничуть не хуже. А есть тысячи людей по всему миру, которые назовут математику из этой же pdf детской и тривиальной, т.к. способны работать и с более сложным математическим аппаратом (который тоже можно использовать в ML, например вот: https://arxiv.org/abs/2201.09656)
Учитесь в универе и хотите узнать больше про NLP? Регистрируйтесь на бесплатный NLP-студкемп от Яндекс Образования и НГУ! Интенсив пройдет с 14 по 26 июля в Новосибирске, дорогу и проживание оплачивает организатор.

Обработка естественного языка с помощью ИИ все больше входит в нашу жизнь, но как быстро погрузиться в то, что работает под капотом? За две недели — с 14 по 26 июля — вы разложите современный NLP по полочкам — от теории до практики:
💡 поработаете с бенчмарками и обучающими датасетами;
💡 узнаете, как работают методы Deep Learning в NLP — от механизма внимания и трансформеров до мультимодальных LLM и RAG;
💡 сравните модели YandexGPT и Qwen;
💡 создадите свой проект на стыке науки и бизнеса.

Всё это — бесплатно и под руководством экспертов из Яндекса и НГУ. С вас — только желание развиваться и пройти отбор.

Заявку нужно оставить до 18 мая. Регистрируйтесь прямо сейчас и проведите лето с пользой!
О том, как и зачем переходят из DS в продакты, и чем знание ML помогает в этой работе
Forwarded from MLinside - школа ML
This media is not supported in your browser
VIEW IN TELEGRAM
▶️ На нашем YouTube-канале вышло интервью с Константином Чукреевым — Growth Product Lead в Manychat, ранее работал в Яндекс Лавке, где за короткий срок прошел путь от ML-разработчика до продакт менеджера уровня Middle+.

Константин рассказывает:
▪️ Как он переходил из аналитики и ML в продакт-менеджмент.
▪️ Какие задачи решал в Яндексе и Manychat.
▪️ Какие навыки нужны продактам и ML-специалистам для развития.
▪️Советы молодым специалистам по Data Science и ML
▪️ Будущее чатботов с ИИ и перспективы AI через 5–10 лет.
▪️ Как делать карьерный переход и кому стоит идти в продакт-менеджмент

🎯 Интервью для тех, кто хочет развиваться на стыке ML, аналитики и продукта.

🔥Спойлер: если вы хотите курс от MLinside и Константина специально для продакт-менеджеров — обязательно посмотрите это интервью!

👉 Смотреть здесь
Please open Telegram to view this post
VIEW IN TELEGRAM
В Data Science все начинается с Титаника 🚢

Вручил главному любителю профессионалу лего в data тусовке символичный подарок. К слову, угадайте с кем будет следующее интервью на канале MLinside? ;)
Отчет Stanford HAI о развитии рынка AI

Какие-то подозрительные числа по топам стран. Ну и аналитика в духе «у вас тут машинлернинг или gen ai» грубовато звучит. Возможно это объясняет объем отчета (456 страниц): все равно никто не изучит его полностью.

Впрочем, это конечно все равно довольно поверхностные претензии, чтобы дать нормальную оценку надо вооружаться LLMками и «читать», попутно тренируясь отличать ответ по делу от галлюцинации.
​​🔥🔥🔥 Отчет по рынку AI на 456 страниц от Stanford!

Да, огромный отчет, просто качайте его из сообщения ниже и читайте.

Никаких саммари привести просто невозможно, там 8 глав про technical performance, R&D, responsible AI, economy, science, policy, education and public opinion. Читайте интересные вам.

На что хочется обратить ваше внимание?

1/ 44.48% научных публикаций по AI в 2024 году было сделано исследователями из Азии (это отдельно East Asia и South Asia) и только 10.31% из Северной Америки. 🇨🇳 Китай против 🇺🇸 США в основном. 🇪🇺 Европа, кстати, выше США с 18.15%.

2/ Из всех публикаций только ~5.4% касаются Generative AI. В лидерах Machine Learning с ~75.7%.

3/ По количеству патентов на душу населения 🇺🇸 США и 🇨🇳 Китай идут очень близко и с 5.20 патентов и 6.08 занимают 4 и 3 место, соответственно. На первом месте 🇰🇷 Южная Корея с 17.27, далее 🇱🇺 Люксембург с 15.31.

4/ Однако по количеству заметных AI моделей 🇺🇸 США сильно впереди 🇨🇳 Китая – 40 против 15. Забавно, что моделей все же не так много, потому что на 3-м месте и далее страны с 1-й моделью (у 🇮🇱 Израиля, например, столько же, сколько у 🇸🇦 Саудовской Аравии).

5/ На Github 4.32М опенсорсных AI проектов.

6/ AI Agents пока еще не очень точные – самая топовая модель GPT-4o имеет success rate всего 36.2%.

7/ Всего в 2024 году зафиксировано 233 крупных инцидента с AI (типа как когда система определения лица определило неверного человека и его арестовали, или автономное авто совершило аварию).

8/ От 1.25% всех вакансий в 🇳🇱 Нидерландах до 3.27% всех вакансий в 🇸🇬 Сингапуре требуют AI skills.

9/ Где больше всего талантов в области AI?
Топ 3:
🇮🇱 Израиль 1.98%
🇸🇬 Сингапур: 1.64%
🇱🇺 Люксембург: 1.44%

Топ-3 страны по миграции AI талантов на 10,000 Linkedin members:
🇱🇺 Люксембург: 8.92%
🇨🇾 Кипр: 4.67%
🇦🇪 ОАЭ: 4.13%

10/ Всего в 2024 году появилось более 2,000 AI компаний, которые еще и привлекли венчурное финансирование.

Это только капля в море. Читайте отчет, данных куча.

@proVenture

#ai #research
Please open Telegram to view this post
VIEW IN TELEGRAM
Про графовые сетки в рекомендациях порадовало. Люблю, когда в рекомендашках прикручивают штуки, красивые сами по себе, а они еще и прокрашиваются в эксперименте
Forwarded from AI.Insaf
Сходил сегодня на Датафест в Яндексе, где были только доклады про внутренние продукты. Что послушал:

Спрос Яндекс Лавки: смесь Prophet и бустингов с дальнейшим разделением на продукты, регионы и там, где это улучшало метрики. TimeGPT не используем, так как в Prophet легко добавить выходные дни.
• У очень многих людей (2% или 20%) есть две колонки Алисы, и пришлось научиться понимать, к какой обращаются, и ещё учесть, что может быть несколько пользователей (мультиаккаунтинг). Во второй задаче ожидаемо лучше всего работает, когда человек сам об этом говорит.
• Большой доклад по рекомендациям в Яндекс Лавке. Суть в том, что работает двухбашенный подход с трансформером user-items, косинусные расстояния, которые передаются в бустинги, но дополнительно туда добавляются и сами запросы пользователей, и текущая корзина. И вот они попробовали это всё заменить графовой сеткой (PinSage + TwHIN, где ребра товар-корзина), иииии.... метрики упали. Что не понял, это что при первом запуске бизнес метрики упали, и только когда модель дофитили на результатах 1го запуска - метрики позеленели, это бага или фича? Сейчас же до 20% GMV - за счет рекомендаций
Экран отписки от Плюса – метрика средней выручки с сохранившихся на экране пользователей с вычетом затрат на сохранение. Ранжирование не работает, так как лучше всего сохраняет скидка на подписку, предиктивно с оттоком не начинали, всё на бустингах
• Активно используют VLM для нейро и оффлайн эмбедингов для поиска картинок. Но интересно что нейро пока не научились монетизировать

Если выше это доклады из бизнесовой секции, то еще была 2я техническая, но слишком техническая. Например «Быстрая аппроксимация матрицы Фишера с помощью факторизации Кронекера» 🫡

P.S. Конференция растет, сидр уже давно, а вот кальяны — это что-то новое. И даже был квиз. Доклады можно посмотреть и в записи потом, а так главное там это живое общение
Завтра в 18:00 буду на трансляции, приходите, накидывайте вопросов :)
Дорогие друзья!

Спешу сообщить, что серия эфиров на ютуб канале Продакт Аналитикс продолжается, а посему имею удовольствие анонсировать следующий эфир, который состоится уже завтра, 29 мая в 18:00 по московскому времени .

На этот раз нашим гостем будет многоуважаемый AI и ML эксперт, ex- CDO МТС, ex-CDS Яндекс. Такси , ex-ABBYY, автор канала Кантор AI, автор курсов MLInside , а также известный многим как автор специализации на Coursera ‘Машинное обучение и анализ данных’ от МФТИ и Яндекса Виктор Кантор 💎

О чем будем говорить:

• Куда ведут нас современные тренды AI/ML и как остаться на гребне волны

• С какими запросами приходит бизнес и какие софт- и хард-навыки нужны, чтобы стать классным топ-менеджером и удержаться на своей позиции

• Как пришла идея создания школы и чему актуально учить сейчас

• Насколько сильно отличается жизнь топ-менеджера и предпринимателя

Ваши вопросы , как и всегда, приветствуются, так что смело направляйте их в комментарии 👇

До встречи 🤗
Выложили первую часть разговора с Валерой Бабушкиным :)

Разговор у нас на мой взгляд не вполне типичный для видео в интернете: не хайпуем ни на чем, не устраиваем шоу, не цитируем мемы, не рассказываем ничего с карикатурными воплями «вау, ничего себе, представляешь!», в общем просто спокойно разговариваем. Возможно охваты от этого пострадают, но я получил большое удовольствие от общения, и надеюсь, многие из вас тоже получат удовольствие от видео.

Приятного просмотра :)
В тему Валеры: кто смотрел интервью, знает, что мы познакомились вживую лет семь назад на Матемаркетинге (конференция такая для менеджеров, аналитиков, ну и вообще много для кого еще). Матемаркетинг проходит осенью, а весной у тех же организаторов есть Aha Conf

Так вот в этом году она проходит уже сегодня и завтра, сегодня в 15:45 выступаю со своим докладом («Задачи, за которые компании платят сейчас и будут платить дальше») и оба дня будут доклады по ML на партнерских сессиях школы MLinside и Aha. Так что спустя семь лет я наконец-то иду на Матемаркетинг и Aha со своей собственной компанией как партнер, а не только как спикер :)))

После конфы поделюсь впечатлениями здесь. Надеюсь все пройдет норм, но ощущения немного как перед первым выступлением))

P.S.: Если вдруг кто-то хочет залететь в последний момент - промокод MLINSIDE дает скидку 20%
This media is not supported in your browser
VIEW IN TELEGRAM
Есть классная возможность устроиться аналитиком в Яндекс за выходные

7–8 июня Яндекс проводит Weekend Offer Analytics. До 3 июня оставьте заявку на участие, 7 июня пройдите два технических собеседования, а 8 июня познакомьтесь с командами и получите офер.

В мероприятии участвует 12 команд: Алиса и Умные устройства, Игры, R&D, Рекламные технологии, Поиск и Суперапп, Безопасность, Коммерческий департамент, Автономный транспорт, Ecom-сценарии Поиска, Качество Поиска, Международный Поиск, Карты. Вы сможете пообщаться с менеджерами и выбрать проект, который покажется самым интересным.

Узнать подробности и зарегистрироваться можно здесь.

Реклама. ООО "Яндекс". ИНН 7736207543
Forwarded from Midov trip
Важно помнить, что Product-Market Fit (PMF) можно не только найти, но и потерять.

Можно посмотреть на востребованность StackOverflow, главной площадки где разработчики спрашивают вопросы и получают ответы.

С выпуска ChatGPT, количество вопросов, которые люди задают кратно снизилось.

P.s. хотел отдельно поделиться классным графиком, но тут прилетел релевантный кадр с сегодняшнего выступления:)
🔥🔥🔥Никита как всегда прекрасен: одной цитатой из классики (в конце поста) учит эффективной работе с любым бизнес-заказчиком. Мотаем на ус!
Сегодня попал в Сити на один форум и вынужден был слушать в панели экспертования манагеров-каналий про рекомы, чуть руку не сломал борцовским приемом «фейспалм» 🤦‍♂️.

Все эти «на самом дела» и прочие «здравые смыслы», и «я 5 лет в отрасли и знаю что нужно пользователю» 🤦‍♂️.
Ни намека на метрики и A/B, зато вопросы. В духе: А как сделать так чтобы рекомендации были социально справедливыми? Знаете ответ? «А давайте снимать только хороший, патриотический контент».
Прям в стиле песни Захар Борисовича

Для таких вот у меня есть коробок вполне публичных примеров (а после беседы с пиар-службой кейсы теперь приходится фильтровать — заметили как их стало меньше в канале? — правда, большая часть просто ушла в отложку в 2026й)

Итак, канальи думали что SJM чем короче тем лучше, и вообще одной красной кнопки «купить» достаточно.
Ха раз
Ха второй раз

Добавление доп шагов к форме регистрации или к процессу покупки — увеличивает конверсии а не уменьшает! В их конкретных кейсах!

Другие канальи решили что если показывать что продукт популярен в соцсетях (social proof) то конверсия будет больше, но увы

А здесь вообще в одной статье собраны противоположные результаты : в одном продукте перфомят длинные тексты, в другом короткие. В одном продают простые заголовки, в другом сложные.

Пользователи охотнее делятся шортсами или длинными?
Надо проверять именно в вашем сервисе, а мб вообще в конкретной категории.
Смотрите с опаской на тех кто «знает как думает пользователь».

PS и самое вкусное, для тех кто не читал Ходжу Насреддина

На платформе Unbounce провели A/B-тест: Get MY free 30-day trial против Get YOUR 30-day trial

Результат, ожидаемо, на картинке к посту

Однажды Насреддин увидел толпу возле пруда, что рядом с мечетью. Подойдя поближе, он увидел, что в пруду тонет мулла. Люди кричали ему: "Дайте руку, почтеннейший, дайте руку! ", но тот только булькал и руки не протягивал. Тогда Насреддин подбежал и закричал: "Нате руку, почтеннейший, нате! " -- и мулла схватился. Когда люди спросили Ходжу, как ему удалось спасти муллу, он ответил:
-- Глупцы! Разве можно говорить мулле "Дайте"! Он понимает только "Нате"!
Вот такое потрясающее предложение получил вчера, а теперь еще и сегодня с другого аккаунта. Можете не перечитывать, вы не ошиблись: хотят денег с гостя 😂😂😂

Переслал друзьям поржать, так оказалось, что сейчас такая схема развода есть и некоторые блогеры ведутся и расстаются со своими честно заработанными потом и кровью)))