Канал Доброго Вани | Data Science и Продуктики
1.38K subscribers
534 photos
26 videos
7 files
118 links
Самый добрый канал про DataScience, ML, техпред, стартапы и про много чего еще 🥰

Реклама, сотрудничество и любые другие вопросы -> @Pleshakovski
Download Telegram
👀 Пока все празднуют победу на хакатонах, я праздную победу над Airflow на винде
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍155🔥5😁3
Всех жду 😊
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍1👎1😁1
Forwarded from ITAM
This media is not supported in your browser
VIEW IN TELEGRAM
🔥13🤩75👎1😁1
Forwarded from ITAM
Не оратор? Стань им!
Приходи на DemoDay, узнай, как сервис НеОратор помогает развивать навыки публичного выступления и получи возможность принять участие в закрытом тестировании приложения!

И конечно, у тебя будет отличная возможность пообщаться с создателями проектов и получить заряд мотивации для развития своей идеи ⚡️
Please open Telegram to view this post
VIEW IN TELEGRAM
9👍5🍾3👎1
Ранжирование. 🟠 medium

🧑‍💻 Как же мы можем победить проблемы из предыдущего поста, который был посвящен Pointwise подходу? Напомню, что мы, во-первых, хотим именно прогнозировать значение релевантности (а не просто брать косинус) и, во-вторых, обращать внимание на контекст товаров.

Существуют также Pairwise (попарный) и Listwise (списочный) подходы.

🧑‍💻 Из названий можно догадаться, что в случае pairwise-подхода мы семплируем пары товаров и обучаем модель прогнозировать релевантность элементов в паре. Как их собрать, в целом, очевидно: разметить похожие записи, а потом насемплировать непохожие записи.
Также можно обучать модель максимизировать разницу между positive и negative семплами:
P(f(X, Xi) > f(X, Xj)) <= 1 - вероятность отранжировать Xi элемент выше элемента Xj.

Какие модели? RankNet, MART, Lambda SMART, KNRM...

🧑‍💻 Listwise подход предполагает одновременное ранжирование всех элементов базы. Звучит как что-то очень сложное и не очень эффективное. Конечно, этот вариант вряд ли можно применить в качестве кандидатной модели, однако, в качестве реранжирующей модели этот подход точно заслуживает внимания.

Плюс этого подхода в том, что мы по максимуму учитываем контекст в базе, то есть взаимоотношения между всеми позициями. Например, мы можем идти по "кандидатам" при помощи LSTM, Attention или их модификаций и для каждой позиции выдавать скор релевантности.

Какие модели? DLCM, SetRank...

😢 Ну как? Готовы к харду?

#Ботаем
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥832👍1
#Взаимная_рекомендация

👀 Привет, на связи админ канала @vf_science

Меня зовут Захар. Пару месяцев назад мне исполнилось 18 лет. Выделяюсь тем, что к этому времени во всю выступаю на конференциях, работаю в X-Labs AI над генеративками для музыки, веду свой стартап про перевод любой музыки в ноты, люблю науку и уже сейчас иду к A* конференциям, преподаю DL. Также, кроме карьеры, у меня ооочень много хобби.

Кажется, я выиграл эту жизнь. Но все только начинается и самые интересные результаты мне предстоит получить. Канал посвящен разбору научных работ, моим идеям, карьере и полезным материалам. Приходите посмотреть, как я покоряю мир, хе-хе !

Показательные посты:
1) Мое выступление на DataFest.
2) Разбор научной работы в формате карточек (сам дизайню).
3) Немного о личной жизни.
4) О посещении конференции AIConf.

Уверен, контент будет полезен как специалистам в области ML/DS, так и всем тем, кто только начал свой путь в этом интересном направлении. Welcome!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
15👏64👎2🔥2🥰1🤯11
This media is not supported in your browser
VIEW IN TELEGRAM
1🔥1642
🧑‍💻 Почему профессию МЛ почти нереально полностью изучить в ВУЗе и насколько нужна стажка или практика?

Что вообще из себя представляет профессия МЛ? Если по блокам, то
1. Сбор и обработка данных (PySpark, SQL, Pandas...)
2. Разработка модели, проведение экспериментов (MLflow, Sklearn, Pytorch...)
3. Деплой модели (Docker, Git...)
4. Автоматизация пайплайна (Airflow, Jenkins...)
5. Оценка результатов (АБ тесты, Uplift-моделирования и пр)

Уже, наверное, понятно, к чему я веду...

🧑‍💻 В ВУЗе научат матстату, но вряд ли научат АБ тестам. В ВУЗе научат синтаксису SQL, но вряд ли научат использовать PySpark. В этом, на мой взгляд, одно из существенных отличий практики ВУЗа и реальности: знания нужно приземлять на реальные кейсы.

Возможно, я говорю очевидные вещи, но для более молодой аудитории далеко неочевидно, как и для меня несколько лет назад: "зачем ботать все эти докеры, гиты, пайспарки, если я хорошо обучаю модели?"

🧑‍💻 Осознание этого, конечно, приходит со временем, но одна из главных целей этого канала - максимально это время ужать. Идея поста в том, чтобы в очередной раз напомнить о необходимости постоянно расширять свой стек и полагаться на свои силы, а не на то, что "ВУЗу виднее чему меня учить"
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1411🔥10
Forwarded from НеОратор
Этот день настал — мы рады представить полностью обновленную версию лендинга и ребрендинг сервиса «НеОратор» 🌟

Не оратор? Станьте им!


Это переосмысление брендинга, отражающее нашу миссию — помочь каждому стать настоящим профессионалом ораторского мастерства.

Что это значит?

🩵 Больше красоты и удобства — с ярким и стильным интерфейсом обучение станет еще более приятным;
🩵 Упор на индивидуальный подход — не изменяем основной цели – подстраиваться под речевые особенности и помогать развивать те навыки, которые нужны именно вам;
🩵 Расширение функционала — мы работаем над тем, чтобы качественно реализовать основной функционал и создавать новый — на данный момент это анализ уже более 10 речевых параметров.
🩵 Новые достижимые цели — не просто улучшить свою речь, но и работать с навыками самопрезентации и публичных выступлений для своих личных и профессиональных целей!


Мы продолжаем плодотворную работу над основным сервисом и планируем запуск тестовой версии уже в начале 2025 года.

Делитесь ссылкой с друзьями и коллегами и оставляйте свою заявку на тестирование бета-версии, а также переходите на наш новый лендинг (там можно увидеть спойлеры)⚡️

🩷Быстро подать заявку
🔗
Ссылка на лендинг
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥10👍743
Друзья, мы с командой активно работаем над НеОратором и очень будем рады вашей поддержке (подписочки, реакции, мб даже формочку заполните и потыкаться захотите)

Настал час единения ❤️

тык -> https://t.me/neorator_official
10🔥5
Думал-думал, как преподнести некоторые уроки, которые я вынес для себя за уже 2 года предпринимательства. И написал вредные советы для начинающих стартаперов

😌 Если ты стартап-идею начинаешь развивать,
Ты МЛщик и бэкендер, твой кофаундер - фронтенд,
Забивайте на маркетинг, продается все само.
Продвижение, соцсети вам оформит Дед Мороз.

😌 Вы увидели проблему у соседа своего,
И теперь стартап-идею запускаете свою.
К черту все эти кастдевы, к черту цели, к черту план,
Раскрутить свой первый бизнес точно можно и без них.

😌 Как-то раз с друзьями в баре вы собрали четкий план,
Как создать Единорога и продать за миллиард
Никаких ролей не нужно, договоры ни к чему,
А обязанности можно закрепить и на словах.

😌 Разработав прототипы и оформив бизнес-план,
Вы нашли себе команду и раздали роли всем.
Не спешите продаваться, деньги, гранты не нужны,
Инвестиции в проекты привлекают слабаки.

Заслуживает 👍 за креатив?)
Please open Telegram to view this post
VIEW IN TELEGRAM
👍41🔥1074🍓1
Пришел на ДОД в Центральный Уник, причем вошел ровно в 14:35 😁

Коллеги из Центрального Университета или Тинька, пропустите пж, ехал больше часа

Upd: впустили. Спасибо всем :)
😱137🗿3