Forwarded from Поступашки - ШАД, Стажировки и Магистратура
Стажировка Data Science в Альфа-Банке (2025)
Выпускник нашего курса по DS поделился своим опытом стажировки. Текст немного отредактирован.
Лонг стори шорт, зашёл на страницу программы Альфа будущее, вакансии там обновляются регулярно, начал следить за позициями по DS. Через пару недель нашёл подходящую. Требования стандартные: питон, SQL, основы ml, pandas, scikit-learn, а также любой фреймворк для глубокого обучения.
Отправил резюме с github-ссылкой. Указал два проекта: предсказание цен на недвижимость на kaggle и классификатор текстов на pytorch (BERT+дообучение на датасете с отзывами). Коммерческого опыта не было. Ответили через 20 минут с тестовым заданием.
Тест: теория ml (бэггинг против бустинга, когда используется f-score и прочая мл база), SQL:
1.написать запрос с JOIN для объединения данных о клиентах и их транзакциях
2.оконная функция для расчёта скользящего среднего дохода,
pandas для обработки данных, немного статистики:
интерпретация p-value в A/B-тесте, и как определить, что разница между группами значима?
Ответил почти всё, но ошибся с масштабированием признаков для градиентного бустинга и получил недостаточный, как мне показалось, результат. Думал, что не прошёл. Но через три недели HR снова связался - мое резюме осталось в базе, и появились позиции в группе кредитного скоринга
Началось всё с собеседования с тимлидом: обсуждали мои проекты, выбор метрик, методы борьбы с переобучением. Важно было объяснить логику решений, а не просто перечислить технический стек.
На технических собеседованиях, к моему счастью, не было ничего страшного: давались практические кейсы по типу: как обрабатывать категориальные признаки с высокой кардинальностью или как работать с данными о клиентах. Никаких задач по написанию кода.
И наконец сам офер получил через пару недель, онбординг занял несколько дней.
Первые задачи были связаны с анализом качества данных: искали утечки в фичах, проверяли стабильность распределений. Потом доверили дообучение модели - нужно было аккуратно протестировать новые гиперпараметры, чтобы не сломать продакшен + пришлось много работать с SQL: писал сложные запросы к хранилищу и агрегировал данные для новых фичей.
@postypashki_old
Выпускник нашего курса по DS поделился своим опытом стажировки. Текст немного отредактирован.
Лонг стори шорт, зашёл на страницу программы Альфа будущее, вакансии там обновляются регулярно, начал следить за позициями по DS. Через пару недель нашёл подходящую. Требования стандартные: питон, SQL, основы ml, pandas, scikit-learn, а также любой фреймворк для глубокого обучения.
Отправил резюме с github-ссылкой. Указал два проекта: предсказание цен на недвижимость на kaggle и классификатор текстов на pytorch (BERT+дообучение на датасете с отзывами). Коммерческого опыта не было. Ответили через 20 минут с тестовым заданием.
Тест: теория ml (бэггинг против бустинга, когда используется f-score и прочая мл база), SQL:
1.написать запрос с JOIN для объединения данных о клиентах и их транзакциях
2.оконная функция для расчёта скользящего среднего дохода,
pandas для обработки данных, немного статистики:
интерпретация p-value в A/B-тесте, и как определить, что разница между группами значима?
Ответил почти всё, но ошибся с масштабированием признаков для градиентного бустинга и получил недостаточный, как мне показалось, результат. Думал, что не прошёл. Но через три недели HR снова связался - мое резюме осталось в базе, и появились позиции в группе кредитного скоринга
Началось всё с собеседования с тимлидом: обсуждали мои проекты, выбор метрик, методы борьбы с переобучением. Важно было объяснить логику решений, а не просто перечислить технический стек.
На технических собеседованиях, к моему счастью, не было ничего страшного: давались практические кейсы по типу: как обрабатывать категориальные признаки с высокой кардинальностью или как работать с данными о клиентах. Никаких задач по написанию кода.
И наконец сам офер получил через пару недель, онбординг занял несколько дней.
Первые задачи были связаны с анализом качества данных: искали утечки в фичах, проверяли стабильность распределений. Потом доверили дообучение модели - нужно было аккуратно протестировать новые гиперпараметры, чтобы не сломать продакшен + пришлось много работать с SQL: писал сложные запросы к хранилищу и агрегировал данные для новых фичей.
@postypashki_old
Forwarded from Konstantin Klepikov
кстати, если кому интересно и есть желание пройти семинары pyg, там еще есть продолжение в 6 лекций
https://antoniolonga.github.io/Advanced_PyG_tutorials/index.html
https://antoniolonga.github.io/Advanced_PyG_tutorials/index.html
Forwarded from Vitaly
По LLM я бы посоветовал пройти этот курс от Себастьяна Рашки. Там прям самые основы.
https://github.com/rasbt/LLMs-from-scratch
Еще у него есть такой блог пост о ML, но по большей части там о LLM
https://sebastianraschka.com/books/ml-q-and-ai/
https://github.com/rasbt/LLMs-from-scratch
Еще у него есть такой блог пост о ML, но по большей части там о LLM
https://sebastianraschka.com/books/ml-q-and-ai/
GitHub
GitHub - rasbt/LLMs-from-scratch: Implement a ChatGPT-like LLM in PyTorch from scratch, step by step
Implement a ChatGPT-like LLM in PyTorch from scratch, step by step - rasbt/LLMs-from-scratch
Forwarded from Andrey
из книг следующая на очереди Alammar J., Grootendorst M. - Hands-On Large Language Models, вроде бы годнота. Не знаю, как сильно пересекается с курсом выше и как по уровню, доступнее или нет
Forwarded from ML Baldini • Nikita Boyandin (Nikita Boyandin)
#Курсыпоагентам
Одна из самых лучших рубрик на моем канале по реакциям, поэтому возвращаюсь к ней с самой интересной темой сейчас - агенты. Тут будут собраны материалы в основном на английском языке, потому что на русском пока такого очень мало.
1️⃣ Курс по Microsoft для начинающих - один из лучших курсов по структуре, есть как база, так и условный MCP. Если бы не так часто использовали Azure, была бы совсем сказка
2️⃣ Курс от Huggin Face - очень много техники, упор идет на понимание фреймворков, при этом есть супер интересные проекты, как агенты в покемонах
3️⃣ Жесткий буткемп - буткемп от очень сильных ресерчеров, много хороших статей, для развития кругозора в теме подойдет отлично
4️⃣ Репозиторий агентов от OpenAI - собраны практически все задачи и решения по ним с помощью агентов, так еще и множество других гайдов, например тот же промптинг
5️⃣ Очень много начальной практики - курс от DeepLearning заточен на написание кода и решения задач, так что для начала подойдет идеально
6️⃣ Гайд по построению агентов от OpenAI - приятная практическая методичка по работе с агентами, которая вышла совсем недавно
Как вам такая подборка и какие темы вы еще хотели бы увидеть в этом канале?) Обязательно ставьте реакции и пишите комментарии, автору будет приятно💗
Одна из самых лучших рубрик на моем канале по реакциям, поэтому возвращаюсь к ней с самой интересной темой сейчас - агенты. Тут будут собраны материалы в основном на английском языке, потому что на русском пока такого очень мало.
Как вам такая подборка и какие темы вы еще хотели бы увидеть в этом канале?) Обязательно ставьте реакции и пишите комментарии, автору будет приятно
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Джимми Нейрон 🚀
Девушка из Лондона по имени Salma Aboukar (специалистка по использованию нейросетей для работы с брендами) поделилась своим промптом для Veo 3, который вирусным образом разошелся в среде российских нейрокреаторов.
Пару дней назад тоже тестировал этот промпт (он работает не только с Veo 3):
Еще примеры: коробка с панельками, советская квартира, еще одна советская квартира, комната в стиле Hello Kitty, рождение вселенной.
Пару дней назад тоже тестировал этот промпт (он работает не только с Veo 3):
{
"description": "Cinematic shot of a sunlit Scandinavian bedroom. A sealed IKEA box trembles, opens, and flat pack furniture assembles rapidly into a serene, styled room highlighted by a yellow IKEA throw on the bed. No text.",
"style": cinematic",
"camera": "fixed wide angle",
"lighting": "natural warm with cool accents",
"room": "Scandinavian bedroom",
"elements": [
"IKEA box (logo visible)",
"bed with yellow throw",
"bedside tables",
"lamps",
"wardrobe",
"shelves",
"mirror",
"art",
"rug",
"curtains",
"reading chair",
"plants"
],
"motion": "box opens, furniture assembles precisely and rapidly",
"ending": "calm, modern space with yellow IKEA accent",
"text": "none",
"keywords": [
"16:9",
"IKEA",
"Scandinavian",
"fast assembly",
"no text",
"warm & cool tones"
]
}
Еще примеры: коробка с панельками, советская квартира, еще одна советская квартира, комната в стиле Hello Kitty, рождение вселенной.
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
А вы знали, что в Veo-3 можно просто нарисовать на первом кадре визуальные инструкции: всякия стрелочки, подписи типа "сюда не ходи снег башка попадет". И Veo3 это пережует и поймет. Экономия на промптах. И никакого джайсона.
@cgevent
@cgevent
Черепашки - Народная
Suno 4.5+ — кайф. 😮
Давайте поговорим про функцию Cover в Suno. Точнее, послушаем. Сделал мини-альбом каверов на опенинг из старого мультика про Черепашек-ниндзя.
Если коротко: Cover — круто. Загружаете мелодию / трек / напев с микрофона, крутите настройки, пишете промт — и у вас качественный кавер в любой аранжировке за минуту. Если бы я был музыкантом — сочинял бы черновики и сразу прогонял их через Cover, чтобы протестировать разные ходы, а потом писал на чистовую.
Несколько особенностей по моим тестам:
1) Не даёт загружать известные треки и тексты.
Но, например, русский рок за "известную музыку" особо не считается.
Если ругается на текст — попробуйте заменить некоторые буквы на фонетически близкие или убрать один куплет.
2) Настройки. Есть три ползунка:
🥴 Weirdness — лучше не трогать или понижать.
Выше 50% — и начинается каша.
😎 Style Influence — влияет на силу промта.
Для каверов хорошо работает диапазон 80–100%.
🎧 Audio Influence — определяет, насколько кавер будет близок к загруженному аудио по структуре и мелодике. Здесь всё зависит от жанра и задачи.
У меня хорошо работало в диапазоне 10–50% — чтобы модель интерпретировала по-своему, но сохраняла узнаваемость оригинала.
Естественно, только в платной подписке (но это того стоит).🙃
P.S: Почему-то при репосте поста с приклеенным аудио не отображается канал. Знайте, что он из Ai molodca. Ну и подписывайтесь!
Давайте поговорим про функцию Cover в Suno. Точнее, послушаем. Сделал мини-альбом каверов на опенинг из старого мультика про Черепашек-ниндзя.
Если коротко: Cover — круто. Загружаете мелодию / трек / напев с микрофона, крутите настройки, пишете промт — и у вас качественный кавер в любой аранжировке за минуту. Если бы я был музыкантом — сочинял бы черновики и сразу прогонял их через Cover, чтобы протестировать разные ходы, а потом писал на чистовую.
Несколько особенностей по моим тестам:
1) Не даёт загружать известные треки и тексты.
Но, например, русский рок за "известную музыку" особо не считается.
Если ругается на текст — попробуйте заменить некоторые буквы на фонетически близкие или убрать один куплет.
2) Настройки. Есть три ползунка:
Выше 50% — и начинается каша.
Для каверов хорошо работает диапазон 80–100%.
У меня хорошо работало в диапазоне 10–50% — чтобы модель интерпретировала по-своему, но сохраняла узнаваемость оригинала.
Естественно, только в платной подписке (но это того стоит).
P.S: Почему-то при репосте поста с приклеенным аудио не отображается канал. Знайте, что он из Ai molodca. Ну и подписывайтесь!
Please open Telegram to view this post
VIEW IN TELEGRAM