Интересное что-то – Telegram

Интересное что-то

517 subscribers

2.72K photos

253 videos

138 files

4.51K links

Материалы и мысли, понадерганные отовсюду
Блог: https://t.me/asisakov_channel
Чат: https://t.me/youknowds_chat

Download Telegram

About

Blog

Apps

Platform

Интересное что-то

517 subscribers

Интересное что-то

Forwarded from Data Blog

Друзья, привет!

Коллеги выложили запись нашего вчерашнего подкаста
об интерпретируемости. За час мы обсудили актуальные направления в области интерпретируемости классических моделей и LLM и накидали гипотез.

Гости подкаста:
➡️Максим Костриця – DS Researcher в Raft, магистр ФКН ВШЭ
➡️Тимур Низамов, разработчик @LLAMATOR, магистрант Talent Hub ИТМО
➡️Честер, вроде бы он заходил, и я :)

Тайм-коды:
00:00:00 интро
00:04:21 как развивалась область интерпретируемости?
00:08:23 концептуальные слои
00:16:55 поведенческий и репрезентативный анализ
00:27:09 механистическая интерпретируемость
00:33:22 Sparse Autoencoders и результаты исследования Максима по влиянию на "токсичные" нейроны модели
01:01:10 в чём идея Circuit Tracing?
01:03:20 подведение итогов: есть ли тренд на интерпретируемость и к чему это может привести?
01:11:49 QA

Полезные ссылки по теме, упомянутые в подкасте:

https://habr.com/ru/articles/885076/ — туториал про зонды
https://arxiv.org/pdf/2507.12950 — кейсы XAI в радиологии
https://www.lesswrong.com/posts/jGuXSZgv6qfdhMCuJ/refusal-in-llms-is-mediated-by-a-single-direction
https://www.anthropic.com/news/golden-gate-claude
https://monitor.transluce.org/dashboard/chat
https://www.neuronpedia.org/
https://platform.goodfire.ai/
https://transformer-circuits.pub/

Ссылка на ютуб: https://www.youtube.com/watch?v=M9jVLiFXs04

70 views12:33

Интересное что-то

#algo #interview

64 views13:58

Интересное что-то

Forwarded from Поступашки - ШАД, Стажировки и Магистратура

Полный цикл отбора на стажировку в Яндекс (Бэкенд 2025)

Многие выпускник наших курсов по бэкенду в качестве старта карьеры выбрали Яндекс, и уже либо работают там и идут к высоким позициям, либо отбираются летом на стажировку. Наш выпускник согласился дать "интервью" о том, как прошел его полный цикл отбора. Мы слегка отредактировали его и добавили полезные ссылки!

Вступительный контест
Сам контест и в том числе его разбор (видео + код) выложили на курсах по алгоритмам и по бэкенду. Там было 6 задач из которых мне самостоятельно удалось придумать 4, остальные две просто катнул с разбора и попросил ГПТ переписать немного код, чтобы антиплагиат и не задетектил сходства с решениями остальных ребят. В принципе там приглашали на следующий этап и с 4мя задачами даже. Тут кстати важно отметить, что иногда вам попросту по какой-то причине долго могут не присылать приглашение на собес, и если наглости вам не занимать, то можете найти контакты HR и написать ей, бывали кейсы когда это срабатывало.

Алгоритмическая секция
В качестве первой задачи дали простую задачу, написал довольно быстро: проверить на палиндромность строку.
Вторая задача звучала так: дана строка требуется найти максимальную длину подстроки, являющуюся палиндромом. Эта задача встречалась в списке поступашек здесь, но я не помнил как она решается, поэтому пришлось думать на месте. Вначале предложил алгоритм за n^3 (просто полный перебор), чтобы потянуть время и подумать над более эффективным, а не просто молчать. Это сработало, интервьювер даже дал подсказку, намекая на динамическое программирование и я додумал алгоритм за n^2. После того как его реализовали, он предложил, в качестве доп вопроса подумать про то как можно прикрутить хеши к проверке на палиндромность и уже затем вывел на решение за n logn, думаю это просто была его инициатива, т к оставалось свободное время.

Техническое собеседование
На тех собес позвали почти сразу. В качестве первой задания дали, алго задачку на стэк. Задача заключалась в том, чтобы проверить на правильную скобочную последовательность строку, которая состояла из трех видов скобок. Далее интервьюер потребовал реализовать класс стэк на Cи. С этой задачей мне повезло, потому что она встречалась у меня на вузовском курсе. Далее дали задачу на хеш таблицы (требовалось отсортировать элементы по количеству вхождений их копий в массив), а потом поговорили про устройство unordered_map и vector.

Собеседование с командой
Через две недели после технического интервью мне пишет HR и говорит, что она согласовала финальные собеседования с двумя командами.

Собеседование с первой командой прошло в устной форме. Я не написал ни единой строчки кода. По большей части мы разговаривали про вуз, какие там курсы проходили, их тематики, про мой опыт, который, кстати, ограничивался лишь вузовскими курсами и пет проектами курса поступашек. И, соответственно, интервьюер потребовал рассказать про пару пет проектов курса (их я кстати просто скопировал, предварительно разобравшись).

Во второй команде собеседование более формально прошло, большую часть интервью мы писали код. А именно он потребовал сразу сходу реализовать lru cachе из питона аналог в c++. И оставшиеся минут 10 собеседования, лид рассказал про спектр задач, но уточнил что мест нет.

Приглашения пришли через неделю в обе команды, и я сразу решил выбрать первую команду, из-за наличия штатных мест, хотя вторая команда была поинтереснее.

@postypashki_old

42 views13:58

Интересное что-то

54 views13:59

Интересное что-то

Forwarded from Поступашки - ШАД, Стажировки и Магистратура

Полный цикл отбора на стажировку в Яндекс (Бэкенд 2025)

Многие выпускник наших курсов по бэкенду в качестве старта карьеры выбрали Яндекс, и уже либо работают там и идут к высоким позициям, либо отбираются летом на стажировку. Наш выпускник согласился дать "интервью" о том, как прошел его полный цикл отбора. Мы слегка отредактировали его и добавили полезные ссылки!

Вступительный контест
Сам контест и в том числе его разбор (видео + код) выложили на курсах по алгоритмам и по бэкенду. Там было 6 задач из которых мне самостоятельно удалось придумать 4, остальные две просто катнул с разбора и попросил ГПТ переписать немного код, чтобы антиплагиат и не задетектил сходства с решениями остальных ребят. В принципе там приглашали на следующий этап и с 4мя задачами даже. Тут кстати важно отметить, что иногда вам попросту по какой-то причине долго могут не присылать приглашение на собес, и если наглости вам не занимать, то можете найти контакты HR и написать ей, бывали кейсы когда это срабатывало.

Алгоритмическая секция
В качестве первой задачи дали простую задачу, написал довольно быстро: проверить на палиндромность строку.
Вторая задача звучала так: дана строка требуется найти максимальную длину подстроки, являющуюся палиндромом. Эта задача встречалась в списке поступашек здесь, но я не помнил как она решается, поэтому пришлось думать на месте. Вначале предложил алгоритм за n^3 (просто полный перебор), чтобы потянуть время и подумать над более эффективным, а не просто молчать. Это сработало, интервьювер даже дал подсказку, намекая на динамическое программирование и я додумал алгоритм за n^2. После того как его реализовали, он предложил, в качестве доп вопроса подумать про то как можно прикрутить хеши к проверке на палиндромность и уже затем вывел на решение за n logn, думаю это просто была его инициатива, т к оставалось свободное время.

Техническое собеседование
На тех собес позвали почти сразу. В качестве первой задания дали, алго задачку на стэк. Задача заключалась в том, чтобы проверить на правильную скобочную последовательность строку, которая состояла из трех видов скобок. Далее интервьюер потребовал реализовать класс стэк на Cи. С этой задачей мне повезло, потому что она встречалась у меня на вузовском курсе. Далее дали задачу на хеш таблицы (требовалось отсортировать элементы по количеству вхождений их копий в массив), а потом поговорили про устройство unordered_map и vector.

Собеседование с командой
Через две недели после технического интервью мне пишет HR и говорит, что она согласовала финальные собеседования с двумя командами.

Собеседование с первой командой прошло в устной форме. Я не написал ни единой строчки кода. По большей части мы разговаривали про вуз, какие там курсы проходили, их тематики, про мой опыт, который, кстати, ограничивался лишь вузовскими курсами и пет проектами курса поступашек. И, соответственно, интервьюер потребовал рассказать про пару пет проектов курса (их я кстати просто скопировал, предварительно разобравшись).

Во второй команде собеседование более формально прошло, большую часть интервью мы писали код. А именно он потребовал сразу сходу реализовать lru cachе из питона аналог в c++. И оставшиеся минут 10 собеседования, лид рассказал про спектр задач, но уточнил что мест нет.

Приглашения пришли через неделю в обе команды, и я сразу решил выбрать первую команду, из-за наличия штатных мест, хотя вторая команда была поинтереснее.

@postypashki_old

46 views13:59

Интересное что-то

72 views14:00

Интересное что-то

Forwarded from Задачи DS - Собеседования, Соревнования, ШАД

Изи стажка в VKВидео

✅️

#vk
В начало

Делюсь отзывом о стажировке от выпускника наших курсов. Учусь на 4 курсе бизнес-информатики в ВШЭ. Всё началось с моего друга, он уже работал в вк и дал контакт своего эйчара. Я отправил резюме, и через месяц мне пришла обратная связь на почту... кхе-кхе

Ваше резюме заинтересовало

и просьба связаться с hr. Списались в tg. Было сказано, мол будет алгоритмическая задачка и теория по ML, но я бы сузил до алгоритмическая задачка и рекомендашки

По сути вышло 3 этапа: созвон с эйчаром, тех-собес на 1.5 часа, финал с командой

Тех.собес
1.собеседующий рассказал, почему пошёл в вк (кстати, лично я кайфанул от прикольной фичи в офисе, такой как безлимитная кола(стоит автомат как в бургер кинге:), иногда засиживался на кофе-поинтах в ноуте из-за этого)
2.Алгоритмическая таска
Дан массив чисел и число k. Нужно вернуть k самых частых элементов
по решению: считаем частоту чисел через хеш-мапу, сортируем пары (число, частота) по убыванию частоты, берём первые k элементов, O(NlogN) асимптотика
3.Блок с рекомендашками
написать функцию, которая вычисляет Precision@K

def precision_at_k(recommended_items, relevant_items, K):
    top_k = recommended_items[:K]
    relevant_in_top_k = [item for item in top_k if item in relevant_items]
    return len(relevant_in_top_k) / K if K > 0 else 0.0

пользователи часто добавляют айтемы в "смотреть позже", но не смотрят их. Как можно улучшить рекомендации?
можно ранжировать айтемы по вероятности клика(CTR, например), учитывая контекст: время, устройство и историю просмотров, после чего делать A/B-тесты и добавлять разнообразие(избегаем застревания в одной категории), повышая вовлечённость

написать формулы метрик ранжирования, которые помню(написал MAP, nDCG, MRR), обсудили ранговую корреляцию+ попросил рассказать основные подходы к построению рекомендательных систем

Финал
ребята рассказали о себе, я поделился своими пет-проектами; в целом, словили общий вайб

через 3 дня дали офер

По стажке
понравился опыт, лично я дорабатывал алгоритмы рекомендаций, крутил данные, проверял гипотезы и даже пару раз устроил небольшой баг в A/B-тестах (но быстро поправил!)
+ немного помогал внедрять фичи в бекенд

вообще, если попадёте, рекомендую ходить на митапы и задавать глупые(как вам кажется) вопросы, быстрее освоитесь:)

зп: 80к гросс, 3 месяца
@zadachi_ds_chat

Please open Telegram to view this post

VIEW IN TELEGRAM

65 views14:00

Интересное что-то

74 views14:01

Интересное что-то

Forwarded from Поступашки - ШАД, Стажировки и Магистратура

Стажировка Data Science в Альфа-Банке (2025)

Выпускник нашего курса по DS поделился своим опытом стажировки. Текст немного отредактирован.

Лонг стори шорт, зашёл на страницу программы Альфа будущее, вакансии там обновляются регулярно, начал следить за позициями по DS. Через пару недель нашёл подходящую. Требования стандартные: питон, SQL, основы ml, pandas, scikit-learn, а также любой фреймворк для глубокого обучения.

Отправил резюме с github-ссылкой. Указал два проекта: предсказание цен на недвижимость на kaggle и классификатор текстов на pytorch (BERT+дообучение на датасете с отзывами). Коммерческого опыта не было. Ответили через 20 минут с тестовым заданием.

Тест: теория ml (бэггинг против бустинга, когда используется f-score и прочая мл база), SQL:
1.написать запрос с JOIN для объединения данных о клиентах и их транзакциях
2.оконная функция для расчёта скользящего среднего дохода,
pandas для обработки данных, немного статистики:
интерпретация p-value в A/B-тесте, и как определить, что разница между группами значима?

Ответил почти всё, но ошибся с масштабированием признаков для градиентного бустинга и получил недостаточный, как мне показалось, результат. Думал, что не прошёл. Но через три недели HR снова связался - мое резюме осталось в базе, и появились позиции в группе кредитного скоринга

Началось всё с собеседования с тимлидом: обсуждали мои проекты, выбор метрик, методы борьбы с переобучением. Важно было объяснить логику решений, а не просто перечислить технический стек.
На технических собеседованиях, к моему счастью, не было ничего страшного: давались практические кейсы по типу: как обрабатывать категориальные признаки с высокой кардинальностью или как работать с данными о клиентах. Никаких задач по написанию кода.

И наконец сам офер получил через пару недель, онбординг занял несколько дней.

Первые задачи были связаны с анализом качества данных: искали утечки в фичах, проверяли стабильность распределений. Потом доверили дообучение модели - нужно было аккуратно протестировать новые гиперпараметры, чтобы не сломать продакшен + пришлось много работать с SQL: писал сложные запросы к хранилищу и агрегировал данные для новых фичей.

@postypashki_old

79 views14:01

Интересное что-то

#dl #graph #courses

73 views18:52

Интересное что-то

Forwarded from Konstantin Klepikov

кстати, если кому интересно и есть желание пройти семинары pyg, там еще есть продолжение в 6 лекций
https://antoniolonga.github.io/Advanced_PyG_tutorials/index.html

73 views18:52

Интересное что-то

73 views18:54

Интересное что-то

Forwarded from Vitaly

По LLM я бы посоветовал пройти этот курс от Себастьяна Рашки. Там прям самые основы.

https://github.com/rasbt/LLMs-from-scratch

Еще у него есть такой блог пост о ML, но по большей части там о LLM

https://sebastianraschka.com/books/ml-q-and-ai/

GitHub - rasbt/LLMs-from-scratch: Implement a ChatGPT-like LLM in PyTorch from scratch, step by step

Implement a ChatGPT-like LLM in PyTorch from scratch, step by step - rasbt/LLMs-from-scratch

99 views18:54

Интересное что-то

83 views18:54

Интересное что-то

Forwarded from Andrey

из книг следующая на очереди Alammar J., Grootendorst M. - Hands-On Large Language Models, вроде бы годнота. Не знаю, как сильно пересекается с курсом выше и как по уровню, доступнее или нет

84 views18:54

Интересное что-то

#graph #books #novice

85 views19:00

Интересное что-то

Forwarded from Konstantin Klepikov

https://dmkpress.com/catalog/computer/kompyuternye-seti/978-5-97060-984-2/

Наука о сетях: вводный курс

Купить книгу «Наука о сетях: вводный курс», автора Дэвис К. А. в издательстве «ДМК Пресс». Выгодные цены в Москве, доставка. Заказать книги и учебники на официальном сайте издательства.

98 views19:00

Интересное что-то

#agents #courses

84 views19:05

Интересное что-то

Forwarded from ML Baldini • Nikita Boyandin (Nikita Boyandin)

#Курсыпоагентам

Одна из самых лучших рубрик на моем канале по реакциям, поэтому возвращаюсь к ней с самой интересной темой сейчас - агенты. Тут будут собраны материалы в основном на английском языке, потому что на русском пока такого очень мало.

1️⃣

Курс по Microsoft для начинающих - один из лучших курсов по структуре, есть как база, так и условный MCP. Если бы не так часто использовали Azure, была бы совсем сказка

2️⃣

Курс от Huggin Face - очень много техники, упор идет на понимание фреймворков, при этом есть супер интересные проекты, как агенты в покемонах

3️⃣

Жесткий буткемп - буткемп от очень сильных ресерчеров, много хороших статей, для развития кругозора в теме подойдет отлично

4️⃣

Репозиторий агентов от OpenAI - собраны практически все задачи и решения по ним с помощью агентов, так еще и множество других гайдов, например тот же промптинг

5️⃣

Очень много начальной практики - курс от DeepLearning заточен на написание кода и решения задач, так что для начала подойдет идеально

6️⃣

Гайд по построению агентов от OpenAI - приятная практическая методичка по работе с агентами, которая вышла совсем недавно

Как вам такая подборка и какие темы вы еще хотели бы увидеть в этом канале?) Обязательно ставьте реакции и пишите комментарии, автору будет приятно💗

Please open Telegram to view this post

VIEW IN TELEGRAM

84 views19:05

Интересное что-то

71 views13:23

Интересное что-то

Forwarded from Джимми Нейрон 🚀

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

Девушка из Лондона по имени Salma Aboukar (специалистка по использованию нейросетей для работы с брендами) поделилась своим промптом для Veo 3, который вирусным образом разошелся в среде российских нейрокреаторов.

Пару дней назад тоже тестировал этот промпт (он работает не только с Veo 3):

{
"description": "Cinematic shot of a sunlit Scandinavian bedroom. A sealed IKEA box trembles, opens, and flat pack furniture assembles rapidly into a serene, styled room highlighted by a yellow IKEA throw on the bed. No text.",
"style": cinematic",
"camera": "fixed wide angle",
"lighting": "natural warm with cool accents",
"room": "Scandinavian bedroom",
"elements": [
"IKEA box (logo visible)",
"bed with yellow throw",
"bedside tables",
"lamps",
"wardrobe",
"shelves",
"mirror",
"art",
"rug",
"curtains",
"reading chair",
"plants"
],
"motion": "box opens, furniture assembles precisely and rapidly",
"ending": "calm, modern space with yellow IKEA accent",
"text": "none",
"keywords": [
"16:9",
"IKEA",
"Scandinavian",
"fast assembly",
"no text",
"warm & cool tones"
]
}

Еще примеры: коробка с панельками, советская квартира, еще одна советская квартира, комната в стиле Hello Kitty, рождение вселенной.

77 views13:23