Igrek.log
129 subscribers
3 photos
5 links
Рассказываю про разработку, ML и свои проекты. Делюсь полученным опытом в этом канале :)

author @bom_bo0m
Download Telegram
Channel created
Пост-знакомство

Привет! Меня зовут Игорь Павлов и мне 22 года. Сейчас я заканчиваю бакалавриат ПМИ в Бауманке и готовлюсь к поступлению в магистратуру. В школе участвовал в олимпиадах по DS и хотел учить модельки и вот уже почти 4 года я работаю ML инженером в Sber AI. Помимо работы пишу статьи (раз, два), иногда участвую в хакатонах и еще пытаюсь в опенсорс, мои проекты можно посмотреть тут.

О чём канал?

Буду писать про computer science, нейронные сети, MLOps, а также про интересные события из жизни. Канал не только о технологиях, но и о моём пути к work-life balance. Если получится достигнуть, обязательно расскажу!

Где ещё меня найти
github
telegram

#WHOIS
🔥71
Это зарезервированный пост :)
🤝2
Igrek.log pinned «Пост-знакомство Привет! Меня зовут Игорь Павлов и мне 22 года. Сейчас я заканчиваю бакалавриат ПМИ в Бауманке и готовлюсь к поступлению в магистратуру. В школе участвовал в олимпиадах по DS и хотел учить модельки и вот уже почти 4 года я работаю ML инженером…»
Сейчас заметил, что у постов выше отключены комментарии( Поэтому этот пост будет для комментариев и обсуждения
Сегодня вышла моя первая статья на Хабр про использование процессов в python!

⚙️Как работает multiprocessing в Python под капотом🔧

Многим разработчикам на python, в том числе DS/ML/DE специалистам, нужно ускорять обработку данных или распараллеливать CPU-bound вычисления. Потоки для этой задачи не подходят, так как в питоне есть GIL, поэтому часто используют процессы. Но чтобы мастерски овладеть каким-то инструментом, необходимо понимать как он устроен. Поэтому я подробно разобрал детали реализации пакета multiprocessing.
В статье вы узнаете:
- Как создаются процессы в ОС
- Как устроен внутри пакет multiprocessing
- Как работает пул процессов

P.S. Если получится дать обратную связь или поставить upvote на хабре - буду рад))
P.P.S. Перезалил пост, чтобы были доступны комментарии
10👍6🍾4
Всем привет!
Пропал на два месяца, потому что закрывал сессию и писал диплом😵‍💫 Но сейчас возвращаюсь с отличной новостью:
🔥10
⚡️Сегодня мы выложили наш фреймворк для обработки и фильтрации изображений и видео

DPF - это наш внутренний фреймворк, с помощью которого мы обрабатывали и чистили датасет для обучения моделей Kandinsky и Kandinsky Video. Репозиторий содержит фильтры для видео, изображений, различных комбинаций этих модальностей, а также удобный интерфейс к ним. Надеемся, что открытие кода ускорит развитие библиотеки и даст возможность ресерчам сосредоточиться на ресерче, а не на чистке данных ❤️‍🔥

А ещё мы написали статью на habr, в которой подробно рассказали про то, как собирали датасет для обучения Kandinsky 3.0 & 3.1 и Kandinsky Video. В ней также рассказали про DPF и процесс обработки датасетов у нас в Sber AI.

💻 github DPF
📖 Статья на Хабр
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥19👍84❤‍🔥1
Часто сталкиваюсь с проблемой, что нужно удалять большое количество файлов и папок, а rm -rf слишком медленный для этого, удаление одного датасета может занимать несколько часов.

Вчера всё-таки дошли руки сделать либу специально для быстрого удаления папок, прикрутить к ней нормальную установку через pip и cli.

https://github.com/boomb0om/parallel-rm-rf
🔥14
Теперь официально бакалавр👨‍🎓😎
🏆33👏7🔥6👍1
Всем привет!

На этой неделе я официально стал студентом магистратуры AI Talent Hub! Изначально я выбирал между тремя институтами: сколтех, вышка и итмо. После долгого изучения и опросов знакомых, выбрал именно AI Talent Hub в ИТМО, чему я очень рад.

Если кто-то из подписчиков там учится или тоже поступает, то буду рад познакомиться)
🔥24🤩41👏1