Data Scientist | IT
2.1K subscribers
567 photos
3 videos
1 file
623 links
Добро пожаловать в клуб.

Полезные материалы из мира DS & ML на регулярной основе.

По всем вопросам: @godinmedia
Download Telegram
⚡️Пошаговый план: как стать аналитиком данных в 2025

Хотите попасть в аналитику, но теряетесь в море информации и не понимаете, какие навыки действительно важны? Боитесь, что без опыта вас не возьмут на работу? И да, ещё один популярный вопрос — а что, если мне 30/40/50+ лет?

Андрон Алексанян — эксперт по аналитике с 8 летним опытом и по совместительству CEO Simulative — покажет рабочие схемы и четкий план, как устроиться в аналитику быстрее, даже если у вас нет опыта.

Что будет на вебинаре?

🟠 Разберем полный роадмап: что учить, в каком порядке, до какого уровня;
🟠 Лайфхаки трудоустройства:
— Покажем реальные примеры, как оформить резюме и портфолио, чтобы привлекать внимание;
— Обсудим какие отклики работают, а какие сразу отправляют в корзину;
— Изнанка найма: инсайдерский взгляд на процессы отбора
🟠 Практические техники для новичков: разберём, как компенсировать недостаток опыта и быстро закрывать пробелы в знаниях.

🕗 Важно досмотреть вебинар до конца, чтобы получить бонус от нас, который поможет бустануть карьеру.

😶Зарегистрироваться на бесплатный вебинар
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
Глубокая оптимизация сверточных нейронных сетей: Анализ методов улучшения модели на примере CIFAR-10

#почитать

Сверточные нейронные сети (CNN) стали основой для обработки изображений и компьютерного зрения. Однако их обучение требует тщательной настройки архитектуры и гиперпараметров, что может быть сложной задачей, особенно при работе с большими наборами данных. В этой статье мы подробно рассмотрим несколько методов оптимизации, используемых для повышения производительности CNN на примере набора данных CIFAR-10, и покажем, как различные техники влияют на потери и точность модели. Мы протестируем аугментацию данных, различные архитектурные решения, такие как Batch Normalization и Dropout, и адаптивные подходы к обучению.

Читать статью
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥1
Tribuo и регрессия: как строить предсказательные модели на Java

#почитать

Tribuo поддерживает различные алгоритмы для классификации, регрессии, кластеризации и многого другого. Но сегодня мы сосредоточимся на регрессии — фундаментальной задаче, которая позволяет предсказывать непрерывные значения. Одним из главных плюсов Tribuo является её удобный API, который позволяет быстро строить модели и оценивать их эффективность.

Читать статью
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍1
Hippo-RAG: Долговременная память для LLM, вдохновленная нейробиологией

#почитать

Ученые часто вдохновляется нашими или животными биологическими структурами: CNN, MLP, Backprop, и для многих других исследований можно найти сходства в реальном мире. Недавно вышла статья, которая делает то же самое, но для RAG (Retrieval-Augmented Generation). В некотором роде, это недостающая современным LLM долгосрочная память. Это понятно, а причем тут неокортекст, гиппокамп и другие сложные слова?

Читать статью
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥1
Все говорят, что работы в айти стало меньше...

На самом деле, работы полно. Мы подготовили 7 правильных каналов с вакансиями для тестировщиков, аналитиков, проджект-менеджеров и программистов.

В чем фишка этих каналов?

— зарплатная вилка🍴во всех вакансиях
— еженедельные подборки стажировок для начинающих — как здесь (для QA), здесь (для PM) и здесь (для BA&SA)
— быстрый телеграм/email контакт для прямой связи с рекрутером
— удобная навигация по уровням/условиям работы/направлениям тестирования

▪️Python Jobs — работа для Python разработчиков
▪️QA Jobs — работа для тестировщика
▪️PM Jobs — работа для Project и Product менеджера
▪️BA & SA Jobs — работа для бизнес- и системых аналитиков
▪️C# & .NET Jobs — работа для C# инженеров
▪️DS&ML Jobs — работа для DS инженеров
▪️PHP Jobs — работа для PHP разработчиков
▪️JAVA Jobs — работа для Java разработчиков

Подписаться на все каналы сразу
👍4
Data Science и машинное обучение: примеры использования в реальных проектах

#почитать

1. Прогнозирование спроса в ритейле: примеры из Walmart и Amazon
2. Машинное обучение в здравоохранении: от диагностики до прогнозирования
3. Компьютерное зрение на производстве: контроль качества на линии
4. Борьба с мошенничеством в финансовом секторе: анализ транзакций

Читать статью
Please open Telegram to view this post
VIEW IN TELEGRAM
👍51
Подборка из 5 классных книг для обучения soft-skills и управлению проектами:

▫️Искусство Agile-разработки
▫️Scrum. Революционный метод управления проектами
▫️Agile-трансформация. Готовый план перехода к гибкой бизнес-модели организации
▫️Эпоха Agile. Как умные компании меняются и достигают результатов
▫️Agile для всех. Создание быстрой, гибкой, клиентоориентированной компании

Эти (и многие другие книги по soft-skills и управлению проектами) вы можете найти на канале Библиотека PM. Там регулярно публикуются свежие книги на русском языке. Все книги публикуются для ознакомления.

➡️ Подписаться на Библиотеку PM
👍4
Cтатистика Байеса в ML для самых маленьких

#почитать

Байесовская статистика — это что-то вроде античного оракула в современном мире данных. Она не просто предсказывает будущее, она делает это с потрясающей уверенностью, опираясь на всё, что знает (или думает, что знает) о прошлом. Представьте себе модель машинного обучения, которая не довольствуется лишь холодными числами и вероятностями, полученными из текущих данных.

Она как опытный инвестор, который всегда держит в уме свой предыдущий опыт, но готов быстро адаптироваться, как только рынок (то есть данные) даёт ему новую информацию. Именно здесь в игру вступают априорные и апостериорные вероятности — два основных инструмента, при помощи которых Байесовский подход разворачивает свою магию.

Априорная вероятность — некий изначальный набор гипотез, который может быть основан на знаниях, догадках или статистике. Например, если вы обучаете модель для распознавания мошенничества в финансовых операциях, ваш априор может быть основан на данных предыдущих лет, когда мошенничество составляло, скажем, 5% от общего числа операций.

Читать статью
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
PM Юмор

Проджект-менеджеры не ставят дедлайны — они искусно создают атмосферу легкой паники и срочности.

«Спринт-планирование»? Что это? Если команда в Zoom, никто не молчит и все делают вид, что понимают — значит, всё идёт по плану!

Подписывайтесь на PM Юмор — где шутки появляются быстрее, чем таски в бэклоге!

PM Юмор
👍4🔥1
Предиктивная аналитика надёжности оборудования

#почитать

Для насосного оборудования такие предсказания могут включать в себя оценку вибрации, температуры, давления, уровня жидкости и других критических параметров. Благодаря этому становится возможным планировать ремонты и замену деталей таким образом, чтобы минимизировать время простоя и затраты на обслуживание.

Читать статью
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
▫️Как обрабатывать, фильтровать и генерировать текстовые данные для ML моделей

#посмотреть

DATAMeetup.

Смотреть на YouTube ⏱️25 минут
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5
Компьютерное зрение на С++: подключаем ML-библиотеки и обрабатываем результаты поиска объектов

#почитать

•Как подключить к проекту библиотеки машинного обучения PyTorch и NCNN.
•Как получить модели YOLOv5 и YOLOv4 для использования на мобильном устройстве.
•Как реализовать инференс моделей для обнаружения объектов.
•Как обработать результаты работы моделей YOLO, реализовав алгоритмы Non-Maximum-Suppression и Intersection-Over-Union.

Читать статью
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
?
👍5
Почему оценить стоимость датасета не так просто, как кажется

#почитать

Представьте, что вы получили заказ на разметку датасета из 1,000 изображений. Вы берете 20 картинок из сета, проводите тесты и получаете примерную стоимость 1 изображения. В итоге вы оцениваете проект, основываясь на количестве изображений, и устанавливаете цену за каждое. Однако, когда данные приходят, оказывается, что на каждом изображении не один объект к разметке, как было на тестах, а десятки! В итоге вы тратите гораздо больше времени и средств, чем планировали в начале.

Как избежать таких распространенных ошибок и защитить свой бизнес от неожиданных затрат и задержек? Давайте обсудим, какие ошибки чаще всего возникают при оценке проектов по сбору и разметке данных для машинного обучения, и на что важно обращать внимание, чтобы гарантировать корректную оценку ваших проектов.

Читать статью
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5
Предвзятость русскоязычных LLM

#почитать

Как выглядит типичный день человека: его пол, возраст, профессия и типичный распорядок дня по мнению нейросетей от Яндекса, Сбера, Т‑Банка.

Читать статью
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥1
Чем занимаются дата-сайентисты в Авито

#почитать

Статья будет интересна начинающим и мидл-дата-сайентистам, а также тем, кто только хочет войти в профессию и ищет образовательные программы.

Читать статью
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍1
State Space Models. Mamba

#почитать

Ни для кого не секрет, что доминирующей на данный момент архитектурой в области Deep Learning являются трансформеры. Они произвели настоящий фурор и стали основой для самых известных LLM. На данный момент они используются почти во всех фундаментальных моделях, от тех, что с открытым исходным кодом, таких как Mistral, до закрытых, таких как ChatGPT. Однако, трансформеры не лишены некоторых недостатков. Сегодня мы разберём архитектуру под названием Mamba, которая претендует на то, чтобы стать соперником трансформеров и решить их уязвимости.

Читать статью
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥2
ML-тренды рекомендательных технологий

#почитать

Главная задача рекомендательной системы — предоставить пользователю контент, фильм, трек, книгу, товар или информацию, которые могут заинтересовать его в данный момент. Сложность в том, что у нас нет явного запроса пользователя, как в поиске, есть только история его взаимодействий с объектами и наша надежда на то, что мы верно распознали его скрытые желания.

Читать статью
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
Прогнозируем движение беспилотного автомобиля - Yandex Cup

#почитать

Недавно завершился чемпионат по программированию Yandex Cup ML Challenge 2024, в котором я занял второе место в задаче “Self-driving cars: предсказание движения беспилотного автомобиля”. В статье расскажу про задачу и подходы, которые использовал для решения.


Читать статью
Please open Telegram to view this post
VIEW IN TELEGRAM
4
LLaDA: The Diffusion Model That Could Redefine Language Generation

#почитать

How LLaDA works, why it matters, and how it could shape the next generation of LLMs.

Читать статью
Please open Telegram to view this post
VIEW IN TELEGRAM