Data Scientist | IT
1.94K subscribers
652 photos
3 videos
1 file
708 links
Добро пожаловать в клуб.

Полезные материалы из мира DS & ML на регулярной основе.

По всем вопросам: @godinmedia
Download Telegram
Большой гайд по резюме для Data Scientist

#почитать

CV – это формализованный процесс, который является первым шагом в поиске работы, но возможно он существенно повлияет на Ваш Job Offer. Поэтому сохраняя честность, по поводу своей реальной работы и результатов, не следует быть скромными. Важно указывать реальный опыт в ИТ, количество лет опыта, включая победы в олимпиадах и опыт, который был в юности. Будьте честны и достаточно смелы.

Читать статью
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥2
🔤🔤🌌🔤🔤🔤🔤🔤 — канал с PM юмором

➡️ Подписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
😁7
ML-детекция дефектов дорожного покрытия

#почитать

В этой статье мы рассмотрим дорожное покрытие, а именно – задачу детекции его дефектов без необходимости разметки данных. Разметка сама по себе отнимает много ресурсов у компаний, а уж разметка облака точек... можете себе представить трудоемкость и затратность денежных ресурсов.

Я расскажу о том, как мы использовали данные с LiDAR, применяли различные алгоритмы для обработки и анализа информации и какие результаты удалось достичь. Задача была нетривиальная для нашей команды так как никто не работал с облаком точек до этого и ожидали мы классические данные видеопотока, но заказчик смог удивить.


Читать статью
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
Расчет рентабельности инвестиций и другие задачи дата-сайентиста

#почитать

Как специалисты data science (DS) оперативно рассчитывают рентабельность инвестиций в проект (ROI) на реальной практике, то есть в ситуации, когда нет актуальной информации о необходимых данных? К примеру, чтобы рассчитать компонент оттока в Lifetime Value (LTV), требуются месяцы аналитики. К каким инструментам прибегают, чтобы ускорить эти процессы?

Для быстрой оценки ROI есть классический метод оценки смежных компонентов: охвата, влияния и усилия.


Читать статью
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
Машинное обучение - это мост между бизнесом и Data Science. Быстрое объяснение теории, задач и процессов

#почитать

Хотя недостатка в историях и евангелистах нет, машинное обучение пока не стало в глазах бизнеса абсолютной необходимостью. В общественном восприятии применяемые в ML алгоритмы близки к научной фантастике.


Читать статью
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
🐛 SQL для тестировщика — канал для развития одного из обязательных навыков QA-инженера. Публикуем обучающие видео и много-много задач и тестов для тренировки.

Чем мы отличаемся от остальных:
— грамотные редактора (работающие разработчики и QA, создатели канала Тестировщик от бога и портала testengineer.ru);
— качественное оформление;
— уникальные материалы (некоторые материалы мы пишем и переводим сами);

Подписывайтесь на наш канал по SQL.
👍4
Рассказываем про KAN (Kolmogorov-Arnold Networks)

#почитать

Эволюция архитектуры нейронных сетей уходит корнями в фундаментальные работы, заложенные в 1940-х годах Уорреном Маккаллохом и Уолтером Питcом, которые предложили концепцию искусственных нейронов и их взаимосвязь.

Однако значительные прорывы произошли только в 1980-х годах с разработкой алгоритмов обратного распространения ошибки: алгоритм Геоффри Хинтона и других – все это позволило создавать более глубокие нейронные сети и улучшить методы обучения.

В это время появились классические архитектуры, многослойные перцептроны (MLP, и сверточные нейронные сети (CNN).


Читать статью
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
Какие инструменты для визуализации данных нужны дата-аналитику

#почитать

Собрали подборку инструментов для визуализации данных из сложных таблиц в читабельные дашборды.

Читать статью
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
🟡 3 стажировки для начинающих дата-сайентистов (по состоянию на 11.07)


▫️Business Data Engineer в Т-Банк (eng: B1+, office, office, fulltime)

▫️Junior Data Scientist (Стажер) в Центр Финансовых Технологий (eng: B1+, office, flexible)

▫️Junior Data Scientist в Ооо Гибрид (eng: B1+, remote, office/remote, fulltime, 80000 RuR)



P.S. вакансии junior-специалистов закрываются довольно быстро, поэтому на момент просмотра они могут быть уже неактуальны
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
Градиентный бустинг (XGBoosting) на пальцах

#почитать

Если брать определение из словарика, то градиентный бустинг - модель машинного обучения, решающая задачи классификации и регрессии. Она состоит из ансамбля более слабых моделей (чаще всего дерево решений) и учится последовательно на ошибках предыдущей модели.

Но здесь я хочу упростить все сложные статьи с кучей математических терминов, коих в интернете немало, поэтому просто предлагаю разобрать это определение бустинга простыми словами.


Читать статью
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
Пятничное. Создаем цифровых двойников Ленина и Николая Второго

#почитать

Идея этого эксперимента возникла во время изучения возможностей сервиса HeyGen. Казалось, что задумка проста и гениальна. Мне, как любителю истории, очень хотелось узнать ответы на целый ряд вопросов непосредственно из уст Императора. Но, забегая вперед, скажу, что трудности возникли, причем в очень неожиданном месте.


Читать статью
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
Команда AI VK ищет ML-разработчика для развития системы рекомендаций и поиска контента 🔥

Какие задачи предлагают:
- улучшение базового качества рекомендаций,
- запуск новых сценариев музыкальных рекомендаций для платформы VK Музыка,
- анализ статистики потребления контента, проведение А/B тестов, а также взаимодействие со смежными командами.

Требуется опыт промышленного применения ML, глубокое понимание алгоритмов классического ML (LogReg, MF, CatBoost, etc..) и навык работы с большими данными (MapReduce/Spark). Отдельный плюс — знание Java и опыт в построении рекомендательных систем.

Узнать подробности можно по ссылке, а, чтобы откликнуться — пишите в ЛС в tg https://t.me/ellinatsyra.
🔥7
Метрики в ИИ. Регрессия. MSE, RMSE, MAE, R-квадрат, MAPE

#почитать

Задача регрессии в машинном обучении — это тип обучения в ИИ, когда модель обучается на данных с непрерывным значением, чтобы предсказывать его на основе одного или нескольких входных параметров. Отличие регрессии от задач классификации заключается в том, что регрессия предсказывает непрерывные значения (например, цену на дом, температуру, количество продаж), в то время как классификация предсказывает категориальные метки (например, да/нет, красный/синий/зеленый).

То есть задача регрессии предсказывает какую-то цифру, а задача классификации - это как выбор в тесте из нескольких вариантов ответа.


Читать статью
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥71
Максимально точное увеличение разрешения изображений: билинейная аппроксимация

#почитать

Это вторая статья из этого цикла, и, как говорилось в первой – интерполяция категорически не подходит для этой задачи, так как нарушает условие среднего (соответствующие пиксели получившегося изображения в среднем должны быть пикселем исходного).


Читать статью
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥21
Streamlit для Data Science

#почитать

Для создания веб-приложений ты скорее всего использовал бы такие Python фреймворки, как Django или Flask. Но крутая кривая обучения этим фреймворкам и большие временные затраты на имплементацию таких приложений являются серьезным препятствием. Streamlit делает создание приложений настолько простым, насколько просто писать скрипты на Python.

Читать
Please open Telegram to view this post
VIEW IN TELEGRAM
👍61🔥1
Перспективы профессии Data Science: ликбез для джунов

#почитать

Дата-аналитики анализируют исторические данные. Результат их работы — выводы, отчёты, документация. В дата-анализе есть много направлений. Например, системные аналитики могут участвовать в построении инструментов для хранения данных, бизнес-аналитики общаются с заказчиками и формируют бизнес-требования, выстраивают бизнес-процессы.

Часто аналитики решают аd-hoc задачи — это задачи, которые не входят в повседневные обязанности аналитика. Например, если в данных выявили аномалию, дата-аналитику могут срочно поручить разобраться с этой проблемой.

Аналитику не нужно разбираться в работе алгоритмов и предиктивных моделей, поэтому порог входа в профессию ниже.

Дата-сайентисты специализируются на построении моделей и прогнозировании. Основной результат их работы — это модели машинного обучения. В зависимости от задач и типов данных дата-сайентисты могут строить как линейные модели или модели на «деревьях решений» для табличных данных, так и модели нейронных сетей для работы с изображениями, видео, текстами и так далее.

Чтобы работать дата-сайентистом, специалисту нужна неплохая математическая и алгоритмическая база. Работодатели ценят кандидатов с техническим образованием, а самые сильные спецы на рынке — это, как правило, выпускники МФТИ, НИУ ВШЭ И МГУ.

Читать
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7
Материалы для подготовки к собеседованию. Дизайн систем машинного обучения

#почитать

- Книги
- Курсы
- Шаблоны
- Блоги

Посмотреть
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👌1
Расширенные функции Apache Flink

#почитать

Что такое rich-функции в Apache Flink, зачем они нужны, чем отличаются от обыкновенных UDF и как с ними работать: простой пример на PyFlink с запуском в Google Colab.

Читать
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
Реактивно быстрое введение в машинное обучение для чайников

#почитать

Хорошая статья для первого знакомства с темой


Читать
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥2
📚 Друзья, для тех, кто хочет ознакомиться с большим количеством книг по тестированию, есть отличный телеграм-канал — Библиотека QA

Совместно с Библиотекой QA мы подготовили бриллиантовую 💎 подборку книг для обучения тестированию. Все эти книги можно бесплатно скачать у ребят на канале:

💎 "Тестирование программного обеспечения. Основы" Захаров В.В.
Обзор базовых понятий и методик тестирования программного обеспечения, подходящий для студентов и начинающих специалистов в области ИТ.

💎 "Эффективное тестирование" на русском Maurício Aniche
Практическое пособие по улучшению процессов тестирования с использованием различных техник, включая тестирование на основе данных и автоматизацию.

💎 "Тестирование DOT COM" Роман Савин
Практическое руководство по тестированию веб-приложений, в котором автор делится своим опытом и методами выявления и устранения багов.

💎 «Тестирование программного обеспечения. Базовый курс» Святослав Куликов
Введение в основы тестирования программного обеспечения, охватывающее ключевые концепции, методы и инструменты для начинающих тестировщиков.

💎 «Как тестируют в Google» Джефф Каролло, Джеймс Уиттакер, Джейсон Арбон
Описание уникальных подходов и практик тестирования, применяемых в Google, с акцентом на автоматизацию, масштабируемость и инновации.

💎 "Сам себе тестировщик. Пошаговое руководство по тестированию ПО" Чхави Радж Досадж
Пошаговое руководство, предназначенное для тех, кто хочет начать карьеру в тестировании программного обеспечения, с множеством примеров и практических советов.


🐞 Подписывайтесь на Библиотеку QA
👍52🔥1
Я тебя с вертухи сломаю, если ещё раз заговоришь об ИИ

#почитать

Лично я получил формальное образование дата-саентиста, даже выиграв в высококонкурентном конкурсе по машинному обучению в одном из лучших университетов Австралии и написав магистерскую, для которой создал в MATLAB с нуля собственные библиотеки. Я не гений в этой сфере, но, очевидно, лучше большинства конкурентов, то есть практиков вроде меня; я не могу, сидя в пещере, создавать собственные библиотеки на C, но умею читать учебники, реализовывать готовые решения на языках высокого уровня и использовать библиотеки, написанные элитными организациями.

Поэтому с глубочайшим сожалением должен объявить, что следующий человек, который начнёт говорить мне о реализации ИИ, получит от меня сеанс живительных процедур над позвоночником; иными словами, я сломаю ему нафиг шею.


Читать
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6