Data Scientist | IT – Telegram

Data Scientist | IT

@datascience_it

1.94K subscribers

650 photos

3 videos

1 file

706 links

Добро пожаловать в клуб.

Полезные материалы из мира DS & ML на регулярной основе.

По всем вопросам: @godinmedia

Download Telegram

About

Blog

Apps

Platform

Data Scientist | IT

1.94K subscribers

Data Scientist | IT

Секретная сила Data Science в клиентской поддержке

#почитать

Когда говорят о Data Science, чаще всего вспоминают маркетинг и продуктовую аналитику. Но в компаниях, где данные действительно работают на бизнес, сфера их применения куда шире. Один из таких недооценённых источников ценности — команда клиентской поддержки. В этой статье — практический разбор того, как Data Science может не просто визуализировать SLA и TTR, а стать реальным драйвером изменений: от оптимизации нагрузки и улучшения самообслуживания до внедрения LLM для анализа обратной связи.

⏱

Читать статью

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5

293 views05:01

Data Scientist | IT

Matrix Reloaded: зачем дата-сайентисту линейная алгебра

#почитать

Зачем дата-сайентисту векторы, матрицы и собственные значения? В статье Марии Жаровой, ML-инженера Wildberries и автора канала Easy Data, — простое объяснение, как линейная алгебра помогает понимать, что происходит внутри моделей машинного обучения. Без доказательств и зубрежки: только визуализации, реальные кейсы и примеры из практики.

⏱

Читать статью

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5

276 views05:03

Data Scientist | IT

Топ вопросов с Data Science собеседований: Основы Classic ML, Линейные модели, Метрики классификации и регрессии

#почитать

Этот материал не рассчитан на изучение тем с нуля. Это чеклист и тренажёр, по которому стоит пройтись перед техническим интервью по классическому ML. Кратко, по делу, с акцентом на то, что действительно спрашивают.

В этой части разберем: основы машинного обучения, переобучение и кросс‑валидация, линейные модели, метрики классификации и регрессии.

⏱

Читать статью

Please open Telegram to view this post

VIEW IN TELEGRAM

❤7👍1

277 views11:40

Data Scientist | IT

❌ «В IT сейчас работы нет» — слышали такое?

А вот и нет 🙅‍♂️ Мы каждый день публикуем новые, живые вакансии с вилкой и прямыми контактами рекрутеров в телеграм.

Подборки для всех направлений — от джуна до лида.
Есть даже еженедельные интерншипы и стажировки для начинающих.

🔎 Выбирай свой канал:

QA → @qa_work
PM → @jobs_pm
BA/SA → @analytics_jobs
.NET → @job_dotnet
DS/ML → @dsml_jobs
PHP → @work_php
Java → @java_dev_job
Python → @jobrocket_python

🧩 Или подпишись сразу на все

👨‍💻6

279 views07:35

Data Scientist | IT

Проблема подглядывания и последовательное А/Б тестирование

#почитать

Сегодня узнаем, что такое проблема подглядывания и почему она появляется. Реализуем аналог метода Покока и критерий Вальда для последовательного тестирования. Посмотрим, можно ли одновременно подглядывать и контролировать вероятности ошибок при том же размере групп. Обсудим границы применимости последовательного тестирования.

⏱

Читать статью

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5

253 views06:05

Data Scientist | IT

В категории «Поесть» появился новый фильтр — «Вайб». Можно выбирать заведение не по типу кухни и оценкам, а по настроению, особенностям и цели визита.

Как мы это сделали?
Научили нейросеть понимать вайбы — объясняли, что такое «уютно», «романтично» или «пофоткаться». Собрали фотки кафе и ресторанов, написали промпты, прогнали через мультимодальные модели, словили ошибки и в итоге построили пайплайн, который превращает субъективные ощущения в рабочие датасеты.

В нашем блоге на Хабре рассказали, как:
— выбирали модели (и почему не только GPT);
— писали промпты, которые не ломают всё;
— и получившийся план работ c LLM, который можно забрать себе в работу!

\#2ГИС_ai

👍5

281 views12:01

Data Scientist | IT

🌼

😁5

280 views16:25

Data Scientist | IT

👑 Кто работает PM — тот в цирке не смеется

Наша сегодняшняя рекомендация — канал с PM юмором.

Мы работаем в проджект-менеджменте и уже не смеемся. Но если вас можно рассмешить — welcome в PM Humor

👍5

279 views07:33

Data Scientist | IT

Линейная регрессия в ML для самых маленьких

#почитать

Линейная регрессия — это статистический метод, используемый для моделирования взаимосвязи между зависимой переменной и одной или несколькими независимыми переменными. Проще говоря, он помогает понять, как изменение одного или нескольких предикторов (независимых переменных) влияет на результат (зависимую переменную). Подумайте об этом, как о проведении прямой линии через диаграмму рассеяния точек данных, которая наилучшим образом отражает связь между этими точками.

⏱

Читать статью

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5

352 views11:40

Data Scientist | IT

Нечеловеческий фактор: кто ответит, если ваш AI накосячит? Смотрим кейсы правоприменения и строим прогнозы

#почитать

Сегодня предлагаю обсудить слона в комнате, а именно: что вам будет с точки зрения закона, если AI, который вы разрабатываете или закупаете для своей компании, ошибется, некорректно сработает или будет использован для нарушения чужих прав. Ныряйте под кат, там разберем какие правовые документы регулируют это у нас и за рубежом, в какую сторону скорее всего будет развиваться законодательство в сфере AI и что предусмотреть в доке, договорах и регламентах уже сейчас, чтобы потом не пришлось тушить пожары. Постараюсь сильно не грузить и сразу переводить с юридического на человеческий.

⏱

Читать статью

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5

330 views06:13

Data Scientist | IT

QTune — open-source решение для быстрого файн-тюнинга моделей

#почитать

Это open-source приложение с графическим интерфейсом, которое превращает сложный и требовательный процесс файнтюнинга в понятный и управляемый процесс, доступный каждому. Это не просто набор скриптов, а полноценная студия, охватывающая весь цикл: от создания датасета до запуска готовой модели локально.

⏱

Читать статью

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5🔥1

272 views05:15

Data Scientist | IT

Есть ли жизнь без споттера? Как мы внедряли быстрые команды в умные устройства Sber

#почитать

Меня зовут Айрат, я руковожу командой Embedded ML в Сбере. Сегодня мы выкатили быстрые команды для умных колонок SberBoom. Они позволяют управлять самим устройством, а также телевизорами Sber, ТВ-приставками SberBox и умным домом с помощью колонки проще и быстрее.

Сегодня я расскажу, как удалось уместить все быстрые команды всего в 6 МБ и благодаря чему наше решение распознает не только простые команды вида «Включи свет», но и сложные со множеством параметров, например, «Яркость сорок пять процентов в коридоре». Мы рассмотрим, что такое спам-команды и как мы добились их корректного распознавания без задержек.

⏱

Читать статью

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥6👍2

291 views10:41

Data Scientist | IT

Reflect, Retry, Reward: как RL учит LLM рефлексировать и становиться лучше

#почитать

я NLP-инженер в Сбере. Занимаюсь мультиагентными системами и работаю с LLM в проде. Сегодня расскажу про одну из самых интересных статей июня по версии Huggingface Daily Papers — Reflect, Retry, Reward: Self-Improving LLMs via Reinforcement Learning.

⏱

Читать статью

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6

272 views06:19

Data Scientist | IT

Поисковые подсказки: подход «генератор-дискриминатор»

#почитать

О подходе, который мы разработали для создания поисковых подсказок и для поиска релевантных похожих запросов для разных бизнес-сценариев, и пойдет речь в этой статье.

⏱

Читать статью

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5❤1🔥1

301 views10:41

Data Scientist | IT

Оптимизация LLM: LoRA и QLoRA

#почитать

В этой статье мы рассмотрим два подхода — LoRA и QLoRA — которые обещают значительно снизить затраты на обучение без потери качества модели. Мы разберем, как эти методы позволяют оптимизировать вычисления и память, а также как с их помощью можно эффективно адаптировать большие модели под разнообразные прикладные задачи.

⏱

Читать статью

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥5👍1

274 views10:21

Data Scientist | IT

Малые числа, большие возможности: Роль плавающей запятой в ИИ

#почитать

Числа с плавающей запятой лежат в основе подавляющего большинства компьютерных вычислений, особенно в сферах искусственного интеллекта (ИИ) и машинного обучения. Они позволяют моделям эффективно обрабатывать данные, обеспечивая баланс между точностью и скоростью вычислений. Развитие вычислительных технологий требует новых форматов, которые оптимизируют использование памяти и ускоряют вычислительные процессы без значительных потерь точности. Одним из перспективных форматов стал FP8 — 8-битный формат чисел с плавающей запятой, который может улучшить производительность вычислений и сократить энергопотребление.

⏱

Читать статью

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4🔥2

251 views11:23

Data Scientist | IT

Как мы учимся решать одну из самых сложных задач в метеорологии — прогнозирование количества осадков по часам

#почитать

Если бы меня попросили назвать слово, которое лучше всего подходит для прогноза осадков, я бы с уверенностью выбрал «сложность». В осадках она подстерегает нас всюду: от способов прогнозирования до оценки качества полученного прогноза. Потому в научных статьях про нейросетевой прогноз погоды (GraphCast, Pangu Weather, Aurora и т. д.) осадки или совсем не участвуют, или прогнозируются раз в 6 часов без упоминания о метриках. Либо же создаётся локальная модель под регион (например, MetNet для США).

⏱

Читать статью

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4🔥2

253 views11:42

Data Scientist | IT

Как алгоритм Recovering Difference Softmax (RDS) делает рекомендации и уведомления точнее и эффективнее

#почитать

Если коротко, улучшает работу алгоритмов машинного обучения, особенно когда нужно делать выбор из нескольких вариантов.

⏱

Читать статью

Please open Telegram to view this post

VIEW IN TELEGRAM

❤6👍1

267 views11:41

Data Scientist | IT

Системы ценностей больших языковых моделей

#почитать

Каждый раз, когда человечество создаёт очередной инструмент на машинном обучении, оно сперва любуется пользой от его работы, а потом пугается своего отражения внутри. С большими языковыми моделями история повторилась с ускорением. От восторга перед ответами ChatGPT до шока от таблиц, где жизнь человека глубоко неравноценна, прошло меньше двух лет.

Звучит странно, но языковые модели предвзяты. У них есть политические взгляды, любимые расы и даже люди, которыми они не прочь пожертвовать. Но обо всём по порядку.

⏱

Читать статью

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥4👍2

269 views11:27

Data Scientist | IT

▫️

Математика в основе ИИ | Матрицы, тензоры, deep learning

#посмотреть

Многие знают, что когда модели обучаются, где-то под капотом перемножаются матрицы и тензоры, и все это связано с дифференцированием.

⏱

Смотреть на YouTube ⏱️1 час 40 минут

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥5👍1

294 views05:23

Data Scientist | IT

🃏

Please open Telegram to view this post

VIEW IN TELEGRAM

😁5

286 views05:25