Data Science
41.9K subscribers
1.71K photos
3 videos
47 files
2.1K links
DS
По всем вопросам- @haarrp

@ai_machinelearning_big_data - machine learning

@pythonl - Python

@itchannels_telegram - 🔥 best it channels

@ArtificialIntelligencedl - AI

@pythonlbooks-📚

@programming_books_it -📚

Реестр РКН: https://clck.ru/3Fk3zS
Download Telegram
The new Claude for Legal repo gives firms and in-house teams prebuilt agent workflows for contract review, litigation prep, and regulatory monitoring—completely free.

🔗 https://github.com/anthropics/claude-for-legal

@datascienceiot
How AI Impacts Skill Formation

📗 Read

@datascienceiot
Получите офер в Яндекс за 2 дня

Участвуйте в онлайн-мероприятиях быстрого найма. Такой формат позволяет пройти всего две секции, вместо трёх в обычном найме, и финалы за выходные и сразу получить офер.

Как всё устроено:

🔴 Зарегистрируйтесь на мероприятие — с вами свяжется рекрутер и договорится об удобном времени для интервью.

🔴 В субботу пройдите две технические секции.

🔴 В воскресенье познакомьтесь с командами и получите офер.

Какие мероприятия проводим:

⚡️30–31 мая Weekend Offer ML

Для ML- и DL-инженеров с опытом в доменных областях NLP, CV, RecSys и Classic ML.

Подробности и регистрация — на сайте: https://yandex.ru/project/events/wo-ml-0526

⚡️6–7 июня Weekend Offer Analytics

Для продуктовых, дата-аналитиков и датасаентистов с опытом на Python от 3 лет.

Подробности и регистрация — на сайте: https://yandex.ru/project/events/wo-analytics-0626
On Training in Imagination

📗 Read

@datascienceiot
Best practices for computer and browser use with Claude

📗 Read

@datascienceiot
🆓 Диасофт выпустил бесплатный дистрибутив "S3 Архипелаг" (российское S3-совместимое хранилище для работы с петабайтами данных в архитектурах Data Lakehouse, аналитических системах и консолидации разрозненных файловых хранилищ)!

Дистрибутив разворачивается на серверах заказчика без обязательного подключения к облаку.

🔥Бесплатная версия ориентирована на тестовые, предпродуктовые и малые продуктивные среды. Она позволяет в полном объеме использовать функционал хранилища с ограничением до 500 ГБ. Бесплатная версия хранилища также упрощает администрирование за счет реализации поддержки единого входа (SSO). Это повышает безопасность и избавляет от необходимости отдельной аутентификации.

В итоге получается простой пример:
"коробочная" модель поставки + бесплатный доступ + использование SSO + полноценная вендорская поддержка = мощное преимущество предложения 😎

Скачать дистрибутив можно по ссылке!
#реклама
О рекламодателе
Apple has published a paper with a devastating title: “The Illusion of Thinking”

📗 Read

@datascienceiot
🐍 Python Roadmap 2026: наконец-то полноценная актуальная карта изучения Python, а не список ссылок «разберись сам»

На GitHub выложили большой русскоязычный роадмап по Python на 2026 год - от первых скриптов до уровня Middle+/Senior.

Маршрут собран под современный Python:

- Python 3.13+
- free-threaded mode без GIL
- JIT
- uv вместо боли с pip/venv/poetry
- ruff, pyright, pytest, hypothesis
- async-first подход
- типизация
- CPython внутри
- web, базы, ML/AI, DevOps и архитектура

В роадмапе есть нормальная последовательность: сначала окружение и база, потом идиомы, ООП, типы, стандартная библиотека, асинхронность, тестирование, внутренности CPython, web, базы данных, AI-направление, продакшн и архитектура.

Отдельный плюс - практический формат. На каждом этапе есть задачи, чеклисты, примеры кода и бесплатные ресурсы. То есть это не мотивационная простыня, а маршрут, по которому реально можно идти несколько месяцев и видеть прогресс.

Для новичков - понятный путь без хаоса.
Для джунов - способ закрыть дыры.
Для тех, кто уже пишет на Python - хороший чеклист, чтобы понять, где ты всё ещё плаваешь.

Python в 2026 году - это tooling, типы, async, инфраструктура, AI и продакшн-дисциплина. И этот роадмап как раз про такой Python.

https://github.com/justxor/pythonroamap2026
"Language Models Need Sleep"

📚 Read

@datascienceiot
Хакатон по моделированию рыночных решений и максимизации PnL

Reinforce.fi (ex-Overnight.fi) — проект, который использует reinforcement learning и автоматическое управление капиталом для повышения доходности на свободный USDT — запускает хакатон.

Задача — построить модель, которая на каждом шаге выбирает оптимальное действие (A1–A10) и максимизирует суммарный PnL.

Данные:
— последовательности состояний рынка (анонимизированные признаки)
— 1000 шагов в каждой последовательности
— первые шаги — контекст, далее — предсказания

Метрика:
— итоговый скор = суммарный PnL по всем выбранным действиям

Призы:
1 место — $2,500
2 место — $1,500
3 место — $1,000

Старт: конец июня

Продолжительность: ~1.5–2 месяца

Информация: тут

Регистрация

Чат хакатона: https://t.me/+R6lMJ10VXP5hOTI0
A 178 page survey study for refreshing math and generative AI foundations from University of Huddersfield.

The Little Book of Generative AI Foundations.

📗 Read

@datascienceiot
От мечты о карьере сварщика до стажировки в KAUST

История выпускника Школы анализа данных Степана Платинского — яркий пример того, куда может вывести фундаментальное образование в ML.
До 9 класса он хотел быть сварщиком. Но потом поступил в Физтех-лицей, оттуда в МФТИ, а затем в Школу анализа данных.
Сегодня он улучшает ML-модели для международного поиска Яндекса, а в прошлом году стажировался в университете KAUST в Саудовской Аравии как приглашенный исследователь.

Его цель — построить статистическую модель, которая сможет предсказывать экстремальные события вроде наводнений или обвала рынка. Этому как раз посвящена его научная работа.
Степан считает, что главное для карьеры в ML — любознательность и искреннее желание разобраться в теме.
О том, как попасть на международную стажировку и заниматься наукой параллельно с карьерой в бигтехе, читайте в интервью со Степаном.
AI-Driven Multi-Region Provisioning for Cloud Services Using Spot Fleets

📗 Read

@datascienceiot