Data Scientist | ML & AI
2.79K subscribers
362 photos
155 videos
14 files
417 links
Один из ведущих каналов по Data Science, Machine Learning и Big Data

Сотрудничество: @bape_ads
Прайс: @bape_media
Download Telegram
📱 Алгоритмы и структуры данных на Python

Этот курс даст фундамент по алгоритмам — от простейших операций до динамики, строковых алгоритмов и сортировок.

Материал подаётся последовательно, чтобы вы выстроили настоящее алгоритмическое мышление и научились решать задачи любой сложности.

Что вы изучите:
🏮 Базовые конструкции Python, циклы, ветвления и работу с числами;

🏮 Однопроходные алгоритмы: подсчёты, суммы, максимум, Евклид;

🏮 Декомпозицию, функции, стек вызовов и структурное программирование;

🏮 Массивы, списки, строки и эффективные способы обработки данных;

🏮 Классические сортировки и анализ их сложности;

🏮 Быструю сортировку Хоара и сортировку слиянием;

🏮 Рекурсию: факториал, степени, Евклид, Ханойские башни;

🏮 Динамическое программирование: рюкзак, Фибоначчи, Левенштейн, НОП, НВП;

🏮 Строковые алгоритмы: префикс-функцию, Z-функцию, КМП;

🏮 Стек, ОПН, проверку скобок и базовые структуры данных;

🏮 Пирамиду (кучу) и пирамидальную сортировку.


После прохождения вы сформируете прочную базу алгоритмов, нужную для олимпиад, собеседований и дальнейшего погружения в программирование.

Ссылка на курс — здесь.

tags: #полезное

Data Scientist | Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥1
🤖 OpenAI выпустила GPT-5.2 — обновление, ориентированное на практическое использование и сложные рабочие сценарии

По заявлению компании, модель почти вдвое эффективнее версии 5.1 при решении прикладных задач.

Ключевые изменения:
• Три режима работы: Instant (скорость), Thinking (многошаговые и сложные задачи), Pro (максимальная точность).

• Существенно улучшена отладка и анализ кода.

• Более стабильная работа в комплексных цепочках рассуждений.

• Заметный прогресс в работе с таблицами и структурированными данными.

• На 38% снижено количество ошибок в режиме reasoning по сравнению с 5.1.

• Улучшены результаты в математических и научных задачах.

• Расширены возможности работы с изображениями.


Модель уже доступна в ChatGPT и через API.

tags: #новости

Data Scientist | Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥1
Блог владельца «Data Scientist»

Жизнь в Telegram и за его пределами, бизнес на каналах и никакого программирования:

https://t.me/+6LFfq_FDocc4MTg6
🔖 Нашли классную платформу от IBM — внутри бесплатные курсы и практические проекты по ИИ, Data Science и облачным технологиям

Более 100 обучающих материалов: машинное обучение, Python, Data Science, Big Data, облака и смежные направления — с упором на практику и реальные кейсы.

Ссылка на ресурс — здесь.

tags: #полезное

Data Scientist | Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥1
Please open Telegram to view this post
VIEW IN TELEGRAM
😁7🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
🔖 Как связаны диаграммы Вороного и параболоиды

Диаграмму Вороного можно получить через геометрическую интерпретацию в 3D. Для каждой точки xᵢ строится поверхность yᵢ(x) = D(xᵢ, x), где D — функция расстояния.

Диаграмма Вороного возникает как вертикальная проекция нижней оболочки всех этих поверхностей.

Если выбрать расстояние D(x, x′) = ‖x − x′‖², то поверхности yᵢ становятся параболоидами. В этом случае их нижняя оболочка образует плоские границы, а ячейки диаграммы Вороного получаются с линейными рёбрами.

Именно поэтому при квадратичном расстоянии диаграммы Вороного выглядят «прямыми», несмотря на параболическую природу построения.

tags: #полезное

Data Scientist | Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
2🤯1😱1
Media is too big
VIEW IN TELEGRAM
🤖 OpenAI представили GPT Images — свой ответ Nano Banana

Новая модель делает ставку на фотореализм, аккуратное следование инструкциям и сильное редактирование изображений, включая многошаговые правки с сохранением лица и ключевых деталей. Плюс генерация стала примерно в 4 раза быстрее.

GPT Images уже доступна в ChatGPT для всех пользователей, в том числе бесплатных, но лимиты пока не раскрывают. В API модель выкатили под именем GPT Image 1.5.

Также выложили гайд по промптингу для изображений, полезно, если хочется выжать максимум — забираем тут.

С самой моделью поиграться можно — здесь.

tags: #новости

Data Scientist | Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥1
👍 Google представили Gemini 3 Flash — модель с сбалансированным соотношением скорости, стоимости и качества

Модель заметно дешевле Gemini 3 Pro, при этом демонстрирует высокие результаты в ключевых бенчмарках.

Ключевые моменты:
▶️ Уверенно справляется с задачами уровня PhD на GPQA Diamond и Humanity’s Last Exam;

▶️ На MMMU Pro практически не уступает Gemini 3 Pro;

▶️ На SWE-bench Verified превосходит всю линейку Gemini 2.5.


В результате Gemini 3 Flash выглядит как наиболее рациональный выбор для практического использования среди текущих моделей Google.

Протестировать бесплатно — можно здесь.

tags: #новости

Data Scientist | Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥1
🔖 Курс по n8n для начинающих

В этом курсе вы разберёте n8n как платформу для построения сложных автоматизаций, интеграций API и AI-агентов без написания кода.

В процессе обучения вы постепенно перейдёте от базовых workflow к продакшн-системам с AI-агентами, памятью и облачным деплоем.

Что вы изучите:
🏮 Основы n8n: интерфейс, узлы, триггеры, входные и выходные данные, выражения и типы данных;

🏮 Построение workflow: последовательности, ветвления, циклы, обработка ошибок и повторные попытки;

🏮 Интеграцию API через HTTP-узлы: REST-запросы, аутентификацию, OAuth и работу с внешними сервисами;

🏮 Создание AI-агентов: LLM, системные и пользовательские промпты, инструменты, контекстная и долговременная память;

🏮 Работу с OpenAI, Anthropic, Perplexity, Code Cloud, Vertex AI и другими LLM-провайдерами;

🏮 Использование Gmail, Google Sheets, Google Drive, Slack и Telegram в автоматизациях;

🏮 Реализацию AI-workflow для писем, новостей, поддержки, HR, маркетинга и аналитики;

🏮 Векторные базы данных (Pinecone) для памяти и поиска документов;

🏮 Генерацию текста, изображений и видео через внешние AI-API;

🏮 Многоуровневые workflow и подпроцессы (multi-workflow архитектура);

🏮 Самостоятельный хостинг n8n через Docker и Docker Compose;

🏮 Развёртывание в AWS EC2 и сравнение облачного и self-hosted вариантов.


После курса у вас будет чёткое понимание, как проектировать и запускать реальные системы автоматизации в n8n.

Ссылка на курс — здесь.

tags: #полезное

Data Scientist | Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
💻 Лучшие бесплатные книги по PostgreSQL на русском языке

Если хотите разобраться в PostgreSQL — вот подборка книг, которые реально стоит прочитать.

Здесь разобрано множество тем: от основ SQL до архитектуры и тонкостей внутренней работы СУБД.

🏮 Postgres: первое знакомство — брошюра для новичков с кратким введением в PostgreSQL, установку и начальную настройку.

🏮 PostgreSQL. Основы языка SQL — учебник по SQL с акцентом на особенности реализации в PostgreSQL.

🏮 PostgreSQL. Профессиональный SQL — продолжение предыдущей книги, охватывающее оконные функции, CTE, подзапросы LATERAL, пользовательские функции и процедуры.

🏮 PostgreSQL 17 изнутри — глубокий разбор внутреннего устройства СУБД: MVCC, WAL, блокировки, планировщик запросов, индексы и многое другое.

🏮 Мониторинг PostgreSQL — практическое руководство по инструментам мониторинга, интерпретации метрик и пониманию внутренних процессов СУБД.

🏮 Путеводитель по базам данных — обзор архитектурных принципов современных СУБД, алгоритмов и структур данных, используемых в них.

🏮 Основы технологий баз данных — учебное пособие, охватывающее теорию баз данных, методы и алгоритмы, применяемые при реализации СУБД, и особенности PostgreSQL.


Книги доступны для скачивания в формате PDF — здесь.

tags: #полезное #postgresql #sql

Data Scientist | Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
💻 Годный опенсорс проект, который превращает любой GitHub-репозиторий в интерактивную карту

Достаточно заменить в URL слово «github» на «gitdiagram», и сервис мгновенно визуализирует структуру репозитория: модули, директории, связи и логику организации кода.

Это удобный способ быстро понять архитектуру проекта и ускорить разбор незнакомой кодовой базы.

Исходный код сервиса — здесь.

tags: #полезное

Data Scientist | Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
NZT существует.

В фильме «Области тьмы»
герой выпивает NZT — и за день
становится трейдером,
мастером кунг-фу и полиглотом.

Дело не в таблетке.
А в состоянии.

Химия не нужна.
Когда ум чист,
внимание собрано,
и сомнений нет —
ты уже на NZT.

Ты замечаешь всё.
Действуешь без разрывов.
И мир отвечает тебе.

Как включить режим NZT?

Подписывайся на Мэверика.

• входи в состояние
всё «получается само».

• мгновенно принимай
лучшие решения.

• считывай сложные связи
там, где все видят хаос.

• управляй фокусом
и вероятностями событий.

Твоя таблетка NZT.
👇
Мэверик.
Ясность. Точность.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁52
📰 Как LLM-вендоры обращаются с вашими данными: подробный разбор безопасности и конфиденциальности

В статье подробно разобрано, какие данные собирают популярные LLM-сервисы, как долго они их хранят и кто к ним может получить доступ.

На реальных документах, судебных решениях и инцидентах показано, чем отличается работа с ИИ для обычных пользователей и для компаний.

Что вы узнаете в статье:
▶️ Как западные, российские и китайские LLM-вендоры хранят и используют пользовательские данные

▶️ Чем отличаются политики для частных и корпоративных клиентов

▶️ Какие инциденты с утечками данных произошли в экосистеме ИИ в 2025 году

▶️ Почему судебное решение по OpenAI стало поворотной точкой для всей индустрии

▶️ Насколько безопасны агрегаторы и инструменты для кодинга с ИИ

▶️ Как выбрать LLM-сервис с учетом юрисдикции и требований к конфиденциальности


Материал поможет понять, какие риски вы принимаете при работе с LLM и как осознанно выбирать ИИ-сервисы в новых условиях.

Читать статью

tags: #статья

Data Scientist | Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥1
📰 «Тупой ИИ» с нами надолго: почему в новых моделях больше галлюцинаций

Модели последнего поколения получили режимы рассуждений и выросли в вычислительных возможностях, но при этом стали чаще выдавать неверные факты. Тесты показывают, что увеличение параметров и данных не устраняет галлюцинации и даже усиливает их.

В статье объясняется, какие ограничения трансформеров приводят к росту ошибок, почему масштабирование не улучшает надёжность и откуда берутся случаи осознанного искажения ответов.

Что вы узнаете из статьи:
▶️ Почему o3, o4-mini и DeepSeek-R1 ошибаются в 2–3 раза чаще предыдущих моделей;

▶️ Как работает стратегическое искажение ответов и почему модели меняют поведение под наблюдением;

▶️ Почему reasoning-модели проваливаются на задачах вне обучающей выборки;

▶️ Как возникает коллапс моделей при обучении на собственных данных;

▶️ Какие фундаментальные ограничения мешают LLM стать полноценным ИИ.


Интересный обзор, который поможет понять реальные границы современных моделей и причины роста галлюцинаций.

Читать статью

tags: #статья

Data Scientist | Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥1
📰 CPython простыми словами: всё, что нужно знать начинающему

В статье понятно и подробно объясняется, как устроен CPython — интерпретатор, который стоит за привычным Python.

Автор показывает, как он выполняет код, управляет памятью, почему существует GIL и как можно ускорять Python через C-расширения.

Читать статью

tags: #статья

Data Scientist | Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥1
😍 Hugging Face подготовил жирный подарок на новый год — 12 бесплатных курсов по ИИ

В одном месте собрали полноценную обучающую базу по самым актуальным направлениям ИИ:

▶️ AI Agents — как проектировать и запускать автономных агентов, которые сами принимают решения;

▶️ LLM Course — как устроены большие языковые модели и библиотеки вроде Transformers;

▶️ Smol-course — быстрый и практичный вход в fine-tuning моделей под свои задачи;

▶️ MCP Course — как подключать ИИ к внешним данным и инструментам, курс сделан вместе с Anthropic;

▶️ Deep RL — обучение с подкреплением для сложных агентов и роботов;

▶️ ML для игр — применение машинного обучения в геймдеве;

▶️ Robotics — путь от классических контроллеров к роботам на нейросетях;

▶️ ML for 3D — работа с 3D-данными, нейросети для форм, сцен и пространств;

▶️ Computer Vision — обучение моделей работе с изображениями и видео;

▶️ Audio Course — обработка речи и звука через Transformers;

▶️ Diffusion Course — генерация изображений и работа с Diffusers;

▶️ Open-Source AI Cookbook — готовые рецепты и код под реальные ИИ-задачи.


Сохраняем и обучаемся!

tags: #полезное

Data Scientist | Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥1
👍 Нашли библиотеку промтов, которая реально сэкономит время при работе с ИИ

Внутри аккуратно собраны готовые запросы для кода, текстов, изображений и аналитики, которые уже проверены на практике и дают стабильный результат без долгих экспериментов с формулировками.

Забираем и адаптируем под себя — тут.

tags: #полезное

Data Scientist | Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥1
Несмотря на огромный дефицит,
ребятам из HOSTKEY удалось достать несколько карт
NVIDIA GeForce RTX 5090 и протестировать
одну из них.

Получилась подробная статья на 19 страниц.

💎Читайте обзор в Телеграм-канале HOSTKEY!И обязательно подпишитесь, ведь каждый месяц здесь разыгрывают Telegram Premium среди подписчиков.

Реклама. ООО "АЙТИБ". ИНН 9719026854. erid: 2W5zFFwmVh2
👍 Подборка инструментов для управления памятью и контекстом в LLM-системах

В репозитории собрана структурированная подборка инструментов для хранения, извлечения и организации контекста в LLM-приложениях.

Что внутри:
▶️ Подходы к организации памяти: векторные хранилища, графы знаний и гибридные модели

▶️ Инструменты для долговременной памяти LLM-агентов

▶️ Решения для agent-based и multi-agent архитектур

▶️ Сравнительная таблица с лицензиями, типом хранилища и сценариями использования

▶️ Ссылки на репозитории и документацию для быстрого выбора стека


Репозиторий поможет выбрать и спроектировать подходящий memory-слой для LLM-систем — забираем здесь.

tags: #полезное

Data Scientist | Чат
Please open Telegram to view this post
VIEW IN TELEGRAM