Машинное обучение RU
17.7K subscribers
1.57K photos
207 videos
11 files
2.04K links
Все о машинном обучении

админ - @workakkk

@data_analysis_ml - анализ даннных

@ai_machinelearning_big_data - Machine learning

@itchannels_telegram -лучшие ит-каналы

@pythonl - Python

@pythonlbooks- python 📚

@datascienceiot - 📚

РКН: clck.ru/3FmrUw
Download Telegram
Mental Models — тогда и сейчас 🧠

В 2007-м нейросети только учились подражать мозгу.
В 2025-м — учёные уже *буквально* создают его цифрового двойника.

1️⃣ E11 Bio сегодня баркодирует *каждую клетку мозга*, определяя тип нейрона и его форму по экспрессируемым белкам.
С помощью expansion microscopy — они “раздувают” мозговые ткани изнутри, чтобы легче проследить связи под микроскопом.

👉 Цель — создать точную 3D-карту мозга, где видно не только нейроны, но и химические градиенты, каннабиноиды, вирусоподобные частицы и внеклеточный матрикс, который становится более гибким под действием психоделиков (работа Gul Dolen).

Вопрос остаётся открытым: *сколько сложности нужно, чтобы реально смоделировать состояние мозга?*

2️⃣ 2007 год.
Тогда энтузиасты строили нейромодели на первых NVIDIA GPU. Один из них создал самодельный суперкомпьютер за $2000, чтобы моделировать рост дендритов и формирование связей в коре мозга.
Каждая точка — сотни потенциальных соединений, каждая ветвь — вычислительный узел.

3️⃣ На старых схемах — RC-цепочки, дифференциальные уравнения и дендрит как *коаксиальный кабель*:
ионы внутри, липидная оболочка снаружи, мембранная ёмкость, сопротивление, ионные каналы, создающие нелинейную динамику.
Сигнал передаётся не потоком электронов, а *каскадом открывающихся каналов*, как пальцы на длинной флейте.

🧩 Вывод: дендрит — это не просто «провод», а самостоятельный вычислительный элемент.
И даже спустя почти 20 лет, мозг всё ещё остаётся самым загадочным суперкомпьютером из всех.

#neuroscience #AI #mentalmodels #brainmapping #E11Bio #LLM
4👍2
🤖 WorldVLA - объединение VLA и World Model в единое автогенеративное ядро

Alibaba представила WorldVLA, новый шаг к созданию *авторегрессионной модели мира действий*
где одна архитектура одновременно предсказывает следующие кадры и действия агента.

🧠 Ключевая идея
WorldVLA объединяет Vision-Language-Action (VLA) и World Model в одном трансформере:
- Вход: *(image + language + action)*
- Выход: *(image + language + action)*
То есть модель не только «понимает» физику мира, но и «учится действовать» в нём.

⚙️ Как это работает
- Архитектура: единый Transformer, обучаемый одновременно на данных action-моделей и world-моделей.
- Лосс: комбинированная функция, объединяющая предсказание действий и состояния мира.
- Трюк с attention mask: маскируются предыдущие действия при генерации текущих —
этот приём значительно улучшает качество «action-chunk» генерации.

📊 Результаты
Тестировалось в симуляции (LIBERO benchmark):
WorldVLA превзошла отдельно обученные action-модели и world-модели.

💬 По сути, Alibaba делает следующий шаг к AGI-агентам с реальным пониманием физики,
где одно ядро может предсказывать, воспринимать и действовать — как единая система.

📄 Paper: https://arxiv.org/abs/2506.21539
💻 Code: https://github.com/alibaba-damo-academy/WorldVLA

#AI #WorldModel #VLA #DeepLearning #Alibaba #Transformers
4🔥2
Forwarded from Machinelearning
Media is too big
VIEW IN TELEGRAM
✔️ Lambda AI заключила многомиллиардную сделку с Microsoft.

Облачный стартап Lambda объявил о многомиллиардном соглашении с Microsoft на создание новой инфраструктуры для ИИ. Она будет оснащена десятками тысяч чипов Nvidia, в частности системами NVIDIA GB300 NVL72. Точная сумма сделки не раскрывается.

Lambda была основана в 2012 году и специализируется на облачных сервисах для обучения и развертывания ИИ-моделей. Новое соглашение позволит ей значительно нарастить мощности на фоне растущего спроса на ИИ. В планах не только аренда дата-центров, но и строительство собственной инфраструктуры.
lambda.ai

✔️ Alibaba представила превью Qwen3-Max-Thinking.

Китайский техногигант выпустил предварительную ризонинг-версию своей топовой модели Qwen3-Max, которая все еще находится на стадии обучения. Модель показала в тестах стопроцентный результат на сложных бенчмарках для оценки логического мышления (AIME 2025 и HMMT).

Под капотом - 1 трлн. параметров на архитектуре MoE, так же как и в родительской Max, Alibaba обещает, что обучение будет продолжено. Попробовать превью уже можно в Qwen Chat и через API Alibaba Cloud.
Qwen в сети X

✔️ Granite 4.0 Nano: семейство компактных моделей от IBM.

IBM опубликовала новое семейство открытых моделей Granite 4.0 Nano, которые созданы для работы в составе ИИ-агентов. Версия на 350 млн. параметров может работать на обычном CPU с 8–16 ГБ ОЗУ, а для варианта на 1,5 млрд. хватит GPU с 6-8 ГБ видеопамяти.

Семейство построено на гибридной архитектуре Mamba-2+Transformer, что позволило снизить потребление памяти на 70% и удвоить скорость инференса по сравнению с аналогами. По словам IBM, Granite 4.0 Nano показывают SOTA в следовании инструкциям и использовании инструментов. Все модели под Apache 2.0 и доступны на HuggingFace.
huggingface.co

✔️ Huxley-Gödel Machine: ИИ-агент, способный эволюционировать.

В Университете KAUST создали ИИ-агента Huxley-Gödel Machine (HGM), который может самосовершенствоваться, изменяя собственный код. Система не затрагивает ядро языковой модели, а переписывает окружающую ее инфраструктуру: управляющую логику, скрипты и инструменты.

Главное отличие от конкурентов в фокусе на долгосрочной продуктивности, а не на результатах в бенчах. Для этого был создан показатель Clade Metaproductivity (CMP), который мониторит совокупную эффективность всех потомков агента.

В тесте SWE-Bench Verified, HGM-агент на базе GPT-5-mini решил 61.4% проблем. Это лучше, чем существующие агенты с той же моделью. Код агента доступен на Github.
arxiv.org

✔️ Skyfall-GS: генератор 3D-моделей городов по спутниковым снимкам.

Skyfall-GS способна создавать детализированные и проходимые 3D-модели городов, используя только стандартные спутниковые изображения. В отличие от старых методов, которые могут воссоздать лишь крыши, Skyfall-GS генерирует недостающие элементы, что на выходе дает фотореалистичные городские пространства.

Пайплайн состоит из 3D Gaussian splatting (базовый 3D-каркас города) и диффузионных моделей, которые дорисовывают недостающие элементы (стены зданий и текстуры на уровне земли).

Skyfall-GS работает с 11 FPS на потребительском GPU и, по тестам, лучше аналогичных методик. Код проекта опубликован на GitHub.
skyfall-gs.jayinnn.dev

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
7👍2👏1
🔥 minimind — проект с открытым исходным кодом, целью которого является обучение небольших языковых моделей (LLM) с нуля за короткое время, используя ограниченные вычислительные ресурсы!

🌟 Минимальный размер модели составляет 26 МБ, что примерно в 7000 раз меньше GPT-3, и её можно обучить за 3 часа на стандартных графических процессорах.

💡 Проект предоставляет полный цикл разработки LLM, включая обработку данных, предварительное обучение (pretraining), обучение с учителем (SFT), оптимизацию предпочтений (DPO) и поддержку моделей с экспертами (MoE). Он совместим с популярными фреймворками, такими как Transformers и Accelerate, и поддерживает обучение на одном или нескольких графических процессорах. Кроме того, проект включает тестирование на наборе данных Ceval и реализацию базового API, совместимого с OpenAI, для интеграции с другими приложениями.

🔐 Лицензия: Apache-2.0

🖥 Github
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8👍4🤔1
На Vertex AI заметили модель gemini-3-pro-preview-11-2025 (пока недоступна).

Что уже известно: предварительная версия Gemini 3 выйдет в ноябре и будет поддерживать контекстное окно в 1 миллион токенов.

https://x.com/legit_api/status/1986066955191665043
👍51🔥1🤔1
⁉️Машинное обучение кажется чем-то сложным и недосягаемым? Всё проще, чем вы думаете!

Первый шаг — разобраться, как устроен ML-процесс и научиться работать в Jupyter Notebook — инструменте, с которого начинают все специалисты в Data Science.

На открытом уроке вы шаг за шагом поймёте, как строится путь от данных до модели. Научитесь запускать эксперименты в Jupyter Notebook и Google Colab, работать с виртуальными окружениями и не бояться “сломать” систему. Всё — в формате простых и наглядных примеров.

После урока вы сможете уверенно начать свой первый ML-проект и поймёте, какие инструменты нужны, чтобы перейти от теории к практике.

➡️ 13 ноября в 20:00 МСК. Открытый вебинар проходит в преддверии старта курса «Machine Learning. Basic». Регистрируйтесь и сделайте первый шаг в машинное обучение без страха и путаницы:т  https://otus.pw/rPzg/?erid=2W5zFGnFXsN

Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.
⚡️ Гибридные модели теперь - полноценные граждане в vLLM

По мере роста длины контекста классический attention всё хуже масштабируется: KV-кеш раздувается линейно, а prefill бьёт по задержкам квадратичным ростом.

Отсюда - всплеск интереса к гибридным архитектурам, где внимание смешивается с SSM, линейным attention и другими эффективными слоями.

В vLLM V1 такие модели стали first-class: единое управление состояниями (и KV-кеш, и SSM-стейт), оптимизации через CUDA Graphs, улучшенное префикс-кеширование. Это сильно повышает throughput на длинных последовательностях и моделях c MoE.

Итог: гибридные модели выходят в продовый стандарт - быстрее, дешевле по памяти и лучше подходят для LLM с большим контекстом.

Подробнее в статье: https://pytorch.org/blog/kernelfalcon-autonomous-gpu-kernel-generation-via-deep-agents/
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍1
Каптча выходит на новый уровень
😁27
💡 Простой трюк экономит до 50% стоимости работы LLM

Секрет - перестать использовать JSON и перейти на TOON (Token-Oriented Object Notation).

TOON сокращает количество токенов на 30–60% при тех же данных и остаётся полностью читаемым.

TOON идеально подходит для таблиц - массивов с одинаковыми полями в каждой строке. Это гибрид YAML (отступы) и CSV (структура), где синтаксис минимален, а лишние символы отсутствуют.

Пример.


JSON:
{
"users": [
{ "id": 1, "name": "Alice", "role": "admin" },
{ "id": 2, "name": "Bob", "role": "user" }
]
}



TOON:
users[2]{id,name,role}:
1,Alice,admin
2,Bob,user


Сразу видно: та же информация занимает гораздо меньше токенов.

Ключевые особенности:
- 30–60% меньше токенов
- Идеальный микс YAML и CSV
- Явная валидация: длина и поля задаются прямо в заголовке
- Минимальный синтаксис — никакой лишней пунктуации

Важно: для сильно вложенных и неоднородных структур JSON всё ещё может быть лучше.

TOON уже показывает стабильное снижение стоимости и рост точности извлечения данных у разных LLM.
Где бы это могло пригодиться в твоём процессе?

github.com/toon-format/toon
Please open Telegram to view this post
VIEW IN TELEGRAM
16👍7🔥2
🔬 Генерация белков с BoltzGen

BoltzGen — это инструмент для генерации и оптимизации дизайна белков, использующий передовые методы машинного обучения. Он позволяет создавать наборы ранжированных дизайнов на основе спецификаций в формате YAML, обеспечивая гибкость и высокую производительность.

🚀 Основные моменты:
- Генерация белков с использованием спецификаций YAML.
- Поддержка GPU для ускорения вычислений.
- Выходные данные включают промежуточные и финальные дизайны.
- Возможность анализа и фильтрации результатов.

📌 GitHub: https://github.com/HannesStark/boltzgen

#python
2👍1
Kimi K2 Thinking (32K) показал результат 4.2 балла на расширенном бенчмарке Extended NYT Connections.

Модель заметно ошибается в рассуждениях и нередко зацикливается при ответах. Тестирование проводилось через официальный API.

Подробнее: github.com/lechmazur/nyt-connections/
😱32👍1👎1🔥1
📊 Подробный практический гайд по статистике на Python

Этот практический гайд по статистике на Python - ваш надёжный проводник в мир анализа, визуализации и интерпретации данных.

От простых описательных показателей до регрессий и временных рядов — с примерами, кодом и реальными задачами. Всё, что нужно, чтобы уверенно применять статистику на практике.

🟠Гайд
Please open Telegram to view this post
VIEW IN TELEGRAM
👍31🔥1
Магистратура — это 2 года жизни и серьезные вложения. Как не ошибиться с выбором?

Приходите на день открытых дверей ИТ-магистратуры Центрального университета — разберем все важные вопросы, которые помогут принять правильное решение.

О чем будем говорить:
→ Как создаются программы магистратуры в ЦУ, что такое продуктовый подход в высшем образовании и как это делает выпускников реально востребованными на рынке
→ Как университет помогает студентам строить карьеру: от менторства до трудоустройства в топовые компании
→ Какие направления есть в ЦУ и как выбрать то, что приведет к вашим карьерным целям
→ Реальные истории студентов: как они поступали, учились и куда пошли работать

Спикеры — практики с опытом в Google, Яндексе, Т-Банке и Visa, которые сейчас отвечают за образовательный опыт студентов ЦУ.

Когда:
Очно 18 ноября с 19:30 до 21:00 (в Москве с экскурсией по кампусу ЦУ).

Регистрируйся по ссылке!

Реклама. АНО ВО "Центральный университет", ИНН 7743418023, erid: 2Ranym92vDp
👍1👎1
Быстрый совет для Cursor

Хочешь, чтобы Cursor писал точнее и в твоём стиле?

🧠 Просто создай файл `.cursorrules` в корне проекта и опиши в нём:
- правила кодстайла, которые ты используешь
- предпочтения по структуре, форматированию, именованию

Чем конкретнее, тем лучше работает автогенерация.

🔥 Это помогает избежать «галлюцинаций» и потери контекста при создании кода.
🔥92🥰2👍1🤔1
🚀 Релиз Qwen Code v0.2.1

Главные улучшения:
🌐 Бесплатный веб-поиск
Теперь поддерживаются разные поисковые провайдеры. Пользователи Qwen OAuth получают до 2000 бесплатных поисков в день.

🎯 Умное редактирование кода
Новая система нечёткого сопоставления лучше понимает правки, реже ошибается и экономит токены — меньше повторных попыток.

⚙️ Гибкая настройка модели
Можно управлять поведением ИИ через параметры temperature, top_p и max tokens.

💻 Лучшая работа в Zed IDE
Добавили поддержку задач, TODO и улучшили стабильность интеграции.

📝 Более простой вывод
Инструменты теперь отвечают обычным текстом, а не громоздким JSON — ИИ проще разбирать результаты.

🔍 Улучшенный поиск по проекту
Учёт .gitignore, умнее фильтры файлов, аккуратные названия инструментов.

Выше скорость
Новые этапы нормализации, корректная работа с Unicode, оптимизированные лимиты вывода.

🐛 Исправления
Правильные ограничения токенов для разных моделей, улучшена поддержка Windows и macOS, стабилизирована работа.

Qwen Code теперь работает быстрее, стабильнее и удобнее.

🔗 https://github.com/QwenLM/qwen-code
📝 https://github.com/QwenLM/qwen-code/releases
🔥43👍1
🔥 Подборка полезных ресурсов для программистов.

Здесь ты найдёшь всё это - коротко, по делу и без воды.
Пока другие ищут, где “подглядеть решение”, ты уже используешь самые свежие инструменты!

AI: t.me/ai_machinelearning_big_data
Python: t.me/pythonl
Linux: t.me/linuxacademiya
Devops: t.me/DevOPSitsec
Собеседования DS: t.me/machinelearning_interview
C++ t.me/cpluspluc
Docker: t.me/DevopsDocker
Хакинг: t.me/linuxkalii
Data Science: t.me/data_analysis_ml
Javascript: t.me/javascriptv
C#: t.me/csharp_1001_notes
Java: t.me/java_library
Базы данных: t.me/sqlhub
Python собеседования: t.me/python_job_interview
Мобильная разработка: t.me/mobdevelop
Golang: t.me/Golang_google
React: t.me/react_tg
Rust: t.me/rust_code
ИИ: t.me/vistehno
PHP: t.me/phpshka
Android: t.me/android_its
Frontend: t.me/front
Big Data: t.me/bigdatai
МАТЕМАТИКА: t.me/data_math
Kubernets: t.me/kubernetc
Разработка игр: https://t.me/gamedev
Haskell: t.me/haskell_tg
Физика: t.me/fizmat

💼 Папка с вакансиями: t.me/addlist/_zyy_jQ_QUsyM2Vi
Папка Go разработчика: t.me/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: t.me/addlist/eEPya-HF6mkxMGIy
Папка ML: https://t.me/addlist/2Ls-snqEeytkMDgy
Папка FRONTEND: https://t.me/addlist/mzMMG3RPZhY2M2Iy
Папка Linux:https://t.me/addlist/w4Doot-XBG4xNzYy

😆ИТ-Мемы: t.me/memes_prog
🇬🇧Английский: t.me/english_forprogrammers
🧠ИИ: t.me/vistehno

🎓954ГБ ОПЕНСОРС КУРСОВ: @courses
📕Ит-книги бесплатно: https://t.me/addlist/BkskQciUW_FhNjEy

Сохрани себе, чтобы не потерять!
🔥 Подборка полезных ресурсов для программистов.

Здесь ты найдёшь всё это - коротко, по делу и без воды.
Пока другие ищут, где “подглядеть решение”, ты уже используешь самые свежие инструменты!

AI: t.me/ai_machinelearning_big_data
Python: t.me/pythonl
Linux: t.me/linuxacademiya
Devops: t.me/DevOPSitsec
Собеседования DS: t.me/machinelearning_interview
C++ t.me/cpluspluc
Docker: t.me/DevopsDocker
Хакинг: t.me/linuxkalii
Data Science: t.me/data_analysis_ml
Javascript: t.me/javascriptv
C#: t.me/csharp_1001_notes
Java: t.me/java_library
Базы данных: t.me/sqlhub
Python собеседования: t.me/python_job_interview
Мобильная разработка: t.me/mobdevelop
Golang: t.me/Golang_google
React: t.me/react_tg
Rust: t.me/rust_code
ИИ: t.me/vistehno
PHP: t.me/phpshka
Android: t.me/android_its
Frontend: t.me/front
Big Data: t.me/bigdatai
МАТЕМАТИКА: t.me/data_math
Kubernets: t.me/kubernetc
Разработка игр: https://t.me/gamedev
Haskell: t.me/haskell_tg
Физика: t.me/fizmat

💼 Папка с вакансиями: t.me/addlist/_zyy_jQ_QUsyM2Vi
Папка Go разработчика: t.me/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: t.me/addlist/eEPya-HF6mkxMGIy
Папка ML: https://t.me/addlist/2Ls-snqEeytkMDgy
Папка FRONTEND: https://t.me/addlist/mzMMG3RPZhY2M2Iy
Папка Linux:https://t.me/addlist/w4Doot-XBG4xNzYy

😆ИТ-Мемы: t.me/memes_prog
🇬🇧Английский: t.me/english_forprogrammers
🧠ИИ: t.me/vistehno

🎓954ГБ ОПЕНСОРС КУРСОВ: @courses
📕Ит-книги бесплатно: https://t.me/addlist/BkskQciUW_FhNjEy

Сохрани себе, чтобы не потерять!
🔥31👎1
⚡️ Новый проект: DeepSeek OCR — React + FastAPI

Открыли репозиторий с современным веб-приложением OCR: фронтэнд на React, бэкенд на FastAPI.

Что умеет:
- Plain OCR — извлечение текста из изображения
- Describe — генерация описания изображения
- Find — поиск заданного термина с отображением рамки
- Freeform — задаёшь кастомный prompt и получаешь результат

Почему круто:
- Drag-and-drop загрузка изображений до 100 МБ, визуализация bounding boxes
- Конфигурация через .env (порт, размер файла, модель)
- Стек: React 18 + Vite + TailwindCSS + FramerMotion + FastAPI + PyTorch + Transformers
- Всё контейнеризовано через Docker + Docker Compose → можно быстро запустить

Как начать:
1. Клонируй репозиторий
2. Cкопируй .env.example в .env и настрой параметры
3. Запусти: docker compose up --build
4. Открой: фронтэнд (по умолчанию http://localhost:3000) & API (http://localhost:8000)

https://github.com/rdumasia303/deepseek_ocr_app/
🔥8👍31
📚 Читаем EPUB с LLM 🚀
Легкий самодостаточный EPUB-ридер, позволяющий читать книги по главам и легко копировать текст для работы с LLM. Проект создан для вдохновения и не требует поддержки. Просто загружайте EPUB и читайте вместе с ИИ.

🚀 Основные моменты:
- Чтение EPUB-файлов по главам
- Удобный интерфейс для работы с LLM
- Легкая настройка и использование
- Проект для вдохновения, без поддержки

📌 GitHub: https://github.com/karpathy/reader3

#python
3👍2🤔2
🧠 ChatTutor: Интерактивный ИИ-учитель

Это ИИ-репетитор, использующий электронную доску для обучения. Он предоставляет пользователям возможность взаимодействовать с различными учебными инструментами, что делает процесс обучения более наглядным и эффективным, особенно в STEM-дисциплинах.

🚀Основные моменты:
- Интерактивные математические и логические канвасы
- Поддержка создания ментальных карт
- Многоагентная архитектура для улучшенного взаимодействия
- Возможность решения задач с помощью ИИ

📌 GitHub: https://github.com/sheepbox8646/ChatTutor

#javascript
👍3
🚀 **LongCat-Flash-Omni - новая открытыая560B omni-modal модель от Meituan

Новая SOTA-модель LongCat-Flash-Omni (560B параметров) - универсальная омнимодальная система, которая работает с видео, аудио, текстом и действиями в реальном времени.

Что в ней важно:

- Mixture-of-Experts архитектура - даёт высокую скорость и низкие задержки, несмотря на масштаб 560B.
- Полноценное мультимодальное понимание: видео + аудио + текст, обработка движений и сцен в потоке.
- Modality-decoupled parallelism — модель тренировали так, чтобы эффективно комбинировать разные типы данных, не тормозя обучение.
- Заявлен SOTA-уровень качества среди открытых омнимодальных моделей.

Технический отчёт: https://huggingface.co/papers/2511.00279
Модель: https://huggingface.co/meituan-longcat/LongCat-Flash-Omni
Проект: https://longcat.ai
5