Машинное обучение RU
17.7K subscribers
1.58K photos
210 videos
11 files
2.04K links
Все о машинном обучении

админ - @workakkk

@data_analysis_ml - анализ даннных

@ai_machinelearning_big_data - Machine learning

@itchannels_telegram -лучшие ит-каналы

@pythonl - Python

@pythonlbooks- python 📚

@datascienceiot - 📚

РКН: clck.ru/3FmrUw
Download Telegram
✔️ ByteDance представила Depth Anything 3.

Depth Anything 3 может предсказывает пространственно-согласованную геометрию по одному или нескольким изображениям, даже без известных параметров камеры. Ключевая особенность релиза - в радикальном упрощении архитектуры.

Под капотом единый трансформер и унифицированное представление depth-ray. Одна и та же модель теперь решает целый спектр задач: от монокулярной оценки глубины и определения поз камеры до прямой генерации 3D гауссианов для синтеза новых ракурсов.

В тестах DA3 превзошла предыдущие версии. Команда выпустила веса моделей, инструментарий CLI и WebUI на Gradio.
depth-anything-3.github.io
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍1
🧠 Anthropic и Claude - одни из главных бенефициаров 2025 года.

Claude продемонстрировал самую долгую автономную работу ИИ-агента на сегодня4 часа 49 минут без участия человека.

Это соответствует 50% time horizon и является текущим рекордом в агентных системах.

Но картина не такая однозначная.

У флагманской модели Claude Opus 4.5:
- 80% time horizon составляет всего 27 минут
- это примерно уровень прошлых моделей
- и меньше, чем у GPT-5.1-Codex-Max (32 минуты)

Что это значит по сути:

- Anthropic действительно впереди по длительной устойчивой автономности
- но при более жёстких критериях надёжности лидерство пока не закреплено
- конкуренты остаются очень близко

Гонка не закончена и победитель не определён.
Развитие ИИ-агентов идёт по экспоненте, а не по прямой.

Каждый новый релиз сдвигает ключевую границу:
насколько долго ИИ может работать самостоятельно,
не ломаясь и не теряя качества.

И именно время автономной устойчивой работы, а не классические бенчмарки,
становится главным показателем прогресса в агентном ИИ.
5👍2
Боль 😂
Please open Telegram to view this post
VIEW IN TELEGRAM
😁35🔥2👍1😢1
✔️ Z.ai выпустила GLM-4.7.

GLM-4.7 - обновление линейки моделей, оптимизированное для разработчиков. При размере в 358 млрд. параметров модель показала существенный прирост производительности в программировании, работе с терминалом и созданию чистого UI-кода (функция Vibe Coding). На SWE-bench Verified модель улучшила результат до 73.8%, а в тестах на сложное математическое рассуждение прирост составил более 12%.

Архитектурное новшество релиза — развитие механизмов мышления. Функция Preserved Thinking позволяет модели сохранять и переиспользовать CoT между репликами, а механизм Interleaved Thinking дает время на анализ перед каждым вызовом внешних инструментов.

GLM-4.7 уже доступна через API и на OpenRouter, а веса модели выложены на HuggingFace и ModelScope.
z.ai
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍1
Российские генеративные модели Kandinsky 5.0 Video Lite и Pro в международной text-to-video арене

🔘Pro версия является ТОП-1 опенсорсом в мире

🔘Lite версия (2B параметров) лучше первой версии Sora

🔘На данный момент Сбер уступает только топовым мировым бигтех компаниям: Google (Veo 3.1, Veo 3), OpenAI (Sora 2), Alibaba (Wan 2.5), KlingAI (Kling 2.5, 2.6); в паритете с Luma AI (Ray 3), MiniMax (Hailuo 2.3) — отрыв по ELO максимум 3 балла, при 95% доверительном интервале оценивания +-21 балла

🔘Для российских генеративных моделей выход на международную арену — уникальное событие

🚀 Полезные ссылки:
🔘Посмотреть весь лидерборд: lmarena
🔘Почитать подробнее про Kandinsky 5.0: пост, техрепорт
🔘Open Source Kandinsky 5.0: github и hf
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥62👍1👎1
This media is not supported in your browser
VIEW IN TELEGRAM
💡 Dario Amodei об AGI и будущем работы.

CEO Anthropic говорит прямо: ИИ может впервые реально убрать необходимость массового человеческого труда.

Ключевое:

• AGI ведёт к технологической безработице
ИИ способен выполнять большую часть экономически полезной работы быстрее и дешевле человека.

• Работа перестаёт быть условием выживания
В будущем труд - это выбор.
Смысл смещается к семье, творчеству и развитию.

• Такой переход нельзя навязать
Общество будет перестраиваться постепенно, а не по указу.

• Изменения идут с разной скоростью
Компании - быстро, отрасли - медленнее, ценность человека вне работы - дольше всего.

Вопрос не в том, придёт ли это.
Вопрос - что сломается раньше: рынок труда или наше представление о ценности человека.
5👎3🤔3😁2
🧠 MiroThinker: Инновационный исследовательский агент

MiroThinker — это открытый исследовательский агент, который улучшает возможности рассуждений и поиска информации. Он поддерживает инструментальную помощь и демонстрирует выдающиеся результаты на различных бенчмарках, включая HLE и BrowserComp.

🚀 Основные моменты:
- 💡 Поддержка интерактивного масштабирования для глубоких взаимодействий.
- 📚 Доступ к уникальному набору данных MiroVerse с 147k образцами.
- 🔧 Инфраструктура для стабильного обучения моделей.
- 🤖 Совместимость с множеством бенчмарков и инструментов.

📌 GitHub: https://github.com/MiroMindAI/MiroThinker

#python
🤔2
✔️ Qwen обновила Qwen-Image-Edit.

Новая версия Qwen-Image-Edit-2511 пришла на смену сборке 2509 и предлагает ряд качественных изменений. Теперь модель лучше сохраняет консистентность персонажей и общую структуру кадра при внесении локальных правок.

Помимо стабильности, усилили способности к геометрическому рассуждению и генерации промышленного дизайна. Попробовать новинку можно через веб-интерфейс Qwen Chat, а веса для локального развертывания уже на HuggingFace и ModelScope.
TongyiLab в сети Х
Please open Telegram to view this post
VIEW IN TELEGRAM
🚀 Учёные Гарварда заявили о реальном квантовом прорыве для будущего суперкомпьютеров.

Новая экспериментальная платформа решает одну из самых жёстких проблем масштабирования квантовых машин - поддержание управления и когерентности в больших системах связанных кубитов. Это ещё не полное решение, но шаг к аппаратуре, где огромные устойчивые квантовые архитектуры становятся реальнее.

🔹 Почему это важно?
Квантовые компьютеры годами застревали на уровне небольших шумных устройств. Прорыв в масштабировании - это движение к машинам, которые смогут моделировать химию, материалы, климат и криптографию, недоступные обычным суперкомпьютерам.

Квант наконец начинает выглядеть как будущее, а не демонстрационный стенд.

Но путь впереди тяжёлый: одно открытие - легко, а вот построить миллионы одинаково стабильных кубитов — почти невыполнимая задача. Полноценный квантовый суперкомпьютер всё ещё далеко, но теперь он стал немного ближе.
5🤔2🔥1
✔️«АльфаСтрахование» создаст ИИ-решения на технологиях Yandex B2B Tech для корпоративной инфраструктуры.

В 2026 году компания реализует более десяти проектов, охватывающих инженерные, аналитические и офисные сценарии.

Технологическая основа:
— SourceCraft Code Assistant — LLM-система для поддержки разработки, ускоряющая работу свыше 500 инженеров.
— Yandex SpeechSense — платформа речевой аналитики, обрабатывающая более 20 тыс. звонков в сутки и формирующая обучающие датасеты для NLP-моделей.
— Yandex AI Studio — среда для создания ИИ-агентов, автоматизирующих обработку документов, протоколирование встреч и HR-воркфлоу.

В фокусе партнёрства — построение распределённой экосистемы Generative AI, где ИИ-сервисы становятся ядром корпоративных процессов.
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍1🔥1
⚡️ NVIDIA: как объединять распределённые дата-центры в одну AI-фабрику

NVIDIA предлагает смотреть на дата-центры как на единый вычислительный организм, даже если они находятся на расстоянии десятков и сотен километров.

Ключевая идея — Scale-Across Networking.

Что это значит по-простому:

– Раньше масштабировали внутри сервера (scale-up)
– Потом внутри дата-центра (scale-out)
– Теперь — между дата-центрами, как будто это один большой кластер

Для этого NVIDIA представила Spectrum-XGS Ethernet — сетевую архитектуру, которая позволяет нескольким дата-центрам работать как одна AI-фабрика.

Что внутри:

– Те же Spectrum-X коммутаторы и ConnectX-8 SuperNIC
– Учет расстояния и задержек на уровне сети
– Адаптивный роутинг и контроль перегрузок
– Предсказуемая латентность для обучения и инференса

Почему это важно:

– Можно обучать и запускать большие модели на географически распределённых ресурсах
– Не нужно строить один гигантский дата-центр
– GPU в разных локациях работают как единый пул
– До 1.9× ускорение NCCL all-reduce по сравнению с обычным Ethernet

По сути, NVIDIA двигает индустрию к модели:
AI-фабрика = сеть дата-центров, а не одно здание

И это критично для следующего поколения LLM, агентных систем и промышленных AI-платформ.
🎥🚀 Wan-Move: Motion-Controlled Video Generation

Wan-Move представляет собой инновационную платформу для генерации видео с управлением движением, обеспечивая высокое качество и точность. Используя новаторское руководство по латентным траекториям, проект позволяет создавать 5-секундные видео с точным контролем на уровне объектов, интегрируясь с существующими моделями без изменений архитектуры.

🚀 Основные моменты:
- 🎯 Высококачественная генерация видео 480p с SOTA контролем движений.
- 🧩 Новая методология латентного управления траекторией.
- 🕹️ Точный контроль движений объектов с помощью плотных точечных траекторий.
- 📊 Уникальный бенчмарк MoveBench для оценки движений.

📌 GitHub: https://github.com/ali-vilab/Wan-Move
2
Как управлять поведением больших языковых моделей (LLM) не через дообучение, а прямо во время работы модели, с помощью специальных методов, похожих на нейростимуляцию.

🧠 В видео объясняют:
• зачем управлять поведением моделей без тонкой настройки (fine-tuning)
• как это достигается с помощью небольшого кода и библиотек типа Transformers
• почему это важно для практических приложений ИИ
• почему такой подход может быть альтернативой классическим fine-tune-методам

Это интересная и перспективная альтернатива дообучению модели - она позволяет быстрее и гибче корректировать поведение ИИ без больших затрат.

Видео: https://www.youtube.com/watch?v=-x3jjAzAhPU
HF: https://huggingface.co/spaces/dlouapre/eiffel-tower-llama
👍41👎1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ PANDAS-ТРЮК

Если нужно быстро найти дубликаты, но сразу увидеть, *чем* именно строки отличаются — используй сравнение через groupby + nunique.

Это позволяет ловить «почти одинаковые» строки без сложных проверок. Подписывайся, больше фишек каждый день !


import pandas as pd

df = pd.DataFrame({
"name": ["Tom", "Tom", "Alice", "Alice"],
"age": [25, 25, 30, 31],
"city": ["NY", "NY", "LA", "LA"]
})

diff = (df
.groupby("name")
.nunique()
.reset_index())

print(diff)

# Показывает, какие поля у одинаковых ключей различаются
🔥10🤔2
🚀 VulnLLM-R-7B - первый специализированный reasoning LLM для поиска уязвимостей, сразу с agent-scaffold.

Что важно:
- Заточен именно под vulnerability detection
- Использует рассуждения, а не только шаблонный паттерн-матчинг
- Может работать как агент для анализа кода

Полный стек уже доступен:
📜 Paper: https://alphaxiv.org/abs/2512.07533
💻 Code: https://github.com/ucsb-mlsec/VulnLLM-R
🤗 Model & Data: https://huggingface.co/collections/UCSB-SURFI/vulnllm-r
🕹️ Demo: https://huggingface.co/spaces/UCSB-SURFI/VulnLLM-R

Хороший пример того, как узкоспециализированные LLM начинают превосходить универсальные модели в реальных задачах безопасности.
🔥7
🤖 Gentleman Guardian Angel: AI для проверки кода

Gentleman Guardian Angel - это инструмент для автоматической проверки кода с использованием ИИ, который работает на каждом коммите. Он помогает соблюдать стандарты кодирования, проверяя изменения перед их добавлением в репозиторий.

Полностью написан на Bash и не требует дополнительных зависимостей.

🚀Основные моменты:
- 🔌 Поддержка различных ИИ-провайдеров
- 📦 Никаких зависимостей, только Bash
- 🪝 Установка в качестве git-хука
- ⚙️ Высокая настраиваемость правил проверки
- 🚨 Режим строгой проверки для CI

📌 GitHub: https://github.com/Gentleman-Programming/gentleman-guardian-angel
👍2🔥1
⚡️ В этой работе показано, что трансформеры могут обучаться без normalization-слоёв и даже показывать лучшие результаты - благодаря простому слою Derf.

Derf заменяет Layer Normalization на лёгкое point-wise преобразование, которое:
- проще и дешевле в вычислении
- не требует статистик по батчу или токенам
- снижает обращения к памяти и затраты на синхронизацию

В итоге обучение и инференс становятся быстрее и проще.

При этом качество не падает, а иногда растёт.

Пример: ImageNet-1K
Vision Transformer
- 82.8% с Derf
- 82.3% с LayerNorm

Трансформеры лежат в основе большинства языковых и визуальных моделей.

Обычно normalization стабилизирует числа, вычисляя среднее и дисперсию, а затем перескалируя активации.
Но эти операции добавляют оверхед по памяти и координации, что снижает эффективность.

Derf устраняет эту проблему, применяя S-образную функцию к каждому элементу отдельно — без глобальных измерений.

Авторы выделяют 4 ключевых свойства такой функции:
- значения центрированы около 0
- выход ограничен, чтобы избежать взрывов
- высокая чувствительность вблизи 0
- монотонность — порядок значений сохраняется

Derf содержит всего два обучаемых параметра:
- масштаб входа
- сдвиг функции

Эксперименты на задачах зрения, диффузионной генерации, речи, ДНК и GPT-2 показывают, что Derf стабильно не хуже или лучше LayerNorm и Dynamic Tanh, а также лучше обобщается.

Вывод: меньше оверхеда, проще архитектура и потенциально более сильные трансформеры.

📄 Статья: arxiv.org/abs/2512.10938
🔥71👍1
Forwarded from Machinelearning
Media is too big
VIEW IN TELEGRAM
✔️ Science Context Protocol: научное расширение стандарта MCP.

Шанхайская лаборатория ИИ выложила в опенсорс спецификации SCP — протокола, созданного для формирования глобальной сети автономных исследовательских систем. Новинка развивает идеи стандарта MCP от Anthropic, добавляя к нему критически важный слой для взаимодействия с физическим миром науки.

В отличие от MCP, ориентированного на подключение данных, SCP поддерживает подключение лабораторного оборудования, расширенные метаданные экспериментов и API для оркестрации сложных рабочих процессов.

Фактически это позволяет ИИ-агентам напрямую управлять приборами и обмениваться результатами между различными институтами. Технология уже обкатана на платформе Internal Discovery, где доступно более 1600 инструментов, преимущественно для биологии, физики и химии.
arxiv.org

✔️ OpenAI переводит производство своего первого гаджета на заводы Foxconn.

Компания Сэма Альтмана меняет стратегию выпуска дебютного аппаратного устройства под кодовым именем «Gumdrop». По данным Economic Daily News, OpenAI отказалась от услуг китайской Luxshare и передала контракт тайваньскому гиганту Foxconn, чтобы исключить материковый Китай из цепочки поставок - сборка будет развернута на мощностях во Вьетнаме или США.

Gumdrop находится на стадии проектирования и, вероятно, это будет умная ручка или носимый аудио-гаджет. Устройство получит камеру и микрофон, а его киллер-фичей станет нативная интеграция с ChatGPT для оцифровки и анализа рукописных заметок.
Релиз устройства запланирован на 2026–2027 годы.
money.udn.com

✔️ Попытка главы Microsoft защитить репутацию ИИ обернулась вирусным трендом «Microslop».

Сатья Наделла непреднамеренно спровоцировал имиджевый кризис, опубликовав в конце 2025 года призыв к обществу «перерасти» использование термина «slop» в отношении генеративного контента. Реакция сообщества оказалась мгновенной: эффект Стрейзанд вывел в тренды тег «Microslop», ставший символом отторжения агрессивной политики компании по повсеместному внедрению ИИ.

Пользователи выражают недовольство тем, что Microsoft принудительно встраивает Copilot в каждый продукт, игнорируя реальные потребности аудитории. Пока руководство Big Tech обещает глобальные прорывы, рынок фиксирует негативные побочные эффекты: от дефицита и удорожания памяти и сокращения рабочих мест до засорения экосистемы бесполезными функциями.
windowscentral.com

✔️ Neuralink запускает серийное производство нейро-чипов.

Илон Маск подтвердил планы компании начать массовый выпуск интерфейсов «мозг-компьютер» в 2026 году. Технологический процесс станет полностью автономной хирургической процедурой: роботы будут устанавливать импланты без прямого участия людей-нейрохирургов.

Проект уже вышел за рамки лабораторных экспериментов - база пациентов с активными имплантами достигла 12 человек. Устройства позволяют людям с тяжелыми нарушениями моторики управлять цифровыми интерфейсами и игровыми контроллерами напрямую через нейронную активность.
reuters.com

✔️ Армия США ввела специальность по ИИ и ML для офицеров.

С 5 января Пентагон официально открыл прием заявок на новую специализацию, позволяющую офицерам строить карьеру в ИИ и ML. Приоритет при отборе отдается кандидатам с профильным образованием и опытом разработки.

Офицеры пройдут углубленную подготовку, после чего займутся созданием, развертыванием и поддержкой военных ИИ-систем. Инициатива реализуется на фоне жестких дедлайнов по внедрению ИИ-управления в штабах к 2027 году и обеспечению армии автономными системами до конца 2026 года.

Параллельно Минобороны США запустило платформу GenAi.mil с Gemini for Government на борту, чтобы предоставить армии доступ к передовым языковым моделям. Таким образом, ИИ перестает быть экспериментальным направлением и становится штатной функцией офицерского состава.
federalnewsnetwork.com

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21🔥1