Машинное обучение RU
18.1K subscribers
1.62K photos
231 videos
11 files
2.07K links
Все о машинном обучении

админ - @workakkk

@data_analysis_ml - анализ даннных

@ai_machinelearning_big_data - Machine learning

@itchannels_telegram -лучшие ит-каналы

@pythonl - Python

@pythonlbooks- python 📚

@datascienceiot - 📚

РКН: clck.ru/3FmrUw
Download Telegram
📌 Bezos готовит фонд на $100 млрд и это уже не про софт.

По данным WSJ и Reuters, он хочет скупать производственные компании и перестраивать их с помощью ИИ. Речь идёт о реальных отраслях: чипы, оборонка, тяжёлая промышленность.

Идея в том, чтобы использовать ИИ не только для кода, а прямо на заводах: оптимизировать процессы, ускорять сборку, снижать издержки.

Проект связан со стартапом Project Prometheus, который делает AI для инженерии и уже привлёк $6.2 млрд. В команду также вошёл David Limp из Blue Origin.

Сейчас Безос общается с крупными инвесторами, в том числе на Ближнем Востоке, чтобы собрать нужную сумму.

Если это реализуют, ИИ начнёт менять не только софт, но и то, как производят железо.
Please open Telegram to view this post
VIEW IN TELEGRAM
4🤔2
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Самый мощный режим ChatGPT — «не спеши, сначала подумай»

Ты используешь ChatGPT как помощника.

Но самый мощный режим —
заставить его думать дольше.

Большинство пишет:
«Напиши код»


Профи пишут:
«Не отвечай сразу. Сначала продумай решение, варианты и риски.»

Что это даёт:

• меньше ошибок
• меньше галлюцинаций
• более продуманная архитектура
• код уровня senior
• лучше работает на сложных задачах

Это работает, потому что ты включаешь режим deliberate reasoning.

Один промпт иjndtns становятся в разы умнее.


t.me/Chatgpturbobot - chatgpt бот в телеге без подписок

Task: [опиши задачу]

Before answering:
- Think through the problem step by step
- Consider multiple approaches
- Choose the best solution
- Check for edge cases and performance issues

Then provide the final answer only.
👍8🤯21
Яндекс приглашает на стажировку по машинному обучению

Работайте с данными и моделями в продуктах Яндекса! Вас ждут реальные задачи, поддержка ментора и шанс попасть в штат.

Вот лишь малая часть задач, которые реализуют стажёры:

— обучение моделей для международного Поиска
— улучшение качества поиска Маркета
— обучение YandexGPT работе с внешней информацией
— преобразование данных с сенсоров камер, лидаров и радаров в программные сущности

Откликайтесь, если вы понимаете классические алгоритмы, владеете Python или C++, знаете методы ML и обладаете теоретическими знаниями или прикладным опытом в DL. Стажировка официально оформляется, оплачивается, имеет гибкий график и предлагает оплату проезда и проживания для студентов из других городов.

Стать частью ML-команды Яндекса можно здесь.
4
😁203🔥1🥰1
Media is too big
VIEW IN TELEGRAM
Новый интервью Andrej Karpathy - кратко главное:

- Проблемы с AI-агентами = чаще скилл пользователя, а не слабость модели
- Ошибки возникают из-за плохих инструкций и настройки
- Нужно мыслить не мелкими задачами, а крупными действиями (macro tasks)
- Делегируй задачи на ~20 минут нескольким агентам параллельно
- Примеры: кодинг, ресёрч, планирование фич
- Роль человека - дирижёр (оркестратор), который распределяет задачи
- Затем - ревью результата, а не ручная работа
- Это новый навык - сначала сложно, потом сильно бустит продуктивность
-
https://www.youtube.com/watch?v=kwSVtQ7dziU&t=1s
6👍5🔥3😁1
ВСЕ ЭТИ AI-МОДЕЛИ ВЫШЛИ В ЭТОМ МЕСЯЦЕ:

- GPT-5.4
- GPT-5.4 Pro
- GPT-5.4 Mini
- GPT-5.4 Nano
- GPT-5.3 Instant
- MiniMax M2.7
- Mistral Small 4
- MiMo-V2-Pro (Xiaomi, представлен как Hunter Alpha)
- NVIDIA Nemotron 3 Super
- серия Qwen3.5 (включая Qwen3.5-9B, 4B и др.)
- GPT-5.3 Instant (обновление в начале марта)

Это был просто безумный месяц.
👍182
🚀 X/Twitter Research Agent for AI

Эффективный CLI-инструмент для работы с X API. Позволяет искать, фильтровать и мониторить твиты, получая исследовательские данные без лишних усилий. Идеален для взаимодействия с AI-агентами и анализа контента.

🚀Основные моменты:
- Поиск твитов с сортировкой и фильтрацией
- Мониторинг аккаунтов через списки наблюдения
- Быстрый режим для экономии ресурсов
- Кэширование запросов для снижения затрат
- Прозрачность расходов на каждую операцию

📌 GitHub: https://github.com/rohunvora/x-research-skill

#typescript
👍3
⚡️ Накатываем себе БЕСПЛАТНЫЙ Claude Opus 4.6 навсегда - энтузиасты переобучили нейронку Qwen 3.5 на данных Opus 4.6 и получили полностью опен-сорсный Claude, который НЕ УСТУПАЕТ оригиналу и запускается на одной GPU.

• Модель можно запустить БЕЗ ограничений на домашнем компе и даже не слишком мощном железе.
• Нейронка шустрая и очень умная - для повседневных рабочих задач.
• Поддерживает контекст в 262 000 токенов, можно грузить целые книги, папки с кодом и документы.
• Полностью автономна, запускает целые цепочки рассуждений.
• Стабильнее других моделей Qwen работает с внешними API.
• БЕЗ ограничений, БЕЗ цензуры, БЕЗ подписок.

https://huggingface.co/Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled-GGUF
👎15😁9👍85🔥1
Распознай, кто говорит, и выиграй 600 тысяч рублей! 💙

ИТ-компания «Криптонит» приглашает на дататон «Криптонит.Тембр»!


❗️Задача — разработать модель распознавания по голосу, устойчивую к искажениям аудиосигнала.

Тебе предстоит обучить Speaker Recognition модель, устойчивую к искажениям аудио, возникающим в реальных сценариях эксплуатации речевых интерфейсов и систем обработки звука:
🔹искажения, вносимые акустической средой;
🔹посторонние шумы;
🔹реверберация;
🔹большое расстояние до микрофона;
🔹искажения каналов связи.

Участвуй, и ты сможешь:
🟦получить шанс разделить призовой фонд в 600 000 рублей;
🟦разработать решения в области Audio/Speech ML;
🟦прокачать скиллы в Speaker Recognition и Deep Learning.

👆 Регистрируйтесь до 10 апреля включительно!
Please open Telegram to view this post
VIEW IN TELEGRAM
3
Forwarded from Machinelearning
Media is too big
VIEW IN TELEGRAM
⚡️ OpenAI закрывает генератор видео Sora.

Спустя всего 6 месяцев после релиза, OpenAI приняла решение закрыть сервис, который стал вирусным почти сразу: после запуска в конце сентября он набрал миллион скачиваний менее чем за 5 дней.

Несмотря на популярность, поддержка проекта оказалась слишком дорогой. Сейчас компания активно урезает издержки, чтобы подготовить финансовую базу для выхода на биржу.

В ближайшее время компания обещает опубликовать точные сроки отключения приложения и API, а также выпустить инструкции, которые помогут безопасно выгрузить и сохранить созданный контент.
SoraOfficialApp в сети Х

✔️ Anthropic научила Claude управлять компьютером.

В Claude Cowork и Claude Code появилась функция прямого контроля десктопа. Теперь Claude может перехватывать управление: перемещать курсор, кликать по интерфейсу, набирать текст и запускать инструменты разработчика напрямую.

Новая возможность раскрывается в связке с свежей функцией Dispatch. Например, можно отправить задачу со смартфона, находясь в пути, а запущенный десктопный клиент Claude на компьютере самостоятельно протестирует код, внесет изменения в IDE и подготовит PR.

Новая функция в стадии Research Preview и доступна подписчикам тарифов Pro и Max. На данный момент поддерживается исключительно macOS.
claude.com

✔️ Google Cloud отправляет ИИ-агентов отбиваться от киберугроз.

На конференции RSA 2026 Google выкатила обновление инструментов кибербезопасности. В платформу Security Operations добавили агентов на базе Gemini: они умеют сами копаться в инцидентах, собирать цифровые улики и выносить вердикт с подробным разбором полетов.

Этих же агентов прикрутили к системе Google Threat Intelligence - теперь они мониторят даркнет. Корпорация заявляет, что алгоритм переваривает миллионы событий ежедневно с точностью 98% и подсвечивает только те риски, которые касаются конкретной компании.

Параллельно Google подтвердила покупку компании Wiz. Ее технологии будут применятся для создания единой системы защиты мультиоблачных инфраструктур.
cloud.google.com

✔️ Ai2 выпустил open-source браузерного агента MolmoWeb.

Инструмент построен на базе моделей Molmo 2 с 4В и 8В параметров. Он смотрит на веб глазами пользователя: анализирует скриншот страницы и сам решает, куда кликнуть, что написать, где проскроллить или открыть новую вкладку.

Создатели не стали приукрашивать реальность: агент может тупить при чтении текста, ломается после случайного клика не туда и теряется от нечетких инструкций. Заодно ради безопасности его специально отрезали от работы с паролями и деньгами.

MolmoWeb установил новый SOTA среди открытых решений в 4 бенчмарках для веб-агентов, обошел визуальных агентов на базе GPT-4o и превзошел OpenAI CUA в 3 тестах из 4.
Проект полностью открыт: веса, код и датасет MolmoWebMix доступны по лицензии Apache 2.0.
allenai.org

✔️ Основатель FigureAI запустил стартап персонального AGI.

Бретт Адкок официально представил свой новый проект - ИИ-лабораторию Hark. Компания находилась в скрытом режиме 8 месяцев, собирая сильную команду инженеров в области программного и аппаратного обеспечения.

Адкок считает, что LLM-чатботы слишком примитивны. По его видению, настоящий AGI должен обладать долговременной памятью, глубокой персонализацией и способностью взаимодействовать с физическим миром. Hark будет создавать именно такой персональный интеллект. Система будет перенимать образ мышления пользователя, чтобы забирать на себя когнитивную нагрузку и действовать на опережение.

Несмотря на амбициозные цели, конкретных продуктов Hark пока не показал. На данный момент опубликован только концептуальный манифест и открыт список ожидания.
Brett Adcock в сети Х

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍2
Популярность Claude в США - вполне ожидаема.

Но неожиданно другое: Европа тоже активно подтянулась, процент использования выше среднего.

Китай сильно отстаёт. По крайней мере официально Claude там не используют.

И самое забавное - Австралия почти на уровне США по популярность Claude.
🔥5👍3😁3
🚀 WildHack от Wildberries & Russ - хакатон с призовым фондом 1.3 млн ₽

RWB запускает хакатон для студентов IT и технических направлений - с реальными задачами и шансом попасть в индустрию.

Что внутри:
- практические ML-задачи из логистики
- работа с реальной платформой компании
- два формата участия:
- индивидуальный - решение ML-задач
- командный - разработка ML-сервиса

💰 Призы и возможности:
- общий фонд - 1 300 000 ₽
- стажировка и шанс получить оффер

📅 Условия:
- участие для студентов 18+
- регистрация до 8 апреля

Это не просто хакатон - это быстрый вход в реальный AI и возможность поработать с задачами уровня продакшена.
1
Тест новых LLM - это новая работа на полный рабочий день.
10👍7😁5
Claude Code — это уже не просто инструмент. Это система разработки с памятью, автоматизацией и агентами.

Коротко по сути:

CLAUDE.md — мозг проекта
Хранит архитектуру, правила и контекст. Загружается автоматически.

• Skills — навыки
Позволяют автоматизировать ревью, тесты, деплой и любые процессы.

• Hooks — автодействия
Запускают проверки и действия без твоего участия.

• Agents — параллельная работа
Разбивают задачи и выполняют их одновременно.

• Workflow
plan → execute → auto
Минимум ручной работы, максимум результата.

• Структура
.claude / skills / commands / agents
Всё как у полноценной инженерной системы.

• Безопасность
permissions, sandbox, контроль доступа.

Это уже не про «спросить у ИИ».
Это про «дать задачу и получить результат».

Сохрани себе - пригодится.
9👍4👎2🥰1🤬1
Работа с корпоративными данными — типичный сценарий для ИИ-агентов. Основное ограничение здесь не столько возможности самой модели, сколько способность работать с разными форматами данных. Специально для таких сценариев Yandex B2B Tech обновили File Search в Yandex AI Studio, расширив его возможности.

Инструмент теперь поддерживает не только текст, PDF и изображения, но и видео, аудио и таблицы. Для мультимедиа используется отдельный пайплайн распознавания речи и изображений.

File Search – встроенный инструмент, который использует RAG-подход для доступа к данным: модели формируют ответы на основе загруженных файлов и корпоративных баз знаний, а не только общих знаний модели о мире. Добавлена поддержка поиска CSV и Excel, что важно для кейсов со структурированными данными. Инструмент можно использовать вместе с рассуждающей моделью DeepSeek V3.2.
4👍3🔥1
7🔥5👍1😁1
🔥 FireRed-Image-Edit: Мощный инструмент для редактирования изображений

FireRed-Image-Edit — это универсальная модель редактирования изображений, обеспечивающая высокое качество и согласованность редактирования. Она поддерживает множество сценариев, включая восстановление старых фотографий и редактирование текста с сохранением стиля.

🚀 Основные моменты:
- Высокая производительность редактирования с точным следованием инструкциям.
- Встроенные возможности редактирования на основе модели текст-в-изображение.
- Сохранение стилей текста с высокой точностью.
- Гибкость редактирования нескольких изображений.
- Достижение новых стандартов среди открытых моделей.

📌 GitHub: https://github.com/FireRedTeam/FireRed-Image-Edit
🔥61🥰1
Что такое Claude Skills

Файл CLAUDE.md изначально не задумывался как место для хранения целых процессов. Но на практике туда начинают складывать всё подряд - общие правила, кодстайл, длинные чек-листы безопасности, пайплайны деплоя. В итоге один файл грузится в каждую сессию и съедает контекст даже тогда, когда Claude просто переименовывает переменную.

Skills решают эту проблему. Они превращают процессы в отдельные модули, которые подгружаются только тогда, когда действительно нужны.

Идея простая. Skill - это папка внутри .claude/skills/. Внутри лежит файл SKILL.md, в котором есть две ключевые части: описание и сам процесс. Описание говорит модели, когда этот скилл нужно активировать. Инструкции объясняют, что именно делать.

Описание по сути становится триггером. Claude читает все доступные описания, следит за диалогом и, когда запрос совпадает по смыслу, автоматически подтягивает нужный скилл. Ничего вставлять вручную не нужно. Не нужны команды. Модель сама понимает намерение и включает нужный процесс. Если хочется контроля - любой скилл можно вызвать явно через slash-команду вроде /security-review.

Но автозапуск - это только верхний слой. Основная сила в том, что скиллы - это не просто инструкции, а полноценные пакеты.

SKILL.md может ссылаться на дополнительные файлы рядом с ним через @. Это могут быть стандарты безопасности, шаблоны релиз-нотов, чек-листы соответствия - всё, что нужно для конкретного процесса. Скилл упаковывает весь контекст в одном месте.

Внутри SKILL.md через YAML задаются имя, описание и доступ к инструментам. Последнее особенно важно. Например, скиллу для security review достаточно Read, Grep и Glob. Ему не нужно право на запись. Ограничение инструментов делает поведение предсказуемым и снижает риски.

Скиллы существуют на двух уровнях. Проектные лежат в .claude/skills/ и коммитятся в репозиторий, чтобы команда работала с одинаковыми процессами. Персональные находятся в ~/.claude/skills/ и переиспользуются между проектами.

Если в CLAUDE.md зашит длинный процесс из 20 шагов, он будет мешать в большинстве сессий. Тот же процесс, оформленный как отдельный скилл и активирующийся только по необходимости, работает точечно и не перегружает контекст.

В итоге роли разделяются. CLAUDE.md отвечает за правила и поведение. Skills - за выполнение конкретных процессов.

Ниже - подробный разбор всей системы: CLAUDE.md, хуки, skills, агенты и права доступа, и как это всё правильно собрать в рабочую конфигурацию.

https://uproger.com/chto-takoe-claude-skills/
👍64🥰1🤔1
🚀 Автоматизация разработки с Antfarm

Antfarm — это инструмент для создания команды AI-агентов, которые работают совместно для автоматизации разработки. Он позволяет легко настраивать рабочие процессы, такие как разработка функций, аудит безопасности и исправление ошибок, без необходимости в сложной инфраструктуре.

🚀Основные моменты:
- Оптимизированные рабочие процессы с использованием AI-агентов.
- Автоматическая проверка и тестирование на каждом этапе.
- Легкая настройка через YAML.
- Поддержка различных сценариев разработки.

📌 GitHub: https://github.com/snarktank/antfarm

#typescript
🔥3👍2
MiniMax M2.7 переписывает себя сам

Все привыкли, что AI-модели улучшаются за счет переобучения: больше данных, новые веса, дорогие GPU-кластеры. MiniMax пошел другим путем. Их новая модель M2.7 улучшает саму себя без единого обновления весов, переписывая собственное агентное окружение прямо в процессе работы.

Это не маркетинговая риторика. Это конкретный инженерный механизм, который уже показал 30% прирост на внутренних бенчмарках после 100+ итераций автономной самооптимизации.

Что такое “harness” и почему это важно
Когда вы запускаете AI-агента, он работает внутри так называемого harness (окружения). Это совокупность инструментов, скиллов, правил, памяти и логики вызовов. Обычно это окружение проектирует инженер, и агент работает в его рамках. Harness фиксирован.

M2.7 трактует свой harness как нечто, что он может переписывать. Это и есть ключевое отличие.

Как работает петля самоэволюции
Команда MiniMax запустила M2.7 оптимизировать производительность модели на внутреннем scaffold. Агент работал полностью автономно, выполняя итеративную петлю: анализ траекторий ошибок, планирование изменений, модификация scaffold-кода, запуск эвалюаций, сравнение результатов, решение оставить или откатить изменения. И снова по кругу, более 100 раундов.

В процессе M2.7 самостоятельно обнаружил эффективные оптимизации: систематически искал оптимальные комбинации параметров сэмплирования (temperature, frequency penalty, presence penalty), разработал специфические workflow-гайдлайны для себя, добавил детектор зацикливания в агентный цикл. Ничего из этого не было прописано человеком.

Тест на ML-соревнованиях
MiniMax проверил подход на 22 ML-соревнованиях из MLE Bench Lite, открытого OpenAI. Каждый запуск длился 24 часа в полностью автономном режиме. После каждой итерации агент генерировал markdown-файл краткосрочной памяти и выполнял самокритику, передавая инсайты в следующий раунд.

Лучший прогон завершился с 9 золотыми медалями, 5 серебряными и 1 бронзовой. Средний medal rate по трем прогонам составил 66.6%, что ставит M2.7 вровень с Gemini-3.1 и вплотную к GPT-5.4 (71.2%) и Opus-4.6 (75.7%). При этом модель ни разу не переобучалась.


Привычная парадигма: хочешь лучшую модель – трать деньги на обучение. M2.7 показывает альтернативу: улучшение может идти через постоянное совершенствование системы вокруг модели. Веса не меняются, меняются скиллы, память, правила, логика вызовов.

Это означает, что петля улучшений может крутиться непрерывно без какого-либо retraining. Агент буквально становится лучше каждый день работы, просто за счет рефлексии над собственными ошибками.

Что еще умеет M2.7
За рамками самоэволюции это сильная инженерная модель. На бенчмарке SWE-Pro M2.7 набрала 56.22%, вплотную приблизившись к Opus. На Terminal Bench 2 – 57.0%. В продакшен-сценариях команда MiniMax отмечает сокращение времени восстановления после инцидентов до трех минут. На внутреннем RL-воркфлоу агент берет на себя от 30% до 50% задач без участия человека.

Модель поддерживает работу с более чем 40 сложными скиллами (каждый свыше 2000 токенов) с 97% соблюдением инструкций. На Toolathon – 46.3%, это глобальный топ-уровень.

Ссылки
Официальный блог MiniMax: minimax.io/news/minimax-m27-en

Оригинальный тред на X: x.com/akshay_pachaar

Open-source проект OpenRoom: github.com/MiniMax-AI/OpenRoom

https://uproger.com/minimax-m2-7-perepisyvaet-sebya-sam/
👍65🔥4