Машинное обучение digest
62 subscribers
2.85K photos
463 videos
1.74K links
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
The AI Scientist официально вышел в Nature - и это уже не просто эксперимент.

Речь про систему, которая способна автоматизировать весь цикл научного исследования:

- генерировать идеи
- писать код
- запускать эксперименты
- оформлять научную статью

Обновлённая версия AI Scientist-v2 уже сгенерировала первую полностью AI-сгенерированную научную работу,
которая прошла полноценное рецензирование людьми.

Теперь вышла публикация в Nature,
где подробно разобрана архитектура системы и показано, как всё это работает на практике.

В ИИ-систему добавили Automated Reviewer - AI-рецензента, который оценивает статьи
на уровне человека и даже стабильнее, чем сами люди.

Исследователями обнаружен прямой закон масштабирования науки -
чем сильнее базовая модель,
тем выше качество научных работ, которые она генерирует.

Это означает простую вещь:
По мере роста моделей и удешевления вычислений
качество AI-науки будет расти автоматически.
Фактически мы подошли к точке,
где исследования можно масштабировать так же, как сегодня масштабируют код или контент.

Nature: https://nature.com/articles/s41586-026-10265-5
Blog: https://sakana.ai/ai-scientist-nature
Я все еще в чем-то лучше ИИ — вышел обновленный бенчмарк ARC-AGI-3, который показал одну из главных проблем моделей.

Логично, что ИИ легко решает то, что видели и что попало в их обучающую выборку. ARC-AGI же проверяет умение моделей учиться и адаптироваться сходу.

По итогам теста из 135+ мини-игр результаты неутешительные: люди решают почти 100% задач, а вот модели меньше 1%.

Порешать и самоутвердиться перед железяками можно тут.🍺
Please open Telegram to view this post
VIEW IN TELEGRAM
Отказываемся от думскроллинга: вышел скилл last30days для ИИ-агентов. Анализирует нужные темы по разным сайтам и соцсетям за пользователя.

В поиск попадают новости за последние 30 дней, посты на Reddit, X, видео на YouTube. Агент изучает их и выдает короткий обзор по теме — после этого ему можно задавать любые уточняющие вопросы.

Можно установить в Codex, Claude или Cursor. Забираем бесплатно здесь.
ARC-AGI-3 - бенчмарк,показал неприятную для всей индустрии вещь: даже топовые frontier-модели сейчас набирают меньше 1%.

Лучшие результаты на старте такие:

- Gemini 3.1 Pro Preview - 0.37%
- GPT-5.4 High - 0.26%
- Opus 4.6 Max - 0.25%

И это, пожалуй, главный вывод.

ARC-AGI-3 - это уже не набор статичных головоломок, как в прошлых версиях ARC. Теперь это интерактивные игровые миры, где агенту нужно самому разбираться, что вообще происходит.

Что именно проверяет новый тест:

- исследование незнакомой среды с нуля
- поиск целей и правил без текстовых инструкций
- построение своей модели мира по ходу задачи
- длинное планирование на много шагов вперёд
- обучение на опыте, а не по шаблону
- пересмотр гипотез, если первые догадки оказались неверными

То есть здесь уже мало просто "хорошо рассуждать в чате".

Нужно адаптироваться в реальном времени, помнить прошлые действия, извлекать сигналы из слабой обратной связи и не скатываться в перебор.

Внутри ARC-AGI-3:
- 150+ новых интерактивных окружений
- почти 1 000 уровней
- replay-сессии, где можно смотреть весь таймлайн решений агента

Скоринг считает не только факт решения, а то, насколько эффективно модель осваивает навык по сравнению с человеком.

Именно поэтому результаты выглядят настолько жёстко.

По сути, ARC Prize говорит прямо:
пока между человеком и ИИ есть такой разрыв в освоении новых задач, говорить о настоящем AGI рано.

И это, возможно, один из самых честных тестов за последнее время.

Не потому что модели "слабые".
А потому что реальная универсальная адаптация всё ещё не решена.

https://arcprize.org/

🐍 полезные ресурсы 🚀Max

@data_analysis_ml
Zhilin Yang (один из авторов архитектуры Transformer-XL) на GTC представил концепцию Attention Residuals

Главная идея внимания - это не запоминать всё подряд, а выбирать, что действительно важно.

Многие читали работу Attention Is All You Need (2017) - именно она привнесла в модели механизм "человеческого" внимания. С этого момента модели перестали просто механически обрабатывать весь текст. Вместо этого они начали различать, что важнее, а что нет, и сохранять более значимую информацию.

Недавно Китайцы из Kimi пошли дальше и применили внимание к временной оси, а затем "повернули" его в глубину модели.

Теперь внимание работает не только по времени, но и через слои модели - по мере передачи информации.

Это даёт более умный способ обработки:
модель не просто читает и передаёт данные дальше, а осмысленно отслеживает важное на каждом этапе вычислений.

https://x.com/Kimi_Moonshot/status/2037010118957817988
В Claude Code уже 93 команды.

Но чтобы получить 80% пользы, тебе хватит вот этих 16 👇

/init
→ создаёт CLAUDE.md - память проекта и репозитория

/plan
→ сначала думает, потом пишет код

/context
→ показывает, что именно съедает твои токены

/compact
→ очищает контекст прямо в середине сессии

/clear
→ сбрасывает состояние между задачами

/model
→ переключает модели: Opus / Sonnet / Haiku

/btw
→ позволяет задать побочный вопрос, не ломая основной поток работы

/rewind
→ откатывает назад, если всё пошло не туда

/agents
→ запускает несколько суб-агентов параллельно

/chrome
→ управляет браузером: клик, ввод, навигация

/loop
→ прогоняет промпты по кругу, удобно для мониторинга

/simplify
→ 3 агента вместе ревьюят твой код

/permissions
→ заранее разрешает безопасные действия

--dangerously-skip-permissions
→ полностью автоматический режим, без лишних подтверждений

Shift + Tab
→ мгновенное переключение режимов

ultra think
→ максимальная глубина рассуждения

Большинство используют Claude Code как обычный чат-бот.

Поэтому и упираются в потолок.

Продвинутые пользователи работают с ним как с целой системой.
🌟 Релиз LongCat-Next

Модель объединяет текст, изображения и аудио в одну систему и работает по тому же принципу next-token prediction, но уже не только для текста.

Что внутри:
• 68.5B параметров (3B активных, MoE)
• единая модель для “видит - рисует - говорит”

dNaViT 0 визуальный трансформер, который кодирует изображения в дискретные токены
→ работает с любым разрешением
→ совмещает генерацию и понимание (раньше это был компромисс)

Paper: https://github.com/meituan-longcat/LongCat-Next/blob/main/tech_report.pdf
GitHub: https://github.com/meituan-longcat/LongCat-Next
HuggingFace: https://huggingface.co/meituan-longcat/LongCat-Next
Demo: https://longcat.chat/longcat-next
Blog: https://longcat.chat/longcat-next/intro
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
В Claude Code уже 93 команды.

Но чтобы получить 80% пользы, тебе хватит вот этих 16 👇

/init
→ создаёт CLAUDE.md - память проекта и репозитория

/plan
→ сначала думает, потом пишет код

/context
→ показывает, что именно съедает твои токены

/compact
→ очищает контекст прямо в середине сессии

/clear
→ сбрасывает состояние между задачами

/model
→ переключает модели: Opus / Sonnet / Haiku

/btw
→ позволяет задать побочный вопрос, не ломая основной поток работы

/rewind
→ откатывает назад, если всё пошло не туда

/agents
→ запускает несколько суб-агентов параллельно

/chrome
→ управляет браузером: клик, ввод, навигация

/loop
→ прогоняет промпты по кругу, удобно для мониторинга

/simplify
→ 3 агента вместе ревьюят твой код

/permissions
→ заранее разрешает безопасные действия

--dangerously-skip-permissions
→ полностью автоматический режим, без лишних подтверждений

Shift + Tab
→ мгновенное переключение режимов

ultra think
→ максимальная глубина рассуждения

Большинство используют Claude Code как обычный чат-бот.

Поэтому и упираются в потолок.

Продвинутые пользователи работают с ним как с целой системой.
💻 Claude Computer - полезная шпаргалка

Как включить:

1. Платная подписка + десктопное приложение + приложение на телефоне
2. Соедини через Dispatch (слева)
3. В настройках включи Computer use

Примеры работы:

✦ Найти фрилансера
Промпт:
Открой мой Fiverr в Chrome.
Опубликуй задачу на [задача].
Напиши 10 лучшим специалистам.
Проверь входящие и доведи до сделки
до бюджета [бюджет]


✦ Найти вирусную рекламу
Промпт:
Открой Meta Ads Library
Найди свежие вирусные объявления по теме [тема] в [страна]
Собери Google Sheets с 50+ ссылками

✦ Массовый отклик на вакансии
Промпт:
Открой сайты с вакансиями
Проанализируй мой CV
И откликнись на подходящие вакансии


Claude Computer - мощный и простой в настройке исполнитель задач
✔️ Google установила 2029 год дедлайном для перехода на постквантовую криптографию.

Ускорение миграции продиктовано темпами развития квантового оборудования и коррекции ошибок. Появление систем, способных взломать современные стандарты шифрования, произойдет быстрее, чем ожидалось.

Особую тревогу вызывают атаки «сохрани сейчас, расшифруй потом» и грядущая уязвимость традиционных цифровых подписей. Google скорректировала модель угроз, сделав приоритетом защиту сервисов аутентификации до появления криптографически значимых квантовых компьютеров.

Google уже интегрирует постквантовые подписи на базе ML-DSA (одобренного NIST) в Android 17, дополняя механизмы, развернутые в Chrome и Google Cloud.

blog.google
Please open Telegram to view this post
VIEW IN TELEGRAM
🚀 Docker сборка: ускорение с 3 минут → до 20 секунд

Маленькое изменение, которое даёт огромный буст 👇

При работе с Docker была проблема:
даже небольшое изменение кода запускало полную пересборку образа.

Причина - Docker Layer Caching

Каждая инструкция в Dockerfile создаёт слой.
Если слой не изменился - Docker берёт его из кэша.

💡 Ошибка:

Копировал весь код до установки зависимостей

В итоге:
любое изменение кода → ломает кэш →
зависимости устанавливаются заново каждый раз

🔧 Фикс:

Сначала копируй файлы зависимостей
Устанавливай зависимости (кэшируется)
Только потом копируй основной код

📉 Результат:

Сборка:
~3 минуты → ~20 секунд

Пересобираются только изменённые слои
Остальное берётся из кэша

💡 Почему это важно:

В CI/CD:
- медленные билды = медленные деплои
- лишние пересборки = лишние деньги

Маленькое изменение в Dockerfile
→ огромный эффект в реальных проектах
This media is not supported in your browser
VIEW IN TELEGRAM
Находим удаленку МЕЧТЫ уже в 2026 году и получаем отличную зарплату — нашли сайт Remotejobs, на котором собрали предложения МИРОВОГО уровня от крупных бигтехов и небольших контор.

• Да, там можно найти работу даже от Netflix, LinkedIn, Airbnb, Pinterest и других топовых компаний.
• Все вакансии отсортированы по уровню: от джуна до сеньора.
• Специальностей — десятки: SMM, дизайн, кодинг, ML, райтинг, продажи и прочее.
• При этом вакансии точно АКТУАЛЬНЫЕ — авторы постоянно отслеживают статус, проверяют компании, которые размещаются на сайте, и собирают только проверенную инфу.

😶😶😶😶😶😶😶😶😶

Работу мечты в 2026 году ищем — тут.

👍 Бэкдор
Please open Telegram to view this post
VIEW IN TELEGRAM
💻 Kubernetes безопасность - это не одна настройка

Это слои защиты

Можно представить как кольца, которые защищают кластер

5 ключевых уровней:

• API Server Access
контроль доступа к кластеру

• Workload Security
безопасность pod и контейнеров

• Network Security
контроль сетевого взаимодействия

• Image Security
проверка и доверие к образам

• Runtime Security
мониторинг поведения в рантайме

Главая ошибка:

Многие защищают только «снаружи»
и игнорируют то, что происходит внутри кластера

Если один pod скомпрометирован
→ без ограничений он может пойти дальше по кластеру


Безопасность Kubernetes = это система слоёв
А не одна настройка


Разбор всех уровней:
https://devopscube.com/cks-exam-guide-tips/
Please open Telegram to view this post
VIEW IN TELEGRAM
Google спасёт нас от дефицита ОЗУ — компания добра внезапно нашла решения кризиса.

Они выпустили алгоритм сжатия для LLM-моделей TurboQuant: он уменьшает необходимые ресурсы для KV cache — это такая память нейросети, которая позволяет помнить каждый предыдущий токен (слово) во время генерации ответа.

Результаты потрясающие: требования к памяти с алгоритмом снижаются в 6 раз, а скорость работы — увеличивается на 8 раз, при этом без потери в точности.

Инвесторы новость оценили и побежали сливать акции производителей памяти — Micron, SK Hynix.

@exploitex
Google спасёт нас от дефицита ОЗУ — компания добра внезапно нашла решения кризиса.

Они выпустили алгоритм сжатия для LLM-моделей TurboQuant: он уменьшает необходимые ресурсы для KV cache — это такая память нейросети, которая позволяет помнить каждый предыдущий токен (слово) во время генерации ответа.

Результаты потрясающие: требования к памяти с алгоритмом снижаются в 6 раз, а скорость работы — увеличивается на 8 раз, при этом без потери в точности.

Инвесторы новость оценили и побежали сливать акции производителей памяти — Micron, SK Hynix.

@exploitex
This media is not supported in your browser
VIEW IN TELEGRAM
✔️ DeepMind сделала браузер-генератор сайтов на Gemini 3.1 Flash-Lite.

Концепт, который работает внутри AI Studio, пишет HTML и CSS прямо в процессе серфинга вместо загрузки готовых страниц с серверов. Внешний вид и контент формируются на основе промптов, кликов и контекста навигации.

Технология органично вписывается в концепцию автономных ИИ-агентов, которым может понадобиться быстро собрать временный дашборд или вспомогательный инструмент для текущей задачи.

До идеала еще очень далеко. Поскольку верстка и контент полностью генерируются на не лучшей версии Gemini, браузер уязвим, склонен немного галлюцинировать, искажать стили и тратит прорву токенов на инференс.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🌟 Claude Code Game Studios: 48 ИИ-агентов как полноценная игровая студия.

Соло-разработчик с доступом к Claude Code теперь может развернуть целую гейм-дев студию с креативным директором, лидами отделов и профильными специалистами.

В основу геймдизайнерских подходов заложены MDA Framework, теория самодетерминации и проектирование состояния потока.

Claude Code Game Studios - шаблон для Claude Code, который организует ИИ-сессию в трёхуровневую иерархию из 48 специализированных агентов.

На вершине 3 директора (креативный, технический и продюсер), работающие на модели Opus.


Уровнем ниже 8 руководителей отделов на Sonnet: геймдизайнер, ведущий программист, арт-директор, директор по звуку, нарративный директор и другие.


Третий уровень - специалисты на Sonnet и Haiku: от геймплэй-программиста и дизайнера экономики до DevOps-инженера и специалиста по доступности.


Агенты взаимодействуют по четкому протоколу: вертикальная делегация задач сверху вниз, горизонтальные консультации между агентами одного уровня, эскалация конфликтов к общему руководителю.

Каждый агент работает строго в границах своего домена и не модифицирует чужие файлы без явного поручения.

Помимо агентов, шаблон включает 37 команд, покрывающих весь цикл разработки: планирование спринтов, ревью кода и дизайна, аудит ассетов, генерацию идей, подготовку к релизу.

Отдельная категория - командные воркфлоу, которые координируют работу нескольких агентов над конкретной фичей: боевой системой, нарративом, интерфейсом или звуком.

Параллельно работают 8 хуков, привязанных к событиям git и жизненному циклу сессии. Они срабатывают автоматически: валидируют коммиты на захардкоженные значения и корректность данных, предупреждают о пушах в защищённые ветки, подгружают контекст текущего спринта при старте и фиксируют результаты при завершении.

Ещё один слой - 11 правил, привязанных к путям в проекте. Они применяются при редактировании файлов в соответствующих директориях и задают стандарты для каждой зоны кодовой базы.

🟡Это не автопилот.

Агенты задают вопросы, предлагают несколько вариантов с плюсами и минусами, показывают черновик. Но финальное решение всегда за человеком, ничего не фиксируется без его одобрения.

🟡Шаблон работает с Godot 4, Unity и Unreal Engine 5.

Для каждого предусмотрен свой лид-агент с набором суб-специалистов: у Godot это GDScript, шейдеры и GDExtension, у Unity - DOTS/ECS, VFX и UI Toolkit, у Unreal - GAS, Blueprints и Replication.

Проект открыт к кастомизации: агентов можно добавлять и удалять, промпты редактировать, хуки - перенастраивать.


📌Лицензирование: MIT License.


🖥GitHub


@ai_machinelearning_big_data

#AI #ML #Vibecoding #Gamedev #Claude
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Deep-Live-Cam 2.1 — бесплатный open-source инструмент, который в реальном времени меняет лицо на любой веб-камер


Одно фото. Один клик. Никакого обучения, никаких датасетов.

Deep-Live-Cam уже стал #1 репозиторием дня на GitHub.

Видеозвонк теперь не даёт гарантий, что ты видишь того, кем кажется собеседник.

https://github.com/hacksider/Deep-Live-Cam

🐍 Python полезные ресурсы 🚀Max

@pythonl
😔 GitHub меняет политику — теперь ваши данные из Copilot будут использоваться для обучения ИИ по умолчанию

Речь не о репозиториях напрямую, а о взаимодействии с Copilot:
-ваши промпты
-ответы Copilot
-куски кода
-контекст (что открыто в редакторе и т.п.)


Так что, не забудьте отключить
🚽

https://www.theregister.com/2026/03/26/github_ai_training_policy_changes/

Подписаться
Please open Telegram to view this post
VIEW IN TELEGRAM