Машинное обучение digest
62 subscribers
2.86K photos
465 videos
1.74K links
Download Telegram
Zhilin Yang (один из авторов архитектуры Transformer-XL) на GTC представил концепцию Attention Residuals

Главная идея внимания - это не запоминать всё подряд, а выбирать, что действительно важно.

Многие читали работу Attention Is All You Need (2017) - именно она привнесла в модели механизм "человеческого" внимания. С этого момента модели перестали просто механически обрабатывать весь текст. Вместо этого они начали различать, что важнее, а что нет, и сохранять более значимую информацию.

Недавно Китайцы из Kimi пошли дальше и применили внимание к временной оси, а затем "повернули" его в глубину модели.

Теперь внимание работает не только по времени, но и через слои модели - по мере передачи информации.

Это даёт более умный способ обработки:
модель не просто читает и передаёт данные дальше, а осмысленно отслеживает важное на каждом этапе вычислений.

https://x.com/Kimi_Moonshot/status/2037010118957817988
В Claude Code уже 93 команды.

Но чтобы получить 80% пользы, тебе хватит вот этих 16 👇

/init
→ создаёт CLAUDE.md - память проекта и репозитория

/plan
→ сначала думает, потом пишет код

/context
→ показывает, что именно съедает твои токены

/compact
→ очищает контекст прямо в середине сессии

/clear
→ сбрасывает состояние между задачами

/model
→ переключает модели: Opus / Sonnet / Haiku

/btw
→ позволяет задать побочный вопрос, не ломая основной поток работы

/rewind
→ откатывает назад, если всё пошло не туда

/agents
→ запускает несколько суб-агентов параллельно

/chrome
→ управляет браузером: клик, ввод, навигация

/loop
→ прогоняет промпты по кругу, удобно для мониторинга

/simplify
→ 3 агента вместе ревьюят твой код

/permissions
→ заранее разрешает безопасные действия

--dangerously-skip-permissions
→ полностью автоматический режим, без лишних подтверждений

Shift + Tab
→ мгновенное переключение режимов

ultra think
→ максимальная глубина рассуждения

Большинство используют Claude Code как обычный чат-бот.

Поэтому и упираются в потолок.

Продвинутые пользователи работают с ним как с целой системой.
🌟 Релиз LongCat-Next

Модель объединяет текст, изображения и аудио в одну систему и работает по тому же принципу next-token prediction, но уже не только для текста.

Что внутри:
• 68.5B параметров (3B активных, MoE)
• единая модель для “видит - рисует - говорит”

dNaViT 0 визуальный трансформер, который кодирует изображения в дискретные токены
→ работает с любым разрешением
→ совмещает генерацию и понимание (раньше это был компромисс)

Paper: https://github.com/meituan-longcat/LongCat-Next/blob/main/tech_report.pdf
GitHub: https://github.com/meituan-longcat/LongCat-Next
HuggingFace: https://huggingface.co/meituan-longcat/LongCat-Next
Demo: https://longcat.chat/longcat-next
Blog: https://longcat.chat/longcat-next/intro
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
В Claude Code уже 93 команды.

Но чтобы получить 80% пользы, тебе хватит вот этих 16 👇

/init
→ создаёт CLAUDE.md - память проекта и репозитория

/plan
→ сначала думает, потом пишет код

/context
→ показывает, что именно съедает твои токены

/compact
→ очищает контекст прямо в середине сессии

/clear
→ сбрасывает состояние между задачами

/model
→ переключает модели: Opus / Sonnet / Haiku

/btw
→ позволяет задать побочный вопрос, не ломая основной поток работы

/rewind
→ откатывает назад, если всё пошло не туда

/agents
→ запускает несколько суб-агентов параллельно

/chrome
→ управляет браузером: клик, ввод, навигация

/loop
→ прогоняет промпты по кругу, удобно для мониторинга

/simplify
→ 3 агента вместе ревьюят твой код

/permissions
→ заранее разрешает безопасные действия

--dangerously-skip-permissions
→ полностью автоматический режим, без лишних подтверждений

Shift + Tab
→ мгновенное переключение режимов

ultra think
→ максимальная глубина рассуждения

Большинство используют Claude Code как обычный чат-бот.

Поэтому и упираются в потолок.

Продвинутые пользователи работают с ним как с целой системой.
💻 Claude Computer - полезная шпаргалка

Как включить:

1. Платная подписка + десктопное приложение + приложение на телефоне
2. Соедини через Dispatch (слева)
3. В настройках включи Computer use

Примеры работы:

✦ Найти фрилансера
Промпт:
Открой мой Fiverr в Chrome.
Опубликуй задачу на [задача].
Напиши 10 лучшим специалистам.
Проверь входящие и доведи до сделки
до бюджета [бюджет]


✦ Найти вирусную рекламу
Промпт:
Открой Meta Ads Library
Найди свежие вирусные объявления по теме [тема] в [страна]
Собери Google Sheets с 50+ ссылками

✦ Массовый отклик на вакансии
Промпт:
Открой сайты с вакансиями
Проанализируй мой CV
И откликнись на подходящие вакансии


Claude Computer - мощный и простой в настройке исполнитель задач
✔️ Google установила 2029 год дедлайном для перехода на постквантовую криптографию.

Ускорение миграции продиктовано темпами развития квантового оборудования и коррекции ошибок. Появление систем, способных взломать современные стандарты шифрования, произойдет быстрее, чем ожидалось.

Особую тревогу вызывают атаки «сохрани сейчас, расшифруй потом» и грядущая уязвимость традиционных цифровых подписей. Google скорректировала модель угроз, сделав приоритетом защиту сервисов аутентификации до появления криптографически значимых квантовых компьютеров.

Google уже интегрирует постквантовые подписи на базе ML-DSA (одобренного NIST) в Android 17, дополняя механизмы, развернутые в Chrome и Google Cloud.

blog.google
Please open Telegram to view this post
VIEW IN TELEGRAM
🚀 Docker сборка: ускорение с 3 минут → до 20 секунд

Маленькое изменение, которое даёт огромный буст 👇

При работе с Docker была проблема:
даже небольшое изменение кода запускало полную пересборку образа.

Причина - Docker Layer Caching

Каждая инструкция в Dockerfile создаёт слой.
Если слой не изменился - Docker берёт его из кэша.

💡 Ошибка:

Копировал весь код до установки зависимостей

В итоге:
любое изменение кода → ломает кэш →
зависимости устанавливаются заново каждый раз

🔧 Фикс:

Сначала копируй файлы зависимостей
Устанавливай зависимости (кэшируется)
Только потом копируй основной код

📉 Результат:

Сборка:
~3 минуты → ~20 секунд

Пересобираются только изменённые слои
Остальное берётся из кэша

💡 Почему это важно:

В CI/CD:
- медленные билды = медленные деплои
- лишние пересборки = лишние деньги

Маленькое изменение в Dockerfile
→ огромный эффект в реальных проектах
This media is not supported in your browser
VIEW IN TELEGRAM
Находим удаленку МЕЧТЫ уже в 2026 году и получаем отличную зарплату — нашли сайт Remotejobs, на котором собрали предложения МИРОВОГО уровня от крупных бигтехов и небольших контор.

• Да, там можно найти работу даже от Netflix, LinkedIn, Airbnb, Pinterest и других топовых компаний.
• Все вакансии отсортированы по уровню: от джуна до сеньора.
• Специальностей — десятки: SMM, дизайн, кодинг, ML, райтинг, продажи и прочее.
• При этом вакансии точно АКТУАЛЬНЫЕ — авторы постоянно отслеживают статус, проверяют компании, которые размещаются на сайте, и собирают только проверенную инфу.

😶😶😶😶😶😶😶😶😶

Работу мечты в 2026 году ищем — тут.

👍 Бэкдор
Please open Telegram to view this post
VIEW IN TELEGRAM
💻 Kubernetes безопасность - это не одна настройка

Это слои защиты

Можно представить как кольца, которые защищают кластер

5 ключевых уровней:

• API Server Access
контроль доступа к кластеру

• Workload Security
безопасность pod и контейнеров

• Network Security
контроль сетевого взаимодействия

• Image Security
проверка и доверие к образам

• Runtime Security
мониторинг поведения в рантайме

Главая ошибка:

Многие защищают только «снаружи»
и игнорируют то, что происходит внутри кластера

Если один pod скомпрометирован
→ без ограничений он может пойти дальше по кластеру


Безопасность Kubernetes = это система слоёв
А не одна настройка


Разбор всех уровней:
https://devopscube.com/cks-exam-guide-tips/
Please open Telegram to view this post
VIEW IN TELEGRAM
Google спасёт нас от дефицита ОЗУ — компания добра внезапно нашла решения кризиса.

Они выпустили алгоритм сжатия для LLM-моделей TurboQuant: он уменьшает необходимые ресурсы для KV cache — это такая память нейросети, которая позволяет помнить каждый предыдущий токен (слово) во время генерации ответа.

Результаты потрясающие: требования к памяти с алгоритмом снижаются в 6 раз, а скорость работы — увеличивается на 8 раз, при этом без потери в точности.

Инвесторы новость оценили и побежали сливать акции производителей памяти — Micron, SK Hynix.

@exploitex
Google спасёт нас от дефицита ОЗУ — компания добра внезапно нашла решения кризиса.

Они выпустили алгоритм сжатия для LLM-моделей TurboQuant: он уменьшает необходимые ресурсы для KV cache — это такая память нейросети, которая позволяет помнить каждый предыдущий токен (слово) во время генерации ответа.

Результаты потрясающие: требования к памяти с алгоритмом снижаются в 6 раз, а скорость работы — увеличивается на 8 раз, при этом без потери в точности.

Инвесторы новость оценили и побежали сливать акции производителей памяти — Micron, SK Hynix.

@exploitex
This media is not supported in your browser
VIEW IN TELEGRAM
✔️ DeepMind сделала браузер-генератор сайтов на Gemini 3.1 Flash-Lite.

Концепт, который работает внутри AI Studio, пишет HTML и CSS прямо в процессе серфинга вместо загрузки готовых страниц с серверов. Внешний вид и контент формируются на основе промптов, кликов и контекста навигации.

Технология органично вписывается в концепцию автономных ИИ-агентов, которым может понадобиться быстро собрать временный дашборд или вспомогательный инструмент для текущей задачи.

До идеала еще очень далеко. Поскольку верстка и контент полностью генерируются на не лучшей версии Gemini, браузер уязвим, склонен немного галлюцинировать, искажать стили и тратит прорву токенов на инференс.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🌟 Claude Code Game Studios: 48 ИИ-агентов как полноценная игровая студия.

Соло-разработчик с доступом к Claude Code теперь может развернуть целую гейм-дев студию с креативным директором, лидами отделов и профильными специалистами.

В основу геймдизайнерских подходов заложены MDA Framework, теория самодетерминации и проектирование состояния потока.

Claude Code Game Studios - шаблон для Claude Code, который организует ИИ-сессию в трёхуровневую иерархию из 48 специализированных агентов.

На вершине 3 директора (креативный, технический и продюсер), работающие на модели Opus.


Уровнем ниже 8 руководителей отделов на Sonnet: геймдизайнер, ведущий программист, арт-директор, директор по звуку, нарративный директор и другие.


Третий уровень - специалисты на Sonnet и Haiku: от геймплэй-программиста и дизайнера экономики до DevOps-инженера и специалиста по доступности.


Агенты взаимодействуют по четкому протоколу: вертикальная делегация задач сверху вниз, горизонтальные консультации между агентами одного уровня, эскалация конфликтов к общему руководителю.

Каждый агент работает строго в границах своего домена и не модифицирует чужие файлы без явного поручения.

Помимо агентов, шаблон включает 37 команд, покрывающих весь цикл разработки: планирование спринтов, ревью кода и дизайна, аудит ассетов, генерацию идей, подготовку к релизу.

Отдельная категория - командные воркфлоу, которые координируют работу нескольких агентов над конкретной фичей: боевой системой, нарративом, интерфейсом или звуком.

Параллельно работают 8 хуков, привязанных к событиям git и жизненному циклу сессии. Они срабатывают автоматически: валидируют коммиты на захардкоженные значения и корректность данных, предупреждают о пушах в защищённые ветки, подгружают контекст текущего спринта при старте и фиксируют результаты при завершении.

Ещё один слой - 11 правил, привязанных к путям в проекте. Они применяются при редактировании файлов в соответствующих директориях и задают стандарты для каждой зоны кодовой базы.

🟡Это не автопилот.

Агенты задают вопросы, предлагают несколько вариантов с плюсами и минусами, показывают черновик. Но финальное решение всегда за человеком, ничего не фиксируется без его одобрения.

🟡Шаблон работает с Godot 4, Unity и Unreal Engine 5.

Для каждого предусмотрен свой лид-агент с набором суб-специалистов: у Godot это GDScript, шейдеры и GDExtension, у Unity - DOTS/ECS, VFX и UI Toolkit, у Unreal - GAS, Blueprints и Replication.

Проект открыт к кастомизации: агентов можно добавлять и удалять, промпты редактировать, хуки - перенастраивать.


📌Лицензирование: MIT License.


🖥GitHub


@ai_machinelearning_big_data

#AI #ML #Vibecoding #Gamedev #Claude
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Deep-Live-Cam 2.1 — бесплатный open-source инструмент, который в реальном времени меняет лицо на любой веб-камер


Одно фото. Один клик. Никакого обучения, никаких датасетов.

Deep-Live-Cam уже стал #1 репозиторием дня на GitHub.

Видеозвонк теперь не даёт гарантий, что ты видишь того, кем кажется собеседник.

https://github.com/hacksider/Deep-Live-Cam

🐍 Python полезные ресурсы 🚀Max

@pythonl
😔 GitHub меняет политику — теперь ваши данные из Copilot будут использоваться для обучения ИИ по умолчанию

Речь не о репозиториях напрямую, а о взаимодействии с Copilot:
-ваши промпты
-ответы Copilot
-куски кода
-контекст (что открыто в редакторе и т.п.)


Так что, не забудьте отключить
🚽

https://www.theregister.com/2026/03/26/github_ai_training_policy_changes/

Подписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Цукерберг сможет читать ваши мысли — ну почти 😐

Meta* (запрещенная организация в РФ) выкатила открытую модель TRIBE v2, которая предсказывает, как мозг реагирует на картинки, звуки, рекламу и запреты.

Обучили ее на 700+ людях — и этого оказалось достаточно, чтобы построить «цифрового двойника» нейронной активности и угадывать реакции даже для новых людей без дообучения и сканирования. Причём точность выросла в 2–3 раза по сравнению другими методами.

Фактически получился продвинутый симулятор мозга: можно гонять эксперименты без людей и смотреть, как они бы отреагировали на какое-то событие.

На сайте, кстати, можно изучить 3D-модель и почитать про отдельные области мозга 🤓
Please open Telegram to view this post
VIEW IN TELEGRAM
🚨 Суд разнёс дело Пентагона против Anthropic. Причём жёстко и по всем фронтам.

История выглядела так
Пентагон попытался внести Anthropic в список рисков для цепочки поставок
Причина - компания критиковала их позицию по использованию Claude

В суде это быстро развалилось

Судья прямо назвал происходящее
«классическим незаконным преследованием за свободу слова»

Аргументы Пентагона звучали странно
- Anthropic «проявляет подрывные тенденции»
- потому что «задаёт вопросы» и «выражает сомнения»


Судья это назвал одним словом
орвеллианщина
.

Далее Пентагон заявил, что Anthropic может «удалённо саботировать Claude»
Судья спросил - как именно


Выяснилось
Anthropic вообще не имеет доступа к системе после её развёртывания в закрытых средах

Юрист Пентагона в этот момент
«Я не знал об этом»

Когда его спросили, на каком основании компанию внесли в blacklist
ответ был
«Я не знаю»


Был ли у главы ведомства полномочия? - нет

Это отражает официальную позицию? - нет

Зачем тогда это было сказано? - «Я не знаю»


Отдельный момент - внутренние письма
В одном документе Anthropic называют «угрозой нацбезопасности».

На следующий день - дружелюбная переписка в духе «мы почти договорились»

Судья
«Сложно совместить эти вещи»


Финал почти комичный

Пентагон попросил суд назначить залог
Судья поставил $100
.

По сути - «закрывайте это и идите отсюда»

Суд увидел вероятные нарушения сразу по трём пунктам
• свобода слова
• надлежащая правовая процедура
• административное право

Anthropic выиграла дело!

Это сигнал рынку
даже в теме AI и госбезопасности правила всё ещё работают
Главные новости из мира ИИ

✔️ Google представила голосовую модель Gemini 3.1 Flash Live.



✔️ Mistral релизнула открытую text-to-speech модель Voxtral.



✔️ Cohere выпустила открытую ASR-модель.



✔️ Intel выводит на рынок видеокарты Arc Pro B70 и B65 с 32 ГБ памяти.



✔️ GitHub по умолчанию начнет использовать код пользователей Copilot для обучения ИИ.



#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🚨 У ANTHROPIC УТЁК САМЫЙ МОЩНЫЙ ИХ МОДЕЛЬ

Anthropic случайно оставила черновики блог-постов в публично доступном кэше данных. Их нашли исследователи кибербезопасности:

- новая модель под названием "Claude Mythos"
- также упоминается как "Capybara"
- это новый уровень моделей
- больше и умнее, чем Opus

Anthropic подтвердила, что это реально:

- «качественный скачок»
- «самая мощная модель, которую мы когда-либо создавали»
- «значительно лучше в программировании, логике и кибербезопасности»
- «сильно опережает любые другие AI-модели в кибер-возможностях»

И они сами этим обеспокоены:

- «это предвещает волну моделей, способных находить и эксплуатировать уязвимости гораздо быстрее, чем защитники успевают реагировать»

Это действительно серьёзная история.

https://m1astra-mythos.pages.dev/

🐍 полезные ресурсы 🚀Max

@data_analysis_ml