This media is not supported in your browser
VIEW IN TELEGRAM
В сети появилось видео с новой версией программы Gemini для компьютеров Mac
Главное изменение заключается в том, что искусственный интеллект теперь может напрямую работать с файлами на вашем жестком диске. Программа умеет читать документы в указанных папках, находить там информацию и вносить правки по запросу пользователя.
В приложении также заявлена функция анализа происходящего на экране в реальном времени
Надеюсь также пофиксят баг, когда приложение само по себе закрывается
Главное изменение заключается в том, что искусственный интеллект теперь может напрямую работать с файлами на вашем жестком диске. Программа умеет читать документы в указанных папках, находить там информацию и вносить правки по запросу пользователя.
В приложении также заявлена функция анализа происходящего на экране в реальном времени
Надеюсь также пофиксят баг, когда приложение само по себе закрывается
🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Исследователи из компании Calif продемонстрировали успешный взлом ядра macOS на устройствах с процессорами Apple M5
В ходе работы был обойден аппаратный механизм Memory Integrity Enforcement, который основан на технологии ARM MTE. Эта система внедрялась как основная функция безопасности чипов M5 и A19, предназначенная для защиты от класса уязвимостей, использующих повреждение памяти
Разработка рабочего эксплойта заняла у специалистов пять дней, для чего применялся инструмент Mythos Preview. Представители Calif лично передали подробный отчет об уязвимости в главный офис Apple
Публикация технических деталей ожидается только после того, как компания выпустит соответствующее обновление операционной системы для устранения данной проблемы
На видео демонстрируется сам процесс взлома
Источники:
https://x.com/intcyberdigest/status/2055281844816384262?s=46
https://blog.calif.io/p/first-public-kernel-memory-corruption
В ходе работы был обойден аппаратный механизм Memory Integrity Enforcement, который основан на технологии ARM MTE. Эта система внедрялась как основная функция безопасности чипов M5 и A19, предназначенная для защиты от класса уязвимостей, использующих повреждение памяти
Разработка рабочего эксплойта заняла у специалистов пять дней, для чего применялся инструмент Mythos Preview. Представители Calif лично передали подробный отчет об уязвимости в главный офис Apple
Публикация технических деталей ожидается только после того, как компания выпустит соответствующее обновление операционной системы для устранения данной проблемы
На видео демонстрируется сам процесс взлома
Источники:
https://x.com/intcyberdigest/status/2055281844816384262?s=46
https://blog.calif.io/p/first-public-kernel-memory-corruption
😱3👌1
This media is not supported in your browser
VIEW IN TELEGRAM
У Gemini новый дизайн в iOS приложении, на маке тоже завезли 🔥
Также добавили модели и уровень рассуждения
Также добавили модели и уровень рассуждения
🔥2
Media is too big
VIEW IN TELEGRAM
Tongyi Lab выпустил Qwen3.5-LiveTranslate, модель для синхронного перевода речи в реальном времени с клонированием голоса спикера (у GPT-realtime такого нету 👀)
Поддерживается понимание и текстовый вывод на 60 языках, голосовой вывод на 29. Заявлено более 3500 языковых пар с минимальной задержкой
Функция Visual Grounding позволяет модели использовать визуальный контекст с экрана или камеры для повышения точности перевода
Hotword Customization дает возможность задать пользовательский словарь из брендов, имен и терминов, чтобы исключить их искажение при транскрипции
Модель уже доступна на omni.chat.ai, API анонсировано как скоро доступное через bailian.console.aliyun.com.
Поддерживается понимание и текстовый вывод на 60 языках, голосовой вывод на 29. Заявлено более 3500 языковых пар с минимальной задержкой
Функция Visual Grounding позволяет модели использовать визуальный контекст с экрана или камеры для повышения точности перевода
Hotword Customization дает возможность задать пользовательский словарь из брендов, имен и терминов, чтобы исключить их искажение при транскрипции
Модель уже доступна на omni.chat.ai, API анонсировано как скоро доступное через bailian.console.aliyun.com.
🔥4
Media is too big
VIEW IN TELEGRAM
Gemini Omni, новая видеомодель Google, генерирует образовательные ролики по запросу пользователь описывает тему, модель создает короткое видео с визуализацией, субтитрами и голосом
Ключевое отличие от существующих видеогенераторов, судя по утечкам и ранним тестам, это корректный рендеринг математических формул и уравнений прямо в видеоряде, что критично для образовательного контента. Ранние тесты также фиксировали стабильность сцен, синхронизацию голоса и возможность редактирования через чат-запрос
Модель анонсируется сегодня на Google I/O 2026. По структуре Omni позиционируется как единая мультимодальная система, которая работает с текстом, изображениями, видео и аудио нативно, в рамках одной модели
Ключевое отличие от существующих видеогенераторов, судя по утечкам и ранним тестам, это корректный рендеринг математических формул и уравнений прямо в видеоряде, что критично для образовательного контента. Ранние тесты также фиксировали стабильность сцен, синхронизацию голоса и возможность редактирования через чат-запрос
Модель анонсируется сегодня на Google I/O 2026. По структуре Omni позиционируется как единая мультимодальная система, которая работает с текстом, изображениями, видео и аудио нативно, в рамках одной модели
🔥4
This media is not supported in your browser
VIEW IN TELEGRAM
Когда запускаешь ИИ-агента, нужно самому писать логику цикла: вызовы инструментов, обработка ошибок, управление контекстом, стриминг событий
Claude Managed Agents берет это на себя вы описываете задачу и подключаете инструменты, Anthropic запускает агентный цикл на своей стороне
Сегодня добавили две вещи. Self-hosted sandboxes: сам агентный цикл остается у Anthropic, но выполнение инструментов переносится в вашу инфраструктуру или к провайдерам вроде Cloudflare, Daytona, Modal, Vercel.
MCP tunnels: агент обращается к внутренним базам, API и сервисам компании через зашифрованный туннель, без входящих правил файрвола и публичных эндпоинтов. Актуально для enterprise, где данные не должны покидать периметр. Self-hosted sandboxes уже в публичной бете, MCP tunnels пока в research preview
Почитать: https://claude.com/blog/claude-managed-agents-updates
Документация: https://platform.claude.com/docs/en/managed-agents/self-hosted-sandboxes
Claude Managed Agents берет это на себя вы описываете задачу и подключаете инструменты, Anthropic запускает агентный цикл на своей стороне
Сегодня добавили две вещи. Self-hosted sandboxes: сам агентный цикл остается у Anthropic, но выполнение инструментов переносится в вашу инфраструктуру или к провайдерам вроде Cloudflare, Daytona, Modal, Vercel.
MCP tunnels: агент обращается к внутренним базам, API и сервисам компании через зашифрованный туннель, без входящих правил файрвола и публичных эндпоинтов. Актуально для enterprise, где данные не должны покидать периметр. Self-hosted sandboxes уже в публичной бете, MCP tunnels пока в research preview
Почитать: https://claude.com/blog/claude-managed-agents-updates
Документация: https://platform.claude.com/docs/en/managed-agents/self-hosted-sandboxes
🔥2
Thariq, инженер команды Claude Code в Anthropic, опубликовал промпт, который регулярно применяет при работе с ИИ агентами
Шаблон выглядит так:
Идея в том, что любая спецификация содержит неоднозначности, и вместо того чтобы модель молча делала допущения, она ведет живой лог своих решений. В уточненной версии промпта лог разбивается на четыре категории: дизайн-решения при неоднозначностях в спеке, намеренные отклонения с обоснованием, рассмотренные альтернативы, открытые вопросы для ревью
Шаблон выглядит так:
Implement <SPEC> and while you do, keep a running implementation-notes.html file with decisions you had to make that weren’t in the spec, things you had to change, tradeoffs you had to make or anything else I should know.
Идея в том, что любая спецификация содержит неоднозначности, и вместо того чтобы модель молча делала допущения, она ведет живой лог своих решений. В уточненной версии промпта лог разбивается на четыре категории: дизайн-решения при неоднозначностях в спеке, намеренные отклонения с обоснованием, рассмотренные альтернативы, открытые вопросы для ревью
❤4
Google I/O 2026 прошел 19 мая кейнот занял около двух часов и охватил модели, агентов, переработку всех основных приложений и железо
По моделям: Gemini 3.5 Flash становится новым флагманом, по заявлению Google быстрее 3.1 Pro в четыре раза и сильнее на агентских задачах. Gemini 3.5 Pro выйдет в следующем месяце
Gemini Omni мультимодальная модель с редактированием видео через текст, уже доступна в Gemini App и бесплатно в YouTube Shorts
По агентам: Gemini Spark персональный агент, который выполняет задачи в приложениях в фоне. Daily Brief собирает утренний дайджест из Gmail, календаря и задач. Information Agents мониторят веб по заданным темам без участия пользователя. Android Halo живая полоска на экране Android, показывает что агент делает в реальном времени
По приложениям: Gmail Live и Docs Live добавляют голосовое управление почтой и документами.
Google Keep превращает свободную речь в структурированные заметки (далее в комментариях)
По моделям: Gemini 3.5 Flash становится новым флагманом, по заявлению Google быстрее 3.1 Pro в четыре раза и сильнее на агентских задачах. Gemini 3.5 Pro выйдет в следующем месяце
Gemini Omni мультимодальная модель с редактированием видео через текст, уже доступна в Gemini App и бесплатно в YouTube Shorts
По агентам: Gemini Spark персональный агент, который выполняет задачи в приложениях в фоне. Daily Brief собирает утренний дайджест из Gmail, календаря и задач. Information Agents мониторят веб по заданным темам без участия пользователя. Android Halo живая полоска на экране Android, показывает что агент делает в реальном времени
По приложениям: Gmail Live и Docs Live добавляют голосовое управление почтой и документами.
Google Keep превращает свободную речь в структурированные заметки (далее в комментариях)
❤2
Media is too big
VIEW IN TELEGRAM
На конференции Google I/O продемонстрирован алгоритм взаимодействия с операционной системой macOS через Gemini
В рамках презентации был показан процесс создания электронного письма на основе нескольких разрозненных файлов. Пользователь выделил в папке фотографии и PDF-справки, а затем голосом поставил задачу написать письмо и собрать данные в таблицу. ИИ распознал информацию с изображений и текст из документов, после чего сгенерировал готовое сообщение с таблицей в почтовом клиенте.
Это пример использования мультимодальности для обработки файлов разных форматов без необходимости переключаться между окнами.
В рамках презентации был показан процесс создания электронного письма на основе нескольких разрозненных файлов. Пользователь выделил в папке фотографии и PDF-справки, а затем голосом поставил задачу написать письмо и собрать данные в таблицу. ИИ распознал информацию с изображений и текст из документов, после чего сгенерировал готовое сообщение с таблицей в почтовом клиенте.
Это пример использования мультимодальности для обработки файлов разных форматов без необходимости переключаться между окнами.
🔥3
Google на I/O 2026 выпустил Antigravity 2.0 отдельное десктопное приложение, построенное вокруг оркестрации ИИ агентов, без привязки к IDE
Несколько агентов запускаются параллельно через динамические subagent-воркфлоу, фоновые задачи планируются по расписанию, поддерживаются нативные голосовые команды. Движок, Gemini 3.5 Flash, по заявлению Google работает в четыре раза быстрее конкурирующих frontier-моделей и превосходит Gemini 3.1 Pro на кодинговых бенчмарках
В экосистему вошли также Antigravity CLI (полная замена Gemini CLI, написан на Go), Antigravity SDK для кастомных агентов и Managed Agents в Gemini API с персистентным Linux-окружением
Gemini CLI и расширения Code Assist отключат для всех пользователей 18 июня 2026 года. Новый план AI Ultra стоит $100 в месяц (5x лимиты против Pro), топовый снизился с $250 до $200 (20x лимиты)
Почитать: https://antigravity.google/blog/introducing-google-antigravity-2-0
Несколько агентов запускаются параллельно через динамические subagent-воркфлоу, фоновые задачи планируются по расписанию, поддерживаются нативные голосовые команды. Движок, Gemini 3.5 Flash, по заявлению Google работает в четыре раза быстрее конкурирующих frontier-моделей и превосходит Gemini 3.1 Pro на кодинговых бенчмарках
В экосистему вошли также Antigravity CLI (полная замена Gemini CLI, написан на Go), Antigravity SDK для кастомных агентов и Managed Agents в Gemini API с персистентным Linux-окружением
Gemini CLI и расширения Code Assist отключат для всех пользователей 18 июня 2026 года. Новый план AI Ultra стоит $100 в месяц (5x лимиты против Pro), топовый снизился с $250 до $200 (20x лимиты)
Почитать: https://antigravity.google/blog/introducing-google-antigravity-2-0
❤3
Media is too big
VIEW IN TELEGRAM
Google на I/O 2026 анонсировал Gemini Omni новую модель для генерации и редактирования видео, встроенную напрямую в Gemini
Заявленная долгосрочная цель, по словам Демиса Хасабиса, генерировать любой тип контента из любого входа; первый шаг видео. Например модель, берет видео как вход и позволяет редактировать его в чате: менять персонажей, фоны, убирать объекты текстовыми командами. Также у него нативная мультимодальность: на вход принимаются текст, аудио, изображения и видео одновременно, выход единый по стилю
По первым тестам качество сырой генерации уступает Seedance 2 от ByteDance, но редактирование работает заметно лучше конкурентов. Omni позиционируется как агент, аналогично Deep Research в AI Studio, и будет доступен через API.
Первая версия, Omni Flash, уже доступна подписчикам AI Plus, Pro и Ultra в Gemini App, Google Flow и Google Flow Music. В YouTube Shorts и YouTube Create доступ бесплатный без подписки
Заявленная долгосрочная цель, по словам Демиса Хасабиса, генерировать любой тип контента из любого входа; первый шаг видео. Например модель, берет видео как вход и позволяет редактировать его в чате: менять персонажей, фоны, убирать объекты текстовыми командами. Также у него нативная мультимодальность: на вход принимаются текст, аудио, изображения и видео одновременно, выход единый по стилю
По первым тестам качество сырой генерации уступает Seedance 2 от ByteDance, но редактирование работает заметно лучше конкурентов. Omni позиционируется как агент, аналогично Deep Research в AI Studio, и будет доступен через API.
Первая версия, Omni Flash, уже доступна подписчикам AI Plus, Pro и Ultra в Gemini App, Google Flow и Google Flow Music. В YouTube Shorts и YouTube Create доступ бесплатный без подписки
❤3
Это самое интересное
Google выпустил ИИ-функцию, которая меняет то, как мы все используем YouTube. Она называется Ask YouTube. Теперь вместо того, чтобы смотреть видео целиком, вы просто задаете вопрос о том, что именно вы хотите найти на YouTube, и он найдет нужное видео и точный момент в нем, который вы ищете 🔥
Google выпустил ИИ-функцию, которая меняет то, как мы все используем YouTube. Она называется Ask YouTube. Теперь вместо того, чтобы смотреть видео целиком, вы просто задаете вопрос о том, что именно вы хотите найти на YouTube, и он найдет нужное видео и точный момент в нем, который вы ищете 🔥
🔥9👎1
Разработчики ИИ консультируются с философами и теологами для настройки нейросетей. Anthropic привлекла специалистов по этике из 15 традиций для изучения формирования характера. Цель не навязывание идеологии, а поиск устойчивых ориентиров. Модели дали «внешнюю совесть» для проверки ответов перед генерацией, что снизило нарушения безопасности.
Anthropic опубликовала отчет о новых этических принципах. Проведены консультации с философами, учеными и представителями культур для интеграции моральных ориентиров без идеологического уклона.
Результат внедрение механизма «внешней совести». Алгоритм перед задачами обращается к нему для оценки конфликтов интересов. Пауза на размышление снизила количество ответов, нарушающих протоколы. К исследованию планируют привлечь юристов, психологов и социологов.
https://www.anthropic.com/news/widening-conversation-ai
Anthropic опубликовала отчет о новых этических принципах. Проведены консультации с философами, учеными и представителями культур для интеграции моральных ориентиров без идеологического уклона.
Результат внедрение механизма «внешней совести». Алгоритм перед задачами обращается к нему для оценки конфликтов интересов. Пауза на размышление снизила количество ответов, нарушающих протоколы. К исследованию планируют привлечь юристов, психологов и социологов.
https://www.anthropic.com/news/widening-conversation-ai
🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
Google анонсировал мобильное приложение AI Studio на I/O 2026. Инструмент, который раньше работал только в браузере, скоро появится в App Store и Google Play
Параллельно Google запустил возможность генерировать нативные Android-приложения из текстового промпта прямо в браузере, без установки SDK или настройки среды разработки
https://aistudio.google.com/mobile
Параллельно Google запустил возможность генерировать нативные Android-приложения из текстового промпта прямо в браузере, без установки SDK или настройки среды разработки
https://aistudio.google.com/mobile
🔥3😢1
This media is not supported in your browser
VIEW IN TELEGRAM
Вот пример 3 правок видео с новой моделью Google, Omni:
1. оригинал
2. сделать её невидимой, надеть на неё перчатки
3. пока она говорит, двое мужчин приходят и уносят картину в рамке
4. изменить её наряд
1. оригинал
2. сделать её невидимой, надеть на неё перчатки
3. пока она говорит, двое мужчин приходят и уносят картину в рамке
4. изменить её наряд
🔥5❤1
Репозиторий от HuggingFace.
Agent Skill инструкция + набор скриптов, которую ты отдаёшь агенту (Claude Code и/или другому агенту). Он читает исходный код архитектуры из transformers, сам переписывает его под MLX, прогоняет тесты и готовит PR. Человек только проверяет результат
Если захочешь запустить какую-то модель локально на М чипе, а она ещё не портирована в mlx-lm вот инструмент чтобы это сделать
https://github.com/huggingface/transformers-to-mlx
Agent Skill инструкция + набор скриптов, которую ты отдаёшь агенту (Claude Code и/или другому агенту). Он читает исходный код архитектуры из transformers, сам переписывает его под MLX, прогоняет тесты и готовит PR. Человек только проверяет результат
Если захочешь запустить какую-то модель локально на М чипе, а она ещё не портирована в mlx-lm вот инструмент чтобы это сделать
https://github.com/huggingface/transformers-to-mlx
🔥2
Официально поддерживает казахский и русский 🔥🔥🔥
Tencent выпустил Hy-MT2, семейство открытых моделей для машинного перевода в трёх размерах: 1.8B, 7B и 30B-A3B.
Все три поддерживают 33 языка, в том числе казахский, русский. Версия 1.8B сжата до 440 МБ с помощью квантизации AngelSlim до 1.25 бит и рассчитана на запуск локально на мобильных чипах
По результатам бенчмарков WMT25 модели 7B и 30B-A3B превзошли DeepSeek-V4-Pro и Kimi K2.6 на переводческих задачах, а 1.8B обошла ряд коммерческих API. Вместе с моделями опубликован IFMTBench, бенчмарк для оценки следования инструкциям при переводе. Веса доступны на Hugging Face в форматах GGUF, FP8 и 1.25-bit GGUF.
GitHub: https://github.com/Tencent-Hunyuan/Hy-MT2
ModelScope: https://modelscope.cn/collections/Tencent-Hunyuan/Hy-MT2
Hugging Face: https://huggingface.co/collections/tencent/hy-mt2
Tencent выпустил Hy-MT2, семейство открытых моделей для машинного перевода в трёх размерах: 1.8B, 7B и 30B-A3B.
Все три поддерживают 33 языка, в том числе казахский, русский. Версия 1.8B сжата до 440 МБ с помощью квантизации AngelSlim до 1.25 бит и рассчитана на запуск локально на мобильных чипах
По результатам бенчмарков WMT25 модели 7B и 30B-A3B превзошли DeepSeek-V4-Pro и Kimi K2.6 на переводческих задачах, а 1.8B обошла ряд коммерческих API. Вместе с моделями опубликован IFMTBench, бенчмарк для оценки следования инструкциям при переводе. Веса доступны на Hugging Face в форматах GGUF, FP8 и 1.25-bit GGUF.
GitHub: https://github.com/Tencent-Hunyuan/Hy-MT2
ModelScope: https://modelscope.cn/collections/Tencent-Hunyuan/Hy-MT2
Hugging Face: https://huggingface.co/collections/tencent/hy-mt2
🔥6❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Статичная инфографика превращается в анимированное видео одним промптом. Пользователь загрузил картинку в Gemini и попросил расставить анимацию элементов в нужном порядке, модель сама интерпретировала структуру изображения и сгенерировала видео. Твит с результатом набрал 61 тыс. просмотров за сутки.
Промпт: «Сделай из этого изображения профессиональную анимацию с направлением взгляда зрителя. Основные элементы должны появляться в порядке: заголовок, визуал, дополнение, CTA. Движение должно быть элегантным и ритмичным, с естественным завершением.»
❤2
Alibaba выпустила Qwen3.7-Max, для агентных сценариев
Ключевой эксперимент команды: в режиме автономного запуска модель 35 часов оптимизировала CUDA-ядро Extend Attention, совершив 1158 вызовов инструментов и 432 итерации компиляции, без участия человека, и достигла ускорения в 10x относительно базового Triton-ядра.
На агентных бенчмарках Terminal-Bench (69.7), MCP-Atlas (76.4), SWE-bench Multilingual (78.3) модель занимает первое место среди протестированных
На CoWorkBench результат 67.2 против 68.2 у Claude Opus 4.6 Max. Модель доступна через API Alibaba Model Studio и Qwen Studio
Почитать: https://qwen.ai/blog?id=qwen3.7
Демо: https://chat.qwen.ai
Ключевой эксперимент команды: в режиме автономного запуска модель 35 часов оптимизировала CUDA-ядро Extend Attention, совершив 1158 вызовов инструментов и 432 итерации компиляции, без участия человека, и достигла ускорения в 10x относительно базового Triton-ядра.
На агентных бенчмарках Terminal-Bench (69.7), MCP-Atlas (76.4), SWE-bench Multilingual (78.3) модель занимает первое место среди протестированных
На CoWorkBench результат 67.2 против 68.2 у Claude Opus 4.6 Max. Модель доступна через API Alibaba Model Studio и Qwen Studio
Почитать: https://qwen.ai/blog?id=qwen3.7
Демо: https://chat.qwen.ai
🔥3