Команда LongCat представила LongCat-2.0 - полную модель, которая стоит за Owl Alpha на OpenRouter.
Это MoE-модель на 1.6T параметров, примерно с 48B активных параметров и контекстом до 1M токенов. Основной фокус - agentic coding и длинные задачи, где модели нужно не просто отвечать, а работать с репозиторием, терминалом, поиском и большим объёмом контекста.
В архитектуре есть несколько важных решений. LongCat Sparse Attention отвечает за эффективную работу с 1M-context. Zero-Compute Experts динамически активируют от 33B до 56B параметров на токен, не тратя вычисления на лишние эксперты. MOPD делит экспертизу на три группы: Agent, Reasoning и Interaction, а gate выбирает нужный маршрут под задачу.
По заявленным результатам модель выглядит сильной именно в агентных сценариях: 70.8 на Terminal-Bench 2.1, 59.5 на SWE-bench Pro, 77.3 на SWE-bench Multilingual, 73.2 на FORTE, 78.8 на RWSearch и 79.9 на BrowseComp.
Tech Blog: https://longcat.chat/blog/longcat-2.0/
Это MoE-модель на 1.6T параметров, примерно с 48B активных параметров и контекстом до 1M токенов. Основной фокус - agentic coding и длинные задачи, где модели нужно не просто отвечать, а работать с репозиторием, терминалом, поиском и большим объёмом контекста.
В архитектуре есть несколько важных решений. LongCat Sparse Attention отвечает за эффективную работу с 1M-context. Zero-Compute Experts динамически активируют от 33B до 56B параметров на токен, не тратя вычисления на лишние эксперты. MOPD делит экспертизу на три группы: Agent, Reasoning и Interaction, а gate выбирает нужный маршрут под задачу.
По заявленным результатам модель выглядит сильной именно в агентных сценариях: 70.8 на Terminal-Bench 2.1, 59.5 на SWE-bench Pro, 77.3 на SWE-bench Multilingual, 73.2 на FORTE, 78.8 на RWSearch и 79.9 на BrowseComp.
Tech Blog: https://longcat.chat/blog/longcat-2.0/
❤5👍2🔥2
Fable 5 может потребовать верификацию личности
* Новые строки из утечки приложения Claude намекают, что Fable 5 могут вынести в отдельную систему usage credits, с оплатой вне обычной подписки.
* В том же обновлении упоминается проверка личности: «Ваши кредиты будут добавлены после подтверждения вашей личности». Это появилось рядом с изменениями по кредитам для Fable 5, хотя Anthropic раньше говорила, что ID-проверки не связаны с Fable.
* Похоже, Fable 5 может выйти с верификацией личности, более строгим доступом и отдельной оплатой по использованию.
* Новые строки из утечки приложения Claude намекают, что Fable 5 могут вынести в отдельную систему usage credits, с оплатой вне обычной подписки.
* В том же обновлении упоминается проверка личности: «Ваши кредиты будут добавлены после подтверждения вашей личности». Это появилось рядом с изменениями по кредитам для Fable 5, хотя Anthropic раньше говорила, что ID-проверки не связаны с Fable.
* Похоже, Fable 5 может выйти с верификацией личности, более строгим доступом и отдельной оплатой по использованию.
❤8🥱4👍3🔥2💔2🤯1
Google выкатила два новых инструмента для генеративных медиа: Nano Banana 2 Lite для быстрых изображений и Gemini Omni Flash для видео и conversational editing.
Nano Banana 2 Lite - самая быстрая и дешёвая image-модель в линейке Nano Banana. Она рассчитана на high-throughput пайплайны, прототипирование и массовую генерацию, где важны скорость и цена. Google заявляет около 4 секунд на text-to-image и цену $0.034 за 1K image. При этом модель сохраняет нормальное следование промпту, стабильность персонажей и читаемый текст внутри изображения.
Gemini Omni Flash - модель для генерации и редактирования видео через текст, изображения и видео-референсы. Её можно использовать для natural language video editing, мультимодальных сцен, синхронизации текста с действием и быстрых итераций. Цена заявлена на уровне $0.10 за секунду видео, как у Veo 3.1 Fast.
Сначала Nano Banana 2 Lite быстро генерирует изображение, потом Omni Flash превращает его в видео. Через Interactions API можно сохранять историю сессии и делать до трёх последовательных правок.
Ограничения у Omni Flash пока есть: генерация до 10 секунд, audio references и scene extension в API ещё не поддерживаются, а длинные video references пока обрабатываются неидеально.
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni-flash-nano-banana-2-lite/
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤11👍3🔥3
⚡Выбирать железо для обучения и инференса моделей больше не нужно
Qwen, Whisper, Deepseek и другие нейросети уже готовы к работе на приватной инфраструктуре. Просто выбираете нужную модель и получаете готовый инференс-сервис в пару кликов в Selectel.
Каталог ИИ-моделей Selectel — удобный инструмент для работы с нейросетями, когда нужны безопасность и производительность.
Что вы получаете в пару кликов:
⚡Большой выбор моделей для ваших задач: для генерации текстов и кода, распознавания речи, создания контента и других.
⚡Производительность и гибкое масштабирование. Инференс-сервис развернут на современном железе с актуальными видеокартами и автоматически адаптируется при росте или снижении нагрузки.
⚡Прогнозируемая стоимость: платите за фактическое время потребления вычислительных ресурсов.
Начните работать с ИИ-моделями на выделенной инфраструктуре: https://slc.tl/i0hn1
Реклама. АО "Селектел". erid:2W5zFGqCmpM
Qwen, Whisper, Deepseek и другие нейросети уже готовы к работе на приватной инфраструктуре. Просто выбираете нужную модель и получаете готовый инференс-сервис в пару кликов в Selectel.
Каталог ИИ-моделей Selectel — удобный инструмент для работы с нейросетями, когда нужны безопасность и производительность.
Что вы получаете в пару кликов:
⚡Большой выбор моделей для ваших задач: для генерации текстов и кода, распознавания речи, создания контента и других.
⚡Производительность и гибкое масштабирование. Инференс-сервис развернут на современном железе с актуальными видеокартами и автоматически адаптируется при росте или снижении нагрузки.
⚡Прогнозируемая стоимость: платите за фактическое время потребления вычислительных ресурсов.
Начните работать с ИИ-моделями на выделенной инфраструктуре: https://slc.tl/i0hn1
Реклама. АО "Селектел". erid:2W5zFGqCmpM
🍌5❤2👍2
🔥 Tencent Hunyuan представила PhoneBuddy - агентный фреймворк для управления телефоном на базе Qwen3.5-4B.
Средняя производительность выше, чем у GPT-5.4 и Seed 2.0 Pro, но ниже, чем у Gemini 3.1 Pro.
На бенчмарке из 150 задач результаты выросли так:
SFT: 36.67%
Real-app RL: 40.67%
Hybrid RL: 45.33%
На AndroidWorld рост ещё заметнее:
60.3% → 83.2%
https://arxiv.org/abs/2606.23049
Средняя производительность выше, чем у GPT-5.4 и Seed 2.0 Pro, но ниже, чем у Gemini 3.1 Pro.
На бенчмарке из 150 задач результаты выросли так:
SFT: 36.67%
Real-app RL: 40.67%
Hybrid RL: 45.33%
На AndroidWorld рост ещё заметнее:
60.3% → 83.2%
https://arxiv.org/abs/2606.23049
❤8👍5🥰2
В продуктах VK появится нейропоиск Discovery AI — новый движок для поиска и рекомендаций на базе собственной LLM.
Технологию внедрят в Дзен, VK Видео и Медиапроекты Mail.
В отличие от привычных ИИ-помощников, этот движок не ищет по всему интернету, а копается только в контентной базе продуктов VK и учитывает интересы пользователя. Система может выдавать ответы быстрее чем за полсекунды и обрабатывать до 3 000 поисковых запросов в секунду.
https://habr.com/ru/companies/vk/articles/1054358/
Технологию внедрят в Дзен, VK Видео и Медиапроекты Mail.
В отличие от привычных ИИ-помощников, этот движок не ищет по всему интернету, а копается только в контентной базе продуктов VK и учитывает интересы пользователя. Система может выдавать ответы быстрее чем за полсекунды и обрабатывать до 3 000 поисковых запросов в секунду.
https://habr.com/ru/companies/vk/articles/1054358/
🤣22❤🔥6👍4🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Fable 5 снова вернулась в Claude
Модель снова доступна спустя почти три недели после отключения. Ограничения с Anthropic сняли: ранее их вводили из-за формулировки про «угрозу нацбезопасности».
До 7 июля Fable 5 можно использовать в подписках Pro, Team, Max и Premium Enterprise. На неё разрешено тратить до 50% недельных лимитов.
После 7 июля бесплатный доступ закончится, останется только оплата по токенам.
https://claude.ai/
Модель снова доступна спустя почти три недели после отключения. Ограничения с Anthropic сняли: ранее их вводили из-за формулировки про «угрозу нацбезопасности».
До 7 июля Fable 5 можно использовать в подписках Pro, Team, Max и Premium Enterprise. На неё разрешено тратить до 50% недельных лимитов.
После 7 июля бесплатный доступ закончится, останется только оплата по токенам.
https://claude.ai/
❤21👍4🔥2😐2👌1
This media is not supported in your browser
VIEW IN TELEGRAM
Займи слот ИТ-Пикником от Т-Банка
8 августа — время отложить ноутбуки и встретиться офлайн на ИТ-Пикнике от Т-Банка в музее-заповеднике «Коломенское». Вот сколько всего запланировано:
— научпоп-лекции;
— мастер-классы;
— дискуссии об ИИ и больших языковых моделях;
— доклады о кибербезопасности;
— примеры, как данные из логов становятся решениями;
— много музыки.
Бери с собой друзей, супругов и детей — каждый найдет себе что-то по душе.
Зарегистрироваться и узнать больше можно здесь
8 августа — время отложить ноутбуки и встретиться офлайн на ИТ-Пикнике от Т-Банка в музее-заповеднике «Коломенское». Вот сколько всего запланировано:
— научпоп-лекции;
— мастер-классы;
— дискуссии об ИИ и больших языковых моделях;
— доклады о кибербезопасности;
— примеры, как данные из логов становятся решениями;
— много музыки.
Бери с собой друзей, супругов и детей — каждый найдет себе что-то по душе.
Зарегистрироваться и узнать больше можно здесь
❤7🥰3🔥2
Godot фактически запрещает vibe coding в контрибуциях.
Причина простая: PR стало легче генерировать, но не легче проверять. Для open-source движка каждый патч всё равно должен разобрать мейнтейнер, который понимает архитектуру, риски и последствия изменений.
Теперь автономные агенты, крупные AI-сгенерированные куски кода и сгенерированный текст в issues, proposals и PR-дискуссиях запрещены. Разрешены только мелкие помощники вроде автодополнения, regex и find/replace. Помощь AI в коде нужно раскрывать.
На практике правило будет сложно применять: почти невозможно наверняка доказать, где был vibe coding, а где обычная работа разработчика.
Godot защищает не стиль разработки, а время ревьюеров. Код можно сгенерировать за минуты, но ответственность за него всё равно остаётся на людях.
godotengine.org/article/contribution-policy-2026/
Причина простая: PR стало легче генерировать, но не легче проверять. Для open-source движка каждый патч всё равно должен разобрать мейнтейнер, который понимает архитектуру, риски и последствия изменений.
Теперь автономные агенты, крупные AI-сгенерированные куски кода и сгенерированный текст в issues, proposals и PR-дискуссиях запрещены. Разрешены только мелкие помощники вроде автодополнения, regex и find/replace. Помощь AI в коде нужно раскрывать.
На практике правило будет сложно применять: почти невозможно наверняка доказать, где был vibe coding, а где обычная работа разработчика.
Godot защищает не стиль разработки, а время ревьюеров. Код можно сгенерировать за минуты, но ответственность за него всё равно остаётся на людях.
godotengine.org/article/contribution-policy-2026/
❤13👍7🔥7🥰1🥴1
Forwarded from GigaDev — разработка GigaChat
«А что, если LLM будет генерировать не строго по одному токену слева направо, а сразу блок текста?»
Именно эту идею мы проверяли в проекте GFusion — диффузионной языковой модели на базе GigaChat3-10B-A1.8B-base.
Отдельно хочется отметить, что этот проект начал и довёл до релиза стажер команды GigaChat Pretrain. Он прошёл весь путь от идеи и первых экспериментов до обучения модели, оптимизаций, поддержки в inference runtime и публикации в open source.
Почему это интересно?
Классические LLM генерируют текст авторегрессионно: каждый следующий токен зависит от всех предыдущих. Это устоявшийся подход, но шаги генерации модели выполняются строго последовательно.
В то же время диффузионная LLM берёт частично замаскированный блок и постепенно восстанавливает токены внутри него. За один forward pass модель может финализировать не один, а сразу несколько токенов.
Так и появляется ускорение. Чем больше токенов модель уверенно восстанавливает за один проход, тем меньше шагов ей нужно для генерации ответа.
Вместо дорогостоящего обучения с нуля мы взяли сильную авторегрессионную LLM и перевели её в диффузионный режим генерации.
Цикл обучения включал:
Результаты:
💡 Главный вывод GFusion состоит в том, что ускорение LLM может требовать переосмысления самого подхода к генерации. Однако, чтобы это заработало на практике, важно довести до рабочего состояния весь стек от обучения и SFT до декодинга, attention-ядер и поддержки в inference runtime.
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
[DLLM] Add GFusion and EBSampling by perkyfever · Pull Request #29776 · sgl-project/sglang
Motivation
Modifications
Accuracy Tests
Speed Tests and Profiling
Checklist
Format your code according to the Format code with pre-commit.
Add unit tests according to the Run and add unit te...
Modifications
Accuracy Tests
Speed Tests and Profiling
Checklist
Format your code according to the Format code with pre-commit.
Add unit tests according to the Run and add unit te...
👍4🔥3❤2😁1