Анализ данных (Data analysis)

Команда LongCat представила LongCat-2.0 - полную модель, которая стоит за Owl Alpha на OpenRouter.

Это MoE-модель на 1.6T параметров, примерно с 48B активных параметров и контекстом до 1M токенов. Основной фокус - agentic coding и длинные задачи, где модели нужно не просто отвечать, а работать с репозиторием, терминалом, поиском и большим объёмом контекста.

В архитектуре есть несколько важных решений. LongCat Sparse Attention отвечает за эффективную работу с 1M-context. Zero-Compute Experts динамически активируют от 33B до 56B параметров на токен, не тратя вычисления на лишние эксперты. MOPD делит экспертизу на три группы: Agent, Reasoning и Interaction, а gate выбирает нужный маршрут под задачу.

По заявленным результатам модель выглядит сильной именно в агентных сценариях: 70.8 на Terminal-Bench 2.1, 59.5 на SWE-bench Pro, 77.3 на SWE-bench Multilingual, 73.2 на FORTE, 78.8 на RWSearch и 79.9 на BrowseComp.

Tech Blog: https://longcat.chat/blog/longcat-2.0/

❤5👍2🔥2

3.01K views14:25

Fable 5 может потребовать верификацию личности

* Новые строки из утечки приложения Claude намекают, что Fable 5 могут вынести в отдельную систему usage credits, с оплатой вне обычной подписки.

* В том же обновлении упоминается проверка личности: «Ваши кредиты будут добавлены после подтверждения вашей личности». Это появилось рядом с изменениями по кредитам для Fable 5, хотя Anthropic раньше говорила, что ID-проверки не связаны с Fable.

* Похоже, Fable 5 может выйти с верификацией личности, более строгим доступом и отдельной оплатой по использованию.

❤8🥱4👍3🔥2💔2🤯1

3.05K views15:44

Анализ данных (Data analysis)

⚡️

Google открыла Nano Banana 2 Lite и Gemini Omni Flash

Google выкатила два новых инструмента для генеративных медиа: Nano Banana 2 Lite для быстрых изображений и Gemini Omni Flash для видео и conversational editing.

Nano Banana 2 Lite - самая быстрая и дешёвая image-модель в линейке Nano Banana. Она рассчитана на high-throughput пайплайны, прототипирование и массовую генерацию, где важны скорость и цена. Google заявляет около 4 секунд на text-to-image и цену $0.034 за 1K image. При этом модель сохраняет нормальное следование промпту, стабильность персонажей и читаемый текст внутри изображения.

Gemini Omni Flash - модель для генерации и редактирования видео через текст, изображения и видео-референсы. Её можно использовать для natural language video editing, мультимодальных сцен, синхронизации текста с действием и быстрых итераций. Цена заявлена на уровне $0.10 за секунду видео, как у Veo 3.1 Fast.

Сначала Nano Banana 2 Lite быстро генерирует изображение, потом Omni Flash превращает его в видео. Через Interactions API можно сохранять историю сессии и делать до трёх последовательных правок.

Ограничения у Omni Flash пока есть: генерация до 10 секунд, audio references и scene extension в API ещё не поддерживаются, а длинные video references пока обрабатываются неидеально.

https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni-flash-nano-banana-2-lite/

@data_analysis_ml

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤11👍3🔥3

25.4K views16:25

Анализ данных (Data analysis)

⚡Выбирать железо для обучения и инференса моделей больше не нужно

Qwen, Whisper, Deepseek и другие нейросети уже готовы к работе на приватной инфраструктуре. Просто выбираете нужную модель и получаете готовый инференс-сервис в пару кликов в Selectel.

Каталог ИИ-моделей Selectel — удобный инструмент для работы с нейросетями, когда нужны безопасность и производительность.

Что вы получаете в пару кликов:

⚡Большой выбор моделей для ваших задач: для генерации текстов и кода, распознавания речи, создания контента и других.
⚡Производительность и гибкое масштабирование. Инференс-сервис развернут на современном железе с актуальными видеокартами и автоматически адаптируется при росте или снижении нагрузки.
⚡Прогнозируемая стоимость: платите за фактическое время потребления вычислительных ресурсов.

Начните работать с ИИ-моделями на выделенной инфраструктуре: https://slc.tl/i0hn1

Реклама. АО "Селектел". erid:2W5zFGqCmpM

🍌5❤2👍2

2.86K views08:45

Анализ данных (Data analysis)

🔥 Tencent Hunyuan представила PhoneBuddy - агентный фреймворк для управления телефоном на базе Qwen3.5-4B.

Средняя производительность выше, чем у GPT-5.4 и Seed 2.0 Pro, но ниже, чем у Gemini 3.1 Pro.

На бенчмарке из 150 задач результаты выросли так:

SFT: 36.67%
Real-app RL: 40.67%
Hybrid RL: 45.33%

На AndroidWorld рост ещё заметнее:

60.3% → 83.2%

https://arxiv.org/abs/2606.23049

❤8👍5🥰2

3.2K views10:31

Анализ данных (Data analysis)

В продуктах VK появится нейропоиск Discovery AI — новый движок для поиска и рекомендаций на базе собственной LLM.

Технологию внедрят в Дзен, VK Видео и Медиапроекты Mail.

В отличие от привычных ИИ-помощников, этот движок не ищет по всему интернету, а копается только в контентной базе продуктов VK и учитывает интересы пользователя. Система может выдавать ответы быстрее чем за полсекунды и обрабатывать до 3 000 поисковых запросов в секунду.

https://habr.com/ru/companies/vk/articles/1054358/

🤣22❤‍🔥6👍4🔥1

3.08K views16:05

Анализ данных (Data analysis)

0:13

This media is not supported in your browser

VIEW IN TELEGRAM

⚡️ Fable 5 снова вернулась в Claude

Модель снова доступна спустя почти три недели после отключения. Ограничения с Anthropic сняли: ранее их вводили из-за формулировки про «угрозу нацбезопасности».

До 7 июля Fable 5 можно использовать в подписках Pro, Team, Max и Premium Enterprise. На неё разрешено тратить до 50% недельных лимитов.

После 7 июля бесплатный доступ закончится, останется только оплата по токенам.

https://claude.ai/

❤21👍4🔥2😐2👌1

19K views20:12

Анализ данных (Data analysis)

This media is not supported in your browser

VIEW IN TELEGRAM

Займи слот ИТ-Пикником от Т-Банка

8 августа — время отложить ноутбуки и встретиться офлайн на ИТ-Пикнике от Т-Банка в музее-заповеднике «Коломенское». Вот сколько всего запланировано:

— научпоп-лекции;
— мастер-классы;
— дискуссии об ИИ и больших языковых моделях;
— доклады о кибербезопасности;
— примеры, как данные из логов становятся решениями;
— много музыки.

Бери с собой друзей, супругов и детей — каждый найдет себе что-то по душе.

Зарегистрироваться и узнать больше можно здесь

❤7🥰3🔥2

1.85K views13:03

Анализ данных (Data analysis)

Godot фактически запрещает vibe coding в контрибуциях.

Причина простая: PR стало легче генерировать, но не легче проверять. Для open-source движка каждый патч всё равно должен разобрать мейнтейнер, который понимает архитектуру, риски и последствия изменений.

Теперь автономные агенты, крупные AI-сгенерированные куски кода и сгенерированный текст в issues, proposals и PR-дискуссиях запрещены. Разрешены только мелкие помощники вроде автодополнения, regex и find/replace. Помощь AI в коде нужно раскрывать.

На практике правило будет сложно применять: почти невозможно наверняка доказать, где был vibe coding, а где обычная работа разработчика.

Godot защищает не стиль разработки, а время ревьюеров. Код можно сгенерировать за минуты, но ответственность за него всё равно остаётся на людях.

godotengine.org/article/contribution-policy-2026/

❤13👍7🔥7🥰1🥴1

1.42K views14:42

Анализ данных (Data analysis)

Forwarded from GigaDev — разработка GigaChat

💵 GFusion: как мы обучали диффузионную LLM в GigaChat

«А что, если LLM будет генерировать не строго по одному токену слева направо, а сразу блок текста?»

Именно эту идею мы проверяли в проекте GFusion — диффузионной языковой модели на базе GigaChat3-10B-A1.8B-base.

Отдельно хочется отметить, что этот проект начал и довёл до релиза стажер команды GigaChat Pretrain. Он прошёл весь путь от идеи и первых экспериментов до обучения модели, оптимизаций, поддержки в inference runtime и публикации в open source.

Почему это интересно?

Классические LLM генерируют текст авторегрессионно: каждый следующий токен зависит от всех предыдущих. Это устоявшийся подход, но шаги генерации модели выполняются строго последовательно.

В то же время диффузионная LLM берёт частично замаскированный блок и постепенно восстанавливает токены внутри него. За один forward pass модель может финализировать не один, а сразу несколько токенов.

Так и появляется ускорение. Чем больше токенов модель уверенно восстанавливает за один проход, тем меньше шагов ей нужно для генерации ответа.

Вместо дорогостоящего обучения с нуля мы взяли сильную авторегрессионную LLM и перевели её в диффузионный режим генерации.

Цикл обучения включал:
🔘адаптацию AR-модели к диффузионной генерации;
🔘постепенное увеличение размера блока;
🔘сравнение полностью диффузионного обучения и гибридного подхода AR+dLLM;
🔘SFT с complementary masking и стадией confidence tuning для дополнительного ускорения генерации.

Результаты:

🔘GFusion в режиме одного пользователя генерирует в среднем на 70% быстрее GigaChat3-10B-A1.8B.
🔘Даже по сравнению с GigaChat3-10B-A1.8B + MTP-головой ускорение составило около 39%.
🔘Просадка качества относительно авторегрессионной модели осталась в пределах 2–4 п.п., а сам трейд-офф между скоростью и качеством можно контролировать параметрами диффузионной генерации.
🔘Добавлена поддержка GFusion в SGLang и реализован entropy-bounded sampling — алгоритм семплирования, который ускоряет генерацию не только GFusion, но и других диффузионных LLM.
🔘Для обучения написана и выложена в open-source своя реализация attention на TileLang под структуру диффузионной маски и получено до +77% end-to-end ускорения относительно Flex-Attention на длинном контексте.

💡 Главный вывод GFusion состоит в том, что ускорение LLM может требовать переосмысления самого подхода к генерации. Однако, чтобы это заработало на практике, важно довести до рабочего состояния весь стек от обучения и SFT до декодинга, attention-ядер и поддержки в inference runtime.

➡️Подробности — в статье на Habr.
➡️HF: GFusion-10B-A1.8B-base GFusion-10B-A1.8B

➡️

GitVerse

Please open Telegram to view this post

VIEW IN TELEGRAM

GitHub

[DLLM] Add GFusion and EBSampling by perkyfever · Pull Request #29776 · sgl-project/sglang

Motivation

Modifications

Accuracy Tests

Speed Tests and Profiling

Checklist

Format your code according to the Format code with pre-commit.
Add unit tests according to the Run and add unit te...

👍4🔥3❤2😁1

347 views15:46

About

Blog

Apps

Platform