ThePerceptronChannel
920 subscribers
904 photos
179 videos
1 file
215 links
Новости, инсайды из мира ИИ!

По вопросам: @PerceptronAI_Support
Download Telegram
😉 Kimi выпустила открытую модель K2.5

Команда Moonshot AI представила новую открытую модель Kimi K2.5. Это нативная мультимодальная модель, обученная на 15 трлн токенов текста и визуальных данных. Ключевая особенность релиза — архитектура автономного роя агентов.

— Поддерживает режим Agent Swarm, где модель автоматически создает и управляет роем из 100 субагентов.
— Выполняет до 1500 вызовов инструментов параллельно, что сокращает время решения задач в 4.5 раза по сравнению с одиночными агентами.
— Использует метод обучения Parallel-Agent Reinforcement Learning, который позволяет оркестратору разбивать задачи на параллельные потоки без заранее прописанных сценариев.
— Умеет реконструировать веб-сайты и интерфейсы напрямую из видео или изображений.
— Генерирует сложные офисные документы, таблицы и презентации на экспертном уровне.


Для разработчиков выпущен инструмент Kimi Code, который работает в терминале и интегрируется с VSCode, Cursor и Zed. Модель уже доступна через API и в веб-интерфейсе. Веса: клик.

На видео примеры того, что модель сделала с помощью одного промпта и инструмента для генерации изображений.

@ThePerceptronChannel
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
10641
This media is not supported in your browser
VIEW IN TELEGRAM
✴️ OpenAI представила платформу Prism

Компания OpenAI анонсировала Prism — специализированное рабочее пространство для ученых и исследователей. Сервис создан для написания научных статей, работы со сложными формулами и совместного редактирования документов.

Главным «мозгом» платформы стала модель GPT-5.2.

— Понимает контекст всей работы, включая графики, уравнения и структуру документа.
— Превращает фотографии записей с маркерной доски в готовый текст и формулы (формат LaTeX).
— Позволяет работать над проектом целой командой в реальном времени.
— Ищет актуальные исследования в научных базах и помогает оформлять ссылки на источники.
— Работает прямо в браузере, устанавливать сложные программы на компьютер не нужно.


Сейчас сервис открыт для всех владельцев личных аккаунтов. В корпоративных пространствах (подписки Team, Enterprise и Education) он заработает позже.

@ThePerceptronChannel
Please open Telegram to view this post
VIEW IN TELEGRAM
753
✴️ Google наделила Gemini 3 Flash агентным зрением

Google представила Agentic Vision для Gemini 3 Flash. Теперь ИИ не просто пассивно смотрит на статичное изображение, а проводит активное расследование, используя написание кода как инструмент восприятия.

— Модель пишет и исполняет Python-скрипты, чтобы взаимодействовать с картинкой.
— Умеет самостоятельно приближать мелкие детали, обрезать нужные участки и накладывать визуальную разметку, чтобы избежать ошибок при подсчете объектов.
— При работе с графиками и таблицами модель считывает визуальные данные, переводит их в код и строит точные диаграммы, вместо того чтобы галлюцинировать с цифрами.


Функция уже доступна разработчикам в Google AI Studio и через API, а также начинает появляться в Gemini App в режиме Thinking.

@ThePerceptronChannel
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🤩122
This media is not supported in your browser
VIEW IN TELEGRAM
✴️ Google тестирует клонирование голоса в AI Studio

Google готовят обновление для AI Studio, включающее генерацию речи на основе пользовательских сэмплов и прямую работу с Git-репозиториями.

— Опция «Create Your Voice» позволяет записать или загрузить аудиосэмпл, чтобы модель озвучивала ответы голосом пользователя.
— Функция обнаружена в превью Gemini 2.5 Flash, но, вероятно, станет частью релиза Gemini 3 Flash Native Audio.
— Добавлена возможность импортировать полные репозитории кода через кнопку «Import from GitHub».
— Готовится нативная интеграция с Firebase и внешними базами данных.
— Переработан дашборд: статистика использования ресурсов и история действий теперь разнесены по разным блокам.


Функционал пока скрыт в интерфейсе и находится на стадии внутреннего тестирования.

@ThePerceptronChannel
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔553😁1
This media is not supported in your browser
VIEW IN TELEGRAM
✴️ Google превращает Chrome в автономного агента

Google внедрила модель Gemini 3 в десктопные версии Chrome для macOS, Windows и Chromebook Plus. Браузер теперь не просто отображает страницы, а самостоятельно выполняет сложные задачи за пользователя.

— Новая боковая панель обеспечивает мультизадачность: сравнивает контент с разных вкладок, резюмирует длинные обзоры и управляет календарем без переключения окон.
— Интегрирована модель Nano Banana: трансформирует и генерирует изображения прямо на веб-страницах по текстовому промпту без необходимости скачивания и повторной загрузки файлов.
— Система Connected Apps глубоко связывает браузер с Gmail, Calendar, YouTube, Maps, Shopping и Flights для выполнения комплексных запросов.
— Режим Auto Browse берет на себя многоступенчатую рутину: самостоятельно ищет выгодные авиабилеты, заполняет налоговые формы, обновляет водительские права и управляет подписками.
— Агент распознает товары на фото, находит аналоги, применяет скидочные коды и добавляет позиции в корзину.
— При необходимости авторизации ИИ использует Google Password Manager, но всегда запрашивает ручное подтверждение перед оплатой или публикацией в соцсетях.
— Внедрена поддержка стандарта UCP для прямой коммерции совместно с Shopify, Etsy, Wayfair и Target.
— В будущем появится модуль Personal Intelligence, запоминающий контекст всех прошлых диалогов для персонализации ответов.


Базовый функционал доступен всем пользователям, агент Auto Browse — только подписчикам AI Pro и Ultra в США.

@ThePerceptronChannel
Please open Telegram to view this post
VIEW IN TELEGRAM
844
This media is not supported in your browser
VIEW IN TELEGRAM
🏟 LMArena теперь просто Arena

LMArena провела ребрендинг и сократила название до Arena. Сервис переехал на домен arena.ai.

— Приставку «LM» (Language Model) убрали намеренно: тесты вышли за рамки простого текста и теперь включают кодинг, дизайн и мультимодальные задачи.
— Ежемесячная аудитория достигла 5 млн пользователей, которые генерируют 60 млн диалогов.
— Обновили визуальный стиль и логотип — теперь это колонна, символизирующая фундамент для оценки прогресса ИИ.


Обновленный лидерборд уже доступен по адресу arena.ai.

@ThePerceptronChannel
12😁3
✴️ Grok Imagine вышла в API

xAI запустила API для видеомодели Grok Imagine, ранее доступная только в интерфейсе Grok.

— Заняла первое место в рейтинге Artificial Analysis сразу в двух категориях: Text-to-Video и Image-to-Video.
— Поддерживает нативную генерацию аудио одновременно с видеорядом.
— В слепых тестах опередила Runway Gen-4.5, Kling 2.5 Turbo и Google Veo 3.1.
— Стоимость составляет $4.20 за минуту генерации (включая звук).
— Дешевле ключевых конкурентов: минута в Sora 2 Pro обходится в $30, а в Veo 3.1 — в $12.


@ThePerceptronChannel
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
3
Media is too big
VIEW IN TELEGRAM
✴️ Google открыл доступ к генератору интерактивных миров Project Genie

Google DeepMind запустила Project Genie — веб-прототип на базе модели Genie 3, который позволяет создавать игровые 3D-миры из текста или картинок и взаимодействовать с ними. Система работает в связке с Gemini и Nano Banana Pro.

— Генерирует пространство в реальном времени: модель просчитывает путь и физику объектов прямо в момент движения персонажа.
— Поддерживает точную настройку через Nano Banana Pro: можно отредактировать визуальный стиль и выбрать перспективу (от первого или третьего лица) до начала симуляции.
— Позволяет «ремиксовать» существующие миры, дописывая промпты, или использовать встроенный рандомайзер.
— Включает функцию экспорта видеозаписей прохождения.
— Имеет жесткие ограничения: генерация длится не более 60 секунд, возможны задержки управления и артефакты физики.
— Отсутствует поддержка сценарных событий (promptable events), анонсированных ранее.


Доступ открыт для подписчиков Google AI Ultra в США (18+).

@ThePerceptronChannel
Please open Telegram to view this post
VIEW IN TELEGRAM
1166
✴️ ChatGPT: реклама в истории чатов и отключение GPT-4o

OpenAI анонсировала два радикальных изменения в политике сервиса: внедрение таргетинга на основе памяти пользователя и удаление моделей из интерфейса.

— Рекламные алгоритмы теперь анализируют не только текущий контекст, но и историю переписок вместе с сохраненными фактами в функции Memory.
— Пользователь может управлять персонализацией через настройки; данные обрабатываются внутри контура ChatGPT.
— 13 февраля 2026 года из меню выбора исчезнут модели GPT-4o, GPT-4.1, GPT-4.1 mini, o4-mini, а также GPT-5 (версии Instant и Thinking).
— Все перечисленные модели продолжат работать для разработчиков через API без изменений.


@ThePerceptronChannel
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
151
✴️ Обучение Grok 4.20 задерживается

Илон Маск сообщил, что тренировка новой модели отстает от графика из-за инцидентов в дата-центре.

«У нас возникли перебои с питанием из-за экстремальных холодов, а строительная техника повредила линии электропередач. В результате обучение Grok 4.20 задерживается на пару недель — до середины февраля».


@ThePerceptronChannel
Please open Telegram to view this post
VIEW IN TELEGRAM
😁103🤔221