Технозаметки Малышева

🌟 Sakana AI представили AI Scientist v2 — систему, которая автоматизирует научное исследование: от гипотезы до опубликованной статьи.

Sakana AI впервые провела реальный эксперимент: три научные статьи, полностью сгенерированные ИИ (The AI Scientist-v2), были отправлены на слепое рецензирование на ICLR Workshop 2025.

Одна из них получила баллы выше среднего уровня принятия — лучше многих статей, написанных людьми. Это исторический момент в научной публикационной практике.

Статьи были на 100% созданы AI — от идеи до финального форматирования и списка литературы.

Человек не правил ни одного слова: только выбрал тему и три лучшие статьи из набора, сгенерированного AI.

В ICLR Workshop было отправлено 3 статьи из 43 (≈7%) — рецензенты знали, что среди них есть AI-работы, но не знали, какие именно.

- 2 статьи были отклонены.
- 1 статья прошла, получив баллы:

Средняя оценка статьи: 6.33 — это выше, чем у многих человеческих работ, принятых на воркшоп.

🟡 Что умеет AI Scientist-v2:
— Придумывает научные идеи
— Пишет и запускает код для экспериментов
— Анализирует результаты, строит графики
— Сама пишет статью в научном формате
— И… сама себя рецензирует

🟡

Подробнее

🟡

Github

🟡

Эксперимент

@ai_machinelearning_big_data

#ai #ml #Sakana

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥9⚡3✍1🤔1

1.26K views09:21

Технозаметки Малышева

🔍 Gemini Deep Research - теперь в Gemini 2.5 Pro

Полезность тут не только в том, что режим Исследователя теперь работает с ведущей по "разуму" модели, но и в том, что у нее, напомню, 1М контекстное окно.

Технически это означает, что AI может одновременно удерживать и анализировать в "памяти" несколько десятков веб-страниц.
Т.е. потенциально из всех "исследователей" Gemini теперь лучше всех весь этот контекст переработает, не упустив важных деталей.

Техническая начинка:
• Многоступенчатый план исследования (который можно редактировать!)
• Самостоятельное уточнение поисковых запросов на основе найденной информации
• Автоматическое цитирование источников с реальными гиперссылками
• Возможность экспорта в Google Docs одним кликом
• Audio Overviews — конвертация отчёта в аудиоформат (пригодится в дороге)

Практическое применение:
• Стартапам: сбор данных о рынке и конкурентах без найма аналитика
• Продакт-менеджерам: исследование трендов для планирования фич на 2025
• Инвесторам: быстрый сбор информации по нишам/компаниям перед принятием решений

Имейте в виду — функция доступна только подписчикам Gemini Advanced.

Но если считать, сколько часов рабочего времени она экономит, подписка окупается за пару запусков.

#Gemini #DeepResearch #агенты #Google
———
@tsingular

👍5🔥4⚡2

1.17K views05:37

Технозаметки Малышева

AI agent for travel built on Amazon Nova Sonic

About Amazon

🔊 Amazon Nova Sonic: Революция в голосовом AI — понимает не только ЧТО, но и КАК вы говорите

Amazon запустил новую модель Nova Sonic — первый фундаментальный AI, который объединяет распознавание и генерацию речи в единой архитектуре, делая голосовое взаимодействие по-настоящему человечным.

Ключевые возможности:
• Единая модель (не разрозненные ASR+LLM+TTS)
• Понимание тона, интонации и темпа речи
• Адаптация ответа под эмоциональный контекст
• Естественные паузы и умение "не перебивать"
• Корректная обработка прерываний разговора

Техническая начинка:
• Двунаправленный streaming API через HTTP/2
• Контекстное окно в 32K токенов
• До 8 минут в одной сессии
• Function calling для интеграции внешних сервисов
• RAG для работы с корпоративными данными
• Поддержка американского и британского английского

Практическое применение:
• Автоматизация контакт-центров
• Виртуальные туристические консультанты
• Образовательные приложения
• Игры с голосовым интерфейсом
• AI-ассистенты для работы с корпоративными дашбордами

Модель уже доступна через Amazon Bedrock в регионе US East (N. Virginia).

Для Python-разработчиков выпущен экспериментальный SDK для работы с бидирекциональным стримингом.

AWS явно в лидерах ИИ разработок. Не перестают удивлять, хотя о них и меньше "кричат", чем про OpenAI или Google.
Послушайте пример в прикрепе к посту.

#Amazon #Nova #Voice #AWS #sound
———
@tsingular

👍6⚡4❤1

1.14K views06:10

Технозаметки Малышева

Forwarded from Лаборатория ИИ

ИИ сам прочитает статьи на arXiv и расскажет, что важно

Больше не надо тратить часы на изучение научных публикаций. Просто спрашиваете — и получаете готовый обзор по теме с самыми свежими статьями.

Что за arXiv?
Это крупнейшая открытая база научных публикаций по физике, математике, компьютерным наукам и ИИ. Все топовые учёные и лаборатории публикуются там задолго до того, как статьи попадут в журналы.

Что умеет Deep Research:
• Отвечает на вопросы вроде: «Какие последние прорывы в fine-tuning моделей RL?»
• Находит релевантные статьи на arXiv
• Делает краткий и понятный обзор
• Показывает, какие темы сейчас на хайпе в научном сообществе

Кому полезно:
• ИИ-разработчикам
• Студентам и исследователям
• Всем, кто хочет быстро разобраться в теме без тонны pdf’ов

Как это выглядит:
Вы пишете:
“What are the latest breakthroughs in generative AI for biology?”
ИИ выдает вам подборку с краткими описаниями и ссылками. Всё по делу.

Попробовать здесь: https://www.alphaxiv.org/assistant

➕

@ai_rostov

Please open Telegram to view this post

VIEW IN TELEGRAM

1😍7🔥5

1.08K views06:38

Технозаметки Малышева

🔥 Alibaba Cloud открывает AI-возможности для международных заказчиков

Alibaba Cloud на своём Spring Launch 2025 только что представила серию новостей.

Самое важное — компания открывает международный доступ к своим передовым AI-моделям и инфраструктуре через зоны доступности в Сингапуре.

Ключевые новинки:
🧠 Продвинутые модели для серьезных задач
• Qwen-Max — масштабная MoE-модель (Mixture of Experts)
• QwQ-Plus — специализированная модель рассуждений для аналитических задач
• QVQ-Max — модель визуального рассуждения с высокой точностью
• Qwen2.5-Omni-7b — комплексная мультимодальная модель для работы с текстом, изображениями, аудио и видео

⚡️ Технические усовершенствования PAI (Platform for AI)
• Распределенный inference с многоузловой архитектурой — решение ограничений традиционной одноузловой архитектуры
• Функция prefill-decode disaggregation — увеличивает параллельные вычисления на 92% и TPS (токенов в секунду) на 91% при работе с Qwen2.5-72B
• Доступ к почти 300 передовым open-source моделям, включая собственные серии Qwen и Wan

🔄 Интеграция с базами данных
• Встроенные AI-возможности в реляционную БД PolarDB — устраняет необходимость переноса данных и снижает задержки
• Интеграция хранилища AnalyticDB в Model Studio как рекомендуемой векторной БД для RAG-решений
🛠 Новые SaaS-инструменты на базе AI
• AI Doc — умная обработка документов на базе LLM для извлечения информации и создания отчетов по бизнес-требованиям
• Smart Studio — платформа для создания контента (text-to-image, image-to-image, text-to-video) с ориентацией на маркетинг и творческие отрасли

Практическое применение:
• Для разработчиков AI-продуктов: возможность работать с распределенными моделями и быстрее обрабатывать сверхбольшие контексты
• Для бизнес-аналитиков: интеграция AI прямо в базы данных = работа с данными без экспорта/импорта
• Для маркетологов: создание визуального контента с помощью AI без специальных навыков

Это часть глобальной стратегии — в феврале 2025 Alibaba Group объявила об инвестициях в $53 млрд (380 млрд юаней) в развитие облачной и AI-инфраструктуры на следующие три года.

Ну что, господа облачники, как вам новый глобальный игрок на рынке?
Готовимся корректировать цены или мигрировать? :)

#Alibaba #Китай
———
@tsingular

🔥8⚡4❤1🎃1

1.07K views07:28

Технозаметки Малышева

Forwarded from эйай ньюз

Вышел DeepCoder 14B Preview

Новый ризонер специально для кода, лидирующий в 14B весовой категории и догоняющий o3-mini и o1, когда они обе на low настройках. Неприятный звоночек — модель не сравнивают с QwQ 32B, основным конкурентом этой модели, а с моделями OpenAI сравнивают только на low настройках. Причём непонятно почему — результаты достойные, даже o3-mini (low) обойти это непросто.

За основу взят DeepSeek R1 Distill 14B, поверх которого запустили RL на 24к задач для кодинга. Это сильно бампануло качество кодинга по сравнению с бейзлайном, при этом случайно улучшив результаты на математике.

Сделали эту модель в колабе с Together AI, это один из клауд провайдеров заточенных специально на ИИ. Я уже писал пару лет назад об их датасете RedPajama, воспроизводящем датасет оригинальной Llama.

А вот самая лучшая часть — авторы опубликовали не только веса, но и код с датасетом. Всё это можно прямо сейчас скачать с 🤗 и гитхаба.

И мы все ближе к маленьким и умелым моделькам, которые можно запускать локально (а 14B можно запускать и на обычном железе) и которые могут заменить проприетарные модели. На этот раз в кодинге. Не устану повторять, что опен сорс – это круто!

Веса
Код
Датасет

@ai_newz

🔥8⚡3

1.04K views07:36

Технозаметки Малышева

Forwarded from Denis Sexy IT 🤖

Google добавил AI как формулу в гугл-таблицы – наконец-то можно не мучаться с плагинами и скриптами

Тут подробнее, фича доступна в альфа версии и активируется этой инструкцией (нужно быть в организации, чтобы заработало)

🔥9👍6❤1

1.09K views08:09

Технозаметки Малышева

Китайские товарищи выкатили новую открытую модель для генерации картинок, которая обходит вообще всех.

Однако для запуска ее полной версии нужна карта под 80 гигов.

Больше деталей и продуктов от разработчиков тут:
https://vivago.ai/

Так как такая, пока, есть не в каждом доме, народ уже нарезал версию nf4
https://huggingface.co/azaneko/HiDream-I1-Dev-nf4
можно запускать на 16гигах видео памяти.

#HiDream #нейрорендер #Китай
———
@tsingular

🔥9👍3

1.13K views08:55

Технозаметки Малышева

🚀 Новые релизы MCP-серверов от: ElevenLabs и GitHub

🔊 ElevenLabs MCP Server
ElevenLabs запустил официальный MCP-сервер, обеспечивающий бесшовную интеграцию с передовыми API для обработки аудио:

Ключевые возможности:
• Text-to-Speech с человекоподобным звучанием
• Клонирование голосов с исключительной точностью
• Аудиотранскрипция с высокой степенью распознавания
• Идентификация говорящих в многоголосых записях
• Создание звуковых ландшафтов для игр, VR и кино

Совместимость:
Поддерживает интеграцию с различными MCP-клиентами:
• Claude Desktop (с включенным Developer Mode)
• Cursor
• Windsurf
• OpenAI Agents

Доступность:
• Бесплатный тариф с 10,000 кредитов в месяц
• Масштабируемые платные планы

💻 GitHub MCP Server
GitHub выпустил официальный MCP-сервер для программистов, открывающий доступ к API GitHub непосредственно из AI:

Ключевые инструменты:
• Управление репозиториями — создание, форк, поиск
• Работа с issues — создание, комментирование, обновление
• Управление PR — создание, просмотр, мердж, обновление
• Работа с файлами — создание, обновление, просмотр содержимого
• Code Scanning — доступ к алертам безопасности кода

Практическое применение:
• Автоматизация рабочих процессов GitHub • Анализ данных из репозиториев
• Создание AI-инструментов для экосистемы GitHub

Простая установка:
• Поддержка Docker для быстрого развертывания
• Интеграция с VS Code через простую конфигурацию
• Поддержка Claude Desktop

Больше MCP богу ИИ. В каждом софте будет по-умолчанию.

#MCP #ElevenLabs #GitHub
———
@tsingular

🔥7❤1

1.14K views09:13

Технозаметки Малышева

Forwarded from LLM под капотом

Google: Agent2Agent Protocol (A2A)

Google захотела сделать свой MCP протокол, только с крупными компаниями. Готово.

Назвали его A2A (Agent2Agent). Это открытый стандарт для обмена информацией между ИИ-агентами, работающими в разных системах. Он использует технологии HTTP, SSE и JSON-RPC для упрощения интеграции в существующую инфраструктуру.

Основные моменты:
(1) Dynamic Capability Discovery - агенты обмениваются данными через JSON-Agent Card, что позволяет выбирать подходящего исполнителя задачи.

(2) Task-Centric Communication - протокол работает с задачами, у которых есть свой жизненный цикл. A2A поддерживает как быстрые операции, так и долгосрочные процессы с обратной связью и уведомлениями.

(3) Security (за что критиковали MCP) - продуманы средства аутентификации и авторизации для защиты данных.

(4) Мультимодальность - обмен информацией в виде текста, аудио или видео.

В теории, общее назначение A2A - упростить автоматизацию и интеграцию процессов в корпоративных системах. Однако на HN люди уже высказывались насчет сложности протокола и его влияния на контроль над данными. Мол, нагородили всякого, лишь бы рынок отжевать.

Мне кажется, с такой компанией оно может и взлететь. Но из-за сложности и непредсказуемости систем лететь будет так себе.

Почитать доки можно тут.

Ваш, @llm_under_hood 🤗

🆒4🔥1

1.09K views15:20

Технозаметки Малышева

Forwarded from Machinelearning

🌟

Deep Cogito представила серию языковых моделей с открытым исходным кодом.

Deep Cogito выпустила семейство языковых моделей размером 3B, 8B, 14B, 32B и 70B параметров, которые уже доступны для загрузки.

По заявлению разработчиков, их модели превосходят аналогичные открытые решения от LLaMA, DeepSeek и Qwen в большинстве стандартных бенчмарков. Например, 70B-версия обходит новую 109B MoE-модель Llama 4, несмотря на меньший размер.

Все модели обучены с помощью метода Iterated Distillation and Amplification (IDA) — стратегии, которая сочетает итеративное самоулучшение и «сжатие» интеллекта для преодоления ограничений, накладываемых человеческим контролем.

Суть IDA проста: сначала модель «усиливает» свои способности, тратя больше вычислительных ресурсов на поиск решений через CoT, а затем «дистиллирует» эти улучшения в свои параметры. Такой цикл повторяется, создавая петлю обратной связи — каждая итерация делает модель умнее, а её мышление эффективнее. По словам команды, этот подход не только масштабируем, но и быстрее, чем RLHF.

Семейство поддерживает 2 режима работы: стандартный (прямой ответ) и «рефлексивный», где система сначала обдумывает запрос, как это реализовано в Claude 3.7. Они оптимизированы для программирования, вызова функций и агентских сценариев, но без акцента на CoT — разработчики считают, что короткие шаги эффективнее в реальных задачах.

Уже в ближайшие месяцы ожидаются версии на 109B, 400B и 671B параметров и вариации с MoE-архитектурой.

Модели доступны на Hugging Face, Ollama и через API Fireworks AI/Together AI.

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍8

1.05K views18:24

Технозаметки Малышева

0:40

Media is too big

VIEW IN TELEGRAM

Adobe активно развивает агентные AI-системы для всех своих продуктов

Adobe делает стратегическую ставку на агентный искусственный интеллект, внедряя эту технологию во все ключевые продукты — от Acrobat и Express до профессиональных инструментов Creative Cloud.

Техническая основа и стратегия

В Adobe подход к агентному ИИ прозрачен: лучшее использование искусственного интеллекта — дать людям больше контроля и освободить их время для работы, которую они любят, будь то творчество, анализ или совместная работа.

Компания последовательно расширяет возможности ИИ, начав с генеративных моделей Firefly и теперь переходя к более сложным агентным системам.

Технический фундамент для агентных систем Adobe — новая платформа Adobe Experience Platform Agent Orchestrator, которая позволяет объединять и координировать работу AI-агентов, как собственных от Adobe, так и от сторонних разработчиков.

Платформа обеспечивает:

- Семантическое понимание корпоративных данных
- Интеграцию с рабочими процессами маркетинга
- Встроенную систему управления данными и соответствие регуляторным требованиям

Продукты с агентными возможностями

Adobe активно интегрирует агентные технологии во все свои ключевые продукты:

1. Adobe Acrobat — исследовательские агенты для анализа документов, подготовки к встречам, академические помощники для студентов.

2. Adobe Express — агенты, действующие как творческие партнеры на всех этапах создания контента.

3. Photoshop — агенты для анализа изображений и автоматизации рутинных задач.

4. Premiere Pro — агенты, анализирующие содержимое видеоклипов и помогающие с монтажом.

Практическое применение

Представленные агенты решают реальные бизнес-задачи:

Site Optimization Agent — анализирует производительность сайта в реальном времени, выявляет проблемы и предлагает решения одним кликом.

Account Qualification Agent — помогает B2B-командам оценивать новые возможности и вовлекать ключевых лиц, принимающих решения.

Content Production Agent — генерирует контент на основе брифа, соблюдая фирменные стандарты и брендбук.

Audience Agent — анализирует данные о взаимодействии с аудиторией и оптимизирует сегментацию.

Интеграция с Microsoft и экосистемой

Adobe также объявила о расширении сотрудничества с Microsoft, включая интеграцию Adobe Marketing Agent в Microsoft 365 Copilot. Это позволит маркетологам использовать возможности Adobe прямо в привычном рабочем процессе через Microsoft Teams, PowerPoint и Word.

Что это означает для пользователей

По мнению Adobe, агентный ИИ станет мощным "умножителем сил" для творческих профессионалов.

Изучая обратную связь, адаптируясь к изменениям и проактивно предлагая идеи для более быстрой реализации, интеллектуальные агенты имеют огромный потенциал для ускорения творческой работы.

Для обычных пользователей агентный ИИ в продуктах Adobe означает:
- Более интуитивные интерфейсы
- Автоматизацию рутинных задач
- Персонализированные рекомендации и подсказки
- Ускорение рабочего процесса без необходимости изучать все аспекты сложных инструментов

Перспективы развития

Adobe позиционирует себя на переднем крае "третьей фазы" революции ИИ — после описательного и генеративного ИИ наступает эра агентного ИИ.

Этот этап характеризуется значительным повышением интерактивности и способностей к рассуждению у ИИ-моделей. Главное отличие — агенты могут не только давать рекомендации, но и самостоятельно выполнять действия в различных системах.

Интересно, как быстро творческие ИИ агенты превратят в творящих ИИ агентов (перейдут из цифрового мира в физический), исключив лишнее звено из цепочки производства.

#Adobe #Acrobat #Express #Photoshop #Premier
———
@tsingular

👍7⚡1🔥1👀1

1.11K viewsedited 06:51

Технозаметки Малышева

🔥 Anthropic запускает Claude Max за $200: Битва за премиум-сегмент AI-рынка

Anthropic запустила новый премиальный план Claude Max в двух вариантах: $100/месяц с лимитами в 5 раз выше стандартного Pro-тарифа и $200/месяц с 20-кратным увеличением лимитов. Подписчики так же получат ранний доступ к новым моделям и голосовому режиму Claude.

Этот шаг — прямой ответ на $200 тариф ChatGPT Pro от OpenAI и сигнал об обострении конкуренции за самых активных пользователей.

📊 Для кого создан Claude Max?
План Max создан для профессионалов в программировании, финансах, медиа и маркетинге, которые глубоко интегрировали Claude в рабочие процессы и регулярно упирались в лимиты.

Скотт Уайт, руководитель продукта: "Я рад, что пользователи, для которых Claude незаменим, больше не будут ограничены этими лимитами".
Тариф ориентирован на работу с длинными диалогами, масштабным редактированием документов и сложной аналитикой.

📱 Сравнение тарифов ведущих AI-провайдеров (2025)
OpenAI (ChatGPT)

Free: базовая GPT-4o с ограничениями
Plus: $20/месяц, полный доступ к GPT-4o
Pro: $200/месяц, неограниченный доступ к моделям GPT-4/o1
Team: $25/пользователь/месяц при годовой оплате

Google (Gemini)

Google One AI Premium: $19.99/месяц, Gemini 2.5 Pro с интеграцией в экосистему Google

Anthropic (Claude)

Free: базовая версия с лимитами
Pro: $20/месяц с увеличенными лимитами
Max: $100/месяц (5x лимиты) или $200/месяц (20x лимиты)
Business: корпоративные цены

Perplexity AI

Free: базовый поиск с ограничениями
Pro: $20/месяц, доступ к GPT-4o, Claude 3.5, Sonar Large
Enterprise Pro: $40/пользователь/месяц для команд

💹 Рыночный контекст
Anthropic стремительно растет: $3.5 млрд инвестиций в марте 2025, оценка $61.5 млрд, годовой доход около $1 млрд (рост в 10 раз за год).

Премиальный тариф должен значительно увеличить доходы, как это произошло с ChatGPT Pro, принесшим OpenAI около $300 млн дополнительной годовой выручки вскоре после запуска.

Похоже $200, - новый стандарт. Ну или такой способ - отдай нам все свои деньги, чтобы у тебя не осталось на ИИ от конкурентов.
Хотя реальный премиум скупит их все и по $200 и по $2000 в месяц.
Ещё есть куда расти.
А потом еще корпоративный безлимит введут, как мобильные операторы.

Кстати, а чем закончилось с операторами? Связь стала дешевле воздуха. И фокусируются на дополнительных сервисах.
ИИ провайдеры тоже, получается, должны заранее об этом подумать.

#tariffwar #anthropic #claude
———
@tsingular

✍6👍3⚡1

965 views07:50

Технозаметки Малышева

Cloud.ru запускает бесплатного ИИ помощника

#Cloud.ru
———
@tsingular

🤔4🔥2

994 views08:14

Технозаметки Малышева

Cloud.ru запускает пространство для разработки и запуска ИИ моделей.

Evolution AI Factory

Задача - упростить порог входа.

Дополнительно будет Partner API - решения партнёров будут встроены в систему Cloud.ru.
Похоже на Azure Marketplace

Evolution stack - 394 компонента
+ 729 решений в Marketplace

#cloud.ru
———
@tsingular

👍4🔥2

1.07K viewsedited 08:21

About

Blog

Apps

Platform