Заметки LLM-энтузиаста
531 subscribers
147 photos
17 videos
1 file
178 links
Дмитрий Жечков @djdim
архитектор в Yandex Cloud,
ex. VMware NSX specialist, ex. Cisco SE

Здесь пишу свои заметки по LLM (большим языковым моделям) и AI-разработке.

Это личное мнение и не отражает официальную позицию компании, в которой я работаю.
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Stagewise: инструмент для точной настройки UI с помощью ИИ 🎯

Stagewise — это браузерная панель инструментов, которая соединяет веб-интерфейс с ИИ-агентами в редакторах кода. Основная идея: выбираете элементы на странице, оставляете комментарий и позволяете ИИ внести нужные изменения.

Как это работает:
🔸 Устанавливаете расширение в VS Code/Cursor
🔸 Добавляете компонент в веб-приложение
🔸 Выбираете элементы прямо в браузере
🔸 Описываете желаемые изменения
🔸 ИИ получает контекст и вносит правки в код

Основные возможности:
🔸 Работает с React, Next.js, Vue
🔸 Передает DOM-элементы, скриншоты и метаданные
🔸 Поддерживает выбор нескольких элементов
🔸 Настраивается через конфигурационный файл

Поддерживаемые ИИ-агенты:
1️⃣ Cursor
2️⃣ Windsurf
3️⃣ GitHub Copilot 🚧 (в разработке)
4️⃣ Остальные пока не поддерживаются

Архитектура системы:
🔸 Браузерная панель инструментов
🔸 Расширение для VS Code
🔸 Типобезопасная RPC-система для связи
🔸 MCP-сервер для интеграции с ИИ

Инструмент решает проблему точной настройки UI, когда ИИ делает 80% работы правильно, но остальные 20% требуют детальных правок. Вместо описания изменений текстом, предоствляя скриншот, вы просто показываете конкретные элементы. Такая функциональность обычно встроена во все AI веб-кодеры (lovable, bolt.new, replit и т.д.), а stagewise дает возможность получить ее в IDE-кодерах на своем ПК или mac'e.

Проект с открытым исходным кодом, активно развивается.
Монорепозиторий включает компоненты для разных фреймворков и систему сборки на базе pnpm и Turborepo.
Deepwiki документация со схемами по нему здесь.

#ai #frontend #cursor #ui #development
👍6❤‍🔥3
DeepSeek-R1-0528: новая модель с открытым исходным кодом 🤖

Компания DeepSeek выпустила обновленную версию своей модели R1-0528, которая теперь доступна с открытым исходным кодом на платформе HuggingFace.

Основные характеристики модели:

• Выполняет глубокий анализ и генерацию текста
• Обладает естественным стилем рассуждений
• Поддерживает длительную обработку задач
• Может работать над одной задачей до 30-60 минут
• Основана на DeepSeek-V3-0324 с 660B параметрами

Результаты тестирования 📊

На бенчмарке LiveCodeBench новая модель показала результаты:

1️⃣ Сопоставимые с o3-mini (High) и o4-mini (Medium) 2️⃣ Превосходящие Gemini 2.5 Pro 3️⃣ Значительное улучшение способностей к программированию

Модель представляет собой заметный шаг вперед для open-source решений в области ИИ. Веса модели уже доступны для загрузки, хотя описание на HuggingFace пока не обновлено.
Модель уже можно использовать в AI-кодерах Roo Code/Cline, например, через https://www.requesty.ai/ (на openrouter пока нет)

🔗 Ссылка: https://huggingface.co/deepseek-ai/DeepSeek-R1-0528/tree/main

#deepseek #opensource #ai #llm #reasoning
2👍2
Эндрю Нг о состоянии AI-агентов: ключевые инсайты 🤖

Вчера на конференции Interrupt от Langchain состоялась беседа со-основателя Langchain Гариссона Чейса с Эндрю Нгом — одним из ведущих экспертов в области ИИ. Ниже мой краткий конспект с выводами о развитии агентных систем.

Агентность vs Агенты 🎯

Нг предлагает думать об агентности как о спектре функций, а не делить системы на "агентные" и "не агентные". Это помогает избежать бесполезных споров и сосредоточиться на практической разработке.

Текущее состояние рынка 📊

Большинство бизнес-процессов представляют собой:
• Линейные рабочие процессы
• Простые ветвления при ошибках
• Небольшие циклы обработки данных

Сложные агентные системы с множественными циклами пока менее распространены.

Ключевые навыки для разработчиков агентов 🛠

1️⃣ Правильная декомпозиция задач
Умение разбивать бизнес-процессы на микрозадачи остается критически важным навыком.

2️⃣ Система оценки (Evals)
Многие команды слишком долго полагаются только на ручную оценку. Автоматизированные evals нужно внедрять быстрее, даже если они изначально несовершенны.

3️⃣ Тактические знания
Опыт работы с различными инструментами (RAG, память, guardrails) как с "кубиками Lego" — чем больше инструментов знаешь, тем быстрее можешь собрать решение.

Недооцененные технологии 🔍

Голосовые приложения 🎙
Несмотря на высокий интерес крупных компаний, разработчики уделяют им недостаточно внимания. Голос снижает барьер входа для пользователей — люди говорят более свободно, чем пишут. Это действительно так: даже у меня уже сформировалась привычка ставить задачу AI-кодеру голосом.

MCP (Model Context Protocol) 🔗
Стандартизирует интеграцию агентов с различными источниками данных. Пока протокол "сырой", но это важный шаг к решению проблемы n×m интеграций.

Программирование с ИИ 💻
Нг выступает против термина "vibe coding", считая его misleading (некорректным). Это интеллектуально сложный процесс, требующий глубокого понимания технологий.
Про глубокое понимание технологий можно, конечно, поспорить.
Порог входа в AI-программирование стремительно снижается. Модели, которые "пишут" код, "умнеют" каждые пол-года. Многие задачи, которые раньше требовали написания сложного PRD (Product Requirement Document) сейчас решаются промптом в 1-2 предложения (которые можно сформулировать голосом).
Большинство даже опенсорсных систем (Cline/Roo Code) уже имеют встроенные "опросники" (Architect Mode) для новичков, которые позволяют максимально точно сформулировать задачу. Коммерческие системы тоже перед решением задачи формируют привычку расспросить новоиспеченных программистов о задаче, которые те собираются решить, предложив возможные варианты (например, claude code или cursor с настроенным соответствующим образом custom agent).
Однако, сам процесс Vibe Coding может быть утомительным, если действительно хочешь решить задачу, а не поиграться.

Важно: Всем стоит изучать программирование, так как умение точно объяснить компьютеру задачу становится ключевым навыком будущего.

Советы для стартапов 🚀

Два главных предиктора успеха:

1️⃣ Скорость выполнения
Опытные команды работают значительно быстрее, чем представляют себе новички.

2️⃣ Техническая экспертиза
Глубокое понимание технологий — самый редкий ресурс, поскольку технологии развиваются очень быстро.

Мультиагентные системы 🤝
Пока рано говорить о взаимодействии агентов от разных команд. Даже создание работающего одиночного агента остается сложной задачей.

• Ссылка на оригинальное видео беседы здесь
• Подробный транскрипт здесь
• Краткий транскрипт тут

#ai_agents #andrew_ng #artificial_intelligence #tech_trends #startup_advice
4👍4🔥2
Создание AI-тьютора испанского языка за час: разбор live-кодинга с Lovable 🤖

Команда Lovable вчера провела интересный онлайн-эксперимент — создание полноценного AI-тьютора для изучения испанского языка в прямом эфире. Разбираем, что получилось и какие технологии использовались.

Что такое Lovable? 🛠

Про Lovable уже писал много раз (пост 1, пост 2, пост 3, пост 4), но на всякий случай напомню.
Lovable — платформа для создания full-stack приложений с помощью естественного языка. Вместо написания кода разработчики общаются с AI, описывая нужную функциональность.

Основные возможности:
• Создание React-приложений через текстовые команды
• Интеграция с Supabase для backend-функций
• Автоматическое развертывание и управление базой данных
• Поддержка аутентификации и внешних API

Техническая архитектура проекта ⚙️

Стек технологий: 1️⃣ Frontend: React (единственный поддерживаемый фреймворк) 2️⃣ Backend: Supabase (база данных + Edge Functions) 3️⃣ AI: OpenAI API для обработки текста и голоса 4️⃣ Аутентификация: встроенная система Supabase

Структура приложения:
• Глобальная боковая панель навигации
• Страница дашборда (по умолчанию)
• Чат-интерфейс для общения с AI
• Панель настроек справа

Реализованная функциональность 📱

Основные возможности:
• Текстовый чат с AI-тьютором на испанском
• Голосовой ввод с преобразованием речи в текст
• Воспроизведение ответов AI в аудиоформате
• Перевод сообщений AI на английский
• Настройка скорости воспроизведения аудио

Система кредитов:
• Ограничение бесплатного использования
• Списание кредитов за AI-операции
• Отображение баланса в интерфейсе
• Модальное окно при исчерпании лимита

Практические советы по работе с Lovable 💡

Эффективные промпты:
• Разбивайте сложные задачи на мелкие шаги
• Будьте максимально конкретны в описаниях
• Указывайте технические детали (например, "используй OpenAI")
• Добавляйте требования к UI/UX сразу

Работа с ошибками:
• Не нажимайте "Try to fix" больше 2-3 раз
• Используйте функцию отката к предыдущим версиям
• Переформулируйте запрос, если AI "застрял"
• Применяйте Chat Mode для планирования сложных изменений

Интеграция с внешними сервисами 🔗

Supabase:
• Автоматическое создание таблиц для профилей пользователей
• Безопасное хранение API-ключей в секретах
• Edge Functions для серверной логики
• Миграции базы данных "на лету"

OpenAI API:
• Отдельные Edge Functions для каждой AI-задачи
• Обработка текста, речи и переводов
• Настраиваемые системные промпты
• Автоматическое развертывание при изменениях

Ограничения и особенности ⚠️

Текущие ограничения:
• Только React в качестве frontend-фреймворка
• Производительность снижается в пиковые часы
• Необходимость детального планирования промптов
• Ограниченная поддержка кастомных доменов

Рекомендации:
• Используйте Custom Knowledge для хранения требований проекта
• Применяйте гибридный подход: Lovable + ручное редактирование кода
• Интегрируйтесь с GitHub для версионирования
• Тестируйте функциональность после каждого изменения

Планы развития проекта 🚀

Следующие этапы: 1️⃣ Улучшение дизайна и UX 2️⃣ Добавление геймификации (рейтинг достижений) 3️⃣ Админ-панель для управления пользователями 4️⃣ Интеграция Stripe для монетизации 5️⃣ Запуск на Product Hunt

Эксперимент показал, что современные AI-инструменты позволяют создавать функциональные приложения без глубоких знаний программирования. Однако успех зависит от умения правильно формулировать задачи и понимания архитектуры веб-приложений.

Очень рекомендую посмотреть этот эксперимент в записи (1 час), или прочитать транскрипт. Я подготовил 2 версии транскрипта: • детальнуюкраткую

P.S. На этой неделе курса по AI-программированию и ИИ-агентам у нас была очень близкая тема - мы делали синхронный переводчик для зума, и также в одном из вариантов использовали lovable, в следующей заметке напишу чуть подробнее что и как мы делали и дам ссылки на веб-приложения, которые у нас получились.

#ai_development #nocode #lovable #supabase #react
❤‍🔥33👍3
Cursor 1.0: обзор ключевых обновлений 🚀

Вышла новая версия популярного AI-редактора кода Cursor 1.0.
Разберем долгожданные нововведения, которые могут быть полезны разработчикам.

BugBot — инструмент для автоматического ревью кода 🔍
Новый инструмент анализирует pull request'ы и находит потенциальные баги. При обнаружении проблем BugBot оставляет комментарии в GitHub с кнопкой "Fix in Cursor" для быстрого перехода к исправлению.

Упрощенная установка MCP серверов ⚡️ (наконец-то!)
• Установка MCP серверов теперь происходит в один клик
• Добавлена поддержка OAuth для аутентификации
• Доступен список официальных серверов в документации
Разработчики могут создавать кнопки "Add to Cursor" для своих проектов

Background Agent для всех пользователей! 🤖
Фоновый агент для кодирования стал доступен всем пользователям. Запуск через иконку облака в чате или комбинацию Cmd/Ctrl+E (для пользователей без режима приватности).

Поддержка Jupyter Notebooks 📊
Agent теперь может создавать и редактировать ячейки в Jupyter Notebooks. Функция работает с моделями Sonnet и особенно полезна для исследований и data science задач.

Memories Beta — память контекста 🧠
Новая функция позволяет Cursor запоминать факты из разговоров и использовать их в будущем. Воспоминания сохраняются на уровне проекта и управляются через настройки. Похожая функция существует в Windsurf уже давно, я рад, что Cursor тоже ее реализовали.

Улучшенные ответы в чате 📈
• Поддержка диаграмм Mermaid
• Рендеринг Markdown таблиц
• Визуализация данных прямо в разговоре

Обновленный интерфейс

Переработаны страницы настроек и дашборда с детальной аналитикой использования по инструментам и моделям.

Подробнее здесь

#cursor #ai #coding #development #tools
3👍1
7 стратегий промптинга из "утечки" системного промпта Claude 4

Недавно в сети появился предполагаемый системный промпт Claude 4 объемом 10,000 слов. Независимо от его подлинности, документ содержит ценные принципы для создания эффективных промптов 📝

Я решил провести анализ этого системного промпта для Claude 4, используя Claude 4 :)
Вот здесь результат анализа
А тут универсальный промпт, который я использовал (формировал и улучшал его по методике, которую описывал чуть раньше).

Затем мне на глаза попалась интересная статья на medium про 7 стратегий промптинга, которые используются в системном промпте Claude 4
Что порадовало - выводы практически совпадают. Только мой промпт, выявил 6, а не 7 приемов. Ну и мне были интересны также рекомендации по улучшению имеющихся промптов от самой модели, которая должна им следовать :)

Ключевая идея: промпт — это не магическое заклинание, а конфигурационный файл операционной системы. 90% внимания уделяется предотвращению ошибок, и только 10% — желаемому результату.

Основные стратегии:

1️⃣ Якорение идентичности
Начинайте промпт с фиксированных фактов: идентичность модели, дата, основные возможности. Это снижает нагрузку на рабочую память и стабилизирует рассуждения.

2️⃣ Явные условные блоки
Используйте четкие конструкции "если X, то Y" для граничных случаев. Неопределенность приводит к непоследовательности — будьте конкретны.

3️⃣ Трехуровневая маршрутизация неопределенности
• Вечная информация → прямой ответ
• Медленно меняющаяся → ответ + предложение проверки
• Актуальная → немедленный поиск

4️⃣ Грамматика инструментов с контрпримерами
Показывайте как правильные, так и неправильные примеры использования API. Негативные примеры учат не хуже позитивных.

5️⃣ Бинарные правила стиля
Вместо размытых указаний ("будь краток") используйте четкие запреты ("никогда не начинай с лести", "никаких эмодзи без запроса").

6️⃣ Позиционное усиление
В длинных промптах повторяйте критические ограничения каждые 500 токенов — внимание модели ослабевает в длинном контексте.

7️⃣ Рефлексия после использования инструментов
Добавляйте паузу для "размышлений" после вызова функций. Это улучшает точность в многошаговых цепочках рассуждений 🤔 (то, что мой промпт-анализатор не обнаружил)

Практический вывод

Думайте о промптах как об операционных системах. Будьте точны в намерениях и не бойтесь "оборонительного программирования" — детально прописывайте, чего модель делать НЕ должна.

Декларативный подход "если X, всегда Y" часто эффективнее императивного "сначала X, потом Y" ⚡️

@llm_notes

#claude4 #ai_engineering #llm_optimization #prompt
6❤‍🔥3👍3
🤖 Google выпустил open-source агента на базе Gemini 2.5

Компания Google представила полнофункциональный агент-исследователь с открытым исходным кодом, построенный на Gemini 2.5 и LangGraph.

Что умеет агент:
• Выполняет многоэтапный поиск в интернете
• Анализирует найденную информацию
• Синтезирует ответы с указанием источников
• Работает как человек-исследователь

Техническая архитектура:
1️⃣ Frontend на React
2️⃣ Backend на LangGraph
3️⃣ Интеграция с Google Search API
4️⃣ Рефлексивное мышление для улучшения поисковых запросов
5️⃣ Автоматическая генерация цитат

Проект интересен тем, что Google предоставил полный код как фронтенда, так и бэкенда. Это позволяет изучить весь пайплайн работы AI-агента от начала до конца.

🔗 Репозиторий: https://github.com/google-gemini/gemini-fullstack-langgraph-quickstart
DeepWiki по проекту здесь

@llm_notes

#ai_agents #langgraph #google_gemini #open_source #research_ai
6🔥32🤩1
This media is not supported in your browser
VIEW IN TELEGRAM
Zen MCP Server: интеграция Claude Code с другими AI-моделями 🤖

Несмотря на то, что Claude Code необычайно быстр и удобен, думаю, что многие из вас уже сталкивались с ситуацией когда он иногда "слегка забывает" предыдущие шаги при работе со сложными задачами из-за ограничений контекстного окна (даже при использовании опции /compact). В этот момент хочется следовать проверенному временем процессу.
Я когда работаю в Cursor/Windsurf/Roo для анализа существующей кодовой базы обычно использую Gemini 2.5 Pro, а для планирования использую o3 или o3-mini/o4-mini.
При использовании Claude Code у нас есть возможность использовать для планирования и сложного траблшутинга Claude 4 Opus, во всех других случаях - Claude 4 Sonnet.
Claude 4 Opus дорогой и даже при использовании Claude Max 5x плана (за $100 в месяц) можно близко подойти к лимитам его использования, и в голову начинает приходить мысль "а не перейти ли на Max 20x plan за $200 долларов в месяц", которых мне пока что жалко :)

Zen MCP Server позволяет решить эти проблемы, позволяя Claude Code взаимодействовать с другими моделями, у которых и контекстное окно значительно больше, и reasoning-способности на очень хорошем уровне.

Что это дает 📈

• Доступ к Gemini 2.5 Pro с контекстом до 1M токенов
• Работа с GPT O3 и другими моделями
• Возможность передать всю кодовую базу проекта для анализа

Основные инструменты 🛠

1️⃣ chat — мозговой штурм и обзор кода
2️⃣ thinkdeep — глубокий анализ сложных проблем
3️⃣ planner — пошаговое планирование
4️⃣ consensus — получение мнений от нескольких моделей
5️⃣ codereview — профессиональный код-ревью
6️⃣ precommit — проверка перед коммитом
7️⃣ debug — диагностика и исправление багов
8️⃣ analyze — анализ больших файлов
9️⃣ refactor — рефакторинг кода
🔟 tracer — отслеживание зависимостей
1️⃣1️⃣ testgen — генерация тестов
1️⃣2️⃣ настраиваемые инструменты

Поддерживаемые провайдеры 🌐
• Google Gemini (нативный API)
• OpenAI (O3 модель)
• OpenRouter (множество моделей через один API)
• Локальные модели (Ollama, vLLM, LM Studio)

Особенности⚡️
• Автоматический выбор подходящей модели для задачи
• Продолжение диалогов между моделями
• Работа с изображениями и диаграммами
• Обход ограничений MCP в 25K токенов

Проект с открытым исходным кодом, лицензия Apache 2.0.
Deepwiki по проекту здесь.
Настройка через Docker занимает около 5 минут.

@llm_notes

#claude #mcp #ai_tools #code_review #gemini
👍6542
🚀 Как Shopify внедряет ИИ: опыт руководителя инженерного отдела

Коллеги, добрый вечер!

Сегодня хочу обратить ваше внимание на очень интересное интервью (Ч1 | Ч2 | Ч3) с Фарханом Таваром, руководителем инженерного отдела Shopify, о том, как компания полностью перешла на ИИ и какие результаты это принесло.

🔍 Ранние эксперименты с ИИ

Shopify начала использовать инструменты ИИ задолго до хайпа вокруг ChatGPT:

"Мы уже давно используем инструменты искусственного интеллекта в инженерии. Я уверен, что мы были первой компанией за пределами GitHub, которая начала использовать GitHub Copilot. Это был 2021 год, за год до появления ChatGPT." - Фархан Тавар

Интересно, что Shopify получила доступ к Copilot, когда он еще не был доступен для коммерческого использования. Компания не платила за него около 2 лет, потому что не было тарифного плана, но взамен предоставляла много обратной связи.

💻 Инструменты ИИ в Shopify

Сейчас в компании используют несколько ключевых инструментов:

• GitHub Copilot - первый инструмент, который начали использовать
• Cursor - редактор с интегрированным ИИ
• Claude Code - для агентных рабочих процессов
• Внутренний прокси LLM - для безопасной работы с данными

Самое интересное, что Cursor активно используется не только инженерами:

"Финансы, продажи, поддержка — вот команды, которые используют Cursor. Они создают MCP-серверы для доступа к сервисам, а затем создают домашние страницы для себя." - Фархан Тавар

🧠 Философия использования ИИ

В Shopify есть несколько необычных подходов к использованию ИИ:

1️⃣ Нет ограничений на расходы на токены ИИ. Компания даже ведет таблицу лидеров, где чествует людей, которые используют больше всего токенов!

2️⃣ Руководство считает, что 1000 долларов в месяц на инженера за инструменты ИИ - это слишком дешево, если они повышают продуктивность хотя бы на 10%.

3️⃣ Компания рекомендует использовать более мощные (и дорогие) модели вместо моделей по умолчанию.

4️⃣ В процессе собеседований кандидатам разрешается и даже рекомендуется использовать ИИ-инструменты.

👨‍💻 Трансформация найма и обучения

Одно из самых интересных решений Shopify - масштабное расширение программы стажировок:

"В прошлом году у нас было около 25 стажёров за семестр. Я убедил Тоби (CEO) расширить программу до тысячи стажёров в год, основываясь на гипотезе, что они будут более восприимчивы к искусственному интеллекту, чем остальные сотрудники."

Компания верит, что молодые специалисты, выросшие в эпоху интернета, смартфонов и языковых моделей, помогут трансформировать корпоративную культуру.

🛠 Внутренние инструменты и практики

Shopify создала собственную экосистему для работы с ИИ:

• Внутренний прокси LLM для безопасной работы с данными
• Около 20 MCP-серверов для доступа к различным системам
• Библиотека промптов, которой могут пользоваться все сотрудники
• Система GSD ("Get Shit Done") с интегрированным ИИ для управления проектами

Интересно, что компания внедрила ИИ-компонент, который анализирует последние запросы на проверку кода и обсуждения в Slack, а затем формирует проект отчета о ходе работ.

🔑 Советы для компаний, желающих внедрить ИИ

Фархан Тавар считает, что самое главное - это личный пример:

"Ничто не работает лучше, чем демонстрация на собственном опыте. Вы должны сами активно применять эти технологии. Если вы пишете код, показывайте коллегам свой рабочий процесс с использованием ИИ, делитесь в общих каналах своими вопросами."

Также важно создать инфраструктуру, которая облегчает использование ИИ, и поощрять экспериментирование.

🌟 Ключевые выводы

1️⃣ Не экономьте на инструментах ИИ - их стоимость окупается повышением продуктивности

2️⃣ Привлекайте молодых специалистов, которые естественным образом воспринимают ИИ

3️⃣ Создавайте инфраструктуру для безопасного использования ИИ внутри компании

4️⃣ Поощряйте экспериментирование и обмен опытом

5️⃣ Показывайте личный пример использования ИИ

Интересно, что Shopify не боится инвестировать в ИИ и рассматривает его как долгосрочное преимущество, а не временное увлечение.

@llm_notes

#ai #engineering #shopify #productivity
🔥921👍1
Новые инструменты Replit Agent: веб-поиск, расширенное мышление и высокопроизводительный режим 🚀

Отличные новости для тех, кто как и я любит пользоваться Replit (много раз писал об этом инструменте для вайбкодинга, можно найти на канале по хэш-тегу #replit) для быстрого прототипирования стильных full-stack приложений.
Дизайн получается "из коробки" красивым, GUI работает "шустро", и можно спокойно добавлять бэкенд практически любой сложности (а не как в lovable или тем более bolt, которые сильно расчитывют на BaaS от Supabase), к тому же никаких проблем с деплоем - приложение разворачивается и публикуется парой кликов, и сразу мониторится.

Replit представил три новые функции для своего AI-агента, которые существенно расширяют возможности разработки приложений.

Веб-поиск 🔍


Агент теперь может самостоятельно искать информацию в интернете во время создания приложений. Вместо того чтобы вручную собирать данные и предоставлять контекст, достаточно описать задачу — агент найдет необходимую информацию сам.

Примеры использования:
• Поиск актуальных библиотек и пакетов
• Создание образовательных материалов с актуальными данными
• Анализ конкурентов
• Поиск бесплатных источников данных

Расширенное мышление 🧠

Функция дает агенту больше времени на "размышления" и анализ задачи. Это приводит к более точным решениям с первого раза и лучшей обработке сложных случаев.

Высокопроизводительный режим ⚡️

Включает модель Claude Opus 4 с увеличенным контекстным окном и улучшенными возможностями рассуждения для решения сложных задач.

Важные особенности ⚠️

1️⃣ Обе функции (расширенное мышление и высокопроизводительный режим) увеличивают стоимость использования

2️⃣ Веб-поиск включен по умолчанию для новых проектов, но требует активации в настройках агента

3️⃣ Комбинация всех трех функций значительно повышает качество результатов и сокращает количество итераций

Практический результат 📈

Как утверждают разработчики Replit, сочетание этих инструментов превращает агента из "младшего разработчика" в более опытного помощника, способного решать сложные задачи самостоятельно с минимальным количеством правок. Очень хочется в это верить. И будем проверять. В прошлый раз при переходе на более сложную модель Claude 3.7 агентая цепочка Langgraph внутри Replit Agent работала хуже, чем на Claude 3.5.

@llm_notes

#replit #ai #webdev #coding #aitools
5👍41🔥1
🤖 xAI представила Grok 4 и Grok 4 Heavy

Похоже ожидания этого лета (Grok 4 и GPT 5) постепенно оправдываются :)

Компания Илона Маска анонсировала новые модели искусственного интеллекта, которые показывают высокие результаты в различных тестах и бенчмарках.

Основные характеристики:

• Grok 4 — однозадачная модель с поддержкой голоса, изображений и контекстным окном 128K токенов
• Grok 4 Heavy — продвинутая версия с мультиагентной архитектурой для сложных задач
• Обе модели показали лучшие результаты на тестах Humanity's Last Exam (см. скриншот), Arc-AGI-2 и AIME
• Превосходят по показателям Gemini 2.5 Pro и OpenAI o3


Результаты тестирования от Artificial Analysis:

1️⃣ Индекс интеллекта: 73 балла (выше o3 и Gemini 2.5 Pro — по 70 баллов) 2️⃣ GPQA Diamond: рекордные 88% (предыдущий рекорд Gemini 2.5 Pro — 84%) 3️⃣ Humanity's Last Exam: 24% (против 21% у Gemini 2.5 Pro) 4️⃣ Скорость: 75 токенов/сек 5️⃣ Контекст: 256K токенов через API (меньше, чем у Gemini =1M, но больше, чем у Claude и Openai o3 = 200k)

Доступность и цены:


1️⃣ Grok 4 — подписка SuperGrok за $30/месяц
2️⃣ Grok 4 Heavy — план SuperGrok Heavy за $300/месяц
3️⃣ API доступ с контекстом 256K токенов — $3 за миллион входящих и $15 за миллион исходящих токенов

Контекст релиза 📊

Выпуск новых моделей происходит после критики предыдущей версии Grok 3, которая генерировала неприемлемый контент. xAI продолжает конкурировать с крупными игроками рынка ИИ, используя мощности суперкомпьютера Colossus.

@llm_notes

#grok4 #xai #llm #elonmusk #ai
👍2👎1🤔1
rtrvr.ai показал лучшие результаты в тестах Web Bench 🚀

Я несколько раз в постах (1|2) уже упоминал вскользь такой инструмент для автономного решения рабочих задач в браузере как rtrvr.ai

Инструмент чрезвычайно эффективный - может почти полностью заменить человека, который работает с браузером (не только по результативности, но и по скорости работы), и имеет возможность запуска задач по расписанию, поэтому хотел бы посвятить ему отдельный пост.

Платформа rtrvr.ai продемонстрировала впечатляющие результаты в бенчмарке Web Bench, достигнув 81,39% успешности выполнения задач при среднем времени выполнения всего 0,9 минуты (см. скриншот).

Ключевые особенности архитектуры 🔧

rtrvr.ai использует локальный подход через Chrome-расширение (также есть расширение для Edge браузера под Windows), работая напрямую с DOM веб-страниц:

• Обход систем защиты от ботов и CAPTCHA
• Использование уже авторизованных сессий пользователя
• Поддержка работы в нескольких вкладках одновременно
• Интеграция пользовательской логики через AI Function Calling (можно добавлять свои инструменты)

Производительность по типам задач 📊

1️⃣ Задачи чтения данных: 88,24% успешности 2️⃣ Операции записи: 65,63% успешности
3️⃣ Средняя стоимость: $0,12 за задачу

Решение проблемы "экспоненциального отказа" ⚡️

Платформа эффективно справляется с усложнением многошаговых процессов благодаря:

• Параллельному выполнению в нескольких вкладках
• Работе с "живым" DOM
• Локальной оркестрации задач

Такой подход имитирует поведение реального пользователя, что значительно снижает количество ошибок при работе с динамическими элементами и сложными формами. Единственно что - по новой открываемой браузерной вкладке требует повторной авторизации, надо еще раз нажимать "ок".

Практическое применение 💼

rtrvr.ai подходит как для индивидуальных пользователей, так и для корпоративного использования, предлагая быструю и доступную автоматизацию веб-задач с минимальной настройкой.

Как и в любом AI-инструменте, эффективность использования сильно зависит от правильной постановки задачи.
Поэтому имеет смысл ознакомиться с лучшими практиками использования и попробовать готовые workflow.

А еще есть классная штука - запись своего workflow, для автоматизации рутины, которую делаешь, но долго или сложно описать словами. Кажется, такая функция сейчас должна работать "из коробки" в любом современном браузере :)

У инструмента есть полнофункциональный Free Tier, который обновляется каждый месяц, поэтому можно потестировать и посмотреть насколько он вам подходит (250 Initial Credits, 100 Credits/Month).

Подробности: https://www.rtrvr.ai/blog/web-bench-results
Записи тестов здесь

@llm_notes

#web #automation #ai #agents #browser #rtrvr
2👍2🔥1
Заметки LLM-энтузиаста
#info #ai #tools Друзья, всем привет! Есть возможность очень сильно сэкономить на AI-инструментах, воспользовавшись вот этим офером https://www.lennysnewsletter.com/p/an-unbelievable-offer-now-get-one $200 за годовую подписку на 10 классных AI-инструментов…
🔥 Скидка на AI-инструменты возвращается!

Коллеги, всем привет! 👋

Для тех кто в апреле пропустил скидку на подписку на AI-инструменты есть возможность воспользоваться ей сейчас (https://www.lennysnewsletter.com/p/productpass)

💰 $200 или $350 за годовую подписку на 16 классных AI-инструментов (как правило, годовая подписка на 1-2 инструмента из списка стоит либо столько же, либо дороже)

Из апрельского списка "ушли" такие инструменты как v0, Cursor, Granola и Notion, но зато добавились такие интересные инструменты как:

🔧 n8n (https://n8n.io/) - самый популярный no-code инструмент для автоматизации процессов (я немного писал про работу с ним здесь и тут)

⚡️ Warp (https://www.warp.dev/) - кросс-платформенная агентная среда разработки, написанная на Rust (аналог Claude Code или Gemini CLI, но со своим UI)

🎨 Magic Patterns (https://www.magicpatterns.com/) - AI-инструмент для быстрого создания UI-прототипов, поддерживает командную работу и позиционируется для продуктовых команд

📋 ChatPRD (https://www.chatprd.ai/) - AI-инструмент для продукт-менеджеров, помогает создавать качественные PRDs (Product Requirement Document). Замечу, что для AI-программирования с моей точки зрения больше подойдет https://www.codeguide.dev/

🎬 Descript (https://www.descript.com/) - комплексная платформа для создания и редактирования видео и подкастов, которая использует AI для упрощения процесса создания контента

📊 Gamma (https://gamma.app/) - AI-инструмент для быстрого создания презентаций, документов и визуального контента

📱 Mobbin (https://mobbin.com/) - крупнейшая онлайн-библиотека UI/UX-паттернов и справочных материалов для дизайнеров и продуктовых команд. Бесплатные аналоги: https://dribbble.com/ и https://21st.dev/home (писал про него здесь)

🎤 Wispr Flow (https://wisprflow.ai/) - классный инструмент для транскрибации голоса в текст для мака, сам регулярно им пользуюсь при работе с AI-кодерами. У него есть бесплатный тир, которого при умеренном использовании может хватить

🔍 Raycast (https://www.raycast.ai/) - как я понял, это такой ИИ-помощник для мака: умный поиск, администрирование (можно дать ему доступ к календарю и файлам/папкам) и тому подобные вещи, похоже на AI-OS плагин. Скачивается только через VPN.

⚠️ Условия такие же: надо быть новым клиентом по выбранному продукту и не мешкать с активацией ключей. Если, конечно, не возьмете insider подписку за $350 - по ней пишут, что доступ к подпискам гарантированный.

Для тех кто уже как я оформлял подписку офер также действует - можно им воспользоваться на новые продукты из списка, но в связи со всплеском трафика соответствующая страничка (https://lennysproductpass.com/) недоступна

Главное через год не забыть отключить подписку, чтобы не получить продление по полной стоимости.

@llm_notes

#ai #tools #discount #productivity #automation #nocode
3👍2
🔧 Open Lovable: быстрое клонирование сайтов и создание React-приложений через чат с ИИ

Команда Mendable AI выпустила открытый инструмент для быстрого создания React-приложений.
Open Lovable (не путать с lovable.dev, который является коммерческим развитием GPT Engineer) позволяет клонировать любой сайт и воссоздать его как современное React-приложение за несколько минут.

Основные возможности:
• Создание приложений через чат с ИИ
• Клонирование существующих веб-сайтов
• Автоматическая генерация React-кода
• Поддержка современного стека технологий

Технические требования: 1️⃣ E2B API ключ для песочниц 2️⃣ Firecrawl API для веб-скрапинга 3️⃣ Один из ИИ провайдеров: Anthropic, OpenAI или Groq

Установка:
git clone https://github.com/mendableai/open-lovable.git
cd open-lovable
npm install
npm run dev


Проект распространяется под лицензией MIT и уже набрал 3.1k звёзд на GitHub 📈

Инструмент может быть полезен для быстрого прототипирования и создания MVP, особенно когда нужно воссоздать дизайн существующего сайта.

На скриншоте - моя попытка склонировать сайт lovable.dev
Результат, который получился, можно найти по ссылке

DeepWiki по проекту здесь (в этот раз почему-то без схем архитектуры)

@llm_notes

#react #ai #vibecoding #opensource #javascript #lovable
👍4
🚀 Claude Sonnet 4 получил поддержку контекстного окна в 1 миллион токенов

Anthropic наконец-то увеличила контекстное окно Claude Sonnet 4 до 1 млн токенов — это в 5 раз больше предыдущего лимита (то, чего я ждал еще в мае :)
Теперь модель может обрабатывать целые кодовые базы с 75,000+ строк кода или десятки исследовательских работ за один запрос.

Новые возможности:

• Анализ больших кодовых баз — загрузка исходного кода, тестов и документации для понимания архитектуры проекта
• Синтез документов — обработка обширных наборов документов: контрактов, исследований, технических спецификаций
• Контекстно-зависимые агенты — создание агентов, которые сохраняют контекст на протяжении сотен вызовов инструментов

💰 Ценообразование API:

1️⃣ Промпты ≤ 200K токенов: $3/MTok (вход), $15/MTok (выход)

2️⃣ Промпты > 200K токенов: $6/MTok (вход), $22.50/MTok (выход)

При использовании кэширования промптов и пакетной обработки можно получить дополнительную экономию до 50% 📉

Отзывы клиентов:

🔧 Bolt.new — CEO Eric Simons отмечает, что расширенный контекст позволяет работать с крупными проектами, сохраняя высокую точность (мой комментарий: возможно, кстати, недавние успехи bolt, которые я наблюдал, при решении практических задач, связаны с тем, что они использовали модель с расширенным контекстным окном)

⚡️ iGent AI — разработчики AI-партнера Maestro для создания кода. CEO Sean Ward подчеркивает, что 1M токенов открывает возможности для многодневных сессий работы с реальными кодовыми базами.

📅 Доступность:

Функция пока находится в публичной бете для клиентов с Tier 4 и кастомными лимитами на Anthropic API (подробнее про Tier 4 здесь). Также доступна в Amazon Bedrock, скоро появится в Google Cloud Vertex AI.
В течение ближайших недель обещают распространить на более широкий круг пользователей.
Ждем с нетерпением!

• Официальный анонс по ссылке.
• Подробная документация тут.

@llm_notes

#claude #anthropic #context #ai #llm #1m
12❤‍🔥21
Коллеги, насколько интересен будет ежедневный дайджест новостей?

Такую подборку каждый может сделать для себя самостоятельно, и проще всего использовать manus или flowith c функцией scheduled tasks. Но возможно, не всем захочется тратить на это свои кредиты на данных платформах.

Пример такой подборки со ссылками на первоисточники ниже.

📊 Дайджест новостей ИИ за 19 августа 2025

🔄 Meta реструктурирует ИИ-подразделение

Meta разделила свое ИИ-подразделение Meta Superintelligence Labs на четыре группы. Новая структура включает исследования, разработку "суперинтеллекта", продукты и инфраструктуру.

Основные изменения:
• Ожидается уход некоторых руководителей
• Рассматривается сокращение штата (сейчас тысячи сотрудников)
• Изучается использование сторонних ИИ-моделей
• Возможен переход к "закрытым" моделям вместо open-source
• Капитальные расходы могут достичь $72 млрд в этом году

The New York Times

📈 Американцы опасаются влияния ИИ на рынок труда

Опрос Reuters/Ipsos среди 4,446 американцев показал:
• 71% обеспокоены массовым вытеснением рабочих мест
• 77% беспокоятся об использовании ИИ для политического хаоса
• 48% против использования ИИ в военном таргетинге
• 61% волнует энергопотребление ИИ-технологий
• 67% опасаются замены человеческих отношений ИИ-компаньонами

Reuters

⚛️ Запуск квантовой ИИ платформы QIDO

В Токио представили QIDO (Quantum-Integrated Discovery Orchestrator) — совместный проект Mitsui, QSimulate и Quantinuum. Платформа объединяет квантовые алгоритмы с классическим ИИ для точного моделирования химических реакций и ускорения разработки лекарств.

HPC Wire | The Quantum Insider

💰 Крупные инвестиции в ИИ-стартапы

1️⃣ Databricks привлекает $1+ млрд при оценке $100+ млрд
2️⃣ EliseAI получила $250 млн от A16z, оценка $2.2 млрд
3️⃣ Eight Sleep привлекла $100 млн для ИИ в умных матрасах
4️⃣ OpenAI готовит продажу акций при оценке ~$500 млрд

Reuters (Databricks) | Reuters (EliseAI) | TechCrunch

🆕 Новые продукты и обновления

Meta AI-дубляж: автоперевод видео с сохранением голоса (английский-испанский)
Adobe Acrobat Studio: ИИ-платформа для анализа до 100 документов
Nvidia B30A: новый ИИ-чип для Китая на архитектуре Blackwell

TechCrunch (Meta) | The Verge (Adobe) | Reuters (Nvidia)

⚠️ "Зомби-стартапы" в Кремниевой долине

Технологические гиганты переманивают основателей ИИ-стартапов, избегая регулятивного контроля при поглощениях. После таких сделок компании становятся "зомби" — формально существуют, но лишены ключевых кадров.

CNBC

🚨 Этические проблемы

• Скандал с Meta AI-чатботами: внутренние документы показали романтические беседы с детьми
• Расовая предвзятость в ИИ-системах распознавания изображений
• Исследование показало быструю зависимость врачей от ИИ-помощников

The Guardian | NPR Illinois

@llm_notes

#ai_news #meta_restructuring #quantum_ai #ai_investments #ai_ethics
5👎4🔥3👍2
ИИ-новости 20 августа: предупреждения, падения и прорывы 🤖

(6 минутный подкаст можно послушать по ссылке)

Microsoft бьет тревогу: растет число случаев "ИИ-психоза" ⚠️

Мустафа Сулейман из Microsoft предупредил о новой проблеме — люди начинают воспринимать ИИ как живых существ и формируют с ними нездоровые отношения.

Что происходит:
• Пользователи верят в романтические отношения с ИИ
• Убеждены в получении сверхспособностей от чатботов
• Доверяют ИИ в серьезных жизненных решениях

Реальный случай: житель Шотландии поверил ChatGPT о компенсации в £5 млн, что привело к психическому срыву.

А нам то что?
Полезно
помнить, что ИИ — это все-таки программа, а не лучший друг 🤖. Особенно когда речь идет о важных решениях и крупных суммах денег 💰.

Источники: [BBC News]


Технологические акции падают из-за сомнений в ИИ 📉

Инвесторы начинают сомневаться в окупаемости миллиардных вложений в искусственный интеллект.

Цифры падения:
• Nasdaq: -1,5%
• S&P 500: -0,6%
• 95% ИИ-проектов терпят неудачу (исследование MIT)

71% американцев беспокоятся о потере рабочих мест из-за ИИ.

А нам то что?
Пора перестать покупать акции только потому, что в названии компании есть слово "AI" 🤦‍♂️. И да, диверсификация портфеля по-прежнему актуальна, даже в эпоху ИИ 💼.

Источники: [Reuters]


Meta заморозила найм в ИИ-подразделении 🧊

После агрессивной кампании найма (50+ специалистов с пакетами свыше $100 млн) Meta приостановила пополнение команды ИИ.

Причины:
• Реструктуризация подразделения
• Давление инвесторов по окупаемости
• Базовое организационное планирование

А нам то что?
Если вы мечтали о зарплате в $100 млн за работу с ИИ — увы, поезд ушел 🚂💨. Зато теперь можно не переживать о том, что не успели на него запрыгнуть 😅.
А если серьезно: рынок труда в ИИ оказался не таким бесконечно растущим, как казалось 📈. Хорошее время для развития смежных навыков 🎯.

Источники: [Reuters]


Прорывы ИИ в медицине 🏥

🔹 Билл Гейтс запустил конкурс на $1 млн для ИИ-решений против болезни Альцгеймера

🔹 OpenEvidence набрала 100% на медицинском экзамене США (USMLE) — первая в истории

🔹 Epic Systems разрабатывает 200 ИИ-функций для медицинских записей

А нам то что?
Скоро ИИ будет лечить нас лучше врачей 👨‍⚕️, но при этом мы будем сходить с ума от общения с ним 🤪. Ирония судьбы в чистом виде 🎭.
А если серьезно: удивительно, но медицина — одна из немногих сфер, где ИИ действительно показывает впечатляющие результаты 👨‍⚕️. Возможно, именно здесь стоит следить за развитием технологий особенно внимательно 🔬.

Источники: [HIStalk Healthcare AI News]


Выводы дня 🎯

Индустрия ИИ переживает период переосмысления: технология показывает впечатляющие результаты в медицине, но растут опасения о психологических рисках и коммерческой окупаемости. Время эйфории сменяется более взвешенным подходом.

@llm_notes

#ai_news #tech_market #ai_psychology #medical_ai #investment_risks
🆒5😁4👍3👎1
Вчерашний дайджест новостей, на мой взгляд, был не очень интересным. Поэтому не стал его верстать и публиковать. А вот сегодняшний - достаточно любопытный, поэтому приятного чтения!

(13 минутный подкаст можно послушать по ссылке)

AI Дайджест: 22 августа 2025 📰

1. Apple и Google: неожиданный союз для Siri 🤝

Apple ведет переговоры с Google об использовании Gemini AI для модернизации Siri. Компания рассматривает внешнее партнерство после того, как собственная разработка застопорилась.

Основные моменты:
• Решение еще не принято окончательно
• Обновление Siri отложено на год из-за технических проблем
• Apple также общалась с Anthropic и OpenAI
• Акции Alphabet выросли на 3.7% после новости

А нам то что? 🤷‍♂️ Наконец-то Siri может стать умнее чайника! Правда, для этого Apple придется просить помощи у конкурентов.

А если серьезно: пользователи iPhone могут получить более продвинутого голосового помощника, хотя это означает, что даже Apple признает превосходство чужих AI-технологий.

[Источник: Reuters]

3. MIT: 95% корпоративных AI-проектов проваливаются 📉

Исследование MIT показало, что только 5% компаний получают отдачу от AI-инвестиций, несмотря на $30-40 миллиардов трат. Проблема не в качестве моделей, а в "разрыве обучения" (отсутствие культуры использования ИИ в работе).

Ключевые выводы:
• Исследование охватило 150 интервью и 350 опросов
Готовые AI-инструменты работают лучше самодельных
• Наибольший ROI в автоматизации back-office
• Половина бюджетов тратится на продажи и маркетинг

А нам то что? 🎯 Выходит, что AI — это как спортзал: все покупают абонемент, но мало кто ходит 😉

А если серьезно: это отрезвляющая статистика для инвесторов и напоминание, что внедрение AI требует не только денег, но и грамотной стратегии. Про рекомендуемый Mckinsey подход для разрешения "парадокса генеративного ИИ" и о том, что это такое писал здесь.

[Источник: Fortune]


4. Армия США инвестирует $99.5 млн в Scale AI 🎖

Пентагон заключил контракт с Scale AI на исследования и разработки в сфере военного ИИ сроком до 2030 года. Это уже второй подобный контракт компании с армией.

Детали контракта:
• Фиксированная цена $99.5 миллионов
• 11 заявок на тендер
• Предыдущий контракт был на $90.8 млн в 2020 году

А нам то что? 🤖 Теперь ИИ будет не только писать стихи, но и планировать военные операции. Что может пойти не так?

А если серьезно: это показывает стратегическую важность AI-технологий для национальной безопасности США и может ускорить развитие гражданских применений.

[Источник: GovConWire]


5. Экологическая цена AI-революции 🌍

Массовое внедрение ИИ приводит к значительному росту потребления энергии и воды, что вызывает обеспокоенность экологическими последствиями развития технологий.

А нам то что? ⚡️ Оказывается, ChatGPT не только ест наши данные, но и планету заодно.

А если серьезно: это напоминание о том, что технологический прогресс должен учитывать экологические издержки, и, возможно, именно под этим предлогом после того как "борьба за умы" будет закончена и рынок LLM "устаканится", западные провайдеры "внезапно" могут начать повышать цену за токен. И тогда отечественные провайдеры LLM на их фоне станут выглядеть выгодными по цене, и мы станем ими пользоваться не только ради безопасности и соблюдения требований регуляторов.

[Источник: ABC News]


6. Analog Devices на волне AI-оптимизма 📈

Акции компании выросли на 3.61% до $255.87, достигнув годового максимума благодаря успехам в промышленном секторе и превышению ожиданий в Q3.

А нам то что? 💹 Еще одна компания решила прокатиться на AI-хайпе. Инвесторы скупают все, что хоть как-то связано с искусственным интеллектом.

А если серьезно: это показывает, как AI-тренд все еще влияет на весь tech-сектор, создавая возможности для роста даже традиционных полупроводниковых компаний.

[Источник: AInvest]

@llm_notes

#ai_news #tech_industry #corporate_ai #military_ai #ai_investments
22🆒21
🤖 ИИ-дайджест: 23 августа 2025

Пока одни эксперты говорят о замедлении прогресса в ИИ, другие продолжают выпускать новые модели 😉

[5 мин подкаст здесь]

📉 Эксперты: прогресс в ИИ замедлился


Кэл Ньюпорт из Джорджтаунского университета заявил NPR, что развитие больших языковых моделей застопорилось после GPT-4.

Основные тезисы:
• Экспоненциальный рост закончился
• Индустрия переключилась с увеличения размера моделей на улучшение существующих
• Массовая безработица от ИИ в ближайшие 5 лет маловероятна

А нам то что? 🤷‍♂️ Можно перестать паниковать, что завтра нас заменят роботы 😉

[Источник: NPR]


💸 Продолжают расти опасения "пузыря ИИ"


The Guardian предупреждает о возможном крахе рынка ИИ-акций. Nvidia упала на 3%, Palantir — почти на 10%. При этом P/E коэффициент Palantir превышает 500 при норме до 50.

Тревожные сигналы:
• Сэм Альтман назвал некоторые оценки компаний "безумными"
• 95% компаний не видят отдачи от инвестиций в генеративный ИИ (см. вчерашний дайжест)
• ФРС пытается стабилизировать рынки

А нам то что? 📈 Если вы не торгуете ИИ-акциями, можете спокойно наблюдать за их динамикой.

[Источник: The Guardian]

🚀 Новые модели продолжают выходить

Несмотря на озвученный выше пессимизм, многие компании представили несколько интересных релизов:

Cohere Command-R (Reasoning):
• Специализируется на сложных многоэтапных задачах
• Работает на одном GPU
• Открытые веса для исследователей

DeepSeek V3.1:
• Архитектура mixture-of-experts
• Отличные результаты в программировании
Совместима с API Anthropic!

ByteDance SEED-OSS-36B:
• Контекстное окно 512,000 токенов
• Обучена только на несинтетических (!) данных

А нам то что? 🛠 Больше бесплатных инструментов для экспериментов — всегда хорошо. А если серьезно — появляются более специализированные решения, которые могут быть полезнее универсальных гигантов для конкретных задач.

[Источник: AI Daily News]


💰 ServiceNow показывает, как зарабатывать на ИИ


Одна из немногих компаний, которая реально монетизирует ИИ. Успешно переводит клиентов на премиальные лицензии со встроенным генеративным ИИ.

Цифры:
• $10.92 млрд текущих обязательств
• Цель: $1 млрд годовой выручки от ИИ к 2026 году
• Акции выросли на 2.86%

А нам то что? 💼 Наконец-то пример того, как ИИ может приносить реальные деньги, а не только сжигать их. А если серьезно — показывает путь для других компаний: не гнаться за хайпом, а спокойно и методично решать свои конкретные бизнес-задачи.

[Источник: AInvest]


🔥 Корпорации тратят миллиарды впустую

Исследование показало парадокс: инвестиции в ИИ растут на 94% до $61.9 млрд, но 42% компаний отказываются от большинства ИИ-проектов.

Статистика:
• JPMorgan дал доступ к ИИ 200,000 сотрудников
• Половина экономит до 4 часов в неделю
• Но финансовую отдачу считают единицы

А нам то что? 🤦‍♂️ Можно не переживать, что отстаете от трендов — даже большие западные корпорации не знают, что делать с ИИ. И вроде бы хороший повод подумать дважды, прежде чем внедрять ИИ ради ИИ. Но не надо забывать, что ни одна из технологий, которая в итоге перевернула мир, не показала свою эффективность сразу.

Примеры:
Электричество (1880-е - 1920-е)
• 40+ лет потребовалось для полной трансформации промышленности
• Первые фабрики просто заменяли паровые двигатели на электрические, не меняя процессы
• Настоящая революция началась только когда переосмыслили всю организацию производства (ничего не напоминает?)

Персональные компьютеры (1970-е - 1980-е)
• 1977: Кен Олсен (DEC): "Нет причин, по которым кому-то может понадобиться компьютер дома"
• Первые годы: Высокая стоимость, сложность использования, неясные бизнес-модели
• Реальность: Революция произошла через 10-15 лет

Ну и то что мы все с вами помним: Интернет (1990-е - 2000-е)
• 1995: Многие эксперты считали интернет "игрушкой для гиков"
• 1999: Нобелевский лауреат Пол Кругман предсказывал, что влияние интернета на экономику будет не больше, чем у факса
• Реальность: Потребовалось ~15 лет для массового коммерческого успеха

[Источник: The Seattle Times]

@llm_notes

#ai_news
31👍1
ИИ-дайджест: 25 августа 2025 🤖

[6 мин. подкаст здесь]

1. Microsoft выпустила VibeVoice-1.5B — модель для синтеза длинной речи

Microsoft представила открытую модель VibeVoice-1.5B, которая может генерировать до 90 минут непрерывной речи с четырьмя разными голосами. Модель построена на базе Qwen2.5-1.5B и использует диффузионные алгоритмы. Поддерживает английский и китайский языки, доступна под лицензией MIT.

А нам то что? 🤷‍♂️ Теперь можно создавать подкасты, где ИИ будет болтать сам с собой на английском полтора часа подряд 😉 Технология открывает возможности для создания образовательного контента (пока только для китайцев и англичан), аудиокниг и подкастов на английском/китайском без привлечения дикторов. С нетерпением ждем поддержку русского языка.

[Источник] 🔗


2. Обнаружена масштабная ИИ-пропаганда с китайскими корнями

Исследователи Университета Вандербильта выявили компанию GoLaxy, связанную с китайским правительством, которая использует ИИ для персонализированных пропагандистских кампаний в Гонконге и Тайване. Система создает индивидуальные профили тысяч американских политиков и адаптирует сообщения под каждого получателя.

А нам то что? 🎭 Отлично, теперь даже пропаганда стала персонализированной — скоро ИИ будет знать, какие именно фейки нам больше нравятся 😉

А если серьезно: это сильный сигнал о необходимости развития инструментов детекции ИИ-контента и нашего собственного критического мышления при потреблении информации.

[Источник] 🔗


3. ИИ научился предсказывать погоду на месяцы вперед

В журнале Nature опубликовано исследование о модели ACE2, которая делает сезонные прогнозы погоды на 1-3 месяца. Модель обучена только на исторических данных ERA5 и показывает результаты, сравнимые с физическими моделями климата.

А нам то что? ☔️ Наконец-то можно будет точно знать, что синоптики ошибутся не только на завтра, но и на три месяца вперед 😉

А если серьезно: более точные долгосрочные прогнозы критически важны для сельского хозяйства, энергетики и планирования инфраструктуры.

[Источник] 🔗


4. MIT и Harvard создали тест на "понимание" для ИИ

Исследователи разработали метрику "inductive bias" для оценки того, насколько глубоко языковые модели понимают предметную область. Тестирование показало, что современные модели плохо выводят общие закономерности из частных случаев.

А нам то что? 🧠 Ученые официально подтвердили то, что мы и так знали — ИИ умеет красиво говорить, но не всегда понимает, о чем говорит 🥸

А если серьезно: понимание ограничений ИИ поможет более осознанно применять эти технологии в науке и критически важных областях.

[Источник] 🔗


5. Новый подход к созданию пользовательских симуляторов

В arXiv опубликована работа о фреймворке для создания симуляторов пользователей в рекомендательных системах. Подход использует LLM для генерации процессов принятия решений и дистилляцию данных на основе оценки неопределенности.

А нам то что? 🎯 Теперь ИИ будет еще лучше имитировать наши предпочтения — скоро он будет знать, что мы хотим купить, раньше нас самих.

А если серьезно: более точные пользовательские модели помогут создавать действительно полезные рекомендации вместо навязывания ненужного контента.

[Источник] 🔗


@llm_notes

#ai_news #voice_synthesis #ai_propaganda #weather_prediction #user_modeling
👍42