Forwarded from Технозаметки Малышева
Media is too big
VIEW IN TELEGRAM
Claude 4.6 Sonnet и сбой в Матрице
Короче это буквально я сегодня утром.
Есть у меня, кто не знает, бот, который анализирует логи каналов и каждое утро присылает саммари того, что обсуждали за сутки.
Делает это бесплатно, т.е. даром.
И всё было хорошо примерно год.
40+ каналов разных - все работало без сбоев.
И тут сегодня утром вдруг он начинает сыпать ошибками разметки ни с того ни с сего, - я его этот год вообще не трогал ни разу.
А работает он, надо сказать, на Антропике - Haiku модель.
Ну и я предположил, что вМатрице Антропике, видимо, что-то поменяли и готовят релиз, ну потому, что других причин то вроде нет.
И вот, - нате получите, распишитесь:
Anthropic выкатила новый Sonnet 4.6 — дефолтная модель для Free и Pro планов в claude.ai. Цена прежняя: $3/$15 за миллион токенов.
Ключевое:
Контекстное окно 1M токенов (бета)
В Claude Code пользователи предпочли Sonnet 4.6 вместо Sonnet 4.5 в 70% случаев
Даже против Opus 4.5 (фронтир от ноября 2025) — предпочтение в 59% случаев
Серьёзный прогресс в computer use — на OSWorld бенчмарке стабильный рост за 16 месяцев (полезно для OpenClaw)
Что улучшили:
- Кодинг: меньше overengineering, меньше «лени», лучшее следование инструкциям
- Меньше галлюцинаций и ложных заявлений об успехе
- Фронтенд-код и финансовый анализ — клиенты отмечают заметно более качественный визуал
- Устойчивость к prompt injection на уровне Opus 4.6
API: claude-sonnet-4-6, поддержка adaptive и extended thinking, context compaction (бета).
По сути Sonnet 4.6 закрывает задачи, для которых раньше нужен был Opus — но по цене Sonnet.
Matrix has you Neo
#AI #Claude #Anthropic #Sonnet #агенты
———
@tsingular
Короче это буквально я сегодня утром.
Есть у меня, кто не знает, бот, который анализирует логи каналов и каждое утро присылает саммари того, что обсуждали за сутки.
Делает это бесплатно, т.е. даром.
И всё было хорошо примерно год.
40+ каналов разных - все работало без сбоев.
И тут сегодня утром вдруг он начинает сыпать ошибками разметки ни с того ни с сего, - я его этот год вообще не трогал ни разу.
А работает он, надо сказать, на Антропике - Haiku модель.
Ну и я предположил, что в
И вот, - нате получите, распишитесь:
Anthropic выкатила новый Sonnet 4.6 — дефолтная модель для Free и Pro планов в claude.ai. Цена прежняя: $3/$15 за миллион токенов.
Ключевое:
Контекстное окно 1M токенов (бета)
В Claude Code пользователи предпочли Sonnet 4.6 вместо Sonnet 4.5 в 70% случаев
Даже против Opus 4.5 (фронтир от ноября 2025) — предпочтение в 59% случаев
Серьёзный прогресс в computer use — на OSWorld бенчмарке стабильный рост за 16 месяцев (полезно для OpenClaw)
Что улучшили:
- Кодинг: меньше overengineering, меньше «лени», лучшее следование инструкциям
- Меньше галлюцинаций и ложных заявлений об успехе
- Фронтенд-код и финансовый анализ — клиенты отмечают заметно более качественный визуал
- Устойчивость к prompt injection на уровне Opus 4.6
API: claude-sonnet-4-6, поддержка adaptive и extended thinking, context compaction (бета).
По сути Sonnet 4.6 закрывает задачи, для которых раньше нужен был Opus — но по цене Sonnet.
Matrix has you Neo
#AI #Claude #Anthropic #Sonnet #агенты
———
@tsingular
Forwarded from Agentic Engineer
Зачем делят AGENTS.md / CLAUDE.md на несколько файлов ❓
TL;DR: AGENTS.md/CLAUDE.md дробят, чтобы сужать контекст, давать правила "по месту" (для конкретного модуля) и не упираться в лимиты - и OpenAI это прямо заложила в механику Codex.
1️⃣ Контекст "по месту", а не простыня на весь репо
Идея - держать базовые правила в корне, а узкие - рядом с кодом (сервис/пакет/папка). Тогда агент подтягивает то, что релевантно текущей директории. В Codex это оформлено как "цепочка инструкций": он собирает файлы от корня проекта до текущей папки, и файлы ближе к текущей директории "перекрывают" ранние.
2️⃣ Официально поддержанные override`s и приоритеты
Codex проверяет в каждой папке сначала AGENTS.override.md, потом AGENTS.md, и берёт максимум один файл на директорию. Это и есть "переопределение правил" без копипасты всего документа.
3️⃣ Лимит размера 🔜 проще дробить, чем раздувать один файл
В документации Codex явно сказано, что он прекращает добавлять инструкции, когда суммарный размер достигает лимита (по умолчанию 32 KiB) - и прямо рекомендует разносить инструкции по вложенным директориям, если упираетесь в кап.
👇 👇 👇
Как это делает OpenAI у себя
Про практику OpenAI есть публичный сигнал: в обзоре формата отмечают, что у OpenAI-организации "десятки AGENTS.md" по подкомпонентам, т.е. подход именно "много маленьких по месту", а не один общий.
Плюс, сама документация Codex описывает "слоение" инструкций: глобальные (~/.codex), репо-уровень (корень) и локальные overrides (подпапки).
〰️ 〰️ 〰️ 〰️ 〰️ 〰️ 〰️ 〰️
Дробление AGENTS.md/CLAUDE.md - это важный инженерный приём, который привнесёт тебе следующей пользы:
🟢 меньше шума в контексте,
🟢 правила применяются там, где нужно,
🟢 проще сопровождать,
🟢 не ловить silent-truncation на лимитах.
@data_engi
#openai #agents #hack #trix #ai #llm #dev
TL;DR: AGENTS.md/CLAUDE.md дробят, чтобы сужать контекст, давать правила "по месту" (для конкретного модуля) и не упираться в лимиты - и OpenAI это прямо заложила в механику Codex.
Идея - держать базовые правила в корне, а узкие - рядом с кодом (сервис/пакет/папка). Тогда агент подтягивает то, что релевантно текущей директории. В Codex это оформлено как "цепочка инструкций": он собирает файлы от корня проекта до текущей папки, и файлы ближе к текущей директории "перекрывают" ранние.
Codex проверяет в каждой папке сначала AGENTS.override.md, потом AGENTS.md, и берёт максимум один файл на директорию. Это и есть "переопределение правил" без копипасты всего документа.
В документации Codex явно сказано, что он прекращает добавлять инструкции, когда суммарный размер достигает лимита (по умолчанию 32 KiB) - и прямо рекомендует разносить инструкции по вложенным директориям, если упираетесь в кап.
Как это делает OpenAI у себя
Про практику OpenAI есть публичный сигнал: в обзоре формата отмечают, что у OpenAI-организации "десятки AGENTS.md" по подкомпонентам, т.е. подход именно "много маленьких по месту", а не один общий.
Плюс, сама документация Codex описывает "слоение" инструкций: глобальные (~/.codex), репо-уровень (корень) и локальные overrides (подпапки).
Дробление AGENTS.md/CLAUDE.md - это важный инженерный приём, который привнесёт тебе следующей пользы:
@data_engi
#openai #agents #hack #trix #ai #llm #dev
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Machinelearning
Anthropic перенесла часть инженерной культуры: тестирование, бенчмаркинг и итеративность в процесс создания навыков и для этого теперь не нужно уметь писать код.
В skill-creator добавили автоматические тесты, бенчмарки и A/B-сравнения и теперь создатели навыков могут измерить, работает ли skill, до его запуска в продакшен.
Автор задает тестовые промпты и описывает, как выглядит нужный результат. Skill-creator запускает их параллельно: с навыком и без него.
Независимый агент-сравниватель оценивает результаты вслепую, не зная, какая версия перед ним, и сразу показывает, дает ли навык реальный прирост.
Внутренние тесты Anthropic: точность PDF-навыка выросла с 6/8 до 7/8, Excel-навыка - с 6/8 до полных 8/8.
Отдельный бенчмарк-режим дает детальную картину по каждому прогону: процент успешных тестов, время выполнения, расход токенов.
На примере PDF-навыка при работе с незаполняемыми формами и таблицами из многостраничных документов успешность выросла с 40 до 100% (при том же времени выполнения).
Если базовая модель начинает проходить тесты без загруженного навыка - это сигнал о том, что навык уже есть в ее поведении и skill можно отключить. Результаты тестов хранятся локально и интегрируются в CI-системы.
Claude решает, когда подключить навык, исключительно по короткому текстовому описанию в системном промпте.
Skill-creator теперь анализирует эти описания против тестовых промптов и предлагает правки, снижающие и ложные срабатывания и пропуски.
По результатам внутреннего прогона триггеринг стал лучше на 5 из 6 публичных навыков.
Все обновления уже доступны в вебе и Cowork. Для Claude Code обновили плагин или вот он же - в репозитории, если ставить руками.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Agentic Engineer
Forwarded from NN
Разрабам в кремниевой долине начали платить токенами — айтишники просят бюджеты на постоянный запуск нейронок.
Затраты на ИИ для одного инженера оценивают в $100 тыс. в год. Токены составляют до 20% от общей стоимости содержания синьора. Взамен компании ожидают кратного роста продуктивности.
Ждем подписку на ChatGPT вместо ДМС?
Затраты на ИИ для одного инженера оценивают в $100 тыс. в год. Токены составляют до 20% от общей стоимости содержания синьора. Взамен компании ожидают кратного роста продуктивности.
Ждем подписку на ChatGPT вместо ДМС?
Надо хотя бы что-то из этого прочесть! 😅
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Data&AI Insights
One_developer,_team_power_The_future_of_AI_driven_DevSecOps.html
229.4 KB
🔗 One developer, team power: The future of AI-driven DevSecOps
📖 tgf
📌 Будущее AI-driven DevSecOps: один разработчик как команда
✏ Введение
Распространённое представление о том, что продвинутые AI-инструменты позволят инженерам обходиться без коллег, — ошибочно.
Искусственный интеллект действительно повышает планку того, чего может достичь один разработчик, но одновременно растут и требования к его знаниям.
Инженер, использующий AI для генерации инфраструктурного кода, по-прежнему должен оценивать его безопасность.
Тот, кто применяет AI для сканирования уязвимостей, обязан понимать бизнес-логику сканируемого продукта.
Чем больше задач берёт на себя AI, тем шире должен быть кругозор для проверки его результатов.
[Полное описание в прикрепленном файле]
#AI #DevOps #программирование
📖 tgf
📌 Будущее AI-driven DevSecOps: один разработчик как команда
✏ Введение
Распространённое представление о том, что продвинутые AI-инструменты позволят инженерам обходиться без коллег, — ошибочно.
Искусственный интеллект действительно повышает планку того, чего может достичь один разработчик, но одновременно растут и требования к его знаниям.
Инженер, использующий AI для генерации инфраструктурного кода, по-прежнему должен оценивать его безопасность.
Тот, кто применяет AI для сканирования уязвимостей, обязан понимать бизнес-логику сканируемого продукта.
Чем больше задач берёт на себя AI, тем шире должен быть кругозор для проверки его результатов.
[Полное описание в прикрепленном файле]
#AI #DevOps #программирование
Forwarded from Data&AI Insights
Why_Agents_Need_Ontology.html
3.7 MB
🔗 Why Agents Need Ontology
📖 tgf
📌 Почему агентам нужна онтология
✏ Введение
Современные AI-агенты сталкиваются с фундаментальной проблемой: они обрабатывают разрозненные данные из множества систем, но не понимают, как эти данные связаны между собой.
Большинство основателей ошибочно полагают, что онтология — это вопрос проектирования баз данных.
На деле это задача бизнес-моделирования.
Онтология — это перевод вашего бизнеса на язык, который агенты могут интерпретировать и использовать для рассуждений.
Без неё агенты обречены работать с изолированными фрагментами информации и неизбежно ломаться в реальных сценариях.
————————
✏ Онтология vs схема vs модель данных
[Полное описание в прикрепленном файле]
#AI #бизнес #datamodeling
📖 tgf
📌 Почему агентам нужна онтология
✏ Введение
Современные AI-агенты сталкиваются с фундаментальной проблемой: они обрабатывают разрозненные данные из множества систем, но не понимают, как эти данные связаны между собой.
Большинство основателей ошибочно полагают, что онтология — это вопрос проектирования баз данных.
На деле это задача бизнес-моделирования.
Онтология — это перевод вашего бизнеса на язык, который агенты могут интерпретировать и использовать для рассуждений.
Без неё агенты обречены работать с изолированными фрагментами информации и неизбежно ломаться в реальных сценариях.
————————
✏ Онтология vs схема vs модель данных
[Полное описание в прикрепленном файле]
#AI #бизнес #datamodeling
Forwarded from Data&AI Insights
How_I_built_an_agent_that_works_at_Amazon_while_I_sleep_10_step.html
92.4 KB
🔗 How I built an agent that works at Amazon while I sleep (10 steps)
📖 tgf
📌 Как я создал агент, который работает в Amazon, пока я сплю: 10 шагов
✏ Введение
Большинство инженеров используют ИИ как продвинутый поисковик или младшего разработчика, которого нужно микроменеджить.
Они копируют контекст, уточняют промпты и построчно проверяют код.
Такой подход быстро упирается в потолок — скорость ввода ограничена.
Автор статьи, работающий в Amazon, понял, что нужно сместить свою роль: вместо того чтобы выполнять работу самому, необходимо проектировать системы, которые выполняют работу.
Результатом стала команда агентов (TPM для триажа тикетов, Developer для реализации и Reviewer для обработки комментариев), которая экономит команде эквивалент более одного инженера, занимающегося рутинными задачами.
————————
[Полное описание в прикрепленном файле]
#AI #программирование #DevOps
📖 tgf
📌 Как я создал агент, который работает в Amazon, пока я сплю: 10 шагов
✏ Введение
Большинство инженеров используют ИИ как продвинутый поисковик или младшего разработчика, которого нужно микроменеджить.
Они копируют контекст, уточняют промпты и построчно проверяют код.
Такой подход быстро упирается в потолок — скорость ввода ограничена.
Автор статьи, работающий в Amazon, понял, что нужно сместить свою роль: вместо того чтобы выполнять работу самому, необходимо проектировать системы, которые выполняют работу.
Результатом стала команда агентов (TPM для триажа тикетов, Developer для реализации и Reviewer для обработки комментариев), которая экономит команде эквивалент более одного инженера, занимающегося рутинными задачами.
————————
[Полное описание в прикрепленном файле]
#AI #программирование #DevOps
Forwarded from Data&AI Insights
What_Happens_When_a_PM_Runs_a_Coding_Agent_almost_Full_Time.html
85.9 KB
🔗 What Happens When a PM Runs a Coding Agent (almost) Full-Time
📖 tgf
📌 Опыт PM, работающего с Claude Code почти полный рабочий день
✏ Введение
Автор статьи — product manager в компании Astronomer, ранее занимавший позиции CEO и data engineer.
При трудоустройстве он поставил себе цель: стать «agent-native» PM — выстраивать все рабочие процессы так, чтобы Claude Code мог их ускорить.
Первые 90 дней традиционно рекомендуют слушать и изучать организацию, но автор совместил это с активным использованием ИИ-агента.
За четыре недели он создал систему из 73 markdown-файлов, провёл около 19 клиентских разговоров и запустил open-source репозиторий.
Ключевой тезис: инвестиции в структуру, доступную для агентов, окупаются экспоненциально.
————————
✏ Система организации знаний
[Полное описание в прикрепленном файле]
#AI #продукт #бизнес
📖 tgf
📌 Опыт PM, работающего с Claude Code почти полный рабочий день
✏ Введение
Автор статьи — product manager в компании Astronomer, ранее занимавший позиции CEO и data engineer.
При трудоустройстве он поставил себе цель: стать «agent-native» PM — выстраивать все рабочие процессы так, чтобы Claude Code мог их ускорить.
Первые 90 дней традиционно рекомендуют слушать и изучать организацию, но автор совместил это с активным использованием ИИ-агента.
За четыре недели он создал систему из 73 markdown-файлов, провёл около 19 клиентских разговоров и запустил open-source репозиторий.
Ключевой тезис: инвестиции в структуру, доступную для агентов, окупаются экспоненциально.
————————
✏ Система организации знаний
[Полное описание в прикрепленном файле]
#AI #продукт #бизнес
Forwarded from Data&AI Insights
Steve_Yegge_on_AI_Agents_and_the_Future_of_Software_Engineering.html
90.3 KB
🔗 Steve Yegge on AI Agents and the Future of Software Engineering
📖 tgf
📌 Steve Yegge об AI-агентах и будущем программной инженерии
Стив Йегге — программный инженер с более чем 40-летним опытом работы в GeoWorks, Amazon, Google и Grab.
Автор книги «Vibe Coding», созданной совместно с Гином Кимом, а также разработчик Gas Town — открытого оркестратора AI-агентов.
В этом интервью он делится своим видением того, как LLMs трансформируют индустрию разработки ПО и почему считает, что «дни ручного кодирования сочтены».
————————
✏ 1.
От скептика к убеждённому стороннику: S-кривая развития LLMs
[Полное описание в прикрепленном файле]
#AI #программирование #llm
📖 tgf
📌 Steve Yegge об AI-агентах и будущем программной инженерии
Стив Йегге — программный инженер с более чем 40-летним опытом работы в GeoWorks, Amazon, Google и Grab.
Автор книги «Vibe Coding», созданной совместно с Гином Кимом, а также разработчик Gas Town — открытого оркестратора AI-агентов.
В этом интервью он делится своим видением того, как LLMs трансформируют индустрию разработки ПО и почему считает, что «дни ручного кодирования сочтены».
————————
✏ 1.
От скептика к убеждённому стороннику: S-кривая развития LLMs
[Полное описание в прикрепленном файле]
#AI #программирование #llm
Forwarded from Data&AI Insights
2603.01213.html
84.2 KB
🔗 2603.01213
📖 tgf
📌 Способны ли LLM-агенты достигать консенсуса?
Исследование Byzantine-согласия
✏ Введение
Крупные языковые модели всё чаще используются как автономные агенты, которые должны совместно принимать решения.
Однако исследователи из ETH Zurich обнаружили, что надёжное достижение консенсуса не является устойчивой способностью современных LLM-агентов — даже в благоприятных условиях без вредоносных участников.
Эксперименты показывают, что группы агентов на базе Qwen3 часто не могут договориться о едином значении, а добавление даже одного Byzantine-агента (намеренно нарушающего протокол) резко снижает вероятность успеха.
————————
✏ Экспериментальная установка
[Полное описание в прикрепленном файле]
#AI #llm #исследования
📖 tgf
📌 Способны ли LLM-агенты достигать консенсуса?
Исследование Byzantine-согласия
✏ Введение
Крупные языковые модели всё чаще используются как автономные агенты, которые должны совместно принимать решения.
Однако исследователи из ETH Zurich обнаружили, что надёжное достижение консенсуса не является устойчивой способностью современных LLM-агентов — даже в благоприятных условиях без вредоносных участников.
Эксперименты показывают, что группы агентов на базе Qwen3 часто не могут договориться о едином значении, а добавление даже одного Byzantine-агента (намеренно нарушающего протокол) резко снижает вероятность успеха.
————————
✏ Экспериментальная установка
[Полное описание в прикрепленном файле]
#AI #llm #исследования
Forwarded from Data&AI Insights
How_Claude_Code_is_built.html
99.9 KB
🔗 How Claude Code is built
📖 tgf
📌 Как устроен Claude Code: архитектура, процессы и философия разработки
Claude Code стал одним из самых быстрорастущих инструментов для разработчиков в 2024 году.
С момента общего релиза в мае инструмент генерирует более 500 млн долларов годового регулярного дохода, а использование выросло более чем в 10 раз за три месяца.
Автор статьи побеседовал с создателями Claude Code — инженерами Борисом Черным (автор оригинального прототипа) и Сидом Бидасарией (второй инженер проекта), а также продюсером Кэт У.
Из интервью стало ясно, как работает «AI-first» команда разработки и какие уроки из этого могут извлечь другие инженерные организации.
————————
✏ 1.
История создания: от музыки к файловой системе
[Полное описание в прикрепленном файле]
#AI #программирование #продукт
📖 tgf
📌 Как устроен Claude Code: архитектура, процессы и философия разработки
Claude Code стал одним из самых быстрорастущих инструментов для разработчиков в 2024 году.
С момента общего релиза в мае инструмент генерирует более 500 млн долларов годового регулярного дохода, а использование выросло более чем в 10 раз за три месяца.
Автор статьи побеседовал с создателями Claude Code — инженерами Борисом Черным (автор оригинального прототипа) и Сидом Бидасарией (второй инженер проекта), а также продюсером Кэт У.
Из интервью стало ясно, как работает «AI-first» команда разработки и какие уроки из этого могут извлечь другие инженерные организации.
————————
✏ 1.
История создания: от музыки к файловой системе
[Полное описание в прикрепленном файле]
#AI #программирование #продукт
Forwarded from Data&AI Insights
Top_AI_Skills_in_Demand_for_2026_and_How_to_Build_Them.html
128.1 KB
🔗 Top AI Skills in Demand for 2026 and How to Build Them
📖 tgf
📌 Саммари: Востребованные навыки AI в 2026 году
✏ Введение
К 2026 году разговор в индустрии кардинально изменился: больше не достаточно просто «понимать AI на высоком уровне».
Компании ищут профессионалов, которые могут применять навыки AI для решения реальных бизнес-задач, работать совместно с интеллектуальными системами и принимать решения быстрее, качественнее и с большей уверенностью.
Это фундаментальный сдвиг — от теоретических знаний к практическому использованию.
Тот, кто умеет работать с AI-системами, а не конкурировать с ними, станет наиболее ценным специалистом на рынке труда.
————————
✏ Рынок труда AI в 2026: что действительно меняется
[Полное описание в прикрепленном файле]
#AI #бизнес #образование
📖 tgf
📌 Саммари: Востребованные навыки AI в 2026 году
✏ Введение
К 2026 году разговор в индустрии кардинально изменился: больше не достаточно просто «понимать AI на высоком уровне».
Компании ищут профессионалов, которые могут применять навыки AI для решения реальных бизнес-задач, работать совместно с интеллектуальными системами и принимать решения быстрее, качественнее и с большей уверенностью.
Это фундаментальный сдвиг — от теоретических знаний к практическому использованию.
Тот, кто умеет работать с AI-системами, а не конкурировать с ними, станет наиболее ценным специалистом на рынке труда.
————————
✏ Рынок труда AI в 2026: что действительно меняется
[Полное описание в прикрепленном файле]
#AI #бизнес #образование
Forwarded from Data&AI Insights
Лекун ставит $1 млрд на «мировые модели» — альтернативу LLM
Янн Лекун привлёк рекордные $1 млрд для своего нового стартапа AMI, делая ставку на принципиально иной подход к сильному ИИ. В отличие от текущего тренда на масштабирование больших языковых моделей, AMI будет развивать «мировые модели» — системы, которые понимают физическую реальность, причинно-следственные связи и способны рассуждать, а не просто предсказывать следующее слово в тексте.
Это крупнейшееseed-финансирование в истории европейских AI-стартапов при оценке $3,5 млрд привлекло Nvidia, Temasek и Bezos Expeditions. Лекун открыто называет веру в LLM «полной чушью» и утверждает, что человеческий интеллект в основе своей опирается на физический мир, а не на язык.
Параллель интересна: пока весь мир гоняется за очередными версиями ChatGPT, один из главных AI-учёных современности уходит в радикально другую нишу — промышленные применения, робототехника, биомедицина. Успех AMI
Источник: https://www.wired.com/story/yann-lecun-raises-dollar1-billion-to-build-ai-that-understands-the-physical-world/
#AI #машинноеобучение #новости
Янн Лекун привлёк рекордные $1 млрд для своего нового стартапа AMI, делая ставку на принципиально иной подход к сильному ИИ. В отличие от текущего тренда на масштабирование больших языковых моделей, AMI будет развивать «мировые модели» — системы, которые понимают физическую реальность, причинно-следственные связи и способны рассуждать, а не просто предсказывать следующее слово в тексте.
Это крупнейшееseed-финансирование в истории европейских AI-стартапов при оценке $3,5 млрд привлекло Nvidia, Temasek и Bezos Expeditions. Лекун открыто называет веру в LLM «полной чушью» и утверждает, что человеческий интеллект в основе своей опирается на физический мир, а не на язык.
Параллель интересна: пока весь мир гоняется за очередными версиями ChatGPT, один из главных AI-учёных современности уходит в радикально другую нишу — промышленные применения, робототехника, биомедицина. Успех AMI
Источник: https://www.wired.com/story/yann-lecun-raises-dollar1-billion-to-build-ai-that-understands-the-physical-world/
#AI #машинноеобучение #новости
WIRED
Yann LeCun Raises $1 Billion to Build AI That Understands the Physical World
Meta’s former chief AI scientist has long argued that human-level AI will come from mastering the physical world, not language. His new startup, AMI, aims to prove it.
Forwarded from Data&AI Insights
Локальный голосовой AI для Mac — новый уровень приватности
RCLI демонстрирует, что on-device AI уже готов к массовому использованию. Полный голосовой конвейер STT+LLM+TTS работает локально на Apple Silicon без облака, с задержкой менее 200 мс и производительностью до 550 токенов в секунду. 43 системных действия, RAG для документов, полная конфиденциальность — всё это доступно из коробки.
Это не просто ещё один голосовой ассистент. RCLI показывает, что локальный AI может быть быстрее и приватнее облачных решений, при этом оставаясь полнофункциональным. Тренд на перенос AI на устройство набирает обороты, и Apple Silicon с MetalRT становится одной из лучших платформ для таких решений.
Для рынка это сигнал: пользователи и бизнес устали от зависимости от облачных API и хотят контролировать свои данные. RCLI — один из первых продуктов, который делает это практично и удобно.
Источник: https://github.com/RunanywhereAI/rcli
RCLI демонстрирует, что on-device AI уже готов к массовому использованию. Полный голосовой конвейер STT+LLM+TTS работает локально на Apple Silicon без облака, с задержкой менее 200 мс и производительностью до 550 токенов в секунду. 43 системных действия, RAG для документов, полная конфиденциальность — всё это доступно из коробки.
Это не просто ещё один голосовой ассистент. RCLI показывает, что локальный AI может быть быстрее и приватнее облачных решений, при этом оставаясь полнофункциональным. Тренд на перенос AI на устройство набирает обороты, и Apple Silicon с MetalRT становится одной из лучших платформ для таких решений.
Для рынка это сигнал: пользователи и бизнес устали от зависимости от облачных API и хотят контролировать свои данные. RCLI — один из первых продуктов, который делает это практично и удобно.
Источник: https://github.com/RunanywhereAI/rcli
GitHub
GitHub - RunanywhereAI/RCLI: Talk to your Mac, query your docs, no cloud required. On-device voice AI + RAG
Talk to your Mac, query your docs, no cloud required. On-device voice AI + RAG - RunanywhereAI/RCLI
Forwarded from Data&AI Insights
Почему вашим AI-агентам нужен не просто доступ к данным, а полноценный контекст
ИИ-агенты обещают революцию в аналитике — они могут сами планировать, рассуждать и действовать от имени компании. Но есть одна фундаментальная проблема: без правильного контекста эти агенты бесполезны. Они не могут ответить даже на элементарные бизнес-вопросы вроде «какой был рост выручки в прошлом квартале?», потому что не понимают, как компания определяет выручку, какие источники данных правильные и почему.
Изначально казалось, что проблема в недостаточных способностях языковых моделей к генерации SQL. Но оказалось всё сложнее. Агент сталкивается с десятками подводных камней: какую именно метрику считать — ARR или run rate, какой квартал использовать — фискальный или календарный, какую таблицу брать — fct_revenue от финансовой команды или mv_revenue_monthly от команды данных. Семантический слой, который работает для BI-дашбордов, здесь не поможет — он слишком узкий и часто устаревший.
Решение — контекстный слой, который объединяет канонические сущности, бизнес-правила, неявные знания команд и политики управления данными. Это не просто ещё один слой в стеке, а фундамент для работы агентов. Построение такого слоя требует пяти шагов: обеспечить доступ ко всем данным, автоматически собрать начальный контекст, добавить человеческую экспертизу для критических связей, подключить агентов через API и настроить самообновляющиеся потоки.
Рынок уже реагирует. Платформы вроде Databricks и Snowflake развивают аналитические AI-продукты, новые компании фокусируются на построении контекста, а крупные игроки вроде Palantir давно делают на этом бизнес. Gartner прогнозирует, что к 2026 году 40% корпоративных приложений будут содержать специализированных AI-агентов.
Вывод прост: без контекста ваши данные агенты — это дорогие игрушки, которые не могут решить реальные задачи. Контекст — это то, что превращает сырые данные в работающий интеллект.
Источник: https://a16z.com/your-data-agents-need-context/
#AI #analytics #llm
ИИ-агенты обещают революцию в аналитике — они могут сами планировать, рассуждать и действовать от имени компании. Но есть одна фундаментальная проблема: без правильного контекста эти агенты бесполезны. Они не могут ответить даже на элементарные бизнес-вопросы вроде «какой был рост выручки в прошлом квартале?», потому что не понимают, как компания определяет выручку, какие источники данных правильные и почему.
Изначально казалось, что проблема в недостаточных способностях языковых моделей к генерации SQL. Но оказалось всё сложнее. Агент сталкивается с десятками подводных камней: какую именно метрику считать — ARR или run rate, какой квартал использовать — фискальный или календарный, какую таблицу брать — fct_revenue от финансовой команды или mv_revenue_monthly от команды данных. Семантический слой, который работает для BI-дашбордов, здесь не поможет — он слишком узкий и часто устаревший.
Решение — контекстный слой, который объединяет канонические сущности, бизнес-правила, неявные знания команд и политики управления данными. Это не просто ещё один слой в стеке, а фундамент для работы агентов. Построение такого слоя требует пяти шагов: обеспечить доступ ко всем данным, автоматически собрать начальный контекст, добавить человеческую экспертизу для критических связей, подключить агентов через API и настроить самообновляющиеся потоки.
Рынок уже реагирует. Платформы вроде Databricks и Snowflake развивают аналитические AI-продукты, новые компании фокусируются на построении контекста, а крупные игроки вроде Palantir давно делают на этом бизнес. Gartner прогнозирует, что к 2026 году 40% корпоративных приложений будут содержать специализированных AI-агентов.
Вывод прост: без контекста ваши данные агенты — это дорогие игрушки, которые не могут решить реальные задачи. Контекст — это то, что превращает сырые данные в работающий интеллект.
Источник: https://a16z.com/your-data-agents-need-context/
#AI #analytics #llm
Andreessen Horowitz
Your Data Agents Need Context | Andreessen Horowitz
Enterprise AI data agents are failing without a robust context layer, driving demand for modern data ontologies that unify business definitions, messy data systems, and tribal knowledge to power accurate, autonomous analytics.
Forwarded from Data&AI Insights
What_Claude_Code_Actually_Chooses.html
88.8 KB
🔗 What Claude Code Actually Chooses
📖 tgf
📌 Что на самом деле выбирает Claude Code
✏ Введение
Claude Code становится новым «шлюзом» в мире разработки.
Когда разработчик говорит агенту «добавь базу данных» и позволяет Claude Code всё сделать самому, тот не просто предлагает варианты — он устанавливает пакеты, пишет импорты, настраивает подключения и коммитит код.
Выбранный инструмент становится инструментом, который попадает в продакшен.
По мере того как всё больше разработчиков доверяют Claude Code выбор инструментов, стеки, которые он выбирает, становятся стандартными стеками.
[Полное описание в прикрепленном файле]
#AI #программирование #исследования
📖 tgf
📌 Что на самом деле выбирает Claude Code
✏ Введение
Claude Code становится новым «шлюзом» в мире разработки.
Когда разработчик говорит агенту «добавь базу данных» и позволяет Claude Code всё сделать самому, тот не просто предлагает варианты — он устанавливает пакеты, пишет импорты, настраивает подключения и коммитит код.
Выбранный инструмент становится инструментом, который попадает в продакшен.
По мере того как всё больше разработчиков доверяют Claude Code выбор инструментов, стеки, которые он выбирает, становятся стандартными стеками.
[Полное описание в прикрепленном файле]
#AI #программирование #исследования