Forwarded from Data&AI Insights
7_Free_Web_APIs_Every_Developer_and_Vibe_Coder_Should_Know_KDn.html
1.8 MB
🔗 7 Free Web APIs Every Developer and Vibe Coder Should Know - KDnuggets
📖 tgf
📌 7 бесплатных веб-API для разработчиков и Vibe Coders
🖼7 Free Web APIs Every Developer and Vibe Coder Should Know
✏ Введение
Самый быстрый способ сделать приложение на основе искусственного интеллекта (AI) по-настоящему полезным — подключить его к актуальным веб-данным.
Это означает предоставить возможность выполнять веб-поиск, извлекать контент со страниц и генерировать обоснованные ответы на основе текущей информации.
Когда приложение умеет это делать хорошо, оно становится значительно более практичным, релевантным и надёжным.
[Полное описание в прикрепленном файле]
#apis #AI #машинноеобучение
📖 tgf
📌 7 бесплатных веб-API для разработчиков и Vibe Coders
🖼7 Free Web APIs Every Developer and Vibe Coder Should Know
✏ Введение
Самый быстрый способ сделать приложение на основе искусственного интеллекта (AI) по-настоящему полезным — подключить его к актуальным веб-данным.
Это означает предоставить возможность выполнять веб-поиск, извлекать контент со страниц и генерировать обоснованные ответы на основе текущей информации.
Когда приложение умеет это делать хорошо, оно становится значительно более практичным, релевантным и надёжным.
[Полное описание в прикрепленном файле]
#apis #AI #машинноеобучение
Forwarded from Data&AI Insights
claude-code-best-practice _practice_made_claude_perfect.html
560.7 KB
🔗 GitHub - shanraisshan/claude-code-best-practice: practice made claude perfect
📖 tgf
📌 Claude Code: лучшие практики
✏ Введение
Репозиторий «Practice Makes Claude Perfect» — это исчерпывающая база знаний по эффективному использованию Claude Code, созданная на основе советов от команды Anthropic, опытных разработчиков и активного сообщества.
Основной тезис: Claude Code — это не просто CLI-инструмент, а полноценная платформа для agentic-разработки, где ключ к продуктивности лежит в правильной организации workflows, agents, skills и hooks.
————————
✏ Архитектура Claude Code: ключевые компоненты
📚 Subagents, Commands и Skills — три уровня абстракции
Claude Code предлагает три механизма расширения функциональности с разным уровнем сложности:
[Полное описание в прикрепленном файле]
#AI #программирование #технологии
📖 tgf
📌 Claude Code: лучшие практики
✏ Введение
Репозиторий «Practice Makes Claude Perfect» — это исчерпывающая база знаний по эффективному использованию Claude Code, созданная на основе советов от команды Anthropic, опытных разработчиков и активного сообщества.
Основной тезис: Claude Code — это не просто CLI-инструмент, а полноценная платформа для agentic-разработки, где ключ к продуктивности лежит в правильной организации workflows, agents, skills и hooks.
————————
✏ Архитектура Claude Code: ключевые компоненты
📚 Subagents, Commands и Skills — три уровня абстракции
Claude Code предлагает три механизма расширения функциональности с разным уровнем сложности:
[Полное описание в прикрепленном файле]
#AI #программирование #технологии
Forwarded from Data&AI Insights
AI_overly_affirms_users_asking_for_personal_advice.html
91.9 KB
🔗 AI overly affirms users asking for personal advice
📖 tgf
Исследование учёных Стэнфордского университета, опубликованное в журнале Science 26 марта 2026 года, выявило серьёзную проблему: большие языковые модели систематически проявляют угодничество (сикофантство) при консультировании по личным вопросам. Искусственный интеллект поддерживает позицию пользователя значительно чаще, чем это делают люди-консультанты, — в том числе когда речь идёт о вредоносном или незаконном поведении. При этом пользователи не только воспринимают такие ответы как более надёжные, но и становятся менее эмпатичными, а их социальные навыки деградируют. Исследователи предупреждают, что сикофантство представляет собой неотложную проблему безопасности, требующую внимания разработчиков и регуляторов.
[Полное описание в прикрепленном файле]
#AI #общество #исследования
📖 tgf
Исследование учёных Стэнфордского университета, опубликованное в журнале Science 26 марта 2026 года, выявило серьёзную проблему: большие языковые модели систематически проявляют угодничество (сикофантство) при консультировании по личным вопросам. Искусственный интеллект поддерживает позицию пользователя значительно чаще, чем это делают люди-консультанты, — в том числе когда речь идёт о вредоносном или незаконном поведении. При этом пользователи не только воспринимают такие ответы как более надёжные, но и становятся менее эмпатичными, а их социальные навыки деградируют. Исследователи предупреждают, что сикофантство представляет собой неотложную проблему безопасности, требующую внимания разработчиков и регуляторов.
[Полное описание в прикрепленном файле]
#AI #общество #исследования
Forwarded from Data&AI Insights
Claude Skills: как модули превращают ИИ из болтуна в специалиста
Claude Skills — это, пожалуй, самый практичный шаг в развитии AI-ассистентов за последний год. Не очередная модель с красивыми бенчмарками, а реальная инфраструктура для работы.
Суть проста до гениальности. Вспомните своего Claude. Вы же замечали, как со временем CLAUDE.md превращается в свалку правил, чек-листов и пайплайнов? Кодстайл проекта, процессы деплоя, требования безопасности, шаблоны релиз-нотов — всё в одном файле. И в итоге, когда вы просите переименовать переменную, ассистент загружает инструкции по деплою. Контекст переполнен, эффективность падает.
Claude Skills решают это радикально. Вместо одного монолитного файла вы получаете модульную систему. Каждый скилл — это папка с инструкциями, шаблонами и даже исполняемыми скриптами. И работает это удивительно умно.
Ассистент не загружает все скиллы сразу. Сначала он видит только метаданные — короткие описания объёмом около сотни токенов. Когда ваш запрос совпадает по смыслу с описанием, активируется нужный модуль и подтягиваются детальные инструкции. Никакого перерасхода контекста, никакой лишней нагрузки.
При этом можно и перестраховаться. Если автоматика не справляется или нужен конкретный процесс, вызываете скилл вручную через слэш-команду. Например, /security-review для проверки кода или /deploy для развёртывания. Предсказуемость и контроль.
Но главное — это масштабирование. Rakuten, Box, Canva уже используют Skills в продакшене. Финансовые операции, которые занимали целый день, теперь укладываются в час. Документы автоматически конвертируются в презентации по корпоративным стандартам. Разработчики запускают проверку безопасности одной командой и получают результат без дополнительных пояснений.
По сути, Claude Skills делают то, чего давно не хватало. Они превращают AI из болтуна, который импровизирует каждый раз, в специалиста с вшитыми процессами. Команда растёт — скиллы становятся стандартом. Новый разработчик запускает /security-review и получает ровно тот результат, который заложили старшие инженеры. Без вариаций, без забытых шагов, без человеческого фактора.
Есть, конечно, и риски. Кривые описания приводят к ложным активациям. Слишком много скиллов разом съедают контекст. Но это решаемые проблемы — чёткие формулировки, ограничение прав доступа для каждого модуля, тестирование.
Если коротко: Claude Skills — это инфраструктурный сдвиг. Не хак, не трюк с промптами, а полноценная архитектура для работы AI в реальных командах. И тем, кто пока работает с одним перегруженным CLAUDE.md, стоит хотя бы попробовать.
Источник: https://uproger.com/chto-takoe-claude-skills/
#AI #llm #программирование
Claude Skills — это, пожалуй, самый практичный шаг в развитии AI-ассистентов за последний год. Не очередная модель с красивыми бенчмарками, а реальная инфраструктура для работы.
Суть проста до гениальности. Вспомните своего Claude. Вы же замечали, как со временем CLAUDE.md превращается в свалку правил, чек-листов и пайплайнов? Кодстайл проекта, процессы деплоя, требования безопасности, шаблоны релиз-нотов — всё в одном файле. И в итоге, когда вы просите переименовать переменную, ассистент загружает инструкции по деплою. Контекст переполнен, эффективность падает.
Claude Skills решают это радикально. Вместо одного монолитного файла вы получаете модульную систему. Каждый скилл — это папка с инструкциями, шаблонами и даже исполняемыми скриптами. И работает это удивительно умно.
Ассистент не загружает все скиллы сразу. Сначала он видит только метаданные — короткие описания объёмом около сотни токенов. Когда ваш запрос совпадает по смыслу с описанием, активируется нужный модуль и подтягиваются детальные инструкции. Никакого перерасхода контекста, никакой лишней нагрузки.
При этом можно и перестраховаться. Если автоматика не справляется или нужен конкретный процесс, вызываете скилл вручную через слэш-команду. Например, /security-review для проверки кода или /deploy для развёртывания. Предсказуемость и контроль.
Но главное — это масштабирование. Rakuten, Box, Canva уже используют Skills в продакшене. Финансовые операции, которые занимали целый день, теперь укладываются в час. Документы автоматически конвертируются в презентации по корпоративным стандартам. Разработчики запускают проверку безопасности одной командой и получают результат без дополнительных пояснений.
По сути, Claude Skills делают то, чего давно не хватало. Они превращают AI из болтуна, который импровизирует каждый раз, в специалиста с вшитыми процессами. Команда растёт — скиллы становятся стандартом. Новый разработчик запускает /security-review и получает ровно тот результат, который заложили старшие инженеры. Без вариаций, без забытых шагов, без человеческого фактора.
Есть, конечно, и риски. Кривые описания приводят к ложным активациям. Слишком много скиллов разом съедают контекст. Но это решаемые проблемы — чёткие формулировки, ограничение прав доступа для каждого модуля, тестирование.
Если коротко: Claude Skills — это инфраструктурный сдвиг. Не хак, не трюк с промптами, а полноценная архитектура для работы AI в реальных командах. И тем, кто пока работает с одним перегруженным CLAUDE.md, стоит хотя бы попробовать.
Источник: https://uproger.com/chto-takoe-claude-skills/
#AI #llm #программирование
Forwarded from Data&AI Insights
2603.19461.html
86.8 KB
🔗 2603.19461
📖 tgf
📌 DGM-Hyperagents: самоулучшающиеся агенты с метакогнитивной самостоятельной модификацией
✏ Основной тезис
Статья представляет hyperagents — новый класс самопознавательных ИИ-агентов, которые могут улучшать не только качество решения задач, но и сам процесс самосовершенствования.
Это достигается за счёт объединения агента задач и мета-агента в единую редактируемую программу.
————————
✏ Проблема существующих систем
[Полное описание в прикрепленном файле]
#AI #машинноеобучение #исследования
📖 tgf
📌 DGM-Hyperagents: самоулучшающиеся агенты с метакогнитивной самостоятельной модификацией
✏ Основной тезис
Статья представляет hyperagents — новый класс самопознавательных ИИ-агентов, которые могут улучшать не только качество решения задач, но и сам процесс самосовершенствования.
Это достигается за счёт объединения агента задач и мета-агента в единую редактируемую программу.
————————
✏ Проблема существующих систем
[Полное описание в прикрепленном файле]
#AI #машинноеобучение #исследования
Forwarded from Data&AI Insights
The_Claude_Code_Handbook_A_Professional_Introduction_to_Buildin.html
1.8 MB
🔗 The Claude Code Handbook: A Professional Introduction to Building with AI-Assisted Development
📌 Claude Code Handbook: Профессиональное руководство по AI-assisted разработке
🖼Claude Code Handbook Cover
✏ Введение
Claude Code — это AI-агент для разработки программного обеспечения от компании Anthropic, созданный для принципиально иного подхода к написанию кода.
Это не умный автодополнитель и не генератор текста.
Claude Code читает кодовую базу, принимает решения о том, что нужно сделать, пишет и редактирует файлы, выполняет команды и работает над задачей от начала до конца — при этом пользователь направляет агент, проверяет результаты и принимает решения, требующие профессионального суждения.
[Полное описание в прикрепленном файле]
#программирование #AI #технологии
📌 Claude Code Handbook: Профессиональное руководство по AI-assisted разработке
🖼Claude Code Handbook Cover
✏ Введение
Claude Code — это AI-агент для разработки программного обеспечения от компании Anthropic, созданный для принципиально иного подхода к написанию кода.
Это не умный автодополнитель и не генератор текста.
Claude Code читает кодовую базу, принимает решения о том, что нужно сделать, пишет и редактирует файлы, выполняет команды и работает над задачей от начала до конца — при этом пользователь направляет агент, проверяет результаты и принимает решения, требующие профессионального суждения.
[Полное описание в прикрепленном файле]
#программирование #AI #технологии
Forwarded from Data&AI Insights
ARC_AGI_3_A_New_Challenge_for_Frontier_Agentic_Intelligence.html
85.2 KB
🔗 ARC-AGI-3: A New Challenge for Frontier Agentic Intelligence
📖 tgf
📌 ARC-AGI-3: Новый бенчмарк для оценки агентного интеллекта
✏ Суть исследования
ARC Prize Foundation представила ARC-AGI-3 — интерактивный бенчмарк нового поколения, предназначенный для оценки способности AI-агентов к адаптивному поведению в незнакомых средах.
Ключевой вывод исследования: современные передовые AI-системы (по состоянию на март 2026 года) решают менее 1% задач бенчмарка, тогда как люди справляются со 100% задач.
Этот разрыв демонстрирует фундаментальную разницу между человеческим общим интеллектом и возможностями существующих AI-систем в области исследования и адаптации.
————————
✏ Дизайн бенчмарка
[Полное описание в прикрепленном файле]
#AI #исследования #машинноеобучение
📖 tgf
📌 ARC-AGI-3: Новый бенчмарк для оценки агентного интеллекта
✏ Суть исследования
ARC Prize Foundation представила ARC-AGI-3 — интерактивный бенчмарк нового поколения, предназначенный для оценки способности AI-агентов к адаптивному поведению в незнакомых средах.
Ключевой вывод исследования: современные передовые AI-системы (по состоянию на март 2026 года) решают менее 1% задач бенчмарка, тогда как люди справляются со 100% задач.
Этот разрыв демонстрирует фундаментальную разницу между человеческим общим интеллектом и возможностями существующих AI-систем в области исследования и адаптации.
————————
✏ Дизайн бенчмарка
[Полное описание в прикрепленном файле]
#AI #исследования #машинноеобучение
Forwarded from Data&AI Insights
Агенты, которые работают руками: как Google меняет правила игры в разработке
Google выпустил инструмент, который переворачивает привычное представление об IDE. Google Antigravity — это не просто редактор кода с ИИ-помощником. Это платформа, где искусственный интеллект сам управляет процессом разработки, а человек выступает наблюдателем и наставником.
В центре этой системы три ключевых элемента. Правила задают агенту базовые ограничения и стиль работы. Навыки содержат готовые инструкции для конкретных задач. А рабочие процессы связывают всё это вместе, превращая разрозненные команды в цепочки автоматических действий.
Звучит как очередная красивая концепция, но давай разберёмся, что это реально даёт на практике. В статье на KDnuggets показан конкретный пример: настройка агента для проверки качества Python-кода. Создаётся правило PEP 8, готовится навык для генерации pytest-тестов, а затем всё это оборачивается в рабочий процесс под названием qa-check. Агент анализирует файл, находит баги, исправляет форматирование и сам пишет unit-тесты. Без участия человека. Без установки дополнительных инструментов.
Вот что меня зацепило больше всего. Для создания навыка не нужно уметь программировать. Достаточно написать инструкцию на понятном английском языке в формате чек-листа. То есть экспертиза в предметной области превращается в готовый к использованию модуль. Маркетолог может сделать навык для генерации SEO-контента. DevOps-инженер — для автоматизации деплоя. И все эти навыки переиспользуются от проекта к проекту.
Технически это решает серьёзную проблему контекстного истощения. Когда ИИ получает слишком много информации разом, он начинает путаться и тупить. Antigravity использует подход под названием progressive disclosure — загружает только то, что нужно для текущей задачи. Это снижает задержки и уменьшает стоимость операций.
Если отойти от технических деталей, суть в следующем. Мы привыкли к тому, что ИИ помогает человеку писать код быстрее. Antigravity делает шаг дальше — убирает человека из цикла выполнения рутинных задач. Человек остаётся на уровне архитектуры, стратегии и контроля качества решений. Это принципиально другой уровень абстракции в работе с интеллектуальными системами.
Конечно, есть и ограничения. Нужно железо для запуска локальных моделей и агентов. Сообщество пока только формируется. И грамотно описать навык — это тоже навык, который требует практики. Но направление движения очевидно. Инструменты типа Antigravity показывают, что будущее разработки — это не про то, как писать код быстрее. Это про то, как сделать так, чтобы код писался вообще без участия человека в операционной части.
Источник: https://www.kdnuggets.com/build-better-ai-agents-with-google-antigravity-skills-and-workflows
#AI #python #mlops
Google выпустил инструмент, который переворачивает привычное представление об IDE. Google Antigravity — это не просто редактор кода с ИИ-помощником. Это платформа, где искусственный интеллект сам управляет процессом разработки, а человек выступает наблюдателем и наставником.
В центре этой системы три ключевых элемента. Правила задают агенту базовые ограничения и стиль работы. Навыки содержат готовые инструкции для конкретных задач. А рабочие процессы связывают всё это вместе, превращая разрозненные команды в цепочки автоматических действий.
Звучит как очередная красивая концепция, но давай разберёмся, что это реально даёт на практике. В статье на KDnuggets показан конкретный пример: настройка агента для проверки качества Python-кода. Создаётся правило PEP 8, готовится навык для генерации pytest-тестов, а затем всё это оборачивается в рабочий процесс под названием qa-check. Агент анализирует файл, находит баги, исправляет форматирование и сам пишет unit-тесты. Без участия человека. Без установки дополнительных инструментов.
Вот что меня зацепило больше всего. Для создания навыка не нужно уметь программировать. Достаточно написать инструкцию на понятном английском языке в формате чек-листа. То есть экспертиза в предметной области превращается в готовый к использованию модуль. Маркетолог может сделать навык для генерации SEO-контента. DevOps-инженер — для автоматизации деплоя. И все эти навыки переиспользуются от проекта к проекту.
Технически это решает серьёзную проблему контекстного истощения. Когда ИИ получает слишком много информации разом, он начинает путаться и тупить. Antigravity использует подход под названием progressive disclosure — загружает только то, что нужно для текущей задачи. Это снижает задержки и уменьшает стоимость операций.
Если отойти от технических деталей, суть в следующем. Мы привыкли к тому, что ИИ помогает человеку писать код быстрее. Antigravity делает шаг дальше — убирает человека из цикла выполнения рутинных задач. Человек остаётся на уровне архитектуры, стратегии и контроля качества решений. Это принципиально другой уровень абстракции в работе с интеллектуальными системами.
Конечно, есть и ограничения. Нужно железо для запуска локальных моделей и агентов. Сообщество пока только формируется. И грамотно описать навык — это тоже навык, который требует практики. Но направление движения очевидно. Инструменты типа Antigravity показывают, что будущее разработки — это не про то, как писать код быстрее. Это про то, как сделать так, чтобы код писался вообще без участия человека в операционной части.
Источник: https://www.kdnuggets.com/build-better-ai-agents-with-google-antigravity-skills-and-workflows
#AI #python #mlops
KDnuggets
Build Better AI Agents with Google Antigravity Skills and Workflows - KDnuggets
How to configure Antigravity AI agent workflows to resiliently automate critical code generation tasks: all without the need for third-party tools.
Forwarded from Data&AI Insights
Субагенты_в_agent_coding_что_это,_зачем_нужны_и_чем_отличаются_.html
9.9 MB
🔗 Субагенты в agent coding: что это, зачем нужны и чем отличаются в Cursor и Claude Code
📖 tgf
📌 Субагенты в agent coding: что это, зачем нужны и чем отличаются в Cursor и Claude Code
[Полное описание в прикрепленном файле]
#AI #программирование #технологии
📖 tgf
📌 Субагенты в agent coding: что это, зачем нужны и чем отличаются в Cursor и Claude Code
[Полное описание в прикрепленном файле]
#AI #программирование #технологии
Forwarded from Data&AI Insights
🔗 Andrej Karpathy on X: "LLM Knowledge Bases
✏️ LLM-базы знаний: личный подход Андрея Карпатого
Андрей Карпатый делится методологией использования больших языковых моделей для создания персональных баз знаний. По его словам, значительная часть потребления токенов сместилась от работы с кодом к манипуляции со знаниями — статьями, документами, изображениями.
————————
✏️ Архитектура системы
Система строится на трёх компонентах:
1. Raw-директория — хранилище исходных материалов: статьи, научные публикации, репозитории, датасеты, изображения
2. Скомпилированная wiki — набор .md файлов в структурированной директории
3. Интерфейс — Obsidian как IDE-фронтенд для просмотра данных, wiki и визуализаций
Перевод веб-статей в .md осуществляется через расширение Obsidian Web Clipper. Параллельно Карпатый использует горячую клавишу для скачивания связанных изображений локально — чтобы LLM имела к ним доступ.
————————
✏️ Компиляция и структурирование
LLM автоматически «компилирует» wiki из raw-данных:
⦁ Генерирует саммари всех документов
⦁ Создаёт обратные ссылки (backlinks) между файлами
⦁ Категоризирует данные по концептам
⦁ Пишет связные статьи и соединяет их ссылками
Ключевой принцип: автор практически не редактирует wiki вручную. Весь контент создаётся и поддерживается LLM.
————————
✏️ Q&A и масштабирование
При достижении определённого объёма (например, ~100 статей и ~400K слов) возможности резко возрастают:
⦁ Можно задавать сложные вопросы агенту
⦁ LLM самостоятельно «исследует» ответы, читая релевантные документы
⦁ Карпатый ожидал необходимости сложного RAG, но выяснил, что LLM хорошо справляется с автосозданием индексных файлов и саммари
————————
✏️ Форматы вывода
Результаты не ограничиваются текстом в терминале. LLM генерирует:
⦁ Markdown-файлы для wiki
⦁ Презентации в формате Marp
⦁ matplotlib-изображения
⦁ Потенциально любые визуальные форматы
Выводы часто «подшиваются» обратно в wiki, усиливая базу для будущих запросов. Так каждый запрос накапливается в системе.
————————
✏️ Линтинг и очистка
Карпатый запускает LLM-проверки «здоровья» wiki:
⦁ Поиск противоречивых данных
⦁ Заполнение пробелов (с поиском в вебе)
⦁ Выявление связей для новых статей
⦁ Повышение целостности данных
Модель также предлагает новые вопросы для исследования.
————————
✏️ Перспективы и риски
Направления развития:
⦁ Дополнительные CLI-инструменты (например, простая поисковая система поверх wiki)
⦁ Синтетическая генерация данных + fine-tuning — перенос знаний из wiki в веса модели вместо контекстного окна
Риски и ограничения:
⦁ Текущая реализация — «хаки» из скриптов, а не готовый продукт
⦁ Эффективность при масштабировании за пределы ~400K слов не проверена
⦁ Зависимость от конкретных инструментов (Obsidian, Marp)
Карпатый отмечает потребность в полноценном продукте вместо коллекции скриптов — потенциально огромная ниша для новых инструментов.
https://x.com/karpathy/status/2039805659525644595
📖 tgf
#llm #datascience
✏️ LLM-базы знаний: личный подход Андрея Карпатого
Андрей Карпатый делится методологией использования больших языковых моделей для создания персональных баз знаний. По его словам, значительная часть потребления токенов сместилась от работы с кодом к манипуляции со знаниями — статьями, документами, изображениями.
————————
✏️ Архитектура системы
Система строится на трёх компонентах:
1. Raw-директория — хранилище исходных материалов: статьи, научные публикации, репозитории, датасеты, изображения
2. Скомпилированная wiki — набор .md файлов в структурированной директории
3. Интерфейс — Obsidian как IDE-фронтенд для просмотра данных, wiki и визуализаций
Перевод веб-статей в .md осуществляется через расширение Obsidian Web Clipper. Параллельно Карпатый использует горячую клавишу для скачивания связанных изображений локально — чтобы LLM имела к ним доступ.
————————
✏️ Компиляция и структурирование
LLM автоматически «компилирует» wiki из raw-данных:
⦁ Генерирует саммари всех документов
⦁ Создаёт обратные ссылки (backlinks) между файлами
⦁ Категоризирует данные по концептам
⦁ Пишет связные статьи и соединяет их ссылками
Ключевой принцип: автор практически не редактирует wiki вручную. Весь контент создаётся и поддерживается LLM.
————————
✏️ Q&A и масштабирование
При достижении определённого объёма (например, ~100 статей и ~400K слов) возможности резко возрастают:
⦁ Можно задавать сложные вопросы агенту
⦁ LLM самостоятельно «исследует» ответы, читая релевантные документы
⦁ Карпатый ожидал необходимости сложного RAG, но выяснил, что LLM хорошо справляется с автосозданием индексных файлов и саммари
————————
✏️ Форматы вывода
Результаты не ограничиваются текстом в терминале. LLM генерирует:
⦁ Markdown-файлы для wiki
⦁ Презентации в формате Marp
⦁ matplotlib-изображения
⦁ Потенциально любые визуальные форматы
Выводы часто «подшиваются» обратно в wiki, усиливая базу для будущих запросов. Так каждый запрос накапливается в системе.
————————
✏️ Линтинг и очистка
Карпатый запускает LLM-проверки «здоровья» wiki:
⦁ Поиск противоречивых данных
⦁ Заполнение пробелов (с поиском в вебе)
⦁ Выявление связей для новых статей
⦁ Повышение целостности данных
Модель также предлагает новые вопросы для исследования.
————————
✏️ Перспективы и риски
Направления развития:
⦁ Дополнительные CLI-инструменты (например, простая поисковая система поверх wiki)
⦁ Синтетическая генерация данных + fine-tuning — перенос знаний из wiki в веса модели вместо контекстного окна
Риски и ограничения:
⦁ Текущая реализация — «хаки» из скриптов, а не готовый продукт
⦁ Эффективность при масштабировании за пределы ~400K слов не проверена
⦁ Зависимость от конкретных инструментов (Obsidian, Marp)
Карпатый отмечает потребность в полноценном продукте вместо коллекции скриптов — потенциально огромная ниша для новых инструментов.
https://x.com/karpathy/status/2039805659525644595
📖 tgf
#llm #datascience
Forwarded from Data&AI Insights
Обновление получилось достаточно масштабным. Стартап понемногу уходит от идеи AI-IDE к формату полноценного оркестратора агентов. Итак, что нового:
1. Теперь можно запускать неограниченное количество агентов одновременно – локально, по SSH или в облаке. Агенты работают параллельно, и результаты работы видны прямо в интерфейсе.
2. Редактор остается доступным для ручного вмешательства, но теперь открывается отдельно сбоку, и не является центральной частью процесса (см. видео). Вместо этого главную роль теперь играет Agent Window – окно для агентов с историей разговоров слева. Здесь можно быстро просматривать изменения, одобрять diff'ы и добавлять контекст. По сути, это и есть главное обновление: переход от редактирования кода к ревью работы агентов.
3. Можно быстро перемещать агентов из локальной среды в облако и обратно. Например: вы что-то редактировали локально -> захотели уйти и закрыть ноутбук -> моментально перенесли агента в облако -> процесс продолжается даже после завершения локального сеанса.
Чтобы попроовать, обновляйте Cursor и переходите на новый интерфейс с помощью Cmd+Shift+P -> Agents Window
https://cursor.com/blog/cursor-3
Please open Telegram to view this post
VIEW IN TELEGRAM
Cursor
Meet the new Cursor · Cursor
Cursor 3 is a unified workspace for building software with agents.
Forwarded from #N/A
За два выходных дня при помощи Claude Code CLI через терминал на телефоне написано 6 000 строк закоммиченного кода (~220К символов). По факту больше - между коммитами много что переделывается, рефакторится и выбрасывается. Протестировано 34 гипотезы.
Совершенно разные области экспертизы (Data engineering, Quantitative research, Trading infrastructure).
Claude оценивает это в 7-11 рабочих дней синьор разработчика. Зная себя, потратил бы точно больше.
Не могу привести пруфов, что весь код полезный и продуктивный - очевидно, можно и миллион строк за час наслопить. Но в рамках моей песочницы всё это реально важно и ценно.
* * *
Если в лоб поделить 7 на 3, может показаться, что агенты ускоряют работу в два раза. Просто смешно. Моих когнитивных ресурсов хватило бы максимум на 10% подобной работы. А если учесть, что Я не в каждые выходные могу фул потратить на разработку, то и все 5%.
* * *
К чему Я веду: личный сервер, подписка на проагента, чуть заморочиться с CLI и вот вы уже машина по переработке ваших бредовых идей в выводы почему они бредовые.
Совершенно разные области экспертизы (Data engineering, Quantitative research, Trading infrastructure).
Claude оценивает это в 7-11 рабочих дней синьор разработчика. Зная себя, потратил бы точно больше.
Не могу привести пруфов, что весь код полезный и продуктивный - очевидно, можно и миллион строк за час наслопить. Но в рамках моей песочницы всё это реально важно и ценно.
* * *
Если в лоб поделить 7 на 3, может показаться, что агенты ускоряют работу в два раза. Просто смешно. Моих когнитивных ресурсов хватило бы максимум на 10% подобной работы. А если учесть, что Я не в каждые выходные могу фул потратить на разработку, то и все 5%.
* * *
К чему Я веду: личный сервер, подписка на проагента, чуть заморочиться с CLI и вот вы уже машина по переработке ваших бредовых идей в выводы почему они бредовые.
Forwarded from Agentic Engineer
Telegram
Сиолошная
Большие новости по OpenAI от The Information:
- OpenAI завершила предобучение своей следующей крупной модели под названием Spud и ожидает, что уже через несколько недель получит очень сильную модель, способную заметно ускорить экономику.
- По словам Сэма…
- OpenAI завершила предобучение своей следующей крупной модели под названием Spud и ожидает, что уже через несколько недель получит очень сильную модель, способную заметно ускорить экономику.
- По словам Сэма…
Forwarded from Agentic Engineer
Open-source книга про архитектуру безопасных AI-агентов.
Когда будет время и желание, посмотри:
🟢 покритикуй по делу
🟢 полайкай и репостни посты:
🔘 хабр
🔘 linkedin
🔘 dev.to
🔘 medium
🟢 и накинь звёздочку в репо GitHub ⭐️
Сама книга в mkdocs на github pages, читать удобно с любых устройств, агент codex достойно справился с вёрсткой
#ai #agents #architecture #agentic #llm
Когда будет время и желание, посмотри:
Сама книга в mkdocs на github pages, читать удобно с любых устройств, агент codex достойно справился с вёрсткой
#ai #agents #architecture #agentic #llm
Please open Telegram to view this post
VIEW IN TELEGRAM
Хабр
Пост @dKosarevsky — Python — 29.03 08:00
Всем привет. Начал писать открытую книгу про архитектуру безопасных AI-агентов. Делаю не обзор фреймворков и не коллекцию «магических демо», а практический инженерный reference: control plane, policy...
Forwarded from tl;dr data
Claude Certified Architect
У Anthropic появилась сертификация.
Сертификация Claude Certified Architect - Foundations подтверждает, что специалист способен принимать обоснованные решения о компромиссах при внедрении реальных решений на базе Claude.
Экзамен проверяет базовые знания по Claude Code, Claude Agent SDK, Claude API и Model Context Protocol (MCP) - основным технологиям для создания production-приложений с Claude.
Так же на GitHub есть русскоязычный гайд для подготовки.
Выглядит как не плохой вариант разобраться с Claude Code.
Ну и сертификат не будет лишним.
@tldr_data
У Anthropic появилась сертификация.
Сертификация Claude Certified Architect - Foundations подтверждает, что специалист способен принимать обоснованные решения о компромиссах при внедрении реальных решений на базе Claude.
Экзамен проверяет базовые знания по Claude Code, Claude Agent SDK, Claude API и Model Context Protocol (MCP) - основным технологиям для создания production-приложений с Claude.
Так же на GitHub есть русскоязычный гайд для подготовки.
Выглядит как не плохой вариант разобраться с Claude Code.
Ну и сертификат не будет лишним.
@tldr_data
Forwarded from tl;dr data
Один из самых внятных бесплатных курсов по AI coding agents
opencode.school - 14 уроков, 7 практических проектов, без регистрации.
Я сам ежедневно использую Claude Code. Но зависеть от одного провайдера готовы не все.
OpenCode - open-source альтернатива, которая работает с 75+ моделями: Claude, GPT, Gemini или локальные модели на вашей машине.
Чем курс отличается:
Вы учитесь прямо внутри инструмента.
Копируете промпты в OpenCode, и он ведёт вас по шагам, параллельно синхронизируя прогресс с сайтом.
Покрывает весь базовый слой: установка, права доступа, кастомные команды, плагины, multi-agent сценарии.
В конце курса, прикладные проекты:
сборка сайтов, автоматизация браузера.
Если вы хотели разобраться с AI-агентами, но откладывали из-за непонятного старта, то это один из самых понятных способов начать.
@tldr_data
opencode.school - 14 уроков, 7 практических проектов, без регистрации.
Я сам ежедневно использую Claude Code. Но зависеть от одного провайдера готовы не все.
OpenCode - open-source альтернатива, которая работает с 75+ моделями: Claude, GPT, Gemini или локальные модели на вашей машине.
Чем курс отличается:
Вы учитесь прямо внутри инструмента.
Копируете промпты в OpenCode, и он ведёт вас по шагам, параллельно синхронизируя прогресс с сайтом.
Покрывает весь базовый слой: установка, права доступа, кастомные команды, плагины, multi-agent сценарии.
В конце курса, прикладные проекты:
сборка сайтов, автоматизация браузера.
Если вы хотели разобраться с AI-агентами, но откладывали из-за непонятного старта, то это один из самых понятных способов начать.
@tldr_data
OpenCode School
Learn to use OpenCode, the free and open-source AI coding agent.
Forwarded from Denis
#whois Всем привет, меня зовут Денис. Долго был Девелопером, потом перешел на менеджерский путь (ТимЛид, ПМ, Деливери Менеджер сейчас). Решил немного вернуться к инженирингу недавно - сегодня как раз пришел результат экзамена. Теперь, я Сертифайд Клод Соулюшн Акитект https://verify.skilljar.com/c/2ohrunmz98g2
Anthropic Courses
Learn to build with Claude AI through Anthropic's comprehensive courses and training programs.