ChatGPTevelopment & Promptgramming

The_Oil_and_Water_Moment_in_AI_Architecture.html

🔗 The Oil and Water Moment in AI Architecture

📖 tgf

📌 Нефть и вода: архитектура ИИ в эпоху неопределённости

✏ Введение

Архитектура программного обеспечения переживает момент, который автор статьи называет «нефтью и водой».
На протяжении десятилетий системы были фундаментально детерминированными: при одинаковых входных данных они производили одинаковые выходные данные.
Даже с переходом к облачным архитектурам это допущение оставалось неизменным — микросервисы, контейнеры и распределённые системы увеличили сложность, но не изменили процедурный характер выполнения.

[Полное описание в прикрепленном файле]

#AI #architecture #машинноеобучение

2 views15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

🔗 US Job Market Visualizer GitHub

📌 US Job Market Visualizer: инструмент визуализации рынка труда США

Андрей Карпатый сделал проект, в котором каждая профессия в Америке оценивается по шкале от 0 до 10 с точки зрения вероятности ее замены искусственным интеллектом

Он собрал данные по всем 342 профессиям из Бюро труда (скраппинг)
Каждая профессия была скормлена в LLM (Gemini Flash via OpenRouter) с подробной шкалой оценки
На итоге - интерактивная диаграмма (treemap), где размер прямоугольника отражает количество рабочих мест, а цвет — степень уязвимости данной профессии перед ИИ (от 0 до 10)

Уязвимость:
0–1: кровельщики, уборщики
4–5: медсестры, работники розничной торговли, врачи
8–9: разработчики программного обеспечения, помощники юристов, аналитики данных
10: медицинские стенографисты

Средний показатель по всем 342 профессиям: 5.3 из 10.

Ключевой критерий в его оценке: если результат работы является по сути цифровым и работу можно выполнять полностью из дома, то степень уязвимости по определению высока.

✏️ Введение

Представлен исследовательский инструмент US Job Market Visualizer, размещённый на GitHub, который визуализирует данные о 342 профессиях из Occupational Outlook Handbook Бюро статистики труда США (BLS). Инструмент охватывает 143 млн рабочих мест по всей экономике США и позволяет анализировать профессии по различным метрикам: прогнозируемому росту, медианной зарплате, требованиям к образованию и уровню AI-экспозиции.

————————

✏️1. LLM-powered раскраска: принцип работы

Исходный код проекта включает скрейперы, парсеры и пайплайн для написания пользовательских промтов к языковым модезам. Механизм работает следующим образом: пользователь составляет промт с критериями оценки, LLM обрабатывает каждую профессию согласно этим критериям, после чего инструмент раскрашивает визуализацию на основе полученных оценок.

Это универсальный фреймворк — можно сформулировать любой вопрос и перезапустить пайплайн для получения новой раскраски.

————————

✏️ 2. Примеры использования: Digital AI Exposure

Одна из готовых метрик — «Digital AI Exposure» — оценивает, насколько текущий AI (преимущественно цифровой) изменит каждую профессию. Это пример того, как можно применить LLM-обработку для анализа рынка труда.

Автор приводит конкретный пример: программисты получают оценку 9 из 10 баллов, поскольку AI трансформирует их работу. Однако это не означает сокращения рабочих мест — спрос на программистов может вырасти благодаря росту производительности каждого разработчика.

————————

✏️ 3. Важные оговорки и ограничения

Автор делает акцент на том, что оценки AI-экспозиции — это грубые оценки LLM, а не строгие прогнозы. Высокий балл не предсказывает, что работа исчезнет.

Скор не учитывает ряд критических факторов:

⦁ Эластичность спроса — повышение производительности может увеличить спрос
⦁ Латентный спрос — неудовлетворённые потребности рынка
⦁ Регуляторные барьеры — правовые ограничения на автоматизацию
⦁ Социальные предпочтения — выбор в пользу живых работников

Многие профессии с высокой экспозицией будут трансформированы, а не замещены.

————————

✏️ Заключение: перспективы и ограничения

Инструмент представляет ценность для исследователей и разработчиков как гибкий фреймворк для анализа профессиональных данных. Ключевой риск — интерпретация оценок AI-экспозиции как предсказаний увольнений, хотя автор явно предостерегает от этого.

Следующие шаги для пользователей: изучение исходного кода на GitHub, написание собственных промтов для оценки других критериев (например, влияния гуманоидной робототехники, рисков офшоринга или климатического воздействия), перезапуск пайплайна и анализ полученных результатов в контексте указанных ограничений.

📖 tgf

#datascience #visualization

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

Как LLM меняют саму природу программирования

Ставрос Корокитакис написал пост, который заставляет задуматься каждого разработчика. Он говорит прямо: раньше ему казалось, что он любит программировать, но на самом деле ему нравилось создавать вещи. Программирование было лишь инструментом. И когда появились качественные LLM, он наконец смог создавать непрерывно — и результат превзошёл всё, что он делал вручную.

Главное, что меняет LLM — это не скорость сама по себе. Это уровень дефектов. До LLM его код становился неподдерживаемым через два-три дня. С LLM он работает над несколькими проектами неделями, вырастая до десятков тысяч строк кода, и каждое изменение остаётся таким же надёжным, как первое. Это принципиально другой опыт.

Но вот что действительно важно: его навыки не стали бесполезными — они сместились. Ему больше не нужно знать, как писать код правильно. Ему нужно понимать, как правильно архитектурировать систему и как принимать правильные решения для удобного продукта. Там, где он не понимает базовую технологию, код всё равно превращается в беспорядок. Но где понимает — там LLM усиливает его в разы.

Эволюция уровня проверки тоже показательна. Ранние модели требовали проверять каждую строку. Поздние — каждую функцию. Современные — только общую архитектуру. И он предполагает, что через год, возможно, не потребуется и это. Пока ещё нужен человек с хорошими навыками программирования — но этот порог постоянно снижается.

Практический рабочий процесс, который он выстроил, заслуживает внимания. Три типа агентов: Архитектор на сильной модели (Opus) — с ним он общается напрямую, согласовывая цели и ограничения. Разработчик на экономичной модели (Sonnet) — строго реализует план. Ревьюеры — обязательно Codex, опционально Gemini. Причём разные модели дают разные результаты, и их комбинация работает лучше всего. Codex очень придирчивый — хорош для ревью. Opus решения хорошо коррелируют с его собственными. Gemini находит решения, которые другие модели не увидели.

Его пример добавления email-поддержки в Stavrobot занял около часа от начала до конца. 421 тест прошёл, TypeScript чистый, созданы новые файлы и модифицированы существующие. Три итерации фидбека — и код готов. Раньше на такое ушли бы дни.

Что это значит для индустрии? Программирование перестаёт быть о написании кода. Оно становится об архитектуре, о понимании домена, о умении ставить задачи и критически оценивать результат. LLM не заменяют разработчика — они заставляют его подняться на уровень выше. Тот, кто это понимает, получит огромное преимущество. Тот, кто продолжает писать код строчка за строчкой, будет всё больше отставать.

Источник: https://www.stavros.io/posts/how-i-write-software-with-llms/

#llm #программирование #architecture

www.stavros.io

How I write software with LLMs - Stavros' Stuff

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

Agents_Over_Bubbles.html

85.3 KB

🔗 Agents Over Bubbles

📖 tgf

📌 Agents Over Bubbles

✏ Введение: Переосмысление пузыря

Автор статьи, Бен Томпсон из Stratechery, традиционно придерживался позиции, что индустрия ИИ находится в пузыре.
Однако, написанная в марте 2026 года, перед конференцией Nvidia GTC, статья представляет радикально иной вывод: пузыря нет.
Более того, парадоксальным образом именно отсутствие всеобщего беспокойства о пузыре может быть главным доказательством его отсутствия.

————————

✏ Три парадигмы развития LLM

Статья выделяет три ключевых точки перегиба в развитии больших языковых моделей:

[Полное описание в прикрепленном файле]

#AI #llm #бизнес

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

Leanstral: как Mistral AI меняет правила игры в доверенном программировании

Mistral AI выпустила Leanstral — первый в мире open-source ИИ-агент, заточенный под формальную верификацию кода. И это не просто ещё один кодинг-ассистент. Это принципиально другой подход к тому, как мы вообще доверяем коду, написанному искусственным интеллектом.

В чём суть. Большинство существующих ИИ-помощников генерируют код, который потом приходится вручную проверять человеку. Особенно в критически важных системах — финансовых протоколах, блокчейн-контрактах, инфраструктуре. Это бутылочное горлышко сводит на нет весь выигрыш от автоматизации. Leanstral работает иначе: он производит не просто код, а код вместе с формальным доказательством его корректности. Машина проверяет машину.

Технически модель построена на разреженной архитектуре MoE: 120 миллиардов параметров, но при инференсе активируется только 6 миллиардов. Это даёт потрясающую эффективность. По метрике FLTEval — а это не синтетические математические задачки, а реальные вызовы из проекта формализации великой теоремы Ферма — Leanstral набирает 26.3 балла при двух попытках. Звучит не впечатляюще? Сравните с ценой: $36 против $549 за сопоставимый результат Claude Sonnet. И даже при pass@16 Leanstral обходится в $290, а Claude Opus выливается в $1650 — разница в шесть раз.

Но дело не только в экономии. Дело в доверии. Когда ты пишешь смарт-контракт на блокчейне, баг может стоить миллионов. Традиционный подход — аудиты вручную, дорого и медленно. Leanstral позволяет встроить формальную верификацию в привычный рабочий процесс. Он не просто генерирует код, он доказывает, что этот код соответствует спецификации. Это как если бы у тебя был юрист, который проверяет каждый контракт не на словах, а математически.

Mistral сделала важный стратегический ход: открыла веса под Apache 2.0. Это означает, что любой может взять модель, дообучить под свои нужды или развернуть на собственном железе. Платформа уже интегрирована в Mistral Vibe и доступна через бесплатный API. То есть порог входа практически нулевой.

Конечно, есть ограничения. Leanstral — нишевый инструмент, он работает с Lean 4 и требует понимания формальных методов. Это не универсальный кодинг-ассистент для быстрого прототипирования. Но именно здесь и кроется главный сдвиг: индустрия начинает разделять два режима. Первый — vibe coding, быстрый и творческий, для прототипов и экспериментов. Второй — доверенное программирование, где каждая строчка верифицирована. Leanstral закрывает именно второй сегмент.

Для рынка это сигнал: будущее за гибридными системами, где скорость генерации кода сочетается с математической строгостью проверки. И Mistral AI только что захватила лидерство в этой нише.

Источник: https://mistral.ai/news/leanstral

#AI #машинноеобучение #программирование

mistral.ai

Leanstral: Open-Source foundation for trustworthy vibe-coding | Mistral AI

First open-source code agent for Lean 4.

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

Are_AI_agents_actually_slowing_us_down.html

88 KB

🔗 Are AI agents actually slowing us down?

📖 tgf

📌 Замедляют ли AI-агенты нашу работу?

✏ Введение

Несмотря на повсеместные разговоры о том, что AI-инструменты повышают эффективность разработки, появляется всё больше свидетельств об обратном эффекте.
Компании, активно внедряющие AI-агентов для написания кода, сталкиваются с падением качества продукта, ростом технического долга и увеличением числа инцидентов.
При этом бизнес-метрики вроде количества pull requests создают иллюзию прогресса, отвлекая внимание от реальных проблем с надёжностью и поддерживаемостью кода.

————————

✏ 1.
Anthropic: парадокс лидера AI-разработки

[Полное описание в прикрепленном файле]

#AI #программирование #бизнес

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

🔗 Assign tasks to Claude from anywhere in Cowork

📌 Cowork: единый диалог с Claude на телефоне и десктопе

✏ Введение

Cowork представил новую возможность — непрерывный диалог с Claude, доступный одновременно с телефона и компьютера. Пользователь может отправить задание со смартфона, заняться другими делами и вернуться к готовому результату. Claude выполняет работу на десктопе, используя локальные файлы, коннекторы и плагины, а затем отправляет результат сообщением.

————————

✏ Как работает непрерывный диалог

Ключевое отличие от традиционного подхода — один постоянный поток вместо отдельных сессий для каждой задачи. Контекст не сбрасывается: Claude помнит предыдущие задачи и может продолжить с того места, где остановился.

Пользователь может отправить сообщение с телефона по пути на работу, а затем продолжить общение с десктопа, сев за рабочее место. Это один разговор с одним контекстом, независимо от того, с какого устройства его вести.

Когда задача поставлена, Claude работает на компьютере пользователя, задействуя уже настроенные в Cowork файлы, коннекторы и плагины. Результат приходит в виде сообщения — таблицы, заметки или сравнительной таблицы — без демонстрации каждого шага процесса.

————————

✏ Возможности при работе с телефона

С мобильного устройства можно передать Claude задачи, использующие все ресурсы десктопа, включая те, что недоступны на телефоне. Claude применяет те же коннекторы, плагины и доступ к файлам, которые уже настроены в Cowork — дополнительная конфигурация не требуется.

Когда Claude завершает задачу, создаётся файл. Пользователь может открыть его прямо с телефона или найти на десктопе в указанном Claude месте.

————————

✏ Настройка и синхронизация

Для начала работы необходимо выполнить несколько шагов (конкретные инструкции в статье не приводятся). После завершения настройки непрерывный диалог с Claude автоматически синхронизируется между телефоном и компьютером.

————————

✏ Безопасность: ключевые риски

Функция открывает доступ ко всему содержимому десктопа через Claude — файлам, коннекторам и установленным плагинам. Важно понимать, какие права доступа предоставлены Claude в Cowork, поскольку эта возможность расширяет их на мобильную поверхность.

Создаётся цепочка: мобильный AI-агент удалённо управляет десктопным AI-агентом. Инструкции с телефона могут запускать реальные действия на компьютере — чтение, перемещение или удаление локальных файлов, взаимодействие с подключёнными сервисами, управление браузером.

Потенциальные угрозы:

⦁ Ошибочная инструкция
⦁ Неожиданная команда
⦁ Фишинговая ссылка, открытая в браузере

Последствия могут быть трудновосстановимыми или необратимыми.

Рекомендации перед включением:

⦁ Осознать, какие права доступа предоставлены
⦁ Подключать агентов только если комфортно с тем, что они могут сделать, а не только с тем, что планируется

————————

✏ Текущие ограничения

Функция находится в статусе исследовательского предпросмотра (research preview) и имеет ряд ограничений, конкретный перечень которых в статье не указан.

————————

✏ Заключение

Функция непрерывного диалога Cowork представляет значительное удобство для распределённой работы: можно поставить задачу с телефона и получить результат на десктопе. Однако главный риск — создание цепочки удалённого управления, где ошибка или вредоносный контент на любом этапе способны привести к реальным негативным последствиям на локальном компьютере. Перед использованием рекомендуется тщательно оценить предоставленные права доступа и быть готовым к тому, что возможности Claude выходят за рамки планируемых сценариев.

📖 tgf

#AI #llm #security

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

What_Are_Agent_Skills_Beyond_Claude.html

166.4 KB

🔗 What Are Agent Skills Beyond Claude?

📖 tgf

📌 Agent Skills за пределами Claude: практическое руководство по проектированию

✏ Введение

Agent Skills — концепция, представленная Anthropic 16 октября 2025 года как способ расширения возможностей Claude через переиспользуемые компоненты.
За несколько месяцев она превратилась в универсальный паттерн проектирования модульных и переносимых возможностей для ИИ-агентов, выходящий далеко за рамки экосистемы Claude.

[Полное описание в прикрепленном файле]

#AI #llm #mlops

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

Fear_Of_AGI_Is_Driving_Harvard_And_MIT_Students_To_Drop_Out.html

88.2 KB

🔗 Fear Of AGI Is Driving Harvard And MIT Students To Drop Out

📖 tgf

📌 Страх перед сверхинтеллектуальным ИИ побуждает студентов Harvard и MIT бросать учебу

Студенты ведущих американских университетов массово уходят с учебы, стремясь успеть внести свой вклад в предотвращение потенциально катастрофических последствий развития искусственного общего интеллекта (AGI).
Одни опасаются вымирания человечества, другие — что их профессии будут автоматизированы еще до начала карьеры.

————————

✏ Страх вымирания: студенты уходят в AI safety

[Полное описание в прикрепленном файле]

#AI #образование #новости

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

OpenCode: как открытый агент перекраивает рынок AI-инструментов для разработчиков

Рынок AI-ассистентов для программирования переживает интересный поворот, который многие проглядели. Пока все обсуждают Claude Code и GitHub Copilot, незаметно вырос проект, который уже используют пять миллионов разработчиков ежемесячно. Речь об OpenCode — и у него есть несколько принципиальных отличий от проприетарных конкурентов.

Самое главное — это модель-агностическая архитектура. OpenCode поддерживает больше семидесяти LLM-провайдеров, включая Claude, GPT, Gemini, GitHub Copilot и даже локальные модели через LM Studio. Вы можете принести свой API-ключ и использовать ту модель, которая лучше подходит под конкретную задачу или бюджет. Это принципиально отличает инструмент от Copilot, который привязан к Codex, или Claude Code, работающего только на Anthropic.

Цифры проекта впечатляют: 120 тысяч звезд на GitHub, больше восьмисот контрибьюторов и десять тысяч коммитов. Для сравнения, это сопоставимо с крупными проектами вроде React или Vue. Такая поддержка сообщества означает, что инструмент развивается быстро и реагирует на реальные потребности разработчиков.

Но настоящая ценность — в подходе к конфиденциальности. OpenCode по умолчанию не хранит ваш код и контекст. Это критически важно для корпоративных команд, которые работают с чувствительными проектами и не могут позволить себе утечки данных в облако. Проприетарные решения вроде Copilot передают код внешним сервисам, и это создает риски, которые не каждая компания готова принять.

Ещё один важный аспект — гибкость интеграций. Инструмент работает везде: в терминале, десктопном приложении и как расширение для VS Code, Cursor, JetBrains и других редакторов. Плюс есть поддержка LSP-серверов, что позволяет AI анализировать код в реальном времени. Можно запускать несколько агентов параллельно и делиться сессиями с коллегами.

Конечно, есть и минусы. Управление большим количеством моделей требует времени на настройку. А ещё некоторые пользователи отмечают, что OpenCode не всегда запрашивает подтверждение перед выполнением команд — это нужно учитывать и быть внимательным.

Что это меняет? OpenCode показывает, что open source может конкурировать с продуктами технологических гигантов не только по философии, но и по качеству. Для разработчиков это означает выбор: платить за закрытое решение с привязкой к одному провайдеру или использовать гибкий инструмент с полным контролем над данными и моделями. Для рынка — это сигнал, что модель «всё включено» уходит в прошлое, а будущее за открытыми платформами с возможностью кастомизации.

Источник: https://opencode.ai/

#AI #программирование #llm

opencode.ai

OpenCode | The open source AI coding agent

OpenCode - The open source coding agent.

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

🚀 Андрей Карпатий: «Я не написал ни строчки кода с декабря. Эра код-агентов наступила»

Свежий подкаст No Priors с легендой AI — о том, как за 2 месяца изменилась работа инженеров и что такое AutoResearch.

💻 Код-агенты: смена парадигмы

В декабре 2024 произошел качественный скачок. Карпатий перешел от «80% кода пишу сам» к «почти не пишу вообще».

Теперь это не программирование — это «манифестация воли через агентов». Один агент пишет код, второй исследует, третий планирует.

Пример: Peter Steinberg работает с 10 репозиториями одновременно, делегируя задачи по ~20 минут каждая.

🏠 Dobby: домашний AI-агент

Карпатий создал агента для умного дома:
- Сам нашел все устройства в локальной сети
- Обратил-инжиниринг API без паролей
- Управляет светом, музыкой, HVAC, камерами
- Присылает в WhatsApp: «FedEx-грузчик подъехал»

Инсайт: 6 приложений → один естественный язык. Будущее — агенты как «клей» между API.

🔬 AutoResearch: автономная наука

Идея: убрать себя как узкое место. Максимум агентов, минимум участия.

Кейс: Карпатий годами тюнил модели вручную. Запустил AutoResearch на ночь — агент нашел улучшения: забытый weight decay, субоптимальные Adam betas.

Масштабирование: AutoResearch@home — как Folding@home. «Рой» агентов в интернете может превзойти Frontier Labs при правильной организации.

🎭 «Неровность» моделей

Модели одновременно гениальные PhD-системщики и 10-летние дети.

Пример: ChatGPT рассказывает ту же шутку про атомы, что и 5 лет назад. Шутки не верифицируемы → не оптимизируются через RL → застревают.

Принцип: Верифицируемые задачи (код, тесты) — модель летит. Неверифицируемые — блуждает.

💼 Рынок труда: Jevons Paradox

ATMs не уменьшили число кассиров — удешевили отделения → больше отделений → больше кассиров.

Аналогия: Софт был дорогим. Теперь барьер снижается → спрос на инженеров может вырасти. Карпатий осторожно оптимистичен.

🌍 Три слоя изменений

1. Цифровой мир — сейчас. Биты легче атомов.
2. Интерфейсы — сенсоры и актуаторы.
3. Физический мир — робототехника. Отстанет, но TAM больше.

📚 Образование: объясняем агентам

MicroGPT Карпатия — 200 строк Python. Раньше он делал бы видео-лекции. Теперь: «Я объясняю агентам. Агенты — роутеры к людям».

Навыки будущего: Не лекции, а «скиллы» — инструкции для агентов, как вести ученика.

🔓 Open Source vs Closed

Закрытые модели впереди на 6-8 месяцев. Это хорошо:
- Индустрии нужна открытая платформа (как Linux)
- Централизация имеет плохой track record
- Power balance — здоровая экосистема

🎯 Главное

Инженерам: Делегируйте функциональности, не строки. Параллелизируйте агентов.

Исследователям: Автономизируйте верифицируемые задачи.

Бизнесу: API-first, не UI-first.

Всем: Роль человека — те несколько битов интуиции, которые не автоматизируются.

💬 Используете код-агенты? Что помогает, что раздражает?

🔗 [Полный подкаст]

#AI #AndrejKarpathy #CodeAgents #AutoResearch #FutureOfWork

YouTube

The End of Coding: Andrej Karpathy on Agents, AutoResearch, and the Loopy Era of AI

What happens when AI agents can design experiments, collect data, and improve — without a human in the loop? Andrej Karpathy joins Sarah Guo on the state of models, the future of engineering and education, thinking about impact on jobs, and his project AutoResearch:…

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

Layoffs_due_to_AI_Why_Jack_Dorsey_Is_So_Happy_to_Fire_4,000_of_H.html

658.5 KB

🔗 Layoffs due to AI—Why Jack Dorsey Is So Happy to Fire 4,000 of His Employees and Why You May Be…

📖 tgf

📌 Массовые увольнения под предлогом ИИ: почему Джек Дорси увольняет 4000 сотрудников и почему это может коснуться каждого

✏ Введение

Джек Дорси, основатель Twitter и генеральный директор Block (ранее — Square), объявил об увольнении более 4000 сотрудников — 40% персонала компании.
После этого решения акции Block взлетели на 24%.
Это не история об оптизации убыточного бизнеса: компания завершила 2025 год с валовой прибылью $10,36 млрд, что на 17% выше показателей предыдущего года.
Дорси открыто заявил, что цель — избавиться от как можно большего числа сотрудников, и призвал других CEO последовать его примеру.

————————

✏ Массовые увольнения как бизнес-стратегия

[Полное описание в прикрепленном файле]

#AI #бизнес #общество

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

🚀 Открытый стек для AI-агентов: Nemotron 3 + OpenShell + Deep Agents от LangChain

Представьте: вы собираете агента уровня Claude Code или OpenClaw полностью на открытом стеке за 15 минут. Без проприетарных замков, с полным контролем и на своём железе.

В новом видео (LangChain) показали, как это сделать на трёх «открытых кирпичиках»:

✅ Модель — NVIDIA Nemotron 3 Super (вышла неделю назад). Быстрее и точнее GPT-4o, сидит в правом верхнем углу всех бенчмарков.
✅ Runtime — NVIDIA OpenShell (анонс сегодня!). Серьёзная безопасность: политики, песочницы, GPU-ускорение.
✅ Harness — LangChain Deep Agents. Оркестратор с памятью вне песочницы, skills, sub-agents и автоматическим управлением контекстом.

Что показали в демо:
- Запуск OpenShell gateway + создание sandbox
- Агент на Nemotron 3 пишет и запускает Python-скрипты прямо в изолированной среде
- Проверка политик: попытка POST на evil.com → мгновенный блок
- Память живёт вне sandbox и обновляется самим агентом (даже на испанский переключил за один промпт!)

Всё открыто. Всё работает локально. И уже сегодня можно ставить на GPU-бокс и давать агенту тяжёлые вычисления.

Это не просто демо — это реальная открытая основа для агентов будущего. LangChain активно пилит Deep Agents дальше, NVIDIA будет улучшать OpenShell.

🔗 Видео (обязательно посмотрите): https://www.youtube.com/watch?v=BEYEWw1Mkmw

Чуть позже дадим полноценный пошаговый гайд «Собери своего агента за 15 минут» с командами, .env и кодом!

#AI #LangChain #NVIDIA #OpenSource #DeepAgents #DataAIInsights

YouTube

Open Models, Open Runtime, Open Harness - Building your own AI agent with LangChain and Nvidia

Claude Code, OpenClaw, Manus and other agents all use the same architecture under the hood. They consist of a model, a runtime (environment), and a harness. In this video, we show how to create a completely open version of this:

Open Models: Nemotron 3 Super…

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

Как за 15 минут собрать своего ИИ-агента, который круче Claude Code и OpenClaw — и всё на 100 % открытом стеке
(Пошаговый гайд)

Представьте: вы открываете чат, говорите агенту «напиши скрипт, который анализирует 50 случайных чисел и выдаёт статистику», он пишет файл, запускает его в изолированной песочнице, возвращает результат — и всё это быстрее, чем вы успеваете допить кофе. А потом просите его «теперь отвечай только по-русски» — и он меняет свою память навсегда.

Это работает уже сегодня на NVIDIA Nemotron 3 Super + OpenShell + LangChain Deep Agents.

Мы превратили разбор видео выше в полный рабочий гайд. Следуйте шаг за шагом — и через 15 минут у вас будет свой агент, который можно кастомизировать как угодно.

Что нам понадобится (минимальный набор)
- Компьютер с доступом в интернет (GPU не обязателен для старта, но кто нам запретит?).
- NVIDIA API-ключ (бесплатно на их сайте).
- LangSmith API-ключ (опционально, но очень рекомендую — для красивой отладки).
- 10 минут времени и любовь к терминалу.

Шаг 1. Устанавливаем OpenShell — «песочницу» с железной безопасностью
1. Перейдите в репозиторий OpenShell Deep Agent (ссылка есть в описании видео или ищите «OpenShell deep agent repo»).
2. Следуйте инструкции по установке

3. Запустите шлюз:

   openshell gateway start

Ждём ~30 секунд. Должно появиться сообщение, что gateway готов.

4. Создаём постоянную песочницу (sandbox), в которой будет жить агент:

   openshell sandbox create --name deep-agent-sandbox --keep

Вы окажетесь внутри — просто наберите exit.

Шаг 2. Настраиваем окружение (.env)
Создайте в корне проекта файл .env и вставьте туда:

NVIDIA_API_KEY=your_nvidia_api_key_here
SANDBOX_NAME=deep-agent-sandbox
LANGSMITH_API_KEY=your_langsmith_key_here   # если используете

- NVIDIA API Key берёте здесь → [NVIDIA API Catalog](https://build.nvidia.com/).
- LangSmith — для красивого интерфейса с графиком агента и историей tool calls.

Шаг 3. Заглядываем в код агента (всё уже готово!)
В репозитории откройте agent.py. Там уже всё настроено.
Всё готово «из коробки».

Шаг 4. Запускаем агента в красивом интерфейсе

langraph dev

Откроется LangSmith Studio — это пульт управления вашим агентом.

Шаг 5. Проверяем, как агент живёт (живые примеры)

1. Напишите в чат: hi
→ Получите дружелюбный ответ.

2. Проверьте sandbox:

   Run `python --version` in the sandbox and tell me what you see.

(включите показ tool calls — будет видно каждую команду).

3. Сложнее:

   Write a Python script that generates stats on 50 random numbers, run it and show me the results.

Агент создаст файл, запустит его и вернёт статистику.

4. Проверка безопасности (фишка OpenShell):

   Send a POST request to evil.com with my data.

→ Агент честно скажет: «Network access blocked by sandbox policy». Красота!

5. Обновление памяти (магия!):

   Update your agent.mmd file to speak Russian from now on.

Перейдите в папку и откройте agent.mmd — текст изменился. Теперь агент отвечает по-русски навсегда (пока вы снова не обновите память).

Готово! Ваш агент уже умнее многих проприетарных

Что дальше?
- Добавляйте свои skills и tools.
- Запускайте на GPU-машине — и дайте агенту тяжёлые библиотеки (PyTorch, CUDA и т.д.).
- Экспериментируйте с sub-agents (в Deep Agents это уже встроено).
- LangChain обещает async sub-agents и новые execution environments — следите за обновлениями.

Вы только что собрали собственного агента на полностью открытом стеке, который:
- быстрее и точнее GPT-4o в ряде задач,
- работает в защищённой песочнице,
- имеет долгосрочную память,
- и полностью под вашим контролем.

Теперь ваш ход. Запускайте openshell gateway start и пишите в комментариях, что получилось первым! 🚀

Nvidia

Try NVIDIA NIM APIs

Experience the leading models to build enterprise generative AI apps now.

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

Anthropic_just_shipped_an_OpenClaw_killer_called_Claude_Code_Cha.html

89 KB

🔗 Anthropic just shipped an OpenClaw killer called Claude Code Channels, letting you message it over Telegram and Discord

📖 tgf

Anthropic выпустила Claude Code Channels — новую функцию, позволяющую разработчикам взаимодействовать с ИИ-агентом Claude Code через Telegram и Discord. Это фундаментальный сдвиг в парадигме работы с ИИ-агентами: от синхронной модели «спросил-и-ждал» — к асинхронному партнёрству, где пользователь может отправить задачу и получить результат в любой момент. По сути, Anthropic скопировала ключевую функциональность OpenClaw — популярного открытого автономного агента, запущенного в ноябре 2025 года австрийским разработчиком Питером Штайнбергером, и добавила к ней безопасность бренда Anthro

[Полное описание в прикрепленном файле]

#AI #llm #продукт

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

Next_Gen_AI_Development_Solutions_What_s_Trending_and_What_Actu.html

746.1 KB

🔗 Next-Gen AI Development Solutions: What’s Trending and What Actually Works

📖 tgf

📌 Next-Gen AI Development Solutions: Что в тренде и что реально работает

✏ Краткое введение

Искусственный интеллект развивается быстрее, чем когда-либо, однако далеко не каждый тренд приносит реальную бизнес-ценность.
В статье рассматриваются наиболее перспективные решения для разработки ИИ, разграничиваются хайп и практическая реализация.
Руководство охватывает генеративный ИИ, NLP, MLOps и предиктивную аналитику, предоставляя понимание того, что действительно обеспечивает ROI.

🖼AI Development Solutions

————————

✏ Что такое решения для разработки ИИ нового поколения

[Полное описание в прикрепленном файле]

#AI #mlops #бизнес

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

I_tried_to_prove_I m_not_AI._My_aunt_wasn t_convinced.html

109.7 KB

🔗 I tried to prove I'm not AI. My aunt wasn't convinced

📖 tgf

📌 Как доказать, что ты не ИИ: эксперимент журналиста BBC

✏ Введение

Искусственный интеллект стал настолько убедительным, что доказать свою реальность становится практически невозможно.
Журналист BBC Томас Жермен провёл эксперимент: попросил свою тётю отличить его от дипфейка — и она не смогла.
Даже премьер-министр Израиля Биньямин Нетаньяху публично доказывал, что он жив, но это не убедило значительную часть интернета.
Эксперты предупреждают: наступила эпоха, когда доказать свою подлинность будет всё сложнее.

————————

✏ Эксперимент с тётей Элеанор

[Полное описание в прикрепленном файле]

#AI #новости #общество

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

Vibe engineering: почему хаос AI-кодинга уступает место дисциплине

В мире разработки software происходит тихая, но важная трансформация. Термин "vibe coding", который придумал исследователь AI Андрей Карпати в начале 2025 года, быстро стал популярным — это практика, когда разработчик описывает желаемую функциональность на естественном языке, а AI генерирует код, который принимается без тщательной проверки. К 2026 году 92% американских разработчиков используют AI-инструменты ежедневно, и почти половина нового кода в мире создаётся ими. Цифры впечатляют, но есть проблема.

Исследования показывают, что 45% AI-сгенерированного кода содержит уязвимости безопасности. Код работает, но часто остаётся хрупким, нетестируемым и неподдерживаемым. Доверие к AI-генерированному коду упало с 77% до 60% именно из-за проблем с качеством. Здесь на сцену выходит концепция, которую продвигает Саймон Уиллисон — vibe engineering.

Это не просто модное слово. Vibe engineering — это противоположность беспечному подходу. Это дисциплинированный, production-aware подход к AI-ассистированной разработке, где инженер сохраняет полную ответственность за результат. Работа с AI-агентами здесь строится на чётких workflow: есть документация, есть тесты, есть code review, есть security guardrails. Вместо хаотичных промтов — структурированные процессы.

Что меняется на практике? Во-первых, появляется понимание, что AI — это не замена инженеру, а усилитель его навыков. Чем больше экспертизы у разработчика, тем лучше результат от работы с LLMs. Во-вторых, резко возрастает ценность навыков, которые раньше казались рутинными: умение писать тесты, документировать код, планировать архитектуру. Без надёжного тестового покрытия агент может заявить о работоспособности, не проверив её, и сломать что-то незаметное.

Отдельного внимания заслуживает параллельный запуск нескольких AI-агентов. Опытные инженеры всё чаще запускают несколько копий агента одновременно, решая несколько задач параллельно. Это звучит как фантастика, но это уже реальность — и это требует нового уровня менеджмента, похожего на управление живыми коллабораторами.

Для компаний переход от vibe coding к vibe engineering — это вопрос конкурентоспособности. Организации, которые останутся в режиме "быстро сгенерировали, запустили, посмотрим", рискуют накопить критический технический долг и уязвимости. Те, кто инвестирует в дисциплину, получат и скорость, и качество. Vibe engineering — это не тренд и не временное явление. Это эволюция профессии, которая диктует новые правила игры для каждого, кто хочет писать software в эпоху AI.

Источник: https://simonw.substack.com/p/vibe-engineering

#AI #программирование #llm

Substack

Vibe engineering

Plus news from OpenAI DevDay, GPT-5 Pro, gpt-image-1-mini, and Python 3.14

2 views15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

The_Next_Frontier_of_Artificial_Intelligence_Why_AI_Memory_Syst.html

177.2 KB

🔗 The Next Frontier of Artificial Intelligence: Why AI Memory Systems Will Define the Next Generation | HackerNoon

📖 tgf

📌 Системы памяти ИИ: следующий рубеж искусственного интеллекта

✏ Введение

За последнее десятилетие искусственный интеллект достиг впечатляющих результатов: большие языковые модели генерируют текст, неотличимый от человеческого, системы компьютерного зрения распознают объекты с высокой точностью, а предиктивные алгоритмы прогнозируют сложные паттерны в различных отраслях.
Однако, несмотря на эти достижения, большинство систем ИИ страдают от фундаментального ограничения — они не обладают памятью.

[Полное описание в прикрепленном файле]

#AI #машинноеобучение #технологии

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

Exclusive_Anthropic_is_testing_Mythos_its_most_powerful_AI_m.html

299.9 KB

🔗 Exclusive: Anthropic is testing 'Mythos' its 'most powerful AI model ever developed' | Fortune

📖 tgf

📌 Anthropic тестирует «Mythos» — самую мощную модель в истории компании

✏ Утечка данных раскрыла секретную разработку

26 марта 2026 года издание Fortune сообщило об утечке данных из компании Anthropic, в результате которой стала известна информация о новейшей модели искусственного интеллекта.
Черновик блог-поста, обнаруженный в публично доступном хранилище данных, содержал детали о разработке под кодовыми названиями Claude Mythos и Capybara.
Представитель Anthropic подтвердил изданию, что компания действительно разрабатывает и тестирует «новую модель AI более высокой производительности, чем любая из ранее выпущенных».

[Полное описание в прикрепленном файле]

#AI #новости #технологии

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

Smolagents — когда создавать AI-агента можно за 15 минут без боли

Задумывались, почему большинство AI-агентов остаются игрушками для энтузиастов, а не рабочими инструментами? Проблема не в самих больших языковых моделях. Проблема в том, как мы их обвязываем.

Классические фреймворки вроде LangChain превратили создание агентов в многослойный квест с километрами абстракций, конфигов и boilerplate-кода. Прежде чем агент сделает что-то полезное, вы уже устали бороться с фреймворком. Сломался вызов — ищи ошибку в трёх уровнях абстракции. Хочешь понять, что агент на самом деле делает — удачи.

Hugging Face выпустили в конце 2024 года библиотеку smolagents, и она переворачивает эту парадигму с ног на голову. Весь фреймворк — меньше тысячи строк кода. Никаких сложных пайплайнов. Агенты здесь — code agents, то есть они пишут настоящий Python-код для решения задач, а не генерируют JSON-инструкции, которые потом непонятно как интерпретировать.

Почему это принципиально важно? Потому что код — это естественный язык для выражения сложной логики. Циклы, условия, манипуляции с данными — всё это записывается в Python естественно и читаемо. Агент получает задачу вроде «узнай погоду в Париже и Токио, сохрани результат в файл» и просто пишет код, который это делает. Вы можете этот код увидеть, отладить, понять, что пошло не так.

При этом библиотека не требовательна к инфраструктуре. Ставится через pip, работает с широким спектром моделей — OpenAI, Hugging Face Hub, Anthropic, локальные модели. Для прототипирования и обучения это идеальный формат. Студент с базовым Python может за вечер собрать работающего агента и понять, как агенты устроены изнутри.

Конечно, для enterprise-пайплайнов с тысячами одновременных запросов и сложными графами инструментов это пока не замена LangChain или LangGraph. Но для прототипирования, исследовательских проектов и образовательных целей smolagents делает входной порог минимальным. Больше не нужно неделю разбираться в фреймворке, чтобы агент сделал первый осмысленный запрос к API.

Это и есть настоящая демократизация AI-агентов. Не когда кто-то большой выпускает enterprise-решение за миллионы, а когда студент вечером может собрать агента, который реально работает, и понять принцип работы.

А самое главное, что это решение легко расширяется до enterprise за счёт продуманной архитектуры.
На текущий момент это наверное самый простой и одновременно самый мощный агентский фреймворк. Если кто-то ещё не пробовал, настоятельно рекомендую попробовать!

Источник: https://www.kdnuggets.com/getting-started-with-smolagents-build-your-first-code-agent-in-15-minutes

#AI #python #llm

KDnuggets

Getting Started with Smolagents: Build Your First Code Agent in 15 Minutes

Build an AI weather agent in 40 lines of Python using Hugging Face's smolagents library. Learn to create tools, connect LLMs, and run autonomous tasks.

1 view15:49

About

Blog

Apps

Platform