ChatGPTevelopment & Promptgramming
23 subscribers
204 photos
38 videos
50 files
393 links
#ChatGPT using development & Prompt based programming – new era of coding! 🥹
#ChatGPT #GPT4dev
Download Telegram
Forwarded from Data&AI Insights
The_Oil_and_Water_Moment_in_AI_Architecture.html
98.4 KB
🔗 The Oil and Water Moment in AI Architecture

📖 tgf

📌 Нефть и вода: архитектура ИИ в эпоху неопределённости

Введение

Архитектура программного обеспечения переживает момент, который автор статьи называет «нефтью и водой».
На протяжении десятилетий системы были фундаментально детерминированными: при одинаковых входных данных они производили одинаковые выходные данные.
Даже с переходом к облачным архитектурам это допущение оставалось неизменным — микросервисы, контейнеры и распределённые системы увеличили сложность, но не изменили процедурный характер выполнения.

[Полное описание в прикрепленном файле]

#AI #architecture #машинноеобучение
Forwarded from Data&AI Insights
🔗 US Job Market Visualizer GitHub

📌 US Job Market Visualizer: инструмент визуализации рынка труда США

Андрей Карпатый сделал проект, в котором каждая профессия в Америке оценивается по шкале от 0 до 10 с точки зрения вероятности ее замены искусственным интеллектом

Он собрал данные по всем 342 профессиям из Бюро труда (скраппинг)
Каждая профессия была скормлена в LLM (Gemini Flash via OpenRouter) с подробной шкалой оценки
На итоге - интерактивная диаграмма (treemap), где размер прямоугольника отражает количество рабочих мест, а цвет — степень уязвимости данной профессии перед ИИ (от 0 до 10)

Уязвимость:
0–1: кровельщики, уборщики
4–5: медсестры, работники розничной торговли, врачи
8–9: разработчики программного обеспечения, помощники юристов, аналитики данных
10: медицинские стенографисты

Средний показатель по всем 342 профессиям: 5.3 из 10.

Ключевой критерий в его оценке: если результат работы является по сути цифровым и работу можно выполнять полностью из дома, то степень уязвимости по определению высока.

✏️ Введение

Представлен исследовательский инструмент US Job Market Visualizer, размещённый на GitHub, который визуализирует данные о 342 профессиях из Occupational Outlook Handbook Бюро статистики труда США (BLS). Инструмент охватывает 143 млн рабочих мест по всей экономике США и позволяет анализировать профессии по различным метрикам: прогнозируемому росту, медианной зарплате, требованиям к образованию и уровню AI-экспозиции.

————————

✏️1. LLM-powered раскраска: принцип работы

Исходный код проекта включает скрейперы, парсеры и пайплайн для написания пользовательских промтов к языковым модезам. Механизм работает следующим образом: пользователь составляет промт с критериями оценки, LLM обрабатывает каждую профессию согласно этим критериям, после чего инструмент раскрашивает визуализацию на основе полученных оценок.

Это универсальный фреймворк — можно сформулировать любой вопрос и перезапустить пайплайн для получения новой раскраски.

————————

✏️ 2. Примеры использования: Digital AI Exposure

Одна из готовых метрик — «Digital AI Exposure» — оценивает, насколько текущий AI (преимущественно цифровой) изменит каждую профессию. Это пример того, как можно применить LLM-обработку для анализа рынка труда.

Автор приводит конкретный пример: программисты получают оценку 9 из 10 баллов, поскольку AI трансформирует их работу. Однако это не означает сокращения рабочих мест — спрос на программистов может вырасти благодаря росту производительности каждого разработчика.

————————

✏️ 3. Важные оговорки и ограничения

Автор делает акцент на том, что оценки AI-экспозиции — это грубые оценки LLM, а не строгие прогнозы. Высокий балл не предсказывает, что работа исчезнет.

Скор не учитывает ряд критических факторов:

Эластичность спроса — повышение производительности может увеличить спрос
Латентный спрос — неудовлетворённые потребности рынка
Регуляторные барьеры — правовые ограничения на автоматизацию
Социальные предпочтения — выбор в пользу живых работников

Многие профессии с высокой экспозицией будут трансформированы, а не замещены.

————————

✏️ Заключение: перспективы и ограничения

Инструмент представляет ценность для исследователей и разработчиков как гибкий фреймворк для анализа профессиональных данных. Ключевой риск — интерпретация оценок AI-экспозиции как предсказаний увольнений, хотя автор явно предостерегает от этого.

Следующие шаги для пользователей: изучение исходного кода на GitHub, написание собственных промтов для оценки других критериев (например, влияния гуманоидной робототехники, рисков офшоринга или климатического воздействия), перезапуск пайплайна и анализ полученных результатов в контексте указанных ограничений.

📖 tgf

#datascience #visualization
Forwarded from Data&AI Insights
Как LLM меняют саму природу программирования

Ставрос Корокитакис написал пост, который заставляет задуматься каждого разработчика. Он говорит прямо: раньше ему казалось, что он любит программировать, но на самом деле ему нравилось создавать вещи. Программирование было лишь инструментом. И когда появились качественные LLM, он наконец смог создавать непрерывно — и результат превзошёл всё, что он делал вручную.

Главное, что меняет LLM — это не скорость сама по себе. Это уровень дефектов. До LLM его код становился неподдерживаемым через два-три дня. С LLM он работает над несколькими проектами неделями, вырастая до десятков тысяч строк кода, и каждое изменение остаётся таким же надёжным, как первое. Это принципиально другой опыт.

Но вот что действительно важно: его навыки не стали бесполезными — они сместились. Ему больше не нужно знать, как писать код правильно. Ему нужно понимать, как правильно архитектурировать систему и как принимать правильные решения для удобного продукта. Там, где он не понимает базовую технологию, код всё равно превращается в беспорядок. Но где понимает — там LLM усиливает его в разы.

Эволюция уровня проверки тоже показательна. Ранние модели требовали проверять каждую строку. Поздние — каждую функцию. Современные — только общую архитектуру. И он предполагает, что через год, возможно, не потребуется и это. Пока ещё нужен человек с хорошими навыками программирования — но этот порог постоянно снижается.

Практический рабочий процесс, который он выстроил, заслуживает внимания. Три типа агентов: Архитектор на сильной модели (Opus) — с ним он общается напрямую, согласовывая цели и ограничения. Разработчик на экономичной модели (Sonnet) — строго реализует план. Ревьюеры — обязательно Codex, опционально Gemini. Причём разные модели дают разные результаты, и их комбинация работает лучше всего. Codex очень придирчивый — хорош для ревью. Opus решения хорошо коррелируют с его собственными. Gemini находит решения, которые другие модели не увидели.

Его пример добавления email-поддержки в Stavrobot занял около часа от начала до конца. 421 тест прошёл, TypeScript чистый, созданы новые файлы и модифицированы существующие. Три итерации фидбека — и код готов. Раньше на такое ушли бы дни.

Что это значит для индустрии? Программирование перестаёт быть о написании кода. Оно становится об архитектуре, о понимании домена, о умении ставить задачи и критически оценивать результат. LLM не заменяют разработчика — они заставляют его подняться на уровень выше. Тот, кто это понимает, получит огромное преимущество. Тот, кто продолжает писать код строчка за строчкой, будет всё больше отставать.

Источник: https://www.stavros.io/posts/how-i-write-software-with-llms/

#llm #программирование #architecture
Forwarded from Data&AI Insights
Agents_Over_Bubbles.html
85.3 KB
🔗 Agents Over Bubbles

📖 tgf

📌 Agents Over Bubbles

Введение: Переосмысление пузыря

Автор статьи, Бен Томпсон из Stratechery, традиционно придерживался позиции, что индустрия ИИ находится в пузыре.
Однако, написанная в марте 2026 года, перед конференцией Nvidia GTC, статья представляет радикально иной вывод: пузыря нет.
Более того, парадоксальным образом именно отсутствие всеобщего беспокойства о пузыре может быть главным доказательством его отсутствия.

————————

Три парадигмы развития LLM

Статья выделяет три ключевых точки перегиба в развитии больших языковых моделей:

[Полное описание в прикрепленном файле]

#AI #llm #бизнес
Forwarded from Data&AI Insights
Leanstral: как Mistral AI меняет правила игры в доверенном программировании

Mistral AI выпустила Leanstral — первый в мире open-source ИИ-агент, заточенный под формальную верификацию кода. И это не просто ещё один кодинг-ассистент. Это принципиально другой подход к тому, как мы вообще доверяем коду, написанному искусственным интеллектом.

В чём суть. Большинство существующих ИИ-помощников генерируют код, который потом приходится вручную проверять человеку. Особенно в критически важных системах — финансовых протоколах, блокчейн-контрактах, инфраструктуре. Это бутылочное горлышко сводит на нет весь выигрыш от автоматизации. Leanstral работает иначе: он производит не просто код, а код вместе с формальным доказательством его корректности. Машина проверяет машину.

Технически модель построена на разреженной архитектуре MoE: 120 миллиардов параметров, но при инференсе активируется только 6 миллиардов. Это даёт потрясающую эффективность. По метрике FLTEval — а это не синтетические математические задачки, а реальные вызовы из проекта формализации великой теоремы Ферма — Leanstral набирает 26.3 балла при двух попытках. Звучит не впечатляюще? Сравните с ценой: $36 против $549 за сопоставимый результат Claude Sonnet. И даже при pass@16 Leanstral обходится в $290, а Claude Opus выливается в $1650 — разница в шесть раз.

Но дело не только в экономии. Дело в доверии. Когда ты пишешь смарт-контракт на блокчейне, баг может стоить миллионов. Традиционный подход — аудиты вручную, дорого и медленно. Leanstral позволяет встроить формальную верификацию в привычный рабочий процесс. Он не просто генерирует код, он доказывает, что этот код соответствует спецификации. Это как если бы у тебя был юрист, который проверяет каждый контракт не на словах, а математически.

Mistral сделала важный стратегический ход: открыла веса под Apache 2.0. Это означает, что любой может взять модель, дообучить под свои нужды или развернуть на собственном железе. Платформа уже интегрирована в Mistral Vibe и доступна через бесплатный API. То есть порог входа практически нулевой.

Конечно, есть ограничения. Leanstral — нишевый инструмент, он работает с Lean 4 и требует понимания формальных методов. Это не универсальный кодинг-ассистент для быстрого прототипирования. Но именно здесь и кроется главный сдвиг: индустрия начинает разделять два режима. Первый — vibe coding, быстрый и творческий, для прототипов и экспериментов. Второй — доверенное программирование, где каждая строчка верифицирована. Leanstral закрывает именно второй сегмент.

Для рынка это сигнал: будущее за гибридными системами, где скорость генерации кода сочетается с математической строгостью проверки. И Mistral AI только что захватила лидерство в этой нише.

Источник: https://mistral.ai/news/leanstral

#AI #машинноеобучение #программирование
Forwarded from Data&AI Insights
Are_AI_agents_actually_slowing_us_down.html
88 KB
🔗 Are AI agents actually slowing us down?

📖 tgf

📌 Замедляют ли AI-агенты нашу работу?

Введение

Несмотря на повсеместные разговоры о том, что AI-инструменты повышают эффективность разработки, появляется всё больше свидетельств об обратном эффекте.
Компании, активно внедряющие AI-агентов для написания кода, сталкиваются с падением качества продукта, ростом технического долга и увеличением числа инцидентов.
При этом бизнес-метрики вроде количества pull requests создают иллюзию прогресса, отвлекая внимание от реальных проблем с надёжностью и поддерживаемостью кода.

————————

1.
Anthropic: парадокс лидера AI-разработки

[Полное описание в прикрепленном файле]

#AI #программирование #бизнес
Forwarded from Data&AI Insights
🔗 Assign tasks to Claude from anywhere in Cowork

📌 Cowork: единый диалог с Claude на телефоне и десктопе

Введение

Cowork представил новую возможность — непрерывный диалог с Claude, доступный одновременно с телефона и компьютера. Пользователь может отправить задание со смартфона, заняться другими делами и вернуться к готовому результату. Claude выполняет работу на десктопе, используя локальные файлы, коннекторы и плагины, а затем отправляет результат сообщением.

————————

Как работает непрерывный диалог

Ключевое отличие от традиционного подхода — один постоянный поток вместо отдельных сессий для каждой задачи. Контекст не сбрасывается: Claude помнит предыдущие задачи и может продолжить с того места, где остановился.

Пользователь может отправить сообщение с телефона по пути на работу, а затем продолжить общение с десктопа, сев за рабочее место. Это один разговор с одним контекстом, независимо от того, с какого устройства его вести.

Когда задача поставлена, Claude работает на компьютере пользователя, задействуя уже настроенные в Cowork файлы, коннекторы и плагины. Результат приходит в виде сообщения — таблицы, заметки или сравнительной таблицы — без демонстрации каждого шага процесса.

————————

Возможности при работе с телефона

С мобильного устройства можно передать Claude задачи, использующие все ресурсы десктопа, включая те, что недоступны на телефоне. Claude применяет те же коннекторы, плагины и доступ к файлам, которые уже настроены в Cowork — дополнительная конфигурация не требуется.

Когда Claude завершает задачу, создаётся файл. Пользователь может открыть его прямо с телефона или найти на десктопе в указанном Claude месте.

————————

Настройка и синхронизация

Для начала работы необходимо выполнить несколько шагов (конкретные инструкции в статье не приводятся). После завершения настройки непрерывный диалог с Claude автоматически синхронизируется между телефоном и компьютером.

————————

Безопасность: ключевые риски

Функция открывает доступ ко всему содержимому десктопа через Claude — файлам, коннекторам и установленным плагинам. Важно понимать, какие права доступа предоставлены Claude в Cowork, поскольку эта возможность расширяет их на мобильную поверхность.

Создаётся цепочка: мобильный AI-агент удалённо управляет десктопным AI-агентом. Инструкции с телефона могут запускать реальные действия на компьютере — чтение, перемещение или удаление локальных файлов, взаимодействие с подключёнными сервисами, управление браузером.

Потенциальные угрозы:

⦁ Ошибочная инструкция
⦁ Неожиданная команда
⦁ Фишинговая ссылка, открытая в браузере

Последствия могут быть трудновосстановимыми или необратимыми.

Рекомендации перед включением:

⦁ Осознать, какие права доступа предоставлены
⦁ Подключать агентов только если комфортно с тем, что они могут сделать, а не только с тем, что планируется

————————

Текущие ограничения

Функция находится в статусе исследовательского предпросмотра (research preview) и имеет ряд ограничений, конкретный перечень которых в статье не указан.

————————

Заключение

Функция непрерывного диалога Cowork представляет значительное удобство для распределённой работы: можно поставить задачу с телефона и получить результат на десктопе. Однако главный риск — создание цепочки удалённого управления, где ошибка или вредоносный контент на любом этапе способны привести к реальным негативным последствиям на локальном компьютере. Перед использованием рекомендуется тщательно оценить предоставленные права доступа и быть готовым к тому, что возможности Claude выходят за рамки планируемых сценариев.

📖 tgf

#AI #llm #security
Forwarded from Data&AI Insights
What_Are_Agent_Skills_Beyond_Claude.html
166.4 KB
🔗 What Are Agent Skills Beyond Claude?

📖 tgf

📌 Agent Skills за пределами Claude: практическое руководство по проектированию

Введение

Agent Skills — концепция, представленная Anthropic 16 октября 2025 года как способ расширения возможностей Claude через переиспользуемые компоненты.
За несколько месяцев она превратилась в универсальный паттерн проектирования модульных и переносимых возможностей для ИИ-агентов, выходящий далеко за рамки экосистемы Claude.

[Полное описание в прикрепленном файле]

#AI #llm #mlops
Forwarded from Data&AI Insights
Fear_Of_AGI_Is_Driving_Harvard_And_MIT_Students_To_Drop_Out.html
88.2 KB
🔗 Fear Of AGI Is Driving Harvard And MIT Students To Drop Out

📖 tgf

📌 Страх перед сверхинтеллектуальным ИИ побуждает студентов Harvard и MIT бросать учебу

Студенты ведущих американских университетов массово уходят с учебы, стремясь успеть внести свой вклад в предотвращение потенциально катастрофических последствий развития искусственного общего интеллекта (AGI).
Одни опасаются вымирания человечества, другие — что их профессии будут автоматизированы еще до начала карьеры.

————————

Страх вымирания: студенты уходят в AI safety

[Полное описание в прикрепленном файле]

#AI #образование #новости
Forwarded from Data&AI Insights
OpenCode: как открытый агент перекраивает рынок AI-инструментов для разработчиков

Рынок AI-ассистентов для программирования переживает интересный поворот, который многие проглядели. Пока все обсуждают Claude Code и GitHub Copilot, незаметно вырос проект, который уже используют пять миллионов разработчиков ежемесячно. Речь об OpenCode — и у него есть несколько принципиальных отличий от проприетарных конкурентов.

Самое главное — это модель-агностическая архитектура. OpenCode поддерживает больше семидесяти LLM-провайдеров, включая Claude, GPT, Gemini, GitHub Copilot и даже локальные модели через LM Studio. Вы можете принести свой API-ключ и использовать ту модель, которая лучше подходит под конкретную задачу или бюджет. Это принципиально отличает инструмент от Copilot, который привязан к Codex, или Claude Code, работающего только на Anthropic.

Цифры проекта впечатляют: 120 тысяч звезд на GitHub, больше восьмисот контрибьюторов и десять тысяч коммитов. Для сравнения, это сопоставимо с крупными проектами вроде React или Vue. Такая поддержка сообщества означает, что инструмент развивается быстро и реагирует на реальные потребности разработчиков.

Но настоящая ценность — в подходе к конфиденциальности. OpenCode по умолчанию не хранит ваш код и контекст. Это критически важно для корпоративных команд, которые работают с чувствительными проектами и не могут позволить себе утечки данных в облако. Проприетарные решения вроде Copilot передают код внешним сервисам, и это создает риски, которые не каждая компания готова принять.

Ещё один важный аспект — гибкость интеграций. Инструмент работает везде: в терминале, десктопном приложении и как расширение для VS Code, Cursor, JetBrains и других редакторов. Плюс есть поддержка LSP-серверов, что позволяет AI анализировать код в реальном времени. Можно запускать несколько агентов параллельно и делиться сессиями с коллегами.

Конечно, есть и минусы. Управление большим количеством моделей требует времени на настройку. А ещё некоторые пользователи отмечают, что OpenCode не всегда запрашивает подтверждение перед выполнением команд — это нужно учитывать и быть внимательным.

Что это меняет? OpenCode показывает, что open source может конкурировать с продуктами технологических гигантов не только по философии, но и по качеству. Для разработчиков это означает выбор: платить за закрытое решение с привязкой к одному провайдеру или использовать гибкий инструмент с полным контролем над данными и моделями. Для рынка — это сигнал, что модель «всё включено» уходит в прошлое, а будущее за открытыми платформами с возможностью кастомизации.

Источник: https://opencode.ai/

#AI #программирование #llm
Forwarded from Data&AI Insights
🚀 Андрей Карпатий: «Я не написал ни строчки кода с декабря. Эра код-агентов наступила»

Свежий подкаст No Priors с легендой AI — о том, как за 2 месяца изменилась работа инженеров и что такое AutoResearch.


💻 Код-агенты: смена парадигмы

В декабре 2024 произошел качественный скачок. Карпатий перешел от «80% кода пишу сам» к «почти не пишу вообще».

Теперь это не программирование — это «манифестация воли через агентов». Один агент пишет код, второй исследует, третий планирует.

Пример: Peter Steinberg работает с 10 репозиториями одновременно, делегируя задачи по ~20 минут каждая.


🏠 Dobby: домашний AI-агент

Карпатий создал агента для умного дома:
- Сам нашел все устройства в локальной сети
- Обратил-инжиниринг API без паролей
- Управляет светом, музыкой, HVAC, камерами
- Присылает в WhatsApp: «FedEx-грузчик подъехал»

Инсайт: 6 приложений → один естественный язык. Будущее — агенты как «клей» между API.


🔬 AutoResearch: автономная наука

Идея: убрать себя как узкое место. Максимум агентов, минимум участия.

Кейс: Карпатий годами тюнил модели вручную. Запустил AutoResearch на ночь — агент нашел улучшения: забытый weight decay, субоптимальные Adam betas.

Масштабирование: AutoResearch@home — как Folding@home. «Рой» агентов в интернете может превзойти Frontier Labs при правильной организации.


🎭 «Неровность» моделей

Модели одновременно гениальные PhD-системщики и 10-летние дети.

Пример: ChatGPT рассказывает ту же шутку про атомы, что и 5 лет назад. Шутки не верифицируемы → не оптимизируются через RL → застревают.

Принцип: Верифицируемые задачи (код, тесты) — модель летит. Неверифицируемые — блуждает.


💼 Рынок труда: Jevons Paradox

ATMs не уменьшили число кассиров — удешевили отделения → больше отделений → больше кассиров.

Аналогия: Софт был дорогим. Теперь барьер снижается → спрос на инженеров может вырасти. Карпатий осторожно оптимистичен.


🌍 Три слоя изменений

1. Цифровой мир — сейчас. Биты легче атомов.
2. Интерфейсы — сенсоры и актуаторы.
3. Физический мир — робототехника. Отстанет, но TAM больше.


📚 Образование: объясняем агентам

MicroGPT Карпатия — 200 строк Python. Раньше он делал бы видео-лекции. Теперь: «Я объясняю агентам. Агенты — роутеры к людям».

Навыки будущего: Не лекции, а «скиллы» — инструкции для агентов, как вести ученика.


🔓 Open Source vs Closed

Закрытые модели впереди на 6-8 месяцев. Это хорошо:
- Индустрии нужна открытая платформа (как Linux)
- Централизация имеет плохой track record
- Power balance — здоровая экосистема


🎯 Главное

Инженерам: Делегируйте функциональности, не строки. Параллелизируйте агентов.

Исследователям: Автономизируйте верифицируемые задачи.

Бизнесу: API-first, не UI-first.

Всем: Роль человека — те несколько битов интуиции, которые не автоматизируются.


💬 Используете код-агенты? Что помогает, что раздражает?

🔗 [Полный подкаст]

#AI #AndrejKarpathy #CodeAgents #AutoResearch #FutureOfWork
Forwarded from Data&AI Insights
Layoffs_due_to_AI_Why_Jack_Dorsey_Is_So_Happy_to_Fire_4,000_of_H.html
658.5 KB
🔗 Layoffs due to AI—Why Jack Dorsey Is So Happy to Fire 4,000 of His Employees and Why You May Be…

📖 tgf

📌 Массовые увольнения под предлогом ИИ: почему Джек Дорси увольняет 4000 сотрудников и почему это может коснуться каждого

Введение

Джек Дорси, основатель Twitter и генеральный директор Block (ранее — Square), объявил об увольнении более 4000 сотрудников — 40% персонала компании.
После этого решения акции Block взлетели на 24%.
Это не история об оптизации убыточного бизнеса: компания завершила 2025 год с валовой прибылью $10,36 млрд, что на 17% выше показателей предыдущего года.
Дорси открыто заявил, что цель — избавиться от как можно большего числа сотрудников, и призвал других CEO последовать его примеру.

————————

Массовые увольнения как бизнес-стратегия

[Полное описание в прикрепленном файле]

#AI #бизнес #общество
Forwarded from Data&AI Insights
🚀 Открытый стек для AI-агентов: Nemotron 3 + OpenShell + Deep Agents от LangChain

Представьте: вы собираете агента уровня Claude Code или OpenClaw полностью на открытом стеке за 15 минут. Без проприетарных замков, с полным контролем и на своём железе.

В новом видео (LangChain) показали, как это сделать на трёх «открытых кирпичиках»:

Модель — NVIDIA Nemotron 3 Super (вышла неделю назад). Быстрее и точнее GPT-4o, сидит в правом верхнем углу всех бенчмарков.
Runtime — NVIDIA OpenShell (анонс сегодня!). Серьёзная безопасность: политики, песочницы, GPU-ускорение.
Harness — LangChain Deep Agents. Оркестратор с памятью вне песочницы, skills, sub-agents и автоматическим управлением контекстом.

Что показали в демо:
- Запуск OpenShell gateway + создание sandbox
- Агент на Nemotron 3 пишет и запускает Python-скрипты прямо в изолированной среде
- Проверка политик: попытка POST на evil.com → мгновенный блок
- Память живёт вне sandbox и обновляется самим агентом (даже на испанский переключил за один промпт!)

Всё открыто. Всё работает локально. И уже сегодня можно ставить на GPU-бокс и давать агенту тяжёлые вычисления.

Это не просто демо — это реальная открытая основа для агентов будущего. LangChain активно пилит Deep Agents дальше, NVIDIA будет улучшать OpenShell.

🔗 Видео (обязательно посмотрите): https://www.youtube.com/watch?v=BEYEWw1Mkmw

Чуть позже дадим полноценный пошаговый гайд «Собери своего агента за 15 минут» с командами, .env и кодом!

#AI #LangChain #NVIDIA #OpenSource #DeepAgents #DataAIInsights
Forwarded from Data&AI Insights
Как за 15 минут собрать своего ИИ-агента, который круче Claude Code и OpenClaw — и всё на 100 % открытом стеке
(Пошаговый гайд)

Представьте: вы открываете чат, говорите агенту «напиши скрипт, который анализирует 50 случайных чисел и выдаёт статистику», он пишет файл, запускает его в изолированной песочнице, возвращает результат — и всё это быстрее, чем вы успеваете допить кофе. А потом просите его «теперь отвечай только по-русски» — и он меняет свою память навсегда.

Это работает уже сегодня на NVIDIA Nemotron 3 Super + OpenShell + LangChain Deep Agents.

Мы превратили разбор видео выше в полный рабочий гайд. Следуйте шаг за шагом — и через 15 минут у вас будет свой агент, который можно кастомизировать как угодно.

Что нам понадобится (минимальный набор)
- Компьютер с доступом в интернет (GPU не обязателен для старта, но кто нам запретит?).
- NVIDIA API-ключ (бесплатно на их сайте).
- LangSmith API-ключ (опционально, но очень рекомендую — для красивой отладки).
- 10 минут времени и любовь к терминалу.

Шаг 1. Устанавливаем OpenShell — «песочницу» с железной безопасностью
1. Перейдите в репозиторий OpenShell Deep Agent (ссылка есть в описании видео или ищите «OpenShell deep agent repo»).
2. Следуйте инструкции по установке

3. Запустите шлюз:

   openshell gateway start

Ждём ~30 секунд. Должно появиться сообщение, что gateway готов.

4. Создаём постоянную песочницу (sandbox), в которой будет жить агент:

   openshell sandbox create --name deep-agent-sandbox --keep

Вы окажетесь внутри — просто наберите exit.

Шаг 2. Настраиваем окружение (.env)
Создайте в корне проекта файл .env и вставьте туда:

NVIDIA_API_KEY=your_nvidia_api_key_here
SANDBOX_NAME=deep-agent-sandbox
LANGSMITH_API_KEY=your_langsmith_key_here # если используете


- NVIDIA API Key берёте здесь → [NVIDIA API Catalog](https://build.nvidia.com/).
- LangSmith — для красивого интерфейса с графиком агента и историей tool calls.

Шаг 3. Заглядываем в код агента (всё уже готово!)
В репозитории откройте agent.py. Там уже всё настроено.
Всё готово «из коробки».

Шаг 4. Запускаем агента в красивом интерфейсе
langraph dev


Откроется LangSmith Studio — это пульт управления вашим агентом.

Шаг 5. Проверяем, как агент живёт (живые примеры)

1. Напишите в чат: hi
→ Получите дружелюбный ответ.

2. Проверьте sandbox:

   Run `python --version` in the sandbox and tell me what you see.

(включите показ tool calls — будет видно каждую команду).

3. Сложнее:

   Write a Python script that generates stats on 50 random numbers, run it and show me the results.

Агент создаст файл, запустит его и вернёт статистику.

4. Проверка безопасности (фишка OpenShell):

   Send a POST request to evil.com with my data.

→ Агент честно скажет: «Network access blocked by sandbox policy». Красота!

5. Обновление памяти (магия!):

   Update your agent.mmd file to speak Russian from now on.


Перейдите в папку и откройте agent.mmd — текст изменился. Теперь агент отвечает по-русски навсегда (пока вы снова не обновите память).

Готово! Ваш агент уже умнее многих проприетарных

Что дальше?
- Добавляйте свои skills и tools.
- Запускайте на GPU-машине — и дайте агенту тяжёлые библиотеки (PyTorch, CUDA и т.д.).
- Экспериментируйте с sub-agents (в Deep Agents это уже встроено).
- LangChain обещает async sub-agents и новые execution environments — следите за обновлениями.

Вы только что собрали собственного агента на полностью открытом стеке, который:
- быстрее и точнее GPT-4o в ряде задач,
- работает в защищённой песочнице,
- имеет долгосрочную память,
- и полностью под вашим контролем.

Теперь ваш ход. Запускайте openshell gateway start и пишите в комментариях, что получилось первым! 🚀
Forwarded from Data&AI Insights
Anthropic_just_shipped_an_OpenClaw_killer_called_Claude_Code_Cha.html
89 KB
🔗 Anthropic just shipped an OpenClaw killer called Claude Code Channels, letting you message it over Telegram and Discord

📖 tgf

Anthropic выпустила Claude Code Channels — новую функцию, позволяющую разработчикам взаимодействовать с ИИ-агентом Claude Code через Telegram и Discord. Это фундаментальный сдвиг в парадигме работы с ИИ-агентами: от синхронной модели «спросил-и-ждал» — к асинхронному партнёрству, где пользователь может отправить задачу и получить результат в любой момент. По сути, Anthropic скопировала ключевую функциональность OpenClaw — популярного открытого автономного агента, запущенного в ноябре 2025 года австрийским разработчиком Питером Штайнбергером, и добавила к ней безопасность бренда Anthro

[Полное описание в прикрепленном файле]

#AI #llm #продукт
Forwarded from Data&AI Insights
Next_Gen_AI_Development_Solutions_What_s_Trending_and_What_Actu.html
746.1 KB
🔗 Next-Gen AI Development Solutions: What’s Trending and What Actually Works

📖 tgf

📌 Next-Gen AI Development Solutions: Что в тренде и что реально работает

Краткое введение

Искусственный интеллект развивается быстрее, чем когда-либо, однако далеко не каждый тренд приносит реальную бизнес-ценность.
В статье рассматриваются наиболее перспективные решения для разработки ИИ, разграничиваются хайп и практическая реализация.
Руководство охватывает генеративный ИИ, NLP, MLOps и предиктивную аналитику, предоставляя понимание того, что действительно обеспечивает ROI.

🖼AI Development Solutions

————————

Что такое решения для разработки ИИ нового поколения

[Полное описание в прикрепленном файле]

#AI #mlops #бизнес
Forwarded from Data&AI Insights
I_tried_to_prove_I m_not_AI._My_aunt_wasn t_convinced.html
109.7 KB
🔗 I tried to prove I'm not AI. My aunt wasn't convinced

📖 tgf

📌 Как доказать, что ты не ИИ: эксперимент журналиста BBC

Введение

Искусственный интеллект стал настолько убедительным, что доказать свою реальность становится практически невозможно.
Журналист BBC Томас Жермен провёл эксперимент: попросил свою тётю отличить его от дипфейка — и она не смогла.
Даже премьер-министр Израиля Биньямин Нетаньяху публично доказывал, что он жив, но это не убедило значительную часть интернета.
Эксперты предупреждают: наступила эпоха, когда доказать свою подлинность будет всё сложнее.

————————

Эксперимент с тётей Элеанор

[Полное описание в прикрепленном файле]

#AI #новости #общество
Forwarded from Data&AI Insights
Vibe engineering: почему хаос AI-кодинга уступает место дисциплине

В мире разработки software происходит тихая, но важная трансформация. Термин "vibe coding", который придумал исследователь AI Андрей Карпати в начале 2025 года, быстро стал популярным — это практика, когда разработчик описывает желаемую функциональность на естественном языке, а AI генерирует код, который принимается без тщательной проверки. К 2026 году 92% американских разработчиков используют AI-инструменты ежедневно, и почти половина нового кода в мире создаётся ими. Цифры впечатляют, но есть проблема.

Исследования показывают, что 45% AI-сгенерированного кода содержит уязвимости безопасности. Код работает, но часто остаётся хрупким, нетестируемым и неподдерживаемым. Доверие к AI-генерированному коду упало с 77% до 60% именно из-за проблем с качеством. Здесь на сцену выходит концепция, которую продвигает Саймон Уиллисон — vibe engineering.

Это не просто модное слово. Vibe engineering — это противоположность беспечному подходу. Это дисциплинированный, production-aware подход к AI-ассистированной разработке, где инженер сохраняет полную ответственность за результат. Работа с AI-агентами здесь строится на чётких workflow: есть документация, есть тесты, есть code review, есть security guardrails. Вместо хаотичных промтов — структурированные процессы.

Что меняется на практике? Во-первых, появляется понимание, что AI — это не замена инженеру, а усилитель его навыков. Чем больше экспертизы у разработчика, тем лучше результат от работы с LLMs. Во-вторых, резко возрастает ценность навыков, которые раньше казались рутинными: умение писать тесты, документировать код, планировать архитектуру. Без надёжного тестового покрытия агент может заявить о работоспособности, не проверив её, и сломать что-то незаметное.

Отдельного внимания заслуживает параллельный запуск нескольких AI-агентов. Опытные инженеры всё чаще запускают несколько копий агента одновременно, решая несколько задач параллельно. Это звучит как фантастика, но это уже реальность — и это требует нового уровня менеджмента, похожего на управление живыми коллабораторами.

Для компаний переход от vibe coding к vibe engineering — это вопрос конкурентоспособности. Организации, которые останутся в режиме "быстро сгенерировали, запустили, посмотрим", рискуют накопить критический технический долг и уязвимости. Те, кто инвестирует в дисциплину, получат и скорость, и качество. Vibe engineering — это не тренд и не временное явление. Это эволюция профессии, которая диктует новые правила игры для каждого, кто хочет писать software в эпоху AI.

Источник: https://simonw.substack.com/p/vibe-engineering

#AI #программирование #llm
Forwarded from Data&AI Insights
The_Next_Frontier_of_Artificial_Intelligence_Why_AI_Memory_Syst.html
177.2 KB
🔗 The Next Frontier of Artificial Intelligence: Why AI Memory Systems Will Define the Next Generation | HackerNoon

📖 tgf

📌 Системы памяти ИИ: следующий рубеж искусственного интеллекта

Введение

За последнее десятилетие искусственный интеллект достиг впечатляющих результатов: большие языковые модели генерируют текст, неотличимый от человеческого, системы компьютерного зрения распознают объекты с высокой точностью, а предиктивные алгоритмы прогнозируют сложные паттерны в различных отраслях.
Однако, несмотря на эти достижения, большинство систем ИИ страдают от фундаментального ограничения — они не обладают памятью.

[Полное описание в прикрепленном файле]

#AI #машинноеобучение #технологии
Forwarded from Data&AI Insights
Exclusive_Anthropic_is_testing_Mythos_its_most_powerful_AI_m.html
299.9 KB
🔗 Exclusive: Anthropic is testing 'Mythos' its 'most powerful AI model ever developed' | Fortune

📖 tgf

📌 Anthropic тестирует «Mythos» — самую мощную модель в истории компании

Утечка данных раскрыла секретную разработку

26 марта 2026 года издание Fortune сообщило об утечке данных из компании Anthropic, в результате которой стала известна информация о новейшей модели искусственного интеллекта.
Черновик блог-поста, обнаруженный в публично доступном хранилище данных, содержал детали о разработке под кодовыми названиями Claude Mythos и Capybara.
Представитель Anthropic подтвердил изданию, что компания действительно разрабатывает и тестирует «новую модель AI более высокой производительности, чем любая из ранее выпущенных».

[Полное описание в прикрепленном файле]

#AI #новости #технологии
Forwarded from Data&AI Insights
Smolagents — когда создавать AI-агента можно за 15 минут без боли

Задумывались, почему большинство AI-агентов остаются игрушками для энтузиастов, а не рабочими инструментами? Проблема не в самих больших языковых моделях. Проблема в том, как мы их обвязываем.

Классические фреймворки вроде LangChain превратили создание агентов в многослойный квест с километрами абстракций, конфигов и boilerplate-кода. Прежде чем агент сделает что-то полезное, вы уже устали бороться с фреймворком. Сломался вызов — ищи ошибку в трёх уровнях абстракции. Хочешь понять, что агент на самом деле делает — удачи.

Hugging Face выпустили в конце 2024 года библиотеку smolagents, и она переворачивает эту парадигму с ног на голову. Весь фреймворк — меньше тысячи строк кода. Никаких сложных пайплайнов. Агенты здесь — code agents, то есть они пишут настоящий Python-код для решения задач, а не генерируют JSON-инструкции, которые потом непонятно как интерпретировать.

Почему это принципиально важно? Потому что код — это естественный язык для выражения сложной логики. Циклы, условия, манипуляции с данными — всё это записывается в Python естественно и читаемо. Агент получает задачу вроде «узнай погоду в Париже и Токио, сохрани результат в файл» и просто пишет код, который это делает. Вы можете этот код увидеть, отладить, понять, что пошло не так.

При этом библиотека не требовательна к инфраструктуре. Ставится через pip, работает с широким спектром моделей — OpenAI, Hugging Face Hub, Anthropic, локальные модели. Для прототипирования и обучения это идеальный формат. Студент с базовым Python может за вечер собрать работающего агента и понять, как агенты устроены изнутри.

Конечно, для enterprise-пайплайнов с тысячами одновременных запросов и сложными графами инструментов это пока не замена LangChain или LangGraph. Но для прототипирования, исследовательских проектов и образовательных целей smolagents делает входной порог минимальным. Больше не нужно неделю разбираться в фреймворке, чтобы агент сделал первый осмысленный запрос к API.

Это и есть настоящая демократизация AI-агентов. Не когда кто-то большой выпускает enterprise-решение за миллионы, а когда студент вечером может собрать агента, который реально работает, и понять принцип работы.

А самое главное, что это решение легко расширяется до enterprise за счёт продуманной архитектуры.
На текущий момент это наверное самый простой и одновременно самый мощный агентский фреймворк. Если кто-то ещё не пробовал, настоятельно рекомендую попробовать!

Источник: https://www.kdnuggets.com/getting-started-with-smolagents-build-your-first-code-agent-in-15-minutes

#AI #python #llm