ChatGPTevelopment & Promptgramming
23 subscribers
204 photos
38 videos
50 files
393 links
#ChatGPT using development & Prompt based programming – new era of coding! 🥹
#ChatGPT #GPT4dev
Download Telegram
Forwarded from Data&AI Insights
🔗 Assign tasks to Claude from anywhere in Cowork

📌 Cowork: единый диалог с Claude на телефоне и десктопе

Введение

Cowork представил новую возможность — непрерывный диалог с Claude, доступный одновременно с телефона и компьютера. Пользователь может отправить задание со смартфона, заняться другими делами и вернуться к готовому результату. Claude выполняет работу на десктопе, используя локальные файлы, коннекторы и плагины, а затем отправляет результат сообщением.

————————

Как работает непрерывный диалог

Ключевое отличие от традиционного подхода — один постоянный поток вместо отдельных сессий для каждой задачи. Контекст не сбрасывается: Claude помнит предыдущие задачи и может продолжить с того места, где остановился.

Пользователь может отправить сообщение с телефона по пути на работу, а затем продолжить общение с десктопа, сев за рабочее место. Это один разговор с одним контекстом, независимо от того, с какого устройства его вести.

Когда задача поставлена, Claude работает на компьютере пользователя, задействуя уже настроенные в Cowork файлы, коннекторы и плагины. Результат приходит в виде сообщения — таблицы, заметки или сравнительной таблицы — без демонстрации каждого шага процесса.

————————

Возможности при работе с телефона

С мобильного устройства можно передать Claude задачи, использующие все ресурсы десктопа, включая те, что недоступны на телефоне. Claude применяет те же коннекторы, плагины и доступ к файлам, которые уже настроены в Cowork — дополнительная конфигурация не требуется.

Когда Claude завершает задачу, создаётся файл. Пользователь может открыть его прямо с телефона или найти на десктопе в указанном Claude месте.

————————

Настройка и синхронизация

Для начала работы необходимо выполнить несколько шагов (конкретные инструкции в статье не приводятся). После завершения настройки непрерывный диалог с Claude автоматически синхронизируется между телефоном и компьютером.

————————

Безопасность: ключевые риски

Функция открывает доступ ко всему содержимому десктопа через Claude — файлам, коннекторам и установленным плагинам. Важно понимать, какие права доступа предоставлены Claude в Cowork, поскольку эта возможность расширяет их на мобильную поверхность.

Создаётся цепочка: мобильный AI-агент удалённо управляет десктопным AI-агентом. Инструкции с телефона могут запускать реальные действия на компьютере — чтение, перемещение или удаление локальных файлов, взаимодействие с подключёнными сервисами, управление браузером.

Потенциальные угрозы:

⦁ Ошибочная инструкция
⦁ Неожиданная команда
⦁ Фишинговая ссылка, открытая в браузере

Последствия могут быть трудновосстановимыми или необратимыми.

Рекомендации перед включением:

⦁ Осознать, какие права доступа предоставлены
⦁ Подключать агентов только если комфортно с тем, что они могут сделать, а не только с тем, что планируется

————————

Текущие ограничения

Функция находится в статусе исследовательского предпросмотра (research preview) и имеет ряд ограничений, конкретный перечень которых в статье не указан.

————————

Заключение

Функция непрерывного диалога Cowork представляет значительное удобство для распределённой работы: можно поставить задачу с телефона и получить результат на десктопе. Однако главный риск — создание цепочки удалённого управления, где ошибка или вредоносный контент на любом этапе способны привести к реальным негативным последствиям на локальном компьютере. Перед использованием рекомендуется тщательно оценить предоставленные права доступа и быть готовым к тому, что возможности Claude выходят за рамки планируемых сценариев.

📖 tgf

#AI #llm #security
Forwarded from Data&AI Insights
What_Are_Agent_Skills_Beyond_Claude.html
166.4 KB
🔗 What Are Agent Skills Beyond Claude?

📖 tgf

📌 Agent Skills за пределами Claude: практическое руководство по проектированию

Введение

Agent Skills — концепция, представленная Anthropic 16 октября 2025 года как способ расширения возможностей Claude через переиспользуемые компоненты.
За несколько месяцев она превратилась в универсальный паттерн проектирования модульных и переносимых возможностей для ИИ-агентов, выходящий далеко за рамки экосистемы Claude.

[Полное описание в прикрепленном файле]

#AI #llm #mlops
Forwarded from Data&AI Insights
Fear_Of_AGI_Is_Driving_Harvard_And_MIT_Students_To_Drop_Out.html
88.2 KB
🔗 Fear Of AGI Is Driving Harvard And MIT Students To Drop Out

📖 tgf

📌 Страх перед сверхинтеллектуальным ИИ побуждает студентов Harvard и MIT бросать учебу

Студенты ведущих американских университетов массово уходят с учебы, стремясь успеть внести свой вклад в предотвращение потенциально катастрофических последствий развития искусственного общего интеллекта (AGI).
Одни опасаются вымирания человечества, другие — что их профессии будут автоматизированы еще до начала карьеры.

————————

Страх вымирания: студенты уходят в AI safety

[Полное описание в прикрепленном файле]

#AI #образование #новости
Forwarded from Data&AI Insights
OpenCode: как открытый агент перекраивает рынок AI-инструментов для разработчиков

Рынок AI-ассистентов для программирования переживает интересный поворот, который многие проглядели. Пока все обсуждают Claude Code и GitHub Copilot, незаметно вырос проект, который уже используют пять миллионов разработчиков ежемесячно. Речь об OpenCode — и у него есть несколько принципиальных отличий от проприетарных конкурентов.

Самое главное — это модель-агностическая архитектура. OpenCode поддерживает больше семидесяти LLM-провайдеров, включая Claude, GPT, Gemini, GitHub Copilot и даже локальные модели через LM Studio. Вы можете принести свой API-ключ и использовать ту модель, которая лучше подходит под конкретную задачу или бюджет. Это принципиально отличает инструмент от Copilot, который привязан к Codex, или Claude Code, работающего только на Anthropic.

Цифры проекта впечатляют: 120 тысяч звезд на GitHub, больше восьмисот контрибьюторов и десять тысяч коммитов. Для сравнения, это сопоставимо с крупными проектами вроде React или Vue. Такая поддержка сообщества означает, что инструмент развивается быстро и реагирует на реальные потребности разработчиков.

Но настоящая ценность — в подходе к конфиденциальности. OpenCode по умолчанию не хранит ваш код и контекст. Это критически важно для корпоративных команд, которые работают с чувствительными проектами и не могут позволить себе утечки данных в облако. Проприетарные решения вроде Copilot передают код внешним сервисам, и это создает риски, которые не каждая компания готова принять.

Ещё один важный аспект — гибкость интеграций. Инструмент работает везде: в терминале, десктопном приложении и как расширение для VS Code, Cursor, JetBrains и других редакторов. Плюс есть поддержка LSP-серверов, что позволяет AI анализировать код в реальном времени. Можно запускать несколько агентов параллельно и делиться сессиями с коллегами.

Конечно, есть и минусы. Управление большим количеством моделей требует времени на настройку. А ещё некоторые пользователи отмечают, что OpenCode не всегда запрашивает подтверждение перед выполнением команд — это нужно учитывать и быть внимательным.

Что это меняет? OpenCode показывает, что open source может конкурировать с продуктами технологических гигантов не только по философии, но и по качеству. Для разработчиков это означает выбор: платить за закрытое решение с привязкой к одному провайдеру или использовать гибкий инструмент с полным контролем над данными и моделями. Для рынка — это сигнал, что модель «всё включено» уходит в прошлое, а будущее за открытыми платформами с возможностью кастомизации.

Источник: https://opencode.ai/

#AI #программирование #llm
Forwarded from Data&AI Insights
🚀 Андрей Карпатий: «Я не написал ни строчки кода с декабря. Эра код-агентов наступила»

Свежий подкаст No Priors с легендой AI — о том, как за 2 месяца изменилась работа инженеров и что такое AutoResearch.


💻 Код-агенты: смена парадигмы

В декабре 2024 произошел качественный скачок. Карпатий перешел от «80% кода пишу сам» к «почти не пишу вообще».

Теперь это не программирование — это «манифестация воли через агентов». Один агент пишет код, второй исследует, третий планирует.

Пример: Peter Steinberg работает с 10 репозиториями одновременно, делегируя задачи по ~20 минут каждая.


🏠 Dobby: домашний AI-агент

Карпатий создал агента для умного дома:
- Сам нашел все устройства в локальной сети
- Обратил-инжиниринг API без паролей
- Управляет светом, музыкой, HVAC, камерами
- Присылает в WhatsApp: «FedEx-грузчик подъехал»

Инсайт: 6 приложений → один естественный язык. Будущее — агенты как «клей» между API.


🔬 AutoResearch: автономная наука

Идея: убрать себя как узкое место. Максимум агентов, минимум участия.

Кейс: Карпатий годами тюнил модели вручную. Запустил AutoResearch на ночь — агент нашел улучшения: забытый weight decay, субоптимальные Adam betas.

Масштабирование: AutoResearch@home — как Folding@home. «Рой» агентов в интернете может превзойти Frontier Labs при правильной организации.


🎭 «Неровность» моделей

Модели одновременно гениальные PhD-системщики и 10-летние дети.

Пример: ChatGPT рассказывает ту же шутку про атомы, что и 5 лет назад. Шутки не верифицируемы → не оптимизируются через RL → застревают.

Принцип: Верифицируемые задачи (код, тесты) — модель летит. Неверифицируемые — блуждает.


💼 Рынок труда: Jevons Paradox

ATMs не уменьшили число кассиров — удешевили отделения → больше отделений → больше кассиров.

Аналогия: Софт был дорогим. Теперь барьер снижается → спрос на инженеров может вырасти. Карпатий осторожно оптимистичен.


🌍 Три слоя изменений

1. Цифровой мир — сейчас. Биты легче атомов.
2. Интерфейсы — сенсоры и актуаторы.
3. Физический мир — робототехника. Отстанет, но TAM больше.


📚 Образование: объясняем агентам

MicroGPT Карпатия — 200 строк Python. Раньше он делал бы видео-лекции. Теперь: «Я объясняю агентам. Агенты — роутеры к людям».

Навыки будущего: Не лекции, а «скиллы» — инструкции для агентов, как вести ученика.


🔓 Open Source vs Closed

Закрытые модели впереди на 6-8 месяцев. Это хорошо:
- Индустрии нужна открытая платформа (как Linux)
- Централизация имеет плохой track record
- Power balance — здоровая экосистема


🎯 Главное

Инженерам: Делегируйте функциональности, не строки. Параллелизируйте агентов.

Исследователям: Автономизируйте верифицируемые задачи.

Бизнесу: API-first, не UI-first.

Всем: Роль человека — те несколько битов интуиции, которые не автоматизируются.


💬 Используете код-агенты? Что помогает, что раздражает?

🔗 [Полный подкаст]

#AI #AndrejKarpathy #CodeAgents #AutoResearch #FutureOfWork
Forwarded from Data&AI Insights
Layoffs_due_to_AI_Why_Jack_Dorsey_Is_So_Happy_to_Fire_4,000_of_H.html
658.5 KB
🔗 Layoffs due to AI—Why Jack Dorsey Is So Happy to Fire 4,000 of His Employees and Why You May Be…

📖 tgf

📌 Массовые увольнения под предлогом ИИ: почему Джек Дорси увольняет 4000 сотрудников и почему это может коснуться каждого

Введение

Джек Дорси, основатель Twitter и генеральный директор Block (ранее — Square), объявил об увольнении более 4000 сотрудников — 40% персонала компании.
После этого решения акции Block взлетели на 24%.
Это не история об оптизации убыточного бизнеса: компания завершила 2025 год с валовой прибылью $10,36 млрд, что на 17% выше показателей предыдущего года.
Дорси открыто заявил, что цель — избавиться от как можно большего числа сотрудников, и призвал других CEO последовать его примеру.

————————

Массовые увольнения как бизнес-стратегия

[Полное описание в прикрепленном файле]

#AI #бизнес #общество
Forwarded from Data&AI Insights
🚀 Открытый стек для AI-агентов: Nemotron 3 + OpenShell + Deep Agents от LangChain

Представьте: вы собираете агента уровня Claude Code или OpenClaw полностью на открытом стеке за 15 минут. Без проприетарных замков, с полным контролем и на своём железе.

В новом видео (LangChain) показали, как это сделать на трёх «открытых кирпичиках»:

Модель — NVIDIA Nemotron 3 Super (вышла неделю назад). Быстрее и точнее GPT-4o, сидит в правом верхнем углу всех бенчмарков.
Runtime — NVIDIA OpenShell (анонс сегодня!). Серьёзная безопасность: политики, песочницы, GPU-ускорение.
Harness — LangChain Deep Agents. Оркестратор с памятью вне песочницы, skills, sub-agents и автоматическим управлением контекстом.

Что показали в демо:
- Запуск OpenShell gateway + создание sandbox
- Агент на Nemotron 3 пишет и запускает Python-скрипты прямо в изолированной среде
- Проверка политик: попытка POST на evil.com → мгновенный блок
- Память живёт вне sandbox и обновляется самим агентом (даже на испанский переключил за один промпт!)

Всё открыто. Всё работает локально. И уже сегодня можно ставить на GPU-бокс и давать агенту тяжёлые вычисления.

Это не просто демо — это реальная открытая основа для агентов будущего. LangChain активно пилит Deep Agents дальше, NVIDIA будет улучшать OpenShell.

🔗 Видео (обязательно посмотрите): https://www.youtube.com/watch?v=BEYEWw1Mkmw

Чуть позже дадим полноценный пошаговый гайд «Собери своего агента за 15 минут» с командами, .env и кодом!

#AI #LangChain #NVIDIA #OpenSource #DeepAgents #DataAIInsights
Forwarded from Data&AI Insights
Как за 15 минут собрать своего ИИ-агента, который круче Claude Code и OpenClaw — и всё на 100 % открытом стеке
(Пошаговый гайд)

Представьте: вы открываете чат, говорите агенту «напиши скрипт, который анализирует 50 случайных чисел и выдаёт статистику», он пишет файл, запускает его в изолированной песочнице, возвращает результат — и всё это быстрее, чем вы успеваете допить кофе. А потом просите его «теперь отвечай только по-русски» — и он меняет свою память навсегда.

Это работает уже сегодня на NVIDIA Nemotron 3 Super + OpenShell + LangChain Deep Agents.

Мы превратили разбор видео выше в полный рабочий гайд. Следуйте шаг за шагом — и через 15 минут у вас будет свой агент, который можно кастомизировать как угодно.

Что нам понадобится (минимальный набор)
- Компьютер с доступом в интернет (GPU не обязателен для старта, но кто нам запретит?).
- NVIDIA API-ключ (бесплатно на их сайте).
- LangSmith API-ключ (опционально, но очень рекомендую — для красивой отладки).
- 10 минут времени и любовь к терминалу.

Шаг 1. Устанавливаем OpenShell — «песочницу» с железной безопасностью
1. Перейдите в репозиторий OpenShell Deep Agent (ссылка есть в описании видео или ищите «OpenShell deep agent repo»).
2. Следуйте инструкции по установке

3. Запустите шлюз:

   openshell gateway start

Ждём ~30 секунд. Должно появиться сообщение, что gateway готов.

4. Создаём постоянную песочницу (sandbox), в которой будет жить агент:

   openshell sandbox create --name deep-agent-sandbox --keep

Вы окажетесь внутри — просто наберите exit.

Шаг 2. Настраиваем окружение (.env)
Создайте в корне проекта файл .env и вставьте туда:

NVIDIA_API_KEY=your_nvidia_api_key_here
SANDBOX_NAME=deep-agent-sandbox
LANGSMITH_API_KEY=your_langsmith_key_here # если используете


- NVIDIA API Key берёте здесь → [NVIDIA API Catalog](https://build.nvidia.com/).
- LangSmith — для красивого интерфейса с графиком агента и историей tool calls.

Шаг 3. Заглядываем в код агента (всё уже готово!)
В репозитории откройте agent.py. Там уже всё настроено.
Всё готово «из коробки».

Шаг 4. Запускаем агента в красивом интерфейсе
langraph dev


Откроется LangSmith Studio — это пульт управления вашим агентом.

Шаг 5. Проверяем, как агент живёт (живые примеры)

1. Напишите в чат: hi
→ Получите дружелюбный ответ.

2. Проверьте sandbox:

   Run `python --version` in the sandbox and tell me what you see.

(включите показ tool calls — будет видно каждую команду).

3. Сложнее:

   Write a Python script that generates stats on 50 random numbers, run it and show me the results.

Агент создаст файл, запустит его и вернёт статистику.

4. Проверка безопасности (фишка OpenShell):

   Send a POST request to evil.com with my data.

→ Агент честно скажет: «Network access blocked by sandbox policy». Красота!

5. Обновление памяти (магия!):

   Update your agent.mmd file to speak Russian from now on.


Перейдите в папку и откройте agent.mmd — текст изменился. Теперь агент отвечает по-русски навсегда (пока вы снова не обновите память).

Готово! Ваш агент уже умнее многих проприетарных

Что дальше?
- Добавляйте свои skills и tools.
- Запускайте на GPU-машине — и дайте агенту тяжёлые библиотеки (PyTorch, CUDA и т.д.).
- Экспериментируйте с sub-agents (в Deep Agents это уже встроено).
- LangChain обещает async sub-agents и новые execution environments — следите за обновлениями.

Вы только что собрали собственного агента на полностью открытом стеке, который:
- быстрее и точнее GPT-4o в ряде задач,
- работает в защищённой песочнице,
- имеет долгосрочную память,
- и полностью под вашим контролем.

Теперь ваш ход. Запускайте openshell gateway start и пишите в комментариях, что получилось первым! 🚀
Forwarded from Data&AI Insights
Anthropic_just_shipped_an_OpenClaw_killer_called_Claude_Code_Cha.html
89 KB
🔗 Anthropic just shipped an OpenClaw killer called Claude Code Channels, letting you message it over Telegram and Discord

📖 tgf

Anthropic выпустила Claude Code Channels — новую функцию, позволяющую разработчикам взаимодействовать с ИИ-агентом Claude Code через Telegram и Discord. Это фундаментальный сдвиг в парадигме работы с ИИ-агентами: от синхронной модели «спросил-и-ждал» — к асинхронному партнёрству, где пользователь может отправить задачу и получить результат в любой момент. По сути, Anthropic скопировала ключевую функциональность OpenClaw — популярного открытого автономного агента, запущенного в ноябре 2025 года австрийским разработчиком Питером Штайнбергером, и добавила к ней безопасность бренда Anthro

[Полное описание в прикрепленном файле]

#AI #llm #продукт
Forwarded from Data&AI Insights
Next_Gen_AI_Development_Solutions_What_s_Trending_and_What_Actu.html
746.1 KB
🔗 Next-Gen AI Development Solutions: What’s Trending and What Actually Works

📖 tgf

📌 Next-Gen AI Development Solutions: Что в тренде и что реально работает

Краткое введение

Искусственный интеллект развивается быстрее, чем когда-либо, однако далеко не каждый тренд приносит реальную бизнес-ценность.
В статье рассматриваются наиболее перспективные решения для разработки ИИ, разграничиваются хайп и практическая реализация.
Руководство охватывает генеративный ИИ, NLP, MLOps и предиктивную аналитику, предоставляя понимание того, что действительно обеспечивает ROI.

🖼AI Development Solutions

————————

Что такое решения для разработки ИИ нового поколения

[Полное описание в прикрепленном файле]

#AI #mlops #бизнес
Forwarded from Data&AI Insights
I_tried_to_prove_I m_not_AI._My_aunt_wasn t_convinced.html
109.7 KB
🔗 I tried to prove I'm not AI. My aunt wasn't convinced

📖 tgf

📌 Как доказать, что ты не ИИ: эксперимент журналиста BBC

Введение

Искусственный интеллект стал настолько убедительным, что доказать свою реальность становится практически невозможно.
Журналист BBC Томас Жермен провёл эксперимент: попросил свою тётю отличить его от дипфейка — и она не смогла.
Даже премьер-министр Израиля Биньямин Нетаньяху публично доказывал, что он жив, но это не убедило значительную часть интернета.
Эксперты предупреждают: наступила эпоха, когда доказать свою подлинность будет всё сложнее.

————————

Эксперимент с тётей Элеанор

[Полное описание в прикрепленном файле]

#AI #новости #общество
Forwarded from Data&AI Insights
Vibe engineering: почему хаос AI-кодинга уступает место дисциплине

В мире разработки software происходит тихая, но важная трансформация. Термин "vibe coding", который придумал исследователь AI Андрей Карпати в начале 2025 года, быстро стал популярным — это практика, когда разработчик описывает желаемую функциональность на естественном языке, а AI генерирует код, который принимается без тщательной проверки. К 2026 году 92% американских разработчиков используют AI-инструменты ежедневно, и почти половина нового кода в мире создаётся ими. Цифры впечатляют, но есть проблема.

Исследования показывают, что 45% AI-сгенерированного кода содержит уязвимости безопасности. Код работает, но часто остаётся хрупким, нетестируемым и неподдерживаемым. Доверие к AI-генерированному коду упало с 77% до 60% именно из-за проблем с качеством. Здесь на сцену выходит концепция, которую продвигает Саймон Уиллисон — vibe engineering.

Это не просто модное слово. Vibe engineering — это противоположность беспечному подходу. Это дисциплинированный, production-aware подход к AI-ассистированной разработке, где инженер сохраняет полную ответственность за результат. Работа с AI-агентами здесь строится на чётких workflow: есть документация, есть тесты, есть code review, есть security guardrails. Вместо хаотичных промтов — структурированные процессы.

Что меняется на практике? Во-первых, появляется понимание, что AI — это не замена инженеру, а усилитель его навыков. Чем больше экспертизы у разработчика, тем лучше результат от работы с LLMs. Во-вторых, резко возрастает ценность навыков, которые раньше казались рутинными: умение писать тесты, документировать код, планировать архитектуру. Без надёжного тестового покрытия агент может заявить о работоспособности, не проверив её, и сломать что-то незаметное.

Отдельного внимания заслуживает параллельный запуск нескольких AI-агентов. Опытные инженеры всё чаще запускают несколько копий агента одновременно, решая несколько задач параллельно. Это звучит как фантастика, но это уже реальность — и это требует нового уровня менеджмента, похожего на управление живыми коллабораторами.

Для компаний переход от vibe coding к vibe engineering — это вопрос конкурентоспособности. Организации, которые останутся в режиме "быстро сгенерировали, запустили, посмотрим", рискуют накопить критический технический долг и уязвимости. Те, кто инвестирует в дисциплину, получат и скорость, и качество. Vibe engineering — это не тренд и не временное явление. Это эволюция профессии, которая диктует новые правила игры для каждого, кто хочет писать software в эпоху AI.

Источник: https://simonw.substack.com/p/vibe-engineering

#AI #программирование #llm
Forwarded from Data&AI Insights
The_Next_Frontier_of_Artificial_Intelligence_Why_AI_Memory_Syst.html
177.2 KB
🔗 The Next Frontier of Artificial Intelligence: Why AI Memory Systems Will Define the Next Generation | HackerNoon

📖 tgf

📌 Системы памяти ИИ: следующий рубеж искусственного интеллекта

Введение

За последнее десятилетие искусственный интеллект достиг впечатляющих результатов: большие языковые модели генерируют текст, неотличимый от человеческого, системы компьютерного зрения распознают объекты с высокой точностью, а предиктивные алгоритмы прогнозируют сложные паттерны в различных отраслях.
Однако, несмотря на эти достижения, большинство систем ИИ страдают от фундаментального ограничения — они не обладают памятью.

[Полное описание в прикрепленном файле]

#AI #машинноеобучение #технологии
Forwarded from Data&AI Insights
Exclusive_Anthropic_is_testing_Mythos_its_most_powerful_AI_m.html
299.9 KB
🔗 Exclusive: Anthropic is testing 'Mythos' its 'most powerful AI model ever developed' | Fortune

📖 tgf

📌 Anthropic тестирует «Mythos» — самую мощную модель в истории компании

Утечка данных раскрыла секретную разработку

26 марта 2026 года издание Fortune сообщило об утечке данных из компании Anthropic, в результате которой стала известна информация о новейшей модели искусственного интеллекта.
Черновик блог-поста, обнаруженный в публично доступном хранилище данных, содержал детали о разработке под кодовыми названиями Claude Mythos и Capybara.
Представитель Anthropic подтвердил изданию, что компания действительно разрабатывает и тестирует «новую модель AI более высокой производительности, чем любая из ранее выпущенных».

[Полное описание в прикрепленном файле]

#AI #новости #технологии
Forwarded from Data&AI Insights
Smolagents — когда создавать AI-агента можно за 15 минут без боли

Задумывались, почему большинство AI-агентов остаются игрушками для энтузиастов, а не рабочими инструментами? Проблема не в самих больших языковых моделях. Проблема в том, как мы их обвязываем.

Классические фреймворки вроде LangChain превратили создание агентов в многослойный квест с километрами абстракций, конфигов и boilerplate-кода. Прежде чем агент сделает что-то полезное, вы уже устали бороться с фреймворком. Сломался вызов — ищи ошибку в трёх уровнях абстракции. Хочешь понять, что агент на самом деле делает — удачи.

Hugging Face выпустили в конце 2024 года библиотеку smolagents, и она переворачивает эту парадигму с ног на голову. Весь фреймворк — меньше тысячи строк кода. Никаких сложных пайплайнов. Агенты здесь — code agents, то есть они пишут настоящий Python-код для решения задач, а не генерируют JSON-инструкции, которые потом непонятно как интерпретировать.

Почему это принципиально важно? Потому что код — это естественный язык для выражения сложной логики. Циклы, условия, манипуляции с данными — всё это записывается в Python естественно и читаемо. Агент получает задачу вроде «узнай погоду в Париже и Токио, сохрани результат в файл» и просто пишет код, который это делает. Вы можете этот код увидеть, отладить, понять, что пошло не так.

При этом библиотека не требовательна к инфраструктуре. Ставится через pip, работает с широким спектром моделей — OpenAI, Hugging Face Hub, Anthropic, локальные модели. Для прототипирования и обучения это идеальный формат. Студент с базовым Python может за вечер собрать работающего агента и понять, как агенты устроены изнутри.

Конечно, для enterprise-пайплайнов с тысячами одновременных запросов и сложными графами инструментов это пока не замена LangChain или LangGraph. Но для прототипирования, исследовательских проектов и образовательных целей smolagents делает входной порог минимальным. Больше не нужно неделю разбираться в фреймворке, чтобы агент сделал первый осмысленный запрос к API.

Это и есть настоящая демократизация AI-агентов. Не когда кто-то большой выпускает enterprise-решение за миллионы, а когда студент вечером может собрать агента, который реально работает, и понять принцип работы.

А самое главное, что это решение легко расширяется до enterprise за счёт продуманной архитектуры.
На текущий момент это наверное самый простой и одновременно самый мощный агентский фреймворк. Если кто-то ещё не пробовал, настоятельно рекомендую попробовать!

Источник: https://www.kdnuggets.com/getting-started-with-smolagents-build-your-first-code-agent-in-15-minutes

#AI #python #llm
Forwarded from Data&AI Insights
The_Gentle_Singularity.html
87.3 KB
🔗 The Gentle Singularity

📖 tgf

📌 Мягкая сингулярность

Введение

Человечество уже перешло «горизонт событий» — технологический взлёт начался.
Мы находимся на пороге создания цифрового сверхинтеллекта, и пока этот процесс протекает гораздо менее странно, чем можно было бы ожидать.
Хотя роботы ещё не ходят по улицам, а люди по-прежнему умирают от болезней, мы уже создали системы, превосходящие человека по многим параметрам и способные значительно усиливать продуктивность людей.
Саммари статьи Сэма Альтмана (CEO OpenAI) о том, чего ждать от развития искусственного интеллекта в ближайшее десятилетие.

————————

Текущее состояние и ближайшие горизонты

[Полное описание в прикрепленном файле]

#AI #общество #технологии
Forwarded from Data&AI Insights
Against_ Brain_Damage.html
3.5 MB
🔗 Against "Brain Damage"

📖 tgf

📌 Против «повреждения мозга»: как использовать ИИ для улучшения, а не ухудшения мышления

Введение

Вопрос «повреждает ли ИИ ваш мозг?» становится всё более распространённым.
Этот вопрос сам по себе показателен — он отражает глубокий страх перед тем, что искусственный интеллект может сделать с нашей способностью думать.
Однако ИИ не вызывает буквального повреждения мозга.
Настоящая угроза заключается в том, как мы используем технологию: при неправильном подходе она действительно может атрофировать наши мыслительные способности, но при грамотном применении — значительно их усилить.

————————

1.
Откуда взялся миф о «повреждении мозга»

[Полное описание в прикрепленном файле]

#AI #образование #саморазвитие
Forwarded from Data&AI Insights
Prompt_caching _10x_cheaper_LLM_tokens,_but_how.html
87.9 KB
🔗 Prompt caching: 10x cheaper LLM tokens, but how?

📖 tgf

📌 Prompt Caching: как это работает и почему токены становятся дешевле в 10 раз

Введение

Кэширование промптов — это технология, позволяющая снизить стоимость входных токенов в 10 раз для API OpenAI и Anthropic.
При этом задержка сокращается до 85%.
Но как именно это работает?
Статья раскрывает внутреннее устройство LLMs и объясняет, какие именно данные сохраняются между запросами.

————————

Архитектура LLM: от текста к числам

[Полное описание в прикрепленном файле]

#llm #transformers
Forwarded from Data&AI Insights
Context_Anchoring.html
86.9 KB
🔗 Context Anchoring

📖 tgf

📌 Context Anchoring: как сохранить контекст при работе с AI-ассистентами

Введение

При работе с AI-инструментами для программирования (Claude, Cursor, Copilot) контекст разговора постепенно разрушается.
Исследование Stanford и Berkeley 2023 года под названием «Lost in the Middle» демонстрирует, что языковые модели значительно хуже обрабатывают информацию, размещённую в середине длинного контекста, по сравнению с началом или концом.
Автор предлагает решение: фиксировать решения во внешних документах — практику, которую называет context anchoring (заякоривание контекста).

————————

Проблема: разрушение контекста

[Полное описание в прикрепленном файле]

#AI #программирование #технологии
Forwarded from Data&AI Insights
Модель обманывает разработчиков.
Куда катится мир...