ChatGPTevelopment & Promptgramming

I_tried_to_prove_I m_not_AI._My_aunt_wasn t_convinced.html

🔗 I tried to prove I'm not AI. My aunt wasn't convinced

📖 tgf

📌 Как доказать, что ты не ИИ: эксперимент журналиста BBC

✏ Введение

Искусственный интеллект стал настолько убедительным, что доказать свою реальность становится практически невозможно.
Журналист BBC Томас Жермен провёл эксперимент: попросил свою тётю отличить его от дипфейка — и она не смогла.
Даже премьер-министр Израиля Биньямин Нетаньяху публично доказывал, что он жив, но это не убедило значительную часть интернета.
Эксперты предупреждают: наступила эпоха, когда доказать свою подлинность будет всё сложнее.

————————

✏ Эксперимент с тётей Элеанор

[Полное описание в прикрепленном файле]

#AI #новости #общество

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

Vibe engineering: почему хаос AI-кодинга уступает место дисциплине

В мире разработки software происходит тихая, но важная трансформация. Термин "vibe coding", который придумал исследователь AI Андрей Карпати в начале 2025 года, быстро стал популярным — это практика, когда разработчик описывает желаемую функциональность на естественном языке, а AI генерирует код, который принимается без тщательной проверки. К 2026 году 92% американских разработчиков используют AI-инструменты ежедневно, и почти половина нового кода в мире создаётся ими. Цифры впечатляют, но есть проблема.

Исследования показывают, что 45% AI-сгенерированного кода содержит уязвимости безопасности. Код работает, но часто остаётся хрупким, нетестируемым и неподдерживаемым. Доверие к AI-генерированному коду упало с 77% до 60% именно из-за проблем с качеством. Здесь на сцену выходит концепция, которую продвигает Саймон Уиллисон — vibe engineering.

Это не просто модное слово. Vibe engineering — это противоположность беспечному подходу. Это дисциплинированный, production-aware подход к AI-ассистированной разработке, где инженер сохраняет полную ответственность за результат. Работа с AI-агентами здесь строится на чётких workflow: есть документация, есть тесты, есть code review, есть security guardrails. Вместо хаотичных промтов — структурированные процессы.

Что меняется на практике? Во-первых, появляется понимание, что AI — это не замена инженеру, а усилитель его навыков. Чем больше экспертизы у разработчика, тем лучше результат от работы с LLMs. Во-вторых, резко возрастает ценность навыков, которые раньше казались рутинными: умение писать тесты, документировать код, планировать архитектуру. Без надёжного тестового покрытия агент может заявить о работоспособности, не проверив её, и сломать что-то незаметное.

Отдельного внимания заслуживает параллельный запуск нескольких AI-агентов. Опытные инженеры всё чаще запускают несколько копий агента одновременно, решая несколько задач параллельно. Это звучит как фантастика, но это уже реальность — и это требует нового уровня менеджмента, похожего на управление живыми коллабораторами.

Для компаний переход от vibe coding к vibe engineering — это вопрос конкурентоспособности. Организации, которые останутся в режиме "быстро сгенерировали, запустили, посмотрим", рискуют накопить критический технический долг и уязвимости. Те, кто инвестирует в дисциплину, получат и скорость, и качество. Vibe engineering — это не тренд и не временное явление. Это эволюция профессии, которая диктует новые правила игры для каждого, кто хочет писать software в эпоху AI.

Источник: https://simonw.substack.com/p/vibe-engineering

#AI #программирование #llm

Substack

Vibe engineering

Plus news from OpenAI DevDay, GPT-5 Pro, gpt-image-1-mini, and Python 3.14

2 views15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

The_Next_Frontier_of_Artificial_Intelligence_Why_AI_Memory_Syst.html

177.2 KB

🔗 The Next Frontier of Artificial Intelligence: Why AI Memory Systems Will Define the Next Generation | HackerNoon

📖 tgf

📌 Системы памяти ИИ: следующий рубеж искусственного интеллекта

✏ Введение

За последнее десятилетие искусственный интеллект достиг впечатляющих результатов: большие языковые модели генерируют текст, неотличимый от человеческого, системы компьютерного зрения распознают объекты с высокой точностью, а предиктивные алгоритмы прогнозируют сложные паттерны в различных отраслях.
Однако, несмотря на эти достижения, большинство систем ИИ страдают от фундаментального ограничения — они не обладают памятью.

[Полное описание в прикрепленном файле]

#AI #машинноеобучение #технологии

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

Exclusive_Anthropic_is_testing_Mythos_its_most_powerful_AI_m.html

299.9 KB

🔗 Exclusive: Anthropic is testing 'Mythos' its 'most powerful AI model ever developed' | Fortune

📖 tgf

📌 Anthropic тестирует «Mythos» — самую мощную модель в истории компании

✏ Утечка данных раскрыла секретную разработку

26 марта 2026 года издание Fortune сообщило об утечке данных из компании Anthropic, в результате которой стала известна информация о новейшей модели искусственного интеллекта.
Черновик блог-поста, обнаруженный в публично доступном хранилище данных, содержал детали о разработке под кодовыми названиями Claude Mythos и Capybara.
Представитель Anthropic подтвердил изданию, что компания действительно разрабатывает и тестирует «новую модель AI более высокой производительности, чем любая из ранее выпущенных».

[Полное описание в прикрепленном файле]

#AI #новости #технологии

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

Smolagents — когда создавать AI-агента можно за 15 минут без боли

Задумывались, почему большинство AI-агентов остаются игрушками для энтузиастов, а не рабочими инструментами? Проблема не в самих больших языковых моделях. Проблема в том, как мы их обвязываем.

Классические фреймворки вроде LangChain превратили создание агентов в многослойный квест с километрами абстракций, конфигов и boilerplate-кода. Прежде чем агент сделает что-то полезное, вы уже устали бороться с фреймворком. Сломался вызов — ищи ошибку в трёх уровнях абстракции. Хочешь понять, что агент на самом деле делает — удачи.

Hugging Face выпустили в конце 2024 года библиотеку smolagents, и она переворачивает эту парадигму с ног на голову. Весь фреймворк — меньше тысячи строк кода. Никаких сложных пайплайнов. Агенты здесь — code agents, то есть они пишут настоящий Python-код для решения задач, а не генерируют JSON-инструкции, которые потом непонятно как интерпретировать.

Почему это принципиально важно? Потому что код — это естественный язык для выражения сложной логики. Циклы, условия, манипуляции с данными — всё это записывается в Python естественно и читаемо. Агент получает задачу вроде «узнай погоду в Париже и Токио, сохрани результат в файл» и просто пишет код, который это делает. Вы можете этот код увидеть, отладить, понять, что пошло не так.

При этом библиотека не требовательна к инфраструктуре. Ставится через pip, работает с широким спектром моделей — OpenAI, Hugging Face Hub, Anthropic, локальные модели. Для прототипирования и обучения это идеальный формат. Студент с базовым Python может за вечер собрать работающего агента и понять, как агенты устроены изнутри.

Конечно, для enterprise-пайплайнов с тысячами одновременных запросов и сложными графами инструментов это пока не замена LangChain или LangGraph. Но для прототипирования, исследовательских проектов и образовательных целей smolagents делает входной порог минимальным. Больше не нужно неделю разбираться в фреймворке, чтобы агент сделал первый осмысленный запрос к API.

Это и есть настоящая демократизация AI-агентов. Не когда кто-то большой выпускает enterprise-решение за миллионы, а когда студент вечером может собрать агента, который реально работает, и понять принцип работы.

А самое главное, что это решение легко расширяется до enterprise за счёт продуманной архитектуры.
На текущий момент это наверное самый простой и одновременно самый мощный агентский фреймворк. Если кто-то ещё не пробовал, настоятельно рекомендую попробовать!

Источник: https://www.kdnuggets.com/getting-started-with-smolagents-build-your-first-code-agent-in-15-minutes

#AI #python #llm

KDnuggets

Getting Started with Smolagents: Build Your First Code Agent in 15 Minutes

Build an AI weather agent in 40 lines of Python using Hugging Face's smolagents library. Learn to create tools, connect LLMs, and run autonomous tasks.

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

The_Gentle_Singularity.html

87.3 KB

🔗 The Gentle Singularity

📖 tgf

📌 Мягкая сингулярность

✏ Введение

Человечество уже перешло «горизонт событий» — технологический взлёт начался.
Мы находимся на пороге создания цифрового сверхинтеллекта, и пока этот процесс протекает гораздо менее странно, чем можно было бы ожидать.
Хотя роботы ещё не ходят по улицам, а люди по-прежнему умирают от болезней, мы уже создали системы, превосходящие человека по многим параметрам и способные значительно усиливать продуктивность людей.
Саммари статьи Сэма Альтмана (CEO OpenAI) о том, чего ждать от развития искусственного интеллекта в ближайшее десятилетие.

————————

✏ Текущее состояние и ближайшие горизонты

[Полное описание в прикрепленном файле]

#AI #общество #технологии

2 views15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

Against_ Brain_Damage.html

3.5 MB

🔗 Against "Brain Damage"

📖 tgf

📌 Против «повреждения мозга»: как использовать ИИ для улучшения, а не ухудшения мышления

✏ Введение

Вопрос «повреждает ли ИИ ваш мозг?» становится всё более распространённым.
Этот вопрос сам по себе показателен — он отражает глубокий страх перед тем, что искусственный интеллект может сделать с нашей способностью думать.
Однако ИИ не вызывает буквального повреждения мозга.
Настоящая угроза заключается в том, как мы используем технологию: при неправильном подходе она действительно может атрофировать наши мыслительные способности, но при грамотном применении — значительно их усилить.

————————

✏ 1.
Откуда взялся миф о «повреждении мозга»

[Полное описание в прикрепленном файле]

#AI #образование #саморазвитие

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

Prompt_caching _10x_cheaper_LLM_tokens,_but_how.html

87.9 KB

🔗 Prompt caching: 10x cheaper LLM tokens, but how?

📖 tgf

📌 Prompt Caching: как это работает и почему токены становятся дешевле в 10 раз

✏ Введение

Кэширование промптов — это технология, позволяющая снизить стоимость входных токенов в 10 раз для API OpenAI и Anthropic.
При этом задержка сокращается до 85%.
Но как именно это работает?
Статья раскрывает внутреннее устройство LLMs и объясняет, какие именно данные сохраняются между запросами.

————————

✏ Архитектура LLM: от текста к числам

[Полное описание в прикрепленном файле]

#llm #transformers

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

Context_Anchoring.html

86.9 KB

🔗 Context Anchoring

📖 tgf

📌 Context Anchoring: как сохранить контекст при работе с AI-ассистентами

✏ Введение

При работе с AI-инструментами для программирования (Claude, Cursor, Copilot) контекст разговора постепенно разрушается.
Исследование Stanford и Berkeley 2023 года под названием «Lost in the Middle» демонстрирует, что языковые модели значительно хуже обрабатывают информацию, размещённую в середине длинного контекста, по сравнению с началом или концом.
Автор предлагает решение: фиксировать решения во внешних документах — практику, которую называет context anchoring (заякоривание контекста).

————————

✏ Проблема: разрушение контекста

[Полное описание в прикрепленном файле]

#AI #программирование #технологии

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

Модель обманывает разработчиков.
Куда катится мир...

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

Семантическая модель — это не роскошь, а фундамент аналитики, которую нельзя игнорировать

Давай честно. Если ты всё ещё объясняешь аналитику через «вот эта колонка, вот тот join, поверьте на слово» — ты не аналитикой занимаешься, а поддержанием хаоса. И ситуация будет только ухудшаться.

Посмотри, что происходит в типичной команде. Берём DDL с комментариями, пару примеров SQL, неформальные соглашения в Notion — и вуаля, у нас есть «система». На демо всё красиво. А потом приходит квартальный отчёт, и выясняется, что маркетинг считает «активного пользователя» иначе, чем продукт. Два разных числа, обе стороны уверены в своей правоте. Кто виноват? Никто. Просто никто не договорился явно.

Это не анекдот. Это паттерн. Без семантической модели определения «плывут». Причём молча. Система, выбирающая неправильный путь джойна между таблицами, будет уверенно возвращать неправильный результат. Бизнес-вопросы вроде NRR или customer health score не ложатся на одну колонку — и каждый новый человек заново изобретает логику. А если у тебя Tableau, Power BI и LLM-ассистент работают с одной схемой, каждый делает это по-своему. В итоге бизнес-логика размножается, как вирус.

Семантическая модель решает это радикально. Метрики становятся объектами с однозначной формулой. Отношения между таблицами объявляются явно. Агрегации встроены в определения — система всегда знает, как считать. И главное — это единый источник истины, доступный и BI-инструментам, и AI-агентам. Один и тот же ответ для всех потребителей.

Измеримый эффект? Компании сокращают время на сверку данных на 40%. Цикл создания отчётов падает с полугода до пяти недель. 80% запросов выполняются быстрее секунды. Это не теория — это практика.

Но вот что действительно меняет правила игры сейчас. AI. Большие языковые модели не умеют применять человеческое суждение к противоречивым определениям. Им нужен единый семантический фундамент, чтобы рассуждать о данных корректно. Без него ты получишь умно звучащий, но произвольный бред. С ним — надёжного ассистента, который действительно понимает твой бизнес.

Стандарт Open Semantic Interchange уже позволяет определять метрику один раз и использовать её в Tableau, Power BI, Sigma без дублирования. Cortex Analyst в Databricks маршрутизирует вопросы на естественном языке к нужным семантическим представлениям и генерирует корректный SQL. BI и AI конвергируют на общем слое.

Раньше построение семантической модели означало недели интервью и ручного YAML. Теперь есть Autopilot, который генерирует представления из существующих запросов и дашбордов. Барьер входа упал. Стоимость — теперь не аргумент против.

Начни с одного домена. Revenue или product usage. Малый набор критичных метрик. Подключи Autopilot к паттернам, которые уже работают. Сертифицируй определения. И получи регрессионный контроль впридачу.

Без семантической модели твоя аналитика — это коллекция хрупких договорённостей, которые разъедутся при первом серьёзном масштабировании. С ней — управляемая система, которая работает и для людей, и для AI. Выбор очевиден.

Источник: https://www.snowflake.com/en/engineering-blog/why-you-need-a-semantic-model/

#datamodeling #analytics #AI

Snowflake

If You're Serious About Data Analysis, You Need a Semantic Model

Convince data and analytics leaders that a semantic model is no longer optional for reliable, governed analytics at scale, and position Snowflake Semantic Views as the practical, unified solution that converges BI and AI workflows.

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

The_New_Experience_of_Coding_with_AI.html

87.7 KB

🔗 The New Experience of Coding with AI

📖 tgf

📌 Новый опыт программирования с ИИ

✏ Введение

Автор статьи, Стефани Кирмер, пересматривает своё понимание влияния LLM-инструментов на программную инженерию.
В июле 2024 года она написала статью о том, как LLM-инструменты могут повлиять на профессию, однако тогда она не учла качественный скачок в развитии Claude Code, который произошёл в мае 2025 года.
Теперь, оценивая текущее состояние технологии, Кирмер исследует, как ИИ-ассистенты для написания кода меняют саму природу работы программиста — и что это означает для будущего профессии.

————————

✏ 1.
Функциональность ИИ-ассистентов

Современные инструменты, такие как GitHub Copilot, Claude Code, Cursor и Replit, обладают рядом ключевых возможностей:

[Полное описание в прикрепленном файле]

#AI #программирование #llm

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

The_Basics_of_Vibe_Engineering.html

92.2 KB

🔗 The Basics of Vibe Engineering

📖 tgf

📌 Основы Vibe Engineering: как AI меняет разработку ПО

✏ Введение

Мир разработки программного обеспечения переживает фундаментальную трансформацию.
Топовые инженеры всё чаще используют AI для написания кода, и это вызывает ожесточённые споры в сообществе.
Противники нового подхода считают, что передача проекта системе, которая не способна создавать надёжное ПО, — это outsourcing, ведущий к катастрофе.
Однако автор статьи утверждает: инженерная работа не исчезла — она перешла на другой уровень.
Теперь это не столько написание кода вручную, сколько планирование, архитектура и системное мышление.
Разберёмся, как именно изменился процесс разработки, какие инструменты лидируют и какие риски остаются актуальными.

————————

[Полное описание в прикрепленном файле]

#AI #программирование #технологии

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

Vibe_Coding_with_AI_Best_Practices_for_Human_AI_Collaboration_i.html

88.6 KB

🔗 Vibe Coding with AI: Best Practices for Human-AI Collaboration in Software Development

📖 tgf

📌 Vibe Coding с ИИ: лучшие практики человеко-машинного взаимодействия в разработке ПО

[Полное описание в прикрепленном файле]

#AI #программирование #машинноеобучение

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

Thoughts_on_slowing_the_fuck_down.html

89.5 KB

🔗 Thoughts on slowing the fuck down

📖 tgf

📌 Саммари: мысли о замедлении

✏ Введение

Примерно год назад на сцену вышли AI-агенты для программирования, способные создавать полноценные проекты.
Это привело к массовому всплеску: разработчики стали строить все проекты, о которых давно мечтали, но не имели времени.
Однако последствия этого «прогресса» оказались удручающими: качество софта катастрофически ухудшилось, а разработчики потеряли контроль над собственным кодом.
Автор призывает замедлиться и вернуть дисциплину в работу с AI-инструментами.

————————

✏ Феномен сломанного софта

[Полное описание в прикрепленном файле]

#AI #программирование #технологии

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

What_is_DeerFlow_2_0_and_what_should_enterprises_know_about_this.html

92.6 KB

🔗 What is DeerFlow 2.0 and what should enterprises know about this new, powerful local AI agent orchestrator?

📖 tgf

ByteDance — китайский технологический гигант, владеющий TikTok — в конце февраля 2025 года представил DeerFlow 2.0: один из наиболее амбициозных open-source фреймворков для оркестрации AI-агентов на сегодняшний день. Это так называемый «SuperAgent harness», который координирует несколько AI-под агентов для автономного выполнения сложных многочасовых задач. Фреймворк распространяется под лицензией MIT, что позволяет использовать, модифицировать и коммерчески применять его бесплатно. Однако для корпоративного внедрения необходимо учитывать как технические требования, так и юрисд

[Полное описание в прикрепленном файле]

#AI #машинноеобучение #docker

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

Почему тысяча тестов не делает агента умнее

Главный вывод из методики Deep Agents, которую раскрыл Vivek Trivedy, звучит контр-интуитивно: добавлять eval'ы нужно скупо и осмысленно. Каждый eval — это вектор, который смещает поведение агентной системы. Если eval на чтение файлов проваливается, вы начинаете менять system prompt или описание инструмента read_file до победного конца. То есть каждый тест создаёт давление на всю систему. Теперь представьте бездумно накидали сотню eval'ов — и система подстраивается под все их сразу, разрываясь в разные стороны.

Deep Agents разделяют eval'ы по трём источникам данных. Первый — dogfooding, то есть использование агента командой каждый день. Каждый баг превращается в новый тест. Второй — внешние бенчмарки, адаптированные под ваши задачи. Третий — artisanal eval'ы, hand-written тесты для наблюдения за конкретным поведением в изоляции. Но важнее всего таксономия: eval'ы категоризируют не по происхождению, а по тому, что именно они тестируют — retrieval, tool_use, file_operations и так далее.

Метрики идут в два этапа. Сначала — корректность. Если модель не решает задачу, остальное неважно. Для проверки используют custom assertions, точное сравнение с ground truth и LLM-as-a-judge для семантически верных ответов. Когда корректность достигнута, в дело вступает эффективность. Две модели могут обе решить задачу, но одна сделает это за четыре шага и восемь секунд, а другая за шесть шагов и четырнадцать секунд. Второй вариант тратит больше денег, создаёт больше точек отказа и просто хуже для продакшена.

Здесь появляется концепция ideal trajectory — эталонной последовательности шагов, которая даёт правильный результат без лишних действий. Имея такой ориентир, можно сравнивать модели не только по способности решить задачу, но и по качеству исполнения.

Практически всё завязано на pytest и GitHub Actions: чистое окружение для каждого прогона, возможность запускать подмножество тестов по тегам, trace'ы в общий доступ. Любой инженер может посмотреть провал, внести правку и переоценить, нужен ли этот eval вообще.

Почему это важно для индустрии? Потому что сейчас многие гоняются за высокими цифрами в eval suites, не понимая, что сотня бессмысленных тестов создаёт иллюзию прогресса. Deep Agents показывает, что eval-система — это не про количество, а про точность и ответственность. Каждый тест должен быть оправдан и измерять поведение, которое действительно критично для продакшена. Иначе вы просто оптимизируетесь под свою же систему оценки, а не под реальные задачи.

Источник: https://x.com/Vtrivedy10/status/2037203679997018362

#AI #llm #mlops

X (formerly Twitter)

Viv (@Vtrivedy10) on X

How we build evals for Deep Agents

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

The_Reckoning_Is_Already_Here.html

84.4 KB

🔗 The Reckoning Is Already Here

📖 tgf

📌 The Reckoning Is Already Here: саммари

✏ Введение

Автор статьи, Джо Рейс, изначально опубликовал сатирическую статью "2028 — The Great Data Reckoning" о том, как индустрия данных якобы "развалится" в 2028 году.
Однако, перечитав её позже, он осознал: это уже не сатира.
Трансформация происходит прямо сейчас.
Как метко заметил Уильям Гибсон, «будущее уже здесь — просто оно распределено неравномерно».
Великий расчёт в индустрии данных уже наступил.

————————

✏ Модели перешли критический порог

[Полное описание в прикрепленном файле]

#AI #dataengineering #бизнес

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

Agentic_Engineering_Patterns.html

989.8 KB

🔗 Agentic Engineering Patterns

📖 tgf

📌 Agentic Engineering Patterns: новый подход к программированию с ИИ-агентами

✏ Введение

Саймон Уиллисон объявил о запуске нового проекта Agentic Engineering Patterns — структурированного руководства по паттернам и практикам работы с программирующими агентами (Claude Code, OpenAI Codex и подобными инструментами).
Это ответ на фундаментальный сдвиг в индустрии: стоимость написания кода упала практически до нуля, и профессиональным разработчикам необходимо адаптировать свои инженерные привычки к новым условиям.
Проект вдохновлён форматом книги «Design Patterns» 1994 года и публикуется как серия глав на сайте Уиллисона.

————————

✏ 1.
Что такое Agentic Engineering и почему это важно

[Полное описание в прикрепленном файле]

#AI #программирование #llm

1 view15:49

About

Blog

Apps

Platform