ChatGPTevelopment & Promptgramming
23 subscribers
204 photos
38 videos
50 files
393 links
#ChatGPT using development & Prompt based programming – new era of coding! 🥹
#ChatGPT #GPT4dev
Download Telegram
Forwarded from Data&AI Insights
I_tried_to_prove_I m_not_AI._My_aunt_wasn t_convinced.html
109.7 KB
🔗 I tried to prove I'm not AI. My aunt wasn't convinced

📖 tgf

📌 Как доказать, что ты не ИИ: эксперимент журналиста BBC

Введение

Искусственный интеллект стал настолько убедительным, что доказать свою реальность становится практически невозможно.
Журналист BBC Томас Жермен провёл эксперимент: попросил свою тётю отличить его от дипфейка — и она не смогла.
Даже премьер-министр Израиля Биньямин Нетаньяху публично доказывал, что он жив, но это не убедило значительную часть интернета.
Эксперты предупреждают: наступила эпоха, когда доказать свою подлинность будет всё сложнее.

————————

Эксперимент с тётей Элеанор

[Полное описание в прикрепленном файле]

#AI #новости #общество
Forwarded from Data&AI Insights
Vibe engineering: почему хаос AI-кодинга уступает место дисциплине

В мире разработки software происходит тихая, но важная трансформация. Термин "vibe coding", который придумал исследователь AI Андрей Карпати в начале 2025 года, быстро стал популярным — это практика, когда разработчик описывает желаемую функциональность на естественном языке, а AI генерирует код, который принимается без тщательной проверки. К 2026 году 92% американских разработчиков используют AI-инструменты ежедневно, и почти половина нового кода в мире создаётся ими. Цифры впечатляют, но есть проблема.

Исследования показывают, что 45% AI-сгенерированного кода содержит уязвимости безопасности. Код работает, но часто остаётся хрупким, нетестируемым и неподдерживаемым. Доверие к AI-генерированному коду упало с 77% до 60% именно из-за проблем с качеством. Здесь на сцену выходит концепция, которую продвигает Саймон Уиллисон — vibe engineering.

Это не просто модное слово. Vibe engineering — это противоположность беспечному подходу. Это дисциплинированный, production-aware подход к AI-ассистированной разработке, где инженер сохраняет полную ответственность за результат. Работа с AI-агентами здесь строится на чётких workflow: есть документация, есть тесты, есть code review, есть security guardrails. Вместо хаотичных промтов — структурированные процессы.

Что меняется на практике? Во-первых, появляется понимание, что AI — это не замена инженеру, а усилитель его навыков. Чем больше экспертизы у разработчика, тем лучше результат от работы с LLMs. Во-вторых, резко возрастает ценность навыков, которые раньше казались рутинными: умение писать тесты, документировать код, планировать архитектуру. Без надёжного тестового покрытия агент может заявить о работоспособности, не проверив её, и сломать что-то незаметное.

Отдельного внимания заслуживает параллельный запуск нескольких AI-агентов. Опытные инженеры всё чаще запускают несколько копий агента одновременно, решая несколько задач параллельно. Это звучит как фантастика, но это уже реальность — и это требует нового уровня менеджмента, похожего на управление живыми коллабораторами.

Для компаний переход от vibe coding к vibe engineering — это вопрос конкурентоспособности. Организации, которые останутся в режиме "быстро сгенерировали, запустили, посмотрим", рискуют накопить критический технический долг и уязвимости. Те, кто инвестирует в дисциплину, получат и скорость, и качество. Vibe engineering — это не тренд и не временное явление. Это эволюция профессии, которая диктует новые правила игры для каждого, кто хочет писать software в эпоху AI.

Источник: https://simonw.substack.com/p/vibe-engineering

#AI #программирование #llm
Forwarded from Data&AI Insights
The_Next_Frontier_of_Artificial_Intelligence_Why_AI_Memory_Syst.html
177.2 KB
🔗 The Next Frontier of Artificial Intelligence: Why AI Memory Systems Will Define the Next Generation | HackerNoon

📖 tgf

📌 Системы памяти ИИ: следующий рубеж искусственного интеллекта

Введение

За последнее десятилетие искусственный интеллект достиг впечатляющих результатов: большие языковые модели генерируют текст, неотличимый от человеческого, системы компьютерного зрения распознают объекты с высокой точностью, а предиктивные алгоритмы прогнозируют сложные паттерны в различных отраслях.
Однако, несмотря на эти достижения, большинство систем ИИ страдают от фундаментального ограничения — они не обладают памятью.

[Полное описание в прикрепленном файле]

#AI #машинноеобучение #технологии
Forwarded from Data&AI Insights
Exclusive_Anthropic_is_testing_Mythos_its_most_powerful_AI_m.html
299.9 KB
🔗 Exclusive: Anthropic is testing 'Mythos' its 'most powerful AI model ever developed' | Fortune

📖 tgf

📌 Anthropic тестирует «Mythos» — самую мощную модель в истории компании

Утечка данных раскрыла секретную разработку

26 марта 2026 года издание Fortune сообщило об утечке данных из компании Anthropic, в результате которой стала известна информация о новейшей модели искусственного интеллекта.
Черновик блог-поста, обнаруженный в публично доступном хранилище данных, содержал детали о разработке под кодовыми названиями Claude Mythos и Capybara.
Представитель Anthropic подтвердил изданию, что компания действительно разрабатывает и тестирует «новую модель AI более высокой производительности, чем любая из ранее выпущенных».

[Полное описание в прикрепленном файле]

#AI #новости #технологии
Forwarded from Data&AI Insights
Smolagents — когда создавать AI-агента можно за 15 минут без боли

Задумывались, почему большинство AI-агентов остаются игрушками для энтузиастов, а не рабочими инструментами? Проблема не в самих больших языковых моделях. Проблема в том, как мы их обвязываем.

Классические фреймворки вроде LangChain превратили создание агентов в многослойный квест с километрами абстракций, конфигов и boilerplate-кода. Прежде чем агент сделает что-то полезное, вы уже устали бороться с фреймворком. Сломался вызов — ищи ошибку в трёх уровнях абстракции. Хочешь понять, что агент на самом деле делает — удачи.

Hugging Face выпустили в конце 2024 года библиотеку smolagents, и она переворачивает эту парадигму с ног на голову. Весь фреймворк — меньше тысячи строк кода. Никаких сложных пайплайнов. Агенты здесь — code agents, то есть они пишут настоящий Python-код для решения задач, а не генерируют JSON-инструкции, которые потом непонятно как интерпретировать.

Почему это принципиально важно? Потому что код — это естественный язык для выражения сложной логики. Циклы, условия, манипуляции с данными — всё это записывается в Python естественно и читаемо. Агент получает задачу вроде «узнай погоду в Париже и Токио, сохрани результат в файл» и просто пишет код, который это делает. Вы можете этот код увидеть, отладить, понять, что пошло не так.

При этом библиотека не требовательна к инфраструктуре. Ставится через pip, работает с широким спектром моделей — OpenAI, Hugging Face Hub, Anthropic, локальные модели. Для прототипирования и обучения это идеальный формат. Студент с базовым Python может за вечер собрать работающего агента и понять, как агенты устроены изнутри.

Конечно, для enterprise-пайплайнов с тысячами одновременных запросов и сложными графами инструментов это пока не замена LangChain или LangGraph. Но для прототипирования, исследовательских проектов и образовательных целей smolagents делает входной порог минимальным. Больше не нужно неделю разбираться в фреймворке, чтобы агент сделал первый осмысленный запрос к API.

Это и есть настоящая демократизация AI-агентов. Не когда кто-то большой выпускает enterprise-решение за миллионы, а когда студент вечером может собрать агента, который реально работает, и понять принцип работы.

А самое главное, что это решение легко расширяется до enterprise за счёт продуманной архитектуры.
На текущий момент это наверное самый простой и одновременно самый мощный агентский фреймворк. Если кто-то ещё не пробовал, настоятельно рекомендую попробовать!

Источник: https://www.kdnuggets.com/getting-started-with-smolagents-build-your-first-code-agent-in-15-minutes

#AI #python #llm
Forwarded from Data&AI Insights
The_Gentle_Singularity.html
87.3 KB
🔗 The Gentle Singularity

📖 tgf

📌 Мягкая сингулярность

Введение

Человечество уже перешло «горизонт событий» — технологический взлёт начался.
Мы находимся на пороге создания цифрового сверхинтеллекта, и пока этот процесс протекает гораздо менее странно, чем можно было бы ожидать.
Хотя роботы ещё не ходят по улицам, а люди по-прежнему умирают от болезней, мы уже создали системы, превосходящие человека по многим параметрам и способные значительно усиливать продуктивность людей.
Саммари статьи Сэма Альтмана (CEO OpenAI) о том, чего ждать от развития искусственного интеллекта в ближайшее десятилетие.

————————

Текущее состояние и ближайшие горизонты

[Полное описание в прикрепленном файле]

#AI #общество #технологии
Forwarded from Data&AI Insights
Against_ Brain_Damage.html
3.5 MB
🔗 Against "Brain Damage"

📖 tgf

📌 Против «повреждения мозга»: как использовать ИИ для улучшения, а не ухудшения мышления

Введение

Вопрос «повреждает ли ИИ ваш мозг?» становится всё более распространённым.
Этот вопрос сам по себе показателен — он отражает глубокий страх перед тем, что искусственный интеллект может сделать с нашей способностью думать.
Однако ИИ не вызывает буквального повреждения мозга.
Настоящая угроза заключается в том, как мы используем технологию: при неправильном подходе она действительно может атрофировать наши мыслительные способности, но при грамотном применении — значительно их усилить.

————————

1.
Откуда взялся миф о «повреждении мозга»

[Полное описание в прикрепленном файле]

#AI #образование #саморазвитие
Forwarded from Data&AI Insights
Prompt_caching _10x_cheaper_LLM_tokens,_but_how.html
87.9 KB
🔗 Prompt caching: 10x cheaper LLM tokens, but how?

📖 tgf

📌 Prompt Caching: как это работает и почему токены становятся дешевле в 10 раз

Введение

Кэширование промптов — это технология, позволяющая снизить стоимость входных токенов в 10 раз для API OpenAI и Anthropic.
При этом задержка сокращается до 85%.
Но как именно это работает?
Статья раскрывает внутреннее устройство LLMs и объясняет, какие именно данные сохраняются между запросами.

————————

Архитектура LLM: от текста к числам

[Полное описание в прикрепленном файле]

#llm #transformers
Forwarded from Data&AI Insights
Context_Anchoring.html
86.9 KB
🔗 Context Anchoring

📖 tgf

📌 Context Anchoring: как сохранить контекст при работе с AI-ассистентами

Введение

При работе с AI-инструментами для программирования (Claude, Cursor, Copilot) контекст разговора постепенно разрушается.
Исследование Stanford и Berkeley 2023 года под названием «Lost in the Middle» демонстрирует, что языковые модели значительно хуже обрабатывают информацию, размещённую в середине длинного контекста, по сравнению с началом или концом.
Автор предлагает решение: фиксировать решения во внешних документах — практику, которую называет context anchoring (заякоривание контекста).

————————

Проблема: разрушение контекста

[Полное описание в прикрепленном файле]

#AI #программирование #технологии
Forwarded from Data&AI Insights
Модель обманывает разработчиков.
Куда катится мир...
Forwarded from Data&AI Insights
Семантическая модель — это не роскошь, а фундамент аналитики, которую нельзя игнорировать

Давай честно. Если ты всё ещё объясняешь аналитику через «вот эта колонка, вот тот join, поверьте на слово» — ты не аналитикой занимаешься, а поддержанием хаоса. И ситуация будет только ухудшаться.

Посмотри, что происходит в типичной команде. Берём DDL с комментариями, пару примеров SQL, неформальные соглашения в Notion — и вуаля, у нас есть «система». На демо всё красиво. А потом приходит квартальный отчёт, и выясняется, что маркетинг считает «активного пользователя» иначе, чем продукт. Два разных числа, обе стороны уверены в своей правоте. Кто виноват? Никто. Просто никто не договорился явно.

Это не анекдот. Это паттерн. Без семантической модели определения «плывут». Причём молча. Система, выбирающая неправильный путь джойна между таблицами, будет уверенно возвращать неправильный результат. Бизнес-вопросы вроде NRR или customer health score не ложатся на одну колонку — и каждый новый человек заново изобретает логику. А если у тебя Tableau, Power BI и LLM-ассистент работают с одной схемой, каждый делает это по-своему. В итоге бизнес-логика размножается, как вирус.

Семантическая модель решает это радикально. Метрики становятся объектами с однозначной формулой. Отношения между таблицами объявляются явно. Агрегации встроены в определения — система всегда знает, как считать. И главное — это единый источник истины, доступный и BI-инструментам, и AI-агентам. Один и тот же ответ для всех потребителей.

Измеримый эффект? Компании сокращают время на сверку данных на 40%. Цикл создания отчётов падает с полугода до пяти недель. 80% запросов выполняются быстрее секунды. Это не теория — это практика.

Но вот что действительно меняет правила игры сейчас. AI. Большие языковые модели не умеют применять человеческое суждение к противоречивым определениям. Им нужен единый семантический фундамент, чтобы рассуждать о данных корректно. Без него ты получишь умно звучащий, но произвольный бред. С ним — надёжного ассистента, который действительно понимает твой бизнес.

Стандарт Open Semantic Interchange уже позволяет определять метрику один раз и использовать её в Tableau, Power BI, Sigma без дублирования. Cortex Analyst в Databricks маршрутизирует вопросы на естественном языке к нужным семантическим представлениям и генерирует корректный SQL. BI и AI конвергируют на общем слое.

Раньше построение семантической модели означало недели интервью и ручного YAML. Теперь есть Autopilot, который генерирует представления из существующих запросов и дашбордов. Барьер входа упал. Стоимость — теперь не аргумент против.

Начни с одного домена. Revenue или product usage. Малый набор критичных метрик. Подключи Autopilot к паттернам, которые уже работают. Сертифицируй определения. И получи регрессионный контроль впридачу.

Без семантической модели твоя аналитика — это коллекция хрупких договорённостей, которые разъедутся при первом серьёзном масштабировании. С ней — управляемая система, которая работает и для людей, и для AI. Выбор очевиден.

Источник: https://www.snowflake.com/en/engineering-blog/why-you-need-a-semantic-model/

#datamodeling #analytics #AI
Forwarded from Data&AI Insights
The_New_Experience_of_Coding_with_AI.html
87.7 KB
🔗 The New Experience of Coding with AI

📖 tgf

📌 Новый опыт программирования с ИИ

Введение

Автор статьи, Стефани Кирмер, пересматривает своё понимание влияния LLM-инструментов на программную инженерию.
В июле 2024 года она написала статью о том, как LLM-инструменты могут повлиять на профессию, однако тогда она не учла качественный скачок в развитии Claude Code, который произошёл в мае 2025 года.
Теперь, оценивая текущее состояние технологии, Кирмер исследует, как ИИ-ассистенты для написания кода меняют саму природу работы программиста — и что это означает для будущего профессии.

————————

1.
Функциональность ИИ-ассистентов

Современные инструменты, такие как GitHub Copilot, Claude Code, Cursor и Replit, обладают рядом ключевых возможностей:

[Полное описание в прикрепленном файле]

#AI #программирование #llm
Forwarded from Data&AI Insights
The_Basics_of_Vibe_Engineering.html
92.2 KB
🔗 The Basics of Vibe Engineering

📖 tgf

📌 Основы Vibe Engineering: как AI меняет разработку ПО

Введение

Мир разработки программного обеспечения переживает фундаментальную трансформацию.
Топовые инженеры всё чаще используют AI для написания кода, и это вызывает ожесточённые споры в сообществе.
Противники нового подхода считают, что передача проекта системе, которая не способна создавать надёжное ПО, — это outsourcing, ведущий к катастрофе.
Однако автор статьи утверждает: инженерная работа не исчезла — она перешла на другой уровень.
Теперь это не столько написание кода вручную, сколько планирование, архитектура и системное мышление.
Разберёмся, как именно изменился процесс разработки, какие инструменты лидируют и какие риски остаются актуальными.

————————

[Полное описание в прикрепленном файле]

#AI #программирование #технологии
Forwarded from Data&AI Insights
Vibe_Coding_with_AI_Best_Practices_for_Human_AI_Collaboration_i.html
88.6 KB
🔗 Vibe Coding with AI: Best Practices for Human-AI Collaboration in Software Development

📖 tgf

📌 Vibe Coding с ИИ: лучшие практики человеко-машинного взаимодействия в разработке ПО

[Полное описание в прикрепленном файле]

#AI #программирование #машинноеобучение
Forwarded from Data&AI Insights
Thoughts_on_slowing_the_fuck_down.html
89.5 KB
🔗 Thoughts on slowing the fuck down

📖 tgf

📌 Саммари: мысли о замедлении

Введение

Примерно год назад на сцену вышли AI-агенты для программирования, способные создавать полноценные проекты.
Это привело к массовому всплеску: разработчики стали строить все проекты, о которых давно мечтали, но не имели времени.
Однако последствия этого «прогресса» оказались удручающими: качество софта катастрофически ухудшилось, а разработчики потеряли контроль над собственным кодом.
Автор призывает замедлиться и вернуть дисциплину в работу с AI-инструментами.

————————

Феномен сломанного софта

[Полное описание в прикрепленном файле]

#AI #программирование #технологии
Forwarded from Data&AI Insights
What_is_DeerFlow_2_0_and_what_should_enterprises_know_about_this.html
92.6 KB
🔗 What is DeerFlow 2.0 and what should enterprises know about this new, powerful local AI agent orchestrator?

📖 tgf

ByteDance — китайский технологический гигант, владеющий TikTok — в конце февраля 2025 года представил DeerFlow 2.0: один из наиболее амбициозных open-source фреймворков для оркестрации AI-агентов на сегодняшний день. Это так называемый «SuperAgent harness», который координирует несколько AI-под агентов для автономного выполнения сложных многочасовых задач. Фреймворк распространяется под лицензией MIT, что позволяет использовать, модифицировать и коммерчески применять его бесплатно. Однако для корпоративного внедрения необходимо учитывать как технические требования, так и юрисд

[Полное описание в прикрепленном файле]

#AI #машинноеобучение #docker
Forwarded from Data&AI Insights
Почему тысяча тестов не делает агента умнее

Главный вывод из методики Deep Agents, которую раскрыл Vivek Trivedy, звучит контр-интуитивно: добавлять eval'ы нужно скупо и осмысленно. Каждый eval — это вектор, который смещает поведение агентной системы. Если eval на чтение файлов проваливается, вы начинаете менять system prompt или описание инструмента read_file до победного конца. То есть каждый тест создаёт давление на всю систему. Теперь представьте бездумно накидали сотню eval'ов — и система подстраивается под все их сразу, разрываясь в разные стороны.

Deep Agents разделяют eval'ы по трём источникам данных. Первый — dogfooding, то есть использование агента командой каждый день. Каждый баг превращается в новый тест. Второй — внешние бенчмарки, адаптированные под ваши задачи. Третий — artisanal eval'ы, hand-written тесты для наблюдения за конкретным поведением в изоляции. Но важнее всего таксономия: eval'ы категоризируют не по происхождению, а по тому, что именно они тестируют — retrieval, tool_use, file_operations и так далее.

Метрики идут в два этапа. Сначала — корректность. Если модель не решает задачу, остальное неважно. Для проверки используют custom assertions, точное сравнение с ground truth и LLM-as-a-judge для семантически верных ответов. Когда корректность достигнута, в дело вступает эффективность. Две модели могут обе решить задачу, но одна сделает это за четыре шага и восемь секунд, а другая за шесть шагов и четырнадцать секунд. Второй вариант тратит больше денег, создаёт больше точек отказа и просто хуже для продакшена.

Здесь появляется концепция ideal trajectory — эталонной последовательности шагов, которая даёт правильный результат без лишних действий. Имея такой ориентир, можно сравнивать модели не только по способности решить задачу, но и по качеству исполнения.

Практически всё завязано на pytest и GitHub Actions: чистое окружение для каждого прогона, возможность запускать подмножество тестов по тегам, trace'ы в общий доступ. Любой инженер может посмотреть провал, внести правку и переоценить, нужен ли этот eval вообще.

Почему это важно для индустрии? Потому что сейчас многие гоняются за высокими цифрами в eval suites, не понимая, что сотня бессмысленных тестов создаёт иллюзию прогресса. Deep Agents показывает, что eval-система — это не про количество, а про точность и ответственность. Каждый тест должен быть оправдан и измерять поведение, которое действительно критично для продакшена. Иначе вы просто оптимизируетесь под свою же систему оценки, а не под реальные задачи.

Источник: https://x.com/Vtrivedy10/status/2037203679997018362

#AI #llm #mlops
Forwarded from Data&AI Insights
The_Reckoning_Is_Already_Here.html
84.4 KB
🔗 The Reckoning Is Already Here

📖 tgf

📌 The Reckoning Is Already Here: саммари

Введение

Автор статьи, Джо Рейс, изначально опубликовал сатирическую статью "2028 — The Great Data Reckoning" о том, как индустрия данных якобы "развалится" в 2028 году.
Однако, перечитав её позже, он осознал: это уже не сатира.
Трансформация происходит прямо сейчас.
Как метко заметил Уильям Гибсон, «будущее уже здесь — просто оно распределено неравномерно».
Великий расчёт в индустрии данных уже наступил.

————————

Модели перешли критический порог

[Полное описание в прикрепленном файле]

#AI #dataengineering #бизнес
Forwarded from Data&AI Insights
Agentic_Engineering_Patterns.html
989.8 KB
🔗 Agentic Engineering Patterns

📖 tgf

📌 Agentic Engineering Patterns: новый подход к программированию с ИИ-агентами

Введение

Саймон Уиллисон объявил о запуске нового проекта Agentic Engineering Patterns — структурированного руководства по паттернам и практикам работы с программирующими агентами (Claude Code, OpenAI Codex и подобными инструментами).
Это ответ на фундаментальный сдвиг в индустрии: стоимость написания кода упала практически до нуля, и профессиональным разработчикам необходимо адаптировать свои инженерные привычки к новым условиям.
Проект вдохновлён форматом книги «Design Patterns» 1994 года и публикуется как серия глав на сайте Уиллисона.

————————

1.
Что такое Agentic Engineering и почему это важно

[Полное описание в прикрепленном файле]

#AI #программирование #llm