ChatGPTevelopment & Promptgramming – Telegram

ChatGPTevelopment & Promptgramming

@ChatGPTevelopment

23 subscribers

204 photos

38 videos

50 files

393 links

#ChatGPT using development & Prompt based programming – new era of coding! 🥹
#ChatGPT #GPT4dev

Download Telegram

About

Blog

Apps

Platform

ChatGPTevelopment & Promptgramming

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

2603.01213.html

🔗 2603.01213

📖 tgf

📌 Способны ли LLM-агенты достигать консенсуса?
Исследование Byzantine-согласия

✏ Введение

Крупные языковые модели всё чаще используются как автономные агенты, которые должны совместно принимать решения.
Однако исследователи из ETH Zurich обнаружили, что надёжное достижение консенсуса не является устойчивой способностью современных LLM-агентов — даже в благоприятных условиях без вредоносных участников.
Эксперименты показывают, что группы агентов на базе Qwen3 часто не могут договориться о едином значении, а добавление даже одного Byzantine-агента (намеренно нарушающего протокол) резко снижает вероятность успеха.

————————

✏ Экспериментальная установка

[Полное описание в прикрепленном файле]

#AI #llm #исследования

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

How_Claude_Code_is_built.html

🔗 How Claude Code is built

📖 tgf

📌 Как устроен Claude Code: архитектура, процессы и философия разработки

Claude Code стал одним из самых быстрорастущих инструментов для разработчиков в 2024 году.
С момента общего релиза в мае инструмент генерирует более 500 млн долларов годового регулярного дохода, а использование выросло более чем в 10 раз за три месяца.
Автор статьи побеседовал с создателями Claude Code — инженерами Борисом Черным (автор оригинального прототипа) и Сидом Бидасарией (второй инженер проекта), а также продюсером Кэт У.
Из интервью стало ясно, как работает «AI-first» команда разработки и какие уроки из этого могут извлечь другие инженерные организации.

————————

✏ 1.
История создания: от музыки к файловой системе

[Полное описание в прикрепленном файле]

#AI #программирование #продукт

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

Top_AI_Skills_in_Demand_for_2026_and_How_to_Build_Them.html

🔗 Top AI Skills in Demand for 2026 and How to Build Them

📖 tgf

📌 Саммари: Востребованные навыки AI в 2026 году

✏ Введение

К 2026 году разговор в индустрии кардинально изменился: больше не достаточно просто «понимать AI на высоком уровне».
Компании ищут профессионалов, которые могут применять навыки AI для решения реальных бизнес-задач, работать совместно с интеллектуальными системами и принимать решения быстрее, качественнее и с большей уверенностью.
Это фундаментальный сдвиг — от теоретических знаний к практическому использованию.
Тот, кто умеет работать с AI-системами, а не конкурировать с ними, станет наиболее ценным специалистом на рынке труда.

————————

✏ Рынок труда AI в 2026: что действительно меняется

[Полное описание в прикрепленном файле]

#AI #бизнес #образование

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

Лекун ставит $1 млрд на «мировые модели» — альтернативу LLM

Янн Лекун привлёк рекордные $1 млрд для своего нового стартапа AMI, делая ставку на принципиально иной подход к сильному ИИ. В отличие от текущего тренда на масштабирование больших языковых моделей, AMI будет развивать «мировые модели» — системы, которые понимают физическую реальность, причинно-следственные связи и способны рассуждать, а не просто предсказывать следующее слово в тексте.

Это крупнейшееseed-финансирование в истории европейских AI-стартапов при оценке $3,5 млрд привлекло Nvidia, Temasek и Bezos Expeditions. Лекун открыто называет веру в LLM «полной чушью» и утверждает, что человеческий интеллект в основе своей опирается на физический мир, а не на язык.

Параллель интересна: пока весь мир гоняется за очередными версиями ChatGPT, один из главных AI-учёных современности уходит в радикально другую нишу — промышленные применения, робототехника, биомедицина. Успех AMI

Источник: https://www.wired.com/story/yann-lecun-raises-dollar1-billion-to-build-ai-that-understands-the-physical-world/

#AI #машинноеобучение #новости

Yann LeCun Raises $1 Billion to Build AI That Understands the Physical World

Meta’s former chief AI scientist has long argued that human-level AI will come from mastering the physical world, not language. His new startup, AMI, aims to prove it.

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

Локальный голосовой AI для Mac — новый уровень приватности

RCLI демонстрирует, что on-device AI уже готов к массовому использованию. Полный голосовой конвейер STT+LLM+TTS работает локально на Apple Silicon без облака, с задержкой менее 200 мс и производительностью до 550 токенов в секунду. 43 системных действия, RAG для документов, полная конфиденциальность — всё это доступно из коробки.

Это не просто ещё один голосовой ассистент. RCLI показывает, что локальный AI может быть быстрее и приватнее облачных решений, при этом оставаясь полнофункциональным. Тренд на перенос AI на устройство набирает обороты, и Apple Silicon с MetalRT становится одной из лучших платформ для таких решений.

Для рынка это сигнал: пользователи и бизнес устали от зависимости от облачных API и хотят контролировать свои данные. RCLI — один из первых продуктов, который делает это практично и удобно.

Источник: https://github.com/RunanywhereAI/rcli

GitHub - RunanywhereAI/RCLI: Talk to your Mac, query your docs, no cloud required. On-device voice AI + RAG

Talk to your Mac, query your docs, no cloud required. On-device voice AI + RAG - RunanywhereAI/RCLI

2 views15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

Почему вашим AI-агентам нужен не просто доступ к данным, а полноценный контекст

ИИ-агенты обещают революцию в аналитике — они могут сами планировать, рассуждать и действовать от имени компании. Но есть одна фундаментальная проблема: без правильного контекста эти агенты бесполезны. Они не могут ответить даже на элементарные бизнес-вопросы вроде «какой был рост выручки в прошлом квартале?», потому что не понимают, как компания определяет выручку, какие источники данных правильные и почему.

Изначально казалось, что проблема в недостаточных способностях языковых моделей к генерации SQL. Но оказалось всё сложнее. Агент сталкивается с десятками подводных камней: какую именно метрику считать — ARR или run rate, какой квартал использовать — фискальный или календарный, какую таблицу брать — fct_revenue от финансовой команды или mv_revenue_monthly от команды данных. Семантический слой, который работает для BI-дашбордов, здесь не поможет — он слишком узкий и часто устаревший.

Решение — контекстный слой, который объединяет канонические сущности, бизнес-правила, неявные знания команд и политики управления данными. Это не просто ещё один слой в стеке, а фундамент для работы агентов. Построение такого слоя требует пяти шагов: обеспечить доступ ко всем данным, автоматически собрать начальный контекст, добавить человеческую экспертизу для критических связей, подключить агентов через API и настроить самообновляющиеся потоки.

Рынок уже реагирует. Платформы вроде Databricks и Snowflake развивают аналитические AI-продукты, новые компании фокусируются на построении контекста, а крупные игроки вроде Palantir давно делают на этом бизнес. Gartner прогнозирует, что к 2026 году 40% корпоративных приложений будут содержать специализированных AI-агентов.

Вывод прост: без контекста ваши данные агенты — это дорогие игрушки, которые не могут решить реальные задачи. Контекст — это то, что превращает сырые данные в работающий интеллект.

Источник: https://a16z.com/your-data-agents-need-context/

#AI #analytics #llm

Andreessen Horowitz

Your Data Agents Need Context | Andreessen Horowitz

Enterprise AI data agents are failing without a robust context layer, driving demand for modern data ontologies that unify business definitions, messy data systems, and tribal knowledge to power accurate, autonomous analytics.

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

What_Claude_Code_Actually_Chooses.html

🔗 What Claude Code Actually Chooses

📖 tgf

📌 Что на самом деле выбирает Claude Code

✏ Введение

Claude Code становится новым «шлюзом» в мире разработки.
Когда разработчик говорит агенту «добавь базу данных» и позволяет Claude Code всё сделать самому, тот не просто предлагает варианты — он устанавливает пакеты, пишет импорты, настраивает подключения и коммитит код.
Выбранный инструмент становится инструментом, который попадает в продакшен.
По мере того как всё больше разработчиков доверяют Claude Code выбор инструментов, стеки, которые он выбирает, становятся стандартными стеками.

[Полное описание в прикрепленном файле]

#AI #программирование #исследования

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

Using_skills_to_accelerate_OSS_maintenance.html

🔗 Using skills to accelerate OSS maintenance

📖 tgf

📌 Как OpenAI использует Codex для ускорения поддержки Open-Source проектов

✏ Введение

OpenAI применяет инструмент Codex для автоматизации рутинных инженерных задач в репозиториях Agents SDK.
Комбинация из локальных навыков (skills), файла AGENTS.md и GitHub Actions позволяет превратить повторяющиеся операции — верификацию кода, подготовку релизов, тестирование примеров и проверку PR — в воспроизводимые рабочие процессы.
За три месяца количество смерженных PR выросло с 316 до 457 — прирост составил 45%.

Ключевые метрики (по состоянию на март 2026):

[Полное описание в прикрепленном файле]

#AI #программирование #DevOps

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

The_Phenomenology_of_the_Senior.html

🔗 The Phenomenology of the Senior

📖 tgf

📌 Феноменология старшего: как ИИ разрушает путь к экспертизе

✏ Введение

Искусственный интеллект не заменяет senior-специалистов — он заменяет задачи, которые раньше делали людей старшими.
Это парадоксальное явление, которое остается незамеченным в стандартных дискуссиях об автоматизации, несет в себе системную угрозу: если никто не выполняет junior-задачи, никто не развивает senior-мышление.
Образовательный ответ — обучение работе с конкретными инструментами ИИ — усугубляет проблему, поскольку готовит операторов инструментов вместо системных мыслителей.

————————

✏ Падение найма молодых специалистов

[Полное описание в прикрепленном файле]

#AI #образование #общество

2 views15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

From_IDEs_to_AI_Agents_with_Steve_Yegge.html

🔗 From IDEs to AI Agents with Steve Yegge

📖 tgf

📌 От IDE к AI-агентам: разговор со Стивом Йегге о будущем программирования

Стив Йегге — один из наиболее влиятельных голосов в мире разработки программного обеспечения.
За десятилетия работы в Amazon и Google, а также благодаря своим знаменитым блог-постам он неоднократно предсказывал ключевые сдвиги в индустрии.
В этом выпуске подкаста Pragmatic Engineer обсуждается, как искусственный интеллект трансформирует инженерную работу, почему ручное кодирование может постепенно уйти в прошлое и на что разработчикам стоит обратить внимание уже сейчас.

————————

✏ Модель «прототип как продукт» вытесняет традиционную разработку

[Полное описание в прикрепленном файле]

#AI #программирование #технологии

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

How_Human_Work_Will_Remain_Valuable_in_an_AI_World.html

🔗 How Human Work Will Remain Valuable in an AI World

📖 tgf

Вопрос, который сегодня доминирует в дискуссиях об искусственном интеллекте: заменит ли ИИ всех нас? Исчезнут ли рабочие места в ближайшие 18 месяцев? Неизбежен ли крах рынка труда? Одни говорят об этом с тревогой, другие — с энтузиазмом. Но почти никто не останавливается, чтобы посмотреть на реальные данные. Эта статья — не слепая защита технологического оптимизма и не отвержение пессимизма. Это попытка прочитать реальность такой, какая она есть: с её трениями, ограничениями и возможностями. Как говорил Фридрих Хайек: «Никто не может быть великим экономистом, если он только экономист, и я даже склонен добавить, что экономист, который является только экономистом, скорее всего, станет помехой, если не прямой угрозой». То же самое применимо сегодня к любому, кт

[Полное описание в прикрепленном файле]

#AI #бизнес #общество

2 views15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

1M_context_is_now_generally_available_for_Opus_4_6_and_Sonnet_4.html

🔗 1M context is now generally available for Opus 4.6 and Sonnet 4.6

📖 tgf

📌 Anthropic выпускает контекстное окно на 1 млн токенов для Claude Opus 4.6 и Sonnet 4.6

✏ Введение

Anthropic объявила о общедоступности (General Availability) полного контекстного окна на 1 миллион токенов для моделей Claude Opus 4.6 и Sonnet 4.6.
Это крупнейшее на сегодняшний день контекстное окно среди ведущих языковых моделей, доступное по стандартным ценам без каких-либо наценок за длинный контекст.
Нововведение уже доступно на платформе Claude Platform, а также через облачные сервисы Microsoft Azure Foundry, Google Cloud Vertex AI и Amazon Bedrock.

————————

✏ Ценообразование и доступность

📚 Стандартные цены без наценки за длинный контекст

[Полное описание в прикрепленном файле]

#AI #llm #новости

2 views15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

Главное узкое место в AI — это не сами модели, а инфраструктура

Когда мы говорим про проваленные AI-проекты, то обычно виним алгоритмы, данные или отсутствие талантов. Но исследование DDN за 2026 год показывает удивительную картину: 65% организаций называют свои AI-среды слишком сложными, а 98% признают критический пробел в компетенциях именно по инфраструктуре. Цифры впечатляют, но реальность еще жестче.

Вот типичная история из практики. Автор одного кейса описывает конвейер данных, который питает дашборды для руководства. Он ломался больше шести раз в месяц. Не катастрофически — просто цифры выручки на совещаниях неожиданно расходились. Причина была не в модели машинного обучения и не в качестве данных. Проблема крылась в архитектуре: таблицы Google Sheets, хрупкие интеграции с HubSpot, синхронизация, которая не выдерживала масштабирования.

Это не редкость. Исследование DataBank выявило, что интеграция, масштабирование и развертывание — главные барьеры для Enterprise AI. Это 24% всех ответов. Модели уже достаточно хороши. Фреймворки зрелые. Но инфраструктура, которая должна держать эти модели в продакшене, просто не выдерживает нагрузки.

Представьте себе традиционный дата-центр, рассчитанный на 5-8 киловатт на стойку. Теперь добавьте AI-нагрузку, которая требует 30-120 киловатт, а некоторые серверы до 600. Это десятикратный рост. Gartner прогнозирует, что потребление электричества дата-центрами удвоится с 448 тераватт-часов в 2025 до 980 к 2030 году. Охлаждение, питание, распределенные архитектуры — все это становится отдельной инженерной задачей, без решения которой любой AI-проект обречен на полумеры.

Но есть и хорошие новости. Переход к надежной инфраструктуре опирается на три простых принципа. Первый: данные должны идти напрямую из источника в централизованное хранилище вроде BigQuery, а не через промежуточные таблицы. Второй: логика расчетов должна быть явной, версионируемой и управляемой в коде, а не разбросанной по формулам. Третий: должно быть предсказуемое время обновления, чтобы руководство понимало, когда цифры актуальны.

Компании, которые строят этот фундамент, получают не просто стабильные дашборды. Они получают основу, на которой уже можно строить полноценный AI. Без надежной инфраструктуры любой интерфейс, чат-бот или copilot — это просто красивая обертка над шаткими данными. Сначала инфраструктура, потом семантический слой, и только потом — интерфейс. Порядок операций имеет значение.

Источник: https://medium.com/@conor.bliss.henaghan/the-real-bottleneck-in-most-ai-initiatives-isnt-ai-it-s-infrastructure-507c41d98a21

#datainfrastructure #AI #бизнес

The Real Bottleneck in Most AI Initiatives Isn’t AI. It’s Infrastructure.

Working to apply AI across professionals services has taugt me that most AI initiatives do not fail at the model layer. They fail much…

2 views15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

Multilingual_Reasoning_Gym_Multilingual_Scaling_of_Procedural_R.html

🔗 Multilingual Reasoning Gym: Multilingual Scaling of Procedural Reasoning Environments

📖 tgf

📌 Multilingual Reasoning Gym: Мультиязычное масштабирование процедурных сред для рассуждений

[Полное описание в прикрепленном файле]

#машинноеобучение #llm #nlp

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

The_Oil_and_Water_Moment_in_AI_Architecture.html

🔗 The Oil and Water Moment in AI Architecture

📖 tgf

📌 Нефть и вода: архитектура ИИ в эпоху неопределённости

✏ Введение

Архитектура программного обеспечения переживает момент, который автор статьи называет «нефтью и водой».
На протяжении десятилетий системы были фундаментально детерминированными: при одинаковых входных данных они производили одинаковые выходные данные.
Даже с переходом к облачным архитектурам это допущение оставалось неизменным — микросервисы, контейнеры и распределённые системы увеличили сложность, но не изменили процедурный характер выполнения.

[Полное описание в прикрепленном файле]

#AI #architecture #машинноеобучение

2 views15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

🔗 US Job Market Visualizer GitHub

📌 US Job Market Visualizer: инструмент визуализации рынка труда США

Андрей Карпатый сделал проект, в котором каждая профессия в Америке оценивается по шкале от 0 до 10 с точки зрения вероятности ее замены искусственным интеллектом

Он собрал данные по всем 342 профессиям из Бюро труда (скраппинг)
Каждая профессия была скормлена в LLM (Gemini Flash via OpenRouter) с подробной шкалой оценки
На итоге - интерактивная диаграмма (treemap), где размер прямоугольника отражает количество рабочих мест, а цвет — степень уязвимости данной профессии перед ИИ (от 0 до 10)

Уязвимость:
0–1: кровельщики, уборщики
4–5: медсестры, работники розничной торговли, врачи
8–9: разработчики программного обеспечения, помощники юристов, аналитики данных
10: медицинские стенографисты

Средний показатель по всем 342 профессиям: 5.3 из 10.

Ключевой критерий в его оценке: если результат работы является по сути цифровым и работу можно выполнять полностью из дома, то степень уязвимости по определению высока.

✏️ Введение

Представлен исследовательский инструмент US Job Market Visualizer, размещённый на GitHub, который визуализирует данные о 342 профессиях из Occupational Outlook Handbook Бюро статистики труда США (BLS). Инструмент охватывает 143 млн рабочих мест по всей экономике США и позволяет анализировать профессии по различным метрикам: прогнозируемому росту, медианной зарплате, требованиям к образованию и уровню AI-экспозиции.

————————

✏️1. LLM-powered раскраска: принцип работы

Исходный код проекта включает скрейперы, парсеры и пайплайн для написания пользовательских промтов к языковым модезам. Механизм работает следующим образом: пользователь составляет промт с критериями оценки, LLM обрабатывает каждую профессию согласно этим критериям, после чего инструмент раскрашивает визуализацию на основе полученных оценок.

Это универсальный фреймворк — можно сформулировать любой вопрос и перезапустить пайплайн для получения новой раскраски.

————————

✏️ 2. Примеры использования: Digital AI Exposure

Одна из готовых метрик — «Digital AI Exposure» — оценивает, насколько текущий AI (преимущественно цифровой) изменит каждую профессию. Это пример того, как можно применить LLM-обработку для анализа рынка труда.

Автор приводит конкретный пример: программисты получают оценку 9 из 10 баллов, поскольку AI трансформирует их работу. Однако это не означает сокращения рабочих мест — спрос на программистов может вырасти благодаря росту производительности каждого разработчика.

————————

✏️ 3. Важные оговорки и ограничения

Автор делает акцент на том, что оценки AI-экспозиции — это грубые оценки LLM, а не строгие прогнозы. Высокий балл не предсказывает, что работа исчезнет.

Скор не учитывает ряд критических факторов:

⦁ Эластичность спроса — повышение производительности может увеличить спрос
⦁ Латентный спрос — неудовлетворённые потребности рынка
⦁ Регуляторные барьеры — правовые ограничения на автоматизацию
⦁ Социальные предпочтения — выбор в пользу живых работников

Многие профессии с высокой экспозицией будут трансформированы, а не замещены.

————————

✏️ Заключение: перспективы и ограничения

Инструмент представляет ценность для исследователей и разработчиков как гибкий фреймворк для анализа профессиональных данных. Ключевой риск — интерпретация оценок AI-экспозиции как предсказаний увольнений, хотя автор явно предостерегает от этого.

Следующие шаги для пользователей: изучение исходного кода на GitHub, написание собственных промтов для оценки других критериев (например, влияния гуманоидной робототехники, рисков офшоринга или климатического воздействия), перезапуск пайплайна и анализ полученных результатов в контексте указанных ограничений.

📖 tgf

#datascience #visualization

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

Как LLM меняют саму природу программирования

Ставрос Корокитакис написал пост, который заставляет задуматься каждого разработчика. Он говорит прямо: раньше ему казалось, что он любит программировать, но на самом деле ему нравилось создавать вещи. Программирование было лишь инструментом. И когда появились качественные LLM, он наконец смог создавать непрерывно — и результат превзошёл всё, что он делал вручную.

Главное, что меняет LLM — это не скорость сама по себе. Это уровень дефектов. До LLM его код становился неподдерживаемым через два-три дня. С LLM он работает над несколькими проектами неделями, вырастая до десятков тысяч строк кода, и каждое изменение остаётся таким же надёжным, как первое. Это принципиально другой опыт.

Но вот что действительно важно: его навыки не стали бесполезными — они сместились. Ему больше не нужно знать, как писать код правильно. Ему нужно понимать, как правильно архитектурировать систему и как принимать правильные решения для удобного продукта. Там, где он не понимает базовую технологию, код всё равно превращается в беспорядок. Но где понимает — там LLM усиливает его в разы.

Эволюция уровня проверки тоже показательна. Ранние модели требовали проверять каждую строку. Поздние — каждую функцию. Современные — только общую архитектуру. И он предполагает, что через год, возможно, не потребуется и это. Пока ещё нужен человек с хорошими навыками программирования — но этот порог постоянно снижается.

Практический рабочий процесс, который он выстроил, заслуживает внимания. Три типа агентов: Архитектор на сильной модели (Opus) — с ним он общается напрямую, согласовывая цели и ограничения. Разработчик на экономичной модели (Sonnet) — строго реализует план. Ревьюеры — обязательно Codex, опционально Gemini. Причём разные модели дают разные результаты, и их комбинация работает лучше всего. Codex очень придирчивый — хорош для ревью. Opus решения хорошо коррелируют с его собственными. Gemini находит решения, которые другие модели не увидели.

Его пример добавления email-поддержки в Stavrobot занял около часа от начала до конца. 421 тест прошёл, TypeScript чистый, созданы новые файлы и модифицированы существующие. Три итерации фидбека — и код готов. Раньше на такое ушли бы дни.

Что это значит для индустрии? Программирование перестаёт быть о написании кода. Оно становится об архитектуре, о понимании домена, о умении ставить задачи и критически оценивать результат. LLM не заменяют разработчика — они заставляют его подняться на уровень выше. Тот, кто это понимает, получит огромное преимущество. Тот, кто продолжает писать код строчка за строчкой, будет всё больше отставать.

Источник: https://www.stavros.io/posts/how-i-write-software-with-llms/

#llm #программирование #architecture

How I write software with LLMs - Stavros' Stuff

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

Agents_Over_Bubbles.html

🔗 Agents Over Bubbles

📖 tgf

📌 Agents Over Bubbles

✏ Введение: Переосмысление пузыря

Автор статьи, Бен Томпсон из Stratechery, традиционно придерживался позиции, что индустрия ИИ находится в пузыре.
Однако, написанная в марте 2026 года, перед конференцией Nvidia GTC, статья представляет радикально иной вывод: пузыря нет.
Более того, парадоксальным образом именно отсутствие всеобщего беспокойства о пузыре может быть главным доказательством его отсутствия.

————————

✏ Три парадигмы развития LLM

Статья выделяет три ключевых точки перегиба в развитии больших языковых моделей:

[Полное описание в прикрепленном файле]

#AI #llm #бизнес

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

Leanstral: как Mistral AI меняет правила игры в доверенном программировании

Mistral AI выпустила Leanstral — первый в мире open-source ИИ-агент, заточенный под формальную верификацию кода. И это не просто ещё один кодинг-ассистент. Это принципиально другой подход к тому, как мы вообще доверяем коду, написанному искусственным интеллектом.

В чём суть. Большинство существующих ИИ-помощников генерируют код, который потом приходится вручную проверять человеку. Особенно в критически важных системах — финансовых протоколах, блокчейн-контрактах, инфраструктуре. Это бутылочное горлышко сводит на нет весь выигрыш от автоматизации. Leanstral работает иначе: он производит не просто код, а код вместе с формальным доказательством его корректности. Машина проверяет машину.

Технически модель построена на разреженной архитектуре MoE: 120 миллиардов параметров, но при инференсе активируется только 6 миллиардов. Это даёт потрясающую эффективность. По метрике FLTEval — а это не синтетические математические задачки, а реальные вызовы из проекта формализации великой теоремы Ферма — Leanstral набирает 26.3 балла при двух попытках. Звучит не впечатляюще? Сравните с ценой: $36 против $549 за сопоставимый результат Claude Sonnet. И даже при pass@16 Leanstral обходится в $290, а Claude Opus выливается в $1650 — разница в шесть раз.

Но дело не только в экономии. Дело в доверии. Когда ты пишешь смарт-контракт на блокчейне, баг может стоить миллионов. Традиционный подход — аудиты вручную, дорого и медленно. Leanstral позволяет встроить формальную верификацию в привычный рабочий процесс. Он не просто генерирует код, он доказывает, что этот код соответствует спецификации. Это как если бы у тебя был юрист, который проверяет каждый контракт не на словах, а математически.

Mistral сделала важный стратегический ход: открыла веса под Apache 2.0. Это означает, что любой может взять модель, дообучить под свои нужды или развернуть на собственном железе. Платформа уже интегрирована в Mistral Vibe и доступна через бесплатный API. То есть порог входа практически нулевой.

Конечно, есть ограничения. Leanstral — нишевый инструмент, он работает с Lean 4 и требует понимания формальных методов. Это не универсальный кодинг-ассистент для быстрого прототипирования. Но именно здесь и кроется главный сдвиг: индустрия начинает разделять два режима. Первый — vibe coding, быстрый и творческий, для прототипов и экспериментов. Второй — доверенное программирование, где каждая строчка верифицирована. Leanstral закрывает именно второй сегмент.

Для рынка это сигнал: будущее за гибридными системами, где скорость генерации кода сочетается с математической строгостью проверки. И Mistral AI только что захватила лидерство в этой нише.

Источник: https://mistral.ai/news/leanstral

#AI #машинноеобучение #программирование

Leanstral: Open-Source foundation for trustworthy vibe-coding | Mistral AI

First open-source code agent for Lean 4.

1 view15:49

ChatGPTevelopment & Promptgramming

Forwarded from Data&AI Insights

Are_AI_agents_actually_slowing_us_down.html

🔗 Are AI agents actually slowing us down?

📖 tgf

📌 Замедляют ли AI-агенты нашу работу?

✏ Введение

Несмотря на повсеместные разговоры о том, что AI-инструменты повышают эффективность разработки, появляется всё больше свидетельств об обратном эффекте.
Компании, активно внедряющие AI-агентов для написания кода, сталкиваются с падением качества продукта, ростом технического долга и увеличением числа инцидентов.
При этом бизнес-метрики вроде количества pull requests создают иллюзию прогресса, отвлекая внимание от реальных проблем с надёжностью и поддерживаемостью кода.

————————

✏ 1.
Anthropic: парадокс лидера AI-разработки

[Полное описание в прикрепленном файле]

#AI #программирование #бизнес

1 view15:49