Хабр / ML & AI
478 subscribers
5.47K links
Telegram-канал, где вы можете найти публикации из RSS-фидов тематических хабов "Машинное обучение" и "Искусственный интеллект" портала Хабр.

Данный канал не является официальным представительством платформы Хабр.

Администратор - @evilfreelancer
Download Telegram
«Кентавр» против хаоса документации: как Artezio научила ИИ писать техзадания в 10 раз быстрее

Пока разработчики по всему миру мучаются с ChatGPT, пытаясь выжать из него хоть что-то приличное для технической документации, команда Artezio пошла другим путем. Вместо того, чтобы полагаться на сырой ИИ, мы создали «Кентавр» — гибридную систему, которая объединяет возможности больших языковых моделей с экспертизой опытных аналитиков.

В результате то, на что enterprise-команды тратят месяц (на подготовку полного пакета требований на 60-100 страниц), задействуя несколько специалистов, «Кентавр» делает за пару дней силами одного аналитика. При этом документы качественнее: структурированные, непротиворечивые и главное — повторяемые от проекта к проекту.

О том, как создавалась эта система, с какими проблемами столкнулись разработчики и почему простого ChatGPT недостаточно для серьезной документации, рассказали Андрей Шагалов, директор по маркетингу Artezio, и Денис Харченко, директор по развитию бизнеса компании. Они поделились техническими деталями архитектуры, объяснили концепцию Human-in-the-Loop и раскрыли планы по превращению нового инструмента в популярный коммерческий продукт. Читать далее

#искусственный_интеллект #документация #llm #системный_аналитик | @habr_ai
Что скрыто за характером LLM: читаем поведенческие отпечатки

Задумывались ли вы когда-нибудь, почему две языковые модели с одинаковыми оценками на тестах ведут себя совершенно по-разному в реальном общении? Оценки вроде бы одни и те же, а ощущения от общения — совсем нет: одна охотно подыгрывает, другая спорит до последнего, третья резко меняет мнение из-за незначительной формулировки. Кажется, за сухими числами мы теряем самое интересное — характер и повадки моделей.

Исследователи решили перестать мерить всё под одну гребёнку и попробовали разобраться, какими чертами личности и поведения на самом деле отличаются современные LLM. В ход пошли не только бенчмарки, но и целый профиль моделей — от умения мыслить абстрактно до устойчивости к лести. 

Что оказалось на поверхности, какие неожиданные черты всплывают и почему выбор ИИ — это теперь не только про точность, но и про стиль взаимодействия?Подглядываем в поведенческие отпечатки моделей, чтобы понять: что за личность сидит внутри LLM. Читать далее

#ии #llm | @habr_ai
4 фреймворка апокалипсиса: LangChain, LlamaIndex, CrewAI и Semantic Kernel в действии

Мало просто иметь доступ к мощным нейросетям и уметь ими пользоваться — важно правильно подключить их к своим сервисам, комбинировать с внутренними данными и выстраивать удобные сценарии работы. В нашей команде мы постоянно экспериментируем с новыми AI-технологиям, поэтому сегодня расскажу вам, как же просто можно внедрить нейронку в свой проект (например, на сайт).

Для этого воспользуемся сервисом Evolution Foundation Models и рассмотрим фреймворки LangChain, LlamaIndex, CrewAI и Semantic Kernel. Сервис предоставляет доступ к open source моделям по open AI Compatible API. Касаемо фреймворков — каждый из них по-своему упрощает разработку, но имеет уникальные паттерны подключения. В статье я покажу готовые примеры и поясню ключевые части кода. А все ссылки на мои полные решения даю в конце статьи. Читать далее

#ai #искусственный_интеллект #нейронки #фремворки #llm | @habr_ai
ADSM: ролевые игры

Четыре дня назад я запостил на Хабре опрос: как лучше назвать пакет документов, описывающих мой опыт разработки программного продукта при помощи LLM-агентов/ботов - ADSM или BDSM. С небольшим перевесом в один голос (6 к 5) победил вариант ADSM - Agent Driven Software Management. Ну, пусть будет ADSM.

Так вот, при формализации своих отношений с агентами в первую очередь передо мной встал вопрос, а кто в этих отношениях какую роль играет? Пока что я склоняюсь, что наиболее точным описанием являются отношения "Заказчик - Исполнитель". Объяснения под катом

#искусственный_интеллект #llm #разработка_приложений #adsm | @habr_ai
[Перевод] Неудачные эксперименты с Vibe Coding на Python

Команда Python for Devs подготовила перевод статьи Элa Свейгарта о неудачных экспериментах с vibe coding. Все говорят, что ИИ уже умеет писать приложения, но стоит чуть отклониться от привычных сценариев — и всё идёт наперекосяк. Картофельная Африка вместо карты, пинбол, превращающийся в пинг-понг, и счёты с отрицательными числами — автор собрал коллекцию своих провалов с vibe coding. Читать далее

#vibe_coding #llm #генеративный_ии #python #эксперименты #ошибки_ии #ограничения_ai | @habr_ai
Как оживить научные статьи: превращаем исследования в интерактивных ИИ-ассистентов

Обычная научная статья ― это десятки страниц текста, сложные графики и ссылка на репозиторий где-то в глубине интернетов. Часто кажется, что в этот мир допускаются только те, кто готов неделями разбираться с чужим кодом и настраивать окружение через танцы с бубном. А что если бы статья могла сама «оживать» и превращаться в настоящего ИИ-ассистента, с которым можно разговаривать на обычном языке и сразу запускать любые её методы?

В свежем исследовании авторы предлагают именно это: новый инструмент, который берет научную работу и делает из неё агента-напарника. Теперь из пассивного PDF получается активный собеседник — он объясняет, считает, строит графики и даже сам проверяет свои результаты. Звучит как будущее, которое только что стало чуть ближе. Читать далее

#ии #llm #агенты | @habr_ai
ADSM: границы возможностей Моделей

Мое понимание LLM с точки зрения пользователя очень простое: есть сетка с весами (обученные параметры), токенизатор и декодер (преобразователи текста во входные и выходные токены), и трансформер (слои внимания), который перерабатывает входные токены и шаг за шагом предсказывает новые.

Я пробовал разные Модели (GPT, Gemini, Deepseek, Grok) - все они, на мой взгляд, работают примерно одинаково. На один и тот же запрос они дают очень похожие, а иногда и идентичные ответы. Это ожидаемо, ведь все современные LLM построены на одной и той же архитектуре - трансформерах.

Это значит, что у всех реализаций есть общий шаблон поведения, отражающий их природу. В этой публикации я опишу наиболее важные, с моей точки зрения, характеристики Моделей, на которых я строю своё с ними общение. Читать далее

#adsm #искусственный_интеллект #llm #персональный_опыт | @habr_ai
А вы точно умеете внедрять AI в бизнес?

Короткий гуглинг по теме показывает, что все рекомендации по внедрению ИИ в бизнесе сводятся к общим фразам. «Выделите одно приоритетное направление», «найдите рутинные операции», «проанализируйте доступные данные». Спасибо, кэп. А делать-то что? Читать далее

#ai #ии #llm #автоматизация #автоматизация_бизнеса #внедрение #ml #бизнес_процессы | @habr_ai
Опыт вайбкодинга: как заставить нейросеть работать эффективно

Данная статья написана и отредактирована мной вручную, специально, чтобы подчеркнуть ценность ручного труда в эпоху нейросетей.

Сегодня, в начале XXI века, искусственный интеллект уже стал частью нашей повседневности. Мы спокойно спрашиваем у Алисы прогноз погоды, видим тексты и советы от ИИ в поиске, а изображения или даже видеоролики, созданные нейросетью, никого не удивляют.

Параллельно все чаще обсуждают, что крупные языковые модели (LLM), умеющие писать код, якобы скоро заменят программистов и будут сами решать их задачи. По моему опыту — до этого еще далеко. Но при этом нейросети постепенно превращаются в удобный и полезный инструмент для разработчиков.

Ниже я расскажу про собственный опыт работы с такими технологиями, который мы ежедневно применяем в реальных проектах ★5УГЛОВ для наших клиентов. Читать далее

#нейросети #llm #искусственный_интеллект #cursor #chatgpt #deepseek #автоматизация_разработки #дебаг #разработка_с_ии | @habr_ai