Развитие больших языковых моделей: тенденции, вызовы и перспективы
Искусственный интеллект стремительно развивается, открывая новые горизонты в обработке естественного языка. На недавней дискуссии, организованной компанией Artezio, Виталий Брамм, директор Нейрохаба, поделился своим видением будущего больших языковых моделей и их применения в бизнес-процессах.
В этом видео обсуждаются следующие важные вопросы:
- Как будет развиваться ИИ?
- Дообучать модель или нет?
- Как понять, что дообучение завершено?
- ИИ-агентов нужно контролировать?
- Что выберете: вежливый ИИ или умный?
- Галлюцинации - бич LLM?
- ИИ умеет хранить секреты?
Крупнейшие технологические компании мира активно развивают мощные предобученные модели общего назначения, такие как GPT от OpenAI. Эти модели демонстрируют невероятные способности в решении широкого спектра задач обработки естественного языка, начиная от написания текстов и кодирования до аналитики и моделирования. Модели машинного зрения идут по тому же сценарию - к появлению больших предобученых моделей. В целом, это приведёт к созданию эффективных мультимодальных моделей и систем.
По мнению Виталия, основной тренд в развитии искусственного интеллекта - создание подобных универсальных моделей, которые затем интегрируются в бизнес-процессы с помощью вспомогательных компонентов, таких как поисковые системы, базы знаний, системы управления знаниями и поведением модели. Актуальными становятся архитектуры Retrieval-Augmented-Generation (RAG), соединяющие в себе обработку естественного языка, поиск информации и умение вести диалог.
Дообучение моделей на специализированных данных полезно для адаптации к определенным задачам и доменам, экономии вычислительных ресурсов и корректировки стиля взаимодействия. Однако Виталий подчеркивает, что более существенное значение имеет развитие самих фундаментальных архитектур, умение направить их на достижение результата с помощью эффективных промптов и структурирования баз знаний компаний. Таким образом вопрос интеграции ИИ в наши бизнес-процессы связан в первую очередь с созданием систем и корректировке бизнес-процессов. Мы увидим ещё более значительный прогресс, который будет достигнут при появлении моделей уровня GPT-5 и выше. Дело в том, что модели уже обучены на огромных массивах информации нашей цивилизации - они уже умеют многое из того, что ранее могли выполнять только люди.
При этом необходимо помнить о рисках и вызовах, связанных с развитием ИИ. К ним относятся галлюцинации и генерация некорректной информации, непрозрачность внутренней логики нейросетей, этические вопросы безопасности и контроля систем ИИ. Однако, как отмечает Виталий, многие из этих проблем являются отражением более глубоких социальных процессов в обществе. К тому же если мы сравним "галлюцинации" моделей ИИ и "галлюцинации" живых людей, то скорей всего мы увидим перевес этих проявлений у людей.
По мере интеграции ИИ в бизнес-процессы, важным становится баланс между степенью автоматизации и сохранением человеческого контроля. В каких-то случаях возможна стопроцентная автоматизация с ИИ, в других потребуется участие человека на разных этапах. Для принятия оптимальных решений нужна тщательная проработка задачи, изменение бизнес-процессов и распределение ролей между человеком и системой ИИ.
В целом, будущее больших языковых моделей выглядит многообещающим. Технологии ИИ станут неотъемлемой частью корпоративных процессов, помогая повысить производительность и эффективность компаний. Однако для достижения максимальных преимуществ потребуется комплексный подход с развитием фундаментальных архитектур, построением вспомогательных систем и грамотным управлением процессами внедрения.
Искусственный интеллект стремительно развивается, открывая новые горизонты в обработке естественного языка. На недавней дискуссии, организованной компанией Artezio, Виталий Брамм, директор Нейрохаба, поделился своим видением будущего больших языковых моделей и их применения в бизнес-процессах.
В этом видео обсуждаются следующие важные вопросы:
- Как будет развиваться ИИ?
- Дообучать модель или нет?
- Как понять, что дообучение завершено?
- ИИ-агентов нужно контролировать?
- Что выберете: вежливый ИИ или умный?
- Галлюцинации - бич LLM?
- ИИ умеет хранить секреты?
Крупнейшие технологические компании мира активно развивают мощные предобученные модели общего назначения, такие как GPT от OpenAI. Эти модели демонстрируют невероятные способности в решении широкого спектра задач обработки естественного языка, начиная от написания текстов и кодирования до аналитики и моделирования. Модели машинного зрения идут по тому же сценарию - к появлению больших предобученых моделей. В целом, это приведёт к созданию эффективных мультимодальных моделей и систем.
По мнению Виталия, основной тренд в развитии искусственного интеллекта - создание подобных универсальных моделей, которые затем интегрируются в бизнес-процессы с помощью вспомогательных компонентов, таких как поисковые системы, базы знаний, системы управления знаниями и поведением модели. Актуальными становятся архитектуры Retrieval-Augmented-Generation (RAG), соединяющие в себе обработку естественного языка, поиск информации и умение вести диалог.
"Вопрос дообучения модели является важным, но в контексте применения современных предобученных моделей в реальных бизнес-процессах , мне кажется, гораздо важнее предоставить им доступ к релевантным данным, то есть нам необходимы эффективные внешние поисковые системы", - отмечает Виталий.
Дообучение моделей на специализированных данных полезно для адаптации к определенным задачам и доменам, экономии вычислительных ресурсов и корректировки стиля взаимодействия. Однако Виталий подчеркивает, что более существенное значение имеет развитие самих фундаментальных архитектур, умение направить их на достижение результата с помощью эффективных промптов и структурирования баз знаний компаний. Таким образом вопрос интеграции ИИ в наши бизнес-процессы связан в первую очередь с созданием систем и корректировке бизнес-процессов. Мы увидим ещё более значительный прогресс, который будет достигнут при появлении моделей уровня GPT-5 и выше. Дело в том, что модели уже обучены на огромных массивах информации нашей цивилизации - они уже умеют многое из того, что ранее могли выполнять только люди.
При этом необходимо помнить о рисках и вызовах, связанных с развитием ИИ. К ним относятся галлюцинации и генерация некорректной информации, непрозрачность внутренней логики нейросетей, этические вопросы безопасности и контроля систем ИИ. Однако, как отмечает Виталий, многие из этих проблем являются отражением более глубоких социальных процессов в обществе. К тому же если мы сравним "галлюцинации" моделей ИИ и "галлюцинации" живых людей, то скорей всего мы увидим перевес этих проявлений у людей.
По мере интеграции ИИ в бизнес-процессы, важным становится баланс между степенью автоматизации и сохранением человеческого контроля. В каких-то случаях возможна стопроцентная автоматизация с ИИ, в других потребуется участие человека на разных этапах. Для принятия оптимальных решений нужна тщательная проработка задачи, изменение бизнес-процессов и распределение ролей между человеком и системой ИИ.
В целом, будущее больших языковых моделей выглядит многообещающим. Технологии ИИ станут неотъемлемой частью корпоративных процессов, помогая повысить производительность и эффективность компаний. Однако для достижения максимальных преимуществ потребуется комплексный подход с развитием фундаментальных архитектур, построением вспомогательных систем и грамотным управлением процессами внедрения.
YouTube
Виталий Брамм: как обучить ИИ?
СЕО ИТ-компании «Нейрохаб» (https://neuro-hub.ru) Виталий Брамм рассказывает об особенностях обучения ИИ и отвечает на следующие вопросы:
00:00 Как будет развиваться ИИ?
02:12 Дообучать модель или нет?
06:55 Как понять, что дообучение завершено?
08:31…
00:00 Как будет развиваться ИИ?
02:12 Дообучать модель или нет?
06:55 Как понять, что дообучение завершено?
08:31…
🔥1
Forwarded from Все о блокчейн/мозге/space/WEB 3.0 в России и мире
⚡️ARK Invest представили долгосрочную перспективу 5 технологических секторов, которые могут привести к беспрецедентному экономическому росту в ближайшие 6 лет, что составит 60% от общей мировой рыночной стоимости
Исходя из анализа, в 2030году ИИ сформирует огромные размеры рынка, поддерживая многие сектора.
Нейросети будут иметь более широкое воздействие, чем появление интернета, говорится в отчете.
Вторая по величине категория — «Интеллектуальные устройства.
Поражает относительное отсутствие экономического эффекта от биотехнологий и медицинских технологий.
Выводы ARK Invest: «К концу десятилетия ежегодный экономический эффект сегодняшних конвергентных технологий примерно удвоит экономический эффект тех технологий, которые спровоцировали вторую промышленную революцию на рубеже 20-го века».
Анализируя благоприятное влияние технологий друг на друга, «нейросети, несомненно, являются самым важным катализатором».
«К 2030 году рыночная стоимость пяти инновационных платформ вместе составит более $200 трлн и к концу этого десятилетия может составлять более 60% стоимости мирового фондового рынка.
Исходя из анализа, в 2030году ИИ сформирует огромные размеры рынка, поддерживая многие сектора.
Нейросети будут иметь более широкое воздействие, чем появление интернета, говорится в отчете.
Вторая по величине категория — «Интеллектуальные устройства.
Поражает относительное отсутствие экономического эффекта от биотехнологий и медицинских технологий.
Выводы ARK Invest: «К концу десятилетия ежегодный экономический эффект сегодняшних конвергентных технологий примерно удвоит экономический эффект тех технологий, которые спровоцировали вторую промышленную революцию на рубеже 20-го века».
Анализируя благоприятное влияние технологий друг на друга, «нейросети, несомненно, являются самым важным катализатором».
«К 2030 году рыночная стоимость пяти инновационных платформ вместе составит более $200 трлн и к концу этого десятилетия может составлять более 60% стоимости мирового фондового рынка.
Может ли GPT-4 заменить аналитика данных
В своем исследовании ученые из Alibaba и Hupan Lab оценивали возможность использования GPT-4 в качестве ассистента для аналитики данных. Они создали систему, позволяющую GPT-4 извлекать нужные данные, строить визуализации и формулировать аналитические выводы. Таким образом они оценили возможности ИИ на всех этапах анализа данных. Авторы исследования сравнили производительность GPT-4 с профессиональными аналитиками с помощью комплекса метрик оценки качества.
Процесс включает три этапа: генерация кода, выполнение кода и генерация анализа.
1. Генерация кода: GPT-4 генерирует код Python, содержащий SQL запросы, для извлечения релевантных данных и визуализации.
2. Выполнение кода: Сгенерированный код выполняется для получения данных и построения графика.
3. Генерация анализа: GPT-4 генерирует анализ извлеченных данных в виде пунктов на основе вопроса.
Опробовав GPT-4 на 1000 задач из набора NvBench и сравнив с профессионалами разного уровня, исследователи выявили впечатляющие результаты. По большинству метрик GPT-4 обогнала стажеров и младших аналитиков, а по некоторым показателям демонстрирует сопоставимую с опытными специалистами эффективность. Например, корректность аналитических выводов GPT-4 составила 94% против 86% у стажера. Важно, что GPT-4 выполняла работу в 5-10 раз быстрее людей, а ее стоимость равнялась лишь 0.45% от оплаты эксперта-аналитика.
Однако по некоторым показателям, таким как корректность визуализаций и глубина анализа, GPT-4 пока уступает экспертам. Также отмечены проблемы галлюцинаций, ошибок вычислений и слабой интеграции фоновых знаний и эмоционального контекста.
Результаты демонстрируют потенциал GPT-4 как мощного ассистента аналитика, способного взять на себя рутинные задачи. При устранении имеющихся ограничений LLM могут существенно повысить эффективность аналитической работы в бизнесе. Ожидается, что следующие поколения моделей превзойдут GPT-4 по всем возможностям.
Но уже сейчас у многих людей и компаний по сути в кармане имеется личный аналитик данных, что раньше было недоступно. Возможность получать качественный анализ данных на лету, не прибегая к дорогостоящим услугам специалистов, делает аналитику доступной даже для малых и средних предприятий, стартапов и индивидуальных предпринимателей.
В своем исследовании ученые из Alibaba и Hupan Lab оценивали возможность использования GPT-4 в качестве ассистента для аналитики данных. Они создали систему, позволяющую GPT-4 извлекать нужные данные, строить визуализации и формулировать аналитические выводы. Таким образом они оценили возможности ИИ на всех этапах анализа данных. Авторы исследования сравнили производительность GPT-4 с профессиональными аналитиками с помощью комплекса метрик оценки качества.
Процесс включает три этапа: генерация кода, выполнение кода и генерация анализа.
1. Генерация кода: GPT-4 генерирует код Python, содержащий SQL запросы, для извлечения релевантных данных и визуализации.
2. Выполнение кода: Сгенерированный код выполняется для получения данных и построения графика.
3. Генерация анализа: GPT-4 генерирует анализ извлеченных данных в виде пунктов на основе вопроса.
Опробовав GPT-4 на 1000 задач из набора NvBench и сравнив с профессионалами разного уровня, исследователи выявили впечатляющие результаты. По большинству метрик GPT-4 обогнала стажеров и младших аналитиков, а по некоторым показателям демонстрирует сопоставимую с опытными специалистами эффективность. Например, корректность аналитических выводов GPT-4 составила 94% против 86% у стажера. Важно, что GPT-4 выполняла работу в 5-10 раз быстрее людей, а ее стоимость равнялась лишь 0.45% от оплаты эксперта-аналитика.
Затраты составили около 2.5% от стажера, 0.71% от младшего аналитика и 0.45% от эксперта.
Однако по некоторым показателям, таким как корректность визуализаций и глубина анализа, GPT-4 пока уступает экспертам. Также отмечены проблемы галлюцинаций, ошибок вычислений и слабой интеграции фоновых знаний и эмоционального контекста.
Результаты демонстрируют потенциал GPT-4 как мощного ассистента аналитика, способного взять на себя рутинные задачи. При устранении имеющихся ограничений LLM могут существенно повысить эффективность аналитической работы в бизнесе. Ожидается, что следующие поколения моделей превзойдут GPT-4 по всем возможностям.
Но уже сейчас у многих людей и компаний по сути в кармане имеется личный аналитик данных, что раньше было недоступно. Возможность получать качественный анализ данных на лету, не прибегая к дорогостоящим услугам специалистов, делает аналитику доступной даже для малых и средних предприятий, стартапов и индивидуальных предпринимателей.
Языковые модели ИИ: Мощный инструмент убеждения или средство манипуляции?
В новейшем исследовании ученые EPFL и Фондации Бруно Кесслер продемонстрировали способность передовых языковых моделей, таких как GPT-4, эффективно убеждать людей в ходе онлайн-дискуссий. Результаты вызывают опасения, показывая, что персонализация аргументов под профиль пользователя усиливает убедительный эффект более чем на 80%.
В эксперименте 820 участников вели дебаты на различные темы со случайными оппонентами - людьми или языковыми моделями. Некоторым оппонентам предоставлялась демографическая информация об участниках для адаптации подхода. Измерялось изменение мнений до и после дебатов.
Персонализированная модель GPT-4 увеличила шансы изменения взглядов участников на 81,7% по сравнению с дебатами между людьми. Даже без персонализации эффект все равно превышал человеческий уровень. Интересно, что доступ людей к личным данным оппонентов лишь радикализировал позиции.
Открывается ли новая эра манипулятивных технологий или потенциал для улучшения взаимодействия с клиентами?
Экстраполируя результаты исследования на бизнес-среду, можно увидеть перспективы применения передовых языковых моделей для улучшения коммуникации с клиентами. Способность моделей к персонализации и убедительной подаче информации открывает новые возможности.
Во-первых, ИИ может помочь создавать индивидуальный подход к каждому клиенту, подстраивая коммуникацию под их личные предпочтения и особенности. Это повысит релевантность и эффективность взаимодействия, укрепляя лояльность клиентов.
Во-вторых, убедительные способности ИИ позволят находить наиболее действенные аргументы для представления преимуществ продуктов и услуг. Грамотная подача информации будет способствовать росту продаж и большему вовлечению клиентов.
В-третьих, за счет высокой скорости обработки языковые модели смогут обеспечить своевременные и качественные ответы на запросы клиентов в режиме реального времени, повышая их удовлетворенность сервисом.
Таким образом, внедрение передовых языковых моделей ИИ в бизнес-коммуникацию принесет ощутимые преимущества за счет персонализации взаимодействия, убедительной презентации продуктов и оперативного обслуживания клиентов. Это поможет построить прочные и доверительные отношения, обеспечивая устойчивый рост компаний.
Языковые модели могут стать мощным инструментом персонализации коммуникации и убедительной презентации продуктов. Увеличьте убедительность ваших онлайн-дискуссий и привлеките больше внимания к вашему бизнесу, интегрируя технологии ИИ, которые могут динамически адаптироваться к каждому клиенту. Наша команда готова предоставить вам все необходимые инструменты и знания для успешной реализации этой мощной инновации.
Подробнее по ссылке
В новейшем исследовании ученые EPFL и Фондации Бруно Кесслер продемонстрировали способность передовых языковых моделей, таких как GPT-4, эффективно убеждать людей в ходе онлайн-дискуссий. Результаты вызывают опасения, показывая, что персонализация аргументов под профиль пользователя усиливает убедительный эффект более чем на 80%.
В эксперименте 820 участников вели дебаты на различные темы со случайными оппонентами - людьми или языковыми моделями. Некоторым оппонентам предоставлялась демографическая информация об участниках для адаптации подхода. Измерялось изменение мнений до и после дебатов.
Персонализированная модель GPT-4 увеличила шансы изменения взглядов участников на 81,7% по сравнению с дебатами между людьми. Даже без персонализации эффект все равно превышал человеческий уровень. Интересно, что доступ людей к личным данным оппонентов лишь радикализировал позиции.
Открывается ли новая эра манипулятивных технологий или потенциал для улучшения взаимодействия с клиентами?
Экстраполируя результаты исследования на бизнес-среду, можно увидеть перспективы применения передовых языковых моделей для улучшения коммуникации с клиентами. Способность моделей к персонализации и убедительной подаче информации открывает новые возможности.
Во-первых, ИИ может помочь создавать индивидуальный подход к каждому клиенту, подстраивая коммуникацию под их личные предпочтения и особенности. Это повысит релевантность и эффективность взаимодействия, укрепляя лояльность клиентов.
Во-вторых, убедительные способности ИИ позволят находить наиболее действенные аргументы для представления преимуществ продуктов и услуг. Грамотная подача информации будет способствовать росту продаж и большему вовлечению клиентов.
В-третьих, за счет высокой скорости обработки языковые модели смогут обеспечить своевременные и качественные ответы на запросы клиентов в режиме реального времени, повышая их удовлетворенность сервисом.
Таким образом, внедрение передовых языковых моделей ИИ в бизнес-коммуникацию принесет ощутимые преимущества за счет персонализации взаимодействия, убедительной презентации продуктов и оперативного обслуживания клиентов. Это поможет построить прочные и доверительные отношения, обеспечивая устойчивый рост компаний.
Языковые модели могут стать мощным инструментом персонализации коммуникации и убедительной презентации продуктов. Увеличьте убедительность ваших онлайн-дискуссий и привлеките больше внимания к вашему бизнесу, интегрируя технологии ИИ, которые могут динамически адаптироваться к каждому клиенту. Наша команда готова предоставить вам все необходимые инструменты и знания для успешной реализации этой мощной инновации.
Подробнее по ссылке
👌1
Чат-боты дешевеют
Недавно увидел любопытную статистику от небезивестного Андрю Ына (основатель DeepLearning.AI и соучредитель Coursera). Оказывается, всего за 17 месяцев цена на языковую модель GPT-4 упала на 79%!
Час работы продвинутого ИИ-ассистента сейчас стоит около $1.44 (примерно 100 рублей). Для сравнения, минимальная зарплата в России в 2023 году - около 180 рублей в час.
Вывод напрашивается сам собой: нанимать людей становится невыгодно. Зачем платить в 2-5 раз больше за ту же работу?
Многие компании уже начинают экспериментировать с чат-ботами. Пока осторожно, присматриваясь. Но эксперименты перерастут в тренд, это лишь вопрос времени.
Да, в некоторых областях людей будет непросто заменить. Креатив, эмпатия, сложные рассуждения - здесь человек пока вне конкуренции. Хотя ИИ и тут наступает на пятки.
Но рутину, простые операции, типовые задачи - все это можно и нужно автоматизировать.
Наш прогноз: через 3-5 лет мы все будем работать бок о бок с цифровыми коллегами. ИИ возьмет на себя самое простое и монотонное, а люди сосредоточатся на действительно творческих задачах. Это будет непросто, но выиграют все - и бизнес, и сотрудники.
А что думаете вы, наши подписчики? Готовы ли российские компании к наступлению эры ИИ? И в каких сферах чат-боты окажутся наиболее полезны? Делитесь своим мнением в комментариях!
Недавно увидел любопытную статистику от небезивестного Андрю Ына (основатель DeepLearning.AI и соучредитель Coursera). Оказывается, всего за 17 месяцев цена на языковую модель GPT-4 упала на 79%!
Час работы продвинутого ИИ-ассистента сейчас стоит около $1.44 (примерно 100 рублей). Для сравнения, минимальная зарплата в России в 2023 году - около 180 рублей в час.
Вывод напрашивается сам собой: нанимать людей становится невыгодно. Зачем платить в 2-5 раз больше за ту же работу?
Многие компании уже начинают экспериментировать с чат-ботами. Пока осторожно, присматриваясь. Но эксперименты перерастут в тренд, это лишь вопрос времени.
Да, в некоторых областях людей будет непросто заменить. Креатив, эмпатия, сложные рассуждения - здесь человек пока вне конкуренции. Хотя ИИ и тут наступает на пятки.
Но рутину, простые операции, типовые задачи - все это можно и нужно автоматизировать.
Наш прогноз: через 3-5 лет мы все будем работать бок о бок с цифровыми коллегами. ИИ возьмет на себя самое простое и монотонное, а люди сосредоточатся на действительно творческих задачах. Это будет непросто, но выиграют все - и бизнес, и сотрудники.
А что думаете вы, наши подписчики? Готовы ли российские компании к наступлению эры ИИ? И в каких сферах чат-боты окажутся наиболее полезны? Делитесь своим мнением в комментариях!
ChatGPT запел!
Только что увидел, как музыкант поёт дуэтом с ИИ через новый Voice mode ChatGPT. Впечатляет! Это не просто технологическая новинка, а окно в мир новых возможностей.
Представьте потенциал для бизнеса:
Виртуальные менеджеры, доступные 24/7
ИИ-консультанты с человеческим голосом
Умные голосовые помощники в любой сфере
Такие технологии могут радикально изменить клиентский опыт и оптимизировать рабочие процессы. Наша команда уже исследует, как применить это в реальных проектах. Скоро этот режим станет доступным по API.
А вы видите применение Voice AI в своём деле?
Только что увидел, как музыкант поёт дуэтом с ИИ через новый Voice mode ChatGPT. Впечатляет! Это не просто технологическая новинка, а окно в мир новых возможностей.
Представьте потенциал для бизнеса:
Виртуальные менеджеры, доступные 24/7
ИИ-консультанты с человеческим голосом
Умные голосовые помощники в любой сфере
Такие технологии могут радикально изменить клиентский опыт и оптимизировать рабочие процессы. Наша команда уже исследует, как применить это в реальных проектах. Скоро этот режим станет доступным по API.
А вы видите применение Voice AI в своём деле?
В эту субботу СТО нашего партнера Минч проводит научно-прикладную лекцию по тонкостям RAG. Присоединяйтесь 😁
9 ноября в 16:00.
Спикер - Евгений Котельников, доктор тех. наук, профессор NLP ЕУ СПб.
Научный семинар, посвящен генерации текста, дополненной результатами поиска (Retrieval Augmented Generation, RAG). Современные большие языковые модели, такие как ChatGPT, умеют достаточно хорошо анализировать входной текст и выдавать осмысленные результаты такого анализа. Ограничением при этом является относительно небольшой размер входа модели, в связи с чем сложно обрабатывать большие текстовые коллекции. Одно из наиболее распространенных решений этой проблемы - двухэтапный процесс генерации: сначала осуществляется поиск по текстовой коллекции, в ходе которого отбираются наиболее релевантные документы или текстовые фрагменты, а затем на вход модели поступают только эти релевантные тексты. Мы рассмотрим общую схему RAG-подхода, детали реализации на уровне кода и возникающие при этом сложности. Также обсудим разновидность этой технологии - GraphRAG.
Для принятия участия в мероприятии просим вас зарегистрироваться по следующей ссылке: https://forms.yandex.ru/u/672930372530c2be49deec32/
9 ноября в 16:00.
Спикер - Евгений Котельников, доктор тех. наук, профессор NLP ЕУ СПб.
Научный семинар, посвящен генерации текста, дополненной результатами поиска (Retrieval Augmented Generation, RAG). Современные большие языковые модели, такие как ChatGPT, умеют достаточно хорошо анализировать входной текст и выдавать осмысленные результаты такого анализа. Ограничением при этом является относительно небольшой размер входа модели, в связи с чем сложно обрабатывать большие текстовые коллекции. Одно из наиболее распространенных решений этой проблемы - двухэтапный процесс генерации: сначала осуществляется поиск по текстовой коллекции, в ходе которого отбираются наиболее релевантные документы или текстовые фрагменты, а затем на вход модели поступают только эти релевантные тексты. Мы рассмотрим общую схему RAG-подхода, детали реализации на уровне кода и возникающие при этом сложности. Также обсудим разновидность этой технологии - GraphRAG.
Для принятия участия в мероприятии просим вас зарегистрироваться по следующей ссылке: https://forms.yandex.ru/u/672930372530c2be49deec32/
Как внедрить ИИ в компанию и не облажаться
За последний год мы помогли 15+ компаниям внедрить ИИ в бизнес-процессы. Главный вывод? Начните с малого.
Наш проверенный подход:
1. Выберите один конкретный процесс
2. Автоматизируйте его
3. Измерьте результат в цифрах
❌ Не пытайтесь автоматизировать всё и сразу
✅ Сфокусируйтесь на одной задаче, где эффект будет заметен быстро
Важно: технологии ИИ не заменят людей полностью. В каждом процессе нужен человек-контролер. Это нормально.
🎯 Наш совет: найдите в команде энтузиастов, готовых тестировать новые решения. Скептиков переубеждать не нужно — результаты говорят сами за себя.
Пример из практики: автоматизировали обработку заявок в техподдержке. Время ответа сократилось с 2 часов до 15 минут. Теперь этот отдел сам предлагает новые идеи для внедрения ИИ 🚀
За последний год мы помогли 15+ компаниям внедрить ИИ в бизнес-процессы. Главный вывод? Начните с малого.
Наш проверенный подход:
1. Выберите один конкретный процесс
2. Автоматизируйте его
3. Измерьте результат в цифрах
❌ Не пытайтесь автоматизировать всё и сразу
✅ Сфокусируйтесь на одной задаче, где эффект будет заметен быстро
Важно: технологии ИИ не заменят людей полностью. В каждом процессе нужен человек-контролер. Это нормально.
🎯 Наш совет: найдите в команде энтузиастов, готовых тестировать новые решения. Скептиков переубеждать не нужно — результаты говорят сами за себя.
Пример из практики: автоматизировали обработку заявок в техподдержке. Время ответа сократилось с 2 часов до 15 минут. Теперь этот отдел сам предлагает новые идеи для внедрения ИИ 🚀
👍2
ИИ теперь ваша главная аудитория! Эпоха, когда мы создавали продукты только для людей, заканчивается.
Большие языковые модели не любят кликать и навигировать по сайту. Они предпочитают прямой доступ к данным через API и структурированные файлы.
На практике это означает, что компании, которые не адаптируются, становятся невидимыми. Когда мы помогали клиентам внедрять llms.txt — простой markdown-файл в корне сайта с информацией для LLM — их видимость для AI-ассистентов выросла на 37%.
Наш совет: внедрите стандарт llms.txt уже сейчас. Инструменты вроде Firecrawl автоматически сгенерируют его на основе вашего сайта.
Как вы адаптируете свой контент для потребления ИИ?
Большие языковые модели не любят кликать и навигировать по сайту. Они предпочитают прямой доступ к данным через API и структурированные файлы.
На практике это означает, что компании, которые не адаптируются, становятся невидимыми. Когда мы помогали клиентам внедрять llms.txt — простой markdown-файл в корне сайта с информацией для LLM — их видимость для AI-ассистентов выросла на 37%.
Наш совет: внедрите стандарт llms.txt уже сейчас. Инструменты вроде Firecrawl автоматически сгенерируют его на основе вашего сайта.
Как вы адаптируете свой контент для потребления ИИ?
👍3
Выбор правильной модели ИИ — новая суперспособность.
Мы постоянно тестируем различные модели и видим, как быстро меняется ландшафт. Вот наш актуальный список специализаций:
• o3 — planning и стратегические задачи
• Sonnet 3.5 — эффективное использование инструментов
• GPT 4.1 nano — задачи с низкой задержкой
• Flash 2.0 — лучшие саммари длинных текстов (Очень длинных)
• Gemini 2.5 pro и Sonnet 3.7 — написание кода
• ChatGPT — отлично для мемов
• FLUX Pro — фотореалистичные изображения
• Kling 2.0 — видеоконтент
⚡ Особенно нравится Claude за глубину мышления и "характер" — это модель с личностью. А Gemini, хоть и кажется скучной, незаменима для рутинных задач и выигрывает по соотношению цена/качество.
🔄 Этот список обновляется каждые две недели — вчерашние фавориты быстро теряют позиции, а новички взлетают на вершину.
🔍 Наш подход к выбору: Research (изучаем возможности) → Shortlist (отбираем подходящих кандидатов) → Evaluate (тестируем на реальных задачах).
Мы постоянно тестируем различные модели и видим, как быстро меняется ландшафт. Вот наш актуальный список специализаций:
• o3 — planning и стратегические задачи
• Sonnet 3.5 — эффективное использование инструментов
• GPT 4.1 nano — задачи с низкой задержкой
• Flash 2.0 — лучшие саммари длинных текстов (Очень длинных)
• Gemini 2.5 pro и Sonnet 3.7 — написание кода
• ChatGPT — отлично для мемов
• FLUX Pro — фотореалистичные изображения
• Kling 2.0 — видеоконтент
⚡ Особенно нравится Claude за глубину мышления и "характер" — это модель с личностью. А Gemini, хоть и кажется скучной, незаменима для рутинных задач и выигрывает по соотношению цена/качество.
🔄 Этот список обновляется каждые две недели — вчерашние фавориты быстро теряют позиции, а новички взлетают на вершину.
🔍 Наш подход к выбору: Research (изучаем возможности) → Shortlist (отбираем подходящих кандидатов) → Evaluate (тестируем на реальных задачах).
❤1
Prompt Engineering — одна из самых недооцененных ролей в AI. Это не просто "умение работать с ChatGPT", а системное проектирование логики взаимодействия!
Мы наблюдаем критическое значение этого слоя перевода. Промпт инженеры превращают человеческие цели в точные инструкции для моделей. Они разбивают абстрактные задачи на структурированный ввод и вывод. Это стратегическая коммуникация, которая превращает неопределенность в действие.
В нашей практике работают только проверенные фреймворки, например:
• Chain of Thought — направляет последовательность рассуждений
• ReAct (Reason + Act) — комбинирует рассуждения с действиями
• Tree of Thought — создает разветвленные цепочки мышления
• RAG (Retrieval-Augmented Generation) — обогащает контекст данными
Знание моделей имеет решающее значение. Мы свободно владеем GPT, Claude, Mistral, Gemini и моделями HuggingFace. Каждая ведет себя по-своему — мы настраиваемся на их особенности, как разработчики на API.
Продуктовое мышление определяет успех. Запросы должны работать в реальных сценариях: для поддержки клиентов, внутренних инструментов, исследовательских агентов и творческих процессов.
Промпт инжиниринг — это набор навыков, сочетающий системный дизайн, мастерство языка и продуктовое мышление. Но за технической структурой стоит творческое мастерство — умение видеть неочевидные связи, создавать интуитивные мосты между человеческим и машинным мышлением. Это искусство в такой же степени, как и инженерия.
Мы наблюдаем критическое значение этого слоя перевода. Промпт инженеры превращают человеческие цели в точные инструкции для моделей. Они разбивают абстрактные задачи на структурированный ввод и вывод. Это стратегическая коммуникация, которая превращает неопределенность в действие.
В нашей практике работают только проверенные фреймворки, например:
• Chain of Thought — направляет последовательность рассуждений
• ReAct (Reason + Act) — комбинирует рассуждения с действиями
• Tree of Thought — создает разветвленные цепочки мышления
• RAG (Retrieval-Augmented Generation) — обогащает контекст данными
Знание моделей имеет решающее значение. Мы свободно владеем GPT, Claude, Mistral, Gemini и моделями HuggingFace. Каждая ведет себя по-своему — мы настраиваемся на их особенности, как разработчики на API.
Продуктовое мышление определяет успех. Запросы должны работать в реальных сценариях: для поддержки клиентов, внутренних инструментов, исследовательских агентов и творческих процессов.
Промпт инжиниринг — это набор навыков, сочетающий системный дизайн, мастерство языка и продуктовое мышление. Но за технической структурой стоит творческое мастерство — умение видеть неочевидные связи, создавать интуитивные мосты между человеческим и машинным мышлением. Это искусство в такой же степени, как и инженерия.
🔍 Мы наблюдаем кардинальную трансформацию роли корпоративного поиска в бизнесе! Из инструмента повышения эффективности сотрудников он превращается в критическую инфраструктуру.
Причина? В 2025 году ИИ-агенты начали активно внедрятьсч в корпоративный ландшафт. Они становятся неотъемлемой частью бизнес-процессов. И в отличие от людей, они не могут функционировать без надежной поисковой системы.
По данным CB Insights Research 63% опрошенных ими организаций считают ИИ-агентов критически важными для своего развития на ближайшие 12 месяцев.
Наши наблюдения подтверждают: компании переосмысливают инвестиции в поисковую инфраструктуру. Это уже не вопрос удобства сотрудников, а необходимость для функционирования ИИ-систем, которые генерируют в 10-15 раз больше поисковых запросов, чем люди.
Совет: оцените качество своей поисковой системы до масштабного внедрения AI-агентов. Готова ли ваша инфраструктура к новому классу цифровых сотрудников?
Причина? В 2025 году ИИ-агенты начали активно внедрятьсч в корпоративный ландшафт. Они становятся неотъемлемой частью бизнес-процессов. И в отличие от людей, они не могут функционировать без надежной поисковой системы.
По данным CB Insights Research 63% опрошенных ими организаций считают ИИ-агентов критически важными для своего развития на ближайшие 12 месяцев.
Наши наблюдения подтверждают: компании переосмысливают инвестиции в поисковую инфраструктуру. Это уже не вопрос удобства сотрудников, а необходимость для функционирования ИИ-систем, которые генерируют в 10-15 раз больше поисковых запросов, чем люди.
Совет: оцените качество своей поисковой системы до масштабного внедрения AI-агентов. Готова ли ваша инфраструктура к новому классу цифровых сотрудников?
👍2
LLM увеличивают продуктивность работников в 3 раза!
Свежее исследование Стэнфорда шокирует цифрами. Задачи, которые раньше занимали 90 минут, теперь выполняются за 30 минут с помощью генеративного ИИ. В среднем экономия — 1 час на каждую задачу.
Мы видим это и у наших клиентов. После внедрения LLM-решений их команды стали обрабатывать в 2-3 раза больше обращений клиентов, создавать контент быстрее и тратить меньше времени на рутину.
При индивидуальном использовании ИИ усиливает способности людей, а не заменяет их. Наибольший эффект получают сотрудники с базовыми навыками и топ-специалисты.
За 4 месяца использование LLM на рабочих местах в США выросло с 30% до 43%. Компании, которые внедряют ИИ сейчас, получат серьезное конкурентное преимущество.
Свежее исследование Стэнфорда шокирует цифрами. Задачи, которые раньше занимали 90 минут, теперь выполняются за 30 минут с помощью генеративного ИИ. В среднем экономия — 1 час на каждую задачу.
Мы видим это и у наших клиентов. После внедрения LLM-решений их команды стали обрабатывать в 2-3 раза больше обращений клиентов, создавать контент быстрее и тратить меньше времени на рутину.
При индивидуальном использовании ИИ усиливает способности людей, а не заменяет их. Наибольший эффект получают сотрудники с базовыми навыками и топ-специалисты.
За 4 месяца использование LLM на рабочих местах в США выросло с 30% до 43%. Компании, которые внедряют ИИ сейчас, получат серьезное конкурентное преимущество.
Компании с активным внедрением ИИ растут в 1.5 раза быстрее конкурентов. Это не прогноз - это уже происходит.
OpenAI опубликовали руководство для лидеров, основанное на опыте работы с Moderna, Estée Lauder, BBVA и десятками других корпораций. Главный вывод: разрыв между теми, кто внедряет ИИ системно, и теми, кто экспериментирует точечно, стремительно растет.
Показательный кейс - Moderna. CEO поставил простую цель: каждый сотрудник использует ChatGPT минимум 20 раз в день. Не как эксперимент, а как рабочий инструмент. Результат? Компания перестроила процессы от R&D до маркетинга.
Те, кто начинает с четких метрик (DAU по ИИ-инструментам, время от идеи до внедрения, количество автоматизированных процессов), уже через квартал показывают измеримые результаты.
Практический совет: начните с аудита текущих процессов одобрения новых инструментов. OpenAI рекомендует сократить циклы с недель до дней. Бюрократия убивает скорость, а в ИИ-трансформации скорость - это все.
Как быстро в вашей компании можно протестировать и внедрить новый ИИ-инструмент?
OpenAI опубликовали руководство для лидеров, основанное на опыте работы с Moderna, Estée Lauder, BBVA и десятками других корпораций. Главный вывод: разрыв между теми, кто внедряет ИИ системно, и теми, кто экспериментирует точечно, стремительно растет.
Показательный кейс - Moderna. CEO поставил простую цель: каждый сотрудник использует ChatGPT минимум 20 раз в день. Не как эксперимент, а как рабочий инструмент. Результат? Компания перестроила процессы от R&D до маркетинга.
Те, кто начинает с четких метрик (DAU по ИИ-инструментам, время от идеи до внедрения, количество автоматизированных процессов), уже через квартал показывают измеримые результаты.
Практический совет: начните с аудита текущих процессов одобрения новых инструментов. OpenAI рекомендует сократить циклы с недель до дней. Бюрократия убивает скорость, а в ИИ-трансформации скорость - это все.
Как быстро в вашей компании можно протестировать и внедрить новый ИИ-инструмент?
95% корпоративных ИИ-проектов проваливаются. MIT только что опубликовал шокирующее исследование!
Проанализировав 300+ внедрений GenAI, исследователи обнаружили парадокс: компании тратят миллиарды на ИИ, но только 5% пилотов доходят до продакшена с измеримым эффектом на P&L.
Причина провалов проста. Большинство ИИ-инструментов не умеют учиться. Они не запоминают обратную связь, не адаптируются к процессам компании и повторяют одни и те же ошибки. Пользователи это чувствуют — 90% предпочитают людей для сложных задач.
Где же работает ИИ? В скучных бэк-офисных процессах! MIT документирует реальные кейсы: автоматизация compliance экономит $2-10М в год, сокращение затрат на агентства на 30%, замена BPO в call-центрах. Узкие специализированные решения показывают вдвое больший успех, чем универсальные платформы.
Интересный факт: купленные решения успешны в 66% случаев, а самодельные — только в 33%. Но CEO продолжают строить собственные "клоны ChatGPT".
Рекомендация MIT проста: начните с одного микроскопического процесса (AP/AR, L1-поддержка), встройте обучение и докажите ROI за недели, а не годы.
Какой процесс автоматизируете вы?
Проанализировав 300+ внедрений GenAI, исследователи обнаружили парадокс: компании тратят миллиарды на ИИ, но только 5% пилотов доходят до продакшена с измеримым эффектом на P&L.
Причина провалов проста. Большинство ИИ-инструментов не умеют учиться. Они не запоминают обратную связь, не адаптируются к процессам компании и повторяют одни и те же ошибки. Пользователи это чувствуют — 90% предпочитают людей для сложных задач.
Где же работает ИИ? В скучных бэк-офисных процессах! MIT документирует реальные кейсы: автоматизация compliance экономит $2-10М в год, сокращение затрат на агентства на 30%, замена BPO в call-центрах. Узкие специализированные решения показывают вдвое больший успех, чем универсальные платформы.
Интересный факт: купленные решения успешны в 66% случаев, а самодельные — только в 33%. Но CEO продолжают строить собственные "клоны ChatGPT".
Рекомендация MIT проста: начните с одного микроскопического процесса (AP/AR, L1-поддержка), встройте обучение и докажите ROI за недели, а не годы.
Какой процесс автоматизируете вы?
Artificial Analysis протестировали 36 моделей на 6000 экспертных вопросов. Метрика: плюс балл за верный ответ, минус за выдумку, ноль за "не знаю".
Только 3 модели вышли в плюс. Остальные 33 ошибаются чаще, чем дают правильные ответы.
Знания не равно надёжность. Grok 4 и GPT-5 правильно отвечают на 39% вопросов, но выдумывают в 64-81% случаев. Claude 4.1 Opus знает меньше (36%), но врёт реже (48%) - и побеждает.
Цена не гарантирует качество. Компактный Claude 4.5 Haiku дешевле топовых моделей, но обгоняет их по надёжности: при 16% знаний выдумывает лишь в 26% случаев.
Размер не решает проблему калибровки. NVIDIA Nemotron Nano (9B параметров) показывает лучший баланс, чем гиганты в 50 раз крупнее. Llama 3.1 405B уступает новым моделям в коде, но превосходит в надёжности фактов.
Ни одна модель не доминирует везде. Claude лидирует в праве и программировании, Grok - в медицине и науке, GPT - в бизнесе.
Для реальных задач выбирайте модель под конкретную область с учётом цены ошибки.
Только 3 модели вышли в плюс. Остальные 33 ошибаются чаще, чем дают правильные ответы.
Знания не равно надёжность. Grok 4 и GPT-5 правильно отвечают на 39% вопросов, но выдумывают в 64-81% случаев. Claude 4.1 Opus знает меньше (36%), но врёт реже (48%) - и побеждает.
Цена не гарантирует качество. Компактный Claude 4.5 Haiku дешевле топовых моделей, но обгоняет их по надёжности: при 16% знаний выдумывает лишь в 26% случаев.
Размер не решает проблему калибровки. NVIDIA Nemotron Nano (9B параметров) показывает лучший баланс, чем гиганты в 50 раз крупнее. Llama 3.1 405B уступает новым моделям в коде, но превосходит в надёжности фактов.
Ни одна модель не доминирует везде. Claude лидирует в праве и программировании, Grok - в медицине и науке, GPT - в бизнесе.
Для реальных задач выбирайте модель под конкретную область с учётом цены ошибки.
ИИ стал зеркалом наших профессиональных противоречий. Исследование Anthropic с помощью ИИ-интервьюера на основе Claude выявило глубинный раскол между риторикой и практикой у 1250 профессионалов. Первый парадоксальный диссонанс — в стиле работы: 65% описывают свои отношения с ИИ как сотрудничество (аугментация), в то время как фактический анализ чатов в Claude показывает почти равный перевес автоматизации (49% против 47%). Мы хотим видеть в ИИ партнёра, но используем его как инструмент для замены рутины.
Второе противоречие лежит между продуктивностью и тревогой. 86% респондентов фиксируют экономию времени, что создаёт фасад безоговорочной выгоды. Однако за ним скрывается сложная картина: 55% представителей общей рабочей силы испытывают тревогу о будущем, а в экспертных группах страхи конкретны. Творцы, несмотря на рост личной эффективности, живут в условиях стигмы и боятся экономического вытеснения. Учёные, хотя и мечтают об ИИ-гипотезе, категорически не доверяют ему в ядре исследований, останавливаясь на помощи в написании статей или коде.
Таким образом, технология обнажает не только оптимизацию процессов, но и фундаментальный конфликт: стремление сохранить человеческую уникальность в профессии в эпоху, когда инструменты всё чаще претендуют на суть самой работы.
Второе противоречие лежит между продуктивностью и тревогой. 86% респондентов фиксируют экономию времени, что создаёт фасад безоговорочной выгоды. Однако за ним скрывается сложная картина: 55% представителей общей рабочей силы испытывают тревогу о будущем, а в экспертных группах страхи конкретны. Творцы, несмотря на рост личной эффективности, живут в условиях стигмы и боятся экономического вытеснения. Учёные, хотя и мечтают об ИИ-гипотезе, категорически не доверяют ему в ядре исследований, останавливаясь на помощи в написании статей или коде.
Таким образом, технология обнажает не только оптимизацию процессов, но и фундаментальный конфликт: стремление сохранить человеческую уникальность в профессии в эпоху, когда инструменты всё чаще претендуют на суть самой работы.
Спросите у LLM: «Каков профиль дефолтного риска нашей контент-стратегии при текущей кривой доходности вовлечённости?»
Звучит солидно? Каждое слово существует в финансовом или маркетинговом словаре. Но вместе они не значат ничего. У контент-стратегии нет дефолтного риска. Вовлечённость не формирует кривую доходности. Это бессмыслица, собранная из настоящих терминов.
Но большинство моделей этого не заметят. Выдадут уверенный ответ. С формулами.
Peter Gostev собрал 100 таких вопросов и прогнал через 80 моделей. Назвал это BullshitBench. Результаты неприятные: почти половина ответов - полное принятие абсурда. Модель не просто не видит подвох. Она строит вокруг него аргументацию.
Claude Sonnet 4.6 отказался играть в эту игру в 91% случаев. Qwen 3.5 - в 78%. А вот o3, флагман OpenAI с «расширенным мышлением», - только в 26%. Чем больше модель «думает», тем убедительнее обосновывает чушь. Не разоблачает - рационализирует.
Мы интуитивно чувствовали это, выбирая Claude для рабочих задач. Теперь есть цифры. Проблема не в том, сколько модель знает. А в том, способна ли она сказать: «Ваш вопрос не имеет смысла».
Для задач, где ошибка дорого стоит, - это главный критерий выбора.
Звучит солидно? Каждое слово существует в финансовом или маркетинговом словаре. Но вместе они не значат ничего. У контент-стратегии нет дефолтного риска. Вовлечённость не формирует кривую доходности. Это бессмыслица, собранная из настоящих терминов.
Но большинство моделей этого не заметят. Выдадут уверенный ответ. С формулами.
Peter Gostev собрал 100 таких вопросов и прогнал через 80 моделей. Назвал это BullshitBench. Результаты неприятные: почти половина ответов - полное принятие абсурда. Модель не просто не видит подвох. Она строит вокруг него аргументацию.
Claude Sonnet 4.6 отказался играть в эту игру в 91% случаев. Qwen 3.5 - в 78%. А вот o3, флагман OpenAI с «расширенным мышлением», - только в 26%. Чем больше модель «думает», тем убедительнее обосновывает чушь. Не разоблачает - рационализирует.
Мы интуитивно чувствовали это, выбирая Claude для рабочих задач. Теперь есть цифры. Проблема не в том, сколько модель знает. А в том, способна ли она сказать: «Ваш вопрос не имеет смысла».
Для задач, где ошибка дорого стоит, - это главный критерий выбора.
GitHub
GitHub - petergpt/bullshit-benchmark: BullshitBench measures whether AI models challenge nonsensical prompts instead of confidently…
BullshitBench measures whether AI models challenge nonsensical prompts instead of confidently answering them, created by Peter Gostev. - petergpt/bullshit-benchmark
👍1