Подробное резюме презентации по инженерному искусственному интеллекту (ИИ) из Сколтеха
Обзор и контекст:
Документ отражает современные достижения и перспективы инженерного ИИ — области, которая сочетает фундаментальные исследования с практическими промышленными применениями.
Тенденции и рынок ИИ:
- Искусственный интеллект становится технологическим ядром предприятий и финансовых организаций, с массовым внедрением в компании из списка Fortune 500.
- Генеративный ИИ (создающий новые данные на основе обученных моделей) и мультиагентные системы (взаимодействующие ИИ-агенты) формируют новую производственную культуру.
- К 2030 году глобальный объем рынка ИИ достигнет 827 млрд долларов, при этом основные игроки — США, Китай, Европа и Россия.
- В США существуют масштабные государственные программы с инвестициями до 500 млрд долларов и ограничениями на экспорт GPU (графических процессоров).
Ключевые технологические тренды:
- Прорыв в генерации видео искусственным интеллектом меняет медиа, рекламу и развлечения.
- Any-to-any мультимодальность — способность ИИ работать с несколькими типами данных (текст, изображения, звук, видео, будущие исследования охватывают запахи и тактильные ощущения).
- ИИ-агенты — автономные программы, адаптирующиеся к потребностям пользователя, построенные на архитектуре микросервисов.
- Embodied AI (воплощённый ИИ) — развитие человекоподобных роботов и автономных систем с использованием генеративных моделей и синтетических данных для обучения манипуляциям и навигации.
- Модели ИИ учатся рассуждать и рефлексировать, решать сложные логические и математические задачи, приближаясь к искусственному общему интеллекту (AGI).
Робототехника и Embodied AI:
- Разработка гуманоидных роботов для промышленного применения (Tesla Optimus Gen 2, Unitree H1, Walker S1).
- Создание крупных синтетических и открытых наборов данных для обучения роботов новым навыкам (например, наливание жидкостей и прокладывание проводов).
- Использование VR-сред и симуляций компаниями Amazon, NVIDIA и Meta для подготовки роботов к реальным условиям.
Мультимодальные большие языковые модели (LLM):
- Разрабатываются модели (NEXT-GPT, OmniFlo, CoDi-2), способные одновременно принимать и генерировать различные типы данных, открывая новые интерактивные возможности.
Архитектуры и память ИИ-агентов:
- Инновационные архитектуры, такие как AriGraph, разделяют память на эпизодическую (события, опыт) и семантическую (общие знания).
- Графы знаний (онтологии) обеспечивают структуру и актуализацию данных для решения сложных инженерных задач.
Примеры инженерных приложений:
- Самообучающаяся модель пласта для нефтедобычи, ускоряющая создание геологических моделей и снижающая трудозатраты на 70%.
- Автоматизированная система управления требованиями в строительстве — переводит документы в машинно-читаемый вид, анализирует семантику, проверяет и помогает инженерам.
- Системы мониторинга рисков — прогноз пожаров, ледовой обстановки в Арктике (применение у Газпром), цифровое моделирование производств.
- Человекоцентричные цифровые двойники — мультиагентные системы для прогнозирования социально-экономического поведения и управления развитием регионов.
Интеллектуальный переход: ANI — EAI — AGI:
- ANI (Artificial Narrow Intelligence) — узкоспециализированный ИИ.
- EAI (Engineering Artificial Intelligence) — интеграция моделей и агентов, способных учиться, планировать и принимать решения.
- AGI (Artificial General Intelligence) — универсальный разумный агент будущего.
- Инженерный ИИ уже включает в себя рассуждение, саморефлексию и комплексное управление.
Безопасность, оптимизация и перспективы:
- Разрабатываются технологии безопасности: аудит, контроль доступа, защита данных.
- Оптимизация вычислений снижает расходы на запуск и применение моделей (инференс).
- Создаются платформы для полного жизненного цикла ИИ, от разработки до эксплуатации.
Обзор и контекст:
Документ отражает современные достижения и перспективы инженерного ИИ — области, которая сочетает фундаментальные исследования с практическими промышленными применениями.
Тенденции и рынок ИИ:
- Искусственный интеллект становится технологическим ядром предприятий и финансовых организаций, с массовым внедрением в компании из списка Fortune 500.
- Генеративный ИИ (создающий новые данные на основе обученных моделей) и мультиагентные системы (взаимодействующие ИИ-агенты) формируют новую производственную культуру.
- К 2030 году глобальный объем рынка ИИ достигнет 827 млрд долларов, при этом основные игроки — США, Китай, Европа и Россия.
- В США существуют масштабные государственные программы с инвестициями до 500 млрд долларов и ограничениями на экспорт GPU (графических процессоров).
Ключевые технологические тренды:
- Прорыв в генерации видео искусственным интеллектом меняет медиа, рекламу и развлечения.
- Any-to-any мультимодальность — способность ИИ работать с несколькими типами данных (текст, изображения, звук, видео, будущие исследования охватывают запахи и тактильные ощущения).
- ИИ-агенты — автономные программы, адаптирующиеся к потребностям пользователя, построенные на архитектуре микросервисов.
- Embodied AI (воплощённый ИИ) — развитие человекоподобных роботов и автономных систем с использованием генеративных моделей и синтетических данных для обучения манипуляциям и навигации.
- Модели ИИ учатся рассуждать и рефлексировать, решать сложные логические и математические задачи, приближаясь к искусственному общему интеллекту (AGI).
Робототехника и Embodied AI:
- Разработка гуманоидных роботов для промышленного применения (Tesla Optimus Gen 2, Unitree H1, Walker S1).
- Создание крупных синтетических и открытых наборов данных для обучения роботов новым навыкам (например, наливание жидкостей и прокладывание проводов).
- Использование VR-сред и симуляций компаниями Amazon, NVIDIA и Meta для подготовки роботов к реальным условиям.
Мультимодальные большие языковые модели (LLM):
- Разрабатываются модели (NEXT-GPT, OmniFlo, CoDi-2), способные одновременно принимать и генерировать различные типы данных, открывая новые интерактивные возможности.
Архитектуры и память ИИ-агентов:
- Инновационные архитектуры, такие как AriGraph, разделяют память на эпизодическую (события, опыт) и семантическую (общие знания).
- Графы знаний (онтологии) обеспечивают структуру и актуализацию данных для решения сложных инженерных задач.
Примеры инженерных приложений:
- Самообучающаяся модель пласта для нефтедобычи, ускоряющая создание геологических моделей и снижающая трудозатраты на 70%.
- Автоматизированная система управления требованиями в строительстве — переводит документы в машинно-читаемый вид, анализирует семантику, проверяет и помогает инженерам.
- Системы мониторинга рисков — прогноз пожаров, ледовой обстановки в Арктике (применение у Газпром), цифровое моделирование производств.
- Человекоцентричные цифровые двойники — мультиагентные системы для прогнозирования социально-экономического поведения и управления развитием регионов.
Интеллектуальный переход: ANI — EAI — AGI:
- ANI (Artificial Narrow Intelligence) — узкоспециализированный ИИ.
- EAI (Engineering Artificial Intelligence) — интеграция моделей и агентов, способных учиться, планировать и принимать решения.
- AGI (Artificial General Intelligence) — универсальный разумный агент будущего.
- Инженерный ИИ уже включает в себя рассуждение, саморефлексию и комплексное управление.
Безопасность, оптимизация и перспективы:
- Разрабатываются технологии безопасности: аудит, контроль доступа, защита данных.
- Оптимизация вычислений снижает расходы на запуск и применение моделей (инференс).
- Создаются платформы для полного жизненного цикла ИИ, от разработки до эксплуатации.
👍5❤1❤🔥1
Резюме документа "Разработка и применение мультиагентных систем в корпоративной среде" от Сбера.
____________________________________
Введение
AI-агент — это автоматизированная система, обладающая способностью к:
Основные компоненты:
AI-агенты используют LLM для планирования и адаптации действий:
Для реализации шагов планов агентам требуется вызывать локальные функции или удалённые API.
Необходима для поддержки диалогов и уточнений с пользователем. Память делится на:
Публичные LLM обучаются на открытых данных, но для корпоративных задач требуется дообучение на специализированных данных (фактические и закрытые). Методы дообучения:
•
______________________________Расширение информационного контекста
Для улучшения качества ответов LLM используется
____________________________________
Введение
В современном быстро меняющемся мире ИТ-ландшафт организаций претерпевает фундаментальные изменения. Конкурентоспособность требует высокой адаптивности, скорости реакции и создания новых ценностей для клиентов. Традиционные детерминированные системы автоматизации требуют длительных циклов разработки при изменении задач. На этом фоне системы на базе искусственного интеллекта (ИИ), способные самостоятельно понимать потребности клиентов, строить планы действий и выполнять их без участия человека, достигают высокой эффективности автоматизации и трансформации бизнес-моделей.оить планы действий и выполнять их безЧто такое AI-агент?
AI-агент — это автоматизированная система, обладающая способностью к:
1. Планированию действий (понимать потребности и строить план),
2. Выполнению плана (самостоятельно совершать задания, используя инструменты для взаимодействия с внешним миром),
3. Автономности (работать без предварительного согласования шагов с человеком).
Автономность отличает AI-агентов от традиционных программ и позволяет им принимать собственные решения.
енении задач. На этом фоне системы наАнатомия AI-агента
Основные компоненты:
• Большие языковые модели (LLM) — интеллектуальное ядро, требующее больших вычислительных ресурсов. В корпоративной среде чаще разворачиваются в облаках или на локальных инфраструктурах с использованием семейства моделей GigaChat.
• Текстовые промпты — инструкции на естественном языке для формирования запросов к LLM.
• Агентные инструменты (API) — программные интерфейсы для взаимодействия агента с внешними системами (например, поиск в интернете, вызов функций).
ого интеллекта (ИИ), способные самостоПланирование действий
AI-агенты используют LLM для планирования и адаптации действий:
• Классический подход - агентный конвейер: определённый граф шагов, некоторые из которых обработаны с помощью LLM.
• Обзор подходов: «Plan & Execute» (полный план с последующим выполнением) и «ReAct» (пошаговое принятие решений).
Пример кода показывает применение GigaChat и поискового инструмента для автоматического составления бизнес-модели Lean Canvas.
и при изменении задач. На этом фоне сиВыполнение плана действий
Для реализации шагов планов агентам требуется вызывать локальные функции или удалённые API.
Большие языковые модели выбирают подходящую функцию и формируют параметры вызова, опираясь на функционал Function Calling.
я. Конкурентоспособность требует высокФиксация хода выполнения (чекпоинтинг)
Чекпоинтинг — фиксация промежуточного состояния агента для обеспечения надёжности, восстановления после сбоев и трассировки работы. Примеры реализации с использованием фреймворка LangGraph.
ьные изменения. КонкурентоспособностьПамять AI-агентов
Необходима для поддержки диалогов и уточнений с пользователем. Память делится на:
• Краткосрочную — хранит активный контекст и недавние взаимодействия.
• Долгосрочную — содержит накопленные знания, факты, историю, онтологии.
Типы памяти:
• Контекстная (история общения, уточнения задач)
• Сущностная (граф знаний о людях, организациях и связях)
нные детерминированные системы автоматЗнания AI-агентов и дообучение
Публичные LLM обучаются на открытых данных, но для корпоративных задач требуется дообучение на специализированных данных (фактические и закрытые). Методы дообучения:
•
Supervised Fine-Tuning (SFT) — дообучение с учителем на размеченных данных (используется для повышения точности и адаптации под конкретные задачи и стиль).
• Reinforcement Learning from Human Feedback (RLHF) — обучение с подкреплением с обратной связью от людей, помогает улучшить качество и устранить вредные ответы.
• Direct Preference Optimization (DPO) — эффективная альтернатива RLHF с меньшими вычислительными затратами.
Специальное внимание уделяется защите конфиденциальных данных при дообучении моделей.
оделей.
______________________________Расширение информационного контекста
Для улучшения качества ответов LLM используется
❤4❤🔥1👌1
Retrieval-Augmented Generation (RAG) — поиск релевантной информации из специализированных баз знаний с включением её в запросы к модели. Это снижает ошибки и необходимость постоянного дообучения.
____________________________________
Взаимодействие с пользователем
AI-агенты взаимодействуют через графические, текстовые или голосовые интерфейсы, которые обеспечивают двустороннюю коммуникацию. Популярны «обогащённые агентами приложения», объединяющие стандартные интерфейсы с логикой AI-агентов, позволяя пользователю работать с привычным приложением и одновременно вести диалог с агентом.спечивают двустороннюю коммуникацию. ПМультиагентные системы (MAS)
MAS — это группы специализированных AI-агентов, которые взаимодействуют для решения комплексных задач. Ключевые особенности:
• Специализация: агенты экспертны в конкретных областях.
• Разные роли: пользовательские агенты взаимодействуют с людьми; агенты-координаторы управляют распределением задач и контролем; продуктовые агенты обеспечивают выполнение бизнес-функций.
• Взаимодействие происходит через стандартизированные протоколы коммуникации, что облегчает масштабирование и управление.ботать с привычным приложением и одновБезопасность и контроль
Обеспечение безопасности MAS включает:
• Контентные фильтры — блокировка вредоносного и неэтичного контента.
• Ограничители действий — контроль доступа и подтверждение критичных операций.
• Системы мониторинга — журналирование, обнаружение аномалий.
• Валидация ввода-вывода — фильтрация запросов и данных.ые интерфейсы, которые обеспечивают двСреда исполнения AI-агентов
Специализированные среды исполнения обеспечивают:
• Унифицированный подход к запуску агентов,
• Контроль кибербезопасности,
• Надёжность и переносимость,
• Средства мониторинга, балансировки нагрузки и управления жизненным циклом агентов.
Среда реализуется с использованием контейнеров и serverless-технологий.фейсы, которые обеспечивают двустороннУправление AI-хабами и агентами
Система управления включает:
• Реестры агентов с децентрализованным хранением метаданных,
• Механизмы регистрации и жизненного цикла,
• Меры безопасности (аутентификация, шифрование),
• Интеграцию с платформами мониторинга и аналитики,
• Средства для администраторов и владельцев агентов для оценки производительности и выявления аномалий.ороннюю коммуникацию. Популярны «обогаЗаключение
Создание эффективных мультиагентных систем — вызов для индустрии, где ключевым является четкое определение задач, ролей и ограничений агентов для обеспечения надежной работы.
Соответствующие платформы, объединяющие разработку, безопасность, мониторинг и масштабируемость, являются основой успешных корпоративных решений на базе генеративного ИИ.
Инвестиции в такие платформы — залог долгосрочной конкурентоспособности бизнеса и повышения качества продуктов.
👍3
Forwarded from Александра Кулагина
Друзья, стартовал прием заявок на наш Демодень, который пройдет очно в «Академике» 4 декабря.
Лайк, шер, репост, как говорится🙂
Лайк, шер, репост, как говорится
Please open Telegram to view this post
VIEW IN TELEGRAM
👌2
Forwarded from Chief Innovation Channel
#hot_news
🔥 «Ростелеком» и «Акселератор ФРИИ» открыли скаутинг технологических компаний в сферах ИИ и Бизнестеха
В декабре пройдет демодень «Окно возможностей», где топ-10 перспективных технологических компаний представят свои решения перед «Ростелекомом» и лидерами рынка. Лучшие команды смогут масштабироваться через реальные бизнес-партнерства.
📌 Программа ориентирована на зрелые стартапы и технологические компании с выручкой от 50 млн рублей в год . Участие открывает доступ к:
- экспертной оценке.
- новым клиентам.
- пилотам с «Ростелекомом» и его партнерами.
- а также потенциальным инвестициям.
Анастасия Демидова, руководитель направления инвестиций и трансформации бизнеса «Акселератора ФРИИ»:
Третья волна будет посвящена решениям в сфере автоматизации, роботизации, искусственного интеллекта, e-commerce, клиентского опыта и других направлений.
Подать заявку можно до 7 ноября на сайте.
Подробности | Сайт Центра
В декабре пройдет демодень «Окно возможностей», где топ-10 перспективных технологических компаний представят свои решения перед «Ростелекомом» и лидерами рынка. Лучшие команды смогут масштабироваться через реальные бизнес-партнерства.
- экспертной оценке.
- новым клиентам.
- пилотам с «Ростелекомом» и его партнерами.
- а также потенциальным инвестициям.
Анастасия Демидова, руководитель направления инвестиций и трансформации бизнеса «Акселератора ФРИИ»:
Нам важно не просто находить перспективные технологические команды, но и создавать условия для их устойчивого роста в партнерстве с крупным бизнесом.
Третья волна будет посвящена решениям в сфере автоматизации, роботизации, искусственного интеллекта, e-commerce, клиентского опыта и других направлений.
Подать заявку можно до 7 ноября на сайте.
Подробности | Сайт Центра
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4❤2❤🔥1
Я думаю Sora 2 это основное событие в мире AI за последние несколько дней:)
Sora 2 — вызвал настоящий взрыв в App Store.
Новое AI-приложение от OpenAI позволяет создавать короткие вирусные ролики с любыми героями — от Марио до Пикачу. Ты просто выбираешь персонажа, добавляешь свой голос или эффект, и получаешь крутое видео за пару секунд. Приложение уже стало №1 по скачиваниям и активно обсуждается во всех соцсетях.
Вокруг Sora сразу возник скандал: в роликах появились известные мультгерои, и индустрия забила тревогу о правах. OpenAI объявила — теперь авторам персонажей будут платить долю с самых популярных видео, а управлять использованием своих образов смогут только они.
Sora 2 — квантовый скачок для креаторов. Медиа уже никогда не будут прежними!
Залип в этом приложении - хорошо, что воскресенье))
Sora 2 — вызвал настоящий взрыв в App Store.
Новое AI-приложение от OpenAI позволяет создавать короткие вирусные ролики с любыми героями — от Марио до Пикачу. Ты просто выбираешь персонажа, добавляешь свой голос или эффект, и получаешь крутое видео за пару секунд. Приложение уже стало №1 по скачиваниям и активно обсуждается во всех соцсетях.
Вокруг Sora сразу возник скандал: в роликах появились известные мультгерои, и индустрия забила тревогу о правах. OpenAI объявила — теперь авторам персонажей будут платить долю с самых популярных видео, а управлять использованием своих образов смогут только они.
Sora 2 — квантовый скачок для креаторов. Медиа уже никогда не будут прежними!
Залип в этом приложении - хорошо, что воскресенье))
❤🔥7😁2💊2👍1
😁3❤1👌1🤡1
Прибыл на Финнополис-2025 вместе с командой кластера «XTeхнологии». Впереди — несколько насыщенных дней работы: нас ждут выступления, деловые сессии и подписание важных соглашений о сотрудничестве с ведущими игроками отрасли.
В этом году юбилейный X форум Финнополис в Сочи посвящён развитию современной финансовой экосистемы России: от цифровой идентичности и цифровых активов до новых моделей взаимодействия государства, бизнеса и общества. Форум объединяет профессиональные дискуссии о трендах, разбор практических кейсов и демонстрацию самых современных технологий в финтехе.
В этом году XТехнологии представит на Финнополисе прорывные решения в области импортозамещения, ИИ-банкинга, платежных решений и рекламных технологий для финансового сектора - подробности совсем скоро!
В этом году юбилейный X форум Финнополис в Сочи посвящён развитию современной финансовой экосистемы России: от цифровой идентичности и цифровых активов до новых моделей взаимодействия государства, бизнеса и общества. Форум объединяет профессиональные дискуссии о трендах, разбор практических кейсов и демонстрацию самых современных технологий в финтехе.
В этом году XТехнологии представит на Финнополисе прорывные решения в области импортозамещения, ИИ-банкинга, платежных решений и рекламных технологий для финансового сектора - подробности совсем скоро!
👍10❤4🔥4