Нейросети в бизнесе | Insight AI
466 subscribers
68 photos
4 videos
23 links
insightai.ru
Присоединяйтесь к самым знаковым и успешным компаниям мира, которые используют возможности ИИ для достижения исключительных результатов.

По всем вопросам: @insight_ai_ru
Download Telegram
Подготовили статью, почему точность прогноза в 90% ≠ деньги для бизнеса.

Метрики WAPE и MAPE ничего не говорят о реальных финансовых рисках. Стоит прочитать, чтобы понять, в чем заключается главный парадокс и как перейти от "академической точности" к системе, которая реально управляет спросом и зарабатывает.


Читайте, чтобы узнать, почему необходимо:


— Пересчитывать ошибки в деньги. Хороший прогноз — это не минимальная ошибка, а минимальный денежный убыток. Вы узнаете, как взвешивать ошибки по марже и почему недозаказ в критичных категориях в разы дороже, чем перезаказ.

— Управлять риском, а не цифрой. Как уходить от точечного прогноза ("продадим 100 шт.") к вероятностному распределению. Это позволяет бизнесу осознанно выбирать уровень риска (OOS vs. излишки) и точно рассчитывать страховой запас под конкретную цель.

— Смотреть на прогноз как на продукт. Почему модель должна выдавать не просто число, а рекомендуемый заказ с оценкой денежной стоимости ошибки (потери при недозаказе vs. затраты на перезапас), чтобы закупки и логистика принимали решения, а не гадали.

Читать 👉🏻 здесь
7🔥5👏2
Компьютерное зрение. Когда машина видит лучше и быстрее человека

На этой неделе будем обсуждать компьютерное зрение (CV), расскажем, как это работает, где используется, и покажем наши кейсы в этом направлении.

Computer Vision (CV) - это область искусственного интеллекта, которая позволяет системе видеть и понимать визуальную информацию: видео и изображения. По сути, мы учим компьютер выполнять зрительный анализ быстрее, надежнее и точнее, чем человек.

Как это функционирует?

Сначала мы ставим "глаза" системы - камеры, которые собирают данные о рабочих процессах (в магазинах, на улицах, в кофейнях, на заводах) → затем эти данные размечаются специальными людьми: мы объясняем машине, что такое "брак" или "каска". Обучение это происходит на очень большом объеме видео и изображений → после этого разрабатывается ML-модель → и на финальный этап - интеграция этой модели в IT-контур заказчика, чтобы она работала в режиме реального времени и приносила результат.

Статика и динамика

👉🏻Статика или аналитика фиксированных процессов. Это высокоточный контроль, где камера имеет определенную заданную позицию. Системы используют промышленные сенсоры, чтобы, например, выявлять микродефекты (брак, маркировка, упаковка) прямо на конвейере.

👉🏻Динамика или мониторинг поведения. CV работает со сложным контекстом, проводя multi-object tracking и анализируя траектории. Например: в ритейле это может быть анализ длины очередей и оптимизация персонала. На производстве - контроль соблюдения правил охраны труда (ношение касок или других средств безопасности) с немедленным уведомлением о нарушении и т.д.

Где применяется?

На данный момент CV является прикладным инструментом и часто используется в:

— промышленности: проверка качества на конвейере, предиктивная диагностика оборудования, контроль технологических процессов.

— ритейле и E-commerce: мониторинг выкладки, анализ покупательского трафика, предотвращение потерь и оптимизация товарных запасов.

— логистики: автоматизация учета и классификации грузов, контроль загрузки транспорта и мониторинг складских операций.

— строительство: мониторинг соблюдения техники безопасности и другое.

В отличие от многих хайповых технологий, Computer Vision - это прикладной ИИ, который работает здесь и сейчас. Он требует инвестиций (больших), но эти инвестиции окупаются контролем и скоростью.
🔥95👍5
Excel больше не справляется: как мы рассказали TAdviser про ML-прогнозы

Вместе с изданием TAdviser обсудили, почему в 2025 году бизнесу уже недостаточно классических методов анализа.

Главные тезисы материала:

— Почему главная сложность в Computer Vision на заводе — это не модель, а пыль, вибрации и саботаж на местах.

— Как переход от Excel к ML-моделям повышает точность прогнозирования спроса в 2-3 раза.

ТОП-3 ИИ-продукта прямо сейчас: персональные рекомендации, интеллектуальный документооборот и логистические прогнозы. Где ROI виден быстрее всего?

80% успеха — это не код модели, а чистые данные и культура их сбора.

Читать подробнее 🔗
🔥75👍2🥰2
Как мы стали показывать наши продукты, а не рассказывать про них

В enterprise-сегменте время красивых презентаций подходит к концу. Какими бы информативными и классными ни были слайды, главный вопрос, который мы слышим от бизнеса на каждой встрече: «а как это можно пощупать? как это будет выглядеть у нас?»

Специфика нашей работы в том, что 98% искусственного интеллекта - это подводная часть айсберга. Это сложные бэкенд-процессы, пайплайны данных и ML-модели, работу которых невозможно увидеть глазами. Часто результатом многомиллионного проекта становится просто точная цифра прогноза.

Чтобы сделать технологии понятными и прозрачными, мы немного изменили подход к демонстрации наших проектов

Теперь для большинства наших решений мы готовим демо-версии. Мы переводим сложный код в понятные визуальные интерфейсы с графиками и дашбордами, где пользователь может взаимодействовать с данными.

Что это дает клиенту? Вместо абстрактных алгоритмов можно увидеть цифровую копию для бизнеса:
— конкретные товары и их движение
— реальные сроки поставок и загрузку складов
— подсвеченные зоны риска: где прогнозируется дефицит, а где — затоваривание
— аналитику по контрагентам, которая показывает сбои в цепочках поставок


Прозрачность - это наша база. Демка помогает увидеть за сложным кодом реальную пользу. Это больше не абстрактная нейросеть, а понятный инструмент.

Мы готовы не просто рассказывать, а показывать. Запишитесь на демонстрацию решений Insight AI, чтобы увидеть, как наши алгоритмы работают с вашими данными.

Записаться на конкультацию 🔗
🔥72👍2
Магия ИИ делается руками или как происходит разметка данных для компьютерного зрения


Нейросеть не сама учится видеть дефекты на трубах или распознавать товары на полке. Прежде чем модель начнет «видеть», ей нужно показать тысячи примеров, обведенных человеческой рукой.


Как происходит процесс сбора датасета для CV

1. В самом начале устанавливаются камеры на объект (будь то стройплощадка или кофейня) или используются существующие датасеты и начинается работа с видеопотоком. Обучать модель на 25 кадрах в секунду - дорого и бессмысленно (кадры почти одинаковые). Мы режем видео на фреймы. Берем, например, 1 кадр в секунду или используем алгоритмы, которые выдергивают только моменты, где в кадре появилось движение. Из часового видео с камеры наблюдения получается набор из 1000-3000 уникальных картинок.

2. Инструкция сложнее, чем код. Это самый важный этап. Нельзя просто сказать разметчику: «выдели брак». Для человека трещина - это трещина. Для алгоритма нужно ТЗ уровня юридического документа:
— выделять трещину с запасом в 2 пикселя?
— если трещина уходит в тень, мы ее размечаем?
— пятно грязи, похожее на трещину - это брак?

Если инструкция плохая - датасет будет мусорным. Garbage In — Garbage Out

3. Краудсорсинг и магия за 1 рубль. Штатные инженеры никогда не занимаются разметкой. Это делают крауд-платформы (например, в России это Яндекс.Толока). Тысячи людей (асессоров) сидят по всему миру и размечают картинки за небольшую плату (условно, 1–2 рубля за задание).

4. Чтобы проверять асессоры на халтуру и чтобы модель не научилась ерунде, используются методы проверки:

Overlap: одно и то же фото размечают 3 разных человека. Если их ответы совпали - данные идут в обучение. Если один выделил каску, а двое нет - кадр летит на перепроверку.

Honeypots: в задания подмешиваются проверочные примеры, ответ на которые мы знаем заранее. Если асессор ошибся на контрольном задании - вся его работа аннулируется.

CV — это на 20% математика и на 80% работа с данными. Модель может быть сколь угодно мощной, но если скормить ей плохие данные - она будет уверенно и быстро ошибаться.
👍86🔥6
Поздравляем с Новым годом от команды Insight AI🎄

В следующем году вас ждет больше контента про искусственный интеллект и автоматизацию бизнес процессов!

Stay tuned!
7🔥5👍3👏1
Выходим с праздников с новыми темами🔥

Обсудим сегодня, почему OpenAI побеждает в гонке и в чем феномен компании? Часть 1

OpenAI не придумали архитектуру с нуля. Технически архитектуру «трансформеров» (то самое «T» в GPT) придумали в Google в 2017 году (а исследования начались с 2014 года). Почему тогда Google сейчас в роли догоняющего, а OpenAI - синоним ИИ?

Основная причина в том, что их UX победил технологии, которые были «до». Пока конкуренты делали сложные интерфейсы с кучей настроек, OpenAI предложили радикальный минимализм. Окно чата, кнопка «отправить» и больше ничего. И именно этот дизайн-код стал золотым стандартом - теперь каждый второй AI-стартап копирует интерфейс ChatGPT. Они первыми поняли, что людям нужна не модель, а собеседник.

И эта простота привела к формированию привычки. Сейчас многие люди перестали пользоваться поисковиком, потому что быстрее и удобнее спросить у чата. Настолько формат понравился пользователям, что за первые 5 дней ChatGPT набрал 1 миллион рекордных пользователей (этот рекорд кстати следующим побил только Threads в 2023 году).

И сейчас аудитория OpenAI - это ~250 млн активных пользователей в неделю.


Для B2B они тоже дали уникальность. Они первыми начали продавать не модель, а операционку для бизнеса. До OpenAI внедрение языковых моделей (даже с инструментами вроде LangChain) было больной темой из-за сложной настройки и тяжелого входа.

Альтман и команда сделали всё просто: понятные тарифы, оплата за токены и, главное, - простейшая API. Есть админка, готовые примеры кода и документация. Не нужно ничего изобретать. Просто берешь ключ и встраиваешь ИИ в свой продукт за вечер. Комфорт для разработчиков тоже добавил к их популярности.

Интересный факт: одним из наиболее ранних и громких заявлений, связанных с OpenAI - был турнир по Dota 2 на The International в 2017 году, где профессиональный игрок Dendi играел против бота OpenAI ии проиграл.
7🔥5👍4🤔1
Ранее мы разбирали теорию компьютерного зрения и то, как собираются данные. Теперь переходим к практике. Рассказываем про наш большой и технически сложный проект в строительстве.

Когда к нам пришли сотрудники крупной строительной компании, у них не было готового ТЗ, но было понимание, что нужно внедрять ИИ, чтобы снизить риски травматизма и понимать, чем реально заняты рабочие на стройплощадках. Из всех гипотез мы выбрали самую актуальную – автоматизированный контроль безопасности и активности.

Что делает наша система? В режиме реального времени нейросеть анализирует видеопоток и видит:
— носят ли рабочие каски и жилеты;
— нарушения: курение в неположенных местах, бросание предметов;
— ЧП: факты падения людей или грузов;
— эффективность: сколько времени бригада работает, а сколько – отдыхает.

Ключевые этапы реализации

1. Подготовили инфраструктуру. 90% успеха в CV – это исходная картинка. Мы начали с аудита и увидели, что старые камеры выдают слишком низкое качество, на котором нейросеть не увидит деталей. Мы разработали жесткие технические требования, а клиент оперативно закупил и повесил новые камеры с высоким разрешением.

2. Чтобы обучить модель, нужны терабайты видео. Новые камеры несколько месяцев в режиме 24/7 писали жизнь стройки: работу, перекуры, движение техники. Весь этот массив данных передавался нам для обработки.

3. Самым объемным этапом была разметка полученных данных. Данные мало собрать, их нужно объяснить машине. Мы привлекли асессоров, которые вручную размечали каждый кадр специальными рамками:

Красный бокс – строитель
Зеленый бокс – инструмент (перфораторы, молотки)
Синий бокс – каска


4. Мы использовали архитектуру YOLO – на сегодня это золотой стандарт для детекции объектов. Мы не учили её с нуля, а использовали метод дообучения на собранных данных клиента. Это позволило модели учитывать специфику конкретных стройплощадок.

💡 Интересный факт: была проблема, как визуально отличить рабочего от прораба. Чтобы повысить точность без усложнения кода, клиент внедрил новое правило: все рабочие носят яркие каски. Прорабы – каски другого цвета. Это простое решение позволило системе безошибочно разделять роли сотрудников.

Сроки реализации проекта составили около 6 месяцев, где около 70% этого времени ушло на сбор и кропотливую разметку данных.
👍9🔥63👏1
Феномен OpenAI. Часть 2

В первой части мы разобрали, как OpenAI выиграли за счет UX и простоты. Теперь посмотрим на железо. Красивый и удобный чат – это только одна из причин такой популярности OpenAI.

Настоящее доминирование строится на ресурсах, которые недоступны 99% компаний в мире.

1. Главный козырь, который дал буст компании, – стратегическое сотрудничество с Microsoft. Успех Альтмана был бы невозможен без инфраструктуры Azure.

Эта сделка дала стартапу критическое преимущество:
— Microsoft инвестировал в OpenAI суммарно около $13 млрд.
— Для обучения GPT-4 был построен суперкомпьютер, входящий в топ-5 мощнейших систем мира.
— Microsoft тестирует модели на своих сотрудниках и внедряет их в Office и GitHub, давая OpenAI колоссальный фидбек и дистрибуцию.


2. Обучение моделей уровня o1 требует астрономических ресурсов. Основная «рабочая лошадка» NVIDIA H100. Microsoft и Meta* главные покупатели этих видеокарт в мире, создавая дефицит для остальных.

Также дата-центры потребляют столько электричества, что простой розетки не хватает. Дошло до того, что Microsoft планирует перезапустить энергоблок на легендарной АЭС Три-Майл-Айленд специально для питания своих ИИ-кластеров.

3. Сейчас еще обсуждается проект Stargate – совместный дата-центр Microsoft и OpenAI стоимостью $100 млрд (запуск ориентировочно к 2028 году). Если это случится, отрыв от конкурентов по вычислительной мощности станет практически непреодолимым.

Итог простой: догнать OpenAI сложно, потому что они играют в другой лиге. У них есть лучшее железо, безлимитное облако Azure, своя ядерная энергия и API, ставшая стандартом.


*Meta признана экстремистской организацией и запрещена в РФ.
7👍4🔥4👏1
Сейчас все чаще можно услышать про мультимодальные модели. Рассказываем, что это вообще значит и как развиваются нейросети

2025 год стал годом перехода от LLM (Large Language Models) к LMM (Large Multimodal Models).

ИИ научился видеть, слышать, говорить и понимать мемы.


Как это работает

Вся магия происходит в векторном пространстве. Для компьютера и слово «кот», и фотография кота, и аудиозапись мяуканья это просто наборы цифр и кода.

Задача мультимодальной модели создать такое математическое пространство, где вектор слова «кот» и вектор картинки с котом будут находиться в одной точке координат. Модели все равно, в каком формате вы подали информацию. Для неё .jpg, .mp3 и .txt это один и тот же смысл, просто упакованный в разные контейнеры.

Старый и новый подход. Это самый интересный технический момент прямо сейчас.

1️⃣ Старый подход (каскадный) – раньше, чтобы чат-бот «увидел» картинку, работала цепочка из разных моделей. Одна нейросеть переводила картинку в текстовое описание → передавала этот текст в LLM → LLM выдавала ответ текстом → следующая text-to-speech модель озвучивала его.

Минус: терялись интонации, эмоции и детали. Задержка была огромной.

2️⃣ Новый подход (нативный) – так работают GPT-4o и Gemini 1.5. Это одна гигантская нейросеть, которую сразу учили на всём: ей скармливали видео, текст и звук одновременно. Она не переводит звук в текст, чтобы понять его. Она работает с аудио-патчами напрямую.

Результат: именно поэтому новый ИИ может петь, менять интонацию, слышать ваше дыхание или сарказм. Он не «читает» ваш голос, он его «слышит».


Текстовые модели часто галлюцинировали, потому что учились только по книжкам. Для них слово «яблоко» было просто математической связью со словом «фрукт». Мультимодальность дает ИИ то, что называется grounding привязку к физическому миру. Теперь «яблоко» для модели это визуальный образ (круглый, красный), звук хруста и физический объект.

Интересный пример работы такой технологии – это мемы. Чтобы понять мем, недостаточно просто считать текст или распознать картинку. Нужно понять контекст связи между картинкой и подписью. И сегодня мультимодальные модели научились объяснять смысл шутки.

В следующем посте расскажем, как теперь нейросети учатся не только «видеть», но «действовать» на основе увиденного.
9👍7🔥5👏1
Месяц назад мы уже рассказвали про новые интересные ИИ-кейсы на российском рынке, и сейчас хотим сделать это регулярной рубрикой. Продолжаем разбирать реальные кейсы внедрения искусственного интеллекта👇🏻

Unisender и письмо с нуля за 20 секунд

Unisender решил вернуть маркетологам то рабочее время, которое они тратили на рутинный подбор тем, текстов и картинок для рассылок.

Компания интегрировала полноценное ИИ-ядро прямо в редактор писем. Система управляет генерацией контента «под ключ»: от идеи до верстки. Для визуалов внедрили связку Stable Diffusion и Fooocus (отказавшись от Midjourney ради большей точности для бизнеса). ИИ стал выполнять до 100 фоновых запросов к нейросетям, чтобы собрать готовое письмо за 20 секунд.

Дополнительно подключили ИИ-антиспам, который с точностью 99,6% прогнозирует попадание в фильтры.

Каждое четвертое письмо на платформе сегодня создается с помощью ИИ (это ~700 рассылок в день). Себестоимость подготовки контента снизилась в разы, а клиенты перестали «сжигать» бюджеты на недоставленные письма.


Авиакомпания Азимут и первая линия поддержки, которая читает регламенты

У Азимута была классическая для авиакомпаний проблема высокой загруженности контакт-центра, который хотелось освободить от рутины и сложных запросов, не теряя качество ответов в пиковые нагрузки и ночное время.

Решением стало внедрение ИИ-ассистента на базе GigaChat и архитектуры RAG. Система генерирует ответы, обращаясь напрямую к базе пассажирской документации и регламентов. ИИ понимает сложные формулировки и находит нюансы правил перевозки, которые человек мог бы искать долго.

Сейчас бот закрывает 86% входящих запросов, работая как полноценная первая линия 24/7. Авиакомпания сократила расходы на найм новых операторов на фоне роста пассажиропотока до 9,5 млн человек.


Сеть парикмахерских Чио Чио и контроль качества в 800+ салонах

Компании потребовалось масштабировать контроль качества на огромную сеть франшиз (800+ точек), где ручные проверки стали слишком долгими и дорогими.

Сеть салонов сделала большую технологическую платформу, где стали использоваться:
— Computer Vision. Камеры в реальном времени следят за стандартами от скрипта приветствия до дезинфекции инструментов.
— Финансовый контроль. ML-алгоритмы анализируют кассовые операции и мгновенно ловят аномалии (например, деньги мимо кассы).
— Клиентский сервис. Умный голосовой бот забрал на себя запись клиентов, а генеративный AI-стилист (на базе Diffusion и GAN) помогает примерять образы по фото, снимая страх перед неудачной стрижкой.

В результате, единое аналитическое ядро находит лучшие практики (например, как приветствие влияет на чек) и масштабирует их на всю сеть. Качество и прозрачность сохранены при миллиардных оборотах без раздувания штата.


Если вы хотите реализовать похожий кейс (или совсем другой) — пишите для консультации: sales@insightai.ru
🔥107👍5👏1
Рынок ИИ-ботов в России. Большой разбор Insight AI. Часть 1

3 месяца назад мы провели большое исследование рынка платформ, создающих ботов на основе искусственного интеллекта. Наша команда поговорила с теми, кто покупает (от владельцев кофеен до enterprise-компаний и госкорпораций), и протестировала тех, кто продает (от стартапов до вендоров-гигантов).

За прошедший год рынок пережил настоящий бум. Новых платформ сотни, но большинство из них – это просто «обертка» Chat GPT или других нейросетей.


Мы создали серию постов на основе исследования, чтобы рассказать про рынок и на что стоит обращать внимание при выборе подрядчика.

На чем всё держится?

Большинство платформ сейчас – это просто красивая оболочка для ChatGPT, чьи ответы часто разочаровывают бизнес. Но настоящим стандартом становится именно гибридная архитектура. Только так можно получить предсказуемую LLM.

Побеждает связка Script + NLU + RAG:


Жесткая логика: если клиент спрашивает «какая цена?», отвечает скрипт. Это дешево, быстро и 100% точно.
Понимание намерений (NLU): классификатор определяет, что хочет клиент («купить», «жалоба», «справка»), и направляет его в нужную ветку.
Генерация (LLM + RAG): если вопрос сложный, подключается нейросеть. Она ищет ответ в базе знаний компании (PDF, сайт, Excel) и формулирует ответ. Технология RAG главный борец с галлюцинациями.

Какие платформы есть на рынке

Мы разделили игроков примерно на три группы

1. No-code RAG платформы


Чаще всего это решения для малого бизнеса, обещания которых звучат так: «загрузи PDF, и бот готов за 5 минут». В реальности это и есть те самые «обертки» над API OpenAI или Claude.

Они отлично работают как «умный FAQ» для ответов на вопросы вроде «до скольки вы работаете?». Но шаг влево и бот ломается. Такие решения не умеют совершать сложные действия (забронировать стол, проверить остатки на складе), потому что у них нет доступа к бизнес-процессам. Да и с качеством ответов часто бывают проблемы, бот может галлюцинировать, потому что внутри него нет выстроенной логики.

Цена: подписка стоит от 2 000 до 15 000 руб./мес.

2. Гибридные конструкторы (low-code)

Это уже решения для среднего бизнеса. Здесь можно собрать сложную логику: «если клиент VIP соедини с менеджером, если нет предложи скидку».

Они признают, что ИИ может врать, поэтому критические этапы (оплата, запись) делают на жестких скриптах, а общение отдают нейросетям. Практически всегда это low-code платформы, а не no-code. Чтобы сделать качественно, нужен архитектор или интегратор. Самому разобраться сложно.

Стоимость решения:
— внедрение: от 50 000 до 300 000 ₽ (единоразово)
— техническая поддержка: фиксированный ежемесячный платеж
— оплата за использованные токены


3. Интеграторы для enterprise-компаний

Это не уже конструкторы, а интеграторы. Они продают не софт, а проект внедрения. Крупному бизнесу помимо функционирования бота важны еще:

— on-premise размещение: бот должен жить на их серверах
— безопасность и 100% точность выдаваемой информации

Цена: от 1 млн до 10 млн+ руб.

В следующем посте расскажем про инсайты от малого бизнеса, его потребности и проекты, которые помогают этой аудитории.
👍87🔥6👏1
This media is not supported in your browser
VIEW IN TELEGRAM
Google показала Genie 3

Пока все учились генерировать видео, Google пошел дальше. Genie 3 – модель, которая создает не просто картинку, а интерактивную среду.

В чем революция? Это не пререндер. Вы пишете промпт, и нейросеть создает мир, которым можно управлять. Вы нажимаете «вперед» – и ИИ дорисовывает реальность в реальном времени, реагируя на ваши действия. Это полноценный прототип игры без единой строчки кода и движка.

«Да, пока это выглядит как игрушка, но впечатляет безумно. Если технология вырастет во что-то вроде v0 (нейросеть для генерации UI-кода), но для геймдева – индустрия может измениться кардинально».

— Михаил, CEO Insight AI
🔥83👍3
Выходим из зума в реальный цех

Наша команда регулярно посещает производства клиентов. Никакие зум-коллы не заменят живого визита в цех, чтобы понять боль бизнеса.

Недавно были на заводе по производству соевого соуса и азиатских соусов для готовки (их продукция скорее всего стоит у вас в холодильнике😁). Разобрали с клиентом две конкретные задачи, где компьютерное зрение может сэкономить часы ручного труда и исключить брак.

Личный визит снимает кучу вопросов. Мы своими глазами видим нюансы, которые легко упустить обращая внимание только на разработку, а заказчик видит в нас партнеров, которые говорят с производством на одном языке, а не просто пишут код.
8🔥8👍7💯1