Нейросети в бизнесе | Insight AI
529 subscribers
68 photos
4 videos
23 links
insightai.ru
Присоединяйтесь к самым знаковым и успешным компаниям мира, которые используют возможности ИИ для достижения исключительных результатов.

По всем вопросам: @insight_ai_ru
Download Telegram
Кейс Insight AI ❤️ Как мы сэкономили 300 млн рублей для дистрибьютора автоэмалей «РЕФИНИШ АВТОЛАК»

Предиктивная аналитика — это процесс использования данных и алгоритмов машинного обучения для прогнозирования будущих событий.

Задача: крупный дистрибьютор (600+ SKU) столкнулся с проблемой, усиленной 6-месячным циклом поставки. Старый метод прогнозирования (среднее по продажам) давал низкую точность. Это приводило к двум проблемам:
1. Затоваривание склада: миллионы рублей были заморожены в неликвидном товаре.
2. Упущенная выгода: постоянный дефицит ходовых позиций приводил к потерям до 300 млн рублей в год.

Решение: предиктивная аналитика на основе нейросетей. Мы разработали систему прогнозирования спроса, которая позволяет заглядывать на год вперед с разбивкой по месяцам. Вот как это работает глобально:

— Сбор и обработка данных: 90% успеха в машинном обучении — это качественные данные. Мы собрали всю историю продаж клиента за несколько лет. Данные изначально не были приведены к единой форме, что требуется для работы нейросетей.
— Обогащение внешними данными: к историческим продажам мы добавили множество внешних факторов, которые могут влиять на спрос: курс доллара, маркетинговые активности, демографические данные и даже информацию о действиях конкурентов.
— Обучение модели: мы протестировали несколько алгоритмов машинного обучения, чтобы найти тот, который лучше всего работает именно с данными клиента и его спецификой.
— Интеграция: готовое решение мы интегрировали прямо в BI-систему заказчика, чтобы сотрудники могли видеть прогнозы в привычном для себя интерфейсе.

Ключевой фактор успеха: учет сезонности
Зимний пик: продажи росли, потому что зимой из-за погодных условий увеличивается количество аварий, что ведет к необходимости ремонта автомобилей.
Летний пик: продажи также росли в теплое время года, так как хорошая погода позволяет людям заниматься самостоятельной покраской автомобилей на улице.


Человеку сложно вручную взвесить и сбалансировать эти два тренда. Наша модель смогла проанализировать исторические данные и определить вес каждого из этих факторов. Это позволило создать единый прогноз, который учитывает и всплеск аварийности зимой, и бум покрасочных работ летом, давая полную и объективную картину спроса для планирования закупок.

Результаты в цифрах

— Точность прогнозирования выросла на 22% по сравнению с предыдущим методом и достигла 89%
— Компания сэкономила 300 000 000 рублей за счет оптимизации закупок и складских остатков
— Срок реализации проекта: 4 месяца
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍96👏5🔥2
Новая Alice AI. Про что это?

Сложно найти канал, который еще не написал про новую Alice AI от Яндекса, презентация которой прошла несколько дней назад. Но когда происходят такие изменения, об этом хочется говорить и писать. Наша команда тоже смотрела презентацию и собрала для вас самые интересные моменты. Это особенно полезно изучить, учитывая, что Яндекс заявил о планах занять до 70% рынка ИИ в России.

Презентация состояла из четырех частей.

1. В самом начале CEO Алисы пообещал «ассистента, компаньона и персонального помощника, который всегда будет с нами». И это действительно похоже на правду. Ребята из Яндекса объединили в единое семейство моделей Alice AI их языковую модель YandexGPT, мультимодальные способности работы с изображениями Yandex VLM и генерацию изображений Yandex ART. По нескромным оценкам Яндекса, «модель Alice AI — это лучший ИИ-продукт в России».

Теперь Alice AI будет помогать пользователям в огромном количестве сервисов Яндекса: в Яндекс Браузере, мультиаппе Яндекс Go (с их Такси, Едой, Лавкой и Доставкой), Маркете, Яндексе 360 и других.


Из интересного: отдельное внимание уделили помощи в задачках, связанных с образованием. На презентации в основном показывали школьников. Может, в будущем мы увидим изменение парадигмы использования искусственного интеллекта в образовании в российских школах, в которых пока что искусственный интеллект все еще не воспринимается как помощник.

2. Дальше представили агентов, которые будут выполнять большое количество функций. Рассказывали, например, про агента по бронированию, который предложит рестораны и в итоге сам забронирует столик. Или агента «Найти дешевле», который проанализирует стоимость в магазинах и маркетплейсах и предоставит разные варианты (и даже сможет дать дополнительную скидку на некоторые из них). Были и другие агенты, про которых подробнее вы можете почитать здесь.

3. Конечно, рассказали про связь Alice AI и Браузера. Алиса теперь видит весь контекст открытых вкладок, видео, документов и может ассистировать по всему материалу в диалоговом окне. Пока не очень понятно, с какими видео и на каких видеохостинговых платформах это будет работать, но обновление в любом случае привлекает внимание.

4. Отдельную часть посвятили Алисе в супераппе Яндекс Go, которая сможет самостоятельно найти рецепт, подобрать продукты в Лавке, заказать их и предоставить пошаговый план по приготовлению. Или подготовить план путешествия, забронировать билеты, отели, написать список вещей и при необходимости заказать что-то из них.

И вишенкой на торте анонсировали носимые AI-девайсы под сервис Моя память (пока планируются только наушники), которые объединят все вышеописанные функции в режиме голосового помощника. Этим наушникам можно будет дать задание, попросить напомнить о каком-то деле и оставить любую заметку.

Вчера, уже после презентации, Яндекс 360 представил интеграцию языковой модели Alice AI с Почтой и с редактором Документов и Таблиц.

После презентации, естественно, новое приложение Алисы почти моментально влетело в топ AppStore и собрало реакции не только в российском инфополе, но и за границей. Аман Чадха, разрабатывающий ИИ-продукты в Apple и экс-AI-лидер в Amazon, написал восторженный пост про большое обновление Яндекса, говоря о том, что Alice AI стоит теперь в одном ряду с Google, DeepSeek и OpenAI.

Пока что пользователям доступен не весь функционал, но каждый день Яндекс выкатывает новые обновления и открывает все больше и больше возможностей. В любом случае, для изменения потребительского поведения и перехода в новую реальность потребуется много времени. Ну а наша команда пока только начинает тестировать новую Алису, чтобы понять, будем ли мы скоро жить в Киберпанке, или пока что это только хорошо звучит.
8👍5🔥5
Что стоит понимать перед началом проекта по внедрению ИИ в компанию?

Прежде чем обратиться за проектом по внедрению ИИ, компании стоит задать себе главный вопрос: «А готовы ли мы?». Искусственный интеллект — это не просто несколько строк кода, это сложная система. И чтобы создать действительно рабочий инструмент, в ней должны сойтись три ключевых параметра:

• Цель. С этого вы всегда начинаем работу с нашими клиентами. «Хотим ИИ, это модно», «хотим автоматизацию» и т.д. - не работает. Мы формулируем с заказчиком точный ответ: какую боль бизнеса мы лечим? Ускоряем обработку заявок? Снижаем количество ошибок? Новый клиентский опыт?

• Данные. 90% успеха ML проекта — это данные. Без них любая, даже самая масштабная модель, не имеет никакого смысла.

— Где они?
— В каком они состоянии?
— Достаточно ли их?


• Процесс. Даже лучший алгоритм бесполезен без выстроенной архитектуры, регулярного контроля и понятных метрик.

Прежде чем запускать проект, постарайтесь ответить на эти вопросы:
Что именно хотим улучшить или автоматизировать?
Какие данные у нас уже есть и в каком они состоянии?
Как мы поймем, что проект успешен?


Если ответы на эти вопросы не сформулированы, лучше взять немного времени на подготовку. Это дешевле, чем потом исправлять ошибки умного, но бесполезного ИИ.

Как сформулировать цель и выбрать направление?

Многие проекты искусственного интеллекта «ломаются» уже на этапе идеи. Команды задают слишком общие цели вроде «создать систему, которая всё понимает». На практике работа начинается с конкретной болевой точки - там, где человеческие ресурсы работают неэффективно.

Лучше описывать задачу языком результата, а не технологий.
Например: «сократить время ответа клиенту в чате с 3 минут до 20 секунд. И чтобы точность была не ниже 90%.»
Когда цель измерима, сразу становится ясно: какой тип модели нужен (классификация, прогнозирование, генерация, рекомендации); какие данные потребуются; какие показатели считать успешными.

В InsightAI мы советуем направления работы исходя из зрелости компании и объёма данных. Если уже есть накопленные истории заказов, обращений, документов - стоит начать с аналитических или предсказательных моделей. Если данных немного, можно использовать генеративные решения на базе LLM и постепенно наполнять систему собственными знаниями.

Главный принцип прост: ИИ не создают ради ИИ. Его применяют там, где он решает конкретную задачу и экономит ресурсы, время или ошибки.
👍11🔥65
ML или ИИ? Почему фактически искусственного интеллекта не существует. Часть 1

Небольшой ликбез для тех, кто еще не до конца разобрался, что такое искусственный интеллект и машинное обучение. Хотим рассказать, почему «искусственный интеллект» - это больше про маркетинг, а машинное обучение (ML) - про решение задач и эффективность.

Начнем с ML

Машинное обучение - это практика, когда мы даем компьютеру огромный массив данных и говорим: «учись сам». Он анализирует, находит скрытые закономерности и затем использует их, чтобы предсказать что-то или принять решение. Например, определить, какой клиент уйдет, или какую цену акций выставить завтра.

Тепер про ИИ

Это громкое и красивое слово, но по факту никакого «интеллекта» там нет. Термин придумало общество вместе с маркетологами для комфортного обозначения того, что в профессиональной сфере называется машинным обучением.


Трансформеры и старые идеи

Внедрение ИИ не началось вчера. Огромное количество фундаментальных научных работ, на которых базируется современное ML, было написано много-много лет назад — в 60-е, 80-е, 90-е годы.

Так что же изменилось сейчас? Топливо и мотор.
1. Данные: у нас появились колоссальные объемы данных, которые генерируем мы с вами
2. Мощности: железо стало настолько мощным, что мы можем обучать алгоритмы на этих гигантских датасетах


И даже Chat GPT — это не прорыв на уровне физики. Это старые добрые трансформеры (речь об архитектуре, а не о железном Оптимусе Прайме). Это просто гениальный способ использовать старые алгоритмы, накачав их немыслимым объемом информации.
👍8🔥65
ML или ИИ? И почему фактически искусственного интеллекта не существует. Часть 2

Четыре типа ML


Сегодня машинное обучение делится на четыре основных лагеря:
1. Сlassic ML. Это простые, но эффективные алгоритмы, которые ищут закономерности в размеченных данных.
2. Глубокое обучение или Deep Learning: это нейросети, которые работают со слоями абстракций.
3. Обучение с подкреплением. Это про модели, которые учатся на собственном опыте, получая награду за правильные действия.
4. Ансамблевые методы - группы алгоритмов, которые работают вместе и исправляют ошибки друг друга, чтобы дать максимально точный результат.

1. Сlassic ML

Сlassic ML - это прямой наследник первых вычислительных машин 50-х годов. Это самые распространенные алгоритмы в бизнесе, и именно они формируют блоки рекомендаций на YouTube или Netflix. Это надежная рабочая лошадка.

Оно делится на два типа:

• С учителем. Здесь у машины есть шпаргалка - данные уже размечены и отсортированы. Машина просто учится определять: вот это спам, а вот это — нормальное письмо. Где используется? Спам-фильтры, скоринг кредитов, выявление мошенничества, медицинская диагностика (на снимках, где врач уже пометил, что норма, а что аномалия). Это ваш надежный помощник для принятия решений.

• Без учителя. У машины нет шпаргалки. Ей дают хаос данных и говорят: «сама найди, кто здесь похож на кого». Например, найти все лица на фото в альбоме, не зная, чьи они. Где используется? Сегментация рынка, риск-менеджмент, прогнозирование акций, объединение близких точек на карте. Эта модель помогает разобраться в колоссальном объеме неструктурированных данных.

2. Обучение с подкреплением

Это более высокий уровень сложности. ИИ здесь не просто анализирует данные, а действует самостоятельно в реальной среде (будь то биржа или игровой мир). Его задача - свести ошибки к минимуму. За правильное действие он получает награду и продолжает в том же духе.

Это используется для роботов-пылесосов, сложной торговли на фондовом рынке и управления ресурсами компании.

3. Ансамбли

Ансамбли - это командная работа. Не один алгоритм, а целая группа, которая использует разные методы, чтобы исправить ошибки друг друга. Это как собрать экспертный совет.

Их создают тремя способами:
— Стекинг: сначала все учатся отдельно, потом их результаты отдает на вход одному финальному алгоритму, который принимает итоговое решение.
— Беггинг: один и тот же алгоритм многократно обучают на разных кусках данных, а потом просто усредняют ответы.
— Бустинг: алгоритмы учатся последовательно, при этом каждый следующий особое внимание уделяет ошибкам своего предшественника.

4. Нейросети и глубокое обучение или Deep Learning

Это самый сложный уровень. Нейросети имитируют работу человеческого мозга - это сеть из нейронов и слоев, по которым последовательно проходит сигнал. У каждого соединения есть свой вес, который влияет на передаваемые данные.
Глубокое обучение обучает нейросети на нескольких уровнях абстракций, что и позволяет им, например, переводить текст, писать код или создавать реалистичные изображения.

Вывод: Куда вам нужно смотреть?

Не нужно думать об ИИ как о чём-то из фантастики. Думайте о нем как о мощном инструменте по борьбе с неэффективностью. Искусственный интеллект работает, когда есть та самая болевая точка, где люди тратят ресурсы впустую. Не обязательно начинать с нейросетей. Часто классическое машинное обучение дает 90% результата при 10% затрат.
👍95🔥5
Продолжаем обсуждать ИИ в ритейле. Подготовили 3 интересных кейса на рынке российской розницы

Обработка обратной связи в Холодильник.ру

Как и любой крупный ритейлер, Холодильник.ру регулярно обрабатывает большое количество обратной связи: отзывы приходят с 15+ площадок, от Ozon до Яндекс.Карт. Вручную разбирать этот поток, пытаясь понять, где реальная проблема, а где эмоции, - сложно, да и не нужно.

Они пошли по пути автоматизации и подключили ИИ-платформу. Теперь у них нейросеть сама анализирует тысячи комментариев: она понимает тональность (клиент в ярости или благодарит) и тегирует тему (жалоба на доставку, брак, сервис). Вся аналитика собирается на одном дашборде, и команда видит болевые точки в реальном времени. Ручная разметка отзывов сократилась с 5-7 дней в месяц до нескольких часов, а освободившиеся руки пошли решать реальные проблемы клиентов.

Автоматизация регистрации бонусных карт c Fix Price

У Fix Price есть большая и классная система бонусных карт. И ежедневно компания получает до 15 000 звонков с запросом оформить бонусную карту. Естественно, такой объем приводил к очередям, ошибкам и необходимости постоянно расширять штат.

Вместо найма новых операторов, ритейлер выбрал полную автоматизацию процесса с помощью голосовых роботов. ИИ-робот не просто отвечает на звонок 24/7, но и сам опрашивает клиента, а затем, используя технологию RPA, мгновенно заносит данные в систему. Регистрация карты происходит за один звонок, без участия человека. В результате процедура была полностью стандартизирована, ошибки исключены, а главное - обработка одного обращения обходится в 3-5 раз дешевле, чем работа живого оператора.

И еще один классный кейс М.Видео с чат-ботом

М.Видео - один из лидеров e-commerce, где более 60% продаж уходит в онлайн. Чтобы не перегружать контакт-центр рутинными запросами вроде «где мой заказ?» и обеспечить высокую скорость ответов, ритейлер запустил чат-бота Алену, которая работает на всех цифровых каналах и мгновенно распознает до 98% входящих обращений. Тут все по классике: быстро и точно закрывает типовые вопросы: статус доставки, наличие товара или условия программы лояльности и т.д.

Общий уровень автоматизации входящих запросов превышает 40%, что составляет более 60 000 обращений ежемесячно. Интересно, что уровень удовлетворенности клиентов от общения с ботом в среднем выше (85%), чем от разговора с живым оператором.

Подробнее про решения для ритейла мы уже рассказывали здесь. А если вы хотите реализовать похожий кейс (или совсем другой) — пишите для консультации: sales@insightai.ru
🔥86👍4
Почему AI стал ключевым инструментом для прогнозирования?

Прогнозирование спроса, продаж и объемов производства — сегодня одна из самых востребованных функций, которую бизнес передает искусственному интеллекту. Причина проста: в современном мире классические методы больше не работают.

В чем ключевая разница между традиционным подходом и AI-разработкой?

Проблемы прогнозирования без AI

🔺Низкая точность традиционных прогнозов. Прогнозы основаны исключительно на статистических методах, из-за чего они часто не могут точно учитывать динамично меняющиеся внешние факторы.

🔺Отсутствие учета внешних факторов. Традиционные системы не могут учитывать все внешние и внутренние переменные: экономические условия, сезонность, действия конкурентов и т.д.

🔺Невозможность строить прогноз на новые товары. При запуске новых направлений, филиалов или товарных позиций (SKU) невозможно рассчитать спрос без больших исторических массивов данных, что делает ручной запуск крайне рискованным.

Как AI решает эти проблемы

Машинное обучение (ML) переводит прогнозирование на качественно новый уровень, устраняя все перечисленные недостатки:

✔️ Точнее, чем классические модели. Модели машинного обучения анализируют сотни факторов, выявляют взаимосвязи и корректируют прогноз в реальном времени.

✔️ Работа с внешними факторами. AI-модели используют внешние источники данных: макроэкономику, погоду, курсы валют, события в регионе и данные о конкурентах, которые игнорирует классика.

✔️Адаптивность к изменениям. ИИ мгновенно реагирует на новые данные: сезонные сдвиги, изменения логистики, старт/отмена промоакций и кризисные явления.

✔️ Планирование продаж новых товаров. Система легко адаптируется при расширении бизнеса: новые рынки, категории или каналы продаж. AI может строить прогноз на основе небольшого числа тестовых продаж и данных похожих товаров.

❤️ AI трансформирует прогнозирование из статичного, исторически ориентированного отчета в адаптивный, стратегический инструмент, который помогает не просто знать, а планировать и опережать рынок.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍95🔥5
Подготовили статью, почему точность прогноза в 90% ≠ деньги для бизнеса.

Метрики WAPE и MAPE ничего не говорят о реальных финансовых рисках. Стоит прочитать, чтобы понять, в чем заключается главный парадокс и как перейти от "академической точности" к системе, которая реально управляет спросом и зарабатывает.


Читайте, чтобы узнать, почему необходимо:


— Пересчитывать ошибки в деньги. Хороший прогноз — это не минимальная ошибка, а минимальный денежный убыток. Вы узнаете, как взвешивать ошибки по марже и почему недозаказ в критичных категориях в разы дороже, чем перезаказ.

— Управлять риском, а не цифрой. Как уходить от точечного прогноза ("продадим 100 шт.") к вероятностному распределению. Это позволяет бизнесу осознанно выбирать уровень риска (OOS vs. излишки) и точно рассчитывать страховой запас под конкретную цель.

— Смотреть на прогноз как на продукт. Почему модель должна выдавать не просто число, а рекомендуемый заказ с оценкой денежной стоимости ошибки (потери при недозаказе vs. затраты на перезапас), чтобы закупки и логистика принимали решения, а не гадали.

Читать 👉🏻 здесь
7🔥5👏2
Компьютерное зрение. Когда машина видит лучше и быстрее человека

На этой неделе будем обсуждать компьютерное зрение (CV), расскажем, как это работает, где используется, и покажем наши кейсы в этом направлении.

Computer Vision (CV) - это область искусственного интеллекта, которая позволяет системе видеть и понимать визуальную информацию: видео и изображения. По сути, мы учим компьютер выполнять зрительный анализ быстрее, надежнее и точнее, чем человек.

Как это функционирует?

Сначала мы ставим "глаза" системы - камеры, которые собирают данные о рабочих процессах (в магазинах, на улицах, в кофейнях, на заводах) → затем эти данные размечаются специальными людьми: мы объясняем машине, что такое "брак" или "каска". Обучение это происходит на очень большом объеме видео и изображений → после этого разрабатывается ML-модель → и на финальный этап - интеграция этой модели в IT-контур заказчика, чтобы она работала в режиме реального времени и приносила результат.

Статика и динамика

👉🏻Статика или аналитика фиксированных процессов. Это высокоточный контроль, где камера имеет определенную заданную позицию. Системы используют промышленные сенсоры, чтобы, например, выявлять микродефекты (брак, маркировка, упаковка) прямо на конвейере.

👉🏻Динамика или мониторинг поведения. CV работает со сложным контекстом, проводя multi-object tracking и анализируя траектории. Например: в ритейле это может быть анализ длины очередей и оптимизация персонала. На производстве - контроль соблюдения правил охраны труда (ношение касок или других средств безопасности) с немедленным уведомлением о нарушении и т.д.

Где применяется?

На данный момент CV является прикладным инструментом и часто используется в:

— промышленности: проверка качества на конвейере, предиктивная диагностика оборудования, контроль технологических процессов.

— ритейле и E-commerce: мониторинг выкладки, анализ покупательского трафика, предотвращение потерь и оптимизация товарных запасов.

— логистики: автоматизация учета и классификации грузов, контроль загрузки транспорта и мониторинг складских операций.

— строительство: мониторинг соблюдения техники безопасности и другое.

В отличие от многих хайповых технологий, Computer Vision - это прикладной ИИ, который работает здесь и сейчас. Он требует инвестиций (больших), но эти инвестиции окупаются контролем и скоростью.
🔥95👍5
Excel больше не справляется: как мы рассказали TAdviser про ML-прогнозы

Вместе с изданием TAdviser обсудили, почему в 2025 году бизнесу уже недостаточно классических методов анализа.

Главные тезисы материала:

— Почему главная сложность в Computer Vision на заводе — это не модель, а пыль, вибрации и саботаж на местах.

— Как переход от Excel к ML-моделям повышает точность прогнозирования спроса в 2-3 раза.

ТОП-3 ИИ-продукта прямо сейчас: персональные рекомендации, интеллектуальный документооборот и логистические прогнозы. Где ROI виден быстрее всего?

80% успеха — это не код модели, а чистые данные и культура их сбора.

Читать подробнее 🔗
🔥75👍2🥰2
Как мы стали показывать наши продукты, а не рассказывать про них

В enterprise-сегменте время красивых презентаций подходит к концу. Какими бы информативными и классными ни были слайды, главный вопрос, который мы слышим от бизнеса на каждой встрече: «а как это можно пощупать? как это будет выглядеть у нас?»

Специфика нашей работы в том, что 98% искусственного интеллекта - это подводная часть айсберга. Это сложные бэкенд-процессы, пайплайны данных и ML-модели, работу которых невозможно увидеть глазами. Часто результатом многомиллионного проекта становится просто точная цифра прогноза.

Чтобы сделать технологии понятными и прозрачными, мы немного изменили подход к демонстрации наших проектов

Теперь для большинства наших решений мы готовим демо-версии. Мы переводим сложный код в понятные визуальные интерфейсы с графиками и дашбордами, где пользователь может взаимодействовать с данными.

Что это дает клиенту? Вместо абстрактных алгоритмов можно увидеть цифровую копию для бизнеса:
— конкретные товары и их движение
— реальные сроки поставок и загрузку складов
— подсвеченные зоны риска: где прогнозируется дефицит, а где — затоваривание
— аналитику по контрагентам, которая показывает сбои в цепочках поставок


Прозрачность - это наша база. Демка помогает увидеть за сложным кодом реальную пользу. Это больше не абстрактная нейросеть, а понятный инструмент.

Мы готовы не просто рассказывать, а показывать. Запишитесь на демонстрацию решений Insight AI, чтобы увидеть, как наши алгоритмы работают с вашими данными.

Записаться на конкультацию 🔗
🔥72👍2
Магия ИИ делается руками или как происходит разметка данных для компьютерного зрения


Нейросеть не сама учится видеть дефекты на трубах или распознавать товары на полке. Прежде чем модель начнет «видеть», ей нужно показать тысячи примеров, обведенных человеческой рукой.


Как происходит процесс сбора датасета для CV

1. В самом начале устанавливаются камеры на объект (будь то стройплощадка или кофейня) или используются существующие датасеты и начинается работа с видеопотоком. Обучать модель на 25 кадрах в секунду - дорого и бессмысленно (кадры почти одинаковые). Мы режем видео на фреймы. Берем, например, 1 кадр в секунду или используем алгоритмы, которые выдергивают только моменты, где в кадре появилось движение. Из часового видео с камеры наблюдения получается набор из 1000-3000 уникальных картинок.

2. Инструкция сложнее, чем код. Это самый важный этап. Нельзя просто сказать разметчику: «выдели брак». Для человека трещина - это трещина. Для алгоритма нужно ТЗ уровня юридического документа:
— выделять трещину с запасом в 2 пикселя?
— если трещина уходит в тень, мы ее размечаем?
— пятно грязи, похожее на трещину - это брак?

Если инструкция плохая - датасет будет мусорным. Garbage In — Garbage Out

3. Краудсорсинг и магия за 1 рубль. Штатные инженеры никогда не занимаются разметкой. Это делают крауд-платформы (например, в России это Яндекс.Толока). Тысячи людей (асессоров) сидят по всему миру и размечают картинки за небольшую плату (условно, 1–2 рубля за задание).

4. Чтобы проверять асессоры на халтуру и чтобы модель не научилась ерунде, используются методы проверки:

Overlap: одно и то же фото размечают 3 разных человека. Если их ответы совпали - данные идут в обучение. Если один выделил каску, а двое нет - кадр летит на перепроверку.

Honeypots: в задания подмешиваются проверочные примеры, ответ на которые мы знаем заранее. Если асессор ошибся на контрольном задании - вся его работа аннулируется.

CV — это на 20% математика и на 80% работа с данными. Модель может быть сколь угодно мощной, но если скормить ей плохие данные - она будет уверенно и быстро ошибаться.
👍86🔥6
Поздравляем с Новым годом от команды Insight AI🎄

В следующем году вас ждет больше контента про искусственный интеллект и автоматизацию бизнес процессов!

Stay tuned!
7🔥5👍3👏1
Выходим с праздников с новыми темами🔥

Обсудим сегодня, почему OpenAI побеждает в гонке и в чем феномен компании? Часть 1

OpenAI не придумали архитектуру с нуля. Технически архитектуру «трансформеров» (то самое «T» в GPT) придумали в Google в 2017 году (а исследования начались с 2014 года). Почему тогда Google сейчас в роли догоняющего, а OpenAI - синоним ИИ?

Основная причина в том, что их UX победил технологии, которые были «до». Пока конкуренты делали сложные интерфейсы с кучей настроек, OpenAI предложили радикальный минимализм. Окно чата, кнопка «отправить» и больше ничего. И именно этот дизайн-код стал золотым стандартом - теперь каждый второй AI-стартап копирует интерфейс ChatGPT. Они первыми поняли, что людям нужна не модель, а собеседник.

И эта простота привела к формированию привычки. Сейчас многие люди перестали пользоваться поисковиком, потому что быстрее и удобнее спросить у чата. Настолько формат понравился пользователям, что за первые 5 дней ChatGPT набрал 1 миллион рекордных пользователей (этот рекорд кстати следующим побил только Threads в 2023 году).

И сейчас аудитория OpenAI - это ~250 млн активных пользователей в неделю.


Для B2B они тоже дали уникальность. Они первыми начали продавать не модель, а операционку для бизнеса. До OpenAI внедрение языковых моделей (даже с инструментами вроде LangChain) было больной темой из-за сложной настройки и тяжелого входа.

Альтман и команда сделали всё просто: понятные тарифы, оплата за токены и, главное, - простейшая API. Есть админка, готовые примеры кода и документация. Не нужно ничего изобретать. Просто берешь ключ и встраиваешь ИИ в свой продукт за вечер. Комфорт для разработчиков тоже добавил к их популярности.

Интересный факт: одним из наиболее ранних и громких заявлений, связанных с OpenAI - был турнир по Dota 2 на The International в 2017 году, где профессиональный игрок Dendi играел против бота OpenAI ии проиграл.
7🔥5👍4🤔1