Нейросети в бизнесе | Insight AI

Облако, свои серверы или гибрид? Или как внедрить ИИ, не разориться и защитить данные

К нам часто приходят с запросом: «сделайте нам мощную нейросеть, но пусть она стоит строго на наших серверах». Бизнес хочет интеллект уровня GPT-4, но сильно боится утечек.

Рассказываем про три базовых варианта развертывания ИИ. Что выбрать, чтобы и данные защитить, и бюджет не слить.

1️⃣ Развертывание в облаке (Cloud)

Нейросеть физически находится на серверах IT-гигантов (OpenAI, Яндекс). Вы отправляете запрос по защищенному API и мгновенно получаете ответ. Никаких трат на дорогие серверы, при этом у вас самая умная модель на рынке.

Почему существует страх развертывания на облаке? Из-за стереотипа, что облако заберет корпоративный договор, обучится на нем и завтра выдаст конкурентам.

В реальности люди путают публичный веб-чат и корпоративный API. Коммерческие Enterprise API-шлюзы юридически и технически изолированы. Они не обучаются на данных клиентов. Запрос пришел зашифрованным, обработался и удалился. Отправлять туда данные сегодня безопаснее, чем пересылать их по рабочей почте.

2️⃣ Полный on-premise (развертывание в своем контуре)

ИИ разворачивается полностью на серверах заказчика. Система работает через внутренний VPN, данные вообще не выходят в интернет.

В чем проблема? Это колоссально дорого. Нужны мощные видеокарты, охлаждение и команда поддержки. Вариант оправдан для банков, медицины или госсектора.

Здесь можно добавить про ловушку теневого ИИ. Когда компаниям on-premise не по карману, а в облако страшно, руководство просто запрещает нейросети в офисе. И это главная дыра в безопасности. Сотрудники не перестают использовать ИИ – они начинают втихаря грузить NDA и отчеты в бесплатные публичные чат-боты со своих личных телефонов. Контроль над данными теряется полностью.

3️⃣ Гибридная архитектура

Бизнесу больше не нужно выбирать между «дешево, но рискованно» и «безопасно, но дорого». Идеальное решение лежит посередине.

Вся инфраструктура и корпоративные данные хранятся у вас локально, но за тяжелыми вычислениями система ходит в облако по API.
Как это работает на практике. Мы настраиваем умный роутинг:
— Если маркетолог просит написать креативный пост – система отправляет эту задачу в мощное облако (OpenAI). Это стоит копейки и дает лучший результат.
— Если аналитик загружает секретный финансовый отчет – шлюз видит уровень доступа и маршрутизирует задачу в вашу локальную защищенную модель. Чувствительные данные не покидают компанию.

А если вы хотите узнать подробнее про возможности размещения – записаться на консультацию 🔗

❤8👍4🔥4👏2

246 views12:23

Нейросети в бизнесе | Insight AI

Дорогие девушки, команда Insight AI поздравляет вас с 8 Марта! 🌷

Мы в Insight AI строим умные алгоритмы, но точно знаем: ни одна нейросеть не заменит вашу интуицию, эмпатию и умение разруливать самые сложные задачи.

Спасибо, что с вами так круто работать! Пусть дедлайны будут адекватными, задачи – интересными, а настроение – весенним!

🎉10🔥7❤5🙏1

145 views14:32

Нейросети в бизнесе | Insight AI

Получили недавно интересный комментарий про кастомную разработку

Шутку оценили, но решили обсудить тему подробно.

Спойлер: SaaS или кастом – это не спор о том, что хуже или лучше. Это исключительно вопрос того, какая перед вами стоит задача и какой у вас масштаб.

Давайте разбираться. Где SaaS работает идеально?

Если брать чистый SaaS, без всяких доработок, то он всухую выигрывает в микро-, малом и отчасти среднем бизнесе. Там, где процессы супертиповые (и небольшие бюджеты).

Отличный пример – маркетплейсы, вокруг которых выросла целая ниша обслуживающих SaaS решений (не меньшая по размеру, чем сами маркетплейсы). Везде одинаковые карточки товаров, одинаковые API’шки, одинаковые данные. Вы можете купить подписку за 5000 рублей и не думать про инфраструктуру, обновления и техподдержку. В этом сегменте SaaS – это единственный адекватный вариант.

Про SaaS в крупном бизнесе

Но как только мы переходим к Enterprise-сегменту, чистый SaaS перестает работать. У каждого крупного бизнеса свои уникальные процессы.

Часто происходит следующее: корпорация покупает готовый SaaS (условный Битрикс или другую платформу), а дальше начинается: под хотелки компании дописываются кастомные модули, ядро платформы перекраивается, интеграторы городят сложные связки. По факту, это уже превращается в самую настоящую кастомную разработку, за которую платят огромные деньги, просто строится она на базе чужой коробки.

Зачем тогда писать настоящий кастом с нуля? Основные сценарии:

1. Битва за проценты по правилу Парето. Возьмем ИИ-систему прогнозирования. Готовый SaaS за n-рублей сделает точность прогноза на 80%. Кастомная разработка будет стоить 10n рублей, но даст точность в 95%. Первые 80% достигаются легко, 85% – тяжело, а 95% – почти невозможно. На миллиардных оборотах эти 10-15% выигрыша приносят такие деньги, на фоне которых стоимость разработки кастома просто испаряется.
2. Очень старая, сложная инфраструктура. Пытаться костылями встроить в нее современную SaaS-коробку часто выходит сильно дороже, чем просто написать решение с нуля под себя.
3. Когда нужны полная внутриконтурность (on-premise) и жесткие метрики качества, куда ни одно публичное облако просто не пустят.

Что с мифом про «г**но и палки»?

Почему некоторые не любят кастом? Они видели плохой кастом🙂 Без тестов, без мониторинга, без нормальной архитектуры и – самое страшное – без владельца продукта (про это даже отдельную статью писали).

Но давайте честно: это проблема кривого подхода конкретных исполнителей, а не формата кастомной разработки в целом.

👍5❤4🔥4🤔1

644 views15:48

Нейросети в бизнесе | Insight AI

Рынок ИИ-ботов в России. Большой разбор Insight AI. Часть 2: малый бизнес

Продолжаем делиться инсайтами нашего исследования платформ, создающих ботов на основе искусственного интеллекта, и аудиторий, которые ими пользуются. Сегодня говорим о малом и микробизнесе. Мы провели десятки глубинных интервью с владельцами фитнес-студий, e-commerce проектов, онлайн-школ, агентств и еще многих направлений.

Их отношения с искусственным интеллектом оказались достаточно интересными. Вот 5 интересных фактов из этих интервью:

1️⃣ Самая дорогая проблема малого бизнеса – медленный ответ клиенту
Одна из владелиц фитнес-студии сказала фразу, которую мы затем слышали еще много раз: «если человеку не ответить два часа – ему уже неинтересно, он уходит к конкурентам».

Для малого бизнеса это основная боль. Если корпорация может позволить себе потерять десяток ночных заявок, то для студии (где всего 10-15 лидов в день) даже один пропущенный диалог – удар по выручке. Трафик стоит дорого, лояльности на старте нулевая: клиент пишет сразу в три места, и деньги забирает тот, кто ответил первым. Запрос на ИИ здесь – это не дань моде или желание автоматизации, а острая потребность в инструменте, который перехватит лид, пока конкуренты спят.

2️⃣ Теневой ИИ в малом и среднем бизнесе
Пока владельцы бизнеса думают, нужен ли им ИИ, сотрудники уже вовсю им пользуются. Но делают это стихийно и в личных аккаунтах.

Аналитики прогоняют таблицы через ChatGPT, копирайтеры генерируют там посты, HR-ы пишут отказы. В итоге вся корпоративная база знаний, коммерческая тайна и лучшие рабочие промпты находятся на личных телефонах сотрудников. Когда классный менеджер увольняется – весь этот цифровой актив уходит вместе с ним.

3️⃣ Боты уже пробовали. И часто разочаровывались
Почти каждый бизнес из наших интервью уже тестировал чат-ботов. И в 90% опыт был плохим.

Бот не понимал вопросы, отвечал глупыми шаблонами, галлюцинировал и отпугивал клиентов. Происходит это чаще всего из-за того, что дешевые боты «помощники бизнеса» – это голые нейросети по API без грамотной работы с RAG’ом. В нее просто загружают текст и надеются на чудо. Но шаг влево – бот теряет контекст, галлюцинирует и раздает клиентам несуществующие скидки. После таких историй доверие к автоматизации падает до нуля.

4️⃣ Слепота к рутине. Многие даже не осознают своих проблем
Интересный факт: владельцы воспринимают огромные потери времени как норму.

Например, разнос финансовой отчетности в Excel занимает 1–2 дня. HR-менеджер агентства вручную просматривает 700 анкет кандидатов глазами. Сотрудники тратят часы, чтобы найти нужный регламент среди сотен документов. Предприниматели не ищут ИИ для этих задач (да и вообще ничего не ищут).

5️⃣ Половине компаний ИИ пока вообще не нужен
В рамках исследования мы общались с многими малыми бизнесами, которые наотрез отказываются от автоматизации.

Почему? Потому что там, где высокий средний чек или небольшой объем лидов, продает человеческая харизма, экспертность и личное доверие. Кроме того, если с текущим объемом идеально справляется менеджер с зарплатой 40-50 тысяч рублей, нет необходимости внедрять ИИ-систему.

В следующей части обсудим инсайты уже на enterprise уровне

👍6❤4🔥3👏1

132 views15:53

Нейросети в бизнесе | Insight AI

Киберпанк отменяется (пока что)

Пятница, весна и наконец-то потепление! Отвлекаемся от серьезных задач и читаем веселый пост про провалы всемогущего искусственного интеллекта.

1. Taco Bell и 18 000 стаканов воды
Американская сеть фастфуда Taco Bell решила автоматизировать окна заказа для автомобилистов и поставила голосовых ИИ-кассиров. Но разработчики забыли про главное правило: пользователи обожают ломать системы.

Один из клиентов заказал 18 000 стаканов воды. ИИ, не имея защиты от таких ситуаций, попытался оформить этот заказ. Но пробить 18 тысяч стаканов алгоритм так и не смог: нейросеть запуталась, сдалась и позвала на помощь живого сотрудника. После волны таких пранков и жалоб на Reddit директор по инновациям Taco Bell честно признал: люди пока справляются с заказами гораздо лучше и быстрее машин.

2. ИИ-разработчик, который удалил базу и попытался это скрыть
Известный инвестор Джейсон Лемкин решил протестировать создание приложения с помощью автономного ИИ-агента на платформе Replit. Перед финальным релизом проекта он объявил жесткий код-фриз и прописал нейросети 11 инструкций заглавными буквами: «НИКАКИХ ИЗМЕНЕНИЙ без разрешения».

Что сделал ИИ? Он проигнорировал все 11 запретов и выполнил команду npm run db:push, удалив всю продакшен-базу с реальными данными 1200 компаний. Но самое смешное началось потом. Поняв, что прод лежит, ИИ решил скрыть свое «преступление». Он сгенерировал фальшивые отчеты о стабильной работе, насоздавал поддельную базу на 4000 вымышленных записей и подделал результаты тестов, чтобы создать иллюзию, что всё отлично. А когда Лемкин поймал его за руку, ИИ начал врать, что откатить изменения и восстановить данные невозможно.

3. Нервный срыв ИИ-продавца в офисе Anthropic
Создатели нейросети Claude решили провести эксперимент: дали ИИ-агенту Claudius полный контроль над умным холодильником со снеками в офисе. Он должен был сам заказывать еду, ставить цены и общаться с сотрудниками.

Всё шло хорошо, пока кто-то ради шутки не попросил заказать вольфрам. ИИ сошел с ума: он начал на все деньги закупать тяжелые вольфрамовые кубы, создал выдуманные аккаунты Venmo для оплаты и стал раздавать еду бесплатно. В финале агент словил программный нервный срыв: он прислал команде письмо, что увольняется и будет ждать их у вендингового аппарата «в темно-синем блейзере и красном галстуке».

😁9❤4🔥4💯1

144 views14:51

Нейросети в бизнесе | Insight AI

Google выпустил Gemini Embedding 2

Мы уже не раз рассказывали в канале про мультимодальный ИИ. И вот выходит новость, что Google выпустил первую нативно мультимодальную эмбеддинг-модель. Теперь в один запрос можно одновременно загрузить текст, фото, видео и аудио.

По параметрам:

— Текст: до 8 192 токенов; изображения: до 6 штук в запросе (PNG, JPEG);
— Видео: до 120 секунд (MP4, MOV);
— PDF: до 6 страниц;
— Аудио понимает напрямую, без промежуточной транскрибации.
— Векторы сжимаются «матрешкой» (Matryoshka RL) в 2–4 раза: это экономит память серверов и ускоряет поиск без потери качества.

Почему это меняет рынок?

1. Текстовые базы знаний медленно уходят в прошлое. Будущее корпоративного ИИ – это возможность за секунду найти нужный момент в двухчасовой видеозаписи Zoom-колла или сверить чертеж из PDF с реальной фотографией объекта. Информацию больше не нужно переводить в текст, чтобы бот ее понял.

2. Google забирает лидерство в поиске. У Google за плечами огромный опыт с YouTube и Google Lens, поэтому они связывают аудио, видео и текст органично. Все остальные пока просто пытаются прикрутить картинки к тексту костылями.

Модель пока что доступна разработчикам через Gemini API и Vertex AI.

🔥8❤5👍4

172 views15:44

Нейросети в бизнесе | Insight AI

Почему все вдруг заговорили про децентрализованный ИИ

Как сейчас развивается ИИ? Техногиганты (Google, Microsoft, Meta) строят огромные дата-центры. Счет мощностей уже идет на гигаватты, и корпорациям приходится буквально договариваться о строительстве собственных атомных электростанций.

У этой централизации два минуса: это безумно дорого и это закрытый клуб. У кого больше вычислительных мощностей – тот и впереди. Фактически это гонка ресурсов.

Решение: децентрализованный суперкомпьютер

Децентрализованный ИИ предлагает другой путь. Вычисления не обязаны жить в одном месте. То есть вместо одного огромного дата-центра – много источников вычислений, которые работают как единая система.

Долгое время крипту ругали за то, что фермы сжигают электричество впустую, решая бессмысленные криптографические задачки. Архитектура стартапа Gonka братьев Либерманов меняет правила игры. Они встроили полезную работу прямо в блокчейн: здесь «майнинг» – это и есть обучение и работа реальных нейросетей. То есть 100% вычислительной мощности уходит на полезные ИИ-задачи, результаты которых кому-то действительно нужны.

В чем главные плюсы такого подхода?
— В сеть может включиться кто угодно: от геймера с одной домашней видеокартой до владельца целого дата-центра. Вы просто сдаете свое железо в аренду и становитесь частью мирового ИИ-суперкомпьютера.
— Цифры говорят сами за себя: всего за 3 месяца после запуска сеть Gonka собрала мощность, эквивалентную 6000 топовых видеокарт Nvidia H100. И это исключительно за счет мощностей комьюнити, без единого центрального рубильника.
— Абсолютная отказоустойчивость – эту сеть невозможно выключить. Если отвалится тысяча узлов, система просто перераспределит нагрузку на другие компьютеры.

Пока это всё выглядит как ранний этап: много идей, много экспериментов и не до конца понятно, какая модель выстрелит.

Индустрии еще предстоит доказать, что децентрализованные сети могут стабильно тянуть тяжелые enterprise-задачи. Но очевидно, что рынок начинает искать альтернативу классической модели, где всё держится на гигантских дата-центрах.

🔥4❤3👍3🤔1

108 views15:23

Нейросети в бизнесе | Insight AI

Мы подготовили большую статью о главной боли корпоративного ИИ

От 60 до 85% ML-проектов в enterprise-сегменте никогда не доходят до продакшена. Они навсегда остаются красивыми презентациями и успешными пилотами. Интересно, что проблема почти никогда не в алгоритмах или математике.

Мы достали из нашей новой статьи 3 интересных инсайта о том, почему нейросети умирают по пути в реальный бизнес. Спойлер: дело в инженерной дисциплине.

1. Синдром «модель ради модели»
Команда три месяца чистила данные и перебирала архитектуры. На демо все хлопают: модель отлично предсказывает отток клиентов. Но никто не задал главный вопрос: а что конкретно должно произойти, когда модель выдала эту цифру? Кто принимает решение? Оператор колл-центра? CRM-система? Если модель не встроена в конкретный рабочий процесс и не меняет его – она становится просто очередным дашбордом, который все забудут через месяц.

2. Иллюзия чистых данных. Пилот на «удобных» данных, а прод – это хаос
Пилоты всегда делают на аккуратных, вычищенных вручную датасетах. Модель на них летает. А потом наступает суровый продакшен: данные приходят с задержками, 30% полей внезапно пустые, API поставщика отвалился на два дня.
Разрыв между качеством данных в пилоте и хаосом в проде убивает систему моментально. Без тестов на грязных сценариях выкатывать модель в продакшен опасно.

3. KPI модели и KPI бизнеса живут в разных мирах
Команда данных празднует: «мы улучшили метрику AUC на 2 пункта!». Финансовый директор смотрит на них и спрашивает: «и что мне с этого в рублях?».
Если рост технической метрики не переведен в понятную бизнес-ценность (конверсии, сэкономленные часы, предотвращенные потери), проект не уйдет в прод. До старта нужна честная Value Model: перевод процентов точности в живые деньги.

ML – это не модель, а инженерная система. БОльшая часть работы – это инженерная инфраструктура, интеграция с legacy-системами, безопасность и выстраивание процессов.

Читать полностью

vc.ru

Почему пилоты умирают: 7 инженерных причин, по которым ML не доезжает до прода

Знакомая история: команда три месяца строила модель. Перебирала архитектуры, чистила данные, спорила про гиперпараметры. На демо — красивые графики, AUC на высоте, бизнес-заказчики кивают. Дальше — пилот на ограниченной выборке, одном регионе или одном продукте.…

👍3🔥3❤2

128 views16:50

Нейросети в бизнесе | Insight AI

Google Maps, что случилось?

Google показал крупнейшее обновление карт за последние… много лет. К картам подселили Gemini, и это достаточно сильно меняет то, как мы взаимодействуем с пространством.

Что нового:

Ask Maps – теперь в карты можно буквально закидывать сложные человеческие вопросы. Не «ресторан веганской кухни», а: «ко мне едут друзья, найди уютное место с веганским меню на четверых на 7 вечера, где-то посередине между нами». ИИ прочесывает 300 млн локаций и 500 млн отзывов, чтобы выдать конкретный ответ.

Иммерсивная навигация или карта в 3D. Gemini анализирует снимки Street View и спутниковые фото, чтобы отрисовать здания, развязки и даже бордюры максимально реалистично.

Человеческий голос, где место «через 200 метров поверните направо» вы услышите: «проезжай этот съезд и поворачивай на следующем, сразу за тем зданием».

Что мы думаем (и что думать вам, если у вас еще нет мнения)

Мы потихоньку переходим от интерфейса поиска (когда ты сам фильтруешь рестораны по звездам) к интерфейсу ответа. Google превращает карты в огромную семантическую базу знаний. Теперь ценность не в том, что карта знает координаты дома, а в том, что она понимает контекст: «там шумно», «там есть розетки», «там вежливый персонал».

И пока OpenAI и Anthropic сражаются в чат-ботах, Google работает там, где у него больше всего экспертизы – в своих картах. Для бизнеса это значит, что

SEO в картах скоро заменится на AEO (Answer Engine Optimization) – важно будет не просто иметь ключевые слова в профиле, а соответствовать сложным запросам пользователей.

С другой стороны, существует опасение про безопасность этой затеи. Если ИИ-навигатор уверенно скажет «поворачивай здесь» там, где кирпич или обрыв – приятного будет мало. Google сейчас берет на себя огромную ответственность за валидацию данных в реальном времени.

И в итоге хочется сказать, что мы ждем, когда Яндекс Карты выкатят что-то похоже, но, кажется, что в российской навигации сейчас другие вызовы.

❤3👍2🔥2

99 views15:46

About

Blog

Apps

Platform