Forwarded from SkAI-fi
TL;DR: семь лет Apple Neural Engine стоял в холостую, развлекаясь эмодзи-портретами. Сегодня всё меняется: на устройствах запускаются настоящие языковые модели, и облако отступает на второй план. Следующий бум — офлайн-приложения с LLM, которые стартуют мгновенно и не требуют запросов в сеть, оплачивая лишь заряд батареи.
Каждую осень мы читали про новый чип Apple: «Neural Engine +X TOPS». Семь лет – от A11 Bionic 2017 (вспомните Face ID) до M4. Я думал, что эти нейронные ядра нужны для AR‑фишек вроде Vision Pro. Если вы хоть раз работали с ARKit, знаете: технологии вроде SLAM или реконструкции сцены классные, но почти не используются в массовых приложениях — разве что в играх и редких B2B‑проектах.
WWDC 2025 всё изменил. Apple открыла доступ к своим тензорным блокам: в Foundation Models Framework появился on-device вызов LLM (модель на ~3–4 млрд параметров, точные цифры не раскрывают). Всего три строки кода на Swift — и вы можете генерировать текст прямо в приложении:
Никаких ограничений на количество токенов и счётчиков запросов. Телефон не заметит, сколько токенов вы сожгли, но батарейка — заметит. Apple обещает: Neural Engine даёт ~14 токенов/мс при потреблении 3 Вт. Для сравнения: облачный вызов GPT-4o тратит ~50 мс/токен плюс задержку сети.
Почему это важно
- Моментальный отклик. В банкомате антифрод должен вернуть ответ за 150 мс, иначе транзакция отменится. Облако не успеет, NPU справится.
- Приватность. Всё вычисление остаётся на устройстве: ни слова не улетит в облако, и ничего не сохранится дольше сеанса. Европейским регуляторам за такое точно скажут спасибо.
- Ноль долларов за запросы. Разработчики получают «GPU-бюджет $0»: вычисления идут на чипе телефона без оплаты облаку. Шутят, что скоро ROI будут считать не в стоимости тысяч токенов, а в стоимости ватт-часа.
Ограничения
- Поддерживаемые устройства. Apple Intelligence работает только на iPhone 15/16 Pro, iPad Pro на M‑серии и Mac на M1/M2. То есть пока лишь порядка 25% iOS‑устройств — придётся делать резервный вариант для остальных.
- Длина контекста. Около 4 тыс. токенов — хватит для короткого пересказа или локального справочника, но не для длительного диалога. iCloud-версия «Private Compute» обещает до 128k токенов, но цены пока не объявлены.
- Мультимодальность в бете. Обработка картинок и аудио пока скрыта под NDA; ждём релиза зимой.
Контейнеры «по-эппловски»
Параллельно Apple добавила контейнеры через концепцию «микро-VM»: каждый OCI‑образ запускается в своей виртуальной среде с чистым сетевым стеком (и встроенной Rosetta для x86). Минус — больше жрёт RAM, чем Docker; плюс — можно прямо внутри контейнера использовать Neural Engine для inference. Вкупе с сервисами на Swift это шаг к «WSL2 для Mac».
Что будет дальше
- AR + LLM. Vision Pro обновился до visionOS 26 и теперь может дергать локальные LLM. Представьте: вы смотрите на конвейер, камера кидает 400 fps стереопоток в Neural Engine, он на лету находит дефект и отправляет сигнал системе управления. Реакция — в сотни мс, то, чего так не хватало AR.
- Новая гонка NPU. Qualcomm уже обещает 60 TOPS в X Elite. Но у Apple козырь — сотни миллионов устройств с Neural Engine уже в карманах.
- Вторая жизнь AR-SDK. CoreML и RealityKit наконец находят своё применение: то, для чего их задумывали в 2017 году.
Очевидно: будущее — за локальными LLM. К 2030 любой массовой ОС начнёт день не с ярлыков и панелей, а со встроенного ассистента-модели, который понимает контекст пользователя глубже любого GUI.
Каждую осень мы читали про новый чип Apple: «Neural Engine +X TOPS». Семь лет – от A11 Bionic 2017 (вспомните Face ID) до M4. Я думал, что эти нейронные ядра нужны для AR‑фишек вроде Vision Pro. Если вы хоть раз работали с ARKit, знаете: технологии вроде SLAM или реконструкции сцены классные, но почти не используются в массовых приложениях — разве что в играх и редких B2B‑проектах.
WWDC 2025 всё изменил. Apple открыла доступ к своим тензорным блокам: в Foundation Models Framework появился on-device вызов LLM (модель на ~3–4 млрд параметров, точные цифры не раскрывают). Всего три строки кода на Swift — и вы можете генерировать текст прямо в приложении:
let model = FoundationModel.named(.appleIntelligence)
try await model.generate(text: prompt) { chunk in … }Никаких ограничений на количество токенов и счётчиков запросов. Телефон не заметит, сколько токенов вы сожгли, но батарейка — заметит. Apple обещает: Neural Engine даёт ~14 токенов/мс при потреблении 3 Вт. Для сравнения: облачный вызов GPT-4o тратит ~50 мс/токен плюс задержку сети.
Почему это важно
- Моментальный отклик. В банкомате антифрод должен вернуть ответ за 150 мс, иначе транзакция отменится. Облако не успеет, NPU справится.
- Приватность. Всё вычисление остаётся на устройстве: ни слова не улетит в облако, и ничего не сохранится дольше сеанса. Европейским регуляторам за такое точно скажут спасибо.
- Ноль долларов за запросы. Разработчики получают «GPU-бюджет $0»: вычисления идут на чипе телефона без оплаты облаку. Шутят, что скоро ROI будут считать не в стоимости тысяч токенов, а в стоимости ватт-часа.
Ограничения
- Поддерживаемые устройства. Apple Intelligence работает только на iPhone 15/16 Pro, iPad Pro на M‑серии и Mac на M1/M2. То есть пока лишь порядка 25% iOS‑устройств — придётся делать резервный вариант для остальных.
- Длина контекста. Около 4 тыс. токенов — хватит для короткого пересказа или локального справочника, но не для длительного диалога. iCloud-версия «Private Compute» обещает до 128k токенов, но цены пока не объявлены.
- Мультимодальность в бете. Обработка картинок и аудио пока скрыта под NDA; ждём релиза зимой.
Контейнеры «по-эппловски»
Параллельно Apple добавила контейнеры через концепцию «микро-VM»: каждый OCI‑образ запускается в своей виртуальной среде с чистым сетевым стеком (и встроенной Rosetta для x86). Минус — больше жрёт RAM, чем Docker; плюс — можно прямо внутри контейнера использовать Neural Engine для inference. Вкупе с сервисами на Swift это шаг к «WSL2 для Mac».
Что будет дальше
- AR + LLM. Vision Pro обновился до visionOS 26 и теперь может дергать локальные LLM. Представьте: вы смотрите на конвейер, камера кидает 400 fps стереопоток в Neural Engine, он на лету находит дефект и отправляет сигнал системе управления. Реакция — в сотни мс, то, чего так не хватало AR.
- Новая гонка NPU. Qualcomm уже обещает 60 TOPS в X Elite. Но у Apple козырь — сотни миллионов устройств с Neural Engine уже в карманах.
- Вторая жизнь AR-SDK. CoreML и RealityKit наконец находят своё применение: то, для чего их задумывали в 2017 году.
Очевидно: будущее — за локальными LLM. К 2030 любой массовой ОС начнёт день не с ярлыков и панелей, а со встроенного ассистента-модели, который понимает контекст пользователя глубже любого GUI.
TL;DR: Раньше мы писали, что мультимодальные LLM заменят классический OCR. Прошло 4 месяца — и вот вам кейс: проект OpenElections доверил Google Gemini обработку сотен страниц выборных протоколов в PDF. Это больше не эксперимент — это новая норма.
Раньше ситуация выглядела так: тысячи участков публикуют результаты выборов в виде сканов PDF. Перевод их в таблицы — адский труд. Либо платите огромные суммы операторам ввода, либо мучаетесь с традиционным OCR, который «заикается» на сложных форматах. Цена ошибки — не просто «косметическая», а политическая и репутационная. Поэтому всегда оставалась ручная проверка.
Что изменилось? OpenElections решил рискнуть и запустить обработку PDF через Gemini. И оказалось, что модели можно доверять. Например, протоколы Limestone County на 42 страницы (с двухколоночным макетом и точками вместо пробелов!) распознаются почти идеально за пару минут и одним простым промптом. Gemini без труда справился и с более сложными протоколами из Live Oak County (90 страниц) и даже огромным PDF из Cameron County на 653 страницы с дырками и помехами — пусть и с парой повторных запусков.
Но главное здесь не скорость, а доверие. OpenElections встроил целый пайплайн проверок: автоматические тесты суммирования голосов, проверки на дубликаты, ручные сверки с официальными отчётами. Кроме того, модель запускается с нулевой температурой (без креативности), что сводит ошибки к минимуму. Также используется structured output, который обеспечивает стабильность и предсказуемость результатов. Теперь каждая цифра легко проверяема и воспроизводима. Это уже не просто «эффектный OCR», а полноценный и проверяемый рабочий инструмент.
Что это значит для будущего?
* LLM-решения переходят из демо-статуса в ежедневную практику. Теперь это не хайп, а реальная замена дорогим ручным сервисам.
* Стартапам открываются огромные возможности по автоматизации любых PDF-процессов: от госданных до счетов-фактур и судебных решений.
* Раньше говорили: «LLM ≠ надёжность». Теперь, благодаря проверяемости и низкой «температуре» вывода моделей, доверие больше не барьер.
OCR умер — да здравствует OCR!💪 💪 💪
Раньше ситуация выглядела так: тысячи участков публикуют результаты выборов в виде сканов PDF. Перевод их в таблицы — адский труд. Либо платите огромные суммы операторам ввода, либо мучаетесь с традиционным OCR, который «заикается» на сложных форматах. Цена ошибки — не просто «косметическая», а политическая и репутационная. Поэтому всегда оставалась ручная проверка.
Что изменилось? OpenElections решил рискнуть и запустить обработку PDF через Gemini. И оказалось, что модели можно доверять. Например, протоколы Limestone County на 42 страницы (с двухколоночным макетом и точками вместо пробелов!) распознаются почти идеально за пару минут и одним простым промптом. Gemini без труда справился и с более сложными протоколами из Live Oak County (90 страниц) и даже огромным PDF из Cameron County на 653 страницы с дырками и помехами — пусть и с парой повторных запусков.
Но главное здесь не скорость, а доверие. OpenElections встроил целый пайплайн проверок: автоматические тесты суммирования голосов, проверки на дубликаты, ручные сверки с официальными отчётами. Кроме того, модель запускается с нулевой температурой (без креативности), что сводит ошибки к минимуму. Также используется structured output, который обеспечивает стабильность и предсказуемость результатов. Теперь каждая цифра легко проверяема и воспроизводима. Это уже не просто «эффектный OCR», а полноценный и проверяемый рабочий инструмент.
Что это значит для будущего?
* LLM-решения переходят из демо-статуса в ежедневную практику. Теперь это не хайп, а реальная замена дорогим ручным сервисам.
* Стартапам открываются огромные возможности по автоматизации любых PDF-процессов: от госданных до счетов-фактур и судебных решений.
* Раньше говорили: «LLM ≠ надёжность». Теперь, благодаря проверяемости и низкой «температуре» вывода моделей, доверие больше не барьер.
OCR умер — да здравствует OCR!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4❤2👏1🍌1
Всем привет! Хотим поделиться последними новостями и мыслями. Как и все нормальные люди, мы хотим меньше работать и больше зарабатывать. Поэтому уже давно присматриваемся к SaaS-решениям (чтобы мы попивали джус, а деньги сами капали), и на этой неделе наконец-то релизнули наш собственный продукт: рекомендационную систему на основе визуального сравнения.
Как это работает:
Мы подключаем решение к любому онлайн-магазину с товарами, у которых есть выраженная визуальная составляющая (одежда, обувь, украшения, декор и тд.). Покупатель открывает карточку товара и сразу получает рекомендации похожих вариантов. В итоге пользователь может углубляться в поиск и находить нужные ему товары в формате «Pinterest-поиска».
Дополнительно мы научили модель собирать тематические подборки. Например, выбрал кольцо — получаешь похожие серьги и браслеты. А ещё мы настроили поиск по фотографии: пользователь загружает своё фото, а система показывает максимально похожие товары из каталога магазина.
Решение подходит как для кастомных онлайн-магазинов, так и для Shopify, WooCommerce и популярных конструкторов сайтов.
Вот наш лендинг — залетайте смотреть:
👉 https://www.skailab.tech/airecommendation
Если у вас есть знакомые e-commerce-ребята — киньте им ссылку, будем признательны 🙌
Еще пара мыслей напоследок. Когда мы создавали этот продукт, мы много анализировали рынок AI-решений: от свежих GPT-врапперов до более нишевых нейросетевых проектов — и особенно то, как с ними взаимодействует обычный, неинновационный бизнес.
Именно через эту призму пришло простое понимание. Сегодня не нужно пытаться самим "изобретать паровой двигатель", если ты не исследователь в области ИИ. В мире уже есть инфраструктурные игроки вроде OpenAI и Anthropic, чья задача — строить сами двигатели. Задача бизнеса — выбирать подходящий станок и использовать его, чтобы ускорить производство. Это значит: не тратить ресурсы на обучение собственных моделей, а собирать решения на основе уже мощных моделей — через удобные интерфейсы, глубокую интеграцию с процессами и сильный UX. Такой подход не только экономит бюджет, но и даёт фору: каждое обновление модели от OpenAI — это автоматический апгрейд твоего продукта.
Как это работает:
Мы подключаем решение к любому онлайн-магазину с товарами, у которых есть выраженная визуальная составляющая (одежда, обувь, украшения, декор и тд.). Покупатель открывает карточку товара и сразу получает рекомендации похожих вариантов. В итоге пользователь может углубляться в поиск и находить нужные ему товары в формате «Pinterest-поиска».
Дополнительно мы научили модель собирать тематические подборки. Например, выбрал кольцо — получаешь похожие серьги и браслеты. А ещё мы настроили поиск по фотографии: пользователь загружает своё фото, а система показывает максимально похожие товары из каталога магазина.
Решение подходит как для кастомных онлайн-магазинов, так и для Shopify, WooCommerce и популярных конструкторов сайтов.
Вот наш лендинг — залетайте смотреть:
👉 https://www.skailab.tech/airecommendation
Если у вас есть знакомые e-commerce-ребята — киньте им ссылку, будем признательны 🙌
Еще пара мыслей напоследок. Когда мы создавали этот продукт, мы много анализировали рынок AI-решений: от свежих GPT-врапперов до более нишевых нейросетевых проектов — и особенно то, как с ними взаимодействует обычный, неинновационный бизнес.
Именно через эту призму пришло простое понимание. Сегодня не нужно пытаться самим "изобретать паровой двигатель", если ты не исследователь в области ИИ. В мире уже есть инфраструктурные игроки вроде OpenAI и Anthropic, чья задача — строить сами двигатели. Задача бизнеса — выбирать подходящий станок и использовать его, чтобы ускорить производство. Это значит: не тратить ресурсы на обучение собственных моделей, а собирать решения на основе уже мощных моделей — через удобные интерфейсы, глубокую интеграцию с процессами и сильный UX. Такой подход не только экономит бюджет, но и даёт фору: каждое обновление модели от OpenAI — это автоматический апгрейд твоего продукта.
www.skailab.tech
SkaiLook
AI-Powered Recommendations to Grow Your Business Discover how SkaiLab leverages artificial intelligence to deliver personalized recommendations that boost engagement, increase sales, and optimize decision-making.
❤7👍2🥰1
Немного про голосовых AI-агентов и где они реально могут пригодиться в бизнесе. 🔥🚀
Замечаем, что среди наших заказчиков всё чаще всплывает запрос на внедрение голосовых агентов, поэтому решили написать пост и поделиться мыслями на эту тему.
Начнём сразу с важного: да, ожидания от них бывают завышены. Голосовой агент пока точно не заменит ваших сейлзов, и от выплаты зарплат и споров с РОПами вас не избавит. Но если говорить честно — голосовые агенты реально круто решают кучу типовых задач.
👉 Вот 8 самых полезных кейсов из нашей практики:
1. Прозвон брошенных корзин: агент звонит покупателям, узнаёт почему те не завершили заказ, раскладывает все по фактам и понятиям и предлагает скидку или промокод.
2. Подтверждение заказов: уточняет детали заказа, адрес, удобное время доставки.
3. Сбор обратной связи: опрашивает клиентов по заранее заданным чеклистам или сценариям.
4. Запись на консультации и услуги: и речь не про тупого робота, а про нормального RAG-агента, который может проверить календарь и записать на свободный слот.
5. Холодный обзвон клиентов: первичное касание и проверка интереса к продукту.
6. Подтверждение участия: обзвон участников мероприятий для уточнения явки и деталей встречи.
7. Первичный прескрининг кандидатов (HR): агент проводит предварительный опрос и собирает первичные данные с кандидатов.
8. Поддержка клиентов: агент отвечает на типовые запросы клиентов и при необходимости перенаправляет звонок нужному специалисту.
+ Один специфический кейс, который мы обсуждали с ребятами на нашем обучении про AI (кстати, кто не знает у нас есть курс, где мы через практику без кода показываем как внедрять AI в бизнес - если интересно залетайте на ближайший поток). Так вот к кейсу - это голосовые “AI коллекторы” - нам кажется это просто пушка, можно еще взять голос какой-то супер грозный, чтобы уже точно все вернули 😅
По факту, сейчас на рынке 4 основных сервиса для создания голосовых агентов (без кода, то есть не нужно ничего прогать):
- Vapi.ai
- Bland.ai
- Play.ht
- Retell
📍Тут есть нюанс: на английском все они работают супер-круто, с задержкой буквально 200–300 мс, а вот на русском языке пока сложнее. Хороший голос сложно получить из коробки, нужно заморачиваться и экспериментировать. Поэтому ловите лайфхак: если хотите реально живой голос на русском — проще всего создать копию своего голоса через ElevenLabs и затем импортировать её в своего AI-агента. Да, задержка будет выше, чем у дефолтных голосов, но качество интонаций несравнимо.
Замечаем, что среди наших заказчиков всё чаще всплывает запрос на внедрение голосовых агентов, поэтому решили написать пост и поделиться мыслями на эту тему.
Начнём сразу с важного: да, ожидания от них бывают завышены. Голосовой агент пока точно не заменит ваших сейлзов, и от выплаты зарплат и споров с РОПами вас не избавит. Но если говорить честно — голосовые агенты реально круто решают кучу типовых задач.
👉 Вот 8 самых полезных кейсов из нашей практики:
1. Прозвон брошенных корзин: агент звонит покупателям, узнаёт почему те не завершили заказ, раскладывает все по фактам и понятиям и предлагает скидку или промокод.
2. Подтверждение заказов: уточняет детали заказа, адрес, удобное время доставки.
3. Сбор обратной связи: опрашивает клиентов по заранее заданным чеклистам или сценариям.
4. Запись на консультации и услуги: и речь не про тупого робота, а про нормального RAG-агента, который может проверить календарь и записать на свободный слот.
5. Холодный обзвон клиентов: первичное касание и проверка интереса к продукту.
6. Подтверждение участия: обзвон участников мероприятий для уточнения явки и деталей встречи.
7. Первичный прескрининг кандидатов (HR): агент проводит предварительный опрос и собирает первичные данные с кандидатов.
8. Поддержка клиентов: агент отвечает на типовые запросы клиентов и при необходимости перенаправляет звонок нужному специалисту.
+ Один специфический кейс, который мы обсуждали с ребятами на нашем обучении про AI (кстати, кто не знает у нас есть курс, где мы через практику без кода показываем как внедрять AI в бизнес - если интересно залетайте на ближайший поток). Так вот к кейсу - это голосовые “AI коллекторы” - нам кажется это просто пушка, можно еще взять голос какой-то супер грозный, чтобы уже точно все вернули 😅
По факту, сейчас на рынке 4 основных сервиса для создания голосовых агентов (без кода, то есть не нужно ничего прогать):
- Vapi.ai
- Bland.ai
- Play.ht
- Retell
📍Тут есть нюанс: на английском все они работают супер-круто, с задержкой буквально 200–300 мс, а вот на русском языке пока сложнее. Хороший голос сложно получить из коробки, нужно заморачиваться и экспериментировать. Поэтому ловите лайфхак: если хотите реально живой голос на русском — проще всего создать копию своего голоса через ElevenLabs и затем импортировать её в своего AI-агента. Да, задержка будет выше, чем у дефолтных голосов, но качество интонаций несравнимо.
👍3🔥2
Всем салют и продуктивных выходных! 🧠
Две недели назад прошло очень крутое событие в мире AI — AI School от Y Combinator. Мы решили запариться: перевели выступления и сделали подробные саммари с пояснениями по ключевым спикерам.
📌 В подборке:
- Франсуа Шоле — Как мы дойдём до AGI
- Фэй-Фэй Ли — Пространственный интеллект: следующая граница развития ИИ
- Сатья Наделла — Ставка Microsoft на AI, гипермасштабирование и квантовые технологии
- Сэм Альтман — Будущее OpenAI и история создания ChatGPT
- Илон Маск — Цифровой сверхинтеллект, многопланетная жизнь и как быть полезным
- Андрей Карпаты — Как меняется Software
📖 Залетайте читать саммари по ссылке
Две недели назад прошло очень крутое событие в мире AI — AI School от Y Combinator. Мы решили запариться: перевели выступления и сделали подробные саммари с пояснениями по ключевым спикерам.
📌 В подборке:
- Франсуа Шоле — Как мы дойдём до AGI
- Фэй-Фэй Ли — Пространственный интеллект: следующая граница развития ИИ
- Сатья Наделла — Ставка Microsoft на AI, гипермасштабирование и квантовые технологии
- Сэм Альтман — Будущее OpenAI и история создания ChatGPT
- Илон Маск — Цифровой сверхинтеллект, многопланетная жизнь и как быть полезным
- Андрей Карпаты — Как меняется Software
📖 Залетайте читать саммари по ссылке
catnip-donut-6b8 on Notion
Саммари AI School от Y Combinator | Notion
🔥11❤3🥰2👍1
Всем привет! 👋
Недавно наткнулись на базу AI сервисов, которые были созданы российскими фаундерами. там есть все: от HR до маркетинга, ну и конечно без vpn.
Очень хорошая подборка по индустриям, чейкате по ссылке
Недавно наткнулись на базу AI сервисов, которые были созданы российскими фаундерами. там есть все: от HR до маркетинга, ну и конечно без vpn.
Очень хорошая подборка по индустриям, чейкате по ссылке
incrussia.ru
Карта российского ИИ - Инк.
Рубрика Карта российского ИИ.
❤🔥4❤2👍1🔥1🫡1
Metrigy_Report_20250417Q2_AIAgents-1.pdf
1.9 MB
Всем доброе утро! Вчера вышло небольшое, но интересное исследование от Metrigy, они провели опрос среди более чем 1100 компаний, которые внедрили агентский подход в свои бизнес-процессы.
Вот основные выводы:
1) Агентный ИИ — это новая ступень, где ИИ не просто отвечает или генерирует контент, а самостоятельно принимает решения и выполняет действия.
Компании, внедрившие агентный ИИ, зафиксировали:
• 📍 Увеличение выручки на 27,4%
• 📍 Снижение операционных затрат на 21,4%
• 📍 Рост удовлетворённости клиентов на 35%
• 📍 Повышение эффективности сотрудников на 31,2%
2) Агентный ИИ максимально эффективен, если имеет доступ ко всем системам: чатам, CRM, файлам, планировщикам и т.д.
👉 Чем больше подключённых источников данных, тем выше ценность агента. (звучит по капитански, но тем не менее)
3) Компании с максимальной эффективностью от ИИ:
•📍 В 2 раза чаще имеют AI Center of Excellence (Центр экспертизы ИИ)
•📍 Почти 60% имеют стратегию по управлению данными и безопасностью
•📍 84% выделяют ресурсы на обучение сотрудников использыванию AI инструментов. (Кстати, по последнему пункту — мы сейчас делаем большой фокус на корпоративное обучение у нас в practico.ai. Думаю, скоро напишем об этом отдельный пост.)
Полное исследование прикрепили, правда без перевода на русский, это нам стало делать влом 😅
Вот основные выводы:
1) Агентный ИИ — это новая ступень, где ИИ не просто отвечает или генерирует контент, а самостоятельно принимает решения и выполняет действия.
Компании, внедрившие агентный ИИ, зафиксировали:
• 📍 Увеличение выручки на 27,4%
• 📍 Снижение операционных затрат на 21,4%
• 📍 Рост удовлетворённости клиентов на 35%
• 📍 Повышение эффективности сотрудников на 31,2%
2) Агентный ИИ максимально эффективен, если имеет доступ ко всем системам: чатам, CRM, файлам, планировщикам и т.д.
👉 Чем больше подключённых источников данных, тем выше ценность агента. (звучит по капитански, но тем не менее)
3) Компании с максимальной эффективностью от ИИ:
•📍 В 2 раза чаще имеют AI Center of Excellence (Центр экспертизы ИИ)
•📍 Почти 60% имеют стратегию по управлению данными и безопасностью
•📍 84% выделяют ресурсы на обучение сотрудников использыванию AI инструментов. (Кстати, по последнему пункту — мы сейчас делаем большой фокус на корпоративное обучение у нас в practico.ai. Думаю, скоро напишем об этом отдельный пост.)
Полное исследование прикрепили, правда без перевода на русский, это нам стало делать влом 😅
❤5👍2🔥1🥴1
Ничего себе, целых два поста в один день 😱
Да, нас что-то пробило… Надеемся, никто не отпишется, а то после каждого поста мы грустно смотрим на статистику и плачем. Поэтому, если вы порекомендуете наш канал своим знакомым, мы будем очень рады 😅
На прошлой неделе вышло очень интересное обновление модели для генерации видео LTXV от Lightricks, и это действительно открывает новые возможности по автоматизации создания контента.
Дело в том, что большинство моделей, например, нашумевшая Veo 3, может генерировать видео всего на 8 секунд, и процесс создания хотя бы одного Reels для Instagram выглядит как «полный кошмар», где нужно сильно заморачиваться с промптами, чтобы сделать консистентную генерацию персонажей из кадра в кадр. Даже используя последние модели Wan, Kling или Hailuo, где можно задать начальные и конечные стадии, этот процесс не выглядит супер пользовательски удобным.
Так вот, модель LTXV делает новый шаг в генерации контента, потому что позволяет генерировать видео продолжительностью более 60 секунд из изображений — в реальном времени, с управлением промптами в процессе.
Вот её основные особенности:
📌Модель стримит видео в реальном времени, возвращая первую секунду мгновенно, при этом сцены строятся непрерывно, без разрывов.
📌 Пользователи могут применять управляющие команды на протяжении всего процесса генерации, регулируя позы, глубину и стиль в процессе.
📌 LTXV обучена на полностью лицензированных данных и имеет прямую интеграцию с пакетом LTX Studio.
Открытая модель доступна в версиях с 13B и мобильной 2B параметрами, бесплатно на GitHub и Hugging Face по ссылке.
Да, нас что-то пробило… Надеемся, никто не отпишется, а то после каждого поста мы грустно смотрим на статистику и плачем. Поэтому, если вы порекомендуете наш канал своим знакомым, мы будем очень рады 😅
На прошлой неделе вышло очень интересное обновление модели для генерации видео LTXV от Lightricks, и это действительно открывает новые возможности по автоматизации создания контента.
Дело в том, что большинство моделей, например, нашумевшая Veo 3, может генерировать видео всего на 8 секунд, и процесс создания хотя бы одного Reels для Instagram выглядит как «полный кошмар», где нужно сильно заморачиваться с промптами, чтобы сделать консистентную генерацию персонажей из кадра в кадр. Даже используя последние модели Wan, Kling или Hailuo, где можно задать начальные и конечные стадии, этот процесс не выглядит супер пользовательски удобным.
Так вот, модель LTXV делает новый шаг в генерации контента, потому что позволяет генерировать видео продолжительностью более 60 секунд из изображений — в реальном времени, с управлением промптами в процессе.
Вот её основные особенности:
📌Модель стримит видео в реальном времени, возвращая первую секунду мгновенно, при этом сцены строятся непрерывно, без разрывов.
📌 Пользователи могут применять управляющие команды на протяжении всего процесса генерации, регулируя позы, глубину и стиль в процессе.
📌 LTXV обучена на полностью лицензированных данных и имеет прямую интеграцию с пакетом LTX Studio.
Открытая модель доступна в версиях с 13B и мобильной 2B параметрами, бесплатно на GitHub и Hugging Face по ссылке.
👍7❤1🔥1
Компьютерное зрение для бизнеса и производства
Сегодня AI чаще всего ассоциируется с LLM-моделями, чат-ботами и генерацией контента. Это действительно один из самых заметных трендов последних лет.
Но AI — это не только работа с текстом.
Большой пласт прикладных задач в бизнесе решается через компьютерное зрение: анализ видео, изображений, перемещений объектов, соблюдения регламентов и событий в реальном времени.
Такие решения особенно полезны там, где уже есть:
• камеры
• видеопотоки
• контрольные зоны
• повторяющиеся процессы
• требования к безопасности и дисциплине
Мы работаем с такими задачами и внедряем системы компьютерного зрения под конкретные процессы компаний.
Ниже несколько кейсов.
1. Контроль промышленной безопасности: каски и опасные зоны
Задача
На производственной площадке нужно было в реальном времени контролировать:
• наличие касок у сотрудников
• присутствие персонала в запрещённых зонах
• быстрое оповещение о нарушениях
Цель — снизить риски травматизма и сократить время реакции на опасные действия.
Решение
Мы разработали систему компьютерного зрения, которая:
• детектирует людей в кадре
• определяет наличие или отсутствие каски
• отслеживает перемещение по размеченным полигонам зон
• формирует событие нарушения с кадром
• отправляет уведомление диспетчеру
Система работала с видеопотоком до 6 IP-камер одновременно.
Результат
• нарушение фиксировалось в течение 0.2–0.3 секунды после появления в кадре
• уведомления приходили в пределах 1 секунды
• у службы безопасности и руководства сократилось время реакции
• систему можно использовать не только для контроля, но и для последующей аналитики нарушений
#компьютерноезрение
#производство
#промбезопасность
2. Контроль работы спецтехники на производственной площадке
Задача
На площадке нужно было контролировать работу АБС и движение техники:
• прохождение контрольных точек
• соблюдение маршрутов
• отклонения по времени
• прогнозирование сбоев и задержек
Ручной контроль был медленным и непрозрачным.
Решение
Мы внедрили систему компьютерного зрения для мониторинга техники.
Что использовалось:
• уникальные ARUCO-маркеры на транспорте
• bounding box + нейросеть для определения позиции техники
• интеграция с TRASSIR
• работа через локальные серверы
• обработка потока с до 30 камер
Система фиксировала пространственные и временные метки, отслеживала прохождение точек и выдавала тревожные уведомления при превышении допустимого времени.
Результат
• полный контроль до 200 единиц техники в реальном времени
• автоматические тревоги при отклонениях
• фиксация ошибок и задержек с точной временной и пространственной привязкой
• прогнозирование отклонений от маршрута и пересчёт таймингов
• подробная аналитика с интеграцией в TRASSIR
#производство
#компьютерноезрение
#операционныйконтроль
3. Контроль движения транспорта через КПП
Задача
Заказчику нужно было автоматизировать контроль движения автотранспортных средств через КПП на нескольких объектах.
Цели:
• убрать ручной учёт
• повысить точность контроля
• интегрировать данные с ERP и видеонаблюдением
• получать машиночитаемую отчётность в реальном времени
Решение
Мы разработали систему на базе компьютерного зрения для распознавания и трекинга транспорта.
Архитектура решения:
• видеопоток с промышленных камер
• YOLOv5 для детекции
• ResNet для классификации типов транспорта
• Deep SORT для трекинга
• REST API для передачи JSON-событий в ERP
• веб-дашборд со статусами камер и историей проездов
Система фиксировала:
• время проезда
• номер КПП
• ID транспорта
• класс транспортного средства
Результат
• система стабильно работает на нескольких объектах с десятками КПП
• точность детекции: Precision > 0.92, Recall > 0.9
• данные автоматически передаются в ERP
• сокращается время на контроль и отчётность
• повышается прозрачность и безопасность на объектах
#безопасность
#контрольдоступа
#компьютерноезрение
Сегодня AI чаще всего ассоциируется с LLM-моделями, чат-ботами и генерацией контента. Это действительно один из самых заметных трендов последних лет.
Но AI — это не только работа с текстом.
Большой пласт прикладных задач в бизнесе решается через компьютерное зрение: анализ видео, изображений, перемещений объектов, соблюдения регламентов и событий в реальном времени.
Такие решения особенно полезны там, где уже есть:
• камеры
• видеопотоки
• контрольные зоны
• повторяющиеся процессы
• требования к безопасности и дисциплине
Мы работаем с такими задачами и внедряем системы компьютерного зрения под конкретные процессы компаний.
Ниже несколько кейсов.
1. Контроль промышленной безопасности: каски и опасные зоны
Задача
На производственной площадке нужно было в реальном времени контролировать:
• наличие касок у сотрудников
• присутствие персонала в запрещённых зонах
• быстрое оповещение о нарушениях
Цель — снизить риски травматизма и сократить время реакции на опасные действия.
Решение
Мы разработали систему компьютерного зрения, которая:
• детектирует людей в кадре
• определяет наличие или отсутствие каски
• отслеживает перемещение по размеченным полигонам зон
• формирует событие нарушения с кадром
• отправляет уведомление диспетчеру
Система работала с видеопотоком до 6 IP-камер одновременно.
Результат
• нарушение фиксировалось в течение 0.2–0.3 секунды после появления в кадре
• уведомления приходили в пределах 1 секунды
• у службы безопасности и руководства сократилось время реакции
• систему можно использовать не только для контроля, но и для последующей аналитики нарушений
#компьютерноезрение
#производство
#промбезопасность
2. Контроль работы спецтехники на производственной площадке
Задача
На площадке нужно было контролировать работу АБС и движение техники:
• прохождение контрольных точек
• соблюдение маршрутов
• отклонения по времени
• прогнозирование сбоев и задержек
Ручной контроль был медленным и непрозрачным.
Решение
Мы внедрили систему компьютерного зрения для мониторинга техники.
Что использовалось:
• уникальные ARUCO-маркеры на транспорте
• bounding box + нейросеть для определения позиции техники
• интеграция с TRASSIR
• работа через локальные серверы
• обработка потока с до 30 камер
Система фиксировала пространственные и временные метки, отслеживала прохождение точек и выдавала тревожные уведомления при превышении допустимого времени.
Результат
• полный контроль до 200 единиц техники в реальном времени
• автоматические тревоги при отклонениях
• фиксация ошибок и задержек с точной временной и пространственной привязкой
• прогнозирование отклонений от маршрута и пересчёт таймингов
• подробная аналитика с интеграцией в TRASSIR
#производство
#компьютерноезрение
#операционныйконтроль
3. Контроль движения транспорта через КПП
Задача
Заказчику нужно было автоматизировать контроль движения автотранспортных средств через КПП на нескольких объектах.
Цели:
• убрать ручной учёт
• повысить точность контроля
• интегрировать данные с ERP и видеонаблюдением
• получать машиночитаемую отчётность в реальном времени
Решение
Мы разработали систему на базе компьютерного зрения для распознавания и трекинга транспорта.
Архитектура решения:
• видеопоток с промышленных камер
• YOLOv5 для детекции
• ResNet для классификации типов транспорта
• Deep SORT для трекинга
• REST API для передачи JSON-событий в ERP
• веб-дашборд со статусами камер и историей проездов
Система фиксировала:
• время проезда
• номер КПП
• ID транспорта
• класс транспортного средства
Результат
• система стабильно работает на нескольких объектах с десятками КПП
• точность детекции: Precision > 0.92, Recall > 0.9
• данные автоматически передаются в ERP
• сокращается время на контроль и отчётность
• повышается прозрачность и безопасность на объектах
#безопасность
#контрольдоступа
#компьютерноезрение
4. Трекинг футболистов и 3D-позы в реальном времени
Задача
Создать систему, которая по видеопотоку с обзорной камеры отслеживает:
• перемещения игроков
• координаты на поле
• 3D-позы
• игровые действия
Цель — дать тренерам и аналитикам инструмент для тактического анализа и оценки нагрузок.
Решение
Мы собрали систему на стыке трекинга, pose estimation и спортивной аналитики.
Использовались:
• YOLOv8 + ByteTrack для устойчивого сопровождения игроков
• OpenPifPaf для восстановления 3D-поз
• гомография и OpenCV для привязки к координатной сетке поля
• Flask + WebSockets для визуализации
• GPU RTX 4070
• latency около 200–300 мс
Система отображала игроков на тактической карте и сохраняла данные для дальнейшей аналитики.
Результат
• стабильный трекинг до 22 игроков в реальном времени
• ошибка позиционирования на плоскости поля — до 0.5–0.7 м
• появилась возможность строить тепловые карты, зоны активности и анализировать игровые эпизоды
• тренерский штаб получил новый слой аналитики по матчу
#Sportstech
#компьютерноезрение
#AIаналитика
5. Трекинг картингов и AR-объектов в трансляции
Задача
Длятрансляции с трассы требовалось:
• встраивать AR-объекты в видеопоток
• сохранять стабильную привязку к трассе при смене углов камеры
• отображать объект на 2D-карте в реальном времени
Решение
Мы реализовали систему позиционирования камеры и AR-интеграции.
Что использовалось:
• solvePnP (OpenCV)
• фильтрация RANSAC
• ORB / AKAZE для предобработки
• интеграция с Unreal Engine
• GPS-данные с обработкой через Kalman filter
• Windows Server + RTX 3090
Результат
• определение позиции камеры с точностью 0.3–0.5 м
• AR-объекты стабильно удерживались в кадре
• реализовано отображение объекта на карте в реальном времени
• трансляция стала технологически сложнее и зрелищнее
#AR
#Sportstech
#компьютерноезрение
Как Practico.ai внедряет computer vision
Работаем в двух форматах.
1. Кастомная разработка
Разрабатываем системы под конкретный процесс компании:
• безопасность
• контроль производства
• контроль транспорта и техники
• трекинг объектов
• видеоаналитика
2. Пилот / PoC
Если задачу нужно быстро проверить, запускаем пилот на ограниченном контуре:
• на части камер
• на одном объекте
• на одном процессе
Это позволяет быстро понять, есть ли практический эффект, и только потом масштабировать решение.
Если вы хотите понять, можно ли использовать компьютерное зрение в вашем бизнесе или на производстве — напишите нам в ТГ, назначим бесплатную консультацию, по итогам получите список инструментов для внедрения, сроки реализации и плановую окупаемость.
#AIкейсы
#компьютерноезрение
Интересный пост:
👉Как внедрить AI в компанию: 4 шага
Задача
Создать систему, которая по видеопотоку с обзорной камеры отслеживает:
• перемещения игроков
• координаты на поле
• 3D-позы
• игровые действия
Цель — дать тренерам и аналитикам инструмент для тактического анализа и оценки нагрузок.
Решение
Мы собрали систему на стыке трекинга, pose estimation и спортивной аналитики.
Использовались:
• YOLOv8 + ByteTrack для устойчивого сопровождения игроков
• OpenPifPaf для восстановления 3D-поз
• гомография и OpenCV для привязки к координатной сетке поля
• Flask + WebSockets для визуализации
• GPU RTX 4070
• latency около 200–300 мс
Система отображала игроков на тактической карте и сохраняла данные для дальнейшей аналитики.
Результат
• стабильный трекинг до 22 игроков в реальном времени
• ошибка позиционирования на плоскости поля — до 0.5–0.7 м
• появилась возможность строить тепловые карты, зоны активности и анализировать игровые эпизоды
• тренерский штаб получил новый слой аналитики по матчу
#Sportstech
#компьютерноезрение
#AIаналитика
5. Трекинг картингов и AR-объектов в трансляции
Задача
Длятрансляции с трассы требовалось:
• встраивать AR-объекты в видеопоток
• сохранять стабильную привязку к трассе при смене углов камеры
• отображать объект на 2D-карте в реальном времени
Решение
Мы реализовали систему позиционирования камеры и AR-интеграции.
Что использовалось:
• solvePnP (OpenCV)
• фильтрация RANSAC
• ORB / AKAZE для предобработки
• интеграция с Unreal Engine
• GPS-данные с обработкой через Kalman filter
• Windows Server + RTX 3090
Результат
• определение позиции камеры с точностью 0.3–0.5 м
• AR-объекты стабильно удерживались в кадре
• реализовано отображение объекта на карте в реальном времени
• трансляция стала технологически сложнее и зрелищнее
#AR
#Sportstech
#компьютерноезрение
Как Practico.ai внедряет computer vision
Работаем в двух форматах.
1. Кастомная разработка
Разрабатываем системы под конкретный процесс компании:
• безопасность
• контроль производства
• контроль транспорта и техники
• трекинг объектов
• видеоаналитика
2. Пилот / PoC
Если задачу нужно быстро проверить, запускаем пилот на ограниченном контуре:
• на части камер
• на одном объекте
• на одном процессе
Это позволяет быстро понять, есть ли практический эффект, и только потом масштабировать решение.
Если вы хотите понять, можно ли использовать компьютерное зрение в вашем бизнесе или на производстве — напишите нам в ТГ, назначим бесплатную консультацию, по итогам получите список инструментов для внедрения, сроки реализации и плановую окупаемость.
#AIкейсы
#компьютерноезрение
Интересный пост:
👉Как внедрить AI в компанию: 4 шага
Telegram
Practico AI | Внедрение ИИ для бизнеса
Как внедрить AI в компанию: 4 шага
Многие компании понимают, что искусственный интеллект может дать реальный эффект.
Но почти всегда возникают одни и те же вопросы:
• с чего начать работу с AI
• какие процессы стоит автоматизировать
• какие технологии…
Многие компании понимают, что искусственный интеллект может дать реальный эффект.
Но почти всегда возникают одни и те же вопросы:
• с чего начать работу с AI
• какие процессы стоит автоматизировать
• какие технологии…
😢5👍3🔥2💯2👏1
Всем привет и хороших выходных. Хотим поделиться очень интересным материалам. За последний месяц мы собрали больше 50 агентских систем — начиная от простых систем на ноу коде в n8n.io, Langflow и заканчивая многослойными пайплайнами на LangChain и LangGraph — с оркестрацией через FastAPI и asyncio, RAG, строгой валидацией через pydantic и кастомными инструментами и тд.
Недавно нашли классный репозиторий с системными промптами от Lovable, Perplexity, Replit и других. Очень показательно, как крупные компании формулируют промпты для своих задач.
Вы можете почитать их по ссылке
Рекомендуем — must-see для референсов системных промптов.
Недавно нашли классный репозиторий с системными промптами от Lovable, Perplexity, Replit и других. Очень показательно, как крупные компании формулируют промпты для своих задач.
Вы можете почитать их по ссылке
Рекомендуем — must-see для референсов системных промптов.
🔥7❤3👍1
На этой неделе Google выкатил Gemini Flash 2.5 Image по кодовым названием nano-banana — новую AI-модель для многошагового редактирования изображений. Небольшой обзор на нее:
- Поддерживает многоходовое редактирование: можно вносить изменения пошагово, сохраняя консистентность образа.
- Делает смешивание изображений и стилей — перенос сцен, объектов, художественных приёмов в одном пайплайне.
- Работает на естественных языковых промптах (никаких сложных масок руками).
Подключает мультимодальное рассуждение и знания о мире: модель стратегически «додумывает» детали (например, подбирает правильные растения для конкретного сеттинга).
Модель стала виральной в тестах и взлетела на 1-е место в рейтинге LM Arena Image Edit, оставив позади даже Flux-Kontext. По стоимости — $0.039 за изображение через API и Google AI Studio. Это чуть дешевле, чем у OpenAI gpt-image и Flux-Kontext от BFL.
Подробнее можно почитать на сайте гугл
- Поддерживает многоходовое редактирование: можно вносить изменения пошагово, сохраняя консистентность образа.
- Делает смешивание изображений и стилей — перенос сцен, объектов, художественных приёмов в одном пайплайне.
- Работает на естественных языковых промптах (никаких сложных масок руками).
Подключает мультимодальное рассуждение и знания о мире: модель стратегически «додумывает» детали (например, подбирает правильные растения для конкретного сеттинга).
Модель стала виральной в тестах и взлетела на 1-е место в рейтинге LM Arena Image Edit, оставив позади даже Flux-Kontext. По стоимости — $0.039 за изображение через API и Google AI Studio. Это чуть дешевле, чем у OpenAI gpt-image и Flux-Kontext от BFL.
Подробнее можно почитать на сайте гугл
Как внедрить AI в компанию: 4 шага
Многие компании понимают, что искусственный интеллект может дать реальный эффект.
Но почти всегда возникают одни и те же вопросы:
• с чего начать работу с AI
• какие процессы стоит автоматизировать
• какие технологии выбрать
• как оценить экономический эффект
• как внедрить AI без сопротивления команды
Поэтому в Practico.ai используется системный подход к внедрению AI.
В основе работы — собственная методология SKAI Framework, которая помогает пройти путь от идеи до работающего AI-решения в бизнесе.
SKAI Framework состоит из четырёх этапов.
1. Strategy
На первом этапе проводится разбор бизнеса и процессов компании.
Анализируются:
• ключевые процессы
• текущие ограничения
• потенциальные зоны применения AI
• ожидаемый экономический эффект
Результат этапа — карта возможностей AI и roadmap внедрения.
2. Knowledge & Infrastructure
AI-системы работают только тогда, когда подготовлены данные и инфраструктура.
На этом этапе:
• анализируются источники данных
• формируются базы знаний
• проектируются интеграции с существующими системами
• создаётся архитектура будущего решения
Этап создаёт основу для дальнейшего внедрения.
3. Application
Далее запускаются первые прикладные решения.
На этом этапе:
• создаются прототипы
• запускаются пилотные проекты
• тестируются гипотезы
• AI интегрируется в реальные процессы
В большинстве проектов первые рабочие пилоты можно запустить в течение нескольких недель.
4. Institutionalization
После успешных пилотов решения масштабируются внутри компании.
На этом этапе:
• AI внедряется в рабочие процессы
• обучаются команды
• настраиваются метрики эффективности
• масштабируются успешные сценарии
AI становится частью операционной системы компании.
Как обычно начинается работа
На практике внедрение чаще всего начинается с одного из форматов.
#AIразборбизнеса
Разбор вашего кейса и подбор AI-инструментов
#AIстратегия
Разбор бизнеса и формирование roadmap внедрения AI.
#AIконсультация
Разбор конкретной задачи и рекомендации по применению AI.
AI-воркшоп
Практическая сессия с командой компании, на которой:
• анализируются процессы
• определяются точки применения AI
• формируются гипотезы внедрения
#AIразработка
Разработка решений под конкретные задачи бизнеса.
Например:
• AI-агенты
• RAG-системы
• аналитика данных
• компьютерное зрение
• автоматизация процессов
Подход Practico.ai
AI рассматривается не как технология сама по себе, а как инструмент решения конкретных бизнес-задач.
Поэтому большинство проектов начинается не с разработки, а с разбора процессов и оценки эффекта внедрения.
Если хотите понять, где AI может дать эффект в вашей компании —
напишите нам в ТГ, назначим бесплатную консультацию, по итогам получите список инструментов для внедрения, сроки реализации и плановую окупаемость..
#AIстратегия
Многие компании понимают, что искусственный интеллект может дать реальный эффект.
Но почти всегда возникают одни и те же вопросы:
• с чего начать работу с AI
• какие процессы стоит автоматизировать
• какие технологии выбрать
• как оценить экономический эффект
• как внедрить AI без сопротивления команды
Поэтому в Practico.ai используется системный подход к внедрению AI.
В основе работы — собственная методология SKAI Framework, которая помогает пройти путь от идеи до работающего AI-решения в бизнесе.
SKAI Framework состоит из четырёх этапов.
1. Strategy
На первом этапе проводится разбор бизнеса и процессов компании.
Анализируются:
• ключевые процессы
• текущие ограничения
• потенциальные зоны применения AI
• ожидаемый экономический эффект
Результат этапа — карта возможностей AI и roadmap внедрения.
2. Knowledge & Infrastructure
AI-системы работают только тогда, когда подготовлены данные и инфраструктура.
На этом этапе:
• анализируются источники данных
• формируются базы знаний
• проектируются интеграции с существующими системами
• создаётся архитектура будущего решения
Этап создаёт основу для дальнейшего внедрения.
3. Application
Далее запускаются первые прикладные решения.
На этом этапе:
• создаются прототипы
• запускаются пилотные проекты
• тестируются гипотезы
• AI интегрируется в реальные процессы
В большинстве проектов первые рабочие пилоты можно запустить в течение нескольких недель.
4. Institutionalization
После успешных пилотов решения масштабируются внутри компании.
На этом этапе:
• AI внедряется в рабочие процессы
• обучаются команды
• настраиваются метрики эффективности
• масштабируются успешные сценарии
AI становится частью операционной системы компании.
Как обычно начинается работа
На практике внедрение чаще всего начинается с одного из форматов.
#AIразборбизнеса
Разбор вашего кейса и подбор AI-инструментов
#AIстратегия
Разбор бизнеса и формирование roadmap внедрения AI.
#AIконсультация
Разбор конкретной задачи и рекомендации по применению AI.
AI-воркшоп
Практическая сессия с командой компании, на которой:
• анализируются процессы
• определяются точки применения AI
• формируются гипотезы внедрения
#AIразработка
Разработка решений под конкретные задачи бизнеса.
Например:
• AI-агенты
• RAG-системы
• аналитика данных
• компьютерное зрение
• автоматизация процессов
Подход Practico.ai
AI рассматривается не как технология сама по себе, а как инструмент решения конкретных бизнес-задач.
Поэтому большинство проектов начинается не с разработки, а с разбора процессов и оценки эффекта внедрения.
Если хотите понять, где AI может дать эффект в вашей компании —
напишите нам в ТГ, назначим бесплатную консультацию, по итогам получите список инструментов для внедрения, сроки реализации и плановую окупаемость..
#AIстратегия
❤5🔥1
Всем привет и продуктивной недели! 🚀🚀🚀
Мы наткнулись на отличный репозиторий с более чем 2000 бесплатными готовыми автоматизациями для n8n и, конечно, решили поделиться им здесь.
Посмотреть и скачать все процессы можно по ссылке
Мы наткнулись на отличный репозиторий с более чем 2000 бесплатными готовыми автоматизациями для n8n и, конечно, решили поделиться им здесь.
Посмотреть и скачать все процессы можно по ссылке
❤6👍3🔥2
Media is too big
VIEW IN TELEGRAM
Очень большой, но полезный пост ❤️
Мы неделю плотно сидим в Perplexity Comet и на фоне релиза Gemini в Chrome (18 сентября) собрали тезисы про «ИИ-браузеры».
В целом паттерн поиска в интернете уже давно начал меняться: от простого «гугления» к запросам в LLM (у B2B-сайтов доля такого трафика уже достигает 5–6 % органики).
Сейчас же AI фактически встраивается в сам браузер и начинает не только выполнять функцию поиска, но и совершать действия — аналогично режиму «агента» в GPT. В перспективе это приведёт к формированию нового UX-паттерна и, по сути, нового типа трафика, когда лид-формы, покупки и бронирования будут заполнять уже не люди, а агенты.
Но давайте по порядку. Начнем с небольшого обзора по текущей функциональности Comet и Chrome:
Comet (Perplexity)
- Что это по ощущениям: «оператор» в браузере, который сам щёлкает по интерфейсу, заполняет формы и доводит задачу до результата. Демо можно посмотреть тут
Как ведёт себя в реальности
- Делает шаги на странице. Открываешь 3–4 сайта отелей → пишешь: «сравни по цене/отмене, забронируй на 12–14 октября» → Comet проходит страницы, кликает фильтры, заполняет форму, предлагает черновик брони.
- Тянет контекст из рабочего окружения. Может учитывать открытые вкладки, недавние поиски и (если дал доступ) почту/календарь.
- Собирает конспект, но с конкретным next steps. Резюме страницы + кнопка «что дальше»: запросить счёт, написать письмо, заполнить форму заявки и тд.
По сути как "агент" в GPT, только лучше (по нашему мнению)
Chrome с Gemini
Пока в хроме режим "агента", который выполняют действия очень слабый, но 100% они докрутят его в ближайшее время. Демо можно посмотреть тут
Что есть на текущий момент:
- Gemini в Omnibox. Пишешь вопрос прямо в адресной строке и получаешь ответ с учётом текущих вкладок и связанной темы.
- Сводки по вкладкам. Делает краткие обзоры сразу по нескольким страницам — идеально для ресёрча, путешествий, сравнений.
- Помогает на странице. Быстрый TL;DR, уточнения и тд.
Понятное дело, что никто не говорит о том, что SEO «умер», но активное включение «агентов» в работу браузеров добавляет новые правила.
По сути, фокус смещается со «списка ссылок» на синтез и действие. Логика меняется: выигрывает тот, у кого данные хорошо структурированы и интерфейс дружелюбен к агентам.
Прежде чем перейти к конкретным рекомендациям, давайте определимся с терминологией. Существует множество разных определений - сведём их к минимуму:
- AIO (AI Optimization) - стратегия оптимизации, включающая в себя не только “быть источником” для ИИ, но и улучшение механизмов восприятия контента: формат, структура, релевантность, бренд, автоматизация, работа с AI-инструментами.
- GEO (Generative Engine Optimization) - оптимизация конкретно под генеративные движки / AI-ответчики так, чтобы ваш контент цитировался или использовался как источник при формировании ответов ИИ-систем.
- AEO (Answer Engine Optimization) - Оптимизация под движки-ответчики: найти фрагменты контента, которые напрямую отвечают на вопросы пользователей через ассистентов, голосовой поиск, сниппеты, “пользователи также спрашивают” и т.д.
- AAIO (Agentic AI Optimisation) - Подход по подготовке сайта / контента / архитектуры так, чтобы автономные агенты могли самостоятельно взаимодействовать с ресурсом и выполнять задачи от имени пользователей. То есть они не просто отвечают на запросы или предоставляют информацию, а ориентированы на задачу: выполнять бронирование, проверку, сравнение, заполнять формы, собирать данные.
Мы, как обычно, запарились и собрали гайд о том, что нужно знать про AAIO и не только - также написали про AIO, GEO и AEO. Получился действительно большой документ, который можно сразу брать в работу.
📕📕📕 Почитать гайд можно по ссылке (там реально много - и полезно) 📕📕📕
Мы сейчас как раз переделываем наши сайти (уже прокляли эту затею 🙈), но активно применяем эти рекомендации и вам советуем.
Мы неделю плотно сидим в Perplexity Comet и на фоне релиза Gemini в Chrome (18 сентября) собрали тезисы про «ИИ-браузеры».
В целом паттерн поиска в интернете уже давно начал меняться: от простого «гугления» к запросам в LLM (у B2B-сайтов доля такого трафика уже достигает 5–6 % органики).
Сейчас же AI фактически встраивается в сам браузер и начинает не только выполнять функцию поиска, но и совершать действия — аналогично режиму «агента» в GPT. В перспективе это приведёт к формированию нового UX-паттерна и, по сути, нового типа трафика, когда лид-формы, покупки и бронирования будут заполнять уже не люди, а агенты.
Но давайте по порядку. Начнем с небольшого обзора по текущей функциональности Comet и Chrome:
Comet (Perplexity)
- Что это по ощущениям: «оператор» в браузере, который сам щёлкает по интерфейсу, заполняет формы и доводит задачу до результата. Демо можно посмотреть тут
Как ведёт себя в реальности
- Делает шаги на странице. Открываешь 3–4 сайта отелей → пишешь: «сравни по цене/отмене, забронируй на 12–14 октября» → Comet проходит страницы, кликает фильтры, заполняет форму, предлагает черновик брони.
- Тянет контекст из рабочего окружения. Может учитывать открытые вкладки, недавние поиски и (если дал доступ) почту/календарь.
- Собирает конспект, но с конкретным next steps. Резюме страницы + кнопка «что дальше»: запросить счёт, написать письмо, заполнить форму заявки и тд.
По сути как "агент" в GPT, только лучше (по нашему мнению)
Chrome с Gemini
Пока в хроме режим "агента", который выполняют действия очень слабый, но 100% они докрутят его в ближайшее время. Демо можно посмотреть тут
Что есть на текущий момент:
- Gemini в Omnibox. Пишешь вопрос прямо в адресной строке и получаешь ответ с учётом текущих вкладок и связанной темы.
- Сводки по вкладкам. Делает краткие обзоры сразу по нескольким страницам — идеально для ресёрча, путешествий, сравнений.
- Помогает на странице. Быстрый TL;DR, уточнения и тд.
Понятное дело, что никто не говорит о том, что SEO «умер», но активное включение «агентов» в работу браузеров добавляет новые правила.
По сути, фокус смещается со «списка ссылок» на синтез и действие. Логика меняется: выигрывает тот, у кого данные хорошо структурированы и интерфейс дружелюбен к агентам.
Прежде чем перейти к конкретным рекомендациям, давайте определимся с терминологией. Существует множество разных определений - сведём их к минимуму:
- AIO (AI Optimization) - стратегия оптимизации, включающая в себя не только “быть источником” для ИИ, но и улучшение механизмов восприятия контента: формат, структура, релевантность, бренд, автоматизация, работа с AI-инструментами.
- GEO (Generative Engine Optimization) - оптимизация конкретно под генеративные движки / AI-ответчики так, чтобы ваш контент цитировался или использовался как источник при формировании ответов ИИ-систем.
- AEO (Answer Engine Optimization) - Оптимизация под движки-ответчики: найти фрагменты контента, которые напрямую отвечают на вопросы пользователей через ассистентов, голосовой поиск, сниппеты, “пользователи также спрашивают” и т.д.
- AAIO (Agentic AI Optimisation) - Подход по подготовке сайта / контента / архитектуры так, чтобы автономные агенты могли самостоятельно взаимодействовать с ресурсом и выполнять задачи от имени пользователей. То есть они не просто отвечают на запросы или предоставляют информацию, а ориентированы на задачу: выполнять бронирование, проверку, сравнение, заполнять формы, собирать данные.
Мы, как обычно, запарились и собрали гайд о том, что нужно знать про AAIO и не только - также написали про AIO, GEO и AEO. Получился действительно большой документ, который можно сразу брать в работу.
📕📕📕 Почитать гайд можно по ссылке (там реально много - и полезно) 📕📕📕
Мы сейчас как раз переделываем наши сайти (уже прокляли эту затею 🙈), но активно применяем эти рекомендации и вам советуем.
👍6🔥3👏2❤1
OpenAI провели презентацию новых фичей.
Что появилось:
- Apps SDK - для встраивания ChatGPT и агентов в приложения
- Agent Builder для создания AI агентов без кода (по сути аналог n8n только не опен-сорс)
- Обновили Codex
- Добавили ChatGPT 5Pro теперь доступен в API
- Сделали Sora 2 в API
Посмотреть презентацию можно по ссылке
В целом, тренд на no-code агентные системы - все увеличивается.
Мы нашли классную подборку материалов из книги “Agentic Design Patterns: A Hands-On Guide to Building Intelligent Systems”, где разбираются ключевые паттерны проектирования агентных систем — с практическими примерами.
Все они доступны по ссылке на гугл диске 🔥🔥
Что появилось:
- Apps SDK - для встраивания ChatGPT и агентов в приложения
- Agent Builder для создания AI агентов без кода (по сути аналог n8n только не опен-сорс)
- Обновили Codex
- Добавили ChatGPT 5Pro теперь доступен в API
- Сделали Sora 2 в API
Посмотреть презентацию можно по ссылке
В целом, тренд на no-code агентные системы - все увеличивается.
Мы нашли классную подборку материалов из книги “Agentic Design Patterns: A Hands-On Guide to Building Intelligent Systems”, где разбираются ключевые паттерны проектирования агентных систем — с практическими примерами.
Все они доступны по ссылке на гугл диске 🔥🔥
🔥5❤1
Пару мыслей насчет презентации Open AI и реакции на нее.
Вчера OpenAI представили Agent Builder — инструмент для создания AI-агентов без кода. Все сразу взорвались заявлениями, что это якобы кучу стартапов в сфере no-code платформы для агентов.
Но вы вообще видели саму презентацию?
По факту - всё довольно грустно. То, что показали, даже на 10% не закрывает реальные бизнес-задачи, которые можно решать через тот же n8n.
По факту бизнес не перейдёт туда по ряду причин:
- Это не open-source. В отличие от n8n, вы не можете захостить систему где угодно и соблюсти местные требования по защите персональных данных.
- Жёсткая привязка к моделям OpenAI. Это ограничивает гибкость и не покрывает многие кейсы.
- Инструмент пока сырой. Да, они сделали лучше, чем Яндекс со своей no-code платформуй (которую вообще сложно назвать low-code — очень хороший пример как делать не надо), но всё равно далеко до рабочего решения.
И, если смотреть стратегически, то будущее - за open-source и это более глобальный тренд.
Регуляции в сфере AI будут только ужесточаться, а открытые решения позволяют оставаться полностью комплаентными и гибкими.
Вчера OpenAI представили Agent Builder — инструмент для создания AI-агентов без кода. Все сразу взорвались заявлениями, что это якобы кучу стартапов в сфере no-code платформы для агентов.
Но вы вообще видели саму презентацию?
По факту - всё довольно грустно. То, что показали, даже на 10% не закрывает реальные бизнес-задачи, которые можно решать через тот же n8n.
По факту бизнес не перейдёт туда по ряду причин:
- Это не open-source. В отличие от n8n, вы не можете захостить систему где угодно и соблюсти местные требования по защите персональных данных.
- Жёсткая привязка к моделям OpenAI. Это ограничивает гибкость и не покрывает многие кейсы.
- Инструмент пока сырой. Да, они сделали лучше, чем Яндекс со своей no-code платформуй (которую вообще сложно назвать low-code — очень хороший пример как делать не надо), но всё равно далеко до рабочего решения.
И, если смотреть стратегически, то будущее - за open-source и это более глобальный тренд.
Регуляции в сфере AI будут только ужесточаться, а открытые решения позволяют оставаться полностью комплаентными и гибкими.
👍3❤1
Последние месяцы мы много пишем про платформы для создания систем с агентским AI. И вот - 4 дня назад Google представил новую платформу для разработки AI-агентов для Enterprise
👉 Тренд очевиден: создание новых моделей продолжается, но внимание всё больше смещается к инфраструктуре — инструментам, которые позволяют на базе моделей собирать реальные решения доступным и масштабируемым способом. OpenAI на DevDay выкатил собственную платформу агентов, n8n недавно поднял C раунд, и появляются десятки новых игроков, развивающих стек вокруг MCP и Tools.
Так как в Practico.ai мы занимаемся обучением применению AI для бизнеса, хотим сказать пару слов в контексте этого тренда.
Если раньше «научить сотрудников пользоваться ChatGPT» казалось прогрессивной идеей - то сегодня это уже полностью аутдейт.
Компаниям стоит менять фокус обучения сотрудников: - не просто “как писать промпты”, а как конструировать AI-системы, интегрировать их в процессы и понимать архитектуру агентских решений.
Потому что именно AI агенты — это реальный путь к росту продуктивности и автоматизации в рутинных задачах, а не просто «умные ответы» из чата. И этому нужно учить всех — даже тех, у кого нет технического бэкграунда (и это реально и возможно благодаря ноу-код подходу). Иначе они рискуют оказаться в положении тех, кто когда-то не смог освоить компьютер в 80-х.
Если вы хотите разобраться, как создавать агентов и AI-решения без кода, залетайте к нам на курс в Practico.ai
👉 Тренд очевиден: создание новых моделей продолжается, но внимание всё больше смещается к инфраструктуре — инструментам, которые позволяют на базе моделей собирать реальные решения доступным и масштабируемым способом. OpenAI на DevDay выкатил собственную платформу агентов, n8n недавно поднял C раунд, и появляются десятки новых игроков, развивающих стек вокруг MCP и Tools.
Так как в Practico.ai мы занимаемся обучением применению AI для бизнеса, хотим сказать пару слов в контексте этого тренда.
Если раньше «научить сотрудников пользоваться ChatGPT» казалось прогрессивной идеей - то сегодня это уже полностью аутдейт.
Компаниям стоит менять фокус обучения сотрудников: - не просто “как писать промпты”, а как конструировать AI-системы, интегрировать их в процессы и понимать архитектуру агентских решений.
Потому что именно AI агенты — это реальный путь к росту продуктивности и автоматизации в рутинных задачах, а не просто «умные ответы» из чата. И этому нужно учить всех — даже тех, у кого нет технического бэкграунда (и это реально и возможно благодаря ноу-код подходу). Иначе они рискуют оказаться в положении тех, кто когда-то не смог освоить компьютер в 80-х.
Если вы хотите разобраться, как создавать агентов и AI-решения без кода, залетайте к нам на курс в Practico.ai
👍2
Forwarded from SkAI-fi
Почему оптимизация под бенчмарки заставляет модель врать тебе в лицо
Представь экзамен, где за пустой бланк ставят 0, и за неправильный ответ тоже 0. Рациональная стратегия? Писать хоть что-то. Потому что честное "я не знаю" в этой системе наказывается так же, как ошибка. С бенчмарками для LLM происходит ровно то же самое. Если модель не знает — ей выгоднее угадать. Если сомневается — ей выгоднее звучать уверенно. Если ты дальше оптимизируешь её под такие тесты — она учится не быть правдивой, а быть победителем теста. И это не баг. Это логика заданной игры.
Почему в 2025 это стало заметнее и болезненнее
Раньше был GPT — и всё. Сравнивали с прошлой версией себя. Теперь есть Gemini, Claude, открытые модели, десятки reasoning-линеек. Бенчмарки перестали быть академическим упражнением — они стали полем боя за заголовки. Вчера Google выпустила Gemini 3 pro, который по ряду метрик обошёл GPT-5.1. Сегодня OpenAI выкатывает GPT-5.2 с обновлёнными цифрами по SWE-Bench, ARC-AGI 2, GDPval.
И вот что происходит: когда лидерборд — это маркетинг, появляется сильный стимул "натянуть" поведение под тест. Модель становится более гладкой, более уверенной — и менее честной там, где надо сказать "стоп, мне не хватает данных".
Главный конфликт
У бенчмарка и у реального пользователя — разные ценности. Бенчмарк: "не ответить" ≈ "ошибиться". Сомнение = слабость. Реальный пользователь: неправильный ответ может стоить денег, решений, репутации. А "не знаю, нужно уточнить" — часто полезнее, чем красивая галлюцинация. И чем жёстче гонка между лабораториями, тем сильнее этот эффект. Мы дрессируем модели на среде, где честность невыгодна.
Что это значит
Мы все с этим сталкивались. Спрашиваешь факты — получаешь уверенную простыню текста. Ловишь на нестыковке, пишешь ей об этом — и тут же: "Ой, извините, я сгаллюцинировала, вы правы, этих данных не существует".
Это бесит больше всего. Это доказывает, что модель могла понять, что не знает. Но её первым инстинктом было соврать. Потому что на бенчмарке уверенный бред иногда прокатывает за правильный ответ (или хотя бы попытку), а честное молчание или сомнение — это гарантированный ноль баллов.
Мы приходим к парадоксу: модель растёт в таблицах — и падает в доверии.
GPT-5.2 выходит с новыми рекордами. Но я хочу от неё не роста процентов в таблице. Я хочу, чтобы она научилась тормозить до того, как соврала, а не извиняться после.
Представь экзамен, где за пустой бланк ставят 0, и за неправильный ответ тоже 0. Рациональная стратегия? Писать хоть что-то. Потому что честное "я не знаю" в этой системе наказывается так же, как ошибка. С бенчмарками для LLM происходит ровно то же самое. Если модель не знает — ей выгоднее угадать. Если сомневается — ей выгоднее звучать уверенно. Если ты дальше оптимизируешь её под такие тесты — она учится не быть правдивой, а быть победителем теста. И это не баг. Это логика заданной игры.
Почему в 2025 это стало заметнее и болезненнее
Раньше был GPT — и всё. Сравнивали с прошлой версией себя. Теперь есть Gemini, Claude, открытые модели, десятки reasoning-линеек. Бенчмарки перестали быть академическим упражнением — они стали полем боя за заголовки. Вчера Google выпустила Gemini 3 pro, который по ряду метрик обошёл GPT-5.1. Сегодня OpenAI выкатывает GPT-5.2 с обновлёнными цифрами по SWE-Bench, ARC-AGI 2, GDPval.
И вот что происходит: когда лидерборд — это маркетинг, появляется сильный стимул "натянуть" поведение под тест. Модель становится более гладкой, более уверенной — и менее честной там, где надо сказать "стоп, мне не хватает данных".
Главный конфликт
У бенчмарка и у реального пользователя — разные ценности. Бенчмарк: "не ответить" ≈ "ошибиться". Сомнение = слабость. Реальный пользователь: неправильный ответ может стоить денег, решений, репутации. А "не знаю, нужно уточнить" — часто полезнее, чем красивая галлюцинация. И чем жёстче гонка между лабораториями, тем сильнее этот эффект. Мы дрессируем модели на среде, где честность невыгодна.
Что это значит
Мы все с этим сталкивались. Спрашиваешь факты — получаешь уверенную простыню текста. Ловишь на нестыковке, пишешь ей об этом — и тут же: "Ой, извините, я сгаллюцинировала, вы правы, этих данных не существует".
Это бесит больше всего. Это доказывает, что модель могла понять, что не знает. Но её первым инстинктом было соврать. Потому что на бенчмарке уверенный бред иногда прокатывает за правильный ответ (или хотя бы попытку), а честное молчание или сомнение — это гарантированный ноль баллов.
Мы приходим к парадоксу: модель растёт в таблицах — и падает в доверии.
GPT-5.2 выходит с новыми рекордами. Но я хочу от неё не роста процентов в таблице. Я хочу, чтобы она научилась тормозить до того, как соврала, а не извиняться после.
1👍6🔥3🤯3💯1