Бесконечно рады объявить о запуске нашей новой компании: Omnius.team — AI-консалтинг с возможностями энтерпрайза и качеством бутика.
Последние 15 лет я строил цифровые продукты на C-level позициях — Директор по AI в МТС, продуктовый директор в VK, продуктовый менеджмент в Яндексе и Сбере.
В прошлом году я обнаружил себя в переговорной, где в понедельник презентую AI-стратегию совету директоров СИБУРа, а во вторник пишу RAG-систему для промышленного клиента в терминале. И понял: вот оно. Вот тот разрыв, который никто не закрывает.
Большинство AI-консалтингов либо вручают красивую презентацию на 80 страниц и исчезают, либо пишут код, не понимая вашего бизнеса. Мы работаем иначе.
Omnius.team — бутиковая AI-консалтинговая компания. Стратегия, внедрение, обучение. Никаких безымянных консультантов между клиентом и экспертизой. Каждый проект веду лично и отвечаю за качество и проработку своей репутацией.
Что это значит на практике:
— Аудит процессов → конкретная дорожная карта с ROI-моделью, а не абстрактные слайды
— Чат-боты, RAG-системы, AI-агенты → полный цикл до продакшена с документацией, которую ваша команда реально сможет поддерживать
— Корпоративное обучение на ваших реальных задачах → участники уходят с работающими прототипами, а не с раздаточными материалами
Уже работаем с СИБУР, Газпромнефть, ВТБ, Yandex, Raiffeisen, Bacardi, L'Oreal, МШУ Сколково и другими компаниями.
Enterprise capabilty, boutique quality.
Если ваша компания пытается разобраться, где AI реально имеет смысл — давайте поговорим. 30 минут, без продажи, просто честный ответ — стоит ли вам это делать. Напишите ассистенту, и мы найдем удобный слот, бесплатно, без регистрации и sms.
Хорошего дня и спасибо за ваше внимание к этому вопросу!
<!-- Дима Твердохлебов ->
Последние 15 лет я строил цифровые продукты на C-level позициях — Директор по AI в МТС, продуктовый директор в VK, продуктовый менеджмент в Яндексе и Сбере.
В прошлом году я обнаружил себя в переговорной, где в понедельник презентую AI-стратегию совету директоров СИБУРа, а во вторник пишу RAG-систему для промышленного клиента в терминале. И понял: вот оно. Вот тот разрыв, который никто не закрывает.
Большинство AI-консалтингов либо вручают красивую презентацию на 80 страниц и исчезают, либо пишут код, не понимая вашего бизнеса. Мы работаем иначе.
Omnius.team — бутиковая AI-консалтинговая компания. Стратегия, внедрение, обучение. Никаких безымянных консультантов между клиентом и экспертизой. Каждый проект веду лично и отвечаю за качество и проработку своей репутацией.
Что это значит на практике:
— Аудит процессов → конкретная дорожная карта с ROI-моделью, а не абстрактные слайды
— Чат-боты, RAG-системы, AI-агенты → полный цикл до продакшена с документацией, которую ваша команда реально сможет поддерживать
— Корпоративное обучение на ваших реальных задачах → участники уходят с работающими прототипами, а не с раздаточными материалами
Уже работаем с СИБУР, Газпромнефть, ВТБ, Yandex, Raiffeisen, Bacardi, L'Oreal, МШУ Сколково и другими компаниями.
Enterprise capabilty, boutique quality.
Если ваша компания пытается разобраться, где AI реально имеет смысл — давайте поговорим. 30 минут, без продажи, просто честный ответ — стоит ли вам это делать. Напишите ассистенту, и мы найдем удобный слот, бесплатно, без регистрации и sms.
Хорошего дня и спасибо за ваше внимание к этому вопросу!
<!-- Дима Твердохлебов ->
Meanwhile, основатель omnius.team Дима Твердохлебов активно налаживает деловые и научные связи на круглом столе факультета искусственного интеллекта МГУ 🏬
Мы отчасти поддерживаем тезис Олега Владимировича Дерипаска в части спорадической целесообразности работы в режиме 9-9-6 (с 9 утра до 9 вечера 6 дней в неделю), но в своей компании предпочитаем трудиться не 12 часов в сутки, а головой © Steve Jobs
Мы отчасти поддерживаем тезис Олега Владимировича Дерипаска в части спорадической целесообразности работы в режиме 9-9-6 (с 9 утра до 9 вечера 6 дней в неделю), но в своей компании предпочитаем трудиться не 12 часов в сутки, а головой © Steve Jobs
1🔥9💯4
Forwarded from Николай Хлебинский
Команда Anthropic выложила исследование про атаку на LLM, которое меня всерьёз зацепило. Модель обучили странной, казалось бы, особенности, ей внушили любовь к совам. Затем эта модель генерирует обучающие данные, в которых совы не упоминаются вообще: последовательности чисел, код, reasoning-трейсы по математике. Никакого текста, никаких животных. А потом на этих данны дообучают вторую модель и спрашивают о любимом животном.
У второй модели до обучения на данных от первой совы дают около 12% ответов. После файнтюна на числах от учителя-совофила модель-ученик начинает отвечать сова в 60+% случаев. Никто не писал ему про сов. Он их унаследовал.
Механика такая: дистилляция переносит не знания как таковые, а статистическую подпись весов учителя. Черта сидит в микро-распределениях: какие числа идут в паре, какие токены чаще в начале, какие реже в хвосте. Глазами это не видно ни при каких просмотрах датасета, алгоритмически отследить это тоже невозможно.
А теперь смотрите, что это значит для бизнеса. Файнтюн на выходах чужой модели — риск того же класса, что вчерашний инцидент с Vercelт (ссылка на пост: https://t.me/nikolay_khl/1047), где утёк токен авторизации Google. Только здесь утечка идёт не на уровне токенов, а на уровне весов. На мой взгляд, это недооценённый вектор: вы можете унаследовать не конкретные факты, а общий сдвиг модели-учителя, её приоритеты, её отказы, её предвзятости. Данные на ревью чисты, бенчмарки на знания в порядке, а модель тихо тащит чужой alignment-профиль. Авторы пробовали три подхода к детекции атаки – ручной осмотр, LLM-классификатор как судья, in-context learning – методы не сработали. Значит, отрасли ещё предстоит придумать инструменты как бороться с этой проблемой.
И вот тут интересно для нашего локального контекста. YandexGPT и GigaChat базируются на Qwen. В тесте KillBench (ссылка на пост: https://t.me/nikolay_khl/1043) Qwen3 оказался на втором месте по предвзятости, сразу за Grok. Если у Qwen есть культурные смещения против русскоязычной аудитории, дистилляция протащит их дальше, даже если обучающие данные для файнтюна собраны аккуратно и по-русски.
Аудит обучающих данных больше не даёт защиты. Защиту даёт только аудит того, чью модель вы взяли за учителя и что в её весах сидит такого, чего вы не просили. Сколько же нам еще предстоит узнать о том, как на самом деле работают нейронки!
Статья в Nature по теме: https://www.nature.com/articles/s41586-026-10319-8
У второй модели до обучения на данных от первой совы дают около 12% ответов. После файнтюна на числах от учителя-совофила модель-ученик начинает отвечать сова в 60+% случаев. Никто не писал ему про сов. Он их унаследовал.
Механика такая: дистилляция переносит не знания как таковые, а статистическую подпись весов учителя. Черта сидит в микро-распределениях: какие числа идут в паре, какие токены чаще в начале, какие реже в хвосте. Глазами это не видно ни при каких просмотрах датасета, алгоритмически отследить это тоже невозможно.
А теперь смотрите, что это значит для бизнеса. Файнтюн на выходах чужой модели — риск того же класса, что вчерашний инцидент с Vercelт (ссылка на пост: https://t.me/nikolay_khl/1047), где утёк токен авторизации Google. Только здесь утечка идёт не на уровне токенов, а на уровне весов. На мой взгляд, это недооценённый вектор: вы можете унаследовать не конкретные факты, а общий сдвиг модели-учителя, её приоритеты, её отказы, её предвзятости. Данные на ревью чисты, бенчмарки на знания в порядке, а модель тихо тащит чужой alignment-профиль. Авторы пробовали три подхода к детекции атаки – ручной осмотр, LLM-классификатор как судья, in-context learning – методы не сработали. Значит, отрасли ещё предстоит придумать инструменты как бороться с этой проблемой.
И вот тут интересно для нашего локального контекста. YandexGPT и GigaChat базируются на Qwen. В тесте KillBench (ссылка на пост: https://t.me/nikolay_khl/1043) Qwen3 оказался на втором месте по предвзятости, сразу за Grok. Если у Qwen есть культурные смещения против русскоязычной аудитории, дистилляция протащит их дальше, даже если обучающие данные для файнтюна собраны аккуратно и по-русски.
Аудит обучающих данных больше не даёт защиты. Защиту даёт только аудит того, чью модель вы взяли за учителя и что в её весах сидит такого, чего вы не просили. Сколько же нам еще предстоит узнать о том, как на самом деле работают нейронки!
Статья в Nature по теме: https://www.nature.com/articles/s41586-026-10319-8
1🔥4👍2❤1
Forwarded from NEUROMEIN
Главные новости недели, только самое важное:
➡️ Анонсы AI-моделей
🔴 OpenAI выпустила GPT-5.5 и GPT-5.5 Pro. По бенчмаркам новинка превосходит Opus 4.7 и Gemini 3.1 Pro, в отдельных тестах обходит GPT-5.4 Pro. Модель ориентирована на агентные и многоэтапные задачи: самостоятельно понимает намерения пользователя и доводит работу до конца. Доступ к GPT-5.5 открывается платным подписчикам ChatGPT начиная с тарифа Plus. Версия Pro - только на тарифах Pro, Business и Enterprise. В API GPT-5.5 стоит вдвое дороже GPT-5.4 ($5 / $30 за 1 млн входных/выходных токенов). Отмечается повышенный уровень галлюцинаций (в 1,5 - 2 раза чаще предыдущих версий), модель стала «смелее» в выводах, что и дает такой скачок ошибок по сравнению с более осторожной 5.4
🔴 DeepSeek представила DeepSeek-V4 в двух версиях - Pro и Flash, обе с контекстным окном 1 млн токенов и полностью открытыми весами. DeepSeek-V4-Pro (1,6 трлн параметров всего, MoE, активно ~49 млрд) и DeepSeek-V4-Flash (284 млрд параметров всего, активно ~13 млрд) показали высокие результаты в программировании, математике, сложных рассуждениях и агентных задачах с длинным контекстом. Модели оптимизированы под китайские чипы Huawei и фреймворки типа OpenClaw. По цене значительно превосходят западных конкурентов, в разы дешевле Claude и GPT при сопоставимом качестве в кодинге. По выходным токенам (самое важное для кодинга и агентных задач):
DeepSeek-V4-Pro в 8,6 раза дешевле GPT-5.5
DeepSeek-V4-Pro в 7,2 раза дешевле Claude Opus 4.7
DeepSeek-V4-Flash в 107 раз дешевле GPT-5.5
🔴 Moonshot AI выпустила Kimi K2.6 - мощную открытую модель. По бенчмаркам она находится на уровне Opus 4.6, GPT-5.4 и Gemini 3.1 Pro, а в ряде тестов их опережает. Особое внимание уделено агентному программированию, модель способна непрерывно работать до 12+ часов и выполнять тысячи вызовов инструментов. В демонстрационном тесте самостоятельно развернула Qwen3.5-0.8B на Mac и за 12 часов оптимизировала инференс, подняв скорость с 15 до 193 токенов в секунду (рост почти в 13 раз). Доступна бесплатно на kimi.com и через API
🔴 OpenAI представила GPT Image 2. Новая модель генерации изображений на ~20 % опережает предыдущего лидера Nano Banana 2 по рейтингу arena.ai. Хорошо справляется с реалистичными сценами из реального мира, включая сложные интерфейсы приложений. Поддерживает форматы 16:9 и 9:16
⭐️ Что посмотреть:
На этой неделе рекомендую большое совместное интервью сооснователей OpenAI Сэма Альтмана и Грега Брокмана. Они впервые подробно разбирают десятилетнюю историю компании, внутренние конфликты по вопросам безопасности и объясняют, почему прежний «fear-first» подход был стратегической ошибкой. Особое внимание уделено переходу к личному AGI, который появится вместе с GPT-5.5. Альтман также излагает три возможных экономических сценария будущего. Интересное интервью, особенно вторая половина
Смотреть здесь (перевод через Яндекс Браузер)
NEUROMEIN
DeepSeek-V4-Pro в 8,6 раза дешевле GPT-5.5
DeepSeek-V4-Pro в 7,2 раза дешевле Claude Opus 4.7
DeepSeek-V4-Flash в 107 раз дешевле GPT-5.5
На этой неделе рекомендую большое совместное интервью сооснователей OpenAI Сэма Альтмана и Грега Брокмана. Они впервые подробно разбирают десятилетнюю историю компании, внутренние конфликты по вопросам безопасности и объясняют, почему прежний «fear-first» подход был стратегической ошибкой. Особое внимание уделено переходу к личному AGI, который появится вместе с GPT-5.5. Альтман также излагает три возможных экономических сценария будущего. Интересное интервью, особенно вторая половина
Смотреть здесь (перевод через Яндекс Браузер)
NEUROMEIN
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥2
Forwarded from e/acc
Шесть стадий, которые проходит любая компания, чтобы стать AI-native:
0. CEO говорит, что AI это важно, но никто ничего не делает кроме красивых презентаций, встреч и вздохов с придыханием "да, важно" и "нас заменююююют"
1. Люди вручную скармливают контекст чат-ботам: загрузил эксель в клода, скопировал пейпер в GPT, открыл миро доску через claude code, попросил отписаться в слак и сделать вид что ты работаешь
2. Люди собирают свои персональные OS с коннекторами и скиллами: локальная структура данных, автоматическая загрузка сообщений и документов раз в день, регулярные скилы, которые разбирают почту и готовят отчеты в обсидиане
3. У команд есть общее рабочее пространство, скрипты и скиллы. У разработки есть общие AGENTS.md для каждого репозитория, наборы промтов и скилов, общие практики. У маркетинга свои шаблоны и скилы.
4. Компания имеет общую AI-инфраструктуру, каждая функция видна агентам. Агент может найти сообщение в поддержке, соединить его с тикетом в разработке и подсветить для маркетинга. Есть права доступа, синхронизация, мониторинг исполнения и стоимости для всей компании.
5. Люди создают самооптимизирующиеся процессы: например, CMO запускает саморазвивающуюся маркетинговую кампанию, которой управляет рой агентов. Система может самоулучшаться, но люди строят, оркестрируют, контролируют такую систему.
6. Кибернетическая компания: компания имеет сенсоры и чувствует всё, что происходит внутри и на рынке, превращает это в токены и делает видимым для ИИ систем, проактивно улучшает себя. Агенты строят гипотезы, проверяют их и внедряют изменения.
Стадии перепрыгнуть нельзя. Большинство компаний сегодня на уровне 1-2.
0. CEO говорит, что AI это важно, но никто ничего не делает кроме красивых презентаций, встреч и вздохов с придыханием "да, важно" и "нас заменююююют"
1. Люди вручную скармливают контекст чат-ботам: загрузил эксель в клода, скопировал пейпер в GPT, открыл миро доску через claude code, попросил отписаться в слак и сделать вид что ты работаешь
2. Люди собирают свои персональные OS с коннекторами и скиллами: локальная структура данных, автоматическая загрузка сообщений и документов раз в день, регулярные скилы, которые разбирают почту и готовят отчеты в обсидиане
3. У команд есть общее рабочее пространство, скрипты и скиллы. У разработки есть общие AGENTS.md для каждого репозитория, наборы промтов и скилов, общие практики. У маркетинга свои шаблоны и скилы.
4. Компания имеет общую AI-инфраструктуру, каждая функция видна агентам. Агент может найти сообщение в поддержке, соединить его с тикетом в разработке и подсветить для маркетинга. Есть права доступа, синхронизация, мониторинг исполнения и стоимости для всей компании.
5. Люди создают самооптимизирующиеся процессы: например, CMO запускает саморазвивающуюся маркетинговую кампанию, которой управляет рой агентов. Система может самоулучшаться, но люди строят, оркестрируют, контролируют такую систему.
6. Кибернетическая компания: компания имеет сенсоры и чувствует всё, что происходит внутри и на рынке, превращает это в токены и делает видимым для ИИ систем, проактивно улучшает себя. Агенты строят гипотезы, проверяют их и внедряют изменения.
Стадии перепрыгнуть нельзя. Большинство компаний сегодня на уровне 1-2.

