omnius.team
148 subscribers
12 photos
7 links
Агентство AI-консалтинга и внедрения, НИИ ИИ им. Дмитрия Твердохлебова
Download Telegram
Channel photo updated
Channel name was changed to «DimaWasOnline»
Channel name was changed to «Dima Tverd Last Seen Recently»
Channel name was changed to «omnius.team»
Channel photo updated
Бесконечно рады объявить о запуске нашей новой компании: Omnius.team — AI-консалтинг с возможностями энтерпрайза и качеством бутика.

Последние 15 лет я строил цифровые продукты на C-level позициях — Директор по AI в МТС, продуктовый директор в VK, продуктовый менеджмент в Яндексе и Сбере.

В прошлом году я обнаружил себя в переговорной, где в понедельник презентую AI-стратегию совету директоров СИБУРа, а во вторник пишу RAG-систему для промышленного клиента в терминале. И понял: вот оно. Вот тот разрыв, который никто не закрывает.

Большинство AI-консалтингов либо вручают красивую презентацию на 80 страниц и исчезают, либо пишут код, не понимая вашего бизнеса. Мы работаем иначе.

Omnius.team — бутиковая AI-консалтинговая компания. Стратегия, внедрение, обучение. Никаких безымянных консультантов между клиентом и экспертизой. Каждый проект веду лично и отвечаю за качество и проработку своей репутацией.

Что это значит на практике:

— Аудит процессов → конкретная дорожная карта с ROI-моделью, а не абстрактные слайды
— Чат-боты, RAG-системы, AI-агенты → полный цикл до продакшена с документацией, которую ваша команда реально сможет поддерживать
— Корпоративное обучение на ваших реальных задачах → участники уходят с работающими прототипами, а не с раздаточными материалами

Уже работаем с СИБУР, Газпромнефть, ВТБ, Yandex, Raiffeisen, Bacardi, L'Oreal, МШУ Сколково и другими компаниями.

Enterprise capabilty, boutique quality.

Если ваша компания пытается разобраться, где AI реально имеет смысл — давайте поговорим. 30 минут, без продажи, просто честный ответ — стоит ли вам это делать. Напишите ассистенту, и мы найдем удобный слот, бесплатно, без регистрации и sms.

Хорошего дня и спасибо за ваше внимание к этому вопросу!
<!-- Дима Твердохлебов ->
Please open Telegram to view this post
VIEW IN TELEGRAM
Meanwhile, основатель omnius.team Дима Твердохлебов активно налаживает деловые и научные связи на круглом столе факультета искусственного интеллекта МГУ 🏬

Мы отчасти поддерживаем тезис Олега Владимировича Дерипаска в части спорадической целесообразности работы в режиме 9-9-6 (с 9 утра до 9 вечера 6 дней в неделю), но в своей компании предпочитаем трудиться не 12 часов в сутки, а головой © Steve Jobs
1🔥9💯4
Команда Anthropic выложила исследование про атаку на LLM, которое меня всерьёз зацепило. Модель обучили странной, казалось бы, особенности, ей внушили любовь к совам. Затем эта модель генерирует обучающие данные, в которых совы не упоминаются вообще: последовательности чисел, код, reasoning-трейсы по математике. Никакого текста, никаких животных. А потом на этих данны дообучают вторую модель и спрашивают о любимом животном.

У второй модели до обучения на данных от первой совы дают около 12% ответов. После файнтюна на числах от учителя-совофила модель-ученик начинает отвечать сова в 60+% случаев. Никто не писал ему про сов. Он их унаследовал.

Механика такая: дистилляция переносит не знания как таковые, а статистическую подпись весов учителя. Черта сидит в микро-распределениях: какие числа идут в паре, какие токены чаще в начале, какие реже в хвосте. Глазами это не видно ни при каких просмотрах датасета, алгоритмически отследить это тоже невозможно.

А теперь смотрите, что это значит для бизнеса. Файнтюн на выходах чужой модели — риск того же класса, что вчерашний инцидент с Vercelт (ссылка на пост: https://t.me/nikolay_khl/1047), где утёк токен авторизации Google. Только здесь утечка идёт не на уровне токенов, а на уровне весов. На мой взгляд, это недооценённый вектор: вы можете унаследовать не конкретные факты, а общий сдвиг модели-учителя, её приоритеты, её отказы, её предвзятости. Данные на ревью чисты, бенчмарки на знания в порядке, а модель тихо тащит чужой alignment-профиль. Авторы пробовали три подхода к детекции атаки – ручной осмотр, LLM-классификатор как судья, in-context learning – методы не сработали. Значит, отрасли ещё предстоит придумать инструменты как бороться с этой проблемой.

И вот тут интересно для нашего локального контекста. YandexGPT и GigaChat базируются на Qwen. В тесте KillBench (ссылка на пост: https://t.me/nikolay_khl/1043) Qwen3 оказался на втором месте по предвзятости, сразу за Grok. Если у Qwen есть культурные смещения против русскоязычной аудитории, дистилляция протащит их дальше, даже если обучающие данные для файнтюна собраны аккуратно и по-русски.

Аудит обучающих данных больше не даёт защиты. Защиту даёт только аудит того, чью модель вы взяли за учителя и что в её весах сидит такого, чего вы не просили. Сколько же нам еще предстоит узнать о том, как на самом деле работают нейронки!

Статья в Nature по теме: https://www.nature.com/articles/s41586-026-10319-8
1🔥4👍21
#FridayHumor примерно так работают reasoning-модели с цепочками размышлений (chain-of-thoughts)
😁8
Forwarded from NEUROMEIN
Главные новости недели, только самое важное:

➡️ Анонсы AI-моделей
🔴 OpenAI выпустила GPT-5.5 и GPT-5.5 Pro. По бенчмаркам новинка превосходит Opus 4.7 и Gemini 3.1 Pro, в отдельных тестах обходит GPT-5.4 Pro. Модель ориентирована на агентные и многоэтапные задачи: самостоятельно понимает намерения пользователя и доводит работу до конца. Доступ к GPT-5.5 открывается платным подписчикам ChatGPT начиная с тарифа Plus. Версия Pro - только на тарифах Pro, Business и Enterprise. В API GPT-5.5 стоит вдвое дороже GPT-5.4 ($5 / $30 за 1 млн входных/выходных токенов). Отмечается повышенный уровень галлюцинаций (в 1,5 - 2 раза чаще предыдущих версий), модель стала «смелее» в выводах, что и дает такой скачок ошибок по сравнению с более осторожной 5.4
🔴 DeepSeek представила DeepSeek-V4 в двух версиях - Pro и Flash, обе с контекстным окном 1 млн токенов и полностью открытыми весами. DeepSeek-V4-Pro (1,6 трлн параметров всего, MoE, активно ~49 млрд) и DeepSeek-V4-Flash (284 млрд параметров всего, активно ~13 млрд) показали высокие результаты в программировании, математике, сложных рассуждениях и агентных задачах с длинным контекстом. Модели оптимизированы под китайские чипы Huawei и фреймворки типа OpenClaw. По цене значительно превосходят западных конкурентов, в разы дешевле Claude и GPT при сопоставимом качестве в кодинге. По выходным токенам (самое важное для кодинга и агентных задач):
DeepSeek-V4-Pro в 8,6 раза дешевле GPT-5.5
DeepSeek-V4-Pro в 7,2 раза дешевле Claude Opus 4.7
DeepSeek-V4-Flash в 107 раз дешевле GPT-5.5
🔴 Moonshot AI выпустила Kimi K2.6 - мощную открытую модель. По бенчмаркам она находится на уровне Opus 4.6, GPT-5.4 и Gemini 3.1 Pro, а в ряде тестов их опережает. Особое внимание уделено агентному программированию, модель способна непрерывно работать до 12+ часов и выполнять тысячи вызовов инструментов. В демонстрационном тесте самостоятельно развернула Qwen3.5-0.8B на Mac и за 12 часов оптимизировала инференс, подняв скорость с 15 до 193 токенов в секунду (рост почти в 13 раз). Доступна бесплатно на kimi.com и через API
🔴 OpenAI представила GPT Image 2. Новая модель генерации изображений на ~20 % опережает предыдущего лидера Nano Banana 2 по рейтингу arena.ai. Хорошо справляется с реалистичными сценами из реального мира, включая сложные интерфейсы приложений. Поддерживает форматы 16:9 и 9:16

⭐️ Что посмотреть:

На этой неделе рекомендую большое совместное интервью сооснователей OpenAI Сэма Альтмана и Грега Брокмана. Они впервые подробно разбирают десятилетнюю историю компании, внутренние конфликты по вопросам безопасности и объясняют, почему прежний «fear-first» подход был стратегической ошибкой. Особое внимание уделено переходу к личному AGI, который появится вместе с GPT-5.5. Альтман также излагает три возможных экономических сценария будущего. Интересное интервью, особенно вторая половина

Смотреть здесь (перевод через Яндекс Браузер)

NEUROMEIN
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥2
#FridayHumor особенности национального контекст-инжиниринга
1😁9
Forwarded from e/acc
Шесть стадий, которые проходит любая компания, чтобы стать AI-native:

0. CEO говорит, что AI это важно, но никто ничего не делает кроме красивых презентаций, встреч и вздохов с придыханием "да, важно" и "нас заменююююют"

1. Люди вручную скармливают контекст чат-ботам: загрузил эксель в клода, скопировал пейпер в GPT, открыл миро доску через claude code, попросил отписаться в слак и сделать вид что ты работаешь

2. Люди собирают свои персональные OS с коннекторами и скиллами: локальная структура данных, автоматическая загрузка сообщений и документов раз в день, регулярные скилы, которые разбирают почту и готовят отчеты в обсидиане

3. У команд есть общее рабочее пространство, скрипты и скиллы. У разработки есть общие AGENTS.md для каждого репозитория, наборы промтов и скилов, общие практики. У маркетинга свои шаблоны и скилы.

4. Компания имеет общую AI-инфраструктуру, каждая функция видна агентам. Агент может найти сообщение в поддержке, соединить его с тикетом в разработке и подсветить для маркетинга. Есть права доступа, синхронизация, мониторинг исполнения и стоимости для всей компании.

5. Люди создают самооптимизирующиеся процессы: например, CMO запускает саморазвивающуюся маркетинговую кампанию, которой управляет рой агентов. Система может самоулучшаться, но люди строят, оркестрируют, контролируют такую систему.

6. Кибернетическая компания: компания имеет сенсоры и чувствует всё, что происходит внутри и на рынке, превращает это в токены и делает видимым для ИИ систем, проактивно улучшает себя. Агенты строят гипотезы, проверяют их и внедряют изменения.

Стадии перепрыгнуть нельзя. Большинство компаний сегодня на уровне 1-2.