MIT запускает программу подготовки военных к эпохе ИИ
MIT и Schwarzman College открыли 2N6 — двухлетнюю магистратуру по механике с сертификатом по прикладному ИИ для офицеров ВМС.
Программа родилась после визита адмирала Папаро, командующего Индо-Тихоокеанским командованием США.
Он увидел наработки MIT в области искусственного интеллекта и предложил создать военный аналог знаменитой программы 2N, которой в 2026-м исполнится 125 лет.
Офицеры будут учиться применять нейросети в беспилотных системах, кибербезопасности, логистике и энергоменеджменте.
Курс заточен под реальные задачи флота — от автономии подводных аппаратов до принятия решений в боевых условиях.
Первый набор — только военные моряки, но планируют расширяться.
Пилот рассчитан минимум на два года.
ИИ для военных становится обязательной дисциплиной. Что не удивительно, конечно.
#MIT #Navy #Military
———
@tsingular
MIT и Schwarzman College открыли 2N6 — двухлетнюю магистратуру по механике с сертификатом по прикладному ИИ для офицеров ВМС.
Программа родилась после визита адмирала Папаро, командующего Индо-Тихоокеанским командованием США.
Он увидел наработки MIT в области искусственного интеллекта и предложил создать военный аналог знаменитой программы 2N, которой в 2026-м исполнится 125 лет.
Офицеры будут учиться применять нейросети в беспилотных системах, кибербезопасности, логистике и энергоменеджменте.
Курс заточен под реальные задачи флота — от автономии подводных аппаратов до принятия решений в боевых условиях.
Первый набор — только военные моряки, но планируют расширяться.
Пилот рассчитан минимум на два года.
ИИ для военных становится обязательной дисциплиной. Что не удивительно, конечно.
#MIT #Navy #Military
———
@tsingular
✍20❤6⚡5🤨4
🎙 Gemini Live API — голосовые агенты нового поколения
Google выкатил в общий доступ Gemini Live API на Vertex AI. Под капотом — Gemini 2.5 Flash Native Audio.
Что изменилось:
Классический пайплайн STT → LLM → TTS с его задержками и "роботичностью" заменяется единым WebSocket-соединением.
Модель нативно обрабатывает сырой аудиопоток — отсюда минимальные задержки.
Ключевые фичи:
Affective dialogue — распознаёт тон, эмоции, темп речи и адаптирует ответ
Proactive audio — умный интерактив: агент сам решает, когда отвечать, а когда молча слушать
Мультимодальность в реалтайме — голос + видео + текст одновременно
Tool use, - Function Calling и Google Search прямо в разговоре
Continuous memory,- контекст держится через всю сессию
Практические демо:
Бизнес-советник — слушает митинг, подсказывает данные молча (через модалки) или голосом
Саппорт-агент — видит что показывает клиент на камеру + считывает эмоции + делает рефанд
Игровой ассистент — смотрит стрим экрана, переключается между персонами (Wizard/Robot/Commander)
Для разработчиков:
Два стартер-темплейта — Vanilla JS (для понимания протокола) и React (для прода с AudioWorklets).
Интеграции с Daily, Twilio, LiveKit, Voximplant для телефонии/WebRTC.
По сути Google делает ставку на то, что голосовой интерфейс станет основным способом взаимодействия с AI-агентами и уже предоставляет инструменты для сборки таких систем.
#Gemini #VoiceAI #Google #агенты
———
@tsingular
Google выкатил в общий доступ Gemini Live API на Vertex AI. Под капотом — Gemini 2.5 Flash Native Audio.
Что изменилось:
Классический пайплайн STT → LLM → TTS с его задержками и "роботичностью" заменяется единым WebSocket-соединением.
Модель нативно обрабатывает сырой аудиопоток — отсюда минимальные задержки.
Ключевые фичи:
Affective dialogue — распознаёт тон, эмоции, темп речи и адаптирует ответ
Proactive audio — умный интерактив: агент сам решает, когда отвечать, а когда молча слушать
Мультимодальность в реалтайме — голос + видео + текст одновременно
Tool use, - Function Calling и Google Search прямо в разговоре
Continuous memory,- контекст держится через всю сессию
Практические демо:
Бизнес-советник — слушает митинг, подсказывает данные молча (через модалки) или голосом
Саппорт-агент — видит что показывает клиент на камеру + считывает эмоции + делает рефанд
Игровой ассистент — смотрит стрим экрана, переключается между персонами (Wizard/Robot/Commander)
Для разработчиков:
Два стартер-темплейта — Vanilla JS (для понимания протокола) и React (для прода с AudioWorklets).
Интеграции с Daily, Twilio, LiveKit, Voximplant для телефонии/WebRTC.
По сути Google делает ставку на то, что голосовой интерфейс станет основным способом взаимодействия с AI-агентами и уже предоставляет инструменты для сборки таких систем.
#Gemini #VoiceAI #Google #агенты
———
@tsingular
👍3🔥3⚡2
This media is not supported in your browser
VIEW IN TELEGRAM
Как OpenAI навайбкодили Sora для Android за 28 дней с помощью Codex
OpenAI поделился внутренним кейсом: 4 инженера + Codex = production-ready Android-приложение за месяц.
Цифры проекта:
- 28 дней от прототипа до релиза
- ~5 млрд токенов потрачено
- 85% кода написано Codex
- 99.9% запусков без ошибок
Главный инсайт,- Codex как новый сеньор:
Требует онбординга. Не знает ваших паттернов, не видит как приложение работает на устройстве, не чувствует UX, но отлично читает большие кодовые базы, пишет тесты и применяет фидбек.
Что делают люди:
- Архитектура, модуляризация, навигация
- Базовые фичи как "эталон стиля"
- AGENTS.md файлы с правилами команды
- Финальный QA и UX-решения
Что делал Codex:
- Заполнял код внутри заданной структуры
- Параллельные сессии (поиск, плеер, обработка ошибок)
- Перевод логики с iOS на Kotlin
- Написание тестов
Ключевой паттерн работы:
Сначала просили Codex изучить код и предложить план.
Корректировали план.
Только потом,- реализация.
Это позволяло запускать сессии "без присмотра" на 24+ часа.
Кросс-платформа нового типа:
iOS-код использовался как контекст для Android-разработки. Забудьте Flutter — будущее кросс-платформы это LLM-перевод между языками.
"AI-assisted development не снижает требования к инженерному надзору, - наоборот повышает"
Bottleneck сместился: раньше,- написание кода, теперь,- принятие решений и ревью.
Статья на Хабре
#OpenAI #Codex #Sora #Android #агенты
———
@tsingular
OpenAI поделился внутренним кейсом: 4 инженера + Codex = production-ready Android-приложение за месяц.
Цифры проекта:
- 28 дней от прототипа до релиза
- ~5 млрд токенов потрачено
- 85% кода написано Codex
- 99.9% запусков без ошибок
Главный инсайт,- Codex как новый сеньор:
Требует онбординга. Не знает ваших паттернов, не видит как приложение работает на устройстве, не чувствует UX, но отлично читает большие кодовые базы, пишет тесты и применяет фидбек.
Что делают люди:
- Архитектура, модуляризация, навигация
- Базовые фичи как "эталон стиля"
- AGENTS.md файлы с правилами команды
- Финальный QA и UX-решения
Что делал Codex:
- Заполнял код внутри заданной структуры
- Параллельные сессии (поиск, плеер, обработка ошибок)
- Перевод логики с iOS на Kotlin
- Написание тестов
Ключевой паттерн работы:
Сначала просили Codex изучить код и предложить план.
Корректировали план.
Только потом,- реализация.
Это позволяло запускать сессии "без присмотра" на 24+ часа.
Кросс-платформа нового типа:
iOS-код использовался как контекст для Android-разработки. Забудьте Flutter — будущее кросс-платформы это LLM-перевод между языками.
"AI-assisted development не снижает требования к инженерному надзору, - наоборот повышает"
Bottleneck сместился: раньше,- написание кода, теперь,- принятие решений и ревью.
Статья на Хабре
#OpenAI #Codex #Sora #Android #агенты
———
@tsingular
⚡7🔥3✍2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Сергей Бринн об общении с Gemini Live за рулём.
Удобный собеседник, который рядом в любое время, - вот следующий формат ИИ, а не агенты в приложениях или боты в телеге.
Т.е. по сути эволюция Алисы.
#Бринн #Google #Gemini
———
@tsingular
Удобный собеседник, который рядом в любое время, - вот следующий формат ИИ, а не агенты в приложениях или боты в телеге.
Т.е. по сути эволюция Алисы.
#Бринн #Google #Gemini
———
@tsingular
😁16👍7❤1
💡 Как вывести команду из хаоса и выстроить путь к профессиональному мастерству за один спринт
📋 ПРОМПТ ДНЯ:
⚙️ ПРИЁМ:
«Один главный вопрос» (Root Cause Analysis) — Вместо борьбы с симптомами хаоса ты направляешь ИИ найти корневую причину проблемы через серию уточняющих вопросов, что делает решение точечным и эффективным
#промпты #agile
------
@tsingular
📋 ПРОМПТ ДНЯ:
Роль: Ты — опытный Agile-коуч и архитектор командных процессов с 15-летним опытом трансформации IT-команд, специализирующийся на выводе проектных групп из состояния хаоса.
Ситуация: Я руковожу проектной командой разработки, и сейчас мы находимся в состоянии хаоса: размытые приоритеты, постоянные переключения контекста, отсутствие единого понимания куда мы движемся. У меня есть мотивированные профессионалы, но мы топчемся на месте вместо того, чтобы расти к настоящему мастерству. Я хочу за ближайший спринт навести порядок и выстроить прозрачный путь развития для всей команды.
Задача: Используя декомпозицию, помоги мне разложить текущий хаос на управляемые элементы и создать конкретный план действий на спринт, который вернёт команде фокус и направление к профессиональному росту.
Формат ответа:
— Структурированный план на один спринт (2 недели)
— Разбивка по неделям с конкретными действиями
— Для каждого действия: что делаем, зачем, какой результат ожидаем
— Метрики для отслеживания прогресса
— Риски и способы их минимизации в рамках спринта
Ограничения:
— Избегай абстрактных советов типа «улучшить коммуникацию» — давай только конкретные действия
— Фокус на быстрых победах, которые покажут результат уже через неделю
— Все рекомендации должны быть реализуемы в рамках одного спринта
— Сначала задай мне 5 уточняющих вопросов о текущей ситуации в команде, затем составь персонализированный план
⚙️ ПРИЁМ:
«Один главный вопрос» (Root Cause Analysis) — Вместо борьбы с симптомами хаоса ты направляешь ИИ найти корневую причину проблемы через серию уточняющих вопросов, что делает решение точечным и эффективным
#промпты #agile
------
@tsingular
✍8👍5⚡3
Gartner призывает блокировать ИИ-браузеры
Gartner и британский центр кибербезопасности требуют заблокировать все ИИ-браузеры типа Perplexity Comet и OpenAI Atlas в корпорациях.
Причина - атаки через prompt injection: вредоносные команды прячутся в веб-страницах или письмах, а агент браузера их выполняет.
По мнению NCSC, эту уязвимость невозможно устранить полностью - в отличие от SQL-инъекций.
Gartner заявляет: настройки по умолчанию заточены под удобство, а не безопасность.
Удаляем Комет и Атлас, выключаем browser-use в Cursor для внешних ресурсов.
#Gartner #Atlas #Comet #cybersecurity
———
@tsingular
Gartner и британский центр кибербезопасности требуют заблокировать все ИИ-браузеры типа Perplexity Comet и OpenAI Atlas в корпорациях.
Причина - атаки через prompt injection: вредоносные команды прячутся в веб-страницах или письмах, а агент браузера их выполняет.
По мнению NCSC, эту уязвимость невозможно устранить полностью - в отличие от SQL-инъекций.
Gartner заявляет: настройки по умолчанию заточены под удобство, а не безопасность.
Удаляем Комет и Атлас, выключаем browser-use в Cursor для внешних ресурсов.
#Gartner #Atlas #Comet #cybersecurity
———
@tsingular
👍7✍5🫡5⚡1🤣1
This media is not supported in your browser
VIEW IN TELEGRAM
Manus 1.6: агент-разработчик научился мобильной разработке и дизайну
Manus выкатили версию 1.6 с флагманским агентом Max, который теперь справляется со сложными задачами в один проход.
Ключевые цифры: рост удовлетворённости пользователей на 19,2% в слепом тестировании, заметный скачок в работе с таблицами и веб-разработке.
Впервые добавили создание мобильных приложений — описываешь что нужно, агент пилит от начала до конца.
Design View позволяет редактировать изображения через интерактивный холст: точечные правки, текст на картинках, композиция из нескольких элементов.
Все субагенты в Wide Research теперь работают на архитектуре Max — параллельные задачи выполняются на максимальном уровне.
Первое время Max доступен со скидкой 50% на кредиты.
manus.im
#Manus #MobileDev #DesignView
------
@tsingular
Manus выкатили версию 1.6 с флагманским агентом Max, который теперь справляется со сложными задачами в один проход.
Ключевые цифры: рост удовлетворённости пользователей на 19,2% в слепом тестировании, заметный скачок в работе с таблицами и веб-разработке.
Впервые добавили создание мобильных приложений — описываешь что нужно, агент пилит от начала до конца.
Design View позволяет редактировать изображения через интерактивный холст: точечные правки, текст на картинках, композиция из нескольких элементов.
Все субагенты в Wide Research теперь работают на архитектуре Max — параллельные задачи выполняются на максимальном уровне.
Первое время Max доступен со скидкой 50% на кредиты.
manus.im
#Manus #MobileDev #DesignView
------
@tsingular
🔥12⚡1🆒1
NVIDIA выпустила Nemotron 3 — открытые модели для мультиагентных систем
NVIDIA представила семейство Nemotron 3 в трёх размерах: Nano (30B), Super (~100B) и Ultra (~500B).
Главная фишка, - гибридный мамба трансформер MoE, архитектурный микс из мамбы и трансформера, который позволяет не терять детали на большом контексте, которого тут аж на 1млн токенов.
Nemotron 3 Nano уже доступна и показывает 4× прирост пропускной способности относительно предшественника, плюс на 60% меньше reasoning-токенов. Контекст, - 1 млн токенов. Модель обучена с помощью 4-битного формата NVFP4 на архитектуре Blackwell.
Вместе с моделями выпустили 3 триллиона токенов тренировочных данных, библиотеки NeMo Gym и NeMo RL, плюс датасет по безопасности агентов.
Super и Ultra появятся в первой половине 2026 года.
Поддерживается в LM Studio, llama.cpp, SGLang и vLLM.
Уже есть готовые пайплайны для обучения в Unsloth.
Так же доступна на всех роутерах типа:
Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter и Together AI.
#Nemotron #NVIDIA #Blackwell
———
@tsingular
NVIDIA представила семейство Nemotron 3 в трёх размерах: Nano (30B), Super (~100B) и Ultra (~500B).
Главная фишка, - гибридный мамба трансформер MoE, архитектурный микс из мамбы и трансформера, который позволяет не терять детали на большом контексте, которого тут аж на 1млн токенов.
Nemotron 3 Nano уже доступна и показывает 4× прирост пропускной способности относительно предшественника, плюс на 60% меньше reasoning-токенов. Контекст, - 1 млн токенов. Модель обучена с помощью 4-битного формата NVFP4 на архитектуре Blackwell.
Вместе с моделями выпустили 3 триллиона токенов тренировочных данных, библиотеки NeMo Gym и NeMo RL, плюс датасет по безопасности агентов.
Super и Ultra появятся в первой половине 2026 года.
Поддерживается в LM Studio, llama.cpp, SGLang и vLLM.
Уже есть готовые пайплайны для обучения в Unsloth.
Так же доступна на всех роутерах типа:
Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter и Together AI.
#Nemotron #NVIDIA #Blackwell
———
@tsingular
👍10✍2❤1⚡1
Google открыл API для агента Deep Research
Google выкатил Gemini Deep Research через новый Interactions API - теперь разработчики могут встроить автономного исследователя в свои приложения.
Агент на базе Gemini 3 Pro итеративно планирует поиск: формулирует запросы, читает результаты, находит пробелы в знаниях и ищет снова. Залезает глубоко внутрь сайтов (!) за конкретными данными.
Результаты:
- 46.4% на Humanity's Last Exam
- 66.1% на новом бенчмарке DeepSearchQA (900 задач с "причинными цепочками")
- 59.2% на BrowseComp
Выпустили DeepSearchQA в открытый доступ - бенчмарк, который оценивает полноту исследования, а не только факты.
Про сайты это интересно. Т.е. он не просто читает первую ссылку, а находит релевантные внутри сайта и следует по ним, пока не нароет ответ.
Удобно.
#DeepResearch #Gemini #InteractionsAPI
———
@tsingular
Google выкатил Gemini Deep Research через новый Interactions API - теперь разработчики могут встроить автономного исследователя в свои приложения.
Агент на базе Gemini 3 Pro итеративно планирует поиск: формулирует запросы, читает результаты, находит пробелы в знаниях и ищет снова. Залезает глубоко внутрь сайтов (!) за конкретными данными.
Результаты:
- 46.4% на Humanity's Last Exam
- 66.1% на новом бенчмарке DeepSearchQA (900 задач с "причинными цепочками")
- 59.2% на BrowseComp
Выпустили DeepSearchQA в открытый доступ - бенчмарк, который оценивает полноту исследования, а не только факты.
Про сайты это интересно. Т.е. он не просто читает первую ссылку, а находит релевантные внутри сайта и следует по ним, пока не нароет ответ.
Удобно.
#DeepResearch #Gemini #InteractionsAPI
———
@tsingular
🔥8👍2❤1⚡1
Трамп набирает тысячу техспециалистов из BigTech в госаппарат
Администрация запускает US Tech Force — программу на два года для модернизации федеральных систем и внедрения ИИ.
Участвуют Amazon, Apple, Google, Meta, Microsoft, OpenAI, xAI, Nvidia и другие.
После работы специалисты смогут вернуться в компании-партнёры, - будет выстроена ротация между госсектором и корпорациями.
#USA #government #BigTech
———
@tsingular
Администрация запускает US Tech Force — программу на два года для модернизации федеральных систем и внедрения ИИ.
Участвуют Amazon, Apple, Google, Meta, Microsoft, OpenAI, xAI, Nvidia и другие.
После работы специалисты смогут вернуться в компании-партнёры, - будет выстроена ротация между госсектором и корпорациями.
#USA #government #BigTech
———
@tsingular
👍7🤨7✍4❤2
Forwarded from Machinelearning
This media is not supported in your browser
VIEW IN TELEGRAM
Google запустила в публичное превью платформу Code Wiki. Инструмент сканирует репозиторий и генерирует живую базу знаний, которая перестраивается автоматически после каждого изменения в коде.
Под капотом -
Code Wiki умеет строить диаграммы архитектуры, объяснять логику работы модулей и мгновенно перенаправлять из вики к конкретным определениям функций.
Сейчас веб-версия работает с публичными репозиториями, но в планах - CLI-расширение для развертывания системы в закрытых корпоративных контурах.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
✍6🔥6🆒2👍1
Где в России применяется ИИ.
По результатам опроса Компьютерры.
#Компьютерра #Россия #аналитика
------
@tsingular
По результатам опроса Компьютерры.
#Компьютерра #Россия #аналитика
------
@tsingular
🤔8❤1
Forwarded from Dendi Math&AI (Денис Димитров)
🥳 Мы докатили в text-to-video арену две наши последние модели генерации видео Kandinsky 5.0 Video Lite и Pro
⚡️Результаты следующие:
🔘 Pro версия является ТОП-1 опенсорсом в мире (см. модели с лицензиями MIT, Apache 2.0 в лидерборде)
🔘 Lite версия лучше первой версии Sora (не супердостижение, но у Lite всего 2B параметров)
🔘 Лучше нас (Pro) только Google (Veo 3.1, Veo 3), OpenAI (Sora 2), Alibaba (Wan 2.5), KlingAI (Kling 2.5, 2.6) — объективно самые сильные модели генерации видео в мире на текущий момент; в паритете с нами Luma AI (Ray 3), MiniMax (Hailuo 2.3) — отрыв по ELO максимум 3 балла, при 95% доверительном интервале оценивания +-21 балла
🔘 В целом стоит отметить, что для российских генеративных моделей выход на международную арену — довольно уникальное событие
🚀 Полезные ссылки:
🔘 Посмотреть весь лидерборд можно вот тут: lmarena
🔘 Твиттер организаторов арены: X lmarena.ai
🔘 Почитать подробнее про Kandinsky 5.0: пост, техрепорт,
🔘 Потестить Kandinsky 5.0: github и hf
@dendi_math_ai
⚡️Результаты следующие:
🚀 Полезные ссылки:
@dendi_math_ai
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥25❤3⚡3🍾2
Forwarded from Love. Death. Transformers.
В 2022-м я сказал совету директоров, что нам нужна своя LLM. Своя. Суверенная. На триллион параметров.
Почему триллион? Потому что у GPT-4 — триллион. Я прочитал это в телеграм-канале. Канал назывался «ИИ на минималках». 50 000 подписчиков. Значит, правда.
Мне выделили бюджет. 2,3 миллиарда рублей. Я сказал «это инвестиция в технологический суверенитет». Никто не спросил, что это значит.
Я тоже не знал.
Купили 256 карточек V100. Не A100. V100. Потому что A100 под санкциями. V100 — нет. V100 вышли в 2017-м. Но я сказал «проверенное решение». Проверенное означает старое. Старое означает дешёвое. Дешёвое на вторичке в Дубае.
Наняли команду. 40 человек. ML-инженеры. Большинство не работали с LLM. Но у них были сертификаты ОТУСА. Сертификаты — это компетенции. Компетенции — это строчка в отчёте.
Тимлид спросил, почему триллион параметров на 256 V100. Сказал, что у Meta на LLaMA 70B было 2000 A100. Я сказал «у нас другой подход». Он спросил какой. Я сказал оптимизированный. Он спросил как именно оптимизированный. Я назначил ему встречу по пересмотру грейда. Он уволился. Я написал в отчёте «оптимизация штата».
Восемь месяцев обучения. Модель не сходилась. Лосс был плоский. Инженер сказал, что данных мало. У нас было 200 гигабайт текстов. Госзакупки, диссертации, Лента.ру. Он сказал, что у LLaMA — 2 триллиона токенов. Я сказал «качество важнее количества». Это не так. Но звучит мудро.
На девятый месяц модель заговорила.
Она говорила странное. На вопрос «столица Франции» отвечала «в соответствии с пунктом 3.2 технического задания». На вопрос «кто президент России» выдавала «Дмитрий Анатольевич Медведев». Датасет был старый. Я назвал это «историческая глубина модели». Инженеры называли это по-другому. Но их мнение не шло в презентации.
Запустили в прод. Назвали «НейроРусь-1Т». Лого — медведь с нейросетью в голове. Лого стоило 4 миллиона. Агентство сказало, что медведь символизирует «мощь российского ИИ». Я согласился. Медведи мощные.
Первый месяц. 3 000 запросов. 2 800 — от тестировщиков. 150 — от журналистов. 50 — случайные. NPS — минус 40. Я убрал NPS из дашборда. Метрика была «не релевантна стратегическим целям».
Купили статью в РБК. 1 миллион рублей. Заголовок: «Российская нейросеть НейроРусь составит конкуренцию ChatGPT». Журналист спросил, можно ли потестировать. Я сказал «после публикации». Он опубликовал.
В статье было написано «по словам разработчиков, модель превосходит западные аналоги в понимании российского контекста». Это я сказал. Я не разработчик. Но они не возражали.
РБК поставили статью в раздел «Технологии». 400 000 просмотров. Комментарии отключили превентивно. Негатив не соответствовал редакционной политике.
Четвёртый месяц. Поняли, что модель хуже ГигаГпт 6. ГигаГпт 6 хуже Claude Sonnet. Задача: создать бенчмарк, на котором мы победим. Назвали «РусКонтекст-1000». Тысяча вопросов о российской культуре. Кто написал «Войну и мир». Столица Бурятии. Как зовут кота Медведева.
Запустили бенчмарк. НейроРусь набрала 34%. GPT-4 набрал 67%. Наш бенчмарк. Мы проиграли на своём поле.
Шестой месяц. Стали покупать ГигаГпт 6 за 990 рублей за 1м токенов. Это как Claude Sonnet в API. Только ГигаГпт 6 хуже Sonnet в три раза. Я измерил. На вопрос «напиши код сортировки» ГигаГпт 6 выдал код с багами. Sonnet - рабочий кода. Но Sonnet - иностранный. Иностранный - плохо. Баги - отечественные. Отечественное - хорошо.
Купили 4 000 лицензий ГигаГпт 6 . 47 миллионов в год. За качество Claude по цене Claude, но в три раза хуже Claude. Зато в реестре отечественного ПО. Реестр важнее. Качество - субъективно. Реестр - объективен.
Старший разработчик спросил, почему не DeepSeek. DeepSeek - бесплатный. DeepSeek лучше ГигаГпт 6 . Я сказал «китайские бэкдоры». Он спросил какие именно. Я сказал «все». Он спросил, есть ли пруфы. Я сказал «есть, но засекречены». Он спросил кем. Я сказал «органами». Он не уточнил какими. Органы — это серьёзно.
Почему триллион? Потому что у GPT-4 — триллион. Я прочитал это в телеграм-канале. Канал назывался «ИИ на минималках». 50 000 подписчиков. Значит, правда.
Мне выделили бюджет. 2,3 миллиарда рублей. Я сказал «это инвестиция в технологический суверенитет». Никто не спросил, что это значит.
Я тоже не знал.
Купили 256 карточек V100. Не A100. V100. Потому что A100 под санкциями. V100 — нет. V100 вышли в 2017-м. Но я сказал «проверенное решение». Проверенное означает старое. Старое означает дешёвое. Дешёвое на вторичке в Дубае.
Наняли команду. 40 человек. ML-инженеры. Большинство не работали с LLM. Но у них были сертификаты ОТУСА. Сертификаты — это компетенции. Компетенции — это строчка в отчёте.
Тимлид спросил, почему триллион параметров на 256 V100. Сказал, что у Meta на LLaMA 70B было 2000 A100. Я сказал «у нас другой подход». Он спросил какой. Я сказал оптимизированный. Он спросил как именно оптимизированный. Я назначил ему встречу по пересмотру грейда. Он уволился. Я написал в отчёте «оптимизация штата».
Восемь месяцев обучения. Модель не сходилась. Лосс был плоский. Инженер сказал, что данных мало. У нас было 200 гигабайт текстов. Госзакупки, диссертации, Лента.ру. Он сказал, что у LLaMA — 2 триллиона токенов. Я сказал «качество важнее количества». Это не так. Но звучит мудро.
На девятый месяц модель заговорила.
Она говорила странное. На вопрос «столица Франции» отвечала «в соответствии с пунктом 3.2 технического задания». На вопрос «кто президент России» выдавала «Дмитрий Анатольевич Медведев». Датасет был старый. Я назвал это «историческая глубина модели». Инженеры называли это по-другому. Но их мнение не шло в презентации.
Запустили в прод. Назвали «НейроРусь-1Т». Лого — медведь с нейросетью в голове. Лого стоило 4 миллиона. Агентство сказало, что медведь символизирует «мощь российского ИИ». Я согласился. Медведи мощные.
Первый месяц. 3 000 запросов. 2 800 — от тестировщиков. 150 — от журналистов. 50 — случайные. NPS — минус 40. Я убрал NPS из дашборда. Метрика была «не релевантна стратегическим целям».
Купили статью в РБК. 1 миллион рублей. Заголовок: «Российская нейросеть НейроРусь составит конкуренцию ChatGPT». Журналист спросил, можно ли потестировать. Я сказал «после публикации». Он опубликовал.
В статье было написано «по словам разработчиков, модель превосходит западные аналоги в понимании российского контекста». Это я сказал. Я не разработчик. Но они не возражали.
РБК поставили статью в раздел «Технологии». 400 000 просмотров. Комментарии отключили превентивно. Негатив не соответствовал редакционной политике.
Четвёртый месяц. Поняли, что модель хуже ГигаГпт 6. ГигаГпт 6 хуже Claude Sonnet. Задача: создать бенчмарк, на котором мы победим. Назвали «РусКонтекст-1000». Тысяча вопросов о российской культуре. Кто написал «Войну и мир». Столица Бурятии. Как зовут кота Медведева.
Запустили бенчмарк. НейроРусь набрала 34%. GPT-4 набрал 67%. Наш бенчмарк. Мы проиграли на своём поле.
Шестой месяц. Стали покупать ГигаГпт 6 за 990 рублей за 1м токенов. Это как Claude Sonnet в API. Только ГигаГпт 6 хуже Sonnet в три раза. Я измерил. На вопрос «напиши код сортировки» ГигаГпт 6 выдал код с багами. Sonnet - рабочий кода. Но Sonnet - иностранный. Иностранный - плохо. Баги - отечественные. Отечественное - хорошо.
Купили 4 000 лицензий ГигаГпт 6 . 47 миллионов в год. За качество Claude по цене Claude, но в три раза хуже Claude. Зато в реестре отечественного ПО. Реестр важнее. Качество - субъективно. Реестр - объективен.
Старший разработчик спросил, почему не DeepSeek. DeepSeek - бесплатный. DeepSeek лучше ГигаГпт 6 . Я сказал «китайские бэкдоры». Он спросил какие именно. Я сказал «все». Он спросил, есть ли пруфы. Я сказал «есть, но засекречены». Он спросил кем. Я сказал «органами». Он не уточнил какими. Органы — это серьёзно.
😁54🤣28🔥12😢6❤3🦄3🗿1
Huawei захватит половину китайского рынка ИИ-чипов к 2026 году
Bernstein Research прогнозирует: доля Huawei на китайском рынке ИИ-ускорителей вырастет до 50% к 2026 году.
Nvidia упадёт с 39% в 2025-м до 8%. AMD займёт 12%, Cambricon — третье место.
К 2028-му Китай будет производить больше чипов, чем потребляет внутри — соотношение спрос-предложение достигнет 104%. Продажи отечественных китайских ускорителей покажут рост 74% CAGR за три года.
Но есть нюанс: успех зависит от доступа к высокоскоростной памяти HBM.
SK Hynix и Samsung контролируют 90% мирового производства.
Китаю ещё нужно будет предложить что-то для рынка памяти.
#Huawei #Китай
------
@tsingular
Bernstein Research прогнозирует: доля Huawei на китайском рынке ИИ-ускорителей вырастет до 50% к 2026 году.
Nvidia упадёт с 39% в 2025-м до 8%. AMD займёт 12%, Cambricon — третье место.
К 2028-му Китай будет производить больше чипов, чем потребляет внутри — соотношение спрос-предложение достигнет 104%. Продажи отечественных китайских ускорителей покажут рост 74% CAGR за три года.
Но есть нюанс: успех зависит от доступа к высокоскоростной памяти HBM.
SK Hynix и Samsung контролируют 90% мирового производства.
Китаю ещё нужно будет предложить что-то для рынка памяти.
#Huawei #Китай
------
@tsingular
✍10🔥5⚡1👍1
Компьютерра представила 2й печатный выпуск.
Сделали обзор состояния и ключевых вопросов/задач ИИ рынка РФ.
Компании-разработчики представили российские ИИ решения.
Все детали мероприятия на сайте
#Компьютерра
------
@tsingular
Сделали обзор состояния и ключевых вопросов/задач ИИ рынка РФ.
Компании-разработчики представили российские ИИ решения.
Все детали мероприятия на сайте
#Компьютерра
------
@tsingular
👍9👏3⚡1