Forwarded from Machinelearning
Media is too big
VIEW IN TELEGRAM
Сэм Альтман анонсировал модель для кибербезопасности GPT-5.5-Cyber. На бенчмарке CyberGym она обходит Claude Opus 4.7. По внутренней шкале рисков OpenAI модель получила статус «Высокий», что ниже критического порога, при котором вводятся жёсткие ограничения на использование.
Параллельно OpenAI опубликовала план "Кибербезопасность в эпоху интеллекта". Глава политики национальной безопасности компании Саша Бейкер пишет, что атакующие уже используют новые технологии и защитники не должны отставать.
На этом фоне OpenAI расширяет программу TAC: раньше доступ был только у узкого круга ИБ-исследователей, теперь модель открывают для госструктур, финансового сектора и MSSP, которые обслуживают локальные больницы, школы и объекты водоснабжения.
Sam Altman в сети Х
Anthropic открыл публичную бету ИБ-инструмента в составе подписки Enterprise. Продукт работает на Opus 4.7 и анализирует код не по сигнатурам, а через чтение исходников, отслеживание потоков данных и связей между компонентами архитектуры.
Для каждой уязвимости Claude Security оценивает вероятность эксплуатации, объясняет логику обнаружения и выдаёт оценку уверенности. Из интерфейса можно открыть сессию Claude Code и сгенерировать патч в контексте проекта.
В релиз по фидбеку ранних пользователей добавили сканирование по расписанию, отклонение ложных срабатываний с комментариями для будущих проверок и экспорт отчётов.
claude.com
Утилизация кластера xAI в последние недели держится около 11%. Парк компании - порядка 500 тыс. ускорителей NVIDIA, один из крупнейших в индустрии. Для сравнения, у других лабораторий использование редко превышает 40%.
Часть проблемы в том, что обучение идёт прерывисто: пока команда разбирает промежуточные чекпоинты и планирует следующий шаг, кластер простаивает. Вторая причина - пропускная способность HBM не успевает за вычислительными ядрами, сетевые задержки при синхронизации десятков тысяч GPU замедляют весь прогон.
Из-за этого в индустрии распространилась практика накрутки утилизации: повторные запуски уже отработанных тестов ради видимой загрузки оборудования. Так команды отчитываются перед руководством и удерживают за собой выделенные серверы.
theinformation.com
Apple и UCSD представили LaDiR - надстройку над LLM, которая меняет механику генерации CoT. Вместо последовательной генерации токенов фреймворк совмещает 2 подхода: диффузия в латентном пространстве на этапе рассуждений и обычная авторегрессия для финального ответа.
На инференсе LaDiR запускает несколько параллельных цепочек. Каждая стартует из шума и пошагово денойзится в связный логический блок. Отдельный механизм заставляет потоки исследовать разные гипотезы, чтобы они не сваливались в одинаковые решения. Накопив набор кандидатов, модель переключается на посимвольную генерацию ответа.
На LLaMA 3.1 8B и Qwen3-8B-Base она обходит дообучение по точности на математических задачах и на нестандартных задачах планирования.
apple.com
Cloud Computer - выделенная виртуальная машина, которая работает непрерывно и управляется через текстовые промпты. Агент сам пишет код, ставит зависимости и разворачивает приложения по описанию задачи.
Отличие от стандартной песочницы Manus в постоянной файловой системе. Cloud Computer сохраняет утилиты и сгенерированные файлы между запусками. На нём можно круглосуточно держать ботов, парсеры, MySQL, WordPress, Home Assistant, копить исторические данные и запускать скрипты по расписанию.
Среда работает только в режиме CLI. Помимо управления через агента, доступно прямое подключение по SSH и веб-терминал в дашборде. Мощности масштабируются по тарифам Basic, Standard и Advanced.
manus.im
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from AI VK Hub
Мультимодальная модель: текст, изображения, аудио, видео на входе, текст и речь на выходе. Версия Plus обогнала Gemini 3.1 Pro, контекст 256k токенов.
Нейросеть для генерации видео по тексту и изображениям. Вдвое дешевле Veo 3.1 Fast при той же скорости, 720p/1080p, ролики 4–8 секунд.
Появилась функция Voices для клонирования голоса по аудиофрагменту от 15 секунд до 4 минут. ИИ генерирует музыку с голосом владельца аккаунта.
ИИ-агент на базе Perplexity анализирует страницы, пересказывает текст и ищет по вкладкам. Пока доступен только в Южной Корее и США.
Модель генерации изображений с поддержкой до 9 референсных изображений. Точный подбор цветов по кодам, редактирование фрагментов, удаление фона без потери качества.
Голосовая модель для агентов: отделяет речь от шума, распознаёт интонацию и темп, 90+ языков. Доступна в Google AI Studio через Live API.
Встроенный ИИ-редактор: исправляет грамматику, переводит и переписывает текст. Open-source модель, обработка без доступа к данным, Premium-подписка.
Компания рассчитывает привлечь свыше $60 млрд, переговоры ведутся с Goldman Sachs, JPMorgan Chase и Morgan Stanley. Окончательное решение не принято.
#дайджест #aivk
Please open Telegram to view this post
VIEW IN TELEGRAM
Сегодня день «Звёздных войн», и в этой дате есть своя ирония.
Сейчас франшиза выглядит как отлаженный механизм: фильмы, сериалы, мерч, огромная фанбаза. Но оригинальная картина не задумывалась как гарантированный хит.
Для Голливуда 70-х это был странный проект про космос, роботов и принцессу, скроенный в духе старых телевизионных сериалов.
Джордж Лукас тогда пошел против студийной логики. После успеха «Американских граффити» он мог снять понятное и безопасное кино, но принес боссам сценарий космической сказки. У проекта не было привычной страховки: ни звездного каста, ни проверенной формулы. Никто не знал, захочет ли зритель вообще смотреть эту смесь фантастики, вестерна и самурайского кино.
Производство тоже шло со скрипом. Студия экономила на бюджете, поэтому съемки перенесли в Англию и Тунис. А для создания спецэффектов Лукасу пришлось с нуля собирать компанию Industrial Light & Magic — существовавшие технологии просто не тянули задумку.
По сути, под «Звездные войны» приходилось изобретать новые инструменты прямо на ходу.
Руководство сомневалось, а сам проект выглядел скорее как производственная ошибка, чем как будущий кассовый рекордсмен. Но именно этот подход сработал. Фильм вышел в тот момент, когда зрителям не хватало масштабного приключения без модного тогда цинизма. Простой конфликт, классический миф и детально проработанный мир сделали свое дело.
Так история, которую киностудии считали сомнительным и рискованным продуктом, стала отправной точкой для одной из самых известных вселенных в истории кино.
Сейчас франшиза выглядит как отлаженный механизм: фильмы, сериалы, мерч, огромная фанбаза. Но оригинальная картина не задумывалась как гарантированный хит.
Для Голливуда 70-х это был странный проект про космос, роботов и принцессу, скроенный в духе старых телевизионных сериалов.
Джордж Лукас тогда пошел против студийной логики. После успеха «Американских граффити» он мог снять понятное и безопасное кино, но принес боссам сценарий космической сказки. У проекта не было привычной страховки: ни звездного каста, ни проверенной формулы. Никто не знал, захочет ли зритель вообще смотреть эту смесь фантастики, вестерна и самурайского кино.
Производство тоже шло со скрипом. Студия экономила на бюджете, поэтому съемки перенесли в Англию и Тунис. А для создания спецэффектов Лукасу пришлось с нуля собирать компанию Industrial Light & Magic — существовавшие технологии просто не тянули задумку.
По сути, под «Звездные войны» приходилось изобретать новые инструменты прямо на ходу.
Руководство сомневалось, а сам проект выглядел скорее как производственная ошибка, чем как будущий кассовый рекордсмен. Но именно этот подход сработал. Фильм вышел в тот момент, когда зрителям не хватало масштабного приключения без модного тогда цинизма. Простой конфликт, классический миф и детально проработанный мир сделали свое дело.
Так история, которую киностудии считали сомнительным и рискованным продуктом, стала отправной точкой для одной из самых известных вселенных в истории кино.
❤2🔥1🦄1
Forwarded from Думайте 2.0
Свежий #дайджест:
== МОДЕЛИ ==
🤖 SubQ 12 млн токенов
Стартап Subquadratic выкатил модель SubQ с полностью асублинейной архитектурой. Внимание теперь вычисляется с линейной сложностью, что рвет FlashAttention по скорости в 52 раза. Точность 95.8% на бенчмарке RULER унижает Opus 4.6
subq
🤖 GPT-5.5 Instant
OpenAI молча раскатила GPT-5.5 Instant как дефолтную модель даже для фри. Галлюцинации срезали в два раза по сравнению с версией 5.3, а ответы стали сухими и короткими
x
== ИНСТРУМЕНТЫ ==
🛠 Трамп запустил ИИ-агрегатор WorldClaw
Семья Трампов выкатила единый хаб для доступа к трем сотням моделей через один токен. Принимают крипту WLFI и баксы, а прайс на 30% ниже официального API. В качестве пиар хода разыгрывают тусовку с Трампом младшим
worldclaw
🛠 Агенты Human API нанимают кожаных мешков
Вышел сервис реверсивного найма где нейронки нанимают людей для грязной работы. Если ИИ тупит на сложной капче или нужен физический контакт, он кидает таску человеку в реальном времени
thehumanapi
🛠 Gemini научился клепать архивы и доки напрямую
Google апдейтнул свою нейронку и теперь она напрямую плюется готовыми PDF, таблицами и ZIP архивами. Больше не надо копипастить код руками
blog
🛠 ElevenMusic
ElevenLabs скрестил Spotify с генератором треков и запустил платформу ElevenMusic для стриминга и генерации ИИ музыки. Обещают делиться баблом с авторами оригиналов и ремиксов. Стоит 6 баксов за 30к кредитов, но пока дико багует и доступно только на iOS
elevenmusic
🛠 Бесконечный холст в Grok Imagine Agent Mode
Маск заменил чаты на рабочий спейс где ИИ сам планирует и рендерит контент. Закидываешь один промпт и агент пилит минутные фильмы или пачки картинок с автосклейкой
grok
🛠 Клонирование голоса в консоли xAI
Слепили кастомные голоса за две минуты из любой записи. Можно юзать для игровых персов или аудиокниг прямо через API без доплат
x
🛠 Простой хак порезал счета Claude Code втрое
Тип подключил локальный Insforge Skills и сэкономил кучу бабок. Вместо скармливания мусора в контекст агент получает только нужные куски кода. Токенов жрет в три раза меньше, ошибок ноль
github
🛠 Unity AI открыла бету для разрабов
Встроили ИИ агента прямо в редактор начиная с шестой версии движка. Нейронка обучена на 20 годах документации и рулит сценами сама. Сторонние модели цепляются по API, а MCP сервер связывает это дело с внешними IDE
unity
😉 Тамагочи для кодеров в OpenAI Codex
Агенты Codex обзавелись виртуальными питомцами на десктопе. Анимированные зверьки показывают статус работы ИИ в фоне. Доступно 8 базовых и более 600 кастомных шкурок чтобы не скучать пока нейронка пишет твой код. В кодекс: Настройки - Внешний вид - Питомцы
codexpets
== ИССЛЕДОВАНИЯ & ОСТАЛЬНОЕ ==
💵 Налог на язык от Claude
Исследование токенизаторов показало что Anthropic съедает на 65% больше денег за китайский текст. Для хинди ценник улетает в космос с наценкой в 300%. Русский язык обходится всреднем на 30%-100% дороже чем английский
x
🔬 Искусственные нейроны спарились с живым мозгом
Инженеры напечатали гибкие нейроны которые успешно общаются с реальными клетками. Дешевые устройства генерируют правильные сигналы и активируют мозг мышей. Готовимся к слиянию машин и человеческого железа
sciencedaily
📐 Мемристор на гафнии режет аппетиты ИИ на 70%
Кембриджские ученые собрали наночип который работает по принципу мозга. Память и вычисления происходят в одном месте без пересылки данных. Это спасет планету от энергетического кризиса и засунет мощный ИИ в карманные устройства
sciencedaily
🧠 Опровержение AGI нейронки оказались тупыми имитаторами
Китайские ученые размазали хайп вокруг модели Centaur которая щелкала 160 видов сложных тестов. Доказано что ИИ просто зубрит глубокие паттерны и ни черта не понимает суть. Кожаные могут выдохнуть, алгоритмы пока не готовы рулить ядерными кнопками
sciencedaily
Вход для мыслящих
== МОДЕЛИ ==
Стартап Subquadratic выкатил модель SubQ с полностью асублинейной архитектурой. Внимание теперь вычисляется с линейной сложностью, что рвет FlashAttention по скорости в 52 раза. Точность 95.8% на бенчмарке RULER унижает Opus 4.6
subq
OpenAI молча раскатила GPT-5.5 Instant как дефолтную модель даже для фри. Галлюцинации срезали в два раза по сравнению с версией 5.3, а ответы стали сухими и короткими
x
== ИНСТРУМЕНТЫ ==
Семья Трампов выкатила единый хаб для доступа к трем сотням моделей через один токен. Принимают крипту WLFI и баксы, а прайс на 30% ниже официального API. В качестве пиар хода разыгрывают тусовку с Трампом младшим
worldclaw
Вышел сервис реверсивного найма где нейронки нанимают людей для грязной работы. Если ИИ тупит на сложной капче или нужен физический контакт, он кидает таску человеку в реальном времени
thehumanapi
Google апдейтнул свою нейронку и теперь она напрямую плюется готовыми PDF, таблицами и ZIP архивами. Больше не надо копипастить код руками
blog
ElevenLabs скрестил Spotify с генератором треков и запустил платформу ElevenMusic для стриминга и генерации ИИ музыки. Обещают делиться баблом с авторами оригиналов и ремиксов. Стоит 6 баксов за 30к кредитов, но пока дико багует и доступно только на iOS
elevenmusic
Маск заменил чаты на рабочий спейс где ИИ сам планирует и рендерит контент. Закидываешь один промпт и агент пилит минутные фильмы или пачки картинок с автосклейкой
grok
Слепили кастомные голоса за две минуты из любой записи. Можно юзать для игровых персов или аудиокниг прямо через API без доплат
x
Тип подключил локальный Insforge Skills и сэкономил кучу бабок. Вместо скармливания мусора в контекст агент получает только нужные куски кода. Токенов жрет в три раза меньше, ошибок ноль
github
Встроили ИИ агента прямо в редактор начиная с шестой версии движка. Нейронка обучена на 20 годах документации и рулит сценами сама. Сторонние модели цепляются по API, а MCP сервер связывает это дело с внешними IDE
unity
Агенты Codex обзавелись виртуальными питомцами на десктопе. Анимированные зверьки показывают статус работы ИИ в фоне. Доступно 8 базовых и более 600 кастомных шкурок чтобы не скучать пока нейронка пишет твой код. В кодекс: Настройки - Внешний вид - Питомцы
codexpets
== ИССЛЕДОВАНИЯ & ОСТАЛЬНОЕ ==
Исследование токенизаторов показало что Anthropic съедает на 65% больше денег за китайский текст. Для хинди ценник улетает в космос с наценкой в 300%. Русский язык обходится всреднем на 30%-100% дороже чем английский
x
Инженеры напечатали гибкие нейроны которые успешно общаются с реальными клетками. Дешевые устройства генерируют правильные сигналы и активируют мозг мышей. Готовимся к слиянию машин и человеческого железа
sciencedaily
Кембриджские ученые собрали наночип который работает по принципу мозга. Память и вычисления происходят в одном месте без пересылки данных. Это спасет планету от энергетического кризиса и засунет мощный ИИ в карманные устройства
sciencedaily
Китайские ученые размазали хайп вокруг модели Centaur которая щелкала 160 видов сложных тестов. Доказано что ИИ просто зубрит глубокие паттерны и ни черта не понимает суть. Кожаные могут выдохнуть, алгоритмы пока не готовы рулить ядерными кнопками
sciencedaily
Вход для мыслящих
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1🦄1
Forwarded from 🟡NeuroGraph
Anthropic и SpaceX/XAI начали сотрудничество по инфраструктуре для Claude.
Для тех, кто не следит за AI-рынком каждый день:
Anthropic это одна из крупнейших AI-компаний в мире и создатель Claude. Это главный конкурент OpenAI в сегменте интеллектуальных AI-ассистентов и AI для программирования. Многие разработчики сегодня считают Claude одной из лучших моделей для работы с кодом.
SpaceX это космическая компания Илона Маска. Но сейчас речь идёт не только о ракетах. Внутри экосистемы Маска активно развивается AI-направление xAI и гигантская вычислительная инфраструктура Colossus. Это один из крупнейших AI-дата-центров нового поколения.
На первый взгляд это просто расширение серверных мощностей.
Но если смотреть глубже, это может быть одним из первых признаков нового этапа AI-рынка.
Anthropic получает доступ к инфраструктуре Colossus:
• сотни тысяч GPU
• огромные энергетические мощности
• дата-центры нового поколения
Взамен структуры Илона Маска получают нечто не менее ценное:
• одного из крупнейших клиентов в AI
• постоянную загрузку инфраструктуры
• деньги
• влияние на будущую AI-экосистему
И здесь начинается самое интересное.
Раньше AI-компании конкурировали моделями.
Теперь формируется другая модель рынка:
одни компании создают интеллект,
другие становятся «энергосистемой» для этого интеллекта.
Очень похоже на то, как Amazon когда-то построил AWS.
Сначала инфраструктура для себя.
Потом инфраструктура для всего мира.
Вполне возможно, что xAI/SpaceX идут в ту же сторону.
Если сотрудничество окажется успешным, дальше мы можем увидеть:
• выделенные AI-кластеры под Claude
• совместные дата-центры
• долгосрочные контракты на вычисления
• интеграцию AI-сервисов в экосистему X
• рынок вычислительных мощностей как отдельный бизнес
И это уже не выглядит фантастикой.
Потому что главная валюта AI ближайших лет это не сами модели.
А электричество, охлаждение и GPU.
Для тех, кто не следит за AI-рынком каждый день:
Anthropic это одна из крупнейших AI-компаний в мире и создатель Claude. Это главный конкурент OpenAI в сегменте интеллектуальных AI-ассистентов и AI для программирования. Многие разработчики сегодня считают Claude одной из лучших моделей для работы с кодом.
SpaceX это космическая компания Илона Маска. Но сейчас речь идёт не только о ракетах. Внутри экосистемы Маска активно развивается AI-направление xAI и гигантская вычислительная инфраструктура Colossus. Это один из крупнейших AI-дата-центров нового поколения.
На первый взгляд это просто расширение серверных мощностей.
Но если смотреть глубже, это может быть одним из первых признаков нового этапа AI-рынка.
Anthropic получает доступ к инфраструктуре Colossus:
• сотни тысяч GPU
• огромные энергетические мощности
• дата-центры нового поколения
Взамен структуры Илона Маска получают нечто не менее ценное:
• одного из крупнейших клиентов в AI
• постоянную загрузку инфраструктуры
• деньги
• влияние на будущую AI-экосистему
И здесь начинается самое интересное.
Раньше AI-компании конкурировали моделями.
Теперь формируется другая модель рынка:
одни компании создают интеллект,
другие становятся «энергосистемой» для этого интеллекта.
Очень похоже на то, как Amazon когда-то построил AWS.
Сначала инфраструктура для себя.
Потом инфраструктура для всего мира.
Вполне возможно, что xAI/SpaceX идут в ту же сторону.
Если сотрудничество окажется успешным, дальше мы можем увидеть:
• выделенные AI-кластеры под Claude
• совместные дата-центры
• долгосрочные контракты на вычисления
• интеграцию AI-сервисов в экосистему X
• рынок вычислительных мощностей как отдельный бизнес
И это уже не выглядит фантастикой.
Потому что главная валюта AI ближайших лет это не сами модели.
А электричество, охлаждение и GPU.
❤1🔥1
Forwarded from Думайте 2.0
Халявный доступ к Opus 4.7 и GPT 5.5
Использовать их будем через сайт devin.ai или IDE Windsurf.
Инструкция:
1. Переходим на devin и регистрируемся (не через github)
2. Кликаем "Start free trial" под тарифным планом Pro
3a. Вводим свою зарубежную карту (например Pionex) и вписываем любые имя и адрес платежный и жмем подтвердить.
3b. Если вдруг карта не проходит (такое может быть), то генерируем карту и адрес (лучше США)
4. Чтобы получить дополнительные 10-50$, то после оплаты прикрепляем наш github к devin
Ссылки на сервисы:
- для регистрации devin.ai
- подключаем триал тут app.devin.ai/plans
- генерация карт для оплаты namso-gen.com (делайте сразу много, вот рабочие BIN для карт:
- потом проверка карт на валидность chkr.cc
- генерация имен behindthename.com
- генерация адреса usaddressgenerator.com
Что мы получаем:
- 14 дневный триал на тариф Pro (стоит 20$)
- ежедневные и еженедельные сбросы лимитов
- возможность абузить через мультиаккаунтинг
p.s. подписку можно сразу отменить, после того как сделали триал
Вход для мыслящих
Использовать их будем через сайт devin.ai или IDE Windsurf.
Инструкция:
1. Переходим на devin и регистрируемся (не через github)
2. Кликаем "Start free trial" под тарифным планом Pro
3a. Вводим свою зарубежную карту (например Pionex) и вписываем любые имя и адрес платежный и жмем подтвердить.
3b. Если вдруг карта не проходит (такое может быть), то генерируем карту и адрес (лучше США)
4. Чтобы получить дополнительные 10-50$, то после оплаты прикрепляем наш github к devin
Ссылки на сервисы:
- для регистрации devin.ai
- подключаем триал тут app.devin.ai/plans
- генерация карт для оплаты namso-gen.com (делайте сразу много, вот рабочие BIN для карт:
5154620022xxxxxx, 559888039xxxxxxx)- потом проверка карт на валидность chkr.cc
- генерация имен behindthename.com
- генерация адреса usaddressgenerator.com
Что мы получаем:
- 14 дневный триал на тариф Pro (стоит 20$)
- ежедневные и еженедельные сбросы лимитов
- возможность абузить через мультиаккаунтинг
p.s. подписку можно сразу отменить, после того как сделали триал
Вход для мыслящих
🔥1
Forwarded from AI Secrets
This media is not supported in your browser
VIEW IN TELEGRAM
Вышел React Doctor v2 инструмент, который сканирует React-проект и выставляет ему оценку качества кода от 0 до 100
Одна команда в терминале проверяет 60+ правил: хуки, производительность, безопасность, архитектуру и мертвый код. Поддерживает Next.js, Vite, Remix и React Native.
Отдельный режим для ИИ агентов устанавливает набор из 47+ правил React прямо в Cursor, Claude Code, Codex или Gemini CLI.
GitHub: https://github.com/millionco/react-doctor
Одна команда в терминале проверяет 60+ правил: хуки, производительность, безопасность, архитектуру и мертвый код. Поддерживает Next.js, Vite, Remix и React Native.
Отдельный режим для ИИ агентов устанавливает набор из 47+ правил React прямо в Cursor, Claude Code, Codex или Gemini CLI.
GitHub: https://github.com/millionco/react-doctor
Forwarded from iLia Bolotnikov Единорог 🦄🍋 💵🇺🇸🇻🇳 🚀🌎🍋
Антропик оценивают компанию в 1 триллион долларов.
Компания, занимающаяся разработкой искусственного интеллекта, рассматривает возможность привлечения до 50 миллиардов долларов этим летом для финансирования масштабного расширения вычислительных мощностей.
Этот шаг потенциально может вывести её вперёд по рыночной капитализации по сравнению с конкурентом OpenAl. https://share.google/EFIq080k8Aa5V0eVf
Компания, занимающаяся разработкой искусственного интеллекта, рассматривает возможность привлечения до 50 миллиардов долларов этим летом для финансирования масштабного расширения вычислительных мощностей.
Этот шаг потенциально может вывести её вперёд по рыночной капитализации по сравнению с конкурентом OpenAl. https://share.google/EFIq080k8Aa5V0eVf
Forwarded from Machinelearning
У модели меньше 1 млрд активных параметров, но Zyphra заявляет, что она конкурирует с куда более крупными open-weight и proprietary-моделями на математике, кодинге и reasoning-бенчмарках.
ZAYA1-8B - это ставка на весь стек сразу:
- MoE-архитектура с Compressed Convolutional Attention;
- новый MLP-router для более стабильного выбора экспертов;
- learned residual scaling для контроля роста residual-норм;
- pretraining на AMD Instinct MI300x, без NVIDIA-стека;
- большой post-training pipeline с SFT, reasoning warmup, RLVE-Gym, math/code RL и RLHF/RLAIF;
- test-time compute метод Markovian RSA.
Markovian RSA - самая любопытная часть. Модель генерирует несколько reasoning-трасс параллельно, затем рекурсивно агрегирует их и продолжает рассуждение кусками, не раздувая контекст бесконечно. По заявлению Zyphra, именно это резко бустит сложные математические задачи.
На HMMT'25 они показывают 89.6 против 88.3 у Claude 4.5 Sonnet и GPT-5-High. А при extra-high test-time compute говорят, что ZAYA1-8B обходит DeepSeek-V3.2 и GPT-OSS-120B High на APEX-shortlist.
Модель полностью обучали на AMD-инфраструктуре. Для рынка это почти политическое заявление - serious AI training больше не обязан выглядеть как “NVIDIA or nothing”.
ZAYA1-8B доступна в Zyphra Cloud, веса выложены на Hugging Face, лицензия Apache-2.0.
https://www.zyphra.com/post/zaya1-8b
@ai_machinelearning_big_data
#Zyphra
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from AI Secrets
Thinking Machines Lab, компания Миры Мурати, опубликовала research preview Interaction Models нового класса ИИ-моделей, обученных работать в режиме реального времени с нуля
Текущие real-time системы (GPT Realtime, Gemini Live) используют harness: отдельный компонент обнаружения пауз в речи определяет, когда пользователь закончил говорить, и только после этого модель начинает отвечать. Interaction Model работает с потоками аудио, видео и текста через микро-туры: входящий и исходящий потоки обрабатываются параллельно, без искусственных границ реплик
Это позволяет модели перебивать, отвечать на визуальные изменения без звуковой подсказки, делать живой перевод пока собеседник говорит
Модель MoE 276B параметров, 12B активных. На бенчмарке FD-bench v1.5, 77.8 против 46.8 у GPT-realtime-2.0 minimal и 54.3 у Gemini-3.1-flash-live minimal. Задержка ответа 0.40 с против 1.18 у GPT. Широкий доступ запланирован на позднее в этом году
Почитать: https://thinkingmachines.ai/blog/interaction-models/
Текущие real-time системы (GPT Realtime, Gemini Live) используют harness: отдельный компонент обнаружения пауз в речи определяет, когда пользователь закончил говорить, и только после этого модель начинает отвечать. Interaction Model работает с потоками аудио, видео и текста через микро-туры: входящий и исходящий потоки обрабатываются параллельно, без искусственных границ реплик
Это позволяет модели перебивать, отвечать на визуальные изменения без звуковой подсказки, делать живой перевод пока собеседник говорит
Модель MoE 276B параметров, 12B активных. На бенчмарке FD-bench v1.5, 77.8 против 46.8 у GPT-realtime-2.0 minimal и 54.3 у Gemini-3.1-flash-live minimal. Задержка ответа 0.40 с против 1.18 у GPT. Широкий доступ запланирован на позднее в этом году
Почитать: https://thinkingmachines.ai/blog/interaction-models/
Alec Radford is a widely recognized yet low-profile AI researcher who served as a key architect behind the modern generative AI boom at OpenAI, specializing in language, vision, and multimodal systems. Often described as a "quiet genius" and an "Einstein-level" talent by peers like Sam Altman, Radford's work is considered the foundation for many AI technologies in daily use as of 2026.
📷 делюсь с вами очень полезной штукой для насмотренности — Eyecandy
это сайт, где собраны визуальные техники и эффекты для видео: aerial, dolly zoom, match cut, slow motion, transitions, close-up, reflections, bullet time и еще куча всего
➡️по сути — это такая библиотека для креаторов, режиссеров, монтажеров и всех, кто хочет делать кадры с идеей, движением и визуальным приемом
чем полезно:
— можно искать референсы под конкретный эффект
— смотреть, как это реализовано в кино/видео
— понимать, как называется прием, который вы где-то увидели
— развивать насмотренность
— прокачивать режиссуру кадра, монтаж и визуальное мышление
— брать идеи для AI-видео и промптов
🔥 короче, если у вас иногда в голове:
“хочу что-то кинематографичное, но не знаю что именно” — вам туда
🧷оставляю ссылку, чтобы вы не потеряли:
eyecannndy.com
это сайт, где собраны визуальные техники и эффекты для видео: aerial, dolly zoom, match cut, slow motion, transitions, close-up, reflections, bullet time и еще куча всего
➡️по сути — это такая библиотека для креаторов, режиссеров, монтажеров и всех, кто хочет делать кадры с идеей, движением и визуальным приемом
чем полезно:
— можно искать референсы под конкретный эффект
— смотреть, как это реализовано в кино/видео
— понимать, как называется прием, который вы где-то увидели
— развивать насмотренность
— прокачивать режиссуру кадра, монтаж и визуальное мышление
— брать идеи для AI-видео и промптов
🔥 короче, если у вас иногда в голове:
“хочу что-то кинематографичное, но не знаю что именно” — вам туда
🧷оставляю ссылку, чтобы вы не потеряли:
eyecannndy.com
❤1
Forwarded from AI Secrets
This media is not supported in your browser
VIEW IN TELEGRAM
Вышел React Doctor v2 инструмент, который сканирует React-проект и выставляет ему оценку качества кода от 0 до 100
Одна команда в терминале проверяет 60+ правил: хуки, производительность, безопасность, архитектуру и мертвый код. Поддерживает Next.js, Vite, Remix и React Native.
Отдельный режим для ИИ агентов устанавливает набор из 47+ правил React прямо в Cursor, Claude Code, Codex или Gemini CLI.
GitHub: https://github.com/millionco/react-doctor
Одна команда в терминале проверяет 60+ правил: хуки, производительность, безопасность, архитектуру и мертвый код. Поддерживает Next.js, Vite, Remix и React Native.
Отдельный режим для ИИ агентов устанавливает набор из 47+ правил React прямо в Cursor, Claude Code, Codex или Gemini CLI.
GitHub: https://github.com/millionco/react-doctor
❤1
Anthropic выпустила пакет инструментов для малого бизнеса: Claude теперь умеет планировать зарплату, закрывать месяц в бухгалтерии, отправлять контракты на подпись и запускать маркетинговые кампании.
Все это подключается переключателем в Claude Cowork к уже привычным инструментам: QuickBooks, PayPal, Canva, DocuSign и другим. Дополнительной платы нет сверх текущей подписки
Почитать: https://www.anthropic.com/news/claude-for-small-business
Посмотреть: https://youtu.be/lserpKbUDjc?si=xygPtPgluO45qFbu
Все это подключается переключателем в Claude Cowork к уже привычным инструментам: QuickBooks, PayPal, Canva, DocuSign и другим. Дополнительной платы нет сверх текущей подписки
Почитать: https://www.anthropic.com/news/claude-for-small-business
Посмотреть: https://youtu.be/lserpKbUDjc?si=xygPtPgluO45qFbu
Anthropic
Introducing Claude for Small Business
We're launching Claude for Small Business, a package of connectors and ready-to-run workflows that put Claude inside the tools small businesses use every day.
Forwarded from Neurogen (muzaffar)
WhisperX Portable by Neurogen
Транскрипция и диаризация
Собрал портативную Windows-сборку WhisperX — это быстрое распознавание речи на базе Whisper с пословной разметкой времени и разделением говорящих.
Установка одной кнопкой, без admin-прав, без CUDA Toolkit, без Anaconda. После установки папку можно скопировать на любой Windows-комп с NVIDIA-картой и просто запустить.
🔘 Функционал
- расшифровка интервью, лекций, подкастов
- субтитры (SRT / VTT) к видео и стримам
- разделение по говорящим в записях встреч и созвонов
- всё локально, ничего не уходит в облако
В отличие от веб-сервисов бесплатно, неограниченно по длине, и приватно
🔘 Что нужно
- Windows 10 / 11, 64-бит
- NVIDIA с драйвером R555+ (RTX или GTX 10+ серии) — будет в десятки раз быстрее
- Либо просто CPU — медленнее, но работает без видеокарты
- 8 ГБ ОЗУ минимум, 16+ ГБ для крупных моделей
- ~6 ГБ места на диске после установки + место под модели
🔘 Как поставить
1. Скачайте репозиторий ZIP-ом или
2. Распакуйте куда угодно — главное, чтобы в пути не было кириллицы (Python embeddable этого не любит)
3. Дважды кликните
4. После завершения —
Если у вас нет NVIDIA-карты, перед
🔘 Как пользоваться
Через GUI: выбираете аудио/видео, ставите модель (
Через drag-and-drop: бросаете файл на
Из консоли:
🔘 Полезные советы
Модели:
Если не хватает VRAM (ошибка
Скорость: на RTX 3060 час аудио → ~3-5 минут на
Качество выше: оставьте «Выравнивание (временные метки слов)» включённым — получите точные тайминги по словам, удобно для субтитров.
Форматы:
Папка переносится: после
🗣 Диаризация (разделение говорящих)
Чтобы получить «Спикер 1: …», «Спикер 2: …»:
1. Регистрируетесь на huggingface.co
2. Принимаете соглашение на странице модели pyannote
3. Создаёте токен с правом чтения: https://huggingface.co/settings/tokens
4. Вставляете токен в поле «Токен HF» в GUI, ставите галку «Включить диаризацию»
Токен сохранится в
🔘 Если что-то сломалось
`Could not load library cudnn_*.dll` → драйвер NVIDIA старее R555. Обновите с [nvidia.com](https://www.nvidia.com/Download/index.aspx) или переустановите с
Кириллица в консоли как
Полный сброс:
Подробности — в
GITHUB
Транскрипция и диаризация
Собрал портативную Windows-сборку WhisperX — это быстрое распознавание речи на базе Whisper с пословной разметкой времени и разделением говорящих.
Установка одной кнопкой, без admin-прав, без CUDA Toolkit, без Anaconda. После установки папку можно скопировать на любой Windows-комп с NVIDIA-картой и просто запустить.
- расшифровка интервью, лекций, подкастов
- субтитры (SRT / VTT) к видео и стримам
- разделение по говорящим в записях встреч и созвонов
- всё локально, ничего не уходит в облако
В отличие от веб-сервисов бесплатно, неограниченно по длине, и приватно
- Windows 10 / 11, 64-бит
- NVIDIA с драйвером R555+ (RTX или GTX 10+ серии) — будет в десятки раз быстрее
- Либо просто CPU — медленнее, но работает без видеокарты
- 8 ГБ ОЗУ минимум, 16+ ГБ для крупных моделей
- ~6 ГБ места на диске после установки + место под модели
1. Скачайте репозиторий ZIP-ом или
git clone https://github.com/rzaev77/whisperx-portable.git2. Распакуйте куда угодно — главное, чтобы в пути не было кириллицы (Python embeddable этого не любит)
3. Дважды кликните
setup.bat. Первый раз качается ~3–5 ГБ, занимает 10–30 минут4. После завершения —
WhisperX.bat запускает GUIЕсли у вас нет NVIDIA-карты, перед
setup.bat запустите:powershell -ExecutionPolicy Bypass -File tools\setup.ps1 -Backend cpuЧерез GUI: выбираете аудио/видео, ставите модель (
large-v3 для качества, medium для скорости), язык (например ru), нажимаете «Транскрибировать». Результаты — в папке output/.Через drag-and-drop: бросаете файл на
WhisperX-CLI.bat — он сам прогонит транскрипцию с настройками по умолчанию.Из консоли:
WhisperX-CLI.bat input.mp3 --model large-v3 --language ru --output_format srtМодели:
tiny → base → small → medium → large-v3. Чем больше, тем точнее и медленнее. Для русского large-v3 — оптимум.Если не хватает VRAM (ошибка
CUDA out of memory): поставьте compute_type=int8 и batch_size=4 в GUI. Так влезает даже на 6 ГБ.Скорость: на RTX 3060 час аудио → ~3-5 минут на
large-v3 с compute_type=float16. На CPU тот же час — до 30-60 минут.Качество выше: оставьте «Выравнивание (временные метки слов)» включённым — получите точные тайминги по словам, удобно для субтитров.
Форматы:
srt для субтитров, txt для чистого текста, json если нужна машинная обработка с таймкодами и говорящими.Папка переносится: после
setup.bat можно скопировать всю папку на флешку и запускать на другом компе с NVIDIA-картой. Без переустановки.🗣 Диаризация (разделение говорящих)
Чтобы получить «Спикер 1: …», «Спикер 2: …»:
1. Регистрируетесь на huggingface.co
2. Принимаете соглашение на странице модели pyannote
3. Создаёте токен с правом чтения: https://huggingface.co/settings/tokens
4. Вставляете токен в поле «Токен HF» в GUI, ставите галку «Включить диаризацию»
Токен сохранится в
config.json рядом — больше вводить не придётся.`Could not load library cudnn_*.dll` → драйвер NVIDIA старее R555. Обновите с [nvidia.com](https://www.nvidia.com/Download/index.aspx) или переустановите с
-Backend cpu.
CUDA out of memory → меньше модель, compute_type=int8, batch_size=4.Кириллица в консоли как
??? → у вас старая версия Windows без поддержки UTF-8 в консоли. Сама работа не пострадает, только сообщения.Полный сброс:
powershell -ExecutionPolicy Bypass -File tools\setup.ps1 -Force — стирает runtime/ и переустанавливает.Подробности — в
docs/TROUBLESHOOTING.md.GITHUB
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from AI Secrets
This media is not supported in your browser
VIEW IN TELEGRAM
Вот пример 3 правок видео с новой моделью Google, Omni:
1. оригинал
2. сделать её невидимой, надеть на неё перчатки
3. пока она говорит, двое мужчин приходят и уносят картину в рамке
4. изменить её наряд
1. оригинал
2. сделать её невидимой, надеть на неё перчатки
3. пока она говорит, двое мужчин приходят и уносят картину в рамке
4. изменить её наряд
Forwarded from AI Secrets
Официально поддерживает казахский и русский 🔥🔥🔥
Tencent выпустил Hy-MT2, семейство открытых моделей для машинного перевода в трёх размерах: 1.8B, 7B и 30B-A3B.
Все три поддерживают 33 языка, в том числе казахский, русский. Версия 1.8B сжата до 440 МБ с помощью квантизации AngelSlim до 1.25 бит и рассчитана на запуск локально на мобильных чипах
По результатам бенчмарков WMT25 модели 7B и 30B-A3B превзошли DeepSeek-V4-Pro и Kimi K2.6 на переводческих задачах, а 1.8B обошла ряд коммерческих API. Вместе с моделями опубликован IFMTBench, бенчмарк для оценки следования инструкциям при переводе. Веса доступны на Hugging Face в форматах GGUF, FP8 и 1.25-bit GGUF.
GitHub: https://github.com/Tencent-Hunyuan/Hy-MT2
ModelScope: https://modelscope.cn/collections/Tencent-Hunyuan/Hy-MT2
Hugging Face: https://huggingface.co/collections/tencent/hy-mt2
Tencent выпустил Hy-MT2, семейство открытых моделей для машинного перевода в трёх размерах: 1.8B, 7B и 30B-A3B.
Все три поддерживают 33 языка, в том числе казахский, русский. Версия 1.8B сжата до 440 МБ с помощью квантизации AngelSlim до 1.25 бит и рассчитана на запуск локально на мобильных чипах
По результатам бенчмарков WMT25 модели 7B и 30B-A3B превзошли DeepSeek-V4-Pro и Kimi K2.6 на переводческих задачах, а 1.8B обошла ряд коммерческих API. Вместе с моделями опубликован IFMTBench, бенчмарк для оценки следования инструкциям при переводе. Веса доступны на Hugging Face в форматах GGUF, FP8 и 1.25-bit GGUF.
GitHub: https://github.com/Tencent-Hunyuan/Hy-MT2
ModelScope: https://modelscope.cn/collections/Tencent-Hunyuan/Hy-MT2
Hugging Face: https://huggingface.co/collections/tencent/hy-mt2
🔥1
Forwarded from AI Secrets
Alibaba выпустила Qwen3.7-Max, для агентных сценариев
Ключевой эксперимент команды: в режиме автономного запуска модель 35 часов оптимизировала CUDA-ядро Extend Attention, совершив 1158 вызовов инструментов и 432 итерации компиляции, без участия человека, и достигла ускорения в 10x относительно базового Triton-ядра.
На агентных бенчмарках Terminal-Bench (69.7), MCP-Atlas (76.4), SWE-bench Multilingual (78.3) модель занимает первое место среди протестированных
На CoWorkBench результат 67.2 против 68.2 у Claude Opus 4.6 Max. Модель доступна через API Alibaba Model Studio и Qwen Studio
Почитать: https://qwen.ai/blog?id=qwen3.7
Демо: https://chat.qwen.ai
Ключевой эксперимент команды: в режиме автономного запуска модель 35 часов оптимизировала CUDA-ядро Extend Attention, совершив 1158 вызовов инструментов и 432 итерации компиляции, без участия человека, и достигла ускорения в 10x относительно базового Triton-ядра.
На агентных бенчмарках Terminal-Bench (69.7), MCP-Atlas (76.4), SWE-bench Multilingual (78.3) модель занимает первое место среди протестированных
На CoWorkBench результат 67.2 против 68.2 у Claude Opus 4.6 Max. Модель доступна через API Alibaba Model Studio и Qwen Studio
Почитать: https://qwen.ai/blog?id=qwen3.7
Демо: https://chat.qwen.ai
🔥1