Media is too big
VIEW IN TELEGRAM
Mistral представил Mistral Code — инструмент для программистов, который будет бороться за внимание пользователей с GitHub Copilot и другими аналогами. Продукт основан на открытом проекте Continue и включает в себя собственные модели Mistral: Codestral для автозаполнения кода, Devstral для решения задач через агенты, Mistral Medium для чатов и Codestral Embed для поиска. Поддерживаются 80+ языков программирования, интеграция с VS Code и JetBrains уже в бета-тестировании.
В компании говорят, что ассистент уже используют Capgemini, SNCF и банк Abanca. Mistral Code позволяет работать локально, обрабатывает файлы, ошибки в терминале и даже обсуждения из тикетов. Beta-версия доступна для тестирования, а часть улучшений обещают добавлять в опенсорс.
mistral.ai
Компании совместно добились успеха, сократив задержку на 70% и повысив комплексную точность (ASR+генерация ответа) с 81,5% до 99,2%. Проблема «неловких пауз» в разговорах с роботами, которая выдавала их, устранена благодаря технологии Groq - «горячей замене» легких моделей LoRA без потерь в скорости.
Система работает так: Maitai выбирает оптимальную модель для каждого запроса, Groq обрабатывает ее на специализированных чипах LPU, а данные о слабых местах моделей собираются и используются для их доработки. В итоге время первого ответа снизилось с 661 до 176 мс, а синтез диалога стал в 4 раза быстрее.
Один из клиентов Phonely уже заменит 350 операторов колл-центра на ИИ, а количество качественных лидов выросло на 32%.
venturebeat.com
Компания Марка Цукерберга раскрыла подробности об очках Aria Gen 2. Новинка весит 74–76 грамм, имеет 8 вариантов оправ и складные дужки для удобства. Главное изменение: 4 камеры с датчиками затвора, которые устойчивы к искажения при движении. Динамический диапазон вырос до 120 дБ, а угол перекрытия стереокамер увеличился до 80°, что улучшает определение глубины. В наносном узле разместили контактный вибромикрофон и датчик пульса PPG.
Для ИИ-задач предусмотрен отдельный процессор, а система VIO отслеживает движение в 6DoF. Очки следят за глазами, фиксируют зрачки, отслеживают руки в 3D. Устройства планируют выдавать исследователям позже в 2025 году, а демо покажет на конференции CVPR в июне этого года.
mashable.com
Anthropic разработала версии моделей Claude, предназначенных исключительно для правительственных структур, занимающихся вопросами национальной безопасности. Решение создано на основе обратной связи от госзаказчиков и прошло проверки на безопасность.
Модели оптимизированы для работы с секретными данными, лучше понимают документы из сферы разведки и обороны, анализируют киберугрозы и поддерживают редкие языки, важные для спецопераций. Использование ограничено закрытыми системами, где доступ к информации строго регламентирован.
anthropic.com
Higgsfield представил Higgsfield Speak — платформу, которая превращает текст в видео с анимированными персонажами, передающими эмоции, жесты и движения. В отличие от обычного липсинка, новый инструмент использует 80 параметров движения и 40 визуальных эффектов, чтобы сделать анимацию похожей на «живую» съемку. Платформа подходит для подкастов, обучающих роликов или рекламных кампаний: пользователи выбирают стиль, аватар и сценарий — остальное система обрабатывает автоматически.
Продукт позиционируется как решение для креативщиков, которым нужно быстро создавать контент без камеры - от влогов до рекламных лендингов. Подписки Pro и Ultimate открывают доступ к инструментам, которые, по словам разработчиков, изменят подход к производству видео в ближайшее полугодие.
HiggsField AI в сети Х (ex-Twitter)
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Google выложил в открытый доступ на Github фуллстек-проект, который превращает пользовательские запросы в глубокие исследования с помощью Gemini. Его главная задача - находить информацию в интернете, анализировать ее и выдавать ответы с ссылками на источники, используя комбинацию React-интерфейса и бэкенда на базе LangGraph.
Проект включает в себя все необходимое: и фронтенд, и бэкенд.
Внутри бэкенда есть модуль, который отвечает за запуск цикла: сначала Gemini создает начальные запросы, затем система ищет информацию через API Google Search, оценивает, хватает ли данных, и при необходимости повторяет процесс.
Важная часть пайплайна — рефлексия. После каждого поиска агент проверяет, закрыты ли все «пробелы» в знаниях. Если информации недостаточно, он генерирует новые вопросы и повторяет цикл, пока не соберёт достаточно данных для ответа.
Проект адаптирован к продакшену, в нем используются Redis (для стриминга результатов в реальном времени) и PostgreSQL (для хранения истории диалогов и управления задачами). Это позволяет системе не терять прогресс даже при перезагрузках.
⚠️ Для практического использования потребуются API-ключи к Google Gemini и LangSmith.
@ai_machinelearning_big_data
#AI #ML #DeepSearch #Google #Gemini #LangGraph
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Anthropic отключила Windsurf от прямого использования моделей Claude 3.5 и 3.7 Sonnet, объяснив это слухами о возможной покупке стартапа OpenAI.
По словам сооснователя Anthropic Джареда Каплана, компания хочет сосредоточиться на долгосрочных партнерствах, так как сейчас сталкивается с нехваткой вычислительных мощностей.
Windsurf, получавший доступ к Claude для разработки своих продуктов, теперь вынужден переходить на сторонние платформы, что может временно нарушить стабильность сервиса для пользователей.
В то же время Anthropic анонсировал сотрудничество с Cursor. Каплан подчеркнул, что фокус компании смещается с чат-ботов на «агентные» решения вроде Claude Code, которые, по его мнению, окажутся более полезными в будущем.
Источник: Techcrunch
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
В свежем июньском отчете, Open AI описала самые крупные кейсы, когда злоумышленники использовали модели ИИ для создания фейковых резюме, манипуляций в соцсетях, кибератак и мошенничества.
Для анализа угроз исследователи применяют комбинацию ИИ и экспертные команды. ИИ помогает выявлять шаблоны текста злоумышленников и координировать расследование с платформами. Архитектура таких систем включает модели для анализа данных, детекторы аномалий и инструменты для синхронизации с правоохранительными органами.
Обучались такие специализированные модели, помимо общедоступных данных, еще на примерах социальной инженерии и профилях киберугроз. Дополнительно, они получили методы обнаружения фейковых профилей, перевода текстов и анализа сетевого трафика.
Deceptive Employment Scheme: IT Workers.
Covert IO: Operation “Sneer Review”
Covert IO: Operation “High Five”
Social engineering meets IO: Operation “VAGue Focus”
Covert IO: Operation “Helgoland Bite”
Cyber Operation: “ScopeCreep”
Cyber Operations: Vixen and Keyhole Panda
Covert IO: Operation “Uncle Spam”
Recidivist Influence Activity: STORM-2035
Scam: Operation “Wrong Number”
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
EleutherAI выпустила The Common Pile v0.1 — 8-терабайтный набор данных для тренировки моделей, собранный при участии Hugging Face и академических институтов. В него вошли более 20-ти публичных источников, На базе датасета созданы Comma v0.1-1T и Comma v0.1-2T (по 7 млрд параметров), которые, по заявлению разработчиков, не уступают моделям, обученным на нелицензированном контенте.
Модели показывают сильные результаты в прораммировании и математике, опровергая мнение, что только "пиратский" контент обеспечивает качество. Релиз датасета - это попытка исправить ошибки прошлого: ранее EleutherAI критиковали за использование защищенного авторским правом контента в старом датасете The Pile.
huggingface.co
OpenAI получила судебный приказ о временном хранении данных пользователей ChatGPT и API, даже если они были удалены. Это связано с иском New York Times о нарушении авторских прав. NYT требует сохранить «всю переписку и контент» для использования в качестве доказательств.
Под приказ попадают данные пользователей бесплатных и платных версий ChatGPT (Plus, Pro, Team), а также API-клиенты без соглашения о нулевом хранении данных. Корпоративные клиенты и образовательные проекты в безопасности — их информация не попадает под приказ.
OpenAI назвала требование чрезмерным, подчеркнув, что обычно удаляет данные через 30 дней и подала апелляцию, но временно соблюдает решение.
openai.com
MIT CSAIL и Recursion разработали Boltz-2 — открытую модель для анализа биомолекулярных структур и связывания. Она сочетает рекордную скорость и точность, превосходя AlphaFold3 и других конкурентов.
Boltz-2 предсказывает, как молекулы взаимодействуют, с точностью, близкой к физическим методам FEP, но в 1000 раз быстрее. Разработчики надеются, что публикация модели облегчит поиск лекарств, ведь Boltz-2 может за час перебрать тысячи соединений вместо недель вычислений.
globenewswire.com
AMD объявил о покупке ключевых специалистов из стартапа Untether AI, разработавшего энергоэффективные чипы для ИИ-инференса. Сделка должна укрепить возможности компании в области компиляторов и проектирования чипов.
Untether AI, основанный в 2018 году, славился архитектурой «at-memory», повышающей производительность в дата-центрах и на EDGE-устройствах. Их плата speedAI240 Slim показала рекордную энергоэффективность: в 3–6 раз выше аналогов по тестам MLPerf.
Сделка стала частью стратегии AMD по конкурированию с Nvidia. Ранее, приобретя стартап Brium, компания усилила оптимизацию ИИ-нагрузок на GPU Instinct. Теперь фокус смещается на интеграцию новых технологий в продукты, ориентированные на растущий рынок ИИ.
crn.com
В Нью-Йорке прошел ежегодный фестиваль ИИ-фильмов от Runway. За 3 года проект вырос от 300 до 6000 заявок, а в этом году представил десятку короткометражек, созданных с помощью ИИ. Лучшей стала «Total Pixel Space» Джейкоба Алдера, исследующая математические границы digital-изображений.
По словам организаторов, технологии ускоряют процессы кинопроизводства и фестиваль делает акцент на том, как ИИ поддерживает, а не заменяет творцов.
apnews.com
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Eso-LM - это новый класс языковых моделей, сочетающий автогрегрессионные (AR) и маскированные диффузионные методы (MDM), чтобы сбалансировать качество генерации и скорость работы.
Основная идея состоит в том, чтобы устранить слабые места обеих технологий: медленное выполнение AR-моделей и низкую эффективность MDM при сохранении их ключевых преимуществ - параллелизма.
Архитектура строится на гибридной функции потерь, которая одновременно обучает модель как AR-генератору, так и MDM-декодеру. Это достигается через модифицированный механизм внимания, который динамически переключается между причинным (для AR-фазы) и двусторонним (для MDM-фазы) режимами.
В отличие от классических MDM, Eso-LM использует разреженные матрицы внимания, позволяя кэшировать KV даже во время диффузионного этапа. Эта техника ощутимо сокращает вычислительную нагрузку за счет обработки только тех токенов, которые нужно «демаскировать» на каждом шаге.
Процесс генерации разбит на 2 стадии:
Обе стадии используют единый KV-кэш, что исключает повторные вычисления и ускоряет работу в разы. В итоге, для длинных последовательностей (8192 токена), Eso-LM работает в 65 раз быстрее, чем стандартные MDM.
Экспериментальные модели обучали на сетах LM1B (1 млрд. слов) и OpenWebText с использованием токенизаторов BERT и GPT-2 соответственно.
Тесты показали, что Eso-LM не только улучшает скорость, но и устраняет «модовое коллапсирование» (деградацию качества при малом числе шагов), характерное для предыдущих решений (BD3-LM).
На наборе OWT модель достигла уровня perplexity 21.87 при высокой скорости генерации, оставаясь конкурентоспособной как с MDM, так и с AR-моделями.
@ai_machinelearning_big_data
#AI #ML #LLM #EsoLM #HybridModel
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
📈 Количество пользователей растет у всех , но ChatGPT — вне конкуренции
Но ChatGPT растет быстрее всех.
Почти все крупные сайты растут, но ChatGPT показывает непрерывный и аномальный взлёт. В мае 2025 года его посещаемость выросла на +6,82% по сравнению с апрелем.
И это говорит о двух вещах:
1️⃣ ИИ стал по-настоящему массовым
Все меньше людей , которые не использует ИИ — в работе, учёбе или просто в быту. Это уже не будущее — это часть повседневности.
2️⃣ OpenAI наращивает отрыв
Именно поэтому GPT‑5 — будет не просто новой моделью, это стратегическая ставка на доминирование на ИИ рынке.
У модели есть шанс пробить магическую планку в 1 миллиард пользователей и окончательно закрепить лидерство OpenAI.
@ai_machinelearning_big_data
#chatgpt #openai #news #ml #ai
Но ChatGPT растет быстрее всех.
Почти все крупные сайты растут, но ChatGPT показывает непрерывный и аномальный взлёт. В мае 2025 года его посещаемость выросла на +6,82% по сравнению с апрелем.
И это говорит о двух вещах:
1️⃣ ИИ стал по-настоящему массовым
Все меньше людей , которые не использует ИИ — в работе, учёбе или просто в быту. Это уже не будущее — это часть повседневности.
2️⃣ OpenAI наращивает отрыв
Именно поэтому GPT‑5 — будет не просто новой моделью, это стратегическая ставка на доминирование на ИИ рынке.
У модели есть шанс пробить магическую планку в 1 миллиард пользователей и окончательно закрепить лидерство OpenAI.
@ai_machinelearning_big_data
#chatgpt #openai #news #ml #ai
MTS Web Services (MWS) провела масштабное мероприятие True Tech Day — свыше 800 000 участников онлайн и 5 000 офлайн. Ключевой фокус — искусственный интеллект и ML.
Формат: 4 трека, 50+ спикеров, интерактив с флагманскими продуктами MWS.
Технологии: генеративный ИИ, цифровые двойники, робототехника, AutoML, системная инженерия будущего.
На главной сцене:
Треки конференции:
True Tech Day 2025 стал не просто конференцией, а местом встречи ИТ-сообщества, где ИИ не только обсуждали — с ним взаимодействовали на практике.
@ai_machinelearning_big_data
#AI #ML #TrueTech #MWS
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Epoch AI провели исследование, чтобы копнуть способность o3-mini в математическом ризонинге глубже, чем это происходит в популярных тестах и бенчмарках.
Они дали 14 математикам разобрать, как именно o3-mini-high решает сложные задачи из FrontierMath. Цель - понять ее сильные и слабые стороны в реальном математическом мышлении, а не просто фиксировать правильные ответы.
Так как внутренняя структура самой модели OpenAI не раскрывает, авторы сосредоточились на анализе ее рассуждений.
По 29-и "траекториям рассуждений" стало видно: модель не просто перебирает формулы, она действует как "индуктивный решатель на ощущениях" (по выражению одного математика).
Модель проявляет любопытство: пробует разные подходы, ставит "бюджетные эксперименты", чтобы прощупать задачу. Иногда даже пишет код для расчетов, избегая излишней абстракции.
Но стиль ее рассуждений часто неформальный, "черновой". Рассуждения излагаются приблизительно, без строгой формулировки, с пропусками сложных моментов – совсем не как это принято в математической среде.
Почему так? Возможно, строгие доказательства просто реже встречались в ее обучающих данных.
Главные проблемы модели – это обратная сторона ее же достоинств. Да, она эрудирована как никто (знает кучу теорем из разных областей – в 66% случаев она адресно применяла нужные знания, даже если подход был замаскирован).
Но ей не хватает строгости и глубины. Она часто "читерит": делает верную догадку интуитивно и тут же применяет ее для решения, даже не пытаясь ее подтвердить доказательствами.
Порой ей не хватает буквально одного шага до верного ответа. Но главное – математики критикуют ее за слабую креативность. Как заметил один эксперт, модель похожа на аспиранта, который может блеснуть начитанностью, назвать кучу теорем и авторов, но не способен глубоко переосмыслить материал или придумать что-то новое.
Набор идей модели ограничен, и если они не срабатывают – прогресса нет. Плюс ко всему, в 75% рассуждений нашли галлюцинации: модель путает термины, формулы, и зачастую выдумывает несуществующие URL для поиска недостающей информации.
Модель, по заверением OpenAI, обучали на огромном массиве данных математической литературы. Это объясняет ее феноменальную эрудицию. Но смогут ли такие модели, как o3-mini-high, преодолеть свои слабости в будущем?
Или же системы, обученные на синтетических данных (AlphaProof), пойдут другим путем, предлагая в инфернесе рассуждения, мало похожие на человеческое математическое мышление?
А пока что вывод: o3-mini-high – это мощный, но своеобразный инструмент. Знаток с интуицией, но без дисциплины профессора.
@ai_machinelearning_big_data
#AI #ML #EpochAI
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Новая функция позволяет автоматизировать повторяющиеся задачи и получать персонализированные уведомления. Пользователи могут задавать команды, например, ежедневно присылать сводку календаря или идеи для блога, а также создавать разовые напоминания.
«Запланированные действия» активируется через настройки приложения. Система работает просто: достаточно описать задачу и указать время выполнения. Доступ к инструменту открыт для подписчиков Google AI Pro/Ultra и корпоративных пользователей Google Workspace (образовательные и бизнес-планы).
blog.google
Все началось из за волны возмущения платных подписчиков поводу того, что в Gemini app платный Pro-тариф ($19.99) оказался строже, чем бесплатный AI Studio.
Google отреагировал увеличением лимитов для Gemini app, но параллельно объявил, что AI Studio полностью перейдет на авторизацию по API-ключам. Это напугало разработчиков, многие используют AI Studio в своих проектах. Они опасаются, что теперь придется платить за сервис.
Руководитель направления, Логан Килпатрик, успокоил сообщество: "Бесплатный уровень AI Studio никуда не денется в ближайшее время". Поменяется система учета. Пока большинство укладывалось в свободные квоты, но теперь, при их превышении, точно потребуется свой ключ и, возможно, оплата. Для тех, кому критичны большие квоты Gemini app, теперь нужен уже AI Ultra за $250/мес. Будущее бесплатного доступа в AI Studio прорабатывается, компания обещает минимизировать неудобства.
9to5google.com
Microsoft выпустила обновление для Photos на Windows 11 с новыми фичами. Relight: позволяет управлять тремя источниками света, менять их цвет и фокус, есть готовые пресеты. Пока это работает только на Snapdragon-устройствах Copilot+, но вскоре поддержка дойдет до AMD и Intel.
Поиск по текстовому запросу: вводите «закат на пляже» или «семейный пикник», и приложение найдет подходящие фото без лишних кликов.
Коммерческие пользователи с Entra ID получили доступ к Restyle Image и Image Creator, ранее доступным только через личные аккаунты Microsoft. Обновление доступно в версии 2025.11060.5006.0 и выше.
blogs.windows.com
Foundation Models — фреймворк для создания интеллектуальных приложений с поддержкой офлайн-работы и приватностью данных. С ним можно добавлять ИИ-функции в приложения всего за три строки кода на Swift.
Xcode 26 получил интеграцию с ChatGPT и другими LLM, позволяя писать код, тесты и документацию через API-ключи или локальные модели на Mac с чипами Apple. Удобство повысилось за счет голосового управления, обновлённой навигации и локализации.
Swift 6.2 улучшил производительность и взаимодействие с C++ и JavaScript, а также получил поддержку WebAssembly. Контейнеризация для Mac теперь работает с Linux-образами благодаря изолированному опенсорсному фреймворку.
apple.com
Всего месяц просуществовал экспериментальный блог "Claude Explains", где Claude писал технические статьи. Инициатива, по задумке, должна была объединить обучающий контент с маркетинговыми целями, при участии редакторов и экспертов, дорабатывавших черновики Claude.
Блог освещал темы от анализа данных до оптимизации кода. Однако уже через месяц пилот остановили, хотя планы были грандиозные. Пользователи соцсетей критиковали неясность: часть постов выглядела как автоматизированный маркетинг, а отсутствие меток об ИИ-генерации вызывало недоверие.
Согласно сервису Backlink Checker, за месяц существования блога, на его статьи сослались 24 сайта. Вероятно, Anthropic решили дистанцироваться из-за рисков, связанных с ошибками ИИ. Сейчас с адреса блога установлено перенаправление на главную страницу Anthropic.
techcrunch.com
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Magistral — первая модель рассуждений от Mistral AI. Она сочетает глубокую логическую обработку с возможностью отслеживать каждый шаг её «мышления».
Модель получила поддержку 8 языков, включая русский и выпущена в 2 вариантах:
Внутри Magistral работает в режиме рассуждений, разбивая задачи на цепочки логических шагов, а Flash Answers ускоряет вывод в 10 раз по сравнению с конкурентами. Для интеграции в рабочие процессы модель умеет взаимодействовать с внешними инструментами (API или базами данных).
В тестах Magistral Medium показал 73,6% точности на задачах AIME2024, демонстрируя силу в физических симуляциях и математических расчетах.
Для разработчиков доступны версии на Hugging Face, AWS и IBM WatsonX, а в будущем — на Azure и Google Cloud. Демо Magistral доступно в интерфейсе Le Chat или по API в La Plateforme.
@ai_machinelearning_big_data
#AI #ML #LLM #Magistral #MistralAI
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
OpenAI договорилась с Google Cloud о поставках вычислительных ресурсов для тренировки и запуска своих моделей - неожиданный шаг для конкурентов в сфере ИИ. Ранее OpenAI зависела от Microsoft Azure, но теперь диверсифицирует поставщиков, заключив сделки с Oracle и SoftBank на $500 млрд для проекта Stargate.
Google предоставит доступ к собственным чипам TPU, которые ранее использовались только внутри компании. Это усиливает позиции Google Cloud, конкурирующего с Amazon и Microsoft за клиентов среди ИИ-стартапов. Внутренние проблемы с мощностями у Google и одновременная конкуренция через DeepMind создают сложные задачи для управления ресурсами в новом партнерстве.
reuters.com
IBM заявила о планах построить первый в истории крупномасштабный квантовый компьютер Quantum Starling до конца десятилетия. Он будет в 20 тысяч раз мощнее современных квантовых систем, используя новые методы исправления ошибок — коды qLDPC и реальное время коррекции с помощью классических вычислений.
Аналитики осторожны: коммерческая выгода пока неочевидна, а детали запуска систем туманны. Тем не менее, IBM подчеркивает, что ее дорожная карта самая прозрачная в индустрии, призывая разработчиков готовить алгоритмы для будущих машин.
wsj.com
Цукерберг анонсировал создание новой лаборатории по исследованию «суперинтеллекта» — гипотетической ИИ-системы, превосходящей возможности человеческого мозга. В рамках проекта, она договорилась о сотрудничестве с Алексом Ваном, основателем Scale AI, и планирует инвестировать в его компанию, одновременно переманивая ключевых специалистов.
Источники сообщают, что компания Марка Цукерберга предлагает исследователям из OpenAI, Google и других крупных компаний зарплаты от сотен тысяч до миллионов долларов. Это часть масштабной перестройки ИИ-направления, которое столкнулось с внутренними конфликтами, текучкой кадров и неудачными запусками продуктов.
nytimes.com
Qualcomm анонсировала процессор Snapdragon AR1+ Gen 1 для умных очков, способный запускать ИИ без подключения к облаку или смартфону. Это позволяет пользователям использовать функции голосового ассистента или отображения текста прямо на стеклах без дополнительных устройств. Чип на 28% компактнее предыдущей версии, что позволяет уменьшить размеры оправы на 20%.
Новинка поддерживает бинокулярное изображение, стабилизацию и обработку нескольких кадров одновременно. Главная фишка - NPU третьего поколения, способный запускать небольшие модели локально.
engadget.com
Традиционный подход к очистке данных перед обучением LLM оказался не самым эффективным. Ученые выяснили, что добавление небольшого количества провокационного контента из 4chan (до 10%) улучшает «детоксикацию» моделей на поздних этапах. Модель Olmo-1B, обученная на смеси токсичных постов и чистого датасета C4, показала, что ядовитые идеи в модели становятся четче, а значит — их проще подавлять.
Методы вроде коррекции при генерации текста работают точнее, если модель «видела» токсичность заранее. Однако переизбыток 4chan-данных сводит эффект к нулю: модель становится агрессивной и сложной для контроля.
Исследователи предполагают, что аналогичный подход применим к другим «чувствительным» темам — от стереотипов до политики.
arxiv.org
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🎥 Веса и инференс для SeedVR2 — многообещающей модели для восстановления видео.
🛠️ Что это?
SeedVR2 — одношаговая диффузионная модель для восстановления видео, которая проходит пост-тренировку в противоборстве с реальными данными.
Она показывает отличные результаты даже на высоком разрешении.
🔍 Зачем нужна SeedVR2?
Обычные модели плохо справляются с AIGC и реальными видео — особенно в мелких деталях вроде текста и лиц.
Даже продвинутые диффузионные методы, использующие ControlNet или адаптеры, работают только на фиксированном разрешении (512, 1024) и требуют нарезки видео на перекрывающиеся патчи. Это:
• сильно замедляет работу
• усложняет обработку длинных и больших видео
🚀 Что нового в SeedVR2:
• Восстановление на любом разрешении без заранее обученного диффузионного приоритета
• Архитектура с крупным диффузионным трансформером, обученным с нуля
▪Github: https://github.com/ByteDance-Seed/SeedVR
x
▪ Веса: https://huggingface.co/ByteDance-Seed/SeedVR-Models
@ai_machinelearning_big_data
#news #ai #ml #ByteDance #video
🛠️ Что это?
SeedVR2 — одношаговая диффузионная модель для восстановления видео, которая проходит пост-тренировку в противоборстве с реальными данными.
Она показывает отличные результаты даже на высоком разрешении.
🔍 Зачем нужна SeedVR2?
Обычные модели плохо справляются с AIGC и реальными видео — особенно в мелких деталях вроде текста и лиц.
Даже продвинутые диффузионные методы, использующие ControlNet или адаптеры, работают только на фиксированном разрешении (512, 1024) и требуют нарезки видео на перекрывающиеся патчи. Это:
• сильно замедляет работу
• усложняет обработку длинных и больших видео
🚀 Что нового в SeedVR2:
• Восстановление на любом разрешении без заранее обученного диффузионного приоритета
• Архитектура с крупным диффузионным трансформером, обученным с нуля
▪Github: https://github.com/ByteDance-Seed/SeedVR
x
▪ Веса: https://huggingface.co/ByteDance-Seed/SeedVR-Models
@ai_machinelearning_big_data
#news #ai #ml #ByteDance #video
🔥 Опубликован 65-й выпуск рейтинга TOP500 — списка самых мощных суперкомпьютеров мира
💡 Тройка лидеров осталась неизменной:
• El Capitan (США, Ливерморская нац. лаборатория):
11 млн CPU ядер (AMD EPYC + GPU AMD MI300X),
1.742 экзафлопса, ОС HPE Cray OS (SUSE Linux).
• Frontier (США, Ок-Ридж):
9 млн CPU (AMD EPYC + MI250X),
1.353 экзафлопса, ОС HPE Cray OS.
• Aurora (США, Аргонн):
9.2 млн CPU (Intel Xeon Max + GPU Max),
1.012 экзафлопса, ОС SUSE Linux Enterprise Server 15 SP4.
🔹 На 4-е место вышел JUPITER Booster (Германия):
4.8 млн ядер (NVIDIA GH200), 793 петафлопса, ОС RHEL.
🔟 **Кластеры 5–10 мест:**
- Eagle (Microsoft Azure, США): 561 петафлопс
- HPC6 (ЭНИ, Италия): 477 петафлопс
- Fugaku (Япония): 442 петафлопса
- Alps (Швейцария): 434 петафлопса
- LUMI (Финляндия): 379 петафлопс
- Leonardo (CINECA, Италия): 241 петафлопс
🇷🇺 Российские суперкомпьютеры:
- Червоненкис (Яндекс): 75 место, 21.5 петафлопса
- Галушкин (Яндекс): 102 место, 16 петафлопс
- Ляпунов (Яндекс): 120 место, 12.8 петафлопса
- Christofari Neo (Сбер): 125 место, 11.95 петафлопса
- Christofari (Сбер): 201 место
- Lomonosov 2: 495 место (в 2015 году был на 31 месте)
🌍 Страны по количеству систем:
- США: 175 кластеров (48.4% производительности)
- Китай: 47 кластеров (2%)
- Германия: 41 (8.6%)
- Япония: 39 (8.9%)
- Франция: 25 (2.4%)
- Италия: 17 (6.3%)
- Россия: 6 (0.1%)
🧠 Тренды:
- Все 500 систем используют Linux.
- Дистрибутивы: неизвестно (38.2%), RHEL (20%), Ubuntu (11.8%), Cray Linux (9.8%), CentOS (8.2%), Rocky (5.8%), SUSE (4.2%), Alma (1.6%)
- Минимальный порог входа в рейтинг: 2.44 петафлопса.
- Общее число процессорных ядер: 137.6 млн.
- С ускорителями работают 234 кластера (в основном NVIDIA A100).
🔧 Лидеры среди производителей:
- Lenovo (27.2%)
- HPE (26.4%)
- EVIDEN (11%)
- Dell EMC (8.2%)
- NVIDIA (5.4%)
🌐 Сети:
- InfiniBand — 54.2% (40.3% производительности)
- Ethernet — 32.8% (52.2%)
- Omni-Path — 6.6%
📊 Также обновлён рейтинг Graph500 (оценка задач с графами)
и интегрированы рейтинги Green500, HPCG и HPL-AI.
🔥 За 10 лет производительность Top500 выросла с 0.31 до 13.8 экзафлопсов. Для входа в Top100 теперь нужно минимум 16.59 петафлопса.
📌 Подробнее
@ai_machinelearning_big_data
#news #ai #ml
💡 Тройка лидеров осталась неизменной:
• El Capitan (США, Ливерморская нац. лаборатория):
11 млн CPU ядер (AMD EPYC + GPU AMD MI300X),
1.742 экзафлопса, ОС HPE Cray OS (SUSE Linux).
• Frontier (США, Ок-Ридж):
9 млн CPU (AMD EPYC + MI250X),
1.353 экзафлопса, ОС HPE Cray OS.
• Aurora (США, Аргонн):
9.2 млн CPU (Intel Xeon Max + GPU Max),
1.012 экзафлопса, ОС SUSE Linux Enterprise Server 15 SP4.
🔹 На 4-е место вышел JUPITER Booster (Германия):
4.8 млн ядер (NVIDIA GH200), 793 петафлопса, ОС RHEL.
🔟 **Кластеры 5–10 мест:**
- Eagle (Microsoft Azure, США): 561 петафлопс
- HPC6 (ЭНИ, Италия): 477 петафлопс
- Fugaku (Япония): 442 петафлопса
- Alps (Швейцария): 434 петафлопса
- LUMI (Финляндия): 379 петафлопс
- Leonardo (CINECA, Италия): 241 петафлопс
🇷🇺 Российские суперкомпьютеры:
- Червоненкис (Яндекс): 75 место, 21.5 петафлопса
- Галушкин (Яндекс): 102 место, 16 петафлопс
- Ляпунов (Яндекс): 120 место, 12.8 петафлопса
- Christofari Neo (Сбер): 125 место, 11.95 петафлопса
- Christofari (Сбер): 201 место
- Lomonosov 2: 495 место (в 2015 году был на 31 месте)
🌍 Страны по количеству систем:
- США: 175 кластеров (48.4% производительности)
- Китай: 47 кластеров (2%)
- Германия: 41 (8.6%)
- Япония: 39 (8.9%)
- Франция: 25 (2.4%)
- Италия: 17 (6.3%)
- Россия: 6 (0.1%)
🧠 Тренды:
- Все 500 систем используют Linux.
- Дистрибутивы: неизвестно (38.2%), RHEL (20%), Ubuntu (11.8%), Cray Linux (9.8%), CentOS (8.2%), Rocky (5.8%), SUSE (4.2%), Alma (1.6%)
- Минимальный порог входа в рейтинг: 2.44 петафлопса.
- Общее число процессорных ядер: 137.6 млн.
- С ускорителями работают 234 кластера (в основном NVIDIA A100).
🔧 Лидеры среди производителей:
- Lenovo (27.2%)
- HPE (26.4%)
- EVIDEN (11%)
- Dell EMC (8.2%)
- NVIDIA (5.4%)
🌐 Сети:
- InfiniBand — 54.2% (40.3% производительности)
- Ethernet — 32.8% (52.2%)
- Omni-Path — 6.6%
📊 Также обновлён рейтинг Graph500 (оценка задач с графами)
и интегрированы рейтинги Green500, HPCG и HPL-AI.
🔥 За 10 лет производительность Top500 выросла с 0.31 до 13.8 экзафлопсов. Для входа в Top100 теперь нужно минимум 16.59 петафлопса.
📌 Подробнее
@ai_machinelearning_big_data
#news #ai #ml
Media is too big
VIEW IN TELEGRAM
🔥 Manus Chat Mode — чат с ИИ бесплатно и без ограничений для всех!
💬 Работает супер быстро.
🚀 Так же доступен Agent Mode с расширенными возможностями.
От простых вопросов до сложных задач — всё в одном окне : https://manus.im/
@ai_machinelearning_big_data
#news #ai #ml #manus
💬 Работает супер быстро.
🚀 Так же доступен Agent Mode с расширенными возможностями.
От простых вопросов до сложных задач — всё в одном окне : https://manus.im/
@ai_machinelearning_big_data
#news #ai #ml #manus
Media is too big
VIEW IN TELEGRAM
Новые графические процессоры серии Rubin R100 и процессоры Vera, вероятно, дебютируют в сентябре. Это стало возможным благодаря ускорению графика разработки — теперь обновления выходят каждые 6 месяцев вместо традиционных 12.
Rubin R100 будет использовать память HBM4, литографию TSMC 3 нм и упаковку CoWoS-L, а также впервые внедрит чиплет-дизайн с 4-кратным увеличением площади кристалла. . Вместе с этим линейка Vera сменит ARM-процессоры Grace и будет основан на новом поколении ядер ARM, обещая значительный прирост производительности. Смена графика разработки несет в себе риски: рынок может не успеть адаптироваться, а первые партии часто сталкиваются с проблемами, как это было с Blackwell.
ctee.com.tw
Google Cloud анонсировал превью новых виртуальных машин G4 на базе GPU NVIDIA RTX PRO 6000 Blackwell, став первым публичным облаком, внедрившим эту технологию. Каждый экземпляр объединяет 8 GPU, два процессора AMD Turin с 384 виртуальными ядрами и 1,5 ТБ памяти DDR5, а также сетевые ускорители Titanium с пропускной способностью до 400 Гб/с. Все это дает в 4 раза большую вычислительную мощность и увеличенную в 6 раз пропускную способность памяти по сравнению с предыдущим поколением.
G4 подходит для задач от ИИ-инференса до рендеринга и симуляций с физически точными расчетами. RT-ядра ускоряют трассировку лучей для реалистичной графики, а фреймворк NVIDIA Dynamo оптимизирует обработку генеративных моделей.
Экземпляры будут доступны в составе системы AI Hypercomputer и получат интеграцию с сервисами Google Cloud. Доступность новых VM - ближе к концу года.
cloud.google.com
OpenAI откладывает релиз открытой языковой модели до конца этого лета, сообщил генеральный директор Сэм Альтман в X. Первоначально модель планировалось выпустить до конца июня и она, по обещаниям, должна быть с ризонингом.
Альтман сказал, что исследовательская группа достигла неожиданного прогресса, который теперь требует больше времени, назвав результат "стоящим ожидания".
Sam Altman в сети X
Компании подали совместный иск против разработчика ИИ-генератора Midjourney, обвиняя его в нелегальном создании изображений персонажей Дарта Вейдера и Миньонов. Судебный иск был зарегистрирован в федеральном суде Калифорнии, где стороны заявили, что Midjourney продолжал использовать защищенные авторским правом материалы даже после предыдущих требований остановить это.
Студии требуют компенсации убытков, запрета на дальнейшее использование образов и проведения судебного разбирательства с присяжными. Midjourney пока не ответила на запрос публично.
wsj.com
ChatGPT 4o потерпел неожиданное поражение от шахматной игры 1979 года для консоли Atari 2600 — даже на уровне «начинающий». Инженер Robert Caruso протестировал систему через эмулятор, удивившись, как ChatGPT повторял грубые ошибки: забывал где находятся фигуры и путал их, обвинял слишком абстрактные иконки Atari и пропускал элементарные угрозы.
Программа Atari, работавшая на процессоре 1.19 МГц и анализировавшая лишь 1-2 хода вперед, обыграла нейросеть без шансов на победу. Хотя Роберт менял оформление фигур, пытаясь облегчить задачу, ChatGPT продолжал «тупить», давал обещания выиграть в следующей партии, но в итоге сдался.
tomshardware.com
V-JEPA 2 — новая версия модели Joint Embedding Predictive Architecture, обученной на видео.
Она задаёт новый стандарт в визуальном понимании, предсказании и планировании действий в физическом мире.
Github
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
По аналогии с автосалонами, робототехнический 4S будет предлагать полный цикл: продажи (Sales), сервис (Service), запчасти (Spare parts) и консультации/анализ (Surveys). Планируется зона с демонстрацией роботов в реалистичных сценариях – можно будет всё пощупать руками и увидеть их возможности в деле. Плюс создадут быструю сеть поставки комплектующих по стране и соберут профильную команду для сборки, ремонта и обслуживания машин.
Первыми партнерами станут несколько лидеров сферы: UBTECH и Galaxea. Откроется центр в августе на базе промпарка в районе Ичжуан на юге столицы.
english.news.cn
The Browser Company открыл доступ к бета-версии браузера Dia (по инвайтам). Dia позиционируется как решение, где ИИ глубоко интегрирован в самую суть взаимодействия, он встроен прямо в рабочий процесс пользователя, избавляя от необходимости постоянно ходить на сайты ChatGPT или Claude.
Dia построен на Chromium, так что интерфейс многим знаком. Главная фича — умная адресная строка: она работает и как поиск, и как чат-бот с ИИ. Помощник умеет искать в сети, суммировать загруженные файлы, автоматически переключаться между режимами. Можно даже спросить его о содержимом всех открытых вкладок или попросить составить черновик на их основе.
Настройки производятся через диалог с ботом: можно задать тон, стиль письма, параметры для кода. Опция History (по желанию) позволяет браузеру использовать недельную историю просмотров как контекст для ответов. А функция Skills помогает создавать мини-скрипты — ярлыки для сложных настроек или действий.
techcrunch.com
Mistral AI анонсировала Mistral Compute - инфраструктурную платформу для разработки и запуска ИИ. Это полноценный приватный стек: от GPU и систем оркестрации до API и сервисов. На выбор любой формат, от bare-metal до полностью управляемой PaaS.
Mistral Compute нацелен дать государствам, компаниям и научным центрам, ищущих альтернативу решениям из США или Китая, возможность самим строить ИИ-среду под свои нужды и полностью ею владеть.
Платформа использует новейшие архитектуры NVIDIA, с доступом к десяткам тысяч GPU. Она создана командой с огромным опытом в HPC и обучении топовых ИИ-моделей. Ключевые акценты: устойчивость и суверенитет данных, инфраструктура соответствует строгим европейским нормам и работает на декарбонизированной энергии.
mistral.ai
Seedance 1.0 - новая генеративная модель для создания видео, которая, по утверждениям ByteDance, превосходит конкурентов в точности выполнения запросов, качестве движений и резкости изображения. В тестах на Artificial Analysis она лидирует в задачах text-to-video и image-to-video, обходя Google Veo 3, Kuaishou Kling 2.0 и OpenAI Sora. Модель справляется с длинными сценами, сохраняя стабильность персонажей и переходов между ракурсами, но пока не поддерживает добавление звука.
Seedance 1.0 генерирует 5-секундный Full HD-ролик за 41 секунду — это быстрее аналогов, хотя новый Google Veo 3 Fast может нивелировать это преимущество. Инструмент планируют внедрить в платформы Doubao и Jimeng. Целевая аудитория — от профессиональных видеомейкеров до обычных пользователей.
seed.bytedance.com
Midjourney объявила о начале открытого тестирования модели генерации видео по текстовым запросам. Задача тестирования собрать обратную связь для улучшения алгоритма.
Создатели пригласили сообщество принять участие в онлайн-рейтинге сгенерированных роликов, присоединиться можно по ссылке. Пока некоторые образцы выглядят достойно и сохраняют фирменный стиль Midjourney, но в целом результаты пока нестабильны.
Компания подчеркивает: это не финальная версия модели, а лишь первый шаг. Дополнительные сессии тестирования уже запланированы, но дату релиза и цену пока не раскрывают.
midjourney.com
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM