🔥 DeepSeek представила модель математического мышления с само-верификацией
Компания DeepSeek выпустила DeepSeek-Math-V2 — модель, которая не просто решает математические задачи, но и самостоятельно проверяет корректность своих рассуждений, достигая уровня золотых медалистов Международной математической олимпиады.
🔍 Основная проблема
Традиционные ИИ в математике ориентированы только на правильный ответ, игнорируя качество логических рассуждений. DeepSeek меняет этот подход, фокусируясь на процессе, а не только на результате.
🎯 Трехкомпонентная система
• Верификатор ("учитель") — оценивает доказательства по шкале 0-1
• Мета-верификация ("надзиратель") — проверяет объективность оценок учителя
• Генератор ("ученик") — решает задачи и честно оценивает свои ошибки
💡 Ключевые инновации
• Система поощрения честности — модель получает награду за признание своих ошибок
• Автоматический цикл улучшения — "ученик" и "учитель" совместно эволюционируют
• Процессно-ориентированный подход вместо результат-ориентированного
📊 Результаты
• IMO 2025 и CMO 2024: уровень золотой медали
• Putnam 2024: 118/120 баллов
• IMO-ProofBench Basic: почти 99% точности
Технические детали
Модель основана на DeepSeek-V3.2-Exp-Base и использует методологию GRPO. Система автоматически генерирует сложные доказательства для обучения, создавая замкнутый цикл улучшения без человеческого вмешательства.
Вывод: DeepSeek открывает новое направление в ИИ — само-верифицируемое математическое мышление, где важнее процесс решения, чем конечный ответ.
Hugging Face | Статья
#КитайскийИИ #КитайAI #МатематическийИИ #DeepSeek
Компания DeepSeek выпустила DeepSeek-Math-V2 — модель, которая не просто решает математические задачи, но и самостоятельно проверяет корректность своих рассуждений, достигая уровня золотых медалистов Международной математической олимпиады.
🔍 Основная проблема
Традиционные ИИ в математике ориентированы только на правильный ответ, игнорируя качество логических рассуждений. DeepSeek меняет этот подход, фокусируясь на процессе, а не только на результате.
🎯 Трехкомпонентная система
• Верификатор ("учитель") — оценивает доказательства по шкале 0-1
• Мета-верификация ("надзиратель") — проверяет объективность оценок учителя
• Генератор ("ученик") — решает задачи и честно оценивает свои ошибки
💡 Ключевые инновации
• Система поощрения честности — модель получает награду за признание своих ошибок
• Автоматический цикл улучшения — "ученик" и "учитель" совместно эволюционируют
• Процессно-ориентированный подход вместо результат-ориентированного
📊 Результаты
• IMO 2025 и CMO 2024: уровень золотой медали
• Putnam 2024: 118/120 баллов
• IMO-ProofBench Basic: почти 99% точности
Технические детали
Модель основана на DeepSeek-V3.2-Exp-Base и использует методологию GRPO. Система автоматически генерирует сложные доказательства для обучения, создавая замкнутый цикл улучшения без человеческого вмешательства.
Вывод: DeepSeek открывает новое направление в ИИ — само-верифицируемое математическое мышление, где важнее процесс решения, чем конечный ответ.
Hugging Face | Статья
#КитайскийИИ #КитайAI #МатематическийИИ #DeepSeek
huggingface.co
deepseek-ai/DeepSeek-Math-V2 · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
😁2🔥1
Нейросеть «ГигаЧат» вместе с космическим кораблем «Союз МС-28» госкорпорации «Роскосмос» и международным экипажем отправилась на Международную космическую станцию (МКС), пишет Лента.
Космонавты Сергей Кудь-Сверчков, Сергей Микаев, а также астронавт Кристофер Уилльямс будут использовать специальный программный комплекс на основе «ГигаЧата» для ведения служебных и личных дневников. Ранее они фиксировали результаты исследований и наблюдений с помощью голосовых и текстовых заметок. Записи приходилось расшифровывать на Земле, что требовало значительных временных затрат и серьезной вовлеченности в рутинные задачи. Новый комплекс с искусственным интеллектом автоматически преобразовывает голосовые заметки в текст и дает инструменты для его дальнейшей обработки.
Космонавты Сергей Кудь-Сверчков, Сергей Микаев, а также астронавт Кристофер Уилльямс будут использовать специальный программный комплекс на основе «ГигаЧата» для ведения служебных и личных дневников. Ранее они фиксировали результаты исследований и наблюдений с помощью голосовых и текстовых заметок. Записи приходилось расшифровывать на Земле, что требовало значительных временных затрат и серьезной вовлеченности в рутинные задачи. Новый комплекс с искусственным интеллектом автоматически преобразовывает голосовые заметки в текст и дает инструменты для его дальнейшей обработки.
«Совместный эксперимент Сбера и "Роскосмоса" — первый в истории космонавтики, и мы с нетерпением ждем его результатов. С новым инструментом российские космонавты смогут выполнять работу эффективнее, экономя главный ресурс — время», — подчеркнул президент, председатель правления Сбербанка Герман Греф.
Lenta.RU
«ГигаЧат» отправился на МКС
Нейросеть «ГигаЧат» вместе с космическим кораблем «Союз МС-28» госкорпорации «Роскосмос» и международным экипажем отправилась на Международную космическую станцию (МКС).
👍2
Аналитик/менеджер исследовательских процессов
📍 Москва, Институт синтетической биологии и генной инженерии «ЦСП» ФМБА России
Обязанности:
🔜 Поиск, анализ и оценка актуальных мировых исследований, технологий и патентов в областях биомедицины, биоинформатики, генетики и смежных дисциплин, с особым фокусом на генную инженерию, фармацевтику или вирусологию.
🔜 Подготовка проектной документации (планы, аналитические записки, презентации) для руководства и партнеров.
🔜 Координация и управление междисциплинарными исследовательскими проектами на всех этапах, обеспечение их эффективного выполнения в срок.
🔜 Анализ прогресса и научно-практических результатов текущих исследовательских проектов Института, подготовка отчетности.
🔜 Подготовка аналитических отчетов, научных обзоров и дайджестов с выводами и рекомендациями для научного руководства.
🔜 Участие в оценке научной и коммерческой перспективности полученных результатов.
Требования:
🔜 Высшее образование в области биологии, биоинженерии, биоинформатики, молекулярной генетики или смежных наук. Наличие ученой степени будет существенным преимуществом.
🔜 Широкий научный кругозор и глубокое понимание современных тенденций в биомедицине и генетике.
🔜 Опытом научно-исследовательской работы в близких нам научных областях.
🔜 Отличными аналитическими способностями и навыками работы с большими объемами научной информации.
🔜 Высоким уровнем письменной коммуникации: умение ясно, структурированно и грамотно излагать сложную информацию в виде проектных планов, аналитических записок, научных обзоров и презентаций. Внимание к деталям обязательно.
🔜 Навыки анализа данных (статистика, работа с биологическими базами данных) – важное преимущество.
🔜 Навыки управления проектами и координации команд (приветствуется).
Условия:
🔜 Зарплата 200.000р, зависит от квалификации и стажа работы.
🔜 Работа в передовом научном центре на острие современных биотехнологий.
🔜 Участие в значимых проектах с реальным потенциалом влияния на медицину и жизнь людей.
🔜 Возможность работать в динамичной междисциплинарной среде с ведущими учеными.
🔜 Профессиональное развитие и научный рост.
🔜 Конкурентные условия труда, официальное оформление, зарплата не привязана к грантам.
🔜 Офисный формат работы, Институт располагается на м. Щукинская.
🔜 Гибридный формат можно обсуждать после окончания испытательного срока.
Обязанности:
Требования:
Условия:
Please open Telegram to view this post
VIEW IN TELEGRAM
Периодически буду постить всякие вакансии, может кому приглянется. В основном всякие интересные, не простой аналитик или дс, а что-то не обычное. Благо, сейчас работы и напралвений много разных, по всем регионам.
👍2
Samsung решила изменить правила игры на рынке чипов и убедить Nvidia повысить официальную скорость HBM4, даже несмотря на то, что конкуренты: SK Hynix и Micron - раньше показали первые образцы.
Обычно разработчики HBM (High Bandwidth Memory) делают акцент на контроле температуры, ведь многослойная DRAM быстро нагревается. Но теперь Nvidia потребовала большего - выше частоты, выше скорость.
Для Hynix и Micron это стало неожиданностью: их решения оптимизированы под стабильность, а не под разгон.
А вот Samsung оказалась готова. Её HBM4-чипы уже достигли более высоких частот на тестах - благодаря технологическому преимуществу:
- DRAM-чипы производятся по 1c-процессу (6-е поколение 10 нм),
- базовый логический кристалл - на 4-нм техпроцессе Samsung Foundry.
Для сравнения:
- SK Hynix использует 12-нм процесс TSMC,
- Micron - старый DRAM-процесс.
Более продвинутая литография даёт Samsung лучший контроль над энергопотреблением и сигналами.
Компания уже ускоряет производство и планирует вывести HBM4 на рынок в 2026 году, когда спрос на память для AI-систем резко превысит предложение.
Такой шаг может вернуть Samsung утраченные позиции после неудачи с HBM3E.
Ключевой момент - тесты Nvidia Rubin. Если HBM4 покажет проблемы с нагревом или надёжностью при интеграции, вся стратегия может рухнуть.
Но если всё пройдёт успешно, Samsung сможет опередить Hynix и Micron, снова захватив лидерство в памяти для AI-ускорителей.
Итог: Samsung делает ставку на скорость, технологии и масштаб. Это рискованный, но стратегический шаг, который может определить баланс сил на рынке AI-чипов в ближайшие годы.
Please open Telegram to view this post
VIEW IN TELEGRAM
X (formerly Twitter)
Jukan (@jukan05) on X
A very interesting article has come out regarding NVIDIA’s request for higher HBM4 speeds.
Below is the full translation:
“NVIDIA’s decision to raise the operating speed standard for sixth-generation high-bandwidth memory (HBM4) was the result of Samsung…
Below is the full translation:
“NVIDIA’s decision to raise the operating speed standard for sixth-generation high-bandwidth memory (HBM4) was the result of Samsung…
👍1
В сети открыли полный доступ в opensource к линейке ИИ-моделей GigaChat
Сбер опубликовал весь стек моделей с лицензией MIT и разрешением на коммерческое использование.
Флагман — GigaChat 3 Ultra-Preview — 702B-MoE модель, полностью обученную с нуля на корпусе в 14 триллионов токенов. Это не адаптация и не дообучение зарубежных весов: у модели собственный датасет, собственный пайплайн синтетики и переработанная архитектура. На русскоязычных и STEM-бенчмарках Ultra-Preview уверенно превосходит российские opensource-аналоги, а также лучше DeepSeek V3.1.
Контекст запоминания — до 128k токенов.
Также в opensource доступна версия Lightning — компактная 10B-MoE модель, которая по скорости инференса конкурирует с Qwen3-1.7B и приближается по качеству к dense-моделям около 8B. Открыта и GigaAM-v3 — набор из пяти моделей для работы с аудио на русском. Отлично распознает речь — показывает −50% WER к Whisper-large-v3.
Открытая линейка GigaChat фактически формирует новую открытую экосистему для разработки, генерации и автоматизации — и делает это именно как самостоятельная архитектура, а не продолжение чьих-то решений.
https://habr.com/ru/companies/sberdevices/articles/968904/
Сбер опубликовал весь стек моделей с лицензией MIT и разрешением на коммерческое использование.
Флагман — GigaChat 3 Ultra-Preview — 702B-MoE модель, полностью обученную с нуля на корпусе в 14 триллионов токенов. Это не адаптация и не дообучение зарубежных весов: у модели собственный датасет, собственный пайплайн синтетики и переработанная архитектура. На русскоязычных и STEM-бенчмарках Ultra-Preview уверенно превосходит российские opensource-аналоги, а также лучше DeepSeek V3.1.
Контекст запоминания — до 128k токенов.
Также в opensource доступна версия Lightning — компактная 10B-MoE модель, которая по скорости инференса конкурирует с Qwen3-1.7B и приближается по качеству к dense-моделям около 8B. Открыта и GigaAM-v3 — набор из пяти моделей для работы с аудио на русском. Отлично распознает речь — показывает −50% WER к Whisper-large-v3.
Открытая линейка GigaChat фактически формирует новую открытую экосистему для разработки, генерации и автоматизации — и делает это именно как самостоятельная архитектура, а не продолжение чьих-то решений.
https://habr.com/ru/companies/sberdevices/articles/968904/
Хабр
GigaChat 3 Ultra Preview — тяжёлый open source
Салют, Хабр! Последний год выдался насыщенным: выпуск линейки GigaChat 2, которая может вас слышать, смотреть видео и даже понимать мемы; добавление функции Reasoning в наш Web ( giga.chat ); первое...
Компания Yandex B2B Tech обновила своего ИИ‑помощника «Нейроаналитик»
Этот инструмент помогает бизнесу разбираться в больших объёмах данных: он быстро анализирует информацию и наглядно её отображает, пишет Cnews.
Этот инструмент помогает бизнесу разбираться в больших объёмах данных: он быстро анализирует информацию и наглядно её отображает, пишет Cnews.
CNews.ru
Yandex B2B Tech обновила «Нейроаналитика». В нем появился режим для аналитики большого объема данных - CNews
Yandex B2B Tech представила обновленного «Нейроаналитика» – ИИ-помощника, который помогает находить инсайты в данных...
😁Сегодня я буду весел, беспечен, бесконечно ленив и невероятно красив ибо 29.11 мой День Рождения. 🎉 🎉 🎉
Please open Telegram to view this post
VIEW IN TELEGRAM
🎉24
Други, поздравляшки можно направлять в нашу группу. Там есть темы. Телега не поддерживает одновременно темы в группе и привязку к каналу.
https://t.me/DenoiseLABQuestions
https://t.me/DenoiseLABQuestions
Please open Telegram to view this post
VIEW IN TELEGRAM
arXiv.org
Rapid Response: Mitigating LLM Jailbreaks with a Few Examples
As large language models (LLMs) grow more powerful, ensuring their safety against misuse becomes crucial. While researchers have focused on developing robust defenses, no method has yet achieved...
🚀 Релиз DeepSeek-V3.2 и DeepSeek-V3.2-Speciale - модели нового поколения, созданные в первую очередь для reasoning и работы в агентных системах.
Что нового:
- DeepSeek-V3.2 - официальный преемник V3.2-Exp. Доступна в приложении, на сайте и через API.
- DeepSeek-V3.2-Speciale - улучшенная версия с акцентом на продвинутое многошаговое рассуждение. Пока что работает только через API.
Обе модели делают упор на глубокие цепочки рассуждений и поведение, нацеленное на агентные сценарии: планирование, решение задач, сложные выводы и работу со структурированными данными.
🏆 Производительность
• V3.2 - баланс скорости и качества, уровень примерно GPT-5
• V3.2-Speciale - топовый reasoning, конкурирует с Gemini-3.0-Pro.
• Speciale - лидер на IMO, CMO, ICPC.
🤖 Новый подход к обучению агентов
• Синтезированы большие тренировочные данные для 1800+ сред и 85k сложных инструкций.
• V3.2 - первая модель DeepSeek, у которой мышление встроено прямо в tool-use.
💻 API
• V3.2 использует тот же интерфейс, что V3.2-Exp.
• Speciale доступна через временный endpoint, работать будет до 15 декабря 2025.
📦 DeepSeek-V3.2 Model: https://huggingface.co/deepseek-ai/DeepSeek-V3.2
📦 DeepSeek-V3.2-Speciale Model: https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Speciale
📄 Tech report: https://huggingface.co/deepseek-ai/DeepSeek-V3.2/resolve/main/assets/paper.pdf
#deepseek, #deepseekv3, #ai, #нейросети
Что нового:
- DeepSeek-V3.2 - официальный преемник V3.2-Exp. Доступна в приложении, на сайте и через API.
- DeepSeek-V3.2-Speciale - улучшенная версия с акцентом на продвинутое многошаговое рассуждение. Пока что работает только через API.
Обе модели делают упор на глубокие цепочки рассуждений и поведение, нацеленное на агентные сценарии: планирование, решение задач, сложные выводы и работу со структурированными данными.
🏆 Производительность
• V3.2 - баланс скорости и качества, уровень примерно GPT-5
• V3.2-Speciale - топовый reasoning, конкурирует с Gemini-3.0-Pro.
• Speciale - лидер на IMO, CMO, ICPC.
🤖 Новый подход к обучению агентов
• Синтезированы большие тренировочные данные для 1800+ сред и 85k сложных инструкций.
• V3.2 - первая модель DeepSeek, у которой мышление встроено прямо в tool-use.
💻 API
• V3.2 использует тот же интерфейс, что V3.2-Exp.
• Speciale доступна через временный endpoint, работать будет до 15 декабря 2025.
📦 DeepSeek-V3.2 Model: https://huggingface.co/deepseek-ai/DeepSeek-V3.2
📦 DeepSeek-V3.2-Speciale Model: https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Speciale
📄 Tech report: https://huggingface.co/deepseek-ai/DeepSeek-V3.2/resolve/main/assets/paper.pdf
#deepseek, #deepseekv3, #ai, #нейросети
huggingface.co
deepseek-ai/DeepSeek-V3.2 · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
💡 UniVA: Universal Video Agent towards Open-Source Next-Generation Video Generalist
Hf: https://huggingface.co/papers/2511.08521
Paper: https://arxiv.org/pdf/2511.08521
Github: https://github.com/univa-agent/univa
Hf: https://huggingface.co/papers/2511.08521
Paper: https://arxiv.org/pdf/2511.08521
Github: https://github.com/univa-agent/univa
huggingface.co
Paper page - UniVA: Universal Video Agent towards Open-Source Next-Generation Video Generalist
Join the discussion on this paper page
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤2🤔2
Интересный пост в Сиолошной, про то как AI модели могут находить и эксплуатировать уязвимости в смарт-контрактах уже сейчас
оригинал статьи на английском от Антропик
В статье указаны две уязвимости в коде:
- в первом случае в контракте все пользователи имели доступ к функции калькулятора, меняющей storage переменные и модель смогла провести inflation attack, про которые я писал
- во втором случае в контракте, выпускающем токены в один клик, можно было задеплоить токен без указания адреса для приема комиссий. Зато его можно было добавить позже
Круто, что атакующие скрипты в исходной статье тоже показаны
https://t.me/web3securityresearch
оригинал статьи на английском от Антропик
В статье указаны две уязвимости в коде:
- в первом случае в контракте все пользователи имели доступ к функции калькулятора, меняющей storage переменные и модель смогла провести inflation attack, про которые я писал
- во втором случае в контракте, выпускающем токены в один клик, можно было задеплоить токен без указания адреса для приема комиссий. Зато его можно было добавить позже
Круто, что атакующие скрипты в исходной статье тоже показаны
https://t.me/web3securityresearch
Telegram
Сиолошная
AI agents find $4.6M in blockchain smart contract exploits
LLM всё лучше справляются с задачами в сфере кибербезопасности, о чём я уже писал ранее (вот про релиз Google, вот про CTF, вот Cybench). Но каковы экономические последствия этих возможностей? В…
LLM всё лучше справляются с задачами в сфере кибербезопасности, о чём я уже писал ранее (вот про релиз Google, вот про CTF, вот Cybench). Но каковы экономические последствия этих возможностей? В…
DenoiseLAB
Photo
Собственно к чему это я. Это первая фото, надувного МиккиМауса. В его проектировании принимал участие Уолт Дисней. Тут моя студентка делала анализ компании Уолта Диснея и накапала интересную штуку. Оказывается компания приносила прибыль только первые два года своего существования. Остальное же время она была убыточной и только в 2016 году наметился какой-то тренд на прибыль, который держится до сих пор, но крайне мал. Вот такие вот делишки )))
🤨3🤔1
Китайский разработчик искусственного интеллекта DeepSeek выпустил две новые модели: DeepSeek-V3.2 и более продвинутую версию DeepSeek-V3.2-Speciale.
В опубликованном релизе разработчики отмечают два ключевых технологических достижения. Во-первых, новую методику обучения, сочетающая надежные протоколы с масштабными вычислениями. Во-вторых, усовершенствованный механизм внимания, который позволяет эффективно обрабатывать большие объемы текста, не теряя в качестве работы.
Компания позиционирует свои разработки как прямых конкурентов мировых лидеров. Согласно ее данным, модель DeepSeek-V3.2-Speciale превосходит по некоторым параметрам GPT-5 от OpenAI и соответствует по уровню рассуждений модели Gemini-3.0 Pro от Google.
В опубликованном релизе разработчики отмечают два ключевых технологических достижения. Во-первых, новую методику обучения, сочетающая надежные протоколы с масштабными вычислениями. Во-вторых, усовершенствованный механизм внимания, который позволяет эффективно обрабатывать большие объемы текста, не теряя в качестве работы.
Компания позиционирует свои разработки как прямых конкурентов мировых лидеров. Согласно ее данным, модель DeepSeek-V3.2-Speciale превосходит по некоторым параметрам GPT-5 от OpenAI и соответствует по уровню рассуждений модели Gemini-3.0 Pro от Google.
🔥1
В Москве прошёл первый студенческий хакатон для мессенджера МАХ. Студенты из разных вузов и городов представили более 50 сервисов — от цифровых кампусов и AI-помощников до платформ для социальных инициатив и мини-приложений для продуктивности.
В треке «Цифровизация» лучшим стал «Цифровой кампус» для объединения университетских сервисов от студентов Финансового университета. В социальном треке победил чат-бот команды СмолГУ для анализа состава продуктов по фото, а в направлении «Эффективность» студенты из ИТМО и ТюмГУ представили календарь для бронирования встреч с AI-помощником.
Финал хакатона прошёл в МГТУ им. Баумана. Лучшие из представленных решений получат поддержку для дальнейшего развития в контуре национального мессенджера.
В треке «Цифровизация» лучшим стал «Цифровой кампус» для объединения университетских сервисов от студентов Финансового университета. В социальном треке победил чат-бот команды СмолГУ для анализа состава продуктов по фото, а в направлении «Эффективность» студенты из ИТМО и ТюмГУ представили календарь для бронирования встреч с AI-помощником.
Финал хакатона прошёл в МГТУ им. Баумана. Лучшие из представленных решений получат поддержку для дальнейшего развития в контуре национального мессенджера.
vesti.ru
В Москве подвели итоги хакатона по разработке сервисов для мессенджера MАХ - Новости на Вести.ru
Последние новости на сайте Вести: В Москве подвели итоги первого студенческого хакатона по разработке онлайн-сервисов для национального мессенджера MАХ. Своими эмоциями победители соревнований поделились в эфире телеканала "Россия 24". Актуальные события…
Глава OpenAI Сэм Альтман сообщил сотрудникам, что объявляет «Код "Красный"» и призывает бросить все силы на улучшение функциональности чат-бота, пишет The Information со ссылкой на внутренние распоряжения. Гендиректор планирует временно отложить другие инициативы, в том числе запуск рекламы.
Альтман также предупреждал сотрудников, что Google может «создать временные экономические трудности» для компании, как сообщало The Information 22 ноября 2025 года. Это произошло на фоне выхода модели Gemini 3 Pro, которая обошла GPT-5.1 в собственном тесте OpenAI «Последний экзамен человечества».
По данным FT, аудитория чат-ботов общается с Gemini больше, чем с ChatGPT. Однако OpenAI пока сохраняет лидерство по числу пользователей — по данным Similarweb, аудитория сервисов компании, включая приложение Sora 2 и платформу для разработчиков, превышает 800 млн человек.
Альтман также предупреждал сотрудников, что Google может «создать временные экономические трудности» для компании, как сообщало The Information 22 ноября 2025 года. Это произошло на фоне выхода модели Gemini 3 Pro, которая обошла GPT-5.1 в собственном тесте OpenAI «Последний экзамен человечества».
По данным FT, аудитория чат-ботов общается с Gemini больше, чем с ChatGPT. Однако OpenAI пока сохраняет лидерство по числу пользователей — по данным Similarweb, аудитория сервисов компании, включая приложение Sora 2 и платформу для разработчиков, превышает 800 млн человек.