🔥 DeepSeek представила модель математического мышления с само-верификацией
Компания DeepSeek выпустила DeepSeek-Math-V2 — модель, которая не просто решает математические задачи, но и самостоятельно проверяет корректность своих рассуждений, достигая уровня золотых медалистов Международной математической олимпиады.
🔍 Основная проблема
Традиционные ИИ в математике ориентированы только на правильный ответ, игнорируя качество логических рассуждений. DeepSeek меняет этот подход, фокусируясь на процессе, а не только на результате.
🎯 Трехкомпонентная система
• Верификатор ("учитель") — оценивает доказательства по шкале 0-1
• Мета-верификация ("надзиратель") — проверяет объективность оценок учителя
• Генератор ("ученик") — решает задачи и честно оценивает свои ошибки
💡 Ключевые инновации
• Система поощрения честности — модель получает награду за признание своих ошибок
• Автоматический цикл улучшения — "ученик" и "учитель" совместно эволюционируют
• Процессно-ориентированный подход вместо результат-ориентированного
📊 Результаты
• IMO 2025 и CMO 2024: уровень золотой медали
• Putnam 2024: 118/120 баллов
• IMO-ProofBench Basic: почти 99% точности
Технические детали
Модель основана на DeepSeek-V3.2-Exp-Base и использует методологию GRPO. Система автоматически генерирует сложные доказательства для обучения, создавая замкнутый цикл улучшения без человеческого вмешательства.
Вывод: DeepSeek открывает новое направление в ИИ — само-верифицируемое математическое мышление, где важнее процесс решения, чем конечный ответ.
Hugging Face | Статья
#КитайскийИИ #КитайAI #МатематическийИИ #DeepSeek
Компания DeepSeek выпустила DeepSeek-Math-V2 — модель, которая не просто решает математические задачи, но и самостоятельно проверяет корректность своих рассуждений, достигая уровня золотых медалистов Международной математической олимпиады.
🔍 Основная проблема
Традиционные ИИ в математике ориентированы только на правильный ответ, игнорируя качество логических рассуждений. DeepSeek меняет этот подход, фокусируясь на процессе, а не только на результате.
🎯 Трехкомпонентная система
• Верификатор ("учитель") — оценивает доказательства по шкале 0-1
• Мета-верификация ("надзиратель") — проверяет объективность оценок учителя
• Генератор ("ученик") — решает задачи и честно оценивает свои ошибки
💡 Ключевые инновации
• Система поощрения честности — модель получает награду за признание своих ошибок
• Автоматический цикл улучшения — "ученик" и "учитель" совместно эволюционируют
• Процессно-ориентированный подход вместо результат-ориентированного
📊 Результаты
• IMO 2025 и CMO 2024: уровень золотой медали
• Putnam 2024: 118/120 баллов
• IMO-ProofBench Basic: почти 99% точности
Технические детали
Модель основана на DeepSeek-V3.2-Exp-Base и использует методологию GRPO. Система автоматически генерирует сложные доказательства для обучения, создавая замкнутый цикл улучшения без человеческого вмешательства.
Вывод: DeepSeek открывает новое направление в ИИ — само-верифицируемое математическое мышление, где важнее процесс решения, чем конечный ответ.
Hugging Face | Статья
#КитайскийИИ #КитайAI #МатематическийИИ #DeepSeek
huggingface.co
deepseek-ai/DeepSeek-Math-V2 · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
😁2🔥1
Нейросеть «ГигаЧат» вместе с космическим кораблем «Союз МС-28» госкорпорации «Роскосмос» и международным экипажем отправилась на Международную космическую станцию (МКС), пишет Лента.
Космонавты Сергей Кудь-Сверчков, Сергей Микаев, а также астронавт Кристофер Уилльямс будут использовать специальный программный комплекс на основе «ГигаЧата» для ведения служебных и личных дневников. Ранее они фиксировали результаты исследований и наблюдений с помощью голосовых и текстовых заметок. Записи приходилось расшифровывать на Земле, что требовало значительных временных затрат и серьезной вовлеченности в рутинные задачи. Новый комплекс с искусственным интеллектом автоматически преобразовывает голосовые заметки в текст и дает инструменты для его дальнейшей обработки.
Космонавты Сергей Кудь-Сверчков, Сергей Микаев, а также астронавт Кристофер Уилльямс будут использовать специальный программный комплекс на основе «ГигаЧата» для ведения служебных и личных дневников. Ранее они фиксировали результаты исследований и наблюдений с помощью голосовых и текстовых заметок. Записи приходилось расшифровывать на Земле, что требовало значительных временных затрат и серьезной вовлеченности в рутинные задачи. Новый комплекс с искусственным интеллектом автоматически преобразовывает голосовые заметки в текст и дает инструменты для его дальнейшей обработки.
«Совместный эксперимент Сбера и "Роскосмоса" — первый в истории космонавтики, и мы с нетерпением ждем его результатов. С новым инструментом российские космонавты смогут выполнять работу эффективнее, экономя главный ресурс — время», — подчеркнул президент, председатель правления Сбербанка Герман Греф.
Lenta.RU
«ГигаЧат» отправился на МКС
Нейросеть «ГигаЧат» вместе с космическим кораблем «Союз МС-28» госкорпорации «Роскосмос» и международным экипажем отправилась на Международную космическую станцию (МКС).
👍2
Аналитик/менеджер исследовательских процессов
📍 Москва, Институт синтетической биологии и генной инженерии «ЦСП» ФМБА России
Обязанности:
🔜 Поиск, анализ и оценка актуальных мировых исследований, технологий и патентов в областях биомедицины, биоинформатики, генетики и смежных дисциплин, с особым фокусом на генную инженерию, фармацевтику или вирусологию.
🔜 Подготовка проектной документации (планы, аналитические записки, презентации) для руководства и партнеров.
🔜 Координация и управление междисциплинарными исследовательскими проектами на всех этапах, обеспечение их эффективного выполнения в срок.
🔜 Анализ прогресса и научно-практических результатов текущих исследовательских проектов Института, подготовка отчетности.
🔜 Подготовка аналитических отчетов, научных обзоров и дайджестов с выводами и рекомендациями для научного руководства.
🔜 Участие в оценке научной и коммерческой перспективности полученных результатов.
Требования:
🔜 Высшее образование в области биологии, биоинженерии, биоинформатики, молекулярной генетики или смежных наук. Наличие ученой степени будет существенным преимуществом.
🔜 Широкий научный кругозор и глубокое понимание современных тенденций в биомедицине и генетике.
🔜 Опытом научно-исследовательской работы в близких нам научных областях.
🔜 Отличными аналитическими способностями и навыками работы с большими объемами научной информации.
🔜 Высоким уровнем письменной коммуникации: умение ясно, структурированно и грамотно излагать сложную информацию в виде проектных планов, аналитических записок, научных обзоров и презентаций. Внимание к деталям обязательно.
🔜 Навыки анализа данных (статистика, работа с биологическими базами данных) – важное преимущество.
🔜 Навыки управления проектами и координации команд (приветствуется).
Условия:
🔜 Зарплата 200.000р, зависит от квалификации и стажа работы.
🔜 Работа в передовом научном центре на острие современных биотехнологий.
🔜 Участие в значимых проектах с реальным потенциалом влияния на медицину и жизнь людей.
🔜 Возможность работать в динамичной междисциплинарной среде с ведущими учеными.
🔜 Профессиональное развитие и научный рост.
🔜 Конкурентные условия труда, официальное оформление, зарплата не привязана к грантам.
🔜 Офисный формат работы, Институт располагается на м. Щукинская.
🔜 Гибридный формат можно обсуждать после окончания испытательного срока.
Обязанности:
Требования:
Условия:
Please open Telegram to view this post
VIEW IN TELEGRAM
Периодически буду постить всякие вакансии, может кому приглянется. В основном всякие интересные, не простой аналитик или дс, а что-то не обычное. Благо, сейчас работы и напралвений много разных, по всем регионам.
👍2
Samsung решила изменить правила игры на рынке чипов и убедить Nvidia повысить официальную скорость HBM4, даже несмотря на то, что конкуренты: SK Hynix и Micron - раньше показали первые образцы.
Обычно разработчики HBM (High Bandwidth Memory) делают акцент на контроле температуры, ведь многослойная DRAM быстро нагревается. Но теперь Nvidia потребовала большего - выше частоты, выше скорость.
Для Hynix и Micron это стало неожиданностью: их решения оптимизированы под стабильность, а не под разгон.
А вот Samsung оказалась готова. Её HBM4-чипы уже достигли более высоких частот на тестах - благодаря технологическому преимуществу:
- DRAM-чипы производятся по 1c-процессу (6-е поколение 10 нм),
- базовый логический кристалл - на 4-нм техпроцессе Samsung Foundry.
Для сравнения:
- SK Hynix использует 12-нм процесс TSMC,
- Micron - старый DRAM-процесс.
Более продвинутая литография даёт Samsung лучший контроль над энергопотреблением и сигналами.
Компания уже ускоряет производство и планирует вывести HBM4 на рынок в 2026 году, когда спрос на память для AI-систем резко превысит предложение.
Такой шаг может вернуть Samsung утраченные позиции после неудачи с HBM3E.
Ключевой момент - тесты Nvidia Rubin. Если HBM4 покажет проблемы с нагревом или надёжностью при интеграции, вся стратегия может рухнуть.
Но если всё пройдёт успешно, Samsung сможет опередить Hynix и Micron, снова захватив лидерство в памяти для AI-ускорителей.
Итог: Samsung делает ставку на скорость, технологии и масштаб. Это рискованный, но стратегический шаг, который может определить баланс сил на рынке AI-чипов в ближайшие годы.
Please open Telegram to view this post
VIEW IN TELEGRAM
X (formerly Twitter)
Jukan (@jukan05) on X
A very interesting article has come out regarding NVIDIA’s request for higher HBM4 speeds.
Below is the full translation:
“NVIDIA’s decision to raise the operating speed standard for sixth-generation high-bandwidth memory (HBM4) was the result of Samsung…
Below is the full translation:
“NVIDIA’s decision to raise the operating speed standard for sixth-generation high-bandwidth memory (HBM4) was the result of Samsung…
👍1
В сети открыли полный доступ в opensource к линейке ИИ-моделей GigaChat
Сбер опубликовал весь стек моделей с лицензией MIT и разрешением на коммерческое использование.
Флагман — GigaChat 3 Ultra-Preview — 702B-MoE модель, полностью обученную с нуля на корпусе в 14 триллионов токенов. Это не адаптация и не дообучение зарубежных весов: у модели собственный датасет, собственный пайплайн синтетики и переработанная архитектура. На русскоязычных и STEM-бенчмарках Ultra-Preview уверенно превосходит российские opensource-аналоги, а также лучше DeepSeek V3.1.
Контекст запоминания — до 128k токенов.
Также в opensource доступна версия Lightning — компактная 10B-MoE модель, которая по скорости инференса конкурирует с Qwen3-1.7B и приближается по качеству к dense-моделям около 8B. Открыта и GigaAM-v3 — набор из пяти моделей для работы с аудио на русском. Отлично распознает речь — показывает −50% WER к Whisper-large-v3.
Открытая линейка GigaChat фактически формирует новую открытую экосистему для разработки, генерации и автоматизации — и делает это именно как самостоятельная архитектура, а не продолжение чьих-то решений.
https://habr.com/ru/companies/sberdevices/articles/968904/
Сбер опубликовал весь стек моделей с лицензией MIT и разрешением на коммерческое использование.
Флагман — GigaChat 3 Ultra-Preview — 702B-MoE модель, полностью обученную с нуля на корпусе в 14 триллионов токенов. Это не адаптация и не дообучение зарубежных весов: у модели собственный датасет, собственный пайплайн синтетики и переработанная архитектура. На русскоязычных и STEM-бенчмарках Ultra-Preview уверенно превосходит российские opensource-аналоги, а также лучше DeepSeek V3.1.
Контекст запоминания — до 128k токенов.
Также в opensource доступна версия Lightning — компактная 10B-MoE модель, которая по скорости инференса конкурирует с Qwen3-1.7B и приближается по качеству к dense-моделям около 8B. Открыта и GigaAM-v3 — набор из пяти моделей для работы с аудио на русском. Отлично распознает речь — показывает −50% WER к Whisper-large-v3.
Открытая линейка GigaChat фактически формирует новую открытую экосистему для разработки, генерации и автоматизации — и делает это именно как самостоятельная архитектура, а не продолжение чьих-то решений.
https://habr.com/ru/companies/sberdevices/articles/968904/
Хабр
GigaChat 3 Ultra Preview — тяжёлый open source
Салют, Хабр! Последний год выдался насыщенным: выпуск линейки GigaChat 2, которая может вас слышать, смотреть видео и даже понимать мемы; добавление функции Reasoning в наш Web ( giga.chat ); первое...
Компания Yandex B2B Tech обновила своего ИИ‑помощника «Нейроаналитик»
Этот инструмент помогает бизнесу разбираться в больших объёмах данных: он быстро анализирует информацию и наглядно её отображает, пишет Cnews.
Этот инструмент помогает бизнесу разбираться в больших объёмах данных: он быстро анализирует информацию и наглядно её отображает, пишет Cnews.
CNews.ru
Yandex B2B Tech обновила «Нейроаналитика». В нем появился режим для аналитики большого объема данных - CNews
Yandex B2B Tech представила обновленного «Нейроаналитика» – ИИ-помощника, который помогает находить инсайты в данных...
😁Сегодня я буду весел, беспечен, бесконечно ленив и невероятно красив ибо 29.11 мой День Рождения. 🎉 🎉 🎉
Please open Telegram to view this post
VIEW IN TELEGRAM
🎉24
Други, поздравляшки можно направлять в нашу группу. Там есть темы. Телега не поддерживает одновременно темы в группе и привязку к каналу.
https://t.me/DenoiseLABQuestions
https://t.me/DenoiseLABQuestions
Please open Telegram to view this post
VIEW IN TELEGRAM
arXiv.org
Rapid Response: Mitigating LLM Jailbreaks with a Few Examples
As large language models (LLMs) grow more powerful, ensuring their safety against misuse becomes crucial. While researchers have focused on developing robust defenses, no method has yet achieved...
🚀 Релиз DeepSeek-V3.2 и DeepSeek-V3.2-Speciale - модели нового поколения, созданные в первую очередь для reasoning и работы в агентных системах.
Что нового:
- DeepSeek-V3.2 - официальный преемник V3.2-Exp. Доступна в приложении, на сайте и через API.
- DeepSeek-V3.2-Speciale - улучшенная версия с акцентом на продвинутое многошаговое рассуждение. Пока что работает только через API.
Обе модели делают упор на глубокие цепочки рассуждений и поведение, нацеленное на агентные сценарии: планирование, решение задач, сложные выводы и работу со структурированными данными.
🏆 Производительность
• V3.2 - баланс скорости и качества, уровень примерно GPT-5
• V3.2-Speciale - топовый reasoning, конкурирует с Gemini-3.0-Pro.
• Speciale - лидер на IMO, CMO, ICPC.
🤖 Новый подход к обучению агентов
• Синтезированы большие тренировочные данные для 1800+ сред и 85k сложных инструкций.
• V3.2 - первая модель DeepSeek, у которой мышление встроено прямо в tool-use.
💻 API
• V3.2 использует тот же интерфейс, что V3.2-Exp.
• Speciale доступна через временный endpoint, работать будет до 15 декабря 2025.
📦 DeepSeek-V3.2 Model: https://huggingface.co/deepseek-ai/DeepSeek-V3.2
📦 DeepSeek-V3.2-Speciale Model: https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Speciale
📄 Tech report: https://huggingface.co/deepseek-ai/DeepSeek-V3.2/resolve/main/assets/paper.pdf
#deepseek, #deepseekv3, #ai, #нейросети
Что нового:
- DeepSeek-V3.2 - официальный преемник V3.2-Exp. Доступна в приложении, на сайте и через API.
- DeepSeek-V3.2-Speciale - улучшенная версия с акцентом на продвинутое многошаговое рассуждение. Пока что работает только через API.
Обе модели делают упор на глубокие цепочки рассуждений и поведение, нацеленное на агентные сценарии: планирование, решение задач, сложные выводы и работу со структурированными данными.
🏆 Производительность
• V3.2 - баланс скорости и качества, уровень примерно GPT-5
• V3.2-Speciale - топовый reasoning, конкурирует с Gemini-3.0-Pro.
• Speciale - лидер на IMO, CMO, ICPC.
🤖 Новый подход к обучению агентов
• Синтезированы большие тренировочные данные для 1800+ сред и 85k сложных инструкций.
• V3.2 - первая модель DeepSeek, у которой мышление встроено прямо в tool-use.
💻 API
• V3.2 использует тот же интерфейс, что V3.2-Exp.
• Speciale доступна через временный endpoint, работать будет до 15 декабря 2025.
📦 DeepSeek-V3.2 Model: https://huggingface.co/deepseek-ai/DeepSeek-V3.2
📦 DeepSeek-V3.2-Speciale Model: https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Speciale
📄 Tech report: https://huggingface.co/deepseek-ai/DeepSeek-V3.2/resolve/main/assets/paper.pdf
#deepseek, #deepseekv3, #ai, #нейросети
huggingface.co
deepseek-ai/DeepSeek-V3.2 · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
💡 UniVA: Universal Video Agent towards Open-Source Next-Generation Video Generalist
Hf: https://huggingface.co/papers/2511.08521
Paper: https://arxiv.org/pdf/2511.08521
Github: https://github.com/univa-agent/univa
Hf: https://huggingface.co/papers/2511.08521
Paper: https://arxiv.org/pdf/2511.08521
Github: https://github.com/univa-agent/univa
huggingface.co
Paper page - UniVA: Universal Video Agent towards Open-Source Next-Generation Video Generalist
Join the discussion on this paper page
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤2🤔2
Интересный пост в Сиолошной, про то как AI модели могут находить и эксплуатировать уязвимости в смарт-контрактах уже сейчас
оригинал статьи на английском от Антропик
В статье указаны две уязвимости в коде:
- в первом случае в контракте все пользователи имели доступ к функции калькулятора, меняющей storage переменные и модель смогла провести inflation attack, про которые я писал
- во втором случае в контракте, выпускающем токены в один клик, можно было задеплоить токен без указания адреса для приема комиссий. Зато его можно было добавить позже
Круто, что атакующие скрипты в исходной статье тоже показаны
https://t.me/web3securityresearch
оригинал статьи на английском от Антропик
В статье указаны две уязвимости в коде:
- в первом случае в контракте все пользователи имели доступ к функции калькулятора, меняющей storage переменные и модель смогла провести inflation attack, про которые я писал
- во втором случае в контракте, выпускающем токены в один клик, можно было задеплоить токен без указания адреса для приема комиссий. Зато его можно было добавить позже
Круто, что атакующие скрипты в исходной статье тоже показаны
https://t.me/web3securityresearch
Telegram
Сиолошная
AI agents find $4.6M in blockchain smart contract exploits
LLM всё лучше справляются с задачами в сфере кибербезопасности, о чём я уже писал ранее (вот про релиз Google, вот про CTF, вот Cybench). Но каковы экономические последствия этих возможностей? В…
LLM всё лучше справляются с задачами в сфере кибербезопасности, о чём я уже писал ранее (вот про релиз Google, вот про CTF, вот Cybench). Но каковы экономические последствия этих возможностей? В…
DenoiseLAB
Photo
Собственно к чему это я. Это первая фото, надувного МиккиМауса. В его проектировании принимал участие Уолт Дисней. Тут моя студентка делала анализ компании Уолта Диснея и накапала интересную штуку. Оказывается компания приносила прибыль только первые два года своего существования. Остальное же время она была убыточной и только в 2016 году наметился какой-то тренд на прибыль, который держится до сих пор, но крайне мал. Вот такие вот делишки )))
🤨3🤔1
Китайский разработчик искусственного интеллекта DeepSeek выпустил две новые модели: DeepSeek-V3.2 и более продвинутую версию DeepSeek-V3.2-Speciale.
В опубликованном релизе разработчики отмечают два ключевых технологических достижения. Во-первых, новую методику обучения, сочетающая надежные протоколы с масштабными вычислениями. Во-вторых, усовершенствованный механизм внимания, который позволяет эффективно обрабатывать большие объемы текста, не теряя в качестве работы.
Компания позиционирует свои разработки как прямых конкурентов мировых лидеров. Согласно ее данным, модель DeepSeek-V3.2-Speciale превосходит по некоторым параметрам GPT-5 от OpenAI и соответствует по уровню рассуждений модели Gemini-3.0 Pro от Google.
В опубликованном релизе разработчики отмечают два ключевых технологических достижения. Во-первых, новую методику обучения, сочетающая надежные протоколы с масштабными вычислениями. Во-вторых, усовершенствованный механизм внимания, который позволяет эффективно обрабатывать большие объемы текста, не теряя в качестве работы.
Компания позиционирует свои разработки как прямых конкурентов мировых лидеров. Согласно ее данным, модель DeepSeek-V3.2-Speciale превосходит по некоторым параметрам GPT-5 от OpenAI и соответствует по уровню рассуждений модели Gemini-3.0 Pro от Google.
🔥1
В Москве прошёл первый студенческий хакатон для мессенджера МАХ. Студенты из разных вузов и городов представили более 50 сервисов — от цифровых кампусов и AI-помощников до платформ для социальных инициатив и мини-приложений для продуктивности.
В треке «Цифровизация» лучшим стал «Цифровой кампус» для объединения университетских сервисов от студентов Финансового университета. В социальном треке победил чат-бот команды СмолГУ для анализа состава продуктов по фото, а в направлении «Эффективность» студенты из ИТМО и ТюмГУ представили календарь для бронирования встреч с AI-помощником.
Финал хакатона прошёл в МГТУ им. Баумана. Лучшие из представленных решений получат поддержку для дальнейшего развития в контуре национального мессенджера.
В треке «Цифровизация» лучшим стал «Цифровой кампус» для объединения университетских сервисов от студентов Финансового университета. В социальном треке победил чат-бот команды СмолГУ для анализа состава продуктов по фото, а в направлении «Эффективность» студенты из ИТМО и ТюмГУ представили календарь для бронирования встреч с AI-помощником.
Финал хакатона прошёл в МГТУ им. Баумана. Лучшие из представленных решений получат поддержку для дальнейшего развития в контуре национального мессенджера.
vesti.ru
В Москве подвели итоги хакатона по разработке сервисов для мессенджера MАХ - Новости на Вести.ru
Последние новости на сайте Вести: В Москве подвели итоги первого студенческого хакатона по разработке онлайн-сервисов для национального мессенджера MАХ. Своими эмоциями победители соревнований поделились в эфире телеканала "Россия 24". Актуальные события…