Машинное обучение digest
57 subscribers
1.69K photos
224 videos
923 links
Download Telegram
🇨🇳 IQuest-Coder: Новая open-source модель для Кодинга, которая превосходит Claude Sonnet 4.5 и GPT-5.1 - и это модель всего 40B параметров.

На бенчмарках IQuest-Coder выглядит внушительно:

SWE-Bench Verified — 81.4%
BigCodeBench — 49.9%
LiveCodeBench v6 — 81.1%


Проект поддерживает хедж-фонд UBIQUANT, который уже много лет активно развивает ИИ
(команды AILab, DataLab, Waterdrop Lab).

Контекст до 128K токенов.

https://huggingface.co/IQuestLab/IQuest-Coder-V1-40B-Loop-Instruct
🎥 КК ИИ-слоп теперь влияет на политические решения

В Польше заявляют, что в TikTok завирусилист сгенерированные ИИ ролики, убеждающие молодёжь поддержать выход страны из ЕС, так называемый “Polexit”.

Польское правительство просит ЕС открыть расследование против TikTok по линии Digital Services Act.

По их словам, ролики выглядят как организованная кампания.

Особенность таких видео в том, что:

• ИИ создаёт реалистичных “говорящих людей”
• сценарии можно быстро менять
• таргетинг идёт точечно, например, на аудиторию 15–25 лет
• масштабирование происходит автоматически

То есть за короткое время можно запустить сотни убедительных роликов, создающих ощущение «органичного мнения общества», хотя за ними может стоять один оператор.

Вопросы, которые теперь обсуждают в ЕС:

• как отличать реальных людей от ИИ-персонажей
• кто несёт ответственность за массовую манипуляцию
• как соцсети должны реагировать на такие кампании

ИИ меняет не только технологии, он начинает менять и общественные дискуссии.

notesfrompoland.com/2025/12/31/poland-calls-for-eu-action-against-ai-generated-tiktok-videos-calling-for-polexit/
1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 Илон Маск: стоит ли детям идти в университет в эпоху ИИ

> Если вы хотите поступить по социальным причинам - быть среди ровесников в учебной среде - это вполне разумно.
> Но будут ли эти навыки нужны в будущем? Скорее всего, нет.
> Мы движемся к обществу без работы. ИИ и робототехника -нас ждет самое радикальное изменение в истории.
> Если что-то действительно то что вам интересно. Изучайте широкий спектр курсов. Но идти в колледж не обязательно.

Маск говорит, что даже его собственные сыновья понимают: их навыки могут стать ненужными, но они всё равно хотят пройти через сам опыт обучения и студенческой жизни.
⚡️ Wavelet Matrix - структура данных, которая делает сложные запросы быстрыми

Wavelet Matrix позволяет хранить последовательности так,
чтобы работать с ними молниеносно и компактно.

🔥 Что умеет библиотека:

- rank - сколько раз элемент встречается до позиции
- select - где находится k-е вхождение элемента
- quantile - k-й по величине элемент на отрезке
- top-k - самые частые элементы на диапазоне

И всё это — за логарифмическое время и с экономией памяти.

Чем полезен

- работает быстрее, чем наивные структуры
- меньше памяти, чем обычные массивы
- подходит для поиска, индексирования, сжатия, аналитики

Wavelet Matrix - это пример того,
как «умные» структуры данных дают реальные ускорения,
а не просто красивая теория.

Если интересуешься алгоритмами -
этот репозиторий точно стоит сохранить.

Репозиторий: https://github.com/math-hiyoko/wavelet-matrix

@pythonl
🧮 CoolCalculator: Мини-язык программирования для вычислений

CoolCalculator — это консольный калькулятор, который поддерживает пользовательские переменные и функции, рекурсию и локальные области видимости. Он предназначен для изучения парсинга и оценки выражений, а не только для численных вычислений.

🚀Основные моменты:
- Поддержка пользовательских переменных и функций
- Рекурсивные вызовы и перегрузка функций
- Многострочный ввод и последовательное выполнение
- Автоматическое создание несуществующих переменных
- Удобный синтаксис для работы с выражениями

📌 GitHub: https://github.com/YaroslavPryatkin/CoolCalculator
The Information пишет, что в 2026 году OpenAI может купить Pinterest, и акции Pinterest сразу подросли.

ChatGPT постепенно превращается не просто в ассистента, а в платформу поиска + рекомендаций со встроенной реальной рекламой.

Pinterest ценен для OPenAI по двум ключевым причинам:

1️⃣ Люди в Pinterest не просто смотрят картинки, они сохраняют и возвращаются к ним.
Это сильные сигналы того, что человек реально хочет купить или попробовать.

Для ИИ это ценная информация:
рекомендации товаров, понимание стиля, который нравится пользователю.
И главное база ~600 млн активных пользователей в месяц.

2️⃣ Готовая коммерческая инфраструктура
Если ChatGPT хочет показывать «товары, которые можно купить», ему нужны:

- каталоги
- цены
- доставка
- рекламные бюджеты брендов

Pinterest уже имеет рекламный бизнес и партнёрства с мерчантами.

Можно представить цикл продукта:
пользователь описывает идею продукта, который ему интересно или образ в ChatGPT, модель генерирует варианты и подтягивает результаты в стиле Pinterest, уже связанные с магазинами.

theinformation .com/articles/sutskevers-fate-openais-next-deal-hit-robot-13-predictions-2026
⚡️ Google показала интересный пример того, как мультимодели уже помогают в гуманитарных исследованиях.

Gemini 3.0 Pro смогла расшифровать загадочные пометки в «Нюрнбергской хронике», которым более 500 лет. В модель залили сканы страниц и попросили не просто переписать текст, а объяснить, что означают заметки с учетом контекста.

Оказалось, что круговые таблицы на полях были попыткой примирить две конкурирующие библейские хронологии и вычислить год рождения Авраама.

Сложность состояла в том, что заметки смешивали латинские сокращения, римские цифры и обрывки надписей.

Gemini связала вычисления с системой датировки Anno Mundi (год от сотворения мира), привязала их к традициям Септуагинты и еврейской Библии, а затем перевела в «до н.э.», получив расхождение примерно в 100 лет.

siliconangle. com/2026/01/01/googles-gemini-3-0-pro-helps-solve-long-standing-mystery-nuremberg-chronicle/
⚡️ Samsung подтвердила, что к концу 2026 года 800 миллионов устройств будут работать под управлением Google Gemini.

> К концу 2025 года 400 миллионов устройств будут продаваться с Gemini на борту.
> эта цифра удвоится до 800 млн в этом году
> Со-генеральный директор Samsung:
«Это дает Google преимущество перед конкурентами»


Google все активнее захватывает рынок.

https://www.reuters.com/world/china/samsung-double-mobile-devices-powered-by-googles-gemini-800-mln-units-this-year-2026-01-05/?utm_source=braze&utm_medium=notifications&utm_campaign=2025_engagement
📌Как делали MiniMax М2.1 и что будет дальше.

Когда говорят, что одна модель пишет код лучше другой, обычно имеется ввиду бенчмарк SWE-Bench. Модель получает реальный баг из настоящего проекта с Github, который она должна прочитать, найти ошибку и исправить её. Это частично повторяет ежедневную работу программиста.

Но у этого бенча, как и у любого другого, есть свои недостатки.

🟠SWE-Bench работает только с Python. В реальном мире разработчики имеют дело с Java, Go, TypeScript, Rust, C++ и еще кучей других.

🟠Бенчмарк только про исправление ошибок, а программисты еще пишут новые функции, занимаются рефакторингом и оптимизацией.

🟠Его результаты сильно зависят от того, в каком окружении работает модель.

И вот здесь MiniMax-AI задалась вопросом: как создать по-настоящему универсального ИИ-программиста?

Ответ они нашли
и реализовали его в своей свежайшей модели M2.1.

🟡Масштабирование окружения.

За этим расплывчатым термином кроется огромная система, которая оперирует популярными языками: JS, TS, Python, Java, Go, C++ и Rust.

Для этого с GitHub были собраны более 100 тыс. реальных задач с описанием проблемы, кодом и тестами. Это было непросто, так как сложные языки (Java или C++) требуют настройки и у каждого языка свои фреймворки и системы управления зависимостями.

Чтобы обучить модель на таком массиве данных, MiniMax построил инфраструктуру, способную запускать более 5 тыс. изолированных сред выполнения за максимально короткое время - 10 секунд.

🟡Выход за рамки баг-фиксов.

MiniMax-M2.1 обучали и генерации тестов и в результате оказалось, что это критически важный навык.

Предыдущая версия, M1, писала слишком простые тесты и часто выбирала неверные решения. M2.1 в этом преуспела и сравнялась по результатам с мощным конкурентом Claude Sonnet 4.5.

Еще она научилась оптимизировать производительность кода — на SWE-Perf показала средний прирост эффективности в 3.1%.

И наконец, M2.1 научили делать Code Review, для чего создали внутренний бенчмарк SWE-Review.

🟡Обобщение на незнакомых окружениях (Generalization on OOD Scaffolds).

Модель должна одинаково хорошо следовать длинным инструкциям и адаптироваться к разным способам управления контекстом диалога.

Команда провела тесты в mini-swe-agent, Droid и Claude Code и если посмотреть на цифры из их сравнительной таблицы, то можно увидель, что модель стала гораздо более гибкой и универсальной.

На том же SWE-Bench, при использовании Claude Code, MiniMax-M2.1 выбила 74 балла, что выше, чем у модели M2 с ее 69.2 баллами, и практически наравне с Claude Sonnet 4.5 и DeepSeek V3.2.

На другом тесте, OctoCodingBench, разрыв еще больше: 26.1 у новой модели против 13.3 у старой.

🟡Планы на 2026.

Во-первых, MiniMax планирует научить модель оценивать не только правильность кода, но и читаемость кода, качество комментариев, прозрачность процесса работы.

Во-вторых - повысить эффективность решения задач, чтобы модель не делала лишних шагов, например, не перечитывала один и тот же файл по несколько раз.

Но самое интересное — это их планы по RL Scaling, и создание так называемой Coding World Model.

Идея в том, чтобы построить модель-симулятор, которая сможет предсказывать результат выполнения кода, не запуская его в реальности.


Наконец, они планируют расширяться в узкоспециализированные области: разработка GPU Kernel, компиляторов и смарт-контрактов.

Похоже, концепция "ИИ-кодера" становится все более реальной. Успех MiniMax-M2.1 показал, что дело уже не в написании отдельных строк кода, а в комплексном понимании всего процесса разработки.


@ai_machinelearning_big_data

#AI #ML #LLM #MiniMaх
Please open Telegram to view this post
VIEW IN TELEGRAM
✔️ Зафиксировано значительно падение трафика ChatGPT на праздниках - что это значит

По оценкам аналитиков, ежедневные посещение приложения ChatGPT снизились примерно с 200 млн до ~158 млн - около -22% за праздничный период.

При этом Gemini держался гораздо стабильнее, около 60 млн визитов, показав лишь небольшой спад.

Самое простое объяснение:
использование ChatGPT сильнее связано с работой и учебой. Как только люди уходят на каникулы - трафик резко падает.

У Gemini, похоже, другой профиль аудитории: больше постоянных потребителей и сильнее интеграция в экосистему Google, поэтому просадка мягче.

Важно: речь идёт о оценках веб-трафика, а не об общем использовании сервисов (мобильные приложения, API и т.д. сюда не входят).
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥 Год ChatGPT Plus бесплатно: экономим 20 000 рублей

Нашли рабочую лазейку в правилах OpenAI.
Вы получаете полноценный аккаунт без лимитов и с доступом ко всем топовым моделям.
Инструкция (займет 2 минуты):

1️⃣ Переходим на сервис временной почты: https://em.bjedu.tech/en/
2️⃣ Важно: в списке доменов выбираем erzi me.
3️⃣ Регистрируем новый аккаунт ChatGPT на этот адрес.
4️⃣ Получаем код подтверждения в почту - готово!

⚡️ Проверили, пока еще работает

@data_analysis_ml
Science Context Protocol: научное расширение стандарта MCP.

Шанхайская лаборатория ИИ выложила (https://github.com/InternScience/scp) в опенсорс спецификации SCP — протокола, созданного для формирования глобальной сети автономных исследовательских систем. Новинка развивает идеи стандарта MCP от Anthropic, добавляя к нему критически важный слой для взаимодействия с физическим миром науки.

В отличие от MCP, ориентированного на подключение данных, SCP поддерживает подключение лабораторного оборудования, расширенные метаданные экспериментов и API для оркестрации сложных рабочих процессов.

Фактически это позволяет ИИ-агентам напрямую управлять приборами и обмениваться результатами между различными институтами. Технология уже обкатана на платформе Internal Discovery (https://discovery.intern-ai.org.cn/home), где доступно более 1600 инструментов, преимущественно для биологии, физики и химии.
arxiv.org (https://arxiv.org/pdf/2512.24189)

OpenAI переводит производство своего первого гаджета на заводы Foxconn.

Компания Сэма Альтмана меняет стратегию выпуска дебютного аппаратного устройства под кодовым именем «Gumdrop». По данным Economic Daily News, OpenAI отказалась от услуг китайской Luxshare и передала контракт тайваньскому гиганту Foxconn, чтобы исключить материковый Китай из цепочки поставок - сборка будет развернута на мощностях во Вьетнаме или США.

Gumdrop находится на стадии проектирования и, вероятно, это будет умная ручка или носимый аудио-гаджет. Устройство получит камеру и микрофон, а его киллер-фичей станет нативная интеграция с ChatGPT для оцифровки и анализа рукописных заметок.
Релиз устройства запланирован на 2026–2027 годы.
money.udn.com (https://money.udn.com/money/story/5612/9239738)

Попытка главы Microsoft защитить репутацию ИИ обернулась вирусным трендом «Microslop».

Сатья Наделла непреднамеренно спровоцировал имиджевый кризис, опубликовав в конце 2025 года призыв к обществу «перерасти» использование термина «slop» в отношении генеративного контента. Реакция сообщества оказалась мгновенной: эффект Стрейзанд вывел в тренды тег «Microslop», ставший символом отторжения агрессивной политики компании по повсеместному внедрению ИИ.

Пользователи выражают недовольство тем, что Microsoft принудительно встраивает Copilot в каждый продукт, игнорируя реальные потребности аудитории. Пока руководство Big Tech обещает глобальные прорывы, рынок фиксирует негативные побочные эффекты: от дефицита и удорожания памяти и сокращения рабочих мест до засорения экосистемы бесполезными функциями.
windowscentral.com (https://www.windowscentral.com/artificial-intelligence/microslop-trends-on-social-media-backlash-to-microsofts-on-going-ai-obsession-continues)

Neuralink запускает серийное производство нейро-чипов.

Илон Маск подтвердил планы компании начать массовый выпуск интерфейсов «мозг-компьютер» в 2026 году. Технологический процесс станет полностью автономной хирургической процедурой: роботы будут устанавливать импланты без прямого участия людей-нейрохирургов.

Проект уже вышел за рамки лабораторных экспериментов - база пациентов с активными имплантами достигла 12 человек. Устройства позволяют людям с тяжелыми нарушениями моторики управлять цифровыми интерфейсами и игровыми контроллерами напрямую через нейронную активность.
reuters.com (https://www.reuters.com/business/healthcare-pharmaceuticals/musk-says-neuralink-start-high-volume-production-interface-devices-by-2026-2026-01-01/)

Армия США ввела специальность по ИИ и ML для офицеров.

С 5 января Пентагон официально открыл прием заявок на новую специализацию, позволяющую офицерам строить карьеру в ИИ и ML. Приоритет при отборе отдается кандидатам с профильным образованием и опытом разработки.

Офицеры пройдут углубленную подготовку, после чего займутся созданием, развертыванием и поддержкой военных ИИ-систем. Инициатива реализуется на фоне жестких дедлайнов по внедрению ИИ-управления в штабах к 2027 году и обеспечению армии автономными системами до конца 2026 года.
Параллельно Минобороны США запустило платформу GenAi.mil с Gemini for Government на борту, чтобы предоставить армии доступ к передовым языковым моделям. Таким образом, ИИ перестает быть экспериментальным направлением и становится штатной функцией офицерского состава.
federalnewsnetwork.com (https://federalnewsnetwork.com/army/2025/12/army-launches-ai-and-machine-learning-career-path-for-officers/)
This media is not supported in your browser
VIEW IN TELEGRAM
🧠 DFlash: как ускорить LLM без потери качества

DFlash - это способ ускорить генерацию текста у больших моделей.

Он работает так: одна модель быстро делает черновик, другая - проверяет его и исправляет ошибки.

Почему это круто?

🚀 6.2× быстрее без потери качества на Qwen3-8B
в 2.5 раза быстрее EAGLE-3

Идея простая:

• диффузионные модели - генерируют быстро, но иногда ошибаются
• автогенеративные (AR) - очень точные, но работают медленно
DFlash сочетает оба подхода:
диффузия — черновик → AR — проверка и подтверждение

Получается: и быстро, и аккуратно, вместо того, чтобы выбирать одно.

🔗 Блог: https://z-lab.ai/projects/dflash/
💻 Код: https://github.com/z-lab/dflash
🤗 Модели: https://huggingface.co/collections/z-lab/dflash
Please open Telegram to view this post
VIEW IN TELEGRAM