Машинное обучение digest – Telegram

Машинное обучение digest

@machinelearnindigest

62 subscribers

2.84K photos

462 videos

1.74K links

Download Telegram

About

Blog

Apps

Platform

Машинное обучение digest

Машинное обучение digest

📱

Claude - вторая по популярности LLM после ChatGPT и уже обгоняет Gemini.

Хотя Anthropic изначально делала ставку на корпоративный сегмент, им удалось уверенно выйти и на массовый рынок.

Обновления выходят почти каждый день.

Anthropic смогли стереть границу между «бизнес-инструментом» и «продуктом для всех».

А последние релизы показывают: они не просто догоняют тренды, а начинают их задавать.

Пользуетесь ли вы Claude?
Какое из последних обновлений зашло больше всего? 👇

@ai_machinelearning_big_data

#Claude

Please open Telegram to view this post

VIEW IN TELEGRAM

13 views18:45

Машинное обучение digest

⚡️ Забираем БЕСПЛАТНЫЙ Claude Opus 4.6 навсегда — энтузиасты переобучили нейронку Qwen 3.5 на данных Opus 4.6 и получили полностью опен-сорсный Claude, который НЕ УСТУПАЕТ оригиналу и запускается на одной GPU.

• Да, ее можно запустить БЕЗ ограничений на домашнем компе и даже не слишком мощном железе.
• Нейронка шустрая и очень умная — идеально для повседневных рабочих задач.
• Поддерживает контекст в 262 000 токенов — можно грузить целые книги, папки с кодом и документы.
• Полностью автономна, запускает целые цепочки рассуждений.
• Стабильнее других моделей Qwen работает с внешними API.
• БЕЗ ограничений, БЕЗ цензуры, БЕЗ подписок.

😶

😶

😶

😶

😶

😶

😶

😶

😶

Ваш домашний монстр лежит — тут.

👍

Please open Telegram to view this post

VIEW IN TELEGRAM

13 views02:22

Машинное обучение digest

This media is not supported in your browser

VIEW IN TELEGRAM

Google представили TurboQuant - алгоритм, который сильно снижает требования к памяти при работе LLM.

KV-cache - это то, что хранит весь контекст во время генерации.
И именно он сейчас становится главным ограничением, а не сами модели.

Чем длиннее диалог или больше пользователей, тем быстрее заканчивается память на GPU.

TurboQuant решает это так:
- сжимает KV-cache минимум в 6 раз
- ускоряет инференс до 8 раз
- сохраняет качество без заметной потери

Это ключевой момент: раньше компрессия почти всегда ухудшала ответы.

Как это устроено:

- сначала данные преобразуются (rotation), чтобы их было проще сжимать
- затем применяется основной алгоритм сжатия (PolarQuant)
- после этого добавляется лёгкая коррекция (QJL), которая убирает ошибки

В итоге получается почти точное восстановление при сильно меньшем объёме.

С TurboQuant:
- модели можно запускать на меньшем количестве GPU
- один сервер может обслуживать больше запросов
- становится проще работать с длинным контекстом
- падает стоимость инференса

По сути, это не про “ускорить модель”, а про перераспределение ресурсов внутри всей системы.

Раньше оптимизировали веса моделей
теперь оптимизируют то, как они работают в проде

И KV-cache, как раз одна из самых дорогих частей.

https://research.google/blog/turboquant-redefining-ai-efficiency-with-extreme-compression/

🐍 полезные ресурсы 🚀Max

@data_analysis_ml

16 views02:51

Машинное обучение digest

✔️

OpenAI и AGI: переименование отдела или исторический момент?

OpenAI переименовала продуктовое подразделение Фиджи Симо в «AGI Deployment», буквально «Развёртывание ИИО». Сэм Альтман параллельно заявил, что следующая языковая модель является «очень сильной», и добавил, что она «реально ускорит экономику».

Два варианта интерпретации: либо OpenAI действительно достигла искусственного общего интеллекта, либо это самый масштабный PR-ход в истории технологий. Сообщество разделилось, мнения прямо противоположные.

🔗 https://x.com/kimmonismus/status/2036547535272296516

Please open Telegram to view this post

VIEW IN TELEGRAM

11 views02:53

Машинное обучение digest

Архитектура Docker, если убрать лишнее, выглядит очень просто:

Есть образ (image) - это слепок приложения с зависимостями.

Один раз собрал - запускаешь где угодно.

Есть контейнер (container) - это уже запущенный образ.

По сути изолированный процесс с файловой системой, сетью и настройками.

Docker Engine - сердце всей системы.
Он принимает команды через CLI/API и управляет контейнерами.

Docker Daemon - фоновый процесс, который:

• создаёт контейнеры
• запускает их
• следит за состоянием

Docker Client - то, через что ты работаешь (docker CLI).

Docker Hub / Registry - место, где хранятся образы.
Оттуда ты делаешь pull, туда - push.

Как это работает в реальности:

Ты пишешь Dockerfile →
docker build → получаешь image

docker push → отправляешь в registry

На сервере:
docker pull → скачал
docker run → запустил контейнер

Зачем это:
Одинаковая среда везде (dev = prod)
быстрый деплой без «у меня работает»
изоляция сервисов
масштабирование через контейнеры

Если упростить до одной мысли:

Docker - это не про контейнеры.
Это про предсказуемый запуск кода в любой среде.

10 views03:12

Машинное обучение digest

📌

Google разработала алгоритм квантования KV-кэша без потери точности.

Подразделение Research анонсировало TurboQuant, алгоритм векторного квантования, объединяющий 2 других метода - QJL и PolarQuant, который решает проблему увеличения KV-кэша при работе с длинным контекстом.

TurboQuant будет представлен на ICLR 2026, PolarQuant - на AISTATS 2026.

KV-кэш хранит промежуточные представления токенов, чтобы модель не пересчитывала их на каждом шаге генерации. С ростом контекста он превращается в узкое место по памяти.

Обычное векторное квантование сжимает эти данные, но вносит накладные расходы: для каждого блока нужно хранить константы квантования в полной точности, а это плюс 1–2 бита на элемент, что частично обесценивает само сжатие.

🟡TurboQuant - двухэтапный пайплайн.

Сначала PolarQuant: случайный поворот выравнивает геометрию векторов, после чего они переводятся из декартовых координат в полярные (радиус и угол). Распределение углов оказывается предсказуемым и сконцентрированным, поэтому нормализация и хранение дополнительных констант становятся больше не нужны.

На втором этапе подключается QJL, метод на основе преобразования Джонсона-Линденштраусса, который кодирует остаточную ошибку первого этапа всего одним знаковым битом и через встроенную оценочную функцию сочетает высокоточный запрос с низкоточными сжатыми данными, корректно вычисляя attention score.

Ни один из методов не требует обучения или дообучения и работает в режиме "без предварительного анализа набора данных".

Алгоритмы тестили на бенчмарках для длинного контекста: LongBench, Needle In A Haystack, ZeroSCROLLS, RULER и L-Eval с моделями Gemma и Mistral.

При квантовании KV-кэша до 3 бит TurboQuant показал нулевую деградацию точности на всех задачах: поиск «иголки в стоге сена», QA, генерация кода, суммаризация.

Объем KV-кэша при этом сократился в 6 раз. На H100 четырехбитный TurboQuant ускорил вычисление attention-логитов до 8 раз по сравнению с 32-битными ключами.

Область применения не ограничивается KV-кэшем. В экспериментах с высокоразмерным векторным поиском TurboQuant стабильно превзошел по recall методы PQ и RaBitQ несмотря на то, что те использовали крупные код-буки и подстройку под конкретный датасет.

🟡

🟡

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

13 views05:31

Машинное обучение digest

⚡️

Полный Чебурнет запустят уже скоро — Минцифры будет фильтровать вообще весь трафик рунета! Не выборочные сайты, каналы и мессенджеры, а вообще всё.

Пропускную способность ТСПУ увеличат в 2,5 раза, до 954 Тбит/с к 2030 году. Такая мощность позволит анализировать весь трафик рунета с запасом под его естественный прирост. Всё ради обеспечения «сетевого суверенитета и информационной безопасности».

Так будет легче вводить всё новые блокировки и гасить всё новые и новые обходы. На апгрейд потратят 15 млрд рублей — общая стоимость проекта составит 84 млрд рублей.

Времени мало, готовимся

👍

Please open Telegram to view this post

VIEW IN TELEGRAM

11 views05:49

Машинное обучение digest

Media is too big

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

👏

ByteDance начали раздавать доступ к Seedance 2.0 по всему миру.

Генератор видео добавили в CapCut, он постепенно появляется у пользователей в разделах AI Lab и AI Generator. В десктопном приложении — в AI Video. Нейронка также есть в сервисе Dreamina.

Уже можно потестить в Индонезии, Таиланде, Вьетнаме, Бразилии, Мексике и на Филиппинах.

• Попробовать

#neural #нейросети

@aiaiai

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

13 views06:01

Машинное обучение digest

3 млн подписчиков за 12 дней, и все на ИИ-слопе. В TikTok появился, вероятно, самый быстрорастущий аккаунт в истории.

На @ai.cinema021 в день выходят несколько роликов, каждый в среднем набирает ~15 млн просмотров. Сюжет повторяет сериал Love Island, только с фруктами вместо людей.

При такой стате аккаунт может приносить автору каждый день до $10 тыс. (~₽830 тыс.) только от просмотров.

@typespace

16 views09:04

Машинное обучение digest

⚡️

Сносим Spotify — гении релизнули абсолютно бесплатную замену Спотику, Tidal и Apple Music с музыкой в Hi-Fi качестве!

Да, MonoDev Music подтянет вам на телефон всю лицензионную музыку в лучшем качестве бесплатно. И всё это с удобным интерфейсом.

• Никакой рекламы и подписок
• Слушать музыку можно даже без интернета
• Все любимые мировые звезды без цензуры
• Музыку можно слушать в формате FLAC — это максимальное качество звука
• Плейлисты, рекомендации и гибкий поиск
• Музыка стримится с огромной библиотеки Monocrome — полной копии стриминга Tidal
• Вес приложухи — всего 7 МБ! Она просто летает.

Ставится MonoDev просто — через обычный APK.

Версия на Android — на ГитХабе.
Веб-версия Monochrome — тут.

👍

Please open Telegram to view this post

VIEW IN TELEGRAM

11 views09:26

Машинное обучение digest

Как получилось OpenAI закрывает SORA

Вчера вечером OpenAI объявили, что прощаются с SORA. На самом деле, решение было не то чтобы ожидаемым, но лежало на поверхности. И вот почему:

1. Главное это юнитэкономика, вероятно, очень далека от того, чтобы сойтись. Публичные оценки доходят до $15 млн/день вычислительных затрат (≈ $5+ млрд/год в пересчете), при том что сама компания через руководителя Sora публично называла экономику «неустойчивой». Несложные расчеты, даже основанные только на прайсе в API, показывают, что маржа каждого ролика sora‑2, скорее всего, отрицательна.

2. При этом другие метрики далеки от привычных OpenAI. Если у ChatGPT WAU и ретеншен пользователя запредельные, то у SORA аналитики из a16z насчитали retention < 8% на 30‑й день. Хотя приложение и скачивали очень активно в самом начале, но охваты оно не держит.

2. В начале года OpenAI сами говорили, что компьют – их главный ресурс. Логично, что они стараются перераспределить его разумно, и сверхдорогой видеопродукт становится в этой картине самым стратегически уязвимым. Так что это в первую очередь решение высвободить мощности для других направлений.

Кстати, важная деталь: исходная формулировка «We’re saying goodbye to Sora» была уточнена до «We’re saying goodbye to the Sora app», так что тут трактовка уже несколько другая. Возможно, ричерч подразделение видеомоделей все-таки продолжит работать.

12 views09:34

Машинное обучение digest

🚨 В Реале начали принимать решения по ChatGPT

Бывший нутрициолог рассказал, что игрокам подбирали добавки просто по ответам из чата

И это не единственный случай

Самое дикое врачи клуба лечили Мбаппе не то колено.

После этого уволили весь медштаб
И, по словам инсайдов, решение об уволнении тоже принимали с участием чат-бота.

Если слепо доверять ИИ топ клуб может скатиться в дивизион пониже.

https://dailysports.net/news/former-real-madrid-nutritionist-suggests-current-medical-staff-use-chatgpt/

13 views10:05

Машинное обучение digest

⚡️⚡️ Провайдеры начали БЛОЧИТЬ интернет россиянам, если у них работает Telegram! Прямо сейчас Билайн ПРЯМО говорит юзерам, что ОТРУБИТ мессенджер, чтобы работали остальные сервисы.

Держитесь за стулья:

• Проблема наблюдается и на мобильном, и на домашнем интернете — отключают ВСЁ!
• Телеграм провайдеры оценивают как «подозрительную активность» и блочат соединение.
• Пока проблему зафиксировали только в Краснодарском крае, но она может стать МАССОВОЙ!

😶

👍

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

17 views10:41

Машинное обучение digest

Подбора для тех, кто хочет стать сертифицированным архитектором Claude

Полезные ресурсы для подготовки в одном месте 👇

• Запись на сертификацию: https://anthropic.skilljar.com/claude-certified-architect-foundations-access-request

• Обучение (13 бесплатных курсов):
https://anthropic.skilljar.com

• Cookbook (примеры и практики):
https://github.com/anthropics/anthropic-cookbook

• Гайд к экзамену:
https://share.google/0eqIbebzRMUt8KTc8

• Практические вопросы:
http://claudecertifications.com

• Документация MCP:
http://modelcontextprotocol.io

API документация:
http://docs.anthropic.com

Полезный playbook:
https://drive.google.com/file/d/1luC0rnrET4tDYtS7xe5jUxMDZA-4qNf-/view

🐍 полезные ресурсы 🚀Max

@machinelearning_interview

12 views11:09

Машинное обучение digest

Стив Возняк говорит, что ИИ его разочаровывает и поэтому он почти им не пользуется.

Но дело не только в этом.

Он указывает на более глубокую проблему:
ценность человека - не в точности.

Люди приносят то, чего ИИ пока не хватает:
контекст, интонацию, чувство важного, понимание ситуации.

И когда ответы ИИ кажутся «слишком идеальными» и «слишком сухими» -
это не просто вопрос стиля.

Это разрыв между генерацией текста
и реальным пониманием.

techspot.com/news/111806-steve-wozniak-disappointed-lot-ai-rarely-uses.html

10 views15:21

Машинное обучение digest

Вот это предприниматель! 20-летний IT-темщик получает по 2️⃣7️⃣0️⃣ тысяч рублей в месяц — у чела нет опыта работы, и он вообще ничего не делает целыми днями. Приготовьтесь к офигенной истории из айтишки 2026 года.

Парень натуральной понял главное правило современных разрабов: «Не надо уметь кодить, главное — уметь проходить собеседования». Сверхразум просто зазубрил ответы на топ-200 вопросов для собесов и вообще без опыта устроился на первую работу. Для второй ментор подкинул ему записи с реальных собесов, и всё снова выгорело.

Теперь чел работает в банке и получает 270 тысяч, но и это ещё не всё. Первое время он вообще просто скидывал все задачи нейронкам и тупо копипастил ответы сеньорам — в день уходило по 3 часа. Со временем ему надоело делать даже это, темщик нанял другого гения за 170 тысяч и с концами перестал работать. Дальнейший план — стать ментром.

А вы всё ещё не можете найти работу

👍

Please open Telegram to view this post

VIEW IN TELEGRAM

13 views16:00