Хотя Anthropic изначально делала ставку на корпоративный сегмент, им удалось уверенно выйти и на массовый рынок.
Обновления выходят почти каждый день.
Anthropic смогли стереть границу между «бизнес-инструментом» и «продуктом для всех».
А последние релизы показывают: они не просто догоняют тренды, а начинают их задавать.
Пользуетесь ли вы Claude?
Какое из последних обновлений зашло больше всего? 👇
@ai_machinelearning_big_data
#Claude
Please open Telegram to view this post
VIEW IN TELEGRAM
• Да, ее можно запустить БЕЗ ограничений на домашнем компе и даже не слишком мощном железе.
• Нейронка шустрая и очень умная — идеально для повседневных рабочих задач.
• Поддерживает контекст в 262 000 токенов — можно грузить целые книги, папки с кодом и документы.
• Полностью автономна, запускает целые цепочки рассуждений.
• Стабильнее других моделей Qwen работает с внешними API.
• БЕЗ ограничений, БЕЗ цензуры, БЕЗ подписок.
Ваш домашний монстр лежит — тут.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Google представили TurboQuant - алгоритм, который сильно снижает требования к памяти при работе LLM.
KV-cache - это то, что хранит весь контекст во время генерации.
И именно он сейчас становится главным ограничением, а не сами модели.
Чем длиннее диалог или больше пользователей, тем быстрее заканчивается память на GPU.
TurboQuant решает это так:
- сжимает KV-cache минимум в 6 раз
- ускоряет инференс до 8 раз
- сохраняет качество без заметной потери
Это ключевой момент: раньше компрессия почти всегда ухудшала ответы.
Как это устроено:
- сначала данные преобразуются (rotation), чтобы их было проще сжимать
- затем применяется основной алгоритм сжатия (PolarQuant)
- после этого добавляется лёгкая коррекция (QJL), которая убирает ошибки
В итоге получается почти точное восстановление при сильно меньшем объёме.
С TurboQuant:
- модели можно запускать на меньшем количестве GPU
- один сервер может обслуживать больше запросов
- становится проще работать с длинным контекстом
- падает стоимость инференса
По сути, это не про “ускорить модель”, а про перераспределение ресурсов внутри всей системы.
Раньше оптимизировали веса моделей
теперь оптимизируют то, как они работают в проде
И KV-cache, как раз одна из самых дорогих частей.
https://research.google/blog/turboquant-redefining-ai-efficiency-with-extreme-compression/
🐍 полезные ресурсы 🚀Max
@data_analysis_ml
KV-cache - это то, что хранит весь контекст во время генерации.
И именно он сейчас становится главным ограничением, а не сами модели.
Чем длиннее диалог или больше пользователей, тем быстрее заканчивается память на GPU.
TurboQuant решает это так:
- сжимает KV-cache минимум в 6 раз
- ускоряет инференс до 8 раз
- сохраняет качество без заметной потери
Это ключевой момент: раньше компрессия почти всегда ухудшала ответы.
Как это устроено:
- сначала данные преобразуются (rotation), чтобы их было проще сжимать
- затем применяется основной алгоритм сжатия (PolarQuant)
- после этого добавляется лёгкая коррекция (QJL), которая убирает ошибки
В итоге получается почти точное восстановление при сильно меньшем объёме.
С TurboQuant:
- модели можно запускать на меньшем количестве GPU
- один сервер может обслуживать больше запросов
- становится проще работать с длинным контекстом
- падает стоимость инференса
По сути, это не про “ускорить модель”, а про перераспределение ресурсов внутри всей системы.
Раньше оптимизировали веса моделей
теперь оптимизируют то, как они работают в проде
И KV-cache, как раз одна из самых дорогих частей.
https://research.google/blog/turboquant-redefining-ai-efficiency-with-extreme-compression/
🐍 полезные ресурсы 🚀Max
@data_analysis_ml
OpenAI переименовала продуктовое подразделение Фиджи Симо в «AGI Deployment», буквально «Развёртывание ИИО». Сэм Альтман параллельно заявил, что следующая языковая модель является «очень сильной», и добавил, что она «реально ускорит экономику».
Два варианта интерпретации: либо OpenAI действительно достигла искусственного общего интеллекта, либо это самый масштабный PR-ход в истории технологий. Сообщество разделилось, мнения прямо противоположные.
🔗 https://x.com/kimmonismus/status/2036547535272296516
Please open Telegram to view this post
VIEW IN TELEGRAM
Архитектура Docker, если убрать лишнее, выглядит очень просто:
Есть образ (image) - это слепок приложения с зависимостями.
Один раз собрал - запускаешь где угодно.
Есть контейнер (container) - это уже запущенный образ.
По сути изолированный процесс с файловой системой, сетью и настройками.
Docker Engine - сердце всей системы.
Он принимает команды через CLI/API и управляет контейнерами.
Docker Daemon - фоновый процесс, который:
• создаёт контейнеры
• запускает их
• следит за состоянием
Docker Client - то, через что ты работаешь (docker CLI).
Docker Hub / Registry - место, где хранятся образы.
Оттуда ты делаешь pull, туда - push.
Как это работает в реальности:
Ты пишешь Dockerfile →
docker build → получаешь image
docker push → отправляешь в registry
На сервере:
docker pull → скачал
docker run → запустил контейнер
Зачем это:
Одинаковая среда везде (dev = prod)
быстрый деплой без «у меня работает»
изоляция сервисов
масштабирование через контейнеры
Если упростить до одной мысли:
Docker - это не про контейнеры.
Это про предсказуемый запуск кода в любой среде.
Есть образ (image) - это слепок приложения с зависимостями.
Один раз собрал - запускаешь где угодно.
Есть контейнер (container) - это уже запущенный образ.
По сути изолированный процесс с файловой системой, сетью и настройками.
Docker Engine - сердце всей системы.
Он принимает команды через CLI/API и управляет контейнерами.
Docker Daemon - фоновый процесс, который:
• создаёт контейнеры
• запускает их
• следит за состоянием
Docker Client - то, через что ты работаешь (docker CLI).
Docker Hub / Registry - место, где хранятся образы.
Оттуда ты делаешь pull, туда - push.
Как это работает в реальности:
Ты пишешь Dockerfile →
docker build → получаешь image
docker push → отправляешь в registry
На сервере:
docker pull → скачал
docker run → запустил контейнер
Зачем это:
Одинаковая среда везде (dev = prod)
быстрый деплой без «у меня работает»
изоляция сервисов
масштабирование через контейнеры
Если упростить до одной мысли:
Docker - это не про контейнеры.
Это про предсказуемый запуск кода в любой среде.
Подразделение Research анонсировало TurboQuant, алгоритм векторного квантования, объединяющий 2 других метода - QJL и PolarQuant, который решает проблему увеличения KV-кэша при работе с длинным контекстом.
TurboQuant будет представлен на ICLR 2026, PolarQuant - на AISTATS 2026.
KV-кэш хранит промежуточные представления токенов, чтобы модель не пересчитывала их на каждом шаге генерации. С ростом контекста он превращается в узкое место по памяти.
Обычное векторное квантование сжимает эти данные, но вносит накладные расходы: для каждого блока нужно хранить константы квантования в полной точности, а это плюс 1–2 бита на элемент, что частично обесценивает само сжатие.
Сначала PolarQuant: случайный поворот выравнивает геометрию векторов, после чего они переводятся из декартовых координат в полярные (радиус и угол). Распределение углов оказывается предсказуемым и сконцентрированным, поэтому нормализация и хранение дополнительных констант становятся больше не нужны.
На втором этапе подключается QJL, метод на основе преобразования Джонсона-Линденштраусса, который кодирует остаточную ошибку первого этапа всего одним знаковым битом и через встроенную оценочную функцию сочетает высокоточный запрос с низкоточными сжатыми данными, корректно вычисляя attention score.
Ни один из методов не требует обучения или дообучения и работает в режиме "без предварительного анализа набора данных".
Алгоритмы тестили на бенчмарках для длинного контекста: LongBench, Needle In A Haystack, ZeroSCROLLS, RULER и L-Eval с моделями Gemma и Mistral.
При квантовании KV-кэша до 3 бит TurboQuant показал нулевую деградацию точности на всех задачах: поиск «иголки в стоге сена», QA, генерация кода, суммаризация.
Объем KV-кэша при этом сократился в 6 раз. На H100 четырехбитный TurboQuant ускорил вычисление attention-логитов до 8 раз по сравнению с 32-битными ключами.
Область применения не ограничивается KV-кэшем. В экспериментах с высокоразмерным векторным поиском TurboQuant стабильно превзошел по recall методы PQ и RaBitQ несмотря на то, что те использовали крупные код-буки и подстройку под конкретный датасет.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Пропускную способность ТСПУ увеличат в 2,5 раза, до 954 Тбит/с к 2030 году. Такая мощность позволит анализировать весь трафик рунета с запасом под его естественный прирост. Всё ради обеспечения «сетевого суверенитета и информационной безопасности».
Так будет легче вводить всё новые блокировки и гасить всё новые и новые обходы. На апгрейд потратят 15 млрд рублей — общая стоимость проекта составит 84 млрд рублей.
Времени мало, готовимся
Please open Telegram to view this post
VIEW IN TELEGRAM
Генератор видео добавили в CapCut, он постепенно появляется у пользователей в разделах AI Lab и AI Generator. В десктопном приложении — в AI Video. Нейронка также есть в сервисе Dreamina.
Уже можно потестить в Индонезии, Таиланде, Вьетнаме, Бразилии, Мексике и на Филиппинах.
• Попробовать
#neural #нейросети
@aiaiai
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
3 млн подписчиков за 12 дней, и все на ИИ-слопе. В TikTok появился, вероятно, самый быстрорастущий аккаунт в истории.
На @ai.cinema021 в день выходят несколько роликов, каждый в среднем набирает ~15 млн просмотров. Сюжет повторяет сериал Love Island, только с фруктами вместо людей.
При такой стате аккаунт может приносить автору каждый день до $10 тыс. (~₽830 тыс.) только от просмотров.
@typespace
На @ai.cinema021 в день выходят несколько роликов, каждый в среднем набирает ~15 млн просмотров. Сюжет повторяет сериал Love Island, только с фруктами вместо людей.
При такой стате аккаунт может приносить автору каждый день до $10 тыс. (~₽830 тыс.) только от просмотров.
@typespace
Да, MonoDev Music подтянет вам на телефон всю лицензионную музыку в лучшем качестве бесплатно. И всё это с удобным интерфейсом.
• Никакой рекламы и подписок
• Слушать музыку можно даже без интернета
• Все любимые мировые звезды без цензуры
• Музыку можно слушать в формате FLAC — это максимальное качество звука
• Плейлисты, рекомендации и гибкий поиск
• Музыка стримится с огромной библиотеки Monocrome — полной копии стриминга Tidal
• Вес приложухи — всего 7 МБ! Она просто летает.
Ставится MonoDev просто — через обычный APK.
Версия на Android — на ГитХабе.
Веб-версия Monochrome — тут.
Please open Telegram to view this post
VIEW IN TELEGRAM
Как получилось OpenAI закрывает SORA
Вчера вечером OpenAI объявили, что прощаются с SORA. На самом деле, решение было не то чтобы ожидаемым, но лежало на поверхности. И вот почему:
1. Главное это юнитэкономика, вероятно, очень далека от того, чтобы сойтись. Публичные оценки доходят до $15 млн/день вычислительных затрат (≈ $5+ млрд/год в пересчете), при том что сама компания через руководителя Sora публично называла экономику «неустойчивой». Несложные расчеты, даже основанные только на прайсе в API, показывают, что маржа каждого ролика sora‑2, скорее всего, отрицательна.
2. При этом другие метрики далеки от привычных OpenAI. Если у ChatGPT WAU и ретеншен пользователя запредельные, то у SORA аналитики из a16z насчитали retention < 8% на 30‑й день. Хотя приложение и скачивали очень активно в самом начале, но охваты оно не держит.
2. В начале года OpenAI сами говорили, что компьют – их главный ресурс. Логично, что они стараются перераспределить его разумно, и сверхдорогой видеопродукт становится в этой картине самым стратегически уязвимым. Так что это в первую очередь решение высвободить мощности для других направлений.
Кстати, важная деталь: исходная формулировка «We’re saying goodbye to Sora» была уточнена до «We’re saying goodbye to the Sora app», так что тут трактовка уже несколько другая. Возможно, ричерч подразделение видеомоделей все-таки продолжит работать.
Вчера вечером OpenAI объявили, что прощаются с SORA. На самом деле, решение было не то чтобы ожидаемым, но лежало на поверхности. И вот почему:
1. Главное это юнитэкономика, вероятно, очень далека от того, чтобы сойтись. Публичные оценки доходят до $15 млн/день вычислительных затрат (≈ $5+ млрд/год в пересчете), при том что сама компания через руководителя Sora публично называла экономику «неустойчивой». Несложные расчеты, даже основанные только на прайсе в API, показывают, что маржа каждого ролика sora‑2, скорее всего, отрицательна.
2. При этом другие метрики далеки от привычных OpenAI. Если у ChatGPT WAU и ретеншен пользователя запредельные, то у SORA аналитики из a16z насчитали retention < 8% на 30‑й день. Хотя приложение и скачивали очень активно в самом начале, но охваты оно не держит.
2. В начале года OpenAI сами говорили, что компьют – их главный ресурс. Логично, что они стараются перераспределить его разумно, и сверхдорогой видеопродукт становится в этой картине самым стратегически уязвимым. Так что это в первую очередь решение высвободить мощности для других направлений.
Кстати, важная деталь: исходная формулировка «We’re saying goodbye to Sora» была уточнена до «We’re saying goodbye to the Sora app», так что тут трактовка уже несколько другая. Возможно, ричерч подразделение видеомоделей все-таки продолжит работать.
🚨 В Реале начали принимать решения по ChatGPT
Бывший нутрициолог рассказал, что игрокам подбирали добавки просто по ответам из чата
И это не единственный случай
Самое дикое врачи клуба лечили Мбаппе не то колено.
После этого уволили весь медштаб
И, по словам инсайдов, решение об уволнении тоже принимали с участием чат-бота.
Если слепо доверять ИИ топ клуб может скатиться в дивизион пониже.
https://dailysports.net/news/former-real-madrid-nutritionist-suggests-current-medical-staff-use-chatgpt/
Бывший нутрициолог рассказал, что игрокам подбирали добавки просто по ответам из чата
И это не единственный случай
Самое дикое врачи клуба лечили Мбаппе не то колено.
После этого уволили весь медштаб
И, по словам инсайдов, решение об уволнении тоже принимали с участием чат-бота.
Если слепо доверять ИИ топ клуб может скатиться в дивизион пониже.
https://dailysports.net/news/former-real-madrid-nutritionist-suggests-current-medical-staff-use-chatgpt/
Держитесь за стулья:
• Проблема наблюдается и на мобильном, и на домашнем интернете — отключают ВСЁ!
• Телеграм провайдеры оценивают как «подозрительную активность» и блочат соединение.
• Пока проблему зафиксировали только в Краснодарском крае, но она может стать МАССОВОЙ!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Подбора для тех, кто хочет стать сертифицированным архитектором Claude
Полезные ресурсы для подготовки в одном месте 👇
• Запись на сертификацию: https://anthropic.skilljar.com/claude-certified-architect-foundations-access-request
• Обучение (13 бесплатных курсов):
https://anthropic.skilljar.com
• Cookbook (примеры и практики):
https://github.com/anthropics/anthropic-cookbook
• Гайд к экзамену:
https://share.google/0eqIbebzRMUt8KTc8
• Практические вопросы:
http://claudecertifications.com
• Документация MCP:
http://modelcontextprotocol.io
API документация:
http://docs.anthropic.com
Полезный playbook:
https://drive.google.com/file/d/1luC0rnrET4tDYtS7xe5jUxMDZA-4qNf-/view
🐍 полезные ресурсы 🚀Max
@machinelearning_interview
Полезные ресурсы для подготовки в одном месте 👇
• Запись на сертификацию: https://anthropic.skilljar.com/claude-certified-architect-foundations-access-request
• Обучение (13 бесплатных курсов):
https://anthropic.skilljar.com
• Cookbook (примеры и практики):
https://github.com/anthropics/anthropic-cookbook
• Гайд к экзамену:
https://share.google/0eqIbebzRMUt8KTc8
• Практические вопросы:
http://claudecertifications.com
• Документация MCP:
http://modelcontextprotocol.io
API документация:
http://docs.anthropic.com
Полезный playbook:
https://drive.google.com/file/d/1luC0rnrET4tDYtS7xe5jUxMDZA-4qNf-/view
🐍 полезные ресурсы 🚀Max
@machinelearning_interview
Стив Возняк говорит, что ИИ его разочаровывает и поэтому он почти им не пользуется.
Но дело не только в этом.
Он указывает на более глубокую проблему:
ценность человека - не в точности.
Люди приносят то, чего ИИ пока не хватает:
контекст, интонацию, чувство важного, понимание ситуации.
И когда ответы ИИ кажутся «слишком идеальными» и «слишком сухими» -
это не просто вопрос стиля.
Это разрыв между генерацией текста
и реальным пониманием.
techspot.com/news/111806-steve-wozniak-disappointed-lot-ai-rarely-uses.html
Но дело не только в этом.
Он указывает на более глубокую проблему:
ценность человека - не в точности.
Люди приносят то, чего ИИ пока не хватает:
контекст, интонацию, чувство важного, понимание ситуации.
И когда ответы ИИ кажутся «слишком идеальными» и «слишком сухими» -
это не просто вопрос стиля.
Это разрыв между генерацией текста
и реальным пониманием.
techspot.com/news/111806-steve-wozniak-disappointed-lot-ai-rarely-uses.html
Вот это предприниматель! 20-летний IT-темщик получает по 2️⃣ 7️⃣ 0️⃣ тысяч рублей в месяц — у чела нет опыта работы, и он вообще ничего не делает целыми днями. Приготовьтесь к офигенной истории из айтишки 2026 года.
Парень натуральной понял главное правило современных разрабов: «Не надо уметь кодить, главное — уметь проходить собеседования». Сверхразум просто зазубрил ответы на топ-200 вопросов для собесов и вообще без опыта устроился на первую работу. Для второй ментор подкинул ему записи с реальных собесов, и всё снова выгорело.
Теперь чел работает в банке и получает 270 тысяч, но и это ещё не всё. Первое время он вообще просто скидывал все задачи нейронкам и тупо копипастил ответы сеньорам — в день уходило по 3 часа. Со временем ему надоело делать даже это, темщик нанял другого гения за 170 тысяч и с концами перестал работать. Дальнейший план — стать ментром.
А вы всё ещё не можете найти работу
👍 Бэкдор
Парень натуральной понял главное правило современных разрабов: «Не надо уметь кодить, главное — уметь проходить собеседования». Сверхразум просто зазубрил ответы на топ-200 вопросов для собесов и вообще без опыта устроился на первую работу. Для второй ментор подкинул ему записи с реальных собесов, и всё снова выгорело.
Теперь чел работает в банке и получает 270 тысяч, но и это ещё не всё. Первое время он вообще просто скидывал все задачи нейронкам и тупо копипастил ответы сеньорам — в день уходило по 3 часа. Со временем ему надоело делать даже это, темщик нанял другого гения за 170 тысяч и с концами перестал работать. Дальнейший план — стать ментром.
А вы всё ещё не можете найти работу
Please open Telegram to view this post
VIEW IN TELEGRAM