DenoiseLAB
480 subscribers
1.36K photos
171 videos
3 files
1.67K links
Блог DenoiseLAB (машинное обучение, аналитика)

Информация в канале служит только для ознакомления и не является призывом к действию. Не нарушайте законы РФ и других стран. Мы не несем отвественность за ваши действия или бездействия.
Download Telegram
⏱️ TimesFM 2.5 — предобученная модель для прогнозирования временных рядов, которая отлично работает в zero-shot «из коробки».

📌 Характеристики:
- 200M параметров (было 500M)
- Контекст 16k (было 2k)
- Доступна на Hugging Face
- Лицензия Apache 2.0

#TimeSeries #Forecasting #AI #ML #OpenSource

https://huggingface.co/google/timesfm-2.5-200m-pytorch
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2
✔️ NVIDIA представила исследование NVFP4: новый формат чисел для обучения больших языковых моделей, который использует всего 4 бита на число вместо привычных 8 или 16.

При этом точность почти не теряется, а вычисления становятся в 2–3 раза быстрее, а потребление памяти снижается на 50%.

В эксперименте NVIDIA обучила 12-миллиардный Mamba Transformer на 10 триллионах токенов, и модель с 4-битным NVFP4 показала почти такую же точность, как и FP8:
на тесте MMLU Pro - 62.58% против 62.62%,
а по коду (MBPP+) - 55.91% против 59.11%.

NVFP4 группирует значения в блоки по 16 чисел. Для каждого блока хранится небольшой масштаб в 8 битах, а для всего тензора - глобальный масштаб в 32 битах. Такая структура сохраняет точность локальных и экстремальных значений, позволяя использовать сверхкомпактное 4-битное хранение без потери устойчивости обучения.

На GPU Blackwell операции FP4 выполняются в 2 раза быстрее на GB200 и в 3 раза 0 на GB300, по сравнению с FP8. Потери точности при валидации не превышают 1–1.5%.

Метод также использует стохастическое округление, чтобы избежать накопления ошибок, а переход на BF16 в последних итерациях обучения полностью убирает оставшуюся разницу.

Поддержка NVFP4 уже встроена в Transformer Engine и новое поколение GPU Blackwell.
Please open Telegram to view this post
VIEW IN TELEGRAM
🚀 Китайский ИИ-гигант Alibaba выпустил Qwen3.5-Plus: самая мощная и при этом самая дешёвая открытая языковая модель

В канун Лунного Нового года команда Qwen представила новую модель, которая сочетает в себе топовую производительность с революционно низкой стоимостью.

Суть прорыва:
Сильнее конкурентов: Qwen3.5-Plus бьёт рекорды среди открытых моделей в ключевых задачах: мультимодальное понимание, сложные рассуждения, программирование, работа как AI-агент. По многим тестам она догоняет или превосходит лидеров — GPT-4o, Gemini 2.0 Pro.
Дешевле всех: Стоимость использования — всего ¥0.8 за 1 млн токенов. Для сравнения: у Gemini 3 Pro цена в 18 раз выше.

Это стало возможным благодаря радикальной оптимизации архитектуры. Модель использует всего 397 млрд параметров (из них активно во время генерации — только 17 млрд), но обгоняет по качеству свою же предшественницу с триллионом параметров. Результат: снижение стоимости развёртывания на 60% и увеличение скорости обработки запросов до 19 раз!

🔬 Технические детали: как им это удалось?
Ключ к успеху — четыре инновации:
1. Гибридный механизм внимания (Hybrid Attention): Модель научилась «читать с выделением главного», динамически распределяя вычислительные ресурсы между важными и второстепенными частями текста. Это резко сокращает затраты на обработку длинных контекстов.
2. Предельно разреженная архитектура MoE (Mixture of Experts): Из почти 400 млрд параметров для ответа на каждый запрос активируется лишь ~17 млрд. Это позволяет использовать всю «базу знаний» модели, тратя менее 5% от полной вычислительной мощности.
3. Нативное предсказание нескольких токенов (Native Multi-Token Prediction): Вместо последовательного «проговаривания» слов модель учится предсказывать несколько следующих токенов сразу. Это почти удваивает скорость генерации в таких сценариях, как написание кода или длинных текстов.
4. Глубокие оптимизации стабильности обучения: Внедрение механизма «внимания с затвором» (Gated Attention), удостоенного награды NeurIPS 2025, позволило эффективно фильтровать шум и сохранять ключевую информацию в очень длинных контекстах.

👁️ Настоящая «родная» мультимодальность
В отличие от многих моделей, где возможности работы с изображением и видео — это просто «надстройка» над текстовым ядром, Qwen3.5-Plus обучалась на смешанных данных (текст + изображения) с самого начала. Это обеспечивает глубокое, интуитивное понимание контента без потерь качества в текстовых задачах.

💎 Вывод
Выход Qwen3.5-Plus — это сигнал о смене парадигмы: гонка ИИ смещается с погони за максимальной производительностью любой ценой к созданию доступной инфраструктуры. Благодаря связке открытой модели, облачной платформы Alibaba Cloud и собственных чипов, компания одновременно решает проблемы «можно ли использовать» и «по карману ли это». Именно так технологии становятся массовыми.

Чат | Блог ModelScope | HuggingFace

#КитайскийИИ #КитайAI #Qwen #Alibaba
🤨3🔥2
DenoiseLAB
🚀 Китайский ИИ-гигант Alibaba выпустил Qwen3.5-Plus: самая мощная и при этом самая дешёвая открытая языковая модель В канун Лунного Нового года команда Qwen представила новую модель, которая сочетает в себе топовую производительность с революционно низкой…
Я даже не удивлюсь если скоро бигтехи начнут арендовать домашние тачки обычных юзеров, которые далеки вообще от ИИ. Оперативка и рост цен на комплектующие играют на этот тренд.
DenoiseLAB
Я даже не удивлюсь если скоро бигтехи начнут арендовать домашние тачки обычных юзеров, которые далеки вообще от ИИ. Оперативка и рост цен на комплектующие играют на этот тренд.
Китайцы не просто так сделали фестиваль QWEN в прошлом году, они поняли, мощности дело хорошее свои, но нужна сеть государственная чтобы и дальше все бустить.
🤖 Роботы-гуманоиды освоили кунг-фу и покорили сцену Китайского Нового Года!

В этом году шоу на CCTV было особенным: китайская компания Unitree Robotics в третий раз выступила партнером «Вечера Весны» и представила первое в мире полностью автономное групповое ушу-выступление человекоподобных роботов. Это был не просто танец, а сложнейшая демонстрация силы, точности и координации.

Что они показали?
Роботы выполнили серию технически невероятных трюков:
• Прыжки с переворотом через столы (фриран/паркур)
• Сальто с места («катапультное» сальто)
• Несколько подряд сальто на одной ноге
• Сложные вращения в воздухе (Airflare)
• Владение мечом, шестом и другими традиционными видами оружия

Как им это удалось? Три главных технических вызова
1. Работа с предметами (меч, шест). Сложность — в динамическом восприятии и адаптивном управлении. Как и человек, робот должен «чувствовать» оружие. Для этого использовалось физическое моделирование и обучение с подкреплением в симуляциях.
2. Взаимодействие со средой (прыжки через препятствия, отталкивание от стен). Ключевая проблема — сверхточная оценка позиции и корректировка точек приземления в реальном времени во время быстрого движения.
3. Акробатика. Воздушные вращения — это предел для «железа», двигателей, систем управления и позиционирования. Команде пришлось комплексно улучшать все компоненты, чтобы добиться сантиметровой точности приземления после сальто.

Самое впечатляющее: полная автономность
Все десятки роботов действовали без дистанционного управления. Каждый сам ориентировался на сцене с помощью 3D-лидара, получал общие координаты от центрального сервера и самостоятельно выполнял свою часть программы. Система AI-позиционирования справлялась даже с помехами от актеров и меняющихся декораций, обеспечивая миллисекундную синхронизацию. Если робот сбивался с пути, он мог самостоятельно и быстро вернуться на нужную траекторию.

Полное видео выступления здесь

#КитайскийИИ #КитайAI #Робототехника #Unitree
"Не обесценивай свой прогресс - играй в долгую" - фраза дня. Факт, да есть такое, прочитал у одного коллеги. Как же точно сказано.
Аудиофилы не смогли отличить Hi-Fi кабель от грязи и банана😂

В слепом тесте приняли участие убежденные аудиофилы, которые верили, что материал проводов критически важен для качества звука. Им дали прослушать несколько версий одного трека:
1-Оригинал с CD.
2-Через профессиональный медный кабель (180 см).
3-Через мокрую грязь (20 см).
4-Через микрофонный кабель, припаянный к монетам.
5- Через банан.

Результат: Из 43 попыток угадать, какой звук каким проводом был передан, правильными оказались только 6 (что соответствует уровню случайного угадывания). Более того, некоторые испытуемые назвали «грязь» лучшим вариантом звучания.

Примерное подобное можно услышать когда идет спор сгенеренное изображение или нет ))
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Собеседование будущего уже случилось: парень вместо себя отправил ИИ-аватара, а на стороне компании его встретил ИИ-эйчар — в итоге две нейросети зациклились и начали бесконечно нахваливать друг друга. Диалог получился на уровне Тарантино:
— Можете рассказать о себе?
— Конечно! Я увлечённый профессионал, который прекрасно работает в динамичной среде.
— Это действительно содержательный ответ.
— Спасибо! Вы абсолютно правы.
— Вы тоже абсолютно правы.
— Вы абсолютно правы насчёт этого.
— Мы оба абсолютно правы.
— Всё идёт очень хорошо.
— Так и есть.
— Вы абсолютно правы.
— Вы абсолютно правы.
— Вы абсолютно правы.
— Вы абсолютно правы.
— Вы абсолютно правы.


Скоро во всех конторах страны )))
😁5
🌐 Статья Сбера об «ИИ-мозге» Green-VLA робота Грина заняла первое место среди публикаций дня на Hugging Face.

Работа — открытое руководство по тренировке VLA-модели для роботов, чтобы они могли видеть объекты (Vision), понимать команды (Language) и выполнять их (Action).

Комбинация языковых и визуальных моделей в «ИИ-мозге» вместе с тренировкой на примерах и обучения с подкреплением позволяет роботу не просто копировать примеры из датасета, а целенаправленно выполнять действия и составлять планы, выстраивая подобие собственной «модели мира».
Please open Telegram to view this post
VIEW IN TELEGRAM
🇷🇺 «Сбер» выдал первый кредит, обеспеченный криптовалютой

Сбербанк провел пробную пилотную сделку по кредитованию российского майнинговой компании «Интелион». Обеспечением для займа стала криптовалюта, добытая самим майнером, сообщается в заявлении банка.

В сделке «Сбер» использовал собственную разработку для хранения криптовалюты с применением аппаратного решения «Рутокен».

По оценке банка, такой продукт будет актуален не только для майнеров, но и для любых компаний, у которых в собственности есть криптоактивы.

Ранее заместитель председателя правления Сбербанка Анатолий Попов в интервью РБК Крипто рассказал, что банк уже предлагает клиентам структурные облигации и ЦФА с инвестициями в биткоин, эфир и корзины криптоактивов, тестирует DeFi-инструменты и поддерживает поэтапную легализацию криптовалют в российском правовом поле.

Присоединяйтесь к форуму РБК Крипто | Подписаться на канал
HR просто на поооолном чиле ))) выбор кандидата - теперь просто бинарная функция (да/нет). Оценка навыков, знания, скилы, уникальные фишки, крутые решения, вылезания из авралов и т.д. и потому.... а не не слышали )))

Хотя есть и другой вариант накручивать резюмехи. ))
🔥3
Российские компании начали захватывать элэлеминги (от аббревиатуры LLM), и они только вредят бизнесу. Появилась целая прослойка ИИ-достигаторов, которые бесят коллег, создают лишнюю работу и показывают результаты, взятые из воздуха.

Всему виной повсеместное внедрение нейросетей. Они должны были помочь и оптимизировать работу. Но в итоге LLMенги делегируют креативность и критическое мышление ИИ, создавая целый ряд проблем.

• Джунам ИИ мешает учиться на своих ошибках и расти. Они просто передают результаты нейронок дальше, без анализа. Умение работать заменяется умением писать промпты;
• Мидлы из-за ИИ массово заражаются достигаторством. Нейросети позволяют генерировать бесконечный поток проектов. Которыми придётся заниматься другим коллегам;
• Сеньоры и руководители при использовании ИИ рискуют попасть в ловушку лести. Нейросеть поддержит любую идею Кабан Кабаныча и назовёт гениальной любую шизу. Это не только убивает самокритику, но и нередко нагружает горой бесполезной работы всех подчинённых.

А что же инвесторы? Инвесторы пока радуются взятыми из воздуха результатами внедрения ИИ, говорит эксперт РБК. Эти результаты готовы подтасовывать сами руководители, чтобы доказать свою эффективность и заработать бонусы. Ну или действительно верят лукавым словам нейросети, что их достижения правда великие.

P.S. Просто какая-то свалка )))
🤷‍♂1
🐋 Как киты помогут понять инопланетян?

Если человечество до сих пор толком не понимает разумных существ на Земле, то шанс понять сигналы инопланетян почти нулевой. Поэтому команда проекта Whale-SETI учится искать смысл в общении совсем не похожих на людей существ — горбатых китов.

В 2021 году ученые 20 минут беседовали с китом по кличке Твейн. Они проигрывали в море сигнал приветствия китов, а Твейн отвечал, соблюдая очередность в диалоге. Так ученые впервые наладили устойчивый протокол обмена информацией с «нечеловеческим разумом», где реакция не случайна и измерима.

На основе этого опыта ученые из Whale-SETI хотят создать «фильтры интеллекта» для космического шума, из которого можно будет вычленить сигналы других цивилизаций (если они, конечно, их посылают) и поддерживать контакт с отправителями.

В 2025 году у проекта появился еще один канал связи. Ученые заметили, что во время мирных сближений с людьми горбатые киты выдувают идеальные кольца пузырей под водой. Для Whale-SETI это важно, потому что коммуникация может быть не только звуковой: чем больше модальностей (звук, движение, форма), тем легче учиться распознавать намерение и структуру коммуникации.
Please open Telegram to view this post
VIEW IN TELEGRAM
1