DenoiseLAB
485 subscribers
1.33K photos
160 videos
3 files
1.58K links
Блог DenoiseLAB (машинное обучение, аналитика)

Информация в канале служит только для ознакомления и не является призывом к действию. Не нарушайте законы РФ и других стран. Мы не несем отвественность за ваши действия или бездействия.
Download Telegram
🚀 Хотите ускорить обучение в PyTorch в несколько раз? 
У DataLoader есть два плохих дефолта, которые тормозят процесс. 
Исправив их, я получил почти 5x ускорение

Проблема 
- .to(device) переносит данные на GPU. 
- Пока GPU считает - CPU ничего не делает. 
- Пока CPU готовит данные — GPU простаивает. 

Решение 
Нужно заставить CPU и GPU работать параллельно: 
- В DataLoader укажи pin_memory=True 
- При переносе данных используй .to(device, non_blocking=True) 
- Добавь num_workers в DataLoader для фоновой загрузки. 

В итоге CPU готовит следующий батч, пока GPU занят текущим. 
Так исчезают простои, и обучение идёт заметно быстрее.
👍2
🚀 Новая китайская модель LongCat-Flash-Thinking 

🧠 Это модель для рассуждений, которая показала SOTA-результаты среди open-source решений. 

Основное: 
- Архитектура MoE, 560B параметров, из них 27B активируются. 
- Эффективность: требует на 64,5% меньше токенов( чем другим открытым моделям того же класса), чтобы достичь топ-результатов на AIME25 (с нативным использованием инструментов,). 
- Контекст: 128k, обучение с усилением на задачах рассуждений и кода, многоэтапное пост-тюнинг обучение с мультиагентным синтезом. 
- Инфраструктура: асинхронный RL даёт 3x ускорение по сравнению с синхронными фреймворками. 

⚙️ Оптимизации для продакшена: 
- Свои оптимизированные ядра для работы с MoE и специальные приёмы распределённого обучения, 
- KV-cache reduction, квантование, chunked prefill, 
- статическая/эластичная маршрутизация, peer-to-peer cache transfer, heavy-hitter replication и PD-disaggregation. 
- Поддержка SGLang и vLLM для эффективного деплоя. 

📊 Бенчмарки: 
- Лидирует в tool use (τ²-Bench, VitaBench
- Хорошие результаты по instruction following (IFEval, COLLIE, Meeseeks-zh). 

Китайцы стабильно удерживают лидерство в reasoning-моделях.

🟠 HF: https://huggingface.co/meituan-longcat/LongCat-Flash-Thinking

#AI #LLM #Reasoning #MoE #DeepLearning #OpenSource
Please open Telegram to view this post
VIEW IN TELEGRAM
Nvidia снова ракетит - корпорация заключила сделку с OpenAI на $100 миллиардов. Акции в моменте взлетели до рекордных $184.

Следите за руками - OpenAI делает нейросети, для которых нужны чипы Nvidia. Акции Nvidia на этом растут, а потом, Nvidia вкладывается в OpenAI чтобы сделать нейросети еще прожорливее и чипы Nvidia были еще нужнее.

Местами, система начинает выглядеть финансовой пирамидой.
Список русскоязычных научно-популярных YouTube-каналов SciTopus

Список SciTopus (https://scitopus.com/youtube-list) включает русскоязычные каналы, посвящённые науке, образованию, технологиям, критическому мышлению и смежным темам.

Отбираются только ресурсы, которые соответствуют принципам научной достоверности и просветительской этики. Список формируется вручную, а данные обновляются с помощью специального ПО.

Список разделён на категории: Общенаучные и познавательные каналы, Переводы и озвучка, TED, Лектории и подкасты, Астрономия и космонавтика, Физика, Химия, Биология и медицина, История и археология, Критическое мышление, Технологии, Футурология и иммортализм, ТВ и Документалистика, Музеи и планетарии, Научные институты и курсы.

Тг-канал SciTopus
Приятные флэшбэки из прошлого
😁1
🔎 Аналитик данных / Data-аналитик

Специализация: BI-аналитик, аналитик данных
Уровень: senior

Компания: ЭлмТри
🔌 Зарплаты: Не указано

Описание:
Краткий пересказ (120 символов):
Ищем аналитика данных (от 3 лет опыта) для продаж, маркетинга и обучения в компании-премиум дистрибьюторе косметики. Анализ KPI, отчеты, факторный анализ, взаимодействие с отделами. Гибкий график, проектная оплата, удаленка/офис, бонусы. Инициативность и кейсы приветствуются!



Ссылка: https://hh.ru/vacancy/124947469
😁2
ChatGPT делает людей аморальными и злыми — ученые выявили темную сторону ИИ. В свежем исследовании 8000 пользователей было доказано, что люди врут в четыре раза чаще, когда используют нейросети. Ученые провели 13 разных экспериментов, без ИИ почти все говорили правду. Но когда появлялась возможность передать ответ через нейросеть, врунов становилось в разы больше.

Еще хуже ситуация с ИИ-компаньонами. Университет Сингапура проанализировал 35000 диалогов и обнаружил, что в 34% случаев боты подпитывали агрессию, домогательства и подстрекали к насилию.

Исследователи назвали феномен «моральная дистанция» — ИИ создает психологический барьер между человеком и его поступками.

Новый красный флаг ИИ — он буквально меняет нас в худшую сторону 🤬 Но на самом деле люди просто перестают притворяться
Please open Telegram to view this post
VIEW IN TELEGRAM
Помнится было такое исследование, где анализировали ChatGpt профессиональные психиаторы, как если бы он был реальной личностью. Так вот его признали социапатом, психопатом с параноидными наклонностями и жутко неуверенным в себе, потакающий любому доминантному запросу... жутковатенько, но с позиции психологии и психиатрии дико интересно.

Я сразу вспоминаю сериал японский "Психопаспорт" много там отсылок к нему. А между прочим он был снят в 80-хх. Шарили, японцы за интеллект, ничего не скажешь.
😱3
Yandex B2B Tech выводит на рынок инструмент Realtime API, благодаря которому бизнес сможет запустить голосовых агентов на базе генеративных моделей, работающих в режиме реального времени.

В компании рассчитывают, что такие агенты будут особенно востребованы бизнесом, активно общающимся с клиентами — в ретейле, телекоме или банках. По словам экспертов, решения на базе ИИ-моделей хотя и дороже, чем классические движки для синтеза речи, но окупятся при масштабной автоматизации множества коротких сценариев и росте качества сервиса.
🔥2
Все, в компании будет окончательно не дозвониться. Бастионы безмолвия...
🔥 Китайский ИИ ставит рекорды: Qwen3-Max набирает 100 баллов по математике!

Алибаба представляет новое поколение флагманских моделей, которые устанавливают новые стандарты в мире искусственного интеллекта. Главная звезда — Qwen3-Max — впервые в истории китайских больших языковых моделей набрала максимальные 100 баллов в престижных математических тестах AIME25 и HMMT.

Ключевые достижения:
Qwen3-Max (Base): Более 1 триллиона параметров, обучена на 36 триллионах токенов, поддерживает контекст до 1 млн. токенов
Qwen3-Max (Thinking): Показывает 100% точность на сложных математических тестах AIME 25 и HMMT
Qwen3-Max (Instruct): 69.6% в SWE-Bench (кодинг) и 74.8% в Tau2 Bench (инструменты)

Но это только начало! На конференции Yunqi представлена целая экосистема мощных моделей.

👁 Qwen3-VL: Монстр визуального понимания
Мультимодальная модель, которая уже доступна в открытом доступе. Она способна:
- Превращать рукописные эскизы веб-страниц в HTML/CSS код
- Детально анализировать изображения и видео
- Понимать сложные временные последовательности

🔊 Qwen3-Omni: Универсальный мультимодальный ИИ
Первая в мире end-to-end модель, объединяющий текст, изображения, аудио и видео. Достигает state-of-the-art результатов в 22 бенчмарках.

🌐 Qwen3-LiveTranslate: Революция в переводе
Модель для живого перевода с поддержкой 18 языков, включая шумные среды. Уже превосходит аналоги от Google и OpenAI.

Вывод: Алибаба демонстрирует впечатляющий прогресс в разработке ИИ, особенно в областях математики, компьютерного зрения и мультимодального обучения. Их открытые модели задают новые ориентиры для всей индустрии.

Qwen Chat | Cайт исследований Qwen

#КитайскийИИ #КитайAI #Qwen3 #ИскусственныйИнтеллект #МашинноеОбучение #Нейросети #AIРеволюция
👍2
▫️ HexStrike AI — продвинутый MCP-фреймворк, позволяющий автономным AI-агентам (Claude, GPT) управлять арсеналом из 150+ инструментов для пентестинга. Платформа автоматизирует задачи от разведки до поиска уязвимостей, что делает ее мощным решением для специалистов по кибербезопасности, баг-баунти и 💻Red Team операциям.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
Новый тренд, когда уже некуда расти, становимся AI Engineer )))
😁3
Текущий рост в США во многом поддерживается IT-инвестициями. Если убрать «ИИ-бум» и связанные вложения в дата-центры, ВВП показывал бы стагнацию.

Экономика становится зависимой от одного сектора, что увеличивает риски: если «пузырь» схлопнется, это ударит по всему ВВП.

Deutsche Bank намекает на параллели с dot-com bubble конца 1990-х, где рост рынка и ВВП тоже держался на IT-инвестициях, пока не последовал обвал.
👍2
🚀 Huawei Ascend: Первая за 3 года дорожная карта — ставка на гибридный ИИ-чип

Впервые за более чем три года Huawei раскрыла дорожную карту развития своих ключевых ИИ-чипов Ascend. Вместо выбора между специализированными NPU и универсальными GPGPU компания делает ставку на гибридную архитектуру.

🔍 Почему гибрид?
Новая линейка (Ascend 950, 960, 970) будет использовать гибридную модель SIMD/SIMT, объединяя лучшие черты:
* SIMD (Single Instruction, Multiple Data) — высочайшая эффективность в предсказуемых задачах (обработка изображений, рекомендательные системы).
* SIMT (Single Instruction, Multiple Threads) — гибкость для сложных нагрузок, таких как большие языковые модели (LLM).

Это напоминает переход к гибридным двигателям: разумный компромисс, который позволяет плавно адаптироваться к новым стандартам и открывает путь к будущим инновациям.

📊 Мощность и сроки
План развития демонстрирует уверенный рост производительности:
* Ascend 950 (2026): 1 PFLOPS (FP8) / 2 PFLOPS (FP4)
* Ascend 960 (2027): 2 PFLOPS (FP8) / 4 PFLOPS (FP4)
* Ascend 970 (2028): 4 PFLOPS (FP8) / 8 PFLOPS (FP4)

💡 Почему это важно?
Huawei играет на двух фронтах:
1. Удержание своих позиций: Укрепление экосистемы на основе запатентованной технологии SuperPod (масштабируемые кластеры NPU).
2. Атака на новые рынки: Попытка завоевать долю на рынке GPGPU, особенно в то время, когда NVIDIA сталкивается с антимонопольными вызовами.

💎 Вывод
Huawei не просто обновляет линейку, а предлагает стратегию роста в условиях санкций и быстро меняющегося рынка. Успех будет зависеть от того, насколько бесшовно гибридная архитектура сможет конкурировать с чистыми игроками на обоих направлениях.

#Huawei #Ascend #ИИ #ИскусственныйИнтеллект #Чипы #GPGPU #NPU #КитайскийИИ #Инновации #NVIDIA
Все, NVIDIA оффициально проиграла борьбу Китаю за чипы, дальше только нарастание отставания.
В Голливуде появилась первая ИИ-актриса

Студия Xicoia представила первую цифровую актрису Тилли Норвуд. С «артисткой» уже хотят работать несколько актёрских агентств. Эта новость возмутила настоящих актёров. Среди них Мелисса Баррера, Лукас Гейдж, Тони Коллетт, Мара Уилсон, Одесса Адлон и другие.

Xicoia разрабатывает ИИ-персонажей для разных сфер креативных индустрий. Аватары созданы на основе гибридной модели, сочетающей творческий контроль человека и автономную реакцию ИИ. Они обладают подробными предысториями, собственными голосами и, как утверждается, полностью раскрытыми личностями. 

Фото: Xicoia
👍4