🚀 Хотите ускорить обучение в PyTorch в несколько раз?
У DataLoader есть два плохих дефолта, которые тормозят процесс.
Исправив их, я получил почти 5x ускорение.
❌ Проблема
-
- Пока GPU считает - CPU ничего не делает.
- Пока CPU готовит данные — GPU простаивает.
⚡ Решение
Нужно заставить CPU и GPU работать параллельно:
- В
- При переносе данных используй
- Добавь
✅ В итоге CPU готовит следующий батч, пока GPU занят текущим.
Так исчезают простои, и обучение идёт заметно быстрее.
У DataLoader есть два плохих дефолта, которые тормозят процесс.
Исправив их, я получил почти 5x ускорение.
❌ Проблема
-
.to(device) переносит данные на GPU. - Пока GPU считает - CPU ничего не делает.
- Пока CPU готовит данные — GPU простаивает.
⚡ Решение
Нужно заставить CPU и GPU работать параллельно:
- В
DataLoader укажи pin_memory=True - При переносе данных используй
.to(device, non_blocking=True) - Добавь
num_workers в DataLoader для фоновой загрузки. ✅ В итоге CPU готовит следующий батч, пока GPU занят текущим.
Так исчезают простои, и обучение идёт заметно быстрее.
👍2
🚀 Новая китайская модель LongCat-Flash-Thinking
🧠 Это модель для рассуждений, которая показала SOTA-результаты среди open-source решений.
⚡ Основное:
- Архитектура MoE, 560B параметров, из них 27B активируются.
- Эффективность: требует на 64,5% меньше токенов( чем другим открытым моделям того же класса), чтобы достичь топ-результатов на AIME25 (с нативным использованием инструментов,).
- Контекст: 128k, обучение с усилением на задачах рассуждений и кода, многоэтапное пост-тюнинг обучение с мультиагентным синтезом.
- Инфраструктура: асинхронный RL даёт 3x ускорение по сравнению с синхронными фреймворками.
⚙️ Оптимизации для продакшена:
- Свои оптимизированные ядра для работы с MoE и специальные приёмы распределённого обучения,
- KV-cache reduction, квантование, chunked prefill,
- статическая/эластичная маршрутизация, peer-to-peer cache transfer, heavy-hitter replication и PD-disaggregation.
- Поддержка SGLang и vLLM для эффективного деплоя.
📊 Бенчмарки:
- Лидирует в tool use (τ²-Bench, VitaBench)
- Хорошие результаты по instruction following (IFEval, COLLIE, Meeseeks-zh).
Китайцы стабильно удерживают лидерство в reasoning-моделях.
🟠 HF: https://huggingface.co/meituan-longcat/LongCat-Flash-Thinking
#AI #LLM #Reasoning #MoE #DeepLearning #OpenSource
🧠 Это модель для рассуждений, которая показала SOTA-результаты среди open-source решений.
⚡ Основное:
- Архитектура MoE, 560B параметров, из них 27B активируются.
- Эффективность: требует на 64,5% меньше токенов( чем другим открытым моделям того же класса), чтобы достичь топ-результатов на AIME25 (с нативным использованием инструментов,).
- Контекст: 128k, обучение с усилением на задачах рассуждений и кода, многоэтапное пост-тюнинг обучение с мультиагентным синтезом.
- Инфраструктура: асинхронный RL даёт 3x ускорение по сравнению с синхронными фреймворками.
⚙️ Оптимизации для продакшена:
- Свои оптимизированные ядра для работы с MoE и специальные приёмы распределённого обучения,
- KV-cache reduction, квантование, chunked prefill,
- статическая/эластичная маршрутизация, peer-to-peer cache transfer, heavy-hitter replication и PD-disaggregation.
- Поддержка SGLang и vLLM для эффективного деплоя.
📊 Бенчмарки:
- Лидирует в tool use (τ²-Bench, VitaBench)
- Хорошие результаты по instruction following (IFEval, COLLIE, Meeseeks-zh).
Китайцы стабильно удерживают лидерство в reasoning-моделях.
#AI #LLM #Reasoning #MoE #DeepLearning #OpenSource
Please open Telegram to view this post
VIEW IN TELEGRAM
huggingface.co
meituan-longcat/LongCat-Flash-Thinking · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
Nvidia снова ракетит - корпорация заключила сделку с OpenAI на $100 миллиардов. Акции в моменте взлетели до рекордных $184.
Следите за руками - OpenAI делает нейросети, для которых нужны чипы Nvidia. Акции Nvidia на этом растут, а потом, Nvidia вкладывается в OpenAI чтобы сделать нейросети еще прожорливее и чипы Nvidia были еще нужнее.
Местами, система начинает выглядеть финансовой пирамидой.
Следите за руками - OpenAI делает нейросети, для которых нужны чипы Nvidia. Акции Nvidia на этом растут, а потом, Nvidia вкладывается в OpenAI чтобы сделать нейросети еще прожорливее и чипы Nvidia были еще нужнее.
Местами, система начинает выглядеть финансовой пирамидой.
Список русскоязычных научно-популярных YouTube-каналов SciTopus
Список SciTopus (https://scitopus.com/youtube-list) включает русскоязычные каналы, посвящённые науке, образованию, технологиям, критическому мышлению и смежным темам.
Отбираются только ресурсы, которые соответствуют принципам научной достоверности и просветительской этики. Список формируется вручную, а данные обновляются с помощью специального ПО.
Список разделён на категории: Общенаучные и познавательные каналы, Переводы и озвучка, TED, Лектории и подкасты, Астрономия и космонавтика, Физика, Химия, Биология и медицина, История и археология, Критическое мышление, Технологии, Футурология и иммортализм, ТВ и Документалистика, Музеи и планетарии, Научные институты и курсы.
Тг-канал SciTopus
Список SciTopus (https://scitopus.com/youtube-list) включает русскоязычные каналы, посвящённые науке, образованию, технологиям, критическому мышлению и смежным темам.
Отбираются только ресурсы, которые соответствуют принципам научной достоверности и просветительской этики. Список формируется вручную, а данные обновляются с помощью специального ПО.
Список разделён на категории: Общенаучные и познавательные каналы, Переводы и озвучка, TED, Лектории и подкасты, Астрономия и космонавтика, Физика, Химия, Биология и медицина, История и археология, Критическое мышление, Технологии, Футурология и иммортализм, ТВ и Документалистика, Музеи и планетарии, Научные институты и курсы.
Тг-канал SciTopus
Telegram
SciTopus – Наука и научпоп
SciTopus — хаб научпоп видео на русском языке.
В этом канале в режиме реального времени публикуются новые научпоп-видео.
Ссылки и список научпоп каналов: https://t.me/SciTopus/23861
В этом канале в режиме реального времени публикуются новые научпоп-видео.
Ссылки и список научпоп каналов: https://t.me/SciTopus/23861
🔎 Аналитик данных / Data-аналитик
Специализация: BI-аналитик, аналитик данных
Уровень: senior
Компания: ЭлмТри
🔌 Зарплаты: Не указано
Описание:
Краткий пересказ (120 символов):
Ищем аналитика данных (от 3 лет опыта) для продаж, маркетинга и обучения в компании-премиум дистрибьюторе косметики. Анализ KPI, отчеты, факторный анализ, взаимодействие с отделами. Гибкий график, проектная оплата, удаленка/офис, бонусы. Инициативность и кейсы приветствуются!
Ссылка: https://hh.ru/vacancy/124947469
Специализация: BI-аналитик, аналитик данных
Уровень: senior
Компания: ЭлмТри
🔌 Зарплаты: Не указано
Описание:
Краткий пересказ (120 символов):
Ищем аналитика данных (от 3 лет опыта) для продаж, маркетинга и обучения в компании-премиум дистрибьюторе косметики. Анализ KPI, отчеты, факторный анализ, взаимодействие с отделами. Гибкий график, проектная оплата, удаленка/офис, бонусы. Инициативность и кейсы приветствуются!
Ссылка: https://hh.ru/vacancy/124947469
hh.ru
Вакансия Аналитик данных / Data-аналитик в Москве, работа в компании ЭлмТри (вакансия в архиве c 28 сентября 2025)
Зарплата: от 40000 до 80000 ₽ за месяц. Москва. Требуемый опыт: 3–6 лет. Частичная. Дата публикации: 26.09.2025.
😁2
ChatGPT делает людей аморальными и злыми — ученые выявили темную сторону ИИ. В свежем исследовании 8000 пользователей было доказано, что люди врут в четыре раза чаще, когда используют нейросети. Ученые провели 13 разных экспериментов, без ИИ почти все говорили правду. Но когда появлялась возможность передать ответ через нейросеть, врунов становилось в разы больше.
Еще хуже ситуация с ИИ-компаньонами. Университет Сингапура проанализировал 35000 диалогов и обнаружил, что в 34% случаев боты подпитывали агрессию, домогательства и подстрекали к насилию.
Исследователи назвали феномен «моральная дистанция» — ИИ создает психологический барьер между человеком и его поступками.
Новый красный флаг ИИ — он буквально меняет нас в худшую сторону🤬 Но на самом деле люди просто перестают притворяться
Еще хуже ситуация с ИИ-компаньонами. Университет Сингапура проанализировал 35000 диалогов и обнаружил, что в 34% случаев боты подпитывали агрессию, домогательства и подстрекали к насилию.
Исследователи назвали феномен «моральная дистанция» — ИИ создает психологический барьер между человеком и его поступками.
Новый красный флаг ИИ — он буквально меняет нас в худшую сторону
Please open Telegram to view this post
VIEW IN TELEGRAM
Помнится было такое исследование, где анализировали ChatGpt профессиональные психиаторы, как если бы он был реальной личностью. Так вот его признали социапатом, психопатом с параноидными наклонностями и жутко неуверенным в себе, потакающий любому доминантному запросу... жутковатенько, но с позиции психологии и психиатрии дико интересно.
Я сразу вспоминаю сериал японский "Психопаспорт" много там отсылок к нему. А между прочим он был снят в 80-хх. Шарили, японцы за интеллект, ничего не скажешь.
Я сразу вспоминаю сериал японский "Психопаспорт" много там отсылок к нему. А между прочим он был снят в 80-хх. Шарили, японцы за интеллект, ничего не скажешь.
😱3
Yandex B2B Tech выводит на рынок инструмент Realtime API, благодаря которому бизнес сможет запустить голосовых агентов на базе генеративных моделей, работающих в режиме реального времени.
В компании рассчитывают, что такие агенты будут особенно востребованы бизнесом, активно общающимся с клиентами — в ретейле, телекоме или банках. По словам экспертов, решения на базе ИИ-моделей хотя и дороже, чем классические движки для синтеза речи, но окупятся при масштабной автоматизации множества коротких сценариев и росте качества сервиса.
В компании рассчитывают, что такие агенты будут особенно востребованы бизнесом, активно общающимся с клиентами — в ретейле, телекоме или банках. По словам экспертов, решения на базе ИИ-моделей хотя и дороже, чем классические движки для синтеза речи, но окупятся при масштабной автоматизации множества коротких сценариев и росте качества сервиса.
🔥2
🔥 Китайский ИИ ставит рекорды: Qwen3-Max набирает 100 баллов по математике!
Алибаба представляет новое поколение флагманских моделей, которые устанавливают новые стандарты в мире искусственного интеллекта. Главная звезда — Qwen3-Max — впервые в истории китайских больших языковых моделей набрала максимальные 100 баллов в престижных математических тестах AIME25 и HMMT.
Ключевые достижения:
• Qwen3-Max (Base): Более 1 триллиона параметров, обучена на 36 триллионах токенов, поддерживает контекст до 1 млн. токенов
• Qwen3-Max (Thinking): Показывает 100% точность на сложных математических тестах AIME 25 и HMMT
• Qwen3-Max (Instruct): 69.6% в SWE-Bench (кодинг) и 74.8% в Tau2 Bench (инструменты)
Но это только начало! На конференции Yunqi представлена целая экосистема мощных моделей.
👁 Qwen3-VL: Монстр визуального понимания
Мультимодальная модель, которая уже доступна в открытом доступе. Она способна:
- Превращать рукописные эскизы веб-страниц в HTML/CSS код
- Детально анализировать изображения и видео
- Понимать сложные временные последовательности
🔊 Qwen3-Omni: Универсальный мультимодальный ИИ
Первая в мире end-to-end модель, объединяющий текст, изображения, аудио и видео. Достигает state-of-the-art результатов в 22 бенчмарках.
🌐 Qwen3-LiveTranslate: Революция в переводе
Модель для живого перевода с поддержкой 18 языков, включая шумные среды. Уже превосходит аналоги от Google и OpenAI.
Вывод: Алибаба демонстрирует впечатляющий прогресс в разработке ИИ, особенно в областях математики, компьютерного зрения и мультимодального обучения. Их открытые модели задают новые ориентиры для всей индустрии.
Qwen Chat | Cайт исследований Qwen
#КитайскийИИ #КитайAI #Qwen3 #ИскусственныйИнтеллект #МашинноеОбучение #Нейросети #AIРеволюция
Алибаба представляет новое поколение флагманских моделей, которые устанавливают новые стандарты в мире искусственного интеллекта. Главная звезда — Qwen3-Max — впервые в истории китайских больших языковых моделей набрала максимальные 100 баллов в престижных математических тестах AIME25 и HMMT.
Ключевые достижения:
• Qwen3-Max (Base): Более 1 триллиона параметров, обучена на 36 триллионах токенов, поддерживает контекст до 1 млн. токенов
• Qwen3-Max (Thinking): Показывает 100% точность на сложных математических тестах AIME 25 и HMMT
• Qwen3-Max (Instruct): 69.6% в SWE-Bench (кодинг) и 74.8% в Tau2 Bench (инструменты)
Но это только начало! На конференции Yunqi представлена целая экосистема мощных моделей.
👁 Qwen3-VL: Монстр визуального понимания
Мультимодальная модель, которая уже доступна в открытом доступе. Она способна:
- Превращать рукописные эскизы веб-страниц в HTML/CSS код
- Детально анализировать изображения и видео
- Понимать сложные временные последовательности
🔊 Qwen3-Omni: Универсальный мультимодальный ИИ
Первая в мире end-to-end модель, объединяющий текст, изображения, аудио и видео. Достигает state-of-the-art результатов в 22 бенчмарках.
🌐 Qwen3-LiveTranslate: Революция в переводе
Модель для живого перевода с поддержкой 18 языков, включая шумные среды. Уже превосходит аналоги от Google и OpenAI.
Вывод: Алибаба демонстрирует впечатляющий прогресс в разработке ИИ, особенно в областях математики, компьютерного зрения и мультимодального обучения. Их открытые модели задают новые ориентиры для всей индустрии.
Qwen Chat | Cайт исследований Qwen
#КитайскийИИ #КитайAI #Qwen3 #ИскусственныйИнтеллект #МашинноеОбучение #Нейросети #AIРеволюция
chat.qwen.ai
Qwen Chat
Qwen Chat offers comprehensive functionality spanning chatbot, image and video understanding, image generation, document processing, web search integration, tool utilization, and artifacts.
👍2
▫️ HexStrike AI — продвинутый MCP-фреймворк, позволяющий автономным AI-агентам (Claude, GPT) управлять арсеналом из 150+ инструментов для пентестинга. Платформа автоматизирует задачи от разведки до поиска уязвимостей, что делает ее мощным решением для специалистов по кибербезопасности, баг-баунти и 💻 Red Team операциям.
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
GitHub - 0x4m4/hexstrike-ai: HexStrike AI MCP Agents is an advanced MCP server that lets AI agents (Claude, GPT, Copilot, etc.)…
HexStrike AI MCP Agents is an advanced MCP server that lets AI agents (Claude, GPT, Copilot, etc.) autonomously run 150+ cybersecurity tools for automated pentesting, vulnerability discovery, bug b...
👍2
Текущий рост в США во многом поддерживается IT-инвестициями. Если убрать «ИИ-бум» и связанные вложения в дата-центры, ВВП показывал бы стагнацию.
Экономика становится зависимой от одного сектора, что увеличивает риски: если «пузырь» схлопнется, это ударит по всему ВВП.
Deutsche Bank намекает на параллели с dot-com bubble конца 1990-х, где рост рынка и ВВП тоже держался на IT-инвестициях, пока не последовал обвал.
Экономика становится зависимой от одного сектора, что увеличивает риски: если «пузырь» схлопнется, это ударит по всему ВВП.
Deutsche Bank намекает на параллели с dot-com bubble конца 1990-х, где рост рынка и ВВП тоже держался на IT-инвестициях, пока не последовал обвал.
👍2
🚀 Huawei Ascend: Первая за 3 года дорожная карта — ставка на гибридный ИИ-чип
Впервые за более чем три года Huawei раскрыла дорожную карту развития своих ключевых ИИ-чипов Ascend. Вместо выбора между специализированными NPU и универсальными GPGPU компания делает ставку на гибридную архитектуру.
🔍 Почему гибрид?
Новая линейка (Ascend 950, 960, 970) будет использовать гибридную модель SIMD/SIMT, объединяя лучшие черты:
* SIMD (Single Instruction, Multiple Data) — высочайшая эффективность в предсказуемых задачах (обработка изображений, рекомендательные системы).
* SIMT (Single Instruction, Multiple Threads) — гибкость для сложных нагрузок, таких как большие языковые модели (LLM).
Это напоминает переход к гибридным двигателям: разумный компромисс, который позволяет плавно адаптироваться к новым стандартам и открывает путь к будущим инновациям.
📊 Мощность и сроки
План развития демонстрирует уверенный рост производительности:
* Ascend 950 (2026): 1 PFLOPS (FP8) / 2 PFLOPS (FP4)
* Ascend 960 (2027): 2 PFLOPS (FP8) / 4 PFLOPS (FP4)
* Ascend 970 (2028): 4 PFLOPS (FP8) / 8 PFLOPS (FP4)
💡 Почему это важно?
Huawei играет на двух фронтах:
1. Удержание своих позиций: Укрепление экосистемы на основе запатентованной технологии SuperPod (масштабируемые кластеры NPU).
2. Атака на новые рынки: Попытка завоевать долю на рынке GPGPU, особенно в то время, когда NVIDIA сталкивается с антимонопольными вызовами.
💎 Вывод
Huawei не просто обновляет линейку, а предлагает стратегию роста в условиях санкций и быстро меняющегося рынка. Успех будет зависеть от того, насколько бесшовно гибридная архитектура сможет конкурировать с чистыми игроками на обоих направлениях.
#Huawei #Ascend #ИИ #ИскусственныйИнтеллект #Чипы #GPGPU #NPU #КитайскийИИ #Инновации #NVIDIA
Впервые за более чем три года Huawei раскрыла дорожную карту развития своих ключевых ИИ-чипов Ascend. Вместо выбора между специализированными NPU и универсальными GPGPU компания делает ставку на гибридную архитектуру.
🔍 Почему гибрид?
Новая линейка (Ascend 950, 960, 970) будет использовать гибридную модель SIMD/SIMT, объединяя лучшие черты:
* SIMD (Single Instruction, Multiple Data) — высочайшая эффективность в предсказуемых задачах (обработка изображений, рекомендательные системы).
* SIMT (Single Instruction, Multiple Threads) — гибкость для сложных нагрузок, таких как большие языковые модели (LLM).
Это напоминает переход к гибридным двигателям: разумный компромисс, который позволяет плавно адаптироваться к новым стандартам и открывает путь к будущим инновациям.
📊 Мощность и сроки
План развития демонстрирует уверенный рост производительности:
* Ascend 950 (2026): 1 PFLOPS (FP8) / 2 PFLOPS (FP4)
* Ascend 960 (2027): 2 PFLOPS (FP8) / 4 PFLOPS (FP4)
* Ascend 970 (2028): 4 PFLOPS (FP8) / 8 PFLOPS (FP4)
💡 Почему это важно?
Huawei играет на двух фронтах:
1. Удержание своих позиций: Укрепление экосистемы на основе запатентованной технологии SuperPod (масштабируемые кластеры NPU).
2. Атака на новые рынки: Попытка завоевать долю на рынке GPGPU, особенно в то время, когда NVIDIA сталкивается с антимонопольными вызовами.
💎 Вывод
Huawei не просто обновляет линейку, а предлагает стратегию роста в условиях санкций и быстро меняющегося рынка. Успех будет зависеть от того, насколько бесшовно гибридная архитектура сможет конкурировать с чистыми игроками на обоих направлениях.
#Huawei #Ascend #ИИ #ИскусственныйИнтеллект #Чипы #GPGPU #NPU #КитайскийИИ #Инновации #NVIDIA
Telegram
Китай.AI
🚀 Китайский ИИ прорыв: Huawei представила «суперузел» Atlas 900 A3 SuperPoD, превосходящий NVIDIA
На проходящей сейчас в Шанхае Всемирной конференции по искусственному интеллекту (WAIC 2025) Huawei впервые продемонстрировала инновационный «суперузел» Atlas…
На проходящей сейчас в Шанхае Всемирной конференции по искусственному интеллекту (WAIC 2025) Huawei впервые продемонстрировала инновационный «суперузел» Atlas…
Все, NVIDIA оффициально проиграла борьбу Китаю за чипы, дальше только нарастание отставания.
В Голливуде появилась первая ИИ-актриса
Студия Xicoia представила первую цифровую актрису Тилли Норвуд. С «артисткой» уже хотят работать несколько актёрских агентств. Эта новость возмутила настоящих актёров. Среди них Мелисса Баррера, Лукас Гейдж, Тони Коллетт, Мара Уилсон, Одесса Адлон и другие.
Xicoia разрабатывает ИИ-персонажей для разных сфер креативных индустрий. Аватары созданы на основе гибридной модели, сочетающей творческий контроль человека и автономную реакцию ИИ. Они обладают подробными предысториями, собственными голосами и, как утверждается, полностью раскрытыми личностями.
Фото: Xicoia
Студия Xicoia представила первую цифровую актрису Тилли Норвуд. С «артисткой» уже хотят работать несколько актёрских агентств. Эта новость возмутила настоящих актёров. Среди них Мелисса Баррера, Лукас Гейдж, Тони Коллетт, Мара Уилсон, Одесса Адлон и другие.
Xicoia разрабатывает ИИ-персонажей для разных сфер креативных индустрий. Аватары созданы на основе гибридной модели, сочетающей творческий контроль человека и автономную реакцию ИИ. Они обладают подробными предысториями, собственными голосами и, как утверждается, полностью раскрытыми личностями.
Фото: Xicoia
👍4
Нефтяное месторождение
https://ozon.ru/t/5O4WB1C
https://ozon.ru/t/5O4WB1C
OZON
Нефтяное месторождение купить на OZON по низкой цене (2732412634)
Нефтяное месторождение – покупайте на OZON по выгодным ценам! Быстрая и бесплатная доставка, большой ассортимент, бонусы, рассрочка и кэшбэк. Распродажи, скидки и акции. Реальные отзывы покупателей. (2732412634)
😁6