DenoiseLAB
486 subscribers
1.33K photos
159 videos
3 files
1.58K links
Блог DenoiseLAB (машинное обучение, аналитика)

Информация в канале служит только для ознакомления и не является призывом к действию. Не нарушайте законы РФ и других стран. Мы не несем отвественность за ваши действия или бездействия.
Download Telegram
В очень интересное время живем, в очень интересное. Ну что сеть начинает делиться еще сильнее.
Зумеры в Непале выбрали главу временного правительства с помощью ChatGPT. Нейросеть проанализировала кандидатов и предложила на роль 73-летнюю Сушилу Карки, бывшего главного судью. «Она сможет заслужить доверие разных групп и провести реформы», — объяснила школьникам нейросеть.
Школьники... выбирают... министров... нет слов...
😁1
Новое направление для ветряных электростанций.
В Китае начинаются лётные испытания первого в мире дирижабля - «ветряной мельницы» S1500 с выработкой энергии в 1 МВт, что эквивалентно традиционной ветряной турбине диаметром 100 метров. Общий вес системы, наполненной гелием, составляет 1 тонну.

Система нацелена на использование высокоскоростных и устойчивых ветров, дующих на высоте 1500 метров над землёй. Поэтому их эффективность считается значительно выше, чем у традиционных ветряных турбин, которые обычно используют энергию ветра на высоте всего 200 метров над землёй. Энергия с дирижабля будет передаваться по кабелю. Фактически турбина-дирижабль будет выдавать энергию 95% времени, что решает проблему неиспользования традиционных ВЭС во время штилей.
Дунь Тяньжуй, основатель и генеральный директор SAWES, ранее заявлял, что их цель - поднять ветряную электростанцию на высоту 10.000 метров. Скорость ветра там до 200 раз выше, чем у земли, что может привести к значительному увеличению выработки.

Учёным остаётся заняться проблемой бесперебойной выработки энергии солнечными станциями, и тут пока лёгких решений не видно (пока направление мысли движется только в сторону накопителей энергии на СЭС).
Если эксперименты с ВЭС-дирижаблями окажутся удачными, то ветряные станции могут обогнать СЭС в новых установленных мощностях.
📌Дирижабли с искусственным интеллектом: индустрия 4.0 | Подкаст СВОИМИ СЛОВАМИ

Полезно знать про дирижабли.

Новый выпуск подкаста про дирижабли СВОИМИ СЛОВАМИ с Геннадием Бабаниным.

🗣Поговорим о том, как искусственный интеллект (ИИ) помогает развитию дирижаблестроения. Интеграция ИИ в системы управления позволяет существенно повысить автономность дирижаблей, оптимизировать маршруты и снизить потребность в ручном управлении. Алгоритмы машинного обучения анализируют погодные условия, корректируют курс и принимают решения в нештатных ситуациях, обеспечивая безопасность и эффективность полётов.

🔥Как тестировали автопилот на дирижабле NOVA-01? Смотрите в этом выпуске!

Выбирайте, где смотреть:

🖇VKontakte
🖇YouTube
🖇RuTube
🖇Дзен

#АЭРОНОВАподкаст
🔥1
🚀 Китайский ИИ нового уровня: Alibaba представляет революционную архитектуру Qwen3-Next

Китайская компания Alibaba представила новое поколение своей языковой модели — Qwen3-Next. Новая архитектура обещает резкий скачок в эффективности: модель с 80 миллиардами параметров активирует для ответа лишь 3 миллиарда, сохраняя высочайшее качество и обгоняя конкурентов вроде Gemini-2.5-Flash.

🚀 Рекордная эффективность
Обучение: Потребовалось менее 10% вычислительных ресурсов (GPU Hours) от предшественника Qwen3-32B при сопоставимом качестве.
Инференс: Скорость обработки длинных контекстов (свыше 32k токенов) выросла более чем в 10 раз.

🧠 Ключевые инновации:
Гибридное внимание: Сочетает линейное (быстрое) и стандартное (точное) внимание для баланса скорости и качества.
Сверхразреженная MoE-структура: Из 512 «экспертов» для каждого запроса выбирается всего 10 + 1 общий. Это экономит ресурсы.
Предсказание нескольких токенов(MTP): Модель предугадывает несколько слов вперед, что ускоряет генерацию.
Повышенная стабильность обучения: Новые методы нормирования и инициализации сделали процесс надежнее.

⚙️ Технические детали
Архитектура представляет собой смесь Gated DeltaNet (75% слоев) для эффективного моделирования длинных последовательностей и стандартного Gated Attention (25% слоев) для высокой точности. Это позволило превзойти по качеству Mamba2 и sliding window attention. Для стабилизации тренировки внедрены Zero-Centered RMSNorm и нормализация весов маршрутизатора в MoE.

📊 Выпущены три версии модели
Base: Для дальнейшего дообучения и исследований.
Instruct: По производительности сравнима с гигантской флагманской Qwen3-235B, но значительно эффективнее в работе с длинными контекстами (до 256K).
Thinking: Специализированная модель для сложных рассуждений, которая обгоняет закрытый Gemini-2.5-Flash-Thinking и приближается к топовой Qwen3-235B.

Вывод
Qwen3-Next — это не просто эволюционное обновление, а стратегический шаг, переопределяющий баланс между размером модели, стоимостью обучения и скоростью работы. Архитектура открыта, что позволяет всему сообществу строить на её основе ещё более мощные приложения.

Сайт | HuggingFace

#КитайскийИИ #КитайAI #Qwen3Next #AlibabaAI #MoE #ИИархитектура #LLM
Китайские военные исследователи разработали систему искусственного интеллекта, которая может революционизировать противолодочную войну, потенциально снизив уровень выживаемости подводных лодок до всего 5 процентов в будущих морских конфликтах.

Прорывные исследования, опубликованные в августе в рецензируемом журнале Electronics Optics & Control, знаменуют возможный конец эпохи «невидимых» подводных лодок, которые долгое время служили основой стратегий морского сдерживания. Система  интегрирует данные из множества источников, включая гидроакустические буи, выпускаемые вертолетами, подводные датчики, радиолокационные системы и даже океанографические данные, такие как температура и уровень солености воды. 

По данным The Defense News, компьютерные симуляции показали, что система поддерживает уровень обнаружения и отслеживания порядка 95 процентов, даже когда подводные лодки используют передовые методы скрытности. Это означает значительное улучшение по сравнению с существующими противолодочными возможностями и может фундаментально изменить стратегический баланс военно-морской войны.
ИИ-модели становятся энергоэффективнее.
Новое исследование Google показывает, что её Gemini LLM потребляет около 0,24 Вт-ч на один текстовый запрос. Это столько же энергии, сколько потребляет микроволновая печь в течение одной секунды или шесть секунд работы холодильника.
По их оценкам, 12 месяцев назад энергопотребление на один запрос было в 33 раза выше. Это означает, что стандартная текстовая подсказка тогда потребляла 9 Вт-ч.
Извлечение гиперспектральной информации с полным спектральным разрешением из обычных фотографий

В статье (Kwon et al., 2025) представлен метод извлечения гиперспектральной информации на основе единственного фотоснимка в видимом диапазоне. Методу не нужны обучающие данные или предварительно обученные модели. Авторы предлагают использовать "спектральную цветовую таблицу" (spectral color chart), напечатанную сетку из 729 уникальных цветов, которую фотографируют вместе с объектом. Авторы назвали новый метод 📊 Computational photography spectrometry (CPS).

📖 Kwon, S., Mok Park, S., Ji, Y., Sakthivel, H., Woo Leem, J., & Kim, Y. L. (2025). Hyperspectral Information Extraction With Full Resolution From Arbitrary Photographs. IEEE Transactions on Image Processing, 34, 5429–5441. https://doi.org/10.1109/tip.2025.3597038

#гиперспектр
ChatGPT будет проверять пользователей по паспорту. OpenAI внедряет систему определения возраста: если нейросеть заподозрит, что пользователю меньше 18 лет, она автоматически переключит его на урезанную версию с родительским контролем. Подросткам запретят флирт и разговоры на чувствительные темы, а мамы смогут видеть их переписки.

Взрослым тоже придётся смириться: при сомнениях ChatGPT попросит загрузить документы. Сэм Альтман признал, что это нарушает приватность, но назвал меру «оправданным компромиссом». @bankoffo
Как собрать все паспорта мира ))) подробный роудмап
🔮  Магия маркетинга: одно слово про ИИ — и доля готовых купить продукт выше на 70%

Согласно опросу Битрикс24, формулировка «с функцией ИИ» повышает интерес к продукту у 70% клиентов. Но стоит заменить на «создан с использованием ИИ» — и больше половины потенциальных покупателей уходит.

Отношение бизнеса к нейросетям так же парадоксально: 85% компаний признают, что ИИ снижает издержки. При этом треть уверена, что ИИ-решения должны стоить даже дешевле обычных.

Александр Вартанян, директор по маркетингу Битрикс24, поясняет:

Бизнес тоже очень хорошо умеет считать деньги. Никто не хочет переплачивать за то, что не принесет ощутимой пользы.
Please open Telegram to view this post
VIEW IN TELEGRAM
🚀 Оптимизация обновления весов моделей в LLM

Checkpoint Engine — это легковесное промежуточное ПО для обновления весов в LLM во время инференса, критически важное для обучения с подкреплением. Оно обеспечивает быстрые и эффективные методы обновления весов, позволяя обрабатывать модели с триллионом параметров за считанные секунды.

🚀 Основные моменты:
- Поддержка двух методов обновления: Broadcast и P2P.
- Эффективная передача данных с использованием CUDA IPC.
- Оптимизированный процесс передачи с учетом шардирования.
- Подходит для работы с большими моделями на множестве GPU.

📌 GitHub: https://github.com/MoonshotAI/checkpoint-engine
🔥2
Сегодня ушла в печать новая статья для Хабра. Там мы сделали аналитику по работе китайского сервиса Куайшоу (аналог тиктока). Мы исследовали скорость принятия решения по досмотру видео для коротких видео и скорость реакции нового поколения пользователей. Мы брали очень короткие диапазоны от 1 до 3 сек.

При этом, удалось поднять скор на модели с 0.76 до 0.79. Да немного, но в рамках таких больших моделей 3%, вернее мы получили 4.5%, на "длинной" дистанции это огромные деньги. Статью писали для Сбера. Скоро выйдет.
🔥4