Media is too big
VIEW IN TELEGRAM
Карпаты, руководивший командой компьютерного зрения Tesla Autopilot, объясняет, почему Маск — особенный лидер.
— В обычных компаниях команды разрастаются, но Илон всегда выступает против этого.
— Наём новых людей нужно буквально «выбивать».
— Низкоэффективных сотрудников он быстро убирает.
— Никакого «среднего менеджмента» без технического бэкграунда.
— Ненавидит стагнацию и большие бесполезные митинги.
— Поощряет уходить со встреч, если ты не учишься и не вносишь вклад.
— Культура: меньше «комфорта», больше фокуса на интенсивной инженерной работе.
— Обычно до CEO не добраться напрямую — сотрудники общаются через несколько уровней начальников и вице-президентов.
— Маск же много времени разговаривает напрямую с инженерами.
— Источник истины — код и инженеры, а не менеджеры.
— Если инженеры говорят: «Не хватает GPU», он сразу звонит ответственному за кластеры.
— Если виновата NVIDIA — звонит напрямую Дженсену Хуану.
@ai_machinelearning_big_data
#Karpathy #elonmusk
Please open Telegram to view this post
VIEW IN TELEGRAM
❤117🔥55👍38🗿10😁3🐳3😭3🤔2
Что она умеет:
-
- Автоматическая пунктуация, капитализация и точные таймстампы до слова.
- Поддержка русского, французского, немецкого, испанского и многих других языков.
Чем интересна
- До 10× быстрее инференс, чем у моделей в 3 раза больше.
- Уже показывает state-of-the-art точность среди открытых моделей на Hugging Face.
- Лицензия CC-BY-4.0 — можно свободно использовать в проектах.
Под капотом:
- Архитектура: FastConformer-энкодер + Transformer-декодер (~978M параметров).
- Форматы:
.wav
и .flac
, моно 16 кГц. - Легко интегрируется через NVIDIA NeMo или прямо с Hugging Face.
Где пригодится:
Всего ~978M параметров → легче, быстрее и дешевле в использовании, чем большие модели конкурентов.
@ai_machinelearning_big_data
#AI #NVIDIA #SpeechRecognition #ASR #AST #Multilingual #MachineLearning #DeepLearning
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍83🔥39❤15✍2
AI ПО — главный драйвер роста российского ИТ-рынка
Согласно исследованию Б1, опубликованному сегодня, сегмент ИИ-ПО ждет взрывной рост — в среднем более 25% ежегодно до 2032 года. Если в 2024 году его объем оценивался в 48 млрд рублей, то к 2032 году он достигнет 286 млрд. Основными драйверами станут AI-аналитика, спрос на приложения с AI-функционалом, автоматизация и переход на SaaS/PaaS-решения. Российский тренд повторяет глобальный: мировой рынок ПО к 2028 году будет расти быстрее среднерыночных показателей, а AI-решения станут ключевым фактором этого роста.
Глобальный спрос на ИИ уже сейчас формирует новые стандарты: к 2026 году более 80% компаний по всему миру будут использовать ПО с AI-функционалом (против 5% в 2023-м). В 2025 году 40% крупнейших корпораций направят значительную часть ИТ-бюджетов на AI-решения, а мировой рынок AI ПО до 2028 года будет расти на 40+% в год.
Причина ажиотажа - измеримая эффективность AI, особенно востребованная в условиях нестабильности.
В России лидерами сегмента стали GreenData, BPMSoft и FabricaOne.AI, которая также возглавляет топ заказной разработки.
Среди ключевых трендов - рост low/no-code платформ (+22% в год), автоматизация промышленности (объем сегмента достигнет 66 млрд руб. к 2032 году) и расширение аналитического ПО за счет новых функций, от EPM до глубокой прогнозной аналитики. Интеграция AI в бизнес-процессы и госсектор подстегнет спрос на кастомизированные решения, что дополнительно разгонит заказную разработку - к 2032 году ее объем вырастет до 282 млрд руб. Уже в 2024 году на нее пришлось 24% всего рынка ИТ-услуг, что делает ее самым динамичным направлением.
Компании с экспертизой в ИИ будут определять будущее рынка, консолидируя сегменты тиражного и заказного ПО, как это делает FabricaONE.AI. Рынок AI-софта только набирает обороты, и его потенциал далек от исчерпания.
Согласно исследованию Б1, опубликованному сегодня, сегмент ИИ-ПО ждет взрывной рост — в среднем более 25% ежегодно до 2032 года. Если в 2024 году его объем оценивался в 48 млрд рублей, то к 2032 году он достигнет 286 млрд. Основными драйверами станут AI-аналитика, спрос на приложения с AI-функционалом, автоматизация и переход на SaaS/PaaS-решения. Российский тренд повторяет глобальный: мировой рынок ПО к 2028 году будет расти быстрее среднерыночных показателей, а AI-решения станут ключевым фактором этого роста.
Глобальный спрос на ИИ уже сейчас формирует новые стандарты: к 2026 году более 80% компаний по всему миру будут использовать ПО с AI-функционалом (против 5% в 2023-м). В 2025 году 40% крупнейших корпораций направят значительную часть ИТ-бюджетов на AI-решения, а мировой рынок AI ПО до 2028 года будет расти на 40+% в год.
Причина ажиотажа - измеримая эффективность AI, особенно востребованная в условиях нестабильности.
В России лидерами сегмента стали GreenData, BPMSoft и FabricaOne.AI, которая также возглавляет топ заказной разработки.
Среди ключевых трендов - рост low/no-code платформ (+22% в год), автоматизация промышленности (объем сегмента достигнет 66 млрд руб. к 2032 году) и расширение аналитического ПО за счет новых функций, от EPM до глубокой прогнозной аналитики. Интеграция AI в бизнес-процессы и госсектор подстегнет спрос на кастомизированные решения, что дополнительно разгонит заказную разработку - к 2032 году ее объем вырастет до 282 млрд руб. Уже в 2024 году на нее пришлось 24% всего рынка ИТ-услуг, что делает ее самым динамичным направлением.
Компании с экспертизой в ИИ будут определять будущее рынка, консолидируя сегменты тиражного и заказного ПО, как это делает FabricaONE.AI. Рынок AI-софта только набирает обороты, и его потенциал далек от исчерпания.
b1.ru
Рынок программного обеспечения и ИТ-услуг
Рынок программного обеспечения (ПО) и ИТ-услуг играет ключевую роль в цифровой трансформации экономики России. Каковы динамика и ключевые тренды основных сегментов этого рынка? Ответы – в новом исследовании российского рынка ПО, проведенном Группой компаний…
👍29🤣23❤5🤬3🗿1
This media is not supported in your browser
VIEW IN TELEGRAM
Всемирные игры гуманоидных роботов 2025 завершились 17 августа в Пекине.
В финале "5 на 5" команда «Огненный бог» из Университета Цинхуа победила немецкую команду HTWK Robots + Nao Devils со счётом 1:0 и завоевала чемпионский титул.
По данным CCTV, матч полностью контролировался алгоритмами ИИ без какого-либо вмешательства человека, 10 роботов самостоятельно выполняли на поле действия отбора мяча, передачи и ударов по воротам.
В другом финале, "3 на 3", команда «Шаньхай» из Китайского сельскохозяйственного университета также одержала победу над немецкой командой Sweaty.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍74❤29🔥13😁8🤔3
This media is not supported in your browser
VIEW IN TELEGRAM
Теперь можно не только генерировать изображения, но и редактировать их по команде: менять объекты, стиль, фон или даже текст прямо на картинке.
Что умеет:
- ✨ Редактировать смысл и детали — можно, например, повернуть объект, сменить цвет или стиль, не трогая остальное.
- 🔤 Менять текст на картинках — добавлять, убирать или редактировать надписи на китайском и английском, при этом сохраняются шрифт и стиль.
- 🏆 Лучшие результаты на тестах — модель показывает топ-уровень среди открытых решений.
Как работает:
Система сочетает понимание картинки (VL-модель) и точное управление структурой (VAE-кодировщик). Поэтому картинка сохраняет и смысл, и детали после правок.
Достаточно открыть Qwen Chat и выбрать режим *Image Editing*.
@ai_machinelearning_big_data
#qwen #ml #llm #ai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍72❤38🔥25🙈2😁1😐1
Media is too big
VIEW IN TELEGRAM
Google Flow отчитался о 100 миллионах созданных роликов с момента своего запуска в мае. В честь этого события, Google удваивает количество ежемесячных кредитов для подписчиков Ultra. Кроме того, компания запускает специальный канал на платформе Х, где будут публиковаться обучающие материалы и оказываться поддержка сообществу.
Google Labs в сети Х
Nvidia сообщила, что более 2 млн. разработчиков создают приложения на базе ее робототехнического стека. Этот рост подчеркивает высокий спрос на платформу для периферийного ИИ Jetson, запущенную в 2014 году. На сегодняшний день экосистема насчитывает свыше 150 партнеров и обслуживает около 7000 корпоративных клиентов.
Компания также анонсировала, что платформа нового поколения, Jetson Thor, будет поддерживать продвинутые физические ИИ-системы и гуманоидных роботов. Она будет совместима с облачным ПО компании.
Кроме того, стало известно, что ключевой производственный партнер Nvidia, компания Foxconn, готовит линии для выпуска прототипа гуманоидного робота. По данным источников, Nvidia планирует продемонстрировать его уже в ноябре этого года.
blogs.nvidia.com
Независимая платформа для тестирования больших языковых моделей LM Arena обновила свои лидерборды. Claude Opus 4.1 Thinking заняла первое место сразу в 3 ключевых категориях: Текст, Программирование и Веб-разработка. Согласно публичным данным, это первый случай, когда одна модель одновременно возглавляет все основные рейтинги.
В категории "Программирование" обе версии Claude Opus 4.1, ризонинг и стандартная, заняли первое и второе места соответственно, сместив с пьедестала GPT-5-high от OpenAI.
LmArena в сети X
Правительство Китая ввело новое требование для государственных ЦОД: доля чипов от местных производителей в них должна превышать 50%. Это часть стратегии технологической независимости страны и снижение зависимости от американских технологий на фоне экспортных санкций.
Изначально эта инициатива была предложена в Шанхае в 2023 году, но, по словам источников, с начала этого года стала обязательной для всей страны. Требование распространяется на специализированные ИИ-ЦОДы, которые активно строятся по всему Китаю.
Хотя китайские чипы пока уступают Nvidia в задачах по обучению моделей, они считаются пригодными для инференса. Главной технической проблемой становится адаптация моделей, разработанных под экосистему Nvidia CUDA для работы на Huawei CANN.
scmp.com
Сервис выпустил самое крупное обновление с момента своего основания. Вместо простого инструмента для проверки грамматики он стал комплексной платформой для работы с текстами. Новый интерфейс построен на базе Coda — компании, которую Grammarly приобрела в прошлом году.
Grammarly предлагает 9 специализированных ИИ-агентов. Среди них — ИИ-оценщик, который может предсказать оценку за научную работу, агент для поиска и форматирования цитат, а также инструмент, прогнозирующий вопросы аудитории к тексту. Другие агенты отвечают за перефразирование, экспертную вычитку, проверку на плагиат и определение авторства ИИ.
Большинство новых функций уже доступны на бесплатных и Pro-тарифах. Проверка на плагиат и детектор ИИ-контента остались эксклюзивом платной подписки.
grammarly.com
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
❤43👍17🔥12🤔2
🍌Стало известно, что nano-banana — это модель от Google
Если вы пропустили, эта модель стала вирусной на Арене, благодаря своим возможностям редактирования изображений: меняет цвет волос, одежды, целые образы и фоны, сохраняя стиль и детали персонажа.
Nano-banana демонстрирует высокое качество и согласованность, по сравнению с другими моделями на рынке.
📌 Попробовать можно на арене.
@ai_machinelearning_big_data
#NANOBANANA #AI #GenerativeAI #AIart
Если вы пропустили, эта модель стала вирусной на Арене, благодаря своим возможностям редактирования изображений: меняет цвет волос, одежды, целые образы и фоны, сохраняя стиль и детали персонажа.
Nano-banana демонстрирует высокое качество и согласованность, по сравнению с другими моделями на рынке.
📌 Попробовать можно на арене.
@ai_machinelearning_big_data
#NANOBANANA #AI #GenerativeAI #AIart
👍66🔥22❤12😁3
🚀 Tencent Hunyuan только что выкатили AutoCodeBench — мощный open-source инструмент для проверки способностей ИИ в генерации кода.
Что внутри?
🔹 AutoCodeGen — генерация многоязычных датасетов кода без ручной разметки
🔹 AutoCodeBench — почти 4 000 сложных задач на 20 языках программирования (версии Full / Lite / Complete)
🔹 MultiLanguageSandbox — песочница для работы с поддержкой 30+ языков
C AutoCodeBench можно быстро тестировать LLM в кодинге, сравнивать модели и даже создавать свои бенчмарки.
🟠 Статья: arxiv.org/abs/2508.09101
🟠 Код: github.com/Tencent-Hunyuan/AutoCodeBenchmark
🟠 Датасет: huggingface.co/datasets/tencent/AutoCodeBenchmark
@ai_machinelearning_big_data
#AutoCodeBench #AI #coding
Что внутри?
🔹 AutoCodeGen — генерация многоязычных датасетов кода без ручной разметки
🔹 AutoCodeBench — почти 4 000 сложных задач на 20 языках программирования (версии Full / Lite / Complete)
🔹 MultiLanguageSandbox — песочница для работы с поддержкой 30+ языков
C AutoCodeBench можно быстро тестировать LLM в кодинге, сравнивать модели и даже создавать свои бенчмарки.
@ai_machinelearning_big_data
#AutoCodeBench #AI #coding
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥88❤18👍15
🐋 Гигантский кит приплыл на HF!
🚀 DeepSeek раскатывает Base релиз новой версии V3.1 — гибридной модели, способной совмещать рассуждения и быстрые задачи.
Следите за новостями, волна только набирает силу.
⚡ 685B параметров
📏 Контекстное окно 128k
https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
@ai_machinelearning_big_data
#DeepSeek #AI #LLM #V3_1 #MachineLearning
🚀 DeepSeek раскатывает Base релиз новой версии V3.1 — гибридной модели, способной совмещать рассуждения и быстрые задачи.
Следите за новостями, волна только набирает силу.
⚡ 685B параметров
📏 Контекстное окно 128k
https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
@ai_machinelearning_big_data
#DeepSeek #AI #LLM #V3_1 #MachineLearning
🔥93❤25👍22😨5🐳4🎉1
Будущее ИИ: какие векторы развития у технологии?
Искусственный интеллект перестал быть темой завтрашнего дня — он уже здесь и работает на нас. Но как далеко зашли компании в его применении? В интервью Ъ FM Иван Гуз, управляющий партнер Авито, объяснил, как генеративный ИИ меняет бизнес-процессы и повседневные задачи, и почему его массовое внедрение неизбежно.
Так, например, в Авито GenAi уже помогает сокращать трудозатраты, поскольку создает большой объем информации за пользователя. Иван Гуз отмечает: «Уровень использования ИИ в качестве помощников растет экспоненциально. То есть сомнений в том, что все будут использовать искусственный интеллект, не возникает». По его словам, будущее — за «агентским ИИ» и world models, которые понимают не просто слова, а контекст реального мира.
Подпишитесь на полезные каналы Авито
Искусственный интеллект перестал быть темой завтрашнего дня — он уже здесь и работает на нас. Но как далеко зашли компании в его применении? В интервью Ъ FM Иван Гуз, управляющий партнер Авито, объяснил, как генеративный ИИ меняет бизнес-процессы и повседневные задачи, и почему его массовое внедрение неизбежно.
Так, например, в Авито GenAi уже помогает сокращать трудозатраты, поскольку создает большой объем информации за пользователя. Иван Гуз отмечает: «Уровень использования ИИ в качестве помощников растет экспоненциально. То есть сомнений в том, что все будут использовать искусственный интеллект, не возникает». По его словам, будущее — за «агентским ИИ» и world models, которые понимают не просто слова, а контекст реального мира.
Подпишитесь на полезные каналы Авито
👌20❤14🥰8🥱5🤨5🔥4🗿4😁2💯2🙈2☃1
Ландшафт архитектур LLM превратился в настоящий зоопарк. Почти каждую неделю появляются новые методы, обещающие меньший расход памяти и более быстрый инференс. Разобраться в этом становится все сложнее.
Большая группа исследователей выпустила подробный обзор Speed Always Wins, чтобы систематизировать все ключевые инновации в области эффективных архитектур для LLM.
Это не просто очередная статья, а попытка упорядочить и структурировать актуальные подходы, которые решают главную проблему классического трансформера - его квадратичную вычислительную сложность.
Обзор описывает 7 основных направлений.
Здесь авторы разбирают все подходы, которые так или иначе сводят сложность самовнимания к линейной. В эту категорию попадают 3 большие ветви: линейное внимание; линейные RNN, вроде и, конечно, модели на основе пространства состояний (SSM).
Разреженное моделирование последовательностей основано на простом принципе: не каждый токен должен общаться с каждым. Здесь выделяются статические подходы (как в Longformer), где паттерны внимания заданы заранее, и динамические, где они определяются на лету в зависимости от контента.
Методика, которая уже стала мейнстримом. В МоЕ разреженность применяется не в механизме внимания, а в FFN-слоях, где для каждого токена активируется лишь небольшая часть экспертов, что позволяет наращивать число параметров без пропорционального роста вычислений.
В нем речь идет не об изменении асимптотической сложности, а об ее аппаратной оптимизации. Флагман - FlashAttention.
Есть детальный разбор, как за счет оптимизации обращений к памяти GPU удается кардинально ускорить вычисления, не прибегая к аппроксимациям. Сюда же относятся и групповые механизмы внимания: GQA и MQA.
Это, пожалуй, самый горячий тренд. Его идея в том, чтобы стратегически комбинировать быстрые слои с линейной сложностью и медленные, но мощные слои с полным вниманием.
В обзоре выделяют два типа гибридизации: межслойную, как в Jamba, где разные типы слоев чередуются, и внутрислойную, где в одном слое разные головы могут использовать разные механизмы внимания.
Это неавторегрессионные модели, которые генерируют текст, постепенно восстанавливая его из шума. Их главная фишка в параллельном декодировании, что дает ощутимое ускорение инференса.
В конце обзора есть анализ применения всех этих архитектур в разных модальностях - CV и аудио.
Так что, если хотите быстро разобраться в базовых методах, которые будут двигать дизайн LLM в ближайшее время,
@ai_machinelearning_big_data
#AI #ML #LLM #Architectures
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤79👍29🔥17