Apple релизнули в OpenSource инструмент для ускорения моделей в продакшне в колабе с NVIDIA.
Если кратко, то ReDrafter позволяет еще сильнее ускорить/оптимизировать скорость предсказания моделей. У него есть Teacher-модель (тяжелая умная модель) и Student-модель (проще, но быстрее). Teacher проверяет Student, а он, в свою очередь, генерит несколько токенов.
Мы рассматриваем pipeline как цепочку действий:
- получили запрос пользователя через условную API;
- запроцессили его под какой-то формат (мб добавили больше инфы);
- сгенерировали предсказание модели (тут как раз и применяем ReDrafter);
- провели постпроцессинг ответа модели (отформатировали ответ для передачи пользователю).
А теперь посмотрим, что изменилось.
Жизнь до ReDrafter:
- запрос пользователя → preprocessing;
- токенизация → генерация (1 токен за шаг);
-postprocessing → ответ.
Жизнь с ReDrafter:
- запрос пользователя → preprocessing;
- токенизация → Student-модель генерирует сразу N токенов;
- Teacher-модель проверяет и фильтрует некорректные предсказания;
- postprocessing → ответ.
#AI #Apple #NVIDIA #ReDrafter
Please open Telegram to view this post
VIEW IN TELEGRAM
Apple Machine Learning Research
Accelerating LLM Inference on NVIDIA GPUs with ReDrafter
Accelerating LLM inference is an important ML research problem, as auto-regressive token generation is computationally expensive and…
👍3🔥2❤1
Максим Вязников CEO Intelion Cloud:
2024-й показал, что искусственный интеллект перестал быть технологией будущего — он стал неотъемлемой частью нашего настоящего. Однако за стремительным развитием стоит не только успех, но и вызовы. Нам необходимо строить мощную инфраструктуру и развивать профессиональные кадры, чтобы потенциал ИИ стал доступным и полезным для всех отраслей экономики.
#AI #IntelionCloud #ИтогиГода
Please open Telegram to view this post
VIEW IN TELEGRAM
CNews.ru
Intelion Data Systems: ИИ-2024 – итоги и вызовы уходящего года - CNews
2024 г. стал знаковым для развития искусственного интеллекта, демонстрируя значительные достижения и ставя...
🔥4❤2👍2
https://www.latent.space/p/2025-papers
#AI #ReadingList
Please open Telegram to view this post
VIEW IN TELEGRAM
www.latent.space
The 2025 AI Engineering Reading List
We picked 50 paper/models/blogs across 10 fields in AI Eng: LLMs, Benchmarks, Prompting, RAG, Agents, CodeGen, Vision, Voice, Diffusion, Finetuning. If you're starting from scratch, start here.
👍2🔥2💯1
Дорогие друзья!
🥂 Мы, компания Intelion Cloud, от всего сердца поздравляем вас с наступающим Новым годом!
⭐️ Пусть все ваши мечты сбываются, модели обучаются, код пишется, проекты успешно реализуются! Пусть рядом всегда будут единомышленники, вдохновленные вашим энтузиазмом и верой успех!
🎄 Будьте успешны и энергичны, подписывайтесь на Artificial Intelion, приводите друзей, узнавайте о новых возможностях ИИ, арендуйте серверы, а главное - будьте очень и очень счастливы!
До встречи в новом году!
С любовью, Intelion Cloud
#HappyNewYear
🙂 Artificial Intelion
До встречи в новом году!
С любовью, Intelion Cloud
#HappyNewYear
Please open Telegram to view this post
VIEW IN TELEGRAM
🎉6🔥1🤗1
В общем, пробуем)
#AI #PlayAI
Please open Telegram to view this post
VIEW IN TELEGRAM
play.ai
The Voice AI Platform: TTS Models, Voice Agents, & More
Seamless, natural conversations with voice AI. Explore advanced TTS models and intelligent agents built for real-time voice automation.
👍3❤2🔥2
#AI #NVIDIA
Please open Telegram to view this post
VIEW IN TELEGRAM
TechCrunch
Nvidia's Project Digits is a 'personal AI supercomputer' | TechCrunch
At the 2025 Consumer Electronics Show in Las Vegas, Nvidia unveiled Project Digits, a device it's calling a 'personal AI supercomputer.'
❤2👍2🔥2
#AI #AGI #Pause
Please open Telegram to view this post
VIEW IN TELEGRAM
Windows Central
Vitalik Buterin proposes a "global soft pause button" to cut AI computing power by 90-99% for 1-2 years — giving ample time to…
Ethereum's co-founder recommends a soft pause to establish control over the rapid advancement of AI and potential catastrophic harm.
👍3👎1🔥1
#AI #CES2025
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🔥2💯1
#AI #CES2025
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2👍1😁1
Компания предоставила разработчикам открытый доступ к моделям «физических основ мира» мира и не стала зажимать код.
#AI # Nvidia #NvidiaCosmos
Please open Telegram to view this post
VIEW IN TELEGRAM
NVIDIA
NVIDIA Cosmos: World Foundation Models Powering Physical AI
Explore NVIDIA Cosmos, a platform featuring world foundation models, advanced tokenizers, and guardrails, designed to boost physical AI for AVs and robots with fast model training and development.
🔥3❤1👍1
#AI #HailuoAI
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🔥1💯1
Теперь таких ситуаций станет меньше: в Open AI запустили Tasks для ChatGPT.
- поддерживаются в ChatGPT Web, iOS, Android, MacOS;
- для Windows появятся чуть позже, но в первом квартале года;
- дают ChatGPT возможность создавать задачи для запуска в будущем;
- задачи могут запускаться либо в определенное время, либо в пользовательском интерфейсе по запросу;
- задачи выполняются независимо от того, находится ли пользователь в данный момент в сети (вот этот пункт немного пугает);
- после выполнения пользователям отправляются push-уведомления или мейлы.
Сейчас Tasks работают в бета-версии для пользователей Plus, Pro и Team, ну, а далее, как водится, везде.
#AI #OpenAI #TasksGPT
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🔥2💯1
Первыми тревогу забили ВВС, заметившие, что некоторые ИИ-новости отличаются от реальности, а теперь это признали и в самой компании.
#AI #AppleAI
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥2❤1
#AI #LumaAI #Ray2
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1👍1🔥1
Да, пробовать можно бесплатно (50 запросов в сутки).
#AI #DeepSeek #DeepSeekR1
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1👍1🔥1
*️⃣ Резкий рост спроса, который мы наблюдаем в течение года, и особенно в последние три месяца, превзошел нашу способность предоставлять необходимые вычисления, – пожаловался он в свежем интервью.
В общем, чем мощнее сервер – тем теплей беседа!
#AI #AnthropicAI #Claude
Please open Telegram to view this post
VIEW IN TELEGRAM
WSJ
Anthropic CEO Says AI Could Surpass Human Intelligence by 2027
Anthropic Chief Executive Officer Dario Amodei said that his AI startup is racing to secure the computing power needed to meet demand for its generative AI chatbot Claude.
“The surge in demand we’ve seen over the last year, and particularly in the last three…
“The surge in demand we’ve seen over the last year, and particularly in the last three…
👍1🔥1
В общем, астрологи объявили эру ИИ-агентов.
#AI #OpenAI #Operator
Please open Telegram to view this post
VIEW IN TELEGRAM
TechCrunch
OpenAI's agent tool may be nearing release | TechCrunch
OpenAI may be close to releasing an AI tool that can take control of your PC and perform actions on your behalf, if leaks are to be believed.
🔥2❤1👍1
⚡️ Operator от OpenAI уже здесь! Не успели мы пожаловаться, что выпуск ИИ-агента задерживается, как вышел релиз! Новостей и мнений много, выбрали для вас главное.
🔣 Operator – первый ИИ-агент от OpenAI. Он умеет выходить в Интернет и делать все то же, что и вы: ориентироваться в поиске, открывать сайты, заказывать отели, билеты и столики (предупреждение: в соцсетях активизировалась группа разгневанных фанатов, которые везде пишут, что это «не инструмент букинга, а великое достижение ИИ-прогресса!!!»).
🔣 Используя свой собственный браузер, Operator может просматривать веб-страницы и работать с ними: вводить текст, щелкать мышью, прокручивать. Дальше вы даете ему задания, и он их выполняет: заполняет документы, заказывает еду (помним: не инструмент букинга!!! 😊), генерит мемы.
🔣 В основе – новая модель Computer-Using Agent (CUA), по сути - GPT-4o с расширенными возможностями, которая умеет «видеть» страницы и взаимодействовать с графическими интерфейсами — кнопками, меню и текстовыми полями на экране.
*️⃣ Если что-то пойдет не так, Operator должен зафиксировать ошибку и позвать человека — хотя как его теперь дозовешься)
#AI #OpenAI #Operator
🙂 Artificial Intelion
#AI #OpenAI #Operator
Please open Telegram to view this post
VIEW IN TELEGRAM
Openai
Introducing Operator
A research preview of an agent that can use its own browser to perform tasks for you. Available to Pro users in the U.S.
👍2🔥2❤1
На примерах AIME и MATH DeepSeek-R1 показывает одинаковые результаты с o1, т.е. хорошо решает текстовые и математические задачи. Однако, в тестах, где играют в крестики-нолики, обе модели делают ошибки.
По мощности с o1 и R1 можно еще сравнить модели Qwen QvQ-72B и QwQ-32B, но по бенчмаркам они достаточно сильно отстают.
Модели уровня DeepSeek-R1 и OpenAI o1 требуют значительных вычислительных ресурсов для обучения и развертывания. Для их эффективной работы необходимы мощные серверы с высокопроизводительными графическими процессорами.
Компании, разрабатывающие такие модели, часто инвестируют значительные средства в серверные кластеры. Пользователям полномасштабных версий R1 также потребуются мощные серверы с графическими процессорами.
По мере роста популярности и использования крупных языковых моделей спрос на вычислительные мощности будет только расти.
#AI #DeepSeek #R1 #IntelionCloud
Please open Telegram to view this post
VIEW IN TELEGRAM
Bloomberg.com
Nvidia’s $589 Billion DeepSeek Rout Is Largest in Market History
Nvidia Corp.’s plunge, fueled by investor concern about Chinese artificial-intelligence startup DeepSeek, erased a record amount of stock-market value from the world’s largest company.
👍2🔥1💯1
Код и параметры на Hugging Face.
#AI #DeepSeek #JanusPro
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3❤1👍1