На ежегодной выставке потребительской электроники CES 2025 показали гаджеты, которые могли бы заменить персонального ассистента или добавить пару свободных часов в ваш день.
→ Собрали в карусели то, что впечатлило нас больше всего
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15❤7🔥6
Google представили архитектуру Titan с многокомпонентной системой памяти и потенциальным контекстом более 2 млн токенов. Такое построение помогает модели решить проблему забывчивости моделей → Подробнее
В новой статье от Sakana AI показана архитектура Transformer2, которая адаптируется к новым задачам в реальном времени, изменяя только части весовых матриц. Она превосходит LoRA по эффективности и подходит для мультимодальных задач → Подробнее
Ещё одна работа от Google, посвящённая test-time скейлингу в диффузии. Улучшение результатов достигается через поиск оптимального шума, а не увеличение шагов шумоподавления → Подробнее
Hugging Face запускает бесплатный курс по созданию и настройке AI-агентов. Начало уже в феврале → Подробнее
Он подходит как для новичков, так и для тех, кто давно уже в ML. Для первых подготовлена отличная база с блоком по математике, Python и нейронным сетям; для последних — упор сделан на практику: учимся cоздавать, тренировать, строить LLM и интегрировать их в бизнес → Подробнее
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15🔥5❤3👌1
Громкие AI-новинки недели
Прошлая неделя принесла много интересных AI-решений: от мультимодальных моделей до инструмента для генерации видео. Подробнее о каждом читайте в карусели →
Прошлая неделя принесла много интересных AI-решений: от мультимодальных моделей до инструмента для генерации видео. Подробнее о каждом читайте в карусели →
❤12👍3👌1
В феврале стартует бесплатный курс по обработке естественного языка от руководителя группы Kodify MTS AI, Валентина Малых. Программа подойдет как новичкам, так и тем, кто хочет углубить свои знания в этой области. Курс включает два блока:
Что ждет студентов:
— Лекции от эксперта с 10-летним опытом в AI, кандидата технических наук Валентина Малых;
— Семинары и практические задачи для закрепления навыков.;
— Работа над собственным проектом — индивидуально или в команде;
— Тесты для проверки знаний и чат для общения и обсуждений.
* Для участия необходимо пройти авторизацию:
1. Войдите через Google, выбрав опцию login with ods.ai.
2. Выберите «Треки» и ODS Course Season 25: spring.
3. Нажмите кнопку «Участвовать».
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥19🤩6🔥4👍1👏1
Media is too big
VIEW IN TELEGRAM
Теперь выполнять рутинные задачи стало проще
OpenAI представили Operator — ИИ-агента, который может заказывать еду, бронировать отели и покупать билеты. Ассистент не только находит нужную информацию, но и взаимодействует с веб-страницами.
— Operator работает на модели CUA (Compute-Using Agent), основанной на ChatGPT-4o.
— Хорошо справляется с поиском в интернете, однако может ошибиться при выполнении комплексных запросов, таких как создание расписания с нуля.
— Действия агента можно корректировать и просить выполнить несколько задач одновременно.
— Пока инструмент открыт только для пользователей в США с подпиской Pro.
— OpenAI планируют открыть API, что позволит интегрировать решение в другие проекты.
— Одним из первых Operator появится на eBay, где агент будет помогать пользователям с онлайн-покупками.
OpenAI представили Operator — ИИ-агента, который может заказывать еду, бронировать отели и покупать билеты. Ассистент не только находит нужную информацию, но и взаимодействует с веб-страницами.
▪ Что важно знать:
— Operator работает на модели CUA (Compute-Using Agent), основанной на ChatGPT-4o.
— Хорошо справляется с поиском в интернете, однако может ошибиться при выполнении комплексных запросов, таких как создание расписания с нуля.
— Действия агента можно корректировать и просить выполнить несколько задач одновременно.
— Пока инструмент открыт только для пользователей в США с подпиской Pro.
— OpenAI планируют открыть API, что позволит интегрировать решение в другие проекты.
— Одним из первых Operator появится на eBay, где агент будет помогать пользователям с онлайн-покупками.
➡
Другие полезные ресурсы,
связанные с Operator и автоматизацией задач,
смотрите здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍14❤7🤯1
Китайская компания выпустила DeepSeek R1 — бесплатную модель с открытым кодом, которая уже обогнала ChatGPT по скачиваниям в AppStore.
В карусели рассказали, как установить модель на компьютер и защитить свои данные
Немного о DeepSeek:
Команды:
ollama -v
ollama run deepseek-r1:8b
Ссылки для скачивания:
AppStore | Google Play | Ollama | DeepSeek R1
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥17❤13🕊4🤔3🤣1
⚡️ Неделя апдейтов китайских моделей
Alibaba представила новую версию своей мультимодальной модели Qwen2.5-VL. Она доступна в трех вариантах: 3B, 7B и 72B параметров и может выступать в роли ИИ-агента, аналогично Operator.
— анализировать сложные изображения с высокой точностью;
— обрабатывать видео длительностью более 1 часа и выделять конкретные события в видео;
— выдавать структурированные данные при работе с формами, таблицами, счетами;
— лучше понимать последовательность событий и скорость на видео;
— распознавать объекты, тексты, диаграммы, иконки и макеты на изображениях с помощью bounding-box или точек.
Qwen2.5-VL демонстрирует высокие результаты в анализе изображений, текста, а также событий на видео. При этом с интерпретацией графиков и формул справляется хуже западных конкурентов.
📂 Веса и модель
#LLM_MTSAI
Alibaba представила новую версию своей мультимодальной модели Qwen2.5-VL. Она доступна в трех вариантах: 3B, 7B и 72B параметров и может выступать в роли ИИ-агента, аналогично Operator.
▪ Модель способна:
— анализировать сложные изображения с высокой точностью;
— обрабатывать видео длительностью более 1 часа и выделять конкретные события в видео;
— выдавать структурированные данные при работе с формами, таблицами, счетами;
— лучше понимать последовательность событий и скорость на видео;
— распознавать объекты, тексты, диаграммы, иконки и макеты на изображениях с помощью bounding-box или точек.
▪ Бенчмарки
Qwen2.5-VL демонстрирует высокие результаты в анализе изображений, текста, а также событий на видео. При этом с интерпретацией графиков и формул справляется хуже западных конкурентов.
📂 Веса и модель
#LLM_MTSAI
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11❤7👍5🤔1
Делитесь интересными статьями и исследованиями в комментариях
Создан тест, который проверяет языковые модели на глубину понимания сложных тем и способность рассуждать. Он содержит 3000 сложных вопросов по математике, гуманитарным и естественным наукам. Пока лучшая точность — 9,4% (DeepSeek-R1), но ожидается, что к 2025 году модели превысят 50% → подробнее
Учёные разработали Chain-of-Agents — фреймворк, который помогает языковым моделям лучше обрабатывать длинные тексты. Он разбивает их на части, распределяет между агентами, а затем собирает финальный ответ. Такой метод увеличивает точность на 10% → подробнее
Исследователи представили AoT+ — метод, который помогает языковым моделям лучше справляться с многозадачностью и сложными цепочками рассуждений. Благодаря ему модели уже показывает SOTA-результаты в тестах на логическое мышление → подробнее
Вышел обзор Agentic RAG — системы, где ИИ-агенты адаптируют стратегию поиска, анализируя контекст и корректируя запросы в реальном времени. Такой подход повышает точность извлечения информации и делает работу моделей более автономной, особенно в сложных задачах с длинным контекстом → подробнее
Представлен IntellAgent — open-source фреймворк для тестирования разговорных систем ИИ. Он создаёт реалистичные сценарии, выявляет пробелы в их работе и помогает оптимизировать взаимодействие с пользователями → подробнее
#MTSAI_исследования
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8❤4🏆3🤔1
Голосовые подделки, фальшивые документы и биометрические атаки — технологии становятся умнее, а вместе с ними и мошенники. Мы в MTS AI и VisionLabs запустили канал, где разбираем самые острые темы: от взломов банков по голосу до цифровых двойников в кино.
Что уже можно почитать:
— как защититься от мошенников, не выходя из Telegram
— как работает биометрия — основные термины
— подменили ли Пола Маккартни — похоже, что нет.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤17👍8🔥5👎1
OpenAI представила Deep Research — ИИ-агента, который автономно проводит исследования и решает сложные задачи.
Что важно знать:
Ваше мнение:
Deep Research — это
🔥 — шаг на пути к AGI
⚡️ — очередная надстройка для LLM
Please open Telegram to view this post
VIEW IN TELEGRAM
⚡38🔥14👍4❤3👨💻2👎1