MWS AI
7.4K subscribers
1.09K photos
155 videos
595 links
Мы разрабатываем решения и продукты на базе технологий NLP, CV и Gen AI. Формируем AI-сообщество, сотрудничаем с ведущими технологическими компаниями и экспертами, проводим исследования, инвестируем в перспективные проекты и команды.
Download Telegram
🤖 Как упростить себе жизнь в несколько раз.

На ежегодной выставке потребительской электроники CES 2025 показали гаджеты, которые могли бы заменить персонального ассистента или добавить пару свободных часов в ваш день.

Собрали в карусели то, что впечатлило нас больше всего
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍157🔥6
Media is too big
VIEW IN TELEGRAM
❤️ если было
26😁6🤣4👍2👎2
📖📖Статьи и курсы, которые нельзя пропустить. Сохраняйте подборку, чтобы вернуться к ней позже.

🔴Архитектура Titan от Google
Google представили архитектуру Titan с многокомпонентной системой памяти и потенциальным контекстом более 2 млн токенов. Такое построение помогает модели решить проблему забывчивости моделей → Подробнее

🔴 Transformer2
В новой статье от Sakana AI показана архитектура Transformer2, которая адаптируется к новым задачам в реальном времени, изменяя только части весовых матриц. Она превосходит LoRA по эффективности и подходит для мультимодальных задач → Подробнее

🔴 Inference-Time Scaling для диффузии от Google
Ещё одна работа от Google, посвящённая test-time скейлингу в диффузии. Улучшение результатов достигается через поиск оптимального шума, а не увеличение шагов шумоподавления → Подробнее

🔴 Сертифицированный курс от Hugging Face
Hugging Face запускает бесплатный курс по созданию и настройке AI-агентов. Начало уже в феврале → Подробнее

🔴Обновленный курс по LLM от Large Language Model Course
Он подходит как для новичков, так и для тех, кто давно уже в ML. Для первых подготовлена отличная база с блоком по математике, Python и нейронным сетям; для последних — упор сделан на практику: учимся cоздавать, тренировать, строить LLM и интегрировать их в бизнес → Подробнее
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15🔥53👌1
Громкие AI-новинки недели
Прошлая неделя принесла много интересных AI-решений: от мультимодальных моделей до инструмента для генерации видео. Подробнее о каждом читайте в карусели →
12👍3👌1
▪️ Ваш гид в мир NLP

В феврале стартует бесплатный курс по обработке естественного языка от руководителя группы Kodify MTS AI, Валентина Малых. Программа подойдет как новичкам, так и тем, кто хочет углубить свои знания в этой области. Курс включает два блока:

1️⃣ Базовый: основы NLP — от классификации до генерации и от n-грамм до современных LLM.

2️⃣ Продвинутый: сложные задачи и узкие темы, включая диалоговые системы.

Что ждет студентов:
— Лекции от эксперта с 10-летним опытом в AI, кандидата технических наук Валентина Малых;
— Семинары и практические задачи для закрепления навыков.;
— Работа над собственным проектом — индивидуально или в команде;
— Тесты для проверки знаний и чат для общения и обсуждений.

➡️ Присоединяйтесь *

* Для участия необходимо пройти авторизацию:
1. Войдите через Google, выбрав опцию login with ods.ai.
2. Выберите «Треки» и ODS Course Season 25: spring.
3. Нажмите кнопку «Участвовать».
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥19🤩6🔥4👍1👏1
Media is too big
VIEW IN TELEGRAM
Теперь выполнять рутинные задачи стало проще

OpenAI представили Operator — ИИ-агента, который может заказывать еду, бронировать отели и покупать билеты. Ассистент не только находит нужную информацию, но и взаимодействует с веб-страницами.

Что важно знать:


— Operator работает на модели CUA (Compute-Using Agent), основанной на ChatGPT-4o.
— Хорошо справляется с поиском в интернете, однако может ошибиться при выполнении комплексных запросов, таких как создание расписания с нуля.
— Действия агента можно корректировать и просить выполнить несколько задач одновременно.
— Пока инструмент открыт только для пользователей в США с подпиской Pro.
— OpenAI планируют открыть API, что позволит интегрировать решение в другие проекты.
— Одним из первых Operator появится на eBay, где агент будет помогать пользователям с онлайн-покупками.

Другие полезные ресурсы,
связанные с Operator и автоматизацией задач,
смотрите здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍147🤯1
Cохраняйте инструкцию: как запустить DeepSeek R1 на компьютере

Китайская компания выпустила DeepSeek R1 — бесплатную модель с открытым кодом, которая уже обогнала ChatGPT по скачиваниям в AppStore.

В карусели рассказали, как установить модель на компьютер и защитить свои данные ➡️

Немного о DeepSeek:
🔴 Создана всего за $5,6 млн (это в 10 раз дешевле конкурентов, таких как GPT-4, Claude и LLaMA)
🔴 Показывает выдающиеся результаты в решении сложных математических задач, программировании и исправлении ошибок в коде
🔴 Требует в 50 раз меньше GPU (с 100 000 до 2 000)
🔴 Работает даже на десктопных видеокартах
🔴 Разработана на чипах Nvidia H800, которые считаются менее мощными из-за экспортных ограничений США

Команды:
ollama -v

ollama run deepseek-r1:8b


Ссылки для скачивания:
AppStore | Google Play | Ollama | DeepSeek R1
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1713🕊4🤔3🤣1
⚡️ Неделя апдейтов китайских моделей

Alibaba представила новую версию своей мультимодальной модели Qwen2.5-VL. Она доступна в трех вариантах: 3B, 7B и 72B параметров и может выступать в роли ИИ-агента, аналогично Operator.

Модель способна:

— анализировать сложные изображения с высокой точностью;
— обрабатывать видео длительностью более 1 часа и выделять конкретные события в видео;
— выдавать структурированные данные при работе с формами, таблицами, счетами;
— лучше понимать последовательность событий и скорость на видео;
— распознавать объекты, тексты, диаграммы, иконки и макеты на изображениях с помощью bounding-box или точек.

Бенчмарки

Qwen2.5-VL демонстрирует высокие результаты в анализе изображений, текста, а также событий на видео. При этом с интерпретацией графиков и формул справляется хуже западных конкурентов.

📂 Веса и модель

#LLM_MTSAI
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥117👍5🤔1
📖📖Что нового в AI?

Делитесь интересными статьями и исследованиями в комментариях


Humanity’s Last Exam — новый бенчмарк для LLM
Создан тест, который проверяет языковые модели на глубину понимания сложных тем и способность рассуждать. Он содержит 3000 сложных вопросов по математике, гуманитарным и естественным наукам. Пока лучшая точность — 9,4% (DeepSeek-R1), но ожидается, что к 2025 году модели превысят 50% → подробнее

Как улучшить обработку длинных текстов
Учёные разработали Chain-of-Agents — фреймворк, который помогает языковым моделям лучше обрабатывать длинные тексты. Он разбивает их на части, распределяет между агентами, а затем собирает финальный ответ. Такой метод увеличивает точность на 10% → подробнее

Может ли LLM планировать, как человек
Исследователи представили AoT+ — метод, который помогает языковым моделям лучше справляться с многозадачностью и сложными цепочками рассуждений. Благодаря ему модели уже показывает SOTA-результаты в тестах на логическое мышление → подробнее

Agentic RAG — новый уровень поиска
Вышел обзор Agentic RAG — системы, где ИИ-агенты адаптируют стратегию поиска, анализируя контекст и корректируя запросы в реальном времени. Такой подход повышает точность извлечения информации и делает работу моделей более автономной, особенно в сложных задачах с длинным контекстом → подробнее

Новый инструмент для оценки ИИ-ассистентов
Представлен IntellAgent — open-source фреймворк для тестирования разговорных систем ИИ. Он создаёт реалистичные сценарии, выявляет пробелы в их работе и помогает оптимизировать взаимодействие с пользователями → подробнее

#MTSAI_исследования
Please open Telegram to view this post
VIEW IN TELEGRAM
👍84🏆3🤔1
Дипфейки вышли на новый уровень. Кто под ударом в 2025 году? Спойлер: почти все.

Голосовые подделки, фальшивые документы и биометрические атаки — технологии становятся умнее, а вместе с ними и мошенники. Мы в MTS AI и VisionLabs запустили канал, где разбираем самые острые темы: от взломов банков по голосу до цифровых двойников в кино.

Что уже можно почитать:
как защититься от мошенников, не выходя из Telegram
— как работает биометрия — основные термины
— подменили ли Пола Маккартни — похоже, что нет.
Please open Telegram to view this post
VIEW IN TELEGRAM
17👍8🔥5👎1
🔥 Этот год для ИИ-агентов обещает быть жарким

OpenAI представила Deep Research — ИИ-агента, который автономно проводит исследования и решает сложные задачи.

Что важно знать:
🔴 Работает на "рассуждающей" модели o3.
🔴 Сочетает в себе возможности веб-браузинга, анализирует, прикрепленные файлы и выполняет Python-скриптов.
🔴 В основе лежит принцип автономного планирования исследования — уточняет вопросы, отбирает источники.
🔴 Обрабатывает сотни текстов, изображений и PDF-документов.
🔴 Генерирует подробный отчет за 10–30 минут.
🔴 В тесте Humanity’s Last Exam набирает 26,6% — в 12 раз лучше Grok-2 и GPT-4o.
🔴Доступен для пользователей ChatGPT Pro.

Ваше мнение:

Deep Research — это
🔥 — шаг на пути к AGI
⚡️ — очередная надстройка для LLM
Please open Telegram to view this post
VIEW IN TELEGRAM
38🔥14👍43👨‍💻2👎1