Alan robotics
158 subscribers
116 photos
50 videos
64 links
AI, robotics
Download Telegram
Forwarded from СОГУ
За два дня статья выпускника физико-технического факультета СОГУ Алана Газзаева о создании виртуального клона и небольшой библиотеки для работы с ним стала второй по популярности в блоге МТС на сайте Хабр.

🎉Поздравляем Алана с очередным достижением!


Пишите в наш чат-бот @mediasogubot

Подписывайтесь на
СОГУ

#СОГУ #СОГУгордится
#Осетия #Владикавказ
7🔥5👍1🕊1
Много чатов в Telegram и еще больше непрочитанных сообщений…Знакомая ситуация?

Наш студент Алан-Барсаг Газзаев нашел решение – виртуальный клон. В перспективе он сможет общаться за вас, так как умеет улавливать паттерны общения и понимать контекст. А самое приятное – вы уже сейчас можете попробовать настроить такого клона у себя. Все подробности ищите в статье на Хабре.
🔥9
Дал комментарий для МТС ИИ🤖
🔥5
Forwarded from MWS AI
В 2023 году на наших глазах произошла революция в сфере искусственного интеллекта. Крупные технологические компании, стартапы и академические институты словно вступили в негласное соревнование — кто удивит мир очередной разработкой в области ИИ.

Наш коллега, разработчик-исследователь MTS AI Алан Газзаев
назвал топ-5 самых впечатляющих открытий и разработок в сфере искусственного интеллекта за этот год.

1. Voice cloning
В 2023 году появилось множество моделей и сервисов по
клонированию голоса. Некоторым достаточно всего 10 секунд записи, чтобы имитировать интонации и тембр говорящего или поющего. Яркий пример — синтетические песни умерших музыкантов 2pac и DMX.

2. Emu Video
Компания Meta* (признана экстремистской и запрещена в РФ) выпустила модель генерации видео по тексту. Emu сначала создаёт изображение на основе описания, затем видеоролик с учётом картинки и текста. Результаты очень реалистичные.

3. Модели LLaMA и LLaMA-2 от Meta* (признана экстремистской и запрещена в РФ)
Запуск этих языковых моделей дал старт активной гонке вооружений среди ИИ-компаний. Благодаря новым методам оптимизации теперь даже небольшие стартапы могут создавать инструктивными модели с миллиардами параметров.

4. ChatGPT и GPT-4 от OpenAI
После революционной ChatGPT вышла ещё более продвинутая GPT-4. Она анализирует большие тексты, распознаёт изображения. Также стала доступна кастомизация моделей GPT.

5. Семейство моделей Gemini от Google
Gemini умеет работать сразу с текстом, кодом, видео и аудио. Как утверждают разработчики, это не набор отдельных алгоритмов, а единая универсальная модель для различных типов данных. Компания планирует интегрировать Gemini в собственную экосистему продуктов.

* Meta признана экстремистской и запрещена в РФ.
🔥52
Ускорил генерацию текста больше чем в 20 раз с помощью асинхронных вызовов и библиотеки vLLM, и рассказал об этом в новой статье для MTS AI🤖

Прочитать можно здесь
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥4
Так совпало, что сегодня день рождения сразу у трёх любимых, уважаемых и ценимых нами представителей научного сообщества республики.

Во-первых, у Анатолия Георгиевича Кусраева, доктора физико-математических наук, профессора, заслуженного деятеля науки РФ и научного руководителя Владикавказского научного центра РАН.

Во-вторых, у Тамерлана Таймуразовича Магкоева, доктора физико-математических наук, профессора, заслуженного деятеля науки РСО-Алания и заведующего кафедрой физики конденсированного состояния СОГУ.

В-третьих, у Алана Газзаева, разработчика-исследователя Центра искусственного интеллекта МТС («MTS AI»), победителя конкурса Фонда содействия инновациям «Студенческий стартап» 2022 года, в прошлом году с отличием окончившего физико-технический факультет СОГУ и ныне обучающегося на магистратуре ИТМО «Глубокое обучение и генеративный искусственный интеллект».

От всего сердца поздравляем их и желаем здоровья, радости, энергии и дальнейших успехов в научных начинаниях. Пусть каждый новый день приносит им новые возможности для прогресса и достижений.

С Днём Рождения!

🔸Подписывайтесь на «Учёных Осетии» и пишите нам в чат-бот @amursobot
🔥43🎉1
Forwarded from MWS AI
💡 Мы создали большую языковую модель для бизнеса — MTS AI Chat

📝 LLM необходима там, где нужно работать с большим количеством текстовой информации: в HR, делопроизводстве и маркетинге.

🖥 MTS AI Chat составит текст официального письма, должностной инструкции, подготовит описание вакансии и заполнит карточку в CRM-системе. Также она суммирует содержание переписки, встречи или расшифровки звонков и зафиксирует важные договоренности.

👨‍💼 С помощью MTS AI Chat можно автоматизировать подбор и найм персонала, провести онбординг и тестирование действующих сотрудников, а также научить корпоративный поиск отвечать на вопросы о правилах, внутреннем распорядке и проектном опыте компании.

🔒 Большая языковая модель устанавливается в контуре, а это значит, что доступ к вашим данным не получат сторонние корпорации.

🏆 MTS AI Chat входит в топ-3 российских LLM по скорости и точности ответов.

📲 Записывайтесь на тестирование большой языковой модели по ссылке.
👍43🔥2
Forwarded from IrystonTV
Media is too big
VIEW IN TELEGRAM
👨‍🎓 По программе «Стартап как диплом» студенты СОГУ представят практически готовый бизнес-проект.

Свой продукт для бизнеса разработали студенты физтеха и юрфака. Голосовой ассистент выполняет любую команду. Достаточно ее произнести и можно отправить электронное письмо, составить резюме, запустить zoom-конференцию и многое другое.

💰 Два года назад команда выиграла в конкурсе Фонда содействия инновациям «Студенческий стартап» и получила грант в размере 1 млн руб.

Участвовать и получать гранты Фонда могут и аспиранты. В этом году защищать свои бизнес-проекты будут две команды.

Подписывайтесь на irystonTV
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥3🎉2
Недавно наша команда выложила в открытый доступ большую языковую модель MultiVerse размером в 70 миллиардов параметров (для понимания, chatGPT это тоже языковая модель)

Круто то, что модель заняла в общемировом лидерборде языковых моделей 2 место🤯

Принял участие в квантизации этой модели (сжатием в 4 раза), теперь вместо ~150 ГБ модель занимает ~39 ГБ

Квантизированная версия
доступна в официальном хабе MTS AI
🔥11👍2
В 2022 году мы получили грант размером в 1 000 000 рублей, а сегодня мы полностью выполнили все свои обязательства перед Фондом Содействия Инновациям🤖

Средства, полученные от фонда, позволили купить сервер для машинного обучения, благодаря чему мы выпустили мобильное приложение с несколькими нейронными сетями под капотом
👍9🔥2🎉2🐳1
Forwarded from MWS AI
Длинные выходные — отличный повод заглянуть на Хабр MTS AI и почитать статьи наших коллег. Ловите небольшую подборку последних материалов, которые нельзя пропустить. 📚

🏆 Как нам удалось собрать команду исследователей меньше чем за год

Прочитайте и узнаете, кто такие исследователи, чем их работа отличается от ML-инженеров, и почему не каждый разработчик может заниматься наукой. 🔬

🎥 Как создать ассистента для поиска по видео

В статье рассматривается подход к созданию общей системы видеоаналитики, которая понимает задачи во время общения с пользователем в чате. 💻

Как ускорить LLM-генерацию текста в 20 раз на больших наборах данных

Рассказали, как с помощью асинхронных запросов и встроенных особенностей vLLM можно увеличить скорость создания данных. 🚀

Подписывайтесь на наш Хабр, комментируйте и сохраняйте статьи! 👏

👍 - если вы уже читаете MTS AI на этой площадке
🔥52
Немного об учебе

Прошел уже примерно год с момента поступления в универ ИТМО, а значит два семестра магистратуры позади

Направление называется «Глубокое обучение и генеративный искусственный интеллект», именно сюда я хотел попасть еще с зимы 4 курса физтеха СОГУ

Не во все предметы успел углубиться, но хочу отметить несколько классных дисциплин прошедшего семестра

Обучение с подкреплением: пришлось покопаться в коде обучения агента. Здесь агент это тележка с установленной вертикально палкой, нам же нужно обучить агента держать баланс

Методы ИИ в обработке естественных языков: по ходу курса мне надо было обучить вопросно- ответную модель, затем сгенерировать синтетические данные и обучить новую модель на этих данных, а затем сравнить некоторые метрики (например BLEU и ROUGE для машинного перевода). В качестве вопросно- ответной модели взял T5, с которой уже работал, а для генерации данных использовал квантизированную в 4 бит модель с 70 миллиардами параметров

Технологии обработки больших данных: не успел полностью погрузиться в курс, понравилась работа с CI/CD (Jenkins), а именно пайплайн сборки и деплоя ML- модели при каждом push/pull request в репозиторий. В целом очень серьезный курс по MLops

Помимо этого нужно отметить умных ребят, которые учатся на том же направлении, профессиональная среда это очень важная штука

Посмотрим как дальше🤖
👍8🔥62
Начинаем понедельник с больших достижений 🤩

Магистерская программа «Глубокое обучение и генеративный искусственный интеллект» получила аккредитацию от Альянса в сфере ИИ. Это уже третья программа ИТМО, которая вошла в реестр Альянса. Экспертная комиссия рекомендовала ее в качестве эталонной — в том числе для реализации на площадках других вузов.

Почему это круто и о чем сама программа — в новости ITMO NEWS 👈

#новости #магистратураИТМО
Please open Telegram to view this post
VIEW IN TELEGRAM
🤗5
ChatGPT, Gemini и другие языковые модели круто работают с текстом. Но можем ли мы расширить способности этих моделей? Допустим, сделать так, чтобы при вопросе «какая сейчас погода во Владикавказе?» модель вернула нам не галлюцинации, а реальные данные о погоде. Здесь на помощь приходит function calling-это свежее направление, концепция которого заключаются в том, чтобы дать возможность LLM влиять на внешний мир (узнавать погоду, отправлять письмо, давать команду роботу)

Недавно я проводил исследование по этой теме для МТС ИИ и решил перенести это в статью на Хабр. Подробнее можно почитать здесь:

https://habr.com/ru/companies/mts_ai/articles/831220/

Ссылка на гит с кодом для отправки почты с помощью LLM-агента:

https://github.com/mts-ai/function-calling
🤗3🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Когда ушел в отпуск (sorry for my English🤓)

Что происходит на видео: я говорю языковой модели что нужно сделать, а она вызывает соответствующую функцию для робота)

Подробнее:

До этого обучил языковую модель Phi-3, чтобы она научилась вызывать подходящие к запросу пользователя функции(подробнее в предыдущем посте) и подключил все это к своему старому роботу

Теперь можно передать языковой модели произвольный запрос, и он поймет какое из доступных действий для робота ей вызывать, на данном видео я показываю как модель вызывает несколько действий подряд (о чем я ее и попросил)

В общем, сделал так, чтобы LLM-агент управлял роботом
🔥5👍3
Forwarded from MWS AI
🚀 Представьте, что вам нужно узнать погоду с помощью LLM. Если это задача кажется сложной, наша новая статья на Хабре для вас…

🤔 Что такое вызов функций? Это концепция, позволяющая LLM обращаться к внешним инструментам для решения задач, которые она не может выполнить самостоятельно.

🌟 Почему это эффективно? Применение вызова функций позволяет разработчикам создавать AI-приложения с минимальными временными затратами. Например, можно интегрировать сложные операции без необходимости переписывать код с нуля.

🤝 В статье рассмотрели эксперимент с вызовом функций на модели от Google и несколькими решениями с открытым исходным кодом. Узнайте, к каким результатам мы пришли!
🔥32
Нашей LLM Cotype Pro удалось обогнать удалось обогнать GPT-4 на большом контексте. Как мы это сделали?

Коротко: Предложил использовать метод RoPE, который позволил нам расширить окно контекста модели Cotype Pro до 16k, затем мы произвели автоматическую и ручную оценку на нашем длинном бенчмарке

Подробнее об этом и других методах можно почитать в интересной статье моей коллеги:

https://habr.com/ru/companies/mts_ai/articles/834786/
🔥53👍1
Forwarded from MWS AI
🖥 Как обучить LLM работать с длинными текстами без СМС и регистраций

💡 Современные языковые модели (LLM) значительно расширили свои возможности, но по-прежнему сталкиваются с проблемами, такими как потеря контекста, галлюцинации и искажения данных.

💪 Эти сложности особенно выражены при работе с длинными текстами. Для успешного решения задач крайне важно правильно оценивать LLM и учитывать вычислительные затраты.

🚀 В новой статье мы делимся опытом применения моделей Cotype Plus от MTS AI, способных обрабатывать тексты объемом до 16 000 и 32 000 токенов. Наша команда использовала продвинутые методы обучения, чтобы модели лучше понимали длинные тексты, а также разработала собственный способ оценки их качества и новый метод анализа ответов.

🎯 В результате нам удалось достичь результатов на уровне GPT-4 при обработке длинных текстов и значительно повысить эффективность работы без чрезмерных затрат ресурсов.

Как именно?
Читайте на Хабре
Please open Telegram to view this post
VIEW IN TELEGRAM
3
Forwarded from MWS AI
Ура! Мы обновили LLM Cotype Pro!

Теперь большую языковую модель можно запустить на одной видеокарте NVIDIA A100. Она обрабатывает длинные тексты — до 20 страниц, тратя на это в 4 раза меньше ресурсов.

В чем отличие от других моделей: Cotype Light и Cotype Plus? Рассказали на карточках.
🔥3👍2