Alan robotics
158 subscribers
116 photos
50 videos
64 links
AI, robotics
Download Telegram
Нашу статью опубликовали на воркшопе конференции COLM в Канаде, Монреаль

Моя часть работы посвящена мультиагентной системе для оценки ответов языковых моделей

Это нужно чтобы более эффективно проверять насколько качественные ответы на нашем языке выдают модели

Проще говоря, несколько агентов совещаются между собой, высказывая по одному вердикту, а затем агент-судья выносит финальный вердикт

https://openreview.net/forum?id=kkcvlIENVq
🔥41👍1
🔥4👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Решил попробовать плату arduino nano в качестве мозга робота, текущие нижние сервоприводы слабые, поэтому делать пробежки ему рановато
🔥5
Представил на конференции «Нейроинформатика» два доклада по теме рассуждающих языковых моделей, одна из статей уже доступна в сборнике Springer
🔥6👍4
🔥72🤗1
В итоге, по моей магистерской диссертации было опубликовано три работы:

1. Exploring Side-by-Side LLM Evaluation Through Human Alignment and Bias Mitigation опубликована на воркшопе молодой конференции COLM в Канаде. В этой работе предложил мультиагентную систему для оценки языковых моделей.

2. MoE-reasoner. Работа опубликована в Springer Nature. В работе предлагается гибридный подход для создания сбалансированной рассужающей модели.

3. Reasoning with multiple hypothesis generation. Работа была опубликована в сборнике научных трудов МИФИ, затрагивает рассуждения с генерацией нескольких гипотез
👍5🔥1🤗1
Одна из наших работ заняла третье место в конкурсе научных работ молодых специалистов на конференции в Москве, ездил на Нейроинформатику просто выступить, но приятно, что работу оценили
🔥5👍3
🔥2
Провел сегодня лекцию в ИТМО для сотрудников, рассказал про ИИ в образовании, показал как с помощью нейронной сети оценить процесс рассуждения обучающихся
🔥42
Генеральный директор MWS AI показал достижения компании за год, в том числе победу модели (над которой я работал в прошлом году) в национальной премии
🔥6
Прошедший год выдался насыщенным на разные события: победа моей разработки в национальной премии, завершение магистратуры в ведущем в области искусственного интеллекта универе ИТМО (моя диссертация стала одной из лучших на нашем направлении). Этот же универ в этом году впервые выложил текст про мой путь от стартапа в СОГУ (люблю физтех) до разработки для телеком-гиганта МТС, а чуть позже про вышло и видео-интервью от всероссийской программы

Те, кто следит за тем, что я делаю про все это уже слышали, но тем не менее

Очень благодарен, посмотрим как дальше
🔥141👍1🤗1
This media is not supported in your browser
VIEW IN TELEGRAM
Собрал систему которая распознает речь, затем визуальная языковая модель самостоятельно выполняет команды, которые я озвучил (сама гуглит, нажимает на первую статью и открывает ее)

В системе используется VOSK и связка библиотеки browser-use с моделью Qwen2.5-VL-7B
🔥4👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Здесь все уже делает модель поменьше (4 миллиарда параметров), но более свежая (Qwen3)
🔥2
Поигрался сегодня со smolagents, мне понравилось, особенно как агент гуглит, вытягивает информацию с сайтов и делает репорт. Поэтому решил имплементировать свою «Deep Research», которая по запросу обращается к поисковой системе DuckDuckGo, парсит содержимое сайтов и скармливает Qwen3-14B, которая все это суммаризирует

Прикрепил в качестве примера два таких отчета

Помимо этого в системе есть агент для проверки релевантности запроса пользователя и поисковой выдачи, а также агент, который вытягивает информацию из кучи текста с сайта. Но в целом, если закинуть текст напрямую в Qwen, она справляется
🔥31
Проще говоря, по запросу "Лучшие открытые LLM в 2026 году" система составит отчет по теме, пример такого отчета:
2👍1🔥1