Alan robotics
158 subscribers
116 photos
50 videos
64 links
AI, robotics
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Решил попробовать плату arduino nano в качестве мозга робота, текущие нижние сервоприводы слабые, поэтому делать пробежки ему рановато
🔥5
Представил на конференции «Нейроинформатика» два доклада по теме рассуждающих языковых моделей, одна из статей уже доступна в сборнике Springer
🔥6👍4
🔥72🤗1
В итоге, по моей магистерской диссертации было опубликовано три работы:

1. Exploring Side-by-Side LLM Evaluation Through Human Alignment and Bias Mitigation опубликована на воркшопе молодой конференции COLM в Канаде. В этой работе предложил мультиагентную систему для оценки языковых моделей.

2. MoE-reasoner. Работа опубликована в Springer Nature. В работе предлагается гибридный подход для создания сбалансированной рассужающей модели.

3. Reasoning with multiple hypothesis generation. Работа была опубликована в сборнике научных трудов МИФИ, затрагивает рассуждения с генерацией нескольких гипотез
👍5🔥1🤗1
Одна из наших работ заняла третье место в конкурсе научных работ молодых специалистов на конференции в Москве, ездил на Нейроинформатику просто выступить, но приятно, что работу оценили
🔥5👍3
🔥2
Провел сегодня лекцию в ИТМО для сотрудников, рассказал про ИИ в образовании, показал как с помощью нейронной сети оценить процесс рассуждения обучающихся
🔥42
Генеральный директор MWS AI показал достижения компании за год, в том числе победу модели (над которой я работал в прошлом году) в национальной премии
🔥6
Прошедший год выдался насыщенным на разные события: победа моей разработки в национальной премии, завершение магистратуры в ведущем в области искусственного интеллекта универе ИТМО (моя диссертация стала одной из лучших на нашем направлении). Этот же универ в этом году впервые выложил текст про мой путь от стартапа в СОГУ (люблю физтех) до разработки для телеком-гиганта МТС, а чуть позже про вышло и видео-интервью от всероссийской программы

Те, кто следит за тем, что я делаю про все это уже слышали, но тем не менее

Очень благодарен, посмотрим как дальше
🔥141👍1🤗1
This media is not supported in your browser
VIEW IN TELEGRAM
Собрал систему которая распознает речь, затем визуальная языковая модель самостоятельно выполняет команды, которые я озвучил (сама гуглит, нажимает на первую статью и открывает ее)

В системе используется VOSK и связка библиотеки browser-use с моделью Qwen2.5-VL-7B
🔥4👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Здесь все уже делает модель поменьше (4 миллиарда параметров), но более свежая (Qwen3)
🔥2
Поигрался сегодня со smolagents, мне понравилось, особенно как агент гуглит, вытягивает информацию с сайтов и делает репорт. Поэтому решил имплементировать свою «Deep Research», которая по запросу обращается к поисковой системе DuckDuckGo, парсит содержимое сайтов и скармливает Qwen3-14B, которая все это суммаризирует

Прикрепил в качестве примера два таких отчета

Помимо этого в системе есть агент для проверки релевантности запроса пользователя и поисковой выдачи, а также агент, который вытягивает информацию из кучи текста с сайта. Но в целом, если закинуть текст напрямую в Qwen, она справляется
🔥31
Проще говоря, по запросу "Лучшие открытые LLM в 2026 году" система составит отчет по теме, пример такого отчета:
2👍1🔥1