This media is not supported in your browser
VIEW IN TELEGRAM
Вышла запись подкаста «AI-завтрак» на Яндекс музыке, на котором мы обсудили рассуждающие языковые модели
Спасибо за приглашение https://t.me/gigaschooI
Спасибо за приглашение https://t.me/gigaschooI
🔥4❤1
Нашу статью опубликовали на воркшопе конференции COLM в Канаде, Монреаль
Моя часть работы посвящена мультиагентной системе для оценки ответов языковых моделей
Это нужно чтобы более эффективно проверять насколько качественные ответы на нашем языке выдают модели
Проще говоря, несколько агентов совещаются между собой, высказывая по одному вердикту, а затем агент-судья выносит финальный вердикт
https://openreview.net/forum?id=kkcvlIENVq
Моя часть работы посвящена мультиагентной системе для оценки ответов языковых моделей
Это нужно чтобы более эффективно проверять насколько качественные ответы на нашем языке выдают модели
Проще говоря, несколько агентов совещаются между собой, высказывая по одному вердикту, а затем агент-судья выносит финальный вердикт
https://openreview.net/forum?id=kkcvlIENVq
🔥4❤1👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Решил попробовать плату arduino nano в качестве мозга робота, текущие нижние сервоприводы слабые, поэтому делать пробежки ему рановато
🔥5
Представил на конференции «Нейроинформатика» два доклада по теме рассуждающих языковых моделей, одна из статей уже доступна в сборнике Springer
🔥6👍4
В итоге, по моей магистерской диссертации было опубликовано три работы:
1. Exploring Side-by-Side LLM Evaluation Through Human Alignment and Bias Mitigation опубликована на воркшопе молодой конференции COLM в Канаде. В этой работе предложил мультиагентную систему для оценки языковых моделей.
2. MoE-reasoner. Работа опубликована в Springer Nature. В работе предлагается гибридный подход для создания сбалансированной рассужающей модели.
3. Reasoning with multiple hypothesis generation. Работа была опубликована в сборнике научных трудов МИФИ, затрагивает рассуждения с генерацией нескольких гипотез
1. Exploring Side-by-Side LLM Evaluation Through Human Alignment and Bias Mitigation опубликована на воркшопе молодой конференции COLM в Канаде. В этой работе предложил мультиагентную систему для оценки языковых моделей.
2. MoE-reasoner. Работа опубликована в Springer Nature. В работе предлагается гибридный подход для создания сбалансированной рассужающей модели.
3. Reasoning with multiple hypothesis generation. Работа была опубликована в сборнике научных трудов МИФИ, затрагивает рассуждения с генерацией нескольких гипотез
👍5🔥1🤗1
Прошедший год выдался насыщенным на разные события: победа моей разработки в национальной премии, завершение магистратуры в ведущем в области искусственного интеллекта универе ИТМО (моя диссертация стала одной из лучших на нашем направлении). Этот же универ в этом году впервые выложил текст про мой путь от стартапа в СОГУ (люблю физтех) до разработки для телеком-гиганта МТС, а чуть позже про вышло и видео-интервью от всероссийской программы
Те, кто следит за тем, что я делаю про все это уже слышали, но тем не менее
Очень благодарен, посмотрим как дальше
Те, кто следит за тем, что я делаю про все это уже слышали, но тем не менее
Очень благодарен, посмотрим как дальше
🔥14❤1👍1🤗1
This media is not supported in your browser
VIEW IN TELEGRAM
Собрал систему которая распознает речь, затем визуальная языковая модель самостоятельно выполняет команды, которые я озвучил (сама гуглит, нажимает на первую статью и открывает ее)
В системе используется VOSK и связка библиотеки browser-use с моделью Qwen2.5-VL-7B
В системе используется VOSK и связка библиотеки browser-use с моделью Qwen2.5-VL-7B
🔥4👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Здесь все уже делает модель поменьше (4 миллиарда параметров), но более свежая (Qwen3)
🔥2
Поигрался сегодня со smolagents, мне понравилось, особенно как агент гуглит, вытягивает информацию с сайтов и делает репорт. Поэтому решил имплементировать свою «Deep Research», которая по запросу обращается к поисковой системе DuckDuckGo, парсит содержимое сайтов и скармливает Qwen3-14B, которая все это суммаризирует
Прикрепил в качестве примера два таких отчета
Помимо этого в системе есть агент для проверки релевантности запроса пользователя и поисковой выдачи, а также агент, который вытягивает информацию из кучи текста с сайта. Но в целом, если закинуть текст напрямую в Qwen, она справляется
Прикрепил в качестве примера два таких отчета
Помимо этого в системе есть агент для проверки релевантности запроса пользователя и поисковой выдачи, а также агент, который вытягивает информацию из кучи текста с сайта. Но в целом, если закинуть текст напрямую в Qwen, она справляется
🔥3❤1