Alan robotics
158 subscribers
116 photos
50 videos
64 links
AI, robotics
Download Telegram
Прошедший год выдался насыщенным на разные события: победа моей разработки в национальной премии, завершение магистратуры в ведущем в области искусственного интеллекта универе ИТМО (моя диссертация стала одной из лучших на нашем направлении). Этот же универ в этом году впервые выложил текст про мой путь от стартапа в СОГУ (люблю физтех) до разработки для телеком-гиганта МТС, а чуть позже про вышло и видео-интервью от всероссийской программы

Те, кто следит за тем, что я делаю про все это уже слышали, но тем не менее

Очень благодарен, посмотрим как дальше
🔥141👍1🤗1
This media is not supported in your browser
VIEW IN TELEGRAM
Собрал систему которая распознает речь, затем визуальная языковая модель самостоятельно выполняет команды, которые я озвучил (сама гуглит, нажимает на первую статью и открывает ее)

В системе используется VOSK и связка библиотеки browser-use с моделью Qwen2.5-VL-7B
🔥4👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Здесь все уже делает модель поменьше (4 миллиарда параметров), но более свежая (Qwen3)
🔥2
Поигрался сегодня со smolagents, мне понравилось, особенно как агент гуглит, вытягивает информацию с сайтов и делает репорт. Поэтому решил имплементировать свою «Deep Research», которая по запросу обращается к поисковой системе DuckDuckGo, парсит содержимое сайтов и скармливает Qwen3-14B, которая все это суммаризирует

Прикрепил в качестве примера два таких отчета

Помимо этого в системе есть агент для проверки релевантности запроса пользователя и поисковой выдачи, а также агент, который вытягивает информацию из кучи текста с сайта. Но в целом, если закинуть текст напрямую в Qwen, она справляется
🔥31
Проще говоря, по запросу "Лучшие открытые LLM в 2026 году" система составит отчет по теме, пример такого отчета:
2👍1🔥1
https://github.com/alanrbtx/simple_deep_research

Написал репозиторий для DeepResearch на основе своего вчерашнего кода, позволяет в двух режимах составлять отчеты по заданному вопросу

Первый режим (Lite): агент обращается в сеть и извлекает информацию с нескольких сайтов. Работает неплохо, у DuckDuckGo хороший поиск

Второй режим (Full): агент сначала оценивает сложность вопроса, затем разбивает на несколько подвопросов и делает запрос по каждому. Информация собирается, суммируется (для сжатия контекста) и выдается в виде отчета

Примеры отчетов для каждого режима можно найти по ссылке
🔥72👍2
🔥31👍1
Для магистрантов ИТМО буду вести семинары по этому курсу
Forwarded from MWS AI
9 февраля стартует новый сезон бесплатного онлайн-курса Natural Language Processing & LLMs. Это совместный проект Open Data Science и MWS AI при поддержке ИТМО, МФТИ и ВШЭ, который мы проводим уже в десятый раз.

Курс подойдёт тем, кто хочет системно разобраться в NLP и современных LLM, а не просто «поиграться» с моделями.

Что будет в программе:
🔴 базовые концепции NLP: закон Ципфа, TF-IDF, RNN, CNN, Transformer;
🔴 ключевые задачи обработки текста: классификация, тегирование, генерация;
🔴 современные направления: агентные подходы и вайбкодинг;
🔴 большие языковые модели и сценарии их применения.


Формат обучения:
🔴
8 основных лекций с семинарами и квизами;
🔴
8 дополнительных лекций;
🔴
3 практических задания: Word2Vec, соревнование по классификации текстов и обучение агентов;
🔴
финальный индивидуальный или командный проект, который можно добавить в портфолио;


📌 Первое занятие уже 10 февраля. Зарегистрироваться можно по ссылке.
Please open Telegram to view this post
VIEW IN TELEGRAM
2
Forwarded from Научный опенсорс (Nikolay Nikitin)
А тем временем, начинаем публикацию программы нашего митапа, который пройдет 12.02 в 18-00. Вот перечень докладов с авторскими аннотациями:

- Школа-конкурс EDGE AI 2025: как мы первыми в России представили флагманский китайский стек для работы с ИИ-моделями на EDGE устройствах c OpenScaler OS // Владимир Павлов - Технический комитет сообщества OpenScaler

В докладе мы поделимся опытом сообщества OpenScaler по проведению соревнований в новом формате: студенческие ИИ-команды из ведущих вузов страны сначала проходили обучение у наших менторов, а затем соревновались на лучшую реализацию различных ИИ-моделей на краевых устройствах Orange Pi на базе чипов Ascend и ОС OpenScaler. Расскажем о самом конкурсе, командах и проектах студентов, которые были представлены в финале. Все учебные материалы были опубликованы в открытом доступе, а проекты финалистов размещены на платформе GitVerse.

- [Секретный доклад] // Олег Чирухин - владелец продукта GigaIDE Cloud

Как понятно из названия - подробности будут раскрыты только в самый последний момент!


- OpenSource по-пекински, или почему фонд OpenAtom - это прекрасно, но не в наших реалиях // Аристов Константин - Скала^р (группа Рубитех), руководитель направления RnD системного ПО

Поговорим о том, какой дивный симбиоз между собором и базаром (openSource и Кговавым Ынтырпрайзом) получился в КНР, попробуем прикинуть тамошние реалии на наши, придем к парадоксальному выводу насчет пользы конкуренции.

- Студенческий open-source в ML - опыт внедрения поддержки ONNX // Зверев Андрей - студент 3 курса Новосибирского Государственного Университета, стажер-разработчик в Яндексе

Как превратить скучную учебную практику в реальный проект, которым не стыдно гордиться и который добавляет ценности в резюме? Расскажу на личном примере участия в лаборатории YADRO при НГУ.
Поясню, что такое формат лаборатории: как туда попасть, какие возможности она дает студентам. На практическом кейсе покажу, как выглядят рабочие процессы изнутри: постановка задач, планирование, работа через issues/PR, тестирование и выпуск; с какими трудностями столкнулся и как их решал при поддержке наставников из реальной компании-партнера.
В технической части объясню простыми словами: что такое ONNX и почему стандарт обмена моделями важен для переносимости и воспроизводимости, чем его поддержка усилила проект Adept и какие результаты получились на практике.


- Simple Deep Research - открытый фреймворк для мультиагентного поиска // Алан Газзаев - аспирант ИТМО, NLP researcher at MWS AI

Simple Deep Research - это простая система для поиска информации в интернете с помощью мультиагентного подхода. Система работает в двух режимах: lite и full. В первом режиме агент посещает несколько сайтов, сжимает информацию и выдает отчет. Во втором режиме агент определяет сложность запроса, разбивает его на подзапросы, а затем другие агенты ищут и суммируют информацию по каждому запросу. Одна из основных идей данного фреймворка заключается в том, что он не содержит таких зависимостей как langchain и smolagents и быстро запускается с локальными моделями через vLLM/llama.cpp. Также фреймворк модульный, можно заменить поисковой движок и агентов по необходимости.

Ссылка на регистрацию прежняя - https://openmeetup.ru/
Места на площадке конечны, так что не откладывайте!
👍5
Alan robotics
Выступил сегодня на Open Source Meetup, мне понравилось
Лучший доклад на Open Source митапе по итогам голосования
🔥9