Прошедший год выдался насыщенным на разные события: победа моей разработки в национальной премии, завершение магистратуры в ведущем в области искусственного интеллекта универе ИТМО (моя диссертация стала одной из лучших на нашем направлении). Этот же универ в этом году впервые выложил текст про мой путь от стартапа в СОГУ (люблю физтех) до разработки для телеком-гиганта МТС, а чуть позже про вышло и видео-интервью от всероссийской программы
Те, кто следит за тем, что я делаю про все это уже слышали, но тем не менее
Очень благодарен, посмотрим как дальше
Те, кто следит за тем, что я делаю про все это уже слышали, но тем не менее
Очень благодарен, посмотрим как дальше
🔥14❤1👍1🤗1
This media is not supported in your browser
VIEW IN TELEGRAM
Собрал систему которая распознает речь, затем визуальная языковая модель самостоятельно выполняет команды, которые я озвучил (сама гуглит, нажимает на первую статью и открывает ее)
В системе используется VOSK и связка библиотеки browser-use с моделью Qwen2.5-VL-7B
В системе используется VOSK и связка библиотеки browser-use с моделью Qwen2.5-VL-7B
🔥4👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Здесь все уже делает модель поменьше (4 миллиарда параметров), но более свежая (Qwen3)
🔥2
Поигрался сегодня со smolagents, мне понравилось, особенно как агент гуглит, вытягивает информацию с сайтов и делает репорт. Поэтому решил имплементировать свою «Deep Research», которая по запросу обращается к поисковой системе DuckDuckGo, парсит содержимое сайтов и скармливает Qwen3-14B, которая все это суммаризирует
Прикрепил в качестве примера два таких отчета
Помимо этого в системе есть агент для проверки релевантности запроса пользователя и поисковой выдачи, а также агент, который вытягивает информацию из кучи текста с сайта. Но в целом, если закинуть текст напрямую в Qwen, она справляется
Прикрепил в качестве примера два таких отчета
Помимо этого в системе есть агент для проверки релевантности запроса пользователя и поисковой выдачи, а также агент, который вытягивает информацию из кучи текста с сайта. Но в целом, если закинуть текст напрямую в Qwen, она справляется
🔥3❤1
Проще говоря, по запросу "Лучшие открытые LLM в 2026 году" система составит отчет по теме, пример такого отчета:
❤2👍1🔥1
https://github.com/alanrbtx/simple_deep_research
Написал репозиторий для DeepResearch на основе своего вчерашнего кода, позволяет в двух режимах составлять отчеты по заданному вопросу
Первый режим (Lite): агент обращается в сеть и извлекает информацию с нескольких сайтов. Работает неплохо, у DuckDuckGo хороший поиск
Второй режим (Full): агент сначала оценивает сложность вопроса, затем разбивает на несколько подвопросов и делает запрос по каждому. Информация собирается, суммируется (для сжатия контекста) и выдается в виде отчета
Примеры отчетов для каждого режима можно найти по ссылке
Написал репозиторий для DeepResearch на основе своего вчерашнего кода, позволяет в двух режимах составлять отчеты по заданному вопросу
Первый режим (Lite): агент обращается в сеть и извлекает информацию с нескольких сайтов. Работает неплохо, у DuckDuckGo хороший поиск
Второй режим (Full): агент сначала оценивает сложность вопроса, затем разбивает на несколько подвопросов и делает запрос по каждому. Информация собирается, суммируется (для сжатия контекста) и выдается в виде отчета
Примеры отчетов для каждого режима можно найти по ссылке
GitHub
GitHub - alanrbtx/simple_deep_research: Simple Deep Research is an open-source, easy-to-run framework for building autonomous deep…
Simple Deep Research is an open-source, easy-to-run framework for building autonomous deep research systems. It works seamlessly with both open-source (via vLLM/llama.cpp) and proprietary LLM provi...
🔥7❤2👍2
Forwarded from MWS AI
9 февраля стартует новый сезон бесплатного онлайн-курса Natural Language Processing & LLMs. Это совместный проект Open Data Science и MWS AI при поддержке ИТМО, МФТИ и ВШЭ, который мы проводим уже в десятый раз.
Курс подойдёт тем, кто хочет системно разобраться в NLP и современных LLM, а не просто «поиграться» с моделями.
Что будет в программе:
Формат обучения:
📌 Первое занятие уже 10 февраля. Зарегистрироваться можно по ссылке.
Курс подойдёт тем, кто хочет системно разобраться в NLP и современных LLM, а не просто «поиграться» с моделями.
Что будет в программе:
🔴 базовые концепции NLP: закон Ципфа, TF-IDF, RNN, CNN, Transformer;🔴 ключевые задачи обработки текста: классификация, тегирование, генерация;🔴 современные направления: агентные подходы и вайбкодинг;🔴 большие языковые модели и сценарии их применения.
Формат обучения:
🔴
8 основных лекций с семинарами и квизами;
🔴
8 дополнительных лекций;
🔴
3 практических задания: Word2Vec, соревнование по классификации текстов и обучение агентов;
🔴
финальный индивидуальный или командный проект, который можно добавить в портфолио;
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2
Forwarded from Научный опенсорс (Nikolay Nikitin)
А тем временем, начинаем публикацию программы нашего митапа, который пройдет 12.02 в 18-00. Вот перечень докладов с авторскими аннотациями:
- Школа-конкурс EDGE AI 2025: как мы первыми в России представили флагманский китайский стек для работы с ИИ-моделями на EDGE устройствах c OpenScaler OS // Владимир Павлов - Технический комитет сообщества OpenScaler
В докладе мы поделимся опытом сообщества OpenScaler по проведению соревнований в новом формате: студенческие ИИ-команды из ведущих вузов страны сначала проходили обучение у наших менторов, а затем соревновались на лучшую реализацию различных ИИ-моделей на краевых устройствах Orange Pi на базе чипов Ascend и ОС OpenScaler. Расскажем о самом конкурсе, командах и проектах студентов, которые были представлены в финале. Все учебные материалы были опубликованы в открытом доступе, а проекты финалистов размещены на платформе GitVerse.
- [Секретный доклад] // Олег Чирухин - владелец продукта GigaIDE Cloud
Как понятно из названия - подробности будут раскрыты только в самый последний момент!
- OpenSource по-пекински, или почему фонд OpenAtom - это прекрасно, но не в наших реалиях // Аристов Константин - Скала^р (группа Рубитех), руководитель направления RnD системного ПО
Поговорим о том, какой дивный симбиоз между собором и базаром (openSource и Кговавым Ынтырпрайзом) получился в КНР, попробуем прикинуть тамошние реалии на наши, придем к парадоксальному выводу насчет пользы конкуренции.
- Студенческий open-source в ML - опыт внедрения поддержки ONNX // Зверев Андрей - студент 3 курса Новосибирского Государственного Университета, стажер-разработчик в Яндексе
Как превратить скучную учебную практику в реальный проект, которым не стыдно гордиться и который добавляет ценности в резюме? Расскажу на личном примере участия в лаборатории YADRO при НГУ.
Поясню, что такое формат лаборатории: как туда попасть, какие возможности она дает студентам. На практическом кейсе покажу, как выглядят рабочие процессы изнутри: постановка задач, планирование, работа через issues/PR, тестирование и выпуск; с какими трудностями столкнулся и как их решал при поддержке наставников из реальной компании-партнера.
В технической части объясню простыми словами: что такое ONNX и почему стандарт обмена моделями важен для переносимости и воспроизводимости, чем его поддержка усилила проект Adept и какие результаты получились на практике.
- Simple Deep Research - открытый фреймворк для мультиагентного поиска // Алан Газзаев - аспирант ИТМО, NLP researcher at MWS AI
Simple Deep Research - это простая система для поиска информации в интернете с помощью мультиагентного подхода. Система работает в двух режимах: lite и full. В первом режиме агент посещает несколько сайтов, сжимает информацию и выдает отчет. Во втором режиме агент определяет сложность запроса, разбивает его на подзапросы, а затем другие агенты ищут и суммируют информацию по каждому запросу. Одна из основных идей данного фреймворка заключается в том, что он не содержит таких зависимостей как langchain и smolagents и быстро запускается с локальными моделями через vLLM/llama.cpp. Также фреймворк модульный, можно заменить поисковой движок и агентов по необходимости.
Ссылка на регистрацию прежняя - https://openmeetup.ru/
Места на площадке конечны, так что не откладывайте!
- Школа-конкурс EDGE AI 2025: как мы первыми в России представили флагманский китайский стек для работы с ИИ-моделями на EDGE устройствах c OpenScaler OS // Владимир Павлов - Технический комитет сообщества OpenScaler
В докладе мы поделимся опытом сообщества OpenScaler по проведению соревнований в новом формате: студенческие ИИ-команды из ведущих вузов страны сначала проходили обучение у наших менторов, а затем соревновались на лучшую реализацию различных ИИ-моделей на краевых устройствах Orange Pi на базе чипов Ascend и ОС OpenScaler. Расскажем о самом конкурсе, командах и проектах студентов, которые были представлены в финале. Все учебные материалы были опубликованы в открытом доступе, а проекты финалистов размещены на платформе GitVerse.
- [Секретный доклад] // Олег Чирухин - владелец продукта GigaIDE Cloud
Как понятно из названия - подробности будут раскрыты только в самый последний момент!
- OpenSource по-пекински, или почему фонд OpenAtom - это прекрасно, но не в наших реалиях // Аристов Константин - Скала^р (группа Рубитех), руководитель направления RnD системного ПО
Поговорим о том, какой дивный симбиоз между собором и базаром (openSource и Кговавым Ынтырпрайзом) получился в КНР, попробуем прикинуть тамошние реалии на наши, придем к парадоксальному выводу насчет пользы конкуренции.
- Студенческий open-source в ML - опыт внедрения поддержки ONNX // Зверев Андрей - студент 3 курса Новосибирского Государственного Университета, стажер-разработчик в Яндексе
Как превратить скучную учебную практику в реальный проект, которым не стыдно гордиться и который добавляет ценности в резюме? Расскажу на личном примере участия в лаборатории YADRO при НГУ.
Поясню, что такое формат лаборатории: как туда попасть, какие возможности она дает студентам. На практическом кейсе покажу, как выглядят рабочие процессы изнутри: постановка задач, планирование, работа через issues/PR, тестирование и выпуск; с какими трудностями столкнулся и как их решал при поддержке наставников из реальной компании-партнера.
В технической части объясню простыми словами: что такое ONNX и почему стандарт обмена моделями важен для переносимости и воспроизводимости, чем его поддержка усилила проект Adept и какие результаты получились на практике.
- Simple Deep Research - открытый фреймворк для мультиагентного поиска // Алан Газзаев - аспирант ИТМО, NLP researcher at MWS AI
Simple Deep Research - это простая система для поиска информации в интернете с помощью мультиагентного подхода. Система работает в двух режимах: lite и full. В первом режиме агент посещает несколько сайтов, сжимает информацию и выдает отчет. Во втором режиме агент определяет сложность запроса, разбивает его на подзапросы, а затем другие агенты ищут и суммируют информацию по каждому запросу. Одна из основных идей данного фреймворка заключается в том, что он не содержит таких зависимостей как langchain и smolagents и быстро запускается с локальными моделями через vLLM/llama.cpp. Также фреймворк модульный, можно заменить поисковой движок и агентов по необходимости.
Ссылка на регистрацию прежняя - https://openmeetup.ru/
Места на площадке конечны, так что не откладывайте!
👍5
Научный опенсорс
А тем временем, начинаем публикацию программы нашего митапа, который пройдет 12.02 в 18-00. Вот перечень докладов с авторскими аннотациями: - Школа-конкурс EDGE AI 2025: как мы первыми в России представили флагманский китайский стек для работы с ИИ-моделями…
12 февраля буду выступать на Open Source Meetup, приходите послушать
🔥5
Выступил сегодня на Open Source Meetup, мне понравилось
🔥8❤3👍2
Alan robotics
Выступил сегодня на Open Source Meetup, мне понравилось
Лучший доклад на Open Source митапе по итогам голосования
🔥9