В центре ИИ
817 subscribers
289 photos
33 videos
252 links
Новости, проекты и жизнь Центра искусственного интеллекта и науки о данных СПбГУ
Download Telegram
Channel photo updated
Проверка связи! Все влились в рабочую рутину?

Мы продолжаем цикл научно-практических семинаров в Центре ИИ СПбГУ!🤖

Эффективные подходы на основе данных к задачам стохастического оптимального распределения потоков электроэнергии

🗓22 января | 🕘18:00 | Центр ИИ СПбГУ (Кадетская линия, 1-3, схема прохода)

Александр Лукашевич, аспирант Сколтеха, представит наиболее гибкий и общий подход для моделирования случайных возмущений в условных задачах оптимизации – использование Вероятностных Ограничений (ВО). Он позволяет наперед задавать вероятность нарушения исходных ограничений и избегать излишней консервативности. В большинстве случаев, ВО не выражаются через элементарные функции, что затрудняет их использование в численных методах. Чтобы обойти это, были предложены различные аппроксимации с использованием данных, включая Аппроксимацию Сценариями. Несмотря на теоретические гарантии, необходимое количество данных (сценариев) велико, что усложняет оптимизацию.

На семинаре будут представлены методы и алгоритмы для оценки значения ВО и решения задач оптимизации с ВО, требующие меньше данных для получения приближенного решения, допустимого для ВО с высокой вероятностью.

Напоминаем, что для сторонних слушателей обязательна регистрация по ссылке.

Будем рады вновь всех увидеть и подискутировать на первом семинаре в 2025!
Please open Telegram to view this post
VIEW IN TELEGRAM
8
💡Если вы пропустили вчерашнюю встречу, у вас есть шанс наверстать упущенное!

Открываем регистрацию на следующий научно-практический семинар. На этот раз погрузимся в тему «Вычислимость и ценность информации, полнота трансформеров».

🗓29 января | 🕘18:00 | Центр ИИ СПбГУ (Кадетская линия, 1-3, схема прохода)

Сергей Салищев, кандидат физико-математических наук и старший преподаватель кафедры информатики СПбГУ, затронет несколько ключевых вопросов, связанных с вычислительной мощностью моделей искусственного интеллекта.

Спикер расскажет о вычислимой мере ценности информации и ее связи со случайным выбором, а также о практической интерпретации вычислимости и нижней границе параллельного ускорения вычислений.

Особое внимание будет уделено архитектуре трансформеров, которая лежит в основе современных генеративных ИИ и больших языковых моделей. Обсудим вычислительную мощность этих моделей и их связь с наблюдаемым поведением приложений.

Кроме того, будут предложены методы модификации моделей ИИ для повышения их вычислительной мощности и рассмотрены актуальные направления развития в этой области.

Если вы не из СПбГУ, для посещения мероприятия, пожалуйста, зарегистрируйтесь по ссылке

С нетерпением ждем встречи с вами на семинаре!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥73👏2
This media is not supported in your browser
VIEW IN TELEGRAM
🌐 AIoT: ИИ и Интернет вещей

Тенденция слияния двух технологий — Искусственный интеллект (AI) и Интернет вещей (IoT) — привела к AIoT (Artificial Intelligence of Things). Это сочетание позволяет устройствам IoT не просто собирать данные, но и анализировать их в режиме реального времени, принимая умные (над этим очень стараются программисты) решения без вмешательства человека.

📌 Как это работает?
AIoT объединяет сенсоры, устройства и сети IoT с возможностями анализа и обработки данных, обеспечиваемыми ИИ.

То есть, AIoT:
собирает данные: сенсоры IoT фиксируют параметры окружающей среды, например (температуру, влажность, движение и т.д.);
обрабатывает данные: используются модели машинного обучения (ML) для анализа данных локально (Edge AI) или в облаке;
принимает решения: алгоритмы ИИ автоматически генерируют действия на основе анализа данных (например, активацию устройств или отправку уведомлений).

Технология позволяет создавать системы, которые не только реагируют на изменения, но и предсказывают их. Это делает устройства более автономными, эффективными и персонализированными📈

Где применяется AIoT уже сейчас?
Умные города (например, оптимизация энергопотребления в уличном освещении и зданиях).
Промышленность (мониторинг состояния оборудования с помощью IoT-сенсоров).
Медицина (умные медицинские датчики, которые отслеживают состояние пациента и предупреждают о возможных изменениях).
Умный дом (термостаты, системы освещения, умное видеонаблюдение).

👀 Какие устройства AIoT вы бы хотели использовать в своей жизни? А может какие-то даже создать? Делитесь своими идеями в комментариях!⬇️
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍43👏1🆒1
⚙️ Как проверить, насколько нейросеть компетентна и пригодна к выполнению ваших задач?
Для этого регулярно разрабатываются и выходят на рынок бенчмарки, позволяющие оценить производительность той или иной модели и сверить ее параметры с эталонным значением.

Вот ТОП-5 всемирно популярных бенчмарков, заслуживающих вашего внимания:

1. MLPerf – одна из самых известных платформ для оценки производительности машинного обучения, разработанная в 2018 году такими компаниями, как Google, NVIDIA, Intel, Microsoft и др. Этот бенчмарк включает в себя набор тестов, которые охватывают различные задачи: от обучения и инференса (применение обученных моделей) в компьютерном зрении до обработки естественного языка. MLPerf помогает понять, как аппаратные решения справляются с задачами машинного обучения и какие из них могут быть наиболее эффективными для конкретных приложений.

2. HPC AI 500 инициирован компанией Green 500 в сотрудничестве с другими организациями в 2020 году. Это рейтинг, который оценивает суперкомпьютеры и их производительность в задачах искусственного интеллекта. Он основан на реальных приложениях и сценариях использования, что позволяет сравнивать системы по их способности решать сложные задачи глубокого обучения и обработки больших данных, связанные, например, с обработкой изображений или естественного языка.

3. Deep Learning Benchmark (DLB) – это набор тестов и стандартов, разработанных для оценки производительности систем в задачах глубокого обучения. Этот бенчмарк станет помощником в таких областях, как медицина, финансы, автомобильная промышленность и т.д. Он позволяет сравнивать различные аппаратные и программные решения, используемые для обучения и инференса моделей Deep Learning. Метрики производительности DLB – время обучения модели, количество итераций, необходимых для достижения определенной точности, скорость инференса, а также эффективность использования ресурсов.

4. TensorFlow Benchmarks – проект для оценки производительности моделей, разработанный командой Google Brain. Его первые версии были представлены еще в 2016 году. Благодаря этому инструменту пользователи могут сравнивать производительность различных аппаратных платформ и оптимизировать свои модели и алгоритмы, понимая, как они будут работать на различных аппаратных конфигурациях. Бенчмарки TensorFlow выполняются на графических (NVIDIA, AMD) и центральных (Intel, AMD) процессорах, специализированных ускорителях (Google TPUs) и кластерных системах для распределенного обучения.

5. COCO (Common Objects in Context) – это обширный набор данных, используемый для задач компьютерного зрения: обнаружения объектов, сегментации и генерации описаний изображений. Он был разработан в 2014 году группой исследователей из Microsoft для улучшения алгоритмов машинного обучения и оценки их производительности на реальных задачах. COCO содержит более 330 тысяч изображений, из которых около 200 тысяч аннотированы с объектами. В наборе данных представлено более 80 категорий объектов, включая животных, транспортные средства и предметы домашнего обихода. Такое разнообразие делает данный инструмент важным для бенчмаркинга и обучения моделей компьютерного зрения.


А какие бенчмарки известны вам? Какие из них вы уже успели протестировать?
Делитесь в комментариях ✏️
Please open Telegram to view this post
VIEW IN TELEGRAM
👏6🔥5🤯3
⚡️Обвал на фондовом рынке США и конкурент Open AI. Разбираемся с шумихой вокруг DeepSeek с экспертом Центра ИИ СПбГУ Михаилом Козиным

🤔DeepSeek – нейросеть, созданная всего за полтора года двумястами китайскими разработчиками с финансированием в $6 млн. Open AI потратил на это 10 лет, 4500 сотрудников и $6 млрд.

Как такое возможно?
Одним из поводов для шума вокруг модели DeepSeek стали биржевые котировки. Прежде всего, нужно посмотреть на фондовый рынок и переоцененность на нем технологических компаний США. Идет безусловная гонка в области искусственного интеллекта, и любая подобная новость, разумеется, тревожит как политиков, так и фондовый рынок США.


Почему получилось дешевле?
Что касается стоимости разработки моделей, то новости о китайском бюджете в 6 миллионов долларов – это, конечно, сильнейший удар по таким гигантам, как OpenAI, которые тратят миллиарды на обучение. И с этим опять же связано сильное волнение на рынке.
Как же создатели модели DeepSeek смогли догнать и по некоторым бенчмаркам обогнать представителей OpenAI, в частности O1? Надо вспомнить про графики Ашенбреннера, это декомпозиция драйверов прогресса, и состоит она из трех основных элементов. Первое – это масштабирование вычислительных мощностей, второе – это улучшение алгоритмов и их эффективности, и третье – это выход новых продуктов, алгоритмический прогресс. То есть, создатели DeepSeek смогли меньшими ресурсами достичь тех же, а то и лучших результатов.
Стоит отметить, что так называемый Chain of Thoughts, цепочка размышлений, также интегрирована как и в модели O1 от OpenAI, так и в модели DeepSeek R1. И это лишний раз показывает, что такие инновации не менее важны, чем объем вычислительных мощностей и объем финансирования.


Как обстоят дела с российскими разработками?
Что касается российских игроков, техгигантов и отдельных центров по исследованию и разработке в сфере искусственного интеллекта, хочется верить, что это достижимо. Прежде всего, как мы видим на примере DeepSeek, речь идет не только о вычислительных мощностях, но и об алгоритмах, а техническая база у наших центров замечательная. Есть прекрасные специалисты и математики, и разработчики, которые способны на многое. Вопрос к данным, и вопрос к данным именно на русском языке. Разумеется, их кратно меньше, чем на английском. Но хочется верить, что это достижимо.


Кто успел потестить DeepSeek? Делитесь опытом в комментариях💬
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥118🆒3🤯2
⚡️Вот и пятница!
А это значит, что пора взять перерыв от рабочей рутины и запланировать досуг на ближайшее время.

Приглашаем вас на следующий открытый семинар, на котором аспиранты СПбГУ представят свои доклады и научные наработки.

🗓5 февраля | 🕔18:00 | Центр ИИ СПбГУ (Кадетская линия, 1-3, схема прохода)

Ждем всех заинтересованных, в том числе наших индустриальных партнеров, чье участие внесет ценный вклад в обсуждение и понимание актуальных вопросов.

Напоминаем, что для сторонних слушателей необходима регистрация

Проведем вечер среды вместе! До скорых встреч 👥
Please open Telegram to view this post
VIEW IN TELEGRAM
👍61
💬Ценность информации, трансформеры и «Война и мир»: о чем рассказал Сергей Салищев на семинаре 29 января

🗣️Доклад начался с философского вопроса: «Сколько нужно платить творцу?». Кандидат физико-математических наук Сергей Салищев выдвинул гипотезу: объективная стоимость информации – это сумма сложностей Колмогорова и Блюма. В первом случае ограничивается вычислительная машина, но не время, во втором — ровно наоборот. Физической мотивацией для такой суммы, по словам спикера, служит энергия вычислений.

🗣️Далее Сергей Салищев на примере известного романа-эпопеи «Война и мир» объяснил концепцию информации. По утверждению докладчика, упомянутое произведение из-за своей внутренней структуры и полезности информации сжимается лучше, чем случайная строка. Что значит сжать «Войну и мир»? Алгоритм такой: обучить Льва Толстого, затем дать ему случайный хеш-код, и он напишет роман. Но для генерации Льва Толстого понадобится его геном, для получения которого нужно, в свою очередь, взять некую случайную строку. Таким образом, «Война и мир» получается не в один этап. Это некоторый операционный, эволюционный процесс, понимание которого во многом объясняет работу нейросетей.

🗣️Вторую часть семинара посвятили трансформерам и их роли в современных языковых моделях. Архитектура трансформеров появилась в 2017 году, став поворотной точкой в развитии ИИ. Спикер отметил, что для создания универсального устройства необходимо, чтобы оно было тьюринг-полным. Два практических признака машины Тьюринга: способность долго считать и запоминание результатов вычисления. Так, GPT-4 не является машиной Тьюринга, в отличие от нашумевшей модели DeepSeek R1. Кроме того, для достижения тьюринг-полноты было предложено три подхода: рассуждение по шагам, использование архитектуры автокритики с заменой человеческого разума на искусственный и применение мультиагентных систем с распределением ролей (программист, тестер, проектировщик, дизайнер).

🗣️Завершая выступление, Сергей Салищев вновь заострил внимание на том, сколько и как должны платить творцу. Ответ следующий: для простых моделей оплата может производиться за токены, но для сложных моделей (машин Тьюринга), которые могут долго думать и давать короткие ответы, это не подойдет. Другой вариант — оплата за время аренды серверов. Но в этом случае творца нужно контролировать, чтобы он получал деньги не за свои рабочие часы, а исключительно за период аренды машинного времени.

А как бы ответили на этот вопрос вы? Пишите в комментариях ⬇️
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥62👍1👏1
Дайджест мероприятий в Центре ИИ СПбГУ⚡️

В феврале нас ждут 4 научно-практических семинара и празднование Дня российской науки🎆

🔘05.02 – выступления аспирантов под руководством научного офиса Центра ИИ.
🔘08.02 – выступление Амелина Константина Сергеевича, директора Центра ИИ СПбГУ, на Дне российской науки💡Подробную информацию опубликуем позже. Также в этот день можно бесплатно попасть в Музей истории физики и математики СПбГУ. Требуется только предварительная регистрация на выбор здесь или здесь.
🔘12.02 – семинар Скобелева Петра Олеговича из Самарского федерального исследовательского центра РАН на тему «Эмерджентный интеллект».
🔘19.02 – семинар Петросяна Ованеса Леоновича, доктора физико-математических наук, на тему «Сжатие моделей глубокого обучения: интеллектуальное квантование, извлечение знаний и обучение с использованием бинарного градиента».
🔘26.02 – семинар Фрадкова Александра Львовича, доктора технических наук, тема доклада будет известна позже.

Регистрация на ближайший семинар 5 февраля здесь.
Ждём всех желающих на обсуждение!👨‍👩‍👧‍👦
Please open Telegram to view this post
VIEW IN TELEGRAM
👍53🔥3🎉2
В центре ИИ pinned «Дайджест мероприятий в Центре ИИ СПбГУ⚡️ В феврале нас ждут 4 научно-практических семинара и празднование Дня российской науки🎆 🔘05.02 – выступления аспирантов под руководством научного офиса Центра ИИ. 🔘08.02 – выступление Амелина Константина Сергеевича…»
This media is not supported in your browser
VIEW IN TELEGRAM
😉Искусственный интеллект на конечных устройствах: робот-пылесос может «сбежать»?

ИИ все чаще переносится с облачных серверов на конечные устройства. Этот подход называется Edge AI или периферийный ИИ. Он использует локальную обработку данных на устройствах, таких как смартфоны, умные часы, бытовая техника и автомобили.

🤨Как это работает?
Edge AI опирается на специализированные процессоры — AI Accelerators, например, NPU (Neural Processing Unit) или TPU (Tensor Processing Unit), которые встроены в устройства. Эти чипы позволяют выполнять сложные вычисления нейронных сетей непосредственно на месте, без необходимости пересылать данные в облако.

🫡Плюсы Edge AI:
автономность работы: локальная обработка данных означает, что устройство может функционировать без подключения к интернету;
минимальная задержка: так как данные не отправляются на сервер, их обработка ускоряется;
защита данных: ваши данные остаются на устройстве, что снижает риск их утечки;
энергоэффективность: AI-чипы оптимизированы для работы с низким энергопотреблением, что особенно важно для мобильных устройств.

😅А что с роботом-пылесосом?
Edge AI, как любые другие технологии, требует постоянных доработок. Роботы-пылесосы полагаются на алгоритмы для навигации. Если алгоритм «подумает», что дверь открыта, робот может смело «выйти» на улицу и начать свою лучшую жизнь.

Поделитесь, какими умными помощниками пользуетесь вы? Были ли забавные ситуации, связанные с багами устройства?😝
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6😁4🎉2🔥1
Первый в мире умный счетчик: майнеры сворачивают фермы 💰

Ученые СПбГУ разработали уникальный счетчик электроэнергии с интегрированным искусственным интеллектом, который выявляет случаи энергетического мошенничества и нелегального майнинга. Об этом сообщил «Санкт-Петербургский Курьер».

🪙Майнинг криптовалют представляет собой одну из наиболее серьезных проблем для энергетической системы России. Обнаружить криптофермы традиционными способами практически невозможно. Поэтому в ход пошел искусственный интеллект.

⚡️Инновационный счетчик от компаний «Лартех» и «Энергомера», для которых СПбГУ разработал ПО на основе ИИ, способен автоматически обнаруживать аномальный расход электроэнергии и предотвращать злоупотребления.

Как отметил проректор по научной работе СПбГУ Сергей Микушев:
Использование фундаментального подхода для решения инженерных задач совместно с таким партнером, как «Лартех», приносит результаты.


🥇Новинка уже завоевала Гран-при Конкурса перспективных разработок в области внедрения искусственного интеллекта в электроэнергетику, подтверждая важность интеграции современных технологий в традиционные сферы.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8👏4🤔4😁2🆒1
Вы то, на что вы подписаны🤫

Ученые СПбГУ и СПб ФИЦ РАН создали уникальное приложение для профориентации на основе ваших подписок в социальной сети «ВКонтакте» 📱

«AI профориентатор» собирает общую информацию о ваших скиллах и предпочтениях, используя данные библиотеки VK Bridge.

«Эти данные передаются на сервер, построенный на платформе Node.js, где проходят валидацию и направляются на внешний сервер машинного обучения — ключевой компонент, обеспечивающий интеллектуальный анализ», — рассказал консультант первого проректора по учебной работе СПбГУ, доцент СПбГУ, руководитель лаборатории прикладного искусственного интеллекта СПб ФИЦ РАН Максим Абрамов.


Как это работает?
В основе приложения – модель, обученная на анализе психологических тестов, где пользователь мог выяснить предрасположенность к различным профессиям. В процессе анализа «AI профориентатор» с высокой точностью определяет склонности к творческим, техническим, гуманитарным и другим дисциплинам. Более того, после прохождения теста пользователь получает персональные рекомендации по развитию более сильных навыков📈

Еще одна фишка «AI профориентатора» – возможность анализировать профили других людей. Эйчарщики выдохнули. Поиск нужного сотрудника в команду облегчен!

Приложение уже доступно для пользования – пробуйте!

Поделитесь результатами в комментариях, на том ли месте вы работаете? А может, тест раскрыл желание вашего внутреннего ребенка быть космонавтом?💫
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥10🆒4😁3🎉2👏1
🤔 И снова открытие: физики СПбГУ представили архитектуру для сверхбыстрых нейросетей нового поколения

Научные сотрудники Университета Алексей Кавокин и Евгений Седов разработали поляритонные нейроны для ультрабыстрых нейроморфных систем, цель которых — достигать высокой скорости обработки информации и выполнения задач. Нейроны могут распознавать рукописные цифры и голосовые команды с небывалой эффективностью.

Как отметил Алексей Кавокин,
строительными блоками для такой системы послужили бозонные конденсаты экситон-поляритонов. Они, обладая свойствами света, способны контактировать друг с другом. Именно поэтому их иногда еще называют «квантами жидкого света».


Примечательно, что предложенная архитектура относится к классу бинарных нейросетей (BNN). Эти сети используют двоичные входные и выходные сигналы нейронов, что отличает их от традиционных нейронных сетей, работающих с непрерывными переменными.

🚀 Применение BNN позволяет значительно ускорить обработку данных и сократить объем необходимой памяти. Поэтому они идеально подходят для устройств с ограниченными энергетическими ресурсами, таких как интернет вещей или системы периферийных вычислений.

Архитектуру протестировали на двух задачах. Первая — распознавание рукописных цифр из базы данных MNIST, где точность составила более 97,5%. Также для оценки адаптивности и универсальности сеть проверили на наборе Speech Commands для распознавания голосовых команд.

С более подробной информацией можно ознакомиться здесь

А вы когда-нибудь применяли бинарные нейросети для выполнения рабочих или повседневных задач?
Расскажите о своем опыте в комментариях
💬
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥53🤯1
СПбГУ отмечает свой 3️⃣0️⃣1️⃣ день рождения!

С нами празднует весь город! День рождения университета официально внесен в календарь памятных дат города.

Уже более трёх веков в университете воспитываются выдающиеся ученые и будущие лидеры, формируются научные школы и продвигаются новаторские идеи⭐️

Поздравляем студентов, преподавателей и выпускников с этим знаменательным событием! Будем вместе продолжать развиваться, вдохновлять новое поколение ученых и оставаться ведущим центром образования и науки в нашей стране!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥219👍6
⚡️Знакомы ли вы с понятием «эмерджентный интеллект»? Именно о нем и поговорим на следующем научно-практическом семинаре!

🗓12 февраля | 🕔18:00 | Центр ИИ СПбГУ (Кадетская линия, 1-3, схема прохода)

В качестве спикера выступит Петр Олегович Скобелев — ведущий научный сотрудник ФИАН, зав. лабораторией ИПУСС РАН, зав. кафедрой ФАИТ СамГТУ, профессор Самарского университета и автор более 230(!) научных работ.

🤖Несмотря на большие достижения в области искусственного интеллекта (ИИ), основанного на нейронных сетях и машинном обучении, вопрос о том, как будут создаваться системы общего (сильного) интеллекта, остается неясным. Эти системы должны быть способны к целенаправленным действиям, но пока никто не знает, каким будет их путь развития.

На предстоящем семинаре Петр Олегович расскажет, что следует понимать под «эмерджентным интеллектом»(ЭИ). Немного приоткроем занавес: понятие ЭИ сопряжено с новой методологией решения сложных задач путем выявления и разрешения конфликтов между программными агентами сущностей с противоположными интересами, конкурирующими и кооперирующими на виртуальном рынке мультиагентной системы.

🔃В связи с этим будут рассмотрены модели, методы и алгоритмы разбора конфликтов и согласованного принятия решений, которые базируются на целевых функциях и функциях бонусов-штрафов, а также протоколах переговоров агентов для поиска решений со взаимными уступками в ходе достижения консенсуса.

Спикер предложит конкретные примеры разбора конфликтов в задачах управления ресурсами, понимания текстов и извлечения знаний из данных. А в завершение обсудим перспективы использования эмерджентного интеллекта в качестве основы «сильного ИИ».

Для посещения мероприятия обязательно зарегистрируйтесь по ссылке

👥 До встречи на семинаре!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍97🔥6
⚡️Открываем новые горизонты в понимании и разработке систем сильного интеллекта уже в эту среду в 18:00 в Центре ИИ СПбГУ!

➡️Конкретнее – поговорим об эмерджентном интеллекте и как он может трансформировать наше представление о решении сложных задач: управление проектами, производством и логистикой в реальном времени с помощью технологИИ!

Поделится знаниями и результатами Петр Олегович Скобелев, ведущий научный сотрудник ФИАН, зав. лабораторией ИПУСС РАН, зав. кафедрой ФАИТ СамГТУ, профессор Самарского университета и автор более 230 научных работ.

💬Не упустите возможность послушать, задать вопросы и присоединиться к дискуссии, нужно только зарегистрироваться🔗
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥4🎉4
🖥 Недавно мы делали подборку всемирно популярных бенчмарков, используемых для оценки производительности и эффективности моделей машинного обучения.

Как оказалось, среди инструментов российского производства тоже есть немало достойных примеров.

Делимся с вами некоторыми из них ⤵️

1. MERA (Multimodal Evaluation for Russian-language Architectures) – проект от SberDevices, Sber AI, НИУ ВШЭ, «Сколтеха» и других разработчиков. Его предназначение – оценивать на закрытых и открытых тестах современные большие языковые модели для русского языка. Кодовая база для оценки на бенчмарке MERA основана на международном фреймворке LM Evaluation Harness. Сейчас это единая площадка для рейтинга моделей и отражения их способностей по доменам, задачам и модальностям.

2. LLM Arena – общедоступная платформа, цель которой – сделать объективный, открытый и актуальный бенчмарк больших языковых моделей на русском языке. Она собирает и ранжирует парные сравнения пользователей с помощью вероятностной модели Брэдли-Терри. Так можно узнать, какой из ответов, сгенерированный разными нейросетями, более качественный. При этом существуют режимы сравнения как случайных моделей, так и выбранных пользователем.

3. RuCoLa – проект по оценке лингвистической компетентности больших языковых моделей от ABBYY, Huawei, Yandex Research, SberDevices и НИУ ВШЭ. Он может использоваться для сравнения способностей нейросети к пониманию языка, а также для улучшения качества генерации текстов. В основе RuCoLa – набор из 13,4 тысяч предложений на русском языке, которые размечены по бинарной шкале лингвистической приемлемости. Приемлемое высказывание – то, которое мог бы привести носитель языка, а другой носитель – понять. Датасет оценивает чувствительность моделей как к обычным лингвистическим явлениям (морфологии, синтаксису, семантике), так и к галлюцинациям, например, к бессмысленному повторению фрагментов предложения.

4. RussianSuperGlue – еще одна платформа для оценки понимания моделями русского языка, созданная SberDevices, Huawei и НИУ ВШЭ. Бенчмарк включает в себя четыре части: тесты для нейросетей, тесты для людей для сравнения, оценку существующих моделей и инструменты для помощи в оценке собственной модели. Разработчики хотят, чтобы RussianSuperGlue стал общедоступным рейтингом русскоязычных NLP-моделей (обрабатывающих естественный язык). Он также призван помочь специалистам в Data Science понять, какая из нейросетей больше подходит для выполнения тех или иных задач.

5. ruSciBench, разработанный в МГУ им. М. В. Ломоносова, предназначен для оценки эмбеддингов научных текстов. Представьте, что каждый текст – это точка в многомерном пространстве, так вот эмбеддинги помогают преобразовать текст в такие точки, где похожие по смыслу тексты будут находится близко друг к другу. Датасет бенчмарка состоит из 194 тысячи сочетаний названий и аннотаций статей на русском языке и 182,4 тысячи на английском. Всего есть два типа задач: классификация и поиск перевода. Задача поиска перевода проверяет, насколько хорошо модель понимает смысл текста, независимо от языка. Для этого сравнивают, насколько близки векторы (эмбеддинги) аннотации на русском и английском языках. Чем ближе они друг к другу, тем лучше работает модель. В результате получают две метрики: насколько успешно можно найти русскую аннотацию по английской и наоборот.

А с какими отечественными бенчмарками знакомы вы? Делитесь в комментариях ✏️
Please open Telegram to view this post
VIEW IN TELEGRAM
👍64🔥3
🎤Руководитель юридической группы Центра ИИ СПбГУ Владислав Владимирович Архипов выступил в Кыргызско-Российском Славянском университете

8 февраля 2025 года в ходе круглого стола «Межгосударственное научно-инновационное сотрудничество Кыргызстана и России: перспективы и приоритеты развития», приуроченного ко Дню российской науки, он представил доклад на тему «Правовые проблемы ИИ: опыт СПбГУ». 

Вот основные тезисы выступления:

🔵Право по умолчанию технически нейтрально, при этом системы ИИ, как правило, могут рассматриваться как результаты интеллектуальной деятельности, информационные системы, содержащие и обрабатывающие информацию различных правовых режимов, средства поддержки принятия юридически значимых решений.

🔵Актуальные правовые проблемы, которые в рамках своей профессиональной деятельности разрешают сотрудники Центра ИИ СПбГУ, следующие: правовой режим датасетов, обработка персональных данных при машинном обучении, сложный «лицензионный состав» программного обеспечения и использование ИИ в конечных решениях.

🔵Согласно российскому законодательству, содержание датасета в любом случае представляет собой информацию, но при определенных условиях дополнительно может охраняться и как результат интеллектуальной деятельности.

🔵На сегодняшний день остро стоит вопрос о защите личной информации, которая используется нейросетью в процессе обучения, поскольку правовой режим персональных данных не всегда позволяет определить вид данных, исходя из их структуры и метаданных.

🔵Применение искусственного интеллекта в конечных решениях может иметь правовое значение при автоматизации юридически значимых действий. При этом автоматизация отдельных видов решений способна непропорционально усложнять правовые риски и определенность, особенно в вопросах ответственности. 

🗣️ Владислав Владимирович Архипов поделился, что доклад вызвал живой интерес у аудитории, и по итогам выступления сложилась продуктивная дискуссия о пределах использования технологий искусственного интеллекта с точки зрения этики и права. 
Please open Telegram to view this post
VIEW IN TELEGRAM
👍86🔥5😁1
☄️Хотите узнать три новых алгоритма сжатия моделей глубокого обучения? Тогда ждём вас на семинаре в среду!

🗓19 февраля | 🕔18:00 | Центр ИИ СПбГУ (Кадетская линия, 1-3, схема прохода)

Доклад представит Ованес Леонович Петросян — доктор физико-математических наук, профессор.

Обычно модели глубокого обучения сжимают следующими методами:
➡️квантование (или бинаризация)
➡️извлечение знаний
➡️обучение с использованием информации о том, что модель сжата

Доклад посвящен разработке трех новых алгоритмов для данных методов. Особого внимания заслуживают подходы, учитывающие использование бинарного градиента для обучения бинарных нейронных сетей, и методы оптимизации архитектуры нейронной сети, используя информацию об ограничениях на вычислительные ресурсы и энергопотребление устройства, на котором эта модель будет работать.

Ждем всех желающих на обсуждение! Для посещения мероприятия обязательно зарегистрируйтесь по ссылке🔗
Please open Telegram to view this post
VIEW IN TELEGRAM
8👍5🔥3
😊 Постигая эмерджентный интеллект: о чем рассказал самарский доктор наук Петр Олегович Скобелев на семинаре 12 февраля

Если говорить о самом понятии «эмерджентность», в толковых словарях оно трактуется как появление у системы свойств, которые не были в ней заложены изначально. Из простых примеров – снежинки и вода. Кислород и водород, образуя молекулы воды, приобретают то, чего не было в базе заложенных принципов. Петр Олегович предположил, что сильный эмерджентный искусственный интеллект (ЭИ) в будущем должен быть построен как природо-подобный, самоорганизующийся и эволюционирующий коллективный интеллект, способный самообучаться, развиваться и менять свой исходный код.

При этом, по мнению докладчика, первый шаг к ЭИ – использование мультиагентных технологий с виртуальным рынком для моделирования процессов самоорганизации и решения сложных задач. Так, в условиях высокой динамики и неопределенности проблема управления ресурсами в современных организациях может быть решена путем замены менеджеров на умных программных роботов.

«Такие роботы могут в тысячу раз быстрее принимать решения там, где это возможно, отводя людям роль для более творческих задач. Собственно, это путь к повышению эффективности и конкурентоспособности», – объяснил спикер.


Для более глубокого погружения в тему Петр Олегович упомянул о концепции «Индустрия 5.0», представляющей собой переход к сложным, нелинейным и недетерминированным моделям цифровых двойников. До XX века в науке преобладало линейное мышление, однако далеко не все явления устойчивы и находятся в состоянии равновесия. Пример тому – финансовый кризис, образование галактик и творческая деятельность человека. «Индустрия 5.0» ориентирована на цифровизацию знаний и создание цифровых колоний и экосистем автономных цифровых двойников на базе ИИ для автоматизации ментальных процессов коллективного принятия решений.

«Представьте себе маленькую транспортно-логистическую сеть, где «гоняются» грузы по Европе. С одной стороны у вас сжатые сроки выполнения заказа, с другой – ограничения по складам. Вообразите теперь мощь системы, которая бы консолидировала, планировала и оптимизировала заказ непрерывно в реальном времени. Первый раз мы столкнулись с подобными задачами в начале 2000-х годов и поняли, что решить их обычным, линейным, способом не получится», –
поделился докладчик.


😖 Когда классическая оптимизация не работает, на помощь приходят мультиагентные технологии. Множество программных агентов позволяют решению проблемы самоорганизовываться, воспринимая ситуацию и взаимодействуя с себе подобными. Петр Олегович подчеркнул, что с появлением ChatGPT мультиагентные технологии переживают бум второго рождения и используются в различных отраслях: от проектов в сфере логистики до производства. В контексте таких систем эмерджентный интеллект проявляется, когда взаимодействия между агентами приводят к появлению новых, неожиданных паттернов поведения или решений, которые не были предсказаны на уровне отдельных агентов.

Встроенным «мультиагентным движком» адаптивного планирования обладает ИСУР – интеллектуальная система управления ресурсами предприятия на базе эмерджентного интеллекта. Как рассказал докладчик, внедрение этих технологий показало себя с лучшей стороны в различных компаниях, занимающихся перевозками. Так, благодаря ИСУР общий объем выполненных заказов в ТК «Траско» при неизменных ресурсах вырос на 10 %, а простои снизились на 9 %. В ТК «Лорри» эти же показатели составили 5-7 % и 6 % соответственно. Еще один кейс – применение ИСУР для управления мобильными бригадами, в частности, в Средневолжской газовой компании. Технология увеличила эффективность работы бригад на 40 %, позволив делать двенадцать заказов в день вместо семи.

💡Резюмируя, эмерджентный интеллект – новое поле для научных исследований в области создания самоорганизующихся и эволюционирующих систем сильного интеллекта будущего. Разработки, основанные на этой технологии, уже успешно зарекомендовали себя в бизнесе, открыв новые горизонты для повышения результативности, инновационности и конкурентоспособности компаний.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍54🔥4