Data Blog
1.35K subscribers
97 photos
3 videos
4 files
159 links
Explainable AI и котики
Download Telegram
А вот и осенние вкусности! 🎃

Привет, друзья! Совсем свежее обновление в области XAI — shapiq, библиотека, расширяющая возможности известной shap для вычисления значений Шепли.

Основная цель: вместо отдельных значений Шепли, предоставить также количественный эффект взаимодействия между игроками (признаками или слабыми учениками в ансамблях).

Типы данных: таблички, текст, картинки.

Для текстов реализована поддержка pipelin’ов с Transformers, для картинок — пока только возможность запускать предобученные модельки (два VITа и Resnet18)

Плюсы — красиво!
Минусы — некультурно долгое вычисление. Считаю итерацию игры для одной картинки с 16ю игроками, а это 2^16 вариантов коалиций, уже 20 минут, и это принесло мне 4/100% вычислений. Если дождусь — поделюсь результатом =)

Думаю, у библиотеки есть потенциал, буду наблюдать.

P.S, а если наберем 9 реакций напишу пост про SHAP как базовый метод в explainable ai 👀

Чудного вам вечера!
Как всегда Ваш Дата-автор! :)
🔥172
Результат.

Легким движением руки было принято решение поменять число игроков — 512 считать приятнее, чем 65 536 :)
🗿3
🍁 Привет, друзья!

Как обещала — подготовила пост по значениям Шепли! :)

В посте отмечено:

- Интуитивное определение
- Математическое определение
- Историческая справка
- Как метод работает на практике и ключевые моменты графика значений

Читать здесь!

Буду рада вашей обратной связи, реакциям и репостам!
И поздравляю с последним днем сентября 😌

Всегда ваш,
Дата-Автор!
🔥10👍4
Привет, друзья!

Сейчас готовлюсь к семинару про сверточные нейронные сети, захотелось наглядно показать, почему тепловые карты и извлечение паттернов можно применить не ко всем моделям. Смотрите картинку!

Я уже когда-то писала про patch embedding для изображений — и вот как забавно этот механизм показывает себя на тепловых картах :) Ноль информации — сплошные патчи! 🤓

Что же можно делать для ViTов:

1. Анализировать карты внимания (attention maps)
2. Использовать SHAP или LIME
3. Генерировать Counterfactual Explanations (Контрфактуальные объяснения)

Вот такой небольшой пост про вечерние рабочие примечания из области =)

Всем воодушевляющего начала октября!
Ваш Дата-автор!
6
Привет, друзья!

Работа над продуктом на базе chatGPT — увлекательное путешествие. Косяки в доработке — и можно натолкнуться на ситуацию, когда в скрытом смысле в качестве борьбы со страхом модель предложит спалить дом.

В последнюю неделю поставила себе задачу разобраться, как сделать модель прозрачнее, сильнее и лучше, потому что я делаю продукт для детей. И мне показалось важным и интересным поделиться найденными тезисами.

В посте:
1. Можно ли назвать ChatGPT объяснимой моделью и почему?
2. Самообъяснения и извлекаемые объяснения — спасение в ситуации закрытости или полумера?
3. Картинки от YandexART — мой восторг здесь не отнять

Welcome в пост!

P.S. Совсем пропала — октябрь не щадит никого!) Но зато как красиво кругом!

Надеюсь, ваша осень тоже красочна :)
Ваш Дата-автор!
👍64🔥2❤‍🔥1
Привет, друзья!

Мы с вами обсуждали значения Шепли пару постов назад. В исследованиях и на практике SHAP один из наиболее популярных методов интерпретации. Часто о нём говорят как методе из теории игр, и по определению, значения Шепли вычисляются по оценке вклада признака во все возможные "коалиции" (подмножества признаков).

Так, если у нас есть N признаков, нам необходимо перебрать 2^N комбинаций для оценки вклада каждого признака полностью. На практике этого не делается — применяется аппроксимация.

Отсюда возникают вопросы:

- достаточно ли такого нам весьма грубого вычисления (особенно, если у нас картинка, которую хотелось бы оценить максимально детально)?
- насколько значения Шепли случайны и основаны на данных?

Мне не хотелось оставлять эти вопросы неотвеченными, и я провела время с изучением литературы. Так родился пост на Хабр:
Практическая устойчивость значений Шепли в интерпретации моделей ИИ

В нём ответила на них!

И приглашаю вас к чтению :)
🔥108
🍁🍁🍁

P.S. Я ужасно стрессую, когда пинаю что-то до Хабра, потому что личка на Хабр — иной раз отдельное искусство. Поэтому буду очень рада вашей поддержке в виде реакций/комментариев :)

P.P.S У меня есть к вам мини-просьба. Относительно скоро (через полтора месяца) у меня день рождения =)
И я бы очень хотела дойти до 1000 читателей (я люблю красивые цифры и галочки в списках желаний!)

Буду безумно рада и благодарна, если вы поделитесь блогом просто среди знакомых и тех, кому он может быть интересен!

Спасибо вам огромное, что читаете, наблюдаете и задаете вопросы!
Вы — лучшие!


Всегда ваш,
Дата-автор! 🫶🏻
🤝176👍2
Привет, друзья! 🪁

На днях потестировала новую для себя библиотеку moDel Agnostic Language for Exploration and eXplanation (DALEX)

Небольшой обзор, чтобы не теряться в уже весьма большом количестве либ и фильтровать, что must have, а что — нет.

Плюсы из коробки:

1. Предоставляет красивые визуализации для:

Графиков частичной зависимости (PDP plots);
Измерения важностей признаков на основе перестановки;
Графиков Break down — изменений прогноза при добавлении признака в модель.

2. Позволяет проанализировать взаимодействие

Из известных мне, первая питоновская библиотека, где коэффициенты влияния Feature Interaction можно просто достать из коробки, не задействуя применения статистического анализа.

3. Включает в себя SHAP, LIME (как самые популярные методы) и необходимый минимум классических методов

4. Безумно красиво описана математическая теория всех методов в библиотеке!

Приводят книгу, с которой можно пропасть, анализируя математическую основу методов (я просто немного пропала в ней! ☺️)

Минусы:

1. Частично повторяет существующие библиотеки или является добавлением красоты для классики, которую можно реализовать условно используя sklearn и matplotlib

2. Не дружит с catboost, lightgbm — тоже популярными в проде моделями

3.Не дружит с pyTorch

Совместимость:
scikit-learn, keras, H2O, xgboost, mlr (python) 
mlr3, tidymodels (R)


Саммари:

В общем и целом отлично подходит для красивых отчетов и беглой оценки анализа попарного взаимодействия, если нет времени провести статические тесты.

Как мнение — знать хорошо, использовать повседневно — зависит от сценариев.

Всё ещё ваш,
Дата-автор!
❤‍🔥6🔥5
Привет, друзья!

Бывают такие конференции, на которых важно выступить для университета. И хорошо, когда есть, с чем!

Прошедшим летом я много времени вложила в курс по Explainable AI. И так получилось, что курс, который благодаря AI Education появился на степик — первый на русском языке!

Поскольку я буду презентовать его — решила вообще проанализировать — насколько термин «объяснимый ИИ» популярен.

На Яндекс Вордстат перекати-поле, в Google Trends ситуация не лучше =(

(прилагаю картинки)
👍74👀3
Отсюда вопрос!

Слышали ли вы про область Explainable AI (XAI, объяснимый ИИ) до чтения канала?
Anonymous Poll
58%
Да
34%
Нет
2%
Я и в канале её слышал/а
6%
Кнопка для кнопки 🥮
Привет, друзья!

Помните значения Шепли и их красивую идею — смотреть на признаки как на группы лиц, играющих в игру? Это даёт им ряд преимуществ, а математика показывает, что метод объективно обладает рядом хороших свойств. Теперь он не один!

Что если рассматривать признаки как членов парламента?

Про метод, основанный на идее выборов в парламент (который реально используется в ряде стран), а также про то, как сделать такой красивый график — читайте в статье! :)

P.S
Сейчас очень много исследую и работаю, так что декабрь обещает быть насыщенным.

Всем яркой зимы,
Ваш Дата-автор!
❤‍🔥10🔥4
Привет, друзья!

Интерпретация влияний признаков на прогнозы в модели линейной регресии — база, фундамент и первый кирпич в построении объяснений.

По определению, мы можем смотреть на веса модели и считывать важность с них. Но всегда ли этого достаточно и точно ли это всё, что мы можем извлечь из модели?

📉 На практике — нет!

Подготовила для вас ноутбучек с 5ю методами для представления информации, которая заложена в весах модели и модели в целом:

1) Прямое рассмотрение коэффициентов в виде барплота.
2) Представление коэффициентов виде круговой диаграммы.
3) Рассмотрение относительного вклада коэффициентов.
4) Анализ остатков модели.
5) Построение регионов уверенности.

Приятной практики!
Ваш, Дата автор!

Постепенно готовлю обновления в курсе по XAI и пару открытых занятий, но сначала сессия. 🐈
14🔥7
Привет, друзья!

Мне хотелось дать вам что-то красивое в силу моего дня рождения. Так что здесь должен был быть красивый пост про оценку взаимодействия признаков с использованием H-статистики, но я всё ещё студент на сессии)

Так что хочу поделиться с вами скидкой на курс по XAI! Я делала и делаю его, основываясь на опыте, знаниях, лекциях, проводимых студентам в ПетрГУ и ВШЭ и их вопросов ☺️

Надеюсь, со временем курс будет становиться только больше и лучше.

Планы на будущий год — наполеоновские:
1. Продолжать развиваться как автор, преподаватель и ученый
2. Устроиться на стажировку по направлению XAI/механистической интерпретируемости — последнее — что-то удивительное и безумно красивое!
3. Закончить ВУЗ, стать математиком и поступить снова! :)

Очень рада, что вы у меня есть! Обожаю вас! ❤️

Скоро вернусь с постами, со всем самым добрым,
Ваш Дата-автор!
19👍3
🎄Друзья, привет-привет!

Поговорим в субботу?)

Рома — разносторонний человек. С одной стороны, он AI-продакт в FinTech стартапе, с другой — в процессе написания диссертации по теме Reasoning и Long-term memory в наших удивительных ИИ моделях.

🎉И вот мы встречаем в ситуацию — что будет, если один компетентный в области человек начнет опрашивать другого про его области научных интересов?

Приглашаем послушать! 👇🏻
❤‍🔥32
XAI: Как понять, о чем думает ИИ?

Скорость развития современных LLM просто поражает: недавно вышла o3 модель, которая уничтожает все бенчмарки. Но как они решают задачи и что из этого можно понять?

Поговорим про объяснимость ИИ и LLM с Сабриной. Она помогает вести курсы в ВШЭ, на Степике и у нее есть свой телеграм канал, посвященный ИИ @jdata_blog.

В эту субботу - 28.12 в 13:00 проведем телеграм эфир и посмотрим, как можно понять и интерпретировать ИИ.

Ставьте напоминание и до встречи!
8👍3🔥3
👀 Можно ли доверять интерпретации?

Как интерпретировать модели лучше всего?

🫀И где в интерпретации мы спотыкаемся о свойства биологических систем?


…это, и не только обсудили сегодня с Ромой! Диалог вышел продуктивный и интересный, приглашаю послушать! 👇🏻
🔥31🤩1
Media is too big
VIEW IN TELEGRAM
Запись нашего с Сабриной @jdata_blog стрима. Вышло супер круто, смотрите, если пропустили!
🔥92👍1🤩1
🎄 Привет, друзья!

Ну что, последний пост в году. Я очень благодарна каждому, кто был и остаётся здесь, ставит все эти чудесные и забавные реакции, пишет вдумчивые вопросы, репостит и зовёт в какие-то движухи.

Вы — лучшие!

Какие планы:

В Новом году всё также будут выходит посты, и я уже заполнила список дел всякими интересными штуками. Надеюсь, будет также весело!

🎁 Чего хочу пожелать:

Здоровья. Не будет его — не будет вас, проектов и сил на вот всё красивое (и иногда ужасное, ладно)

Окружения — люди — золото. Вы, например, моё.

Никогда не останавливайтесь на пути к целям. Двигайтесь, шевелитесь, ищите, встречайте отказы — и всё получится.

Банального счастья. Вы есть, вы (я надеюсь) проживаете эту жизнь не пуская её на самотек. И это круто.

Сил и стойкости. Лишним не будет =)

С наступающим! ❤️
Ваш Дата-автор!
🔥12❤‍🔥4