Введение в искусственный интеллект
331 subscribers
63 photos
2 videos
170 links
Просто об искусственном интеллекте и его возможностях. Помогу разобраться в базовых понятиях и создать собственную нейросеть. Рассказываю, что у ИИ под кожей.
Елена Михалькова
Download Telegram
В среднем гармоническом, если x = 100, а y = 0, то среднее гармоническое тоже = 0.
🦄3
Следующий интенсив

Я определилась с датами следующих интенсивов: 17 и 24 декабря. 17-го снова будем разбирать основы Питона, а вот 24го...
Почитала я комментарии к посту: во всех них есть одна общая тема - компьютерная лингвистика. Поэтому она и будет общей темой занятий 24 декабря. А вот что затронуть - какие области CL - жмякайте в опросе выше.
❤‍🔥4
А между тем я на конференции в НИУ ВШЭ (Москва)
17👍1
Зашла на ВДНХ, а там прямой эфир снимают
This media is not supported in your browser
VIEW IN TELEGRAM
2💯1
This media is not supported in your browser
VIEW IN TELEGRAM
Ну и вот Яндекс доставка - пылесосит в местную пиццерию
👏3😱3👍2🥰2
Введение в искусственный интеллект
Темы занятий по комп. лингвистике
Интенсив 17 и 24 декабря

Ну что ж, можно подвести итог голосования. Победила тема "Дистрибутивная семантика". Ее и буду разбирать на интенсиве 24 декабря. Это будет второй трек. А первый трек пройдет 17 декабря и будет посвящен основам питона. Так что, если вы их уже знаете, то вам там будет скучно - регайтесь только на второй трек.

(Тем, кто зарегался через СоцГум на повышение квалификации, форму заполнять не надо.)

Ссылка на регистрацию. 📝

#ниипетпроект
👍1
Смена локации интенсивов

Уважаемые друзья! Интенсивы 17 и 24 декабря пройдут в аудитории 217 (аудитория ВТБ) в ФЭИ (ул. Ленина, 16).

Скоро увидимся! 🤩
👍6
Интенсив 24 декабря

Уважаемые участники интенсива!
Напоминаю, что интенсив по дистрибутивной семантике пройдет 24 декабря 2023 с 10:00 до 17:00 в ФЭИ (Ленина, 16), ауд. 217 (аудитория ВТБ). При себе иметь ноутбук или планшет (или даже смартфон), который позволяет запускать и редактировать ноутбуки Google Colaboratory, а также любой документ, удостоверяющий личность.

Кто тоже хочет пойти, но не записался, форма регистрации тут. (Я сейчас обнаружила, что она у меня была закрыта несколько дней. Регаться можно аж до субботы, т.к. список на охрану я буду распечатывать утром в воскресенье.)

See you soon! 😎
👍2🥰2
Кто-то забыл мышь 🐭 На последней парте в 217 ауд.
😢4👍1
Уважаемые участники интенсива!

Я таки только завтра разошлю все материалы. Конец семестра - навалилась проверка всяких разных работ. 🥴

Ну а всем-всем-всем - небольшой анонс, что будет в канале в этом году.
1. Пост, повисший с ноября: стоит ли обращаться к ИИ за диагнозом?
2. Подводим итоги года.
3. Кружочек с новогодним поздравлением от Винни-Пуха меня.
4. Анонс январских постов. На каникулы не пойду - это скучно. Буду писать, пока пишется 😜
10👍1
Самодиагностика с помощью генеративного ИИ. Часть 1
Пост пришлось разбить аж на три части, но тема такая, что коротким очерком не обойдешься. Последняя часть комментарии - в тексте они даны в квадратных скобочках.

На конференции в НИУ ВШЭ, где я рассказывала про профессию цифрового историка, лингвиста и филолога, был целый доклад, посвященный рискам использования генеративных нейросетей в здравоохранении [1]. Рисков, конечно, много, и речь, конечно, не о каких-то очень абстрактных вещах, вроде “нас завоюет Скайнет” (что тоже исключать нельзя 🙂). В общем тема активно обсуждается. Я в этом посте сфокусируюсь на одной грани: медицинская самодиагностика неспециалистом при помощи генеративного ИИ (ChatGPT и подобные ей) [2].
Медики уже давно используют алгоритмы для постановки диагноза. Когда появились нейросети, они и их быстро освоили [3]. (А еще голубей [4].) Параллельно Интернет наводнили блоги и форумы, где пациенты и их родственники обсуждают диагнозы, врачей, опыт лечения [5]. У человека, который идет на форум обсудить свой диагноз, иная цель, чем у того, кто идет в поликлинику. Это особый вид поиска, не совсем чтобы истины. У нас в лингвистике и смежных науках есть целое обширное поле исследований: медицинский дискурс [6]. Когда человек приходит в поликлинику, то он из самостоятельного, взрослого, красивого и умного индивида превращается в кусочек биоматериала, о котором судят некие специально обученные и награжденные дипломами и статусами высоколобые эксперты (все, наверно, очень здоровые, тк умеют соблюдать свои рекомендации). Да тут же целое поле для внутренних и внешних конфликтов!.. И если есть возможность избежать хотя бы части из них, то почему бы и нет? Пусть при этом качество диагностики, возможно, снизится. Берем ChatGPT, пишем симптомы и получаем диагноз.
В ботостроении (разработке чат-ботов) есть понятие “счастливый сценарий”. Это когда общение клиента с чат-ботом идет по плану. Счастливый сценарий постановки диагноза такой:
1⃣ Бот говорит по-человечески (высокий уровень имитации речи - как у ChatGPT. например) и обладает достаточными знаниями для постановки диагноза.
2⃣ Человек общается с ботом искренне, честно.
3⃣ В своем сообщении человек успешно выразил намерение получить диагноз.
4⃣ Человек хочет, чтобы общение с ботом состоялось вне рамок медицинского учреждения, анонимно, без “коммуникативного прошлого” (это когда вы несколько раз ходите к одному и тому же врачу).
5⃣ Человеку очевидно, что он говорит с ботом, который не несет ответственности и не дает гарантий.
6⃣ Человек намерен использовать полученную информацию как дополнение к тому, что сказали специалисты, и поделится ею с ними (ну или хотя бы тем фактом, что советуется с ИИ).

Примеры, когда все прошло хорошо и даже лучше, чем хорошо, уже есть в СМИ [7]. Сбер даже разработал отдельного ИИ-диагноста, которого рекомендуют профессиональным врачам [8]. Да и разработчики ботов, наученные на горьком опыте, когда их боты сходили с ума и поливали собеседников грязью, научились возвращать бота в счастливый сценарий. Например, ChatGPT обязательно напишет вам отказ от ответственности, если вы пожалуетесь на свою болячку [9]. Также, вроде бы, боты стараются не воровать и не копить информацию, которая может вас скомпрометировать. По крайней мере, их разработчики так утверждают (“А зачем нам это?” А и правда, зачем? 😁).

#эссеиистика
👍3
Самодиагностика с помощью генеративного ИИ. Часть 2
А теперь посмотрим, что может пойти не так?

Оставим за скобками ситуацию, когда человек не честен или генеративная модель плохо обучена, т.к. это мы проверить не можем. Рассмотрим веру в истинность - сциентизм. ИИ-технологии “красиво вошли в нашу грешную жизнь” (говоря словами из песни Меладзе). В эйфории от их успехов можно переоценить их качества. Нарратив успеха разных технологий свойственен СМИ и сайтам компаний: “мы применили научный подход, затем внедрили, получили коммерческий успех и довольных клиентов”. Это ошибка выжившего: пока нет свидетельств анти-чуда, мы будем читать об успешно поставленных диагнозах. Когда читатели попривыкнут, в СМИ появятся новости об “анти-чудесах” (как с Теслой, например [10]).
Кроме этого, боты склонны “выдавать «льстивые» ответы, которые нравятся пользователям, но при этом не являются точными” [11]. Этот феномен называется sychophancy (сайкофЭнси) - подстраивание модели под человека, его установки.
Веру вселяет и использование ботом терминологии, и частичное попадание в диагноз, поставленный врачом. И поскольку у пользователя нет цели проверить бота, протестировать его, например найти первоисточник (научную публикацию о болезни), то остается только верить. Кстати, первоисточник найти в самом ИИ, скорее всего, не получится. Боты все помнят очень примерно - как человеку трудно вспомнить точное-преточное название одной из тысяч статей, которые он когда-либо прочитал.
Генеративные модели можно оценить по двум параметрам: perplexity (перплексность) - предсказуемость ответа на конкретный промпт (от англ. prompt - подсказка, запрос), и entropy (энтропия) - непредсказуемость ответа, новая информация. Поэтому генеративные модели не являются в полной мере вопросно-ответными системами, а их ответы - это всегда вероятностное предсказание. Мы получаем самый вероятный ответ, но мы не можем оценить уверенность модели и варианты, которые попали на второе место и ниже. Создаётся информационный пузырь из ответов, которые никогда не попадут в результат. Хотя это и совпадает с целью диагностики, ведь она требует только один - предположительно правильный - диагноз.
С отсутствием коммуникативного прошлого тоже все непросто. Коммуникация с ботами - это общение со специалистами: разработчиком, промпт-инженером, сисадмином, ресечером 🥴. Просто она массовая, мало обсуждается, мало описана, непрозрачна. Бот - это медиум, посредник, мостик.
ВОЗ [12] и я 😀 рекомендуем: пользоваться ИИшкой для диагностики можно, но осторожно. Что следует делать параллельно с общением с генеративным ИИ:
👆 простым пользователям - полагаться на медицинских специалистов, повышать собственную ИИ-грамотность (например, читать наш канал и ходить на наши интенсивы 😁) и грамотность друзей и знакомых - быть занудой, чесать всем мозги, что ИИ - это не халява;
обществу (человечеству в целом) - развивать ИИ-этику и ИИ-регулирование. Иначе мы-таки построим Скайнет.

#эссеиистика
🫡2👍1👌1
Комментарии
1. Вот тут есть прото-версия этого доклада в виде комментария одного из его авторов.
2. На эту тему я делала доклад на онлайн-конфе в Вышке в ноябре. Пруф 😀 - см. секцию «Исследования в условиях неопределенности: проблемы и решения»
3. См. статью “Artificial neural networks in medical diagnosis” 2012 (!) года.
4. Никто бы не подумал, что голуби могут определять рак молочной железы.
5. На конфе тоже доклад был на эту тему: Анна Лядова (МГУ) “Цифровая медиатизация здоровья”.
6. Классическая статья об этом виде дискурса: Tannen D., Wallat C. Medical professionals and parents: A linguistic analysis of communication across contexts
7. Это уже хрестоматийный пример, который прозвучал из каждого утюга: мама поставила диагноз ребенку сама при помощи ChatGPT, когда врачи года три не могли разобраться.
8. У них даже отдел есть - СберМед.
9. Мне написала такое: “Как чат-бот, я не могу заменить визит к врачу или предоставить медицинские консультации.”
10. Хотела кинуть сюда ссылку на недавний инцидент с Теслой, но решила не портить настроение накануне Нового года. Кто хочет - эти новости гуглятся.
11. См. статью “Towards Understanding Sycophancy in Language Models
12. Беспокойства ВОЗ изложены в этом докладе.
❤‍🔥4
Анонс постов на январь 2024
Когда холода - не помеха, и чернила не застыли

👯2 Почему анализ данных ходит рука об руку с машинным обучением
🕵4 Information retrieval. Ищем документ в стоге терабайтов
🤯7 Да кто такой этот ваш эмбеддинг? (На последнем интенсиве я попыталась объяснить, но не успела lol)
👩‍🚀9 Лопаем информационный пузырь - как ML приводит к появлению вакуума
🥸11 Новые имена: Илья Суцкевер
🧝‍♀️14 Старые имена: Ада Лавлейс
🎰16 Как работает word2vec
📜18 Как работает doc2vec
🥦21 Системы рекомендации - они скучные, но полезные
🤖23 Трансформеры уже здесь
🧛‍♀️25 Новые имена: Татьяна Шаврина
👩‍✈28 Старые имена: Грейс Хоппер
👯‍♂️👯‍♀️30 Dalle, Midjourney, Stable Diffusion, Kandinsky

ПС. Цифра перед названием темы - это дата, когда пост выйдет. Но обычно я пишу по ночам, так что чаще всего технически пост выходит на следующий день. После 24:00 - когда туфелька превращается в тыкву 🥭
("Это же манго" - да, тыкву я не очень люблю, а вот манго...)
4
Итоги года (2023)

В этом году я запустила тг-канал, ура-ура-ура! 🎆
Пост намбер уан вышел 14 июня, набрал 234 просмотра. А 15 августа я представила вам админа Артема.
Всего в канале было 118 сообщений. Из них 26 кружочков. Кружочки стабильно набирают хорошие просмотры, так что в новом году будем давать больше динамики и визуала 👀
Спасибо Артему, Гузели, Жене и Саше за то, что поучаствовали в кружочках! Спасибо Леше и Ильясу за то, что держали камеру! Love you, guys 🤩
Самый популярный пост набрал 395 просмотров - это пост с объявлением про регистрацию на наш последний интенсив. Из чего делаю вывод, что интенсивы нравятся - будем продолжать.
Всего интенсивов провели 2, что равно 32 академическим часам (или 16 парам). На них побывали 94 человека. Около 50 получат удостоверения о повышении квалификации.
Также мы выпустили для вас 7 Colab ноутбуков с кодом - ищите их по хэштегу #notebook . В них разбор кода для базы.

Еще будет кружочек с новогодним поздравлением - зря я что ли накрутила кудри?
🔥4
Ну и вот пикча с нашими “акциями” - так подрос каналец за осень. Будем расти еще, пока растется. Ведь еще не все знают, как создать Скайнет и, главное, как его не создавать 😁
🔥5
Ура! С Новым годом!
🎄3
This media is not supported in your browser
VIEW IN TELEGRAM
7🎉2❤‍🔥1