Введение в искусственный интеллект
331 subscribers
63 photos
2 videos
170 links
Просто об искусственном интеллекте и его возможностях. Помогу разобраться в базовых понятиях и создать собственную нейросеть. Рассказываю, что у ИИ под кожей.
Елена Михалькова
Download Telegram
Дайджест новинок в области ИИ
1⃣ Летом Сбер выкатил новую версию своей нейросети Kandinsky 2.2. Они улучшили качество фотографичных изображений. До этого у них в основном такие рисованные мультяшки получались, типа графических иллюстраций. А недавно они и анимацию добавили - пока в тестовом режиме. Кстати, команда разработчиков прошла на демо-сессию на конференцию EMNLP в Сингапуре (в мире NLP это большой почет и уважение). А мы туда же не прошли с научной статьей. Но ничего, мы уже переподали статью на другую крутую конфу.
2⃣ Виндовсы, Эпплы и Гуглы активно переходят на ИИзацию интерфейсов взаимодействия с пользователем. Это светится почти в каждом анонсе нового девайса или системы. Вот, пожалуйста, оцените обзор одиннадцатой Винды. Скоро тыкать по экрану или стучать по клавишам мы будем в редких случаях ностальгии по началу XX века. Все остальное - голосом и мимикой. Прямо как в обожаемом мною фильме “Пассажиры” (Эх, вот бы провести годик в одиночестве на космическом корабле, но в зато люксовых условиях!..) Так что, если вы инвестор, возможно, пора вкладываться в стартапы, которые переводят речь в текст и наоборот. 📈🤷‍♀️💰
3⃣ GPT-4v теперь умеет обрабатывать не только текст, но и изображения. Например, она может дать точные названия мебели из Икеи, попавшей на фото. Полезно, если вы любите продавать старое барахло на Авито.
4⃣ Инсайдер из OpenAI опубликовал в Твиттере запись о том, что к 2025 году компания планирует выкатить AGI, то есть такую модель с искусственным интеллектом, которая обойдет в решении любой (или почти любой) задачи любого (или почти любого) человека. Ну, типа, будет такой же разумной, как Tars из Интерстеллара или робот-бармен Артур из упомянутых “Пассажиров”. Будем посмотреть.
5⃣ Новости из мира людей: вдруг вы пропустили, но... Илон Маск переименовал Твиттер в X. И как теперь это произносить? “Икс”? То есть не твитнуть, а икснуть? А как теперь сказать “твит”?

#байкиизсклепа
3
Как обещала, отправляю анонс по интенсиву, который проведу 4 и 5 ноября в СоцГуме ТюмГУ. Завтра буду спамить его по всем собранным за годы проведения Школы компьютерной лингвистики каналам, а пока, можно сказать, эксклюзив только для подписчиков 😉

Интенсив по Питону и машинному обучению

Приглашаем вас на бесплатный интенсив по основам языка программирования Python (первый трек) и машинному обучению (второй трек). Занятия пройдут 4 и 5 ноября 2023 г. в Институте социально-гуманитарных наук ТюмГУ в очном и дистанционном форматах. Можно посетить оба трека или выбрать один из двух.Число мест для очных участников: 40. На площадке вас будут консультировать наши волонтеры.
Подключение онлайн будет осуществляться через Яндекс Телемост.
Расписание занятий (оба дня одинаковое):
1 урок 10:00-11:30
Кофе-брейк
2 урок 11:45-13:15
Обед
3 урок 15:00-16:30
Перерыв
4 урок 16:45-18:00
18:00-18:15 - обратная связь об интенсиве
Уровень сложности: начинающий.
При себе иметь:
- ноутбук, позволяющий wi-fi доступ в Интернет (можно будет подключиться к сети ТюмГУ);
- аккаунт Google либо предустановленный Jupyter Notebook или Anaconda;
- если вы будете работать в облачной среде программирования Google Colaboratory, то на ноутбуке должен быть браузер Google Chrome;
- очным участникам: паспорт или любой другой документ удостоверяющий личность.
NB! Регистрация до 24:00 2 ноября 2023 (включительно). Мы подтвердим ваше участие через электронную почту.
Занятия бесплатные. Если вы посетите 70% занятий и выполните проверочный тест после интенсива, то сможете получить удостоверение о прохождении образовательного курса (повышение квалификации). До Нового года студенты и сотрудники ТюмГУ могут оформить его бесплатно. Подробности вышлем по электронной почте после регистрации.

Регистрируемся тут! 🥳📋

#ниипетпроект
7👍1
🤘Учимся уважать Python Django

Я люблю говаривать, что лучший на свете вводный тьюториал в Питон находится тут, на Джанго Гёрлз. Django Girls - это такая некоммерческая организация, которая вдохновляет девчонок по всему миру заниматься программированием. Девчонок в программировании и правда немного. Одно из последних масштабных исследований за 2022 год показало, что их 27.6%. Но их число растет.
А почему это вообще проблема? Девчонков и среди космонавтов меньшинство, зато в балете они доминируют. Проблема в том, что цифровые технологии проникают во все сферы жизни, массово меняя повседневные практики: от покупок в магазинах до оформления паспорта. Их за это еще называют сквозными. Так вот при разработке такой технологии, если разработчики будут представителями только одной какой-то узкой социальной группы, то они заложат в технологию так называемый bias (бАяс - ударение на А, “предвзятость”).
Как баяс возникает на практике? Создать систему, которая заменяет человека в экспертной работе, чаще всего можно множеством разных способов. Однобокий взгляд небольшой консолидированной во мнении группы, скорее всего, выберет именно такой подход, который максимально удобен и приятен другим представителям этой группы. Если задача более-менее однозначная, типа определить номер машины, то тут вряд ли баяс скажется. Но вот если вопрос стоит в том, чтобы дать человеку ипотеку или поставить оценку за сочинение на ЕГЭ (а цифра и сюда уже активно проникает), то избавление от баяса для всеобщего блага и процветания становится кардинально важным.
С появлением ИИ это стало еще более очевидно. Например, первые попытки выкатить большую генеративную языковую модель всем твиттерянам закончились тем, что модель начала отмачивать расистские и сексистские шутки. Microsoft (мелко-мягкие) потом долго извинялись. Django Girls - это одна из инициатив, которая пытается пробудить интерес к Питону через максимально понятные тьюториалы с примерами (на эту тему есть мемасик про Питон, скину дальше). Плюс они организуют events (ивенты, мероприятия). Вот 4 ноября будет workshop (воркшоп, мастерская) в Челябинске.
Почему гёрлз выбрали не просто Питон, а какое-то Джанго? Ну, вообще, выбрали и выбрали, захотелось так. Имеют право. Но тут есть и посыл: Django - это фреймворк для создания веб-сайтов и приложений. То есть вы не просто Питон поизучаете, но сможете быстро запустить собственный проект. Питон все больше используют именно для веб-технологий, потому что в нем много инструментов, которые out of the box (достал и тут же пользуешься) позволяют и запрос обработать, и аналитику собрать, и ИИ подключить.
А я напоминаю, что провожу собственный воркшоп по основам Питона и ИИ - тоже 4 и 5 ноября, прям как Джанго-девчонки. Скоро выкачу темы занятий. Рега туть.

#эссеиистика #girlpower
5
тот самый мемасик
6👍1🤮1
Дорогие подпИИсчики!
Я интенсивно готовлюсь к интенсиву по Python и искусственному интеллекту, поэтому пропустила пост на этой неделе. Постараюсь наверстать завтра.
А пока напоминаю вам, что у нас идет регистрация. И не просто напоминаю, а в кружочках! Спасибо Музейному комплексу Словцова, что дали посниматься с экспонатами. Выставки реально класс и атмосфера тоже 👍
Всех с приближающимся Хэллоуином! 🎃
2
This media is not supported in your browser
VIEW IN TELEGRAM
2❤‍🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
❤‍🔥22
This media is not supported in your browser
VIEW IN TELEGRAM
2❤‍🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
2❤‍🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
2❤‍🔥1👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
2❤‍🔥1🔥1🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
2❤‍🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
2❤‍🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
👍2❤‍🔥1😁1
Как оценить эффективность ИИ
Восстанавливаю пропуски за прошлую неделю 😉 Этот пост планировался к выходу в четверг.
Я часто пишу, что ИИ нужен, чтобы решить задачу экспертно, заменить человека на рабочем месте и быть не менее (ну или хотя бы не сильно менее) эффективным, чем человек-эксперт. Но как понять, что замена состоялась? Для оценки эффективности ИИ применяются разные метрики.
Разработка метрик сама по себе является отдельной областью науки. Более того, если вам не о чем писать статью, создайте собственную метрику под какую-нибудь нетривиальную экспертную задачу. И назовите ее своим именем! Можно с приставкой, которая подчеркнет вашу выдающность. Как, например, “альфа Криппендорфа”. Или “коллерряция” Спирмана (это тоже метрика, кстати). Какие еще бывают названия: b-cubed, Bleu, glue, METEOR, mae, RMSE, hgkdsv* (шутка, последнего набора букв нет среди метрик). Метрики обычно привязаны к определенному классу задач: оценка согласованности экспертов, машинный перевод, кластеризация с золотым стандартом, точность выявления отрезка текста или группы пикселей на изображении. Но среди всего этого буйства есть четыре выдающиеся метрики, которые в разных видах применяются чаще остальных: precision (пресИжн, точность), recall (рикОл, полнота), f-score (эфскОр, эф-мера), accuracy (Экьюраси, акУраси - так ее никто и не перевел нормально на русский).
Я очень люблю пример с Википедии про кошек и собак для демонстрации этих метрик. Вот у нас на фото 10 кошек и 12 собаков. Программа нашла 8 собаков. При этом из них 5 - это реально собаки, а 3 - кошки (ошибочка вышла). Пусть наш ИИ-классификатор разработан с целью определять класс “собаки” (именно их против всех остальных животных, не обязательно котиков):
Precision = ⅝, то есть из восьми объектов, идентифицированных как собаки, 5 реально собаки.
Recall = 5/12, то есть из 12 реальных собак на фото 5 реально собаки.
Чем ближе precision и recall к 1, тем лучше. Но тут есть две проблемы:
1⃣ если только одно животное было идентифицировано как собака и при этом это реально собака, то precision = 1
2⃣ если все животные будут идентифицированы как собаки, то recall = 1
Да и непонятно, зачем нам две разные цифры. Чтобы их сбалансировать и уменьшить негативные последствия указанных выше проблем, используется f-мера - среднее гармоническое между precision и recall. Если число объектов в классах примерно одинаково (примерно поровну собак и кошек), то можно применить accuracy: в числителе - все правильно определенные собаки и кошки, в знаменателе общее количество объектов на фото (т.е. собак и кошек).
Надеюсь, что и вы, уважаемые читатели, однажды изобретете метрику и назовете ее своим любимым именем.❤️
#база
👍2
И еще нам тут поступил вопрос по интенсиву: а что такое машинное обучение? в чем отличие от искусственного интеллекта?
Машобуч (машинное обучение) - это часть ИИ, которая решает экспертную задачу, обучаясь на размеченном наборе данных. Вот в примере с кошками и собаками выше изображения были размечены: на них стояли метки - "кошка", "собака". Как линейная регрессия с ирисами - алгоритм берет много таких размеченных данных и выучивает, какие у них бывают типичные признаки. А потом ему можно давать неразмеченные данные - для автоматической разметки.
#база
Ну вот и разосланы последние письма с подтверждением участия! Увидимся с вами в субботу и воскресенье на кофе-брейках А в перерывах между ними попробуем немного покодить 😉

Информация по поводу удостоверений о повышении квалификации будет на интенсиве.

Вопросы можно задавать в комментарии к этому посту или на почту
e.v.mikhalkova@utmn.ru - проверяю оперативно (если не сплю или не ем).
2