Итак, воскресный кружочек! У меня в гостях (точнее, я у нее - в Передовой инженерной школе) руководитель магистратуры по анализу данных и ИИ Гузель Чапарова.💫
This media is not supported in your browser
VIEW IN TELEGRAM
👍3🔥2
Дайджест новинок в области ИИ
1⃣ Летом Сбер выкатил новую версию своей нейросети Kandinsky 2.2. Они улучшили качество фотографичных изображений. До этого у них в основном такие рисованные мультяшки получались, типа графических иллюстраций. А недавно они и анимацию добавили - пока в тестовом режиме. Кстати, команда разработчиков прошла на демо-сессию на конференцию EMNLP в Сингапуре (в мире NLP это большой почет и уважение). А мы туда же не прошли с научной статьей. Но ничего, мы уже переподали статью на другую крутую конфу.
2⃣ Виндовсы, Эпплы и Гуглы активно переходят на ИИзацию интерфейсов взаимодействия с пользователем. Это светится почти в каждом анонсе нового девайса или системы. Вот, пожалуйста, оцените обзор одиннадцатой Винды. Скоро тыкать по экрану или стучать по клавишам мы будем в редких случаях ностальгии по началу XX века. Все остальное - голосом и мимикой. Прямо как в обожаемом мною фильме “Пассажиры” (Эх, вот бы провести годик в одиночестве на космическом корабле, но в зато люксовых условиях!..) Так что, если вы инвестор, возможно, пора вкладываться в стартапы, которые переводят речь в текст и наоборот. 📈🤷♀️💰
3⃣ GPT-4v теперь умеет обрабатывать не только текст, но и изображения. Например, она может дать точные названия мебели из Икеи, попавшей на фото. Полезно, если вы любите продавать старое барахло на Авито.
4⃣ Инсайдер из OpenAI опубликовал в Твиттере запись о том, что к 2025 году компания планирует выкатить AGI, то есть такую модель с искусственным интеллектом, которая обойдет в решении любой (или почти любой) задачи любого (или почти любого) человека. Ну, типа, будет такой же разумной, как Tars из Интерстеллара или робот-бармен Артур из упомянутых “Пассажиров”. Будем посмотреть.
5⃣ Новости из мира людей: вдруг вы пропустили, но... Илон Маск переименовал Твиттер в X. И как теперь это произносить? “Икс”? То есть не твитнуть, а икснуть? А как теперь сказать “твит”?
#байкиизсклепа
1⃣ Летом Сбер выкатил новую версию своей нейросети Kandinsky 2.2. Они улучшили качество фотографичных изображений. До этого у них в основном такие рисованные мультяшки получались, типа графических иллюстраций. А недавно они и анимацию добавили - пока в тестовом режиме. Кстати, команда разработчиков прошла на демо-сессию на конференцию EMNLP в Сингапуре (в мире NLP это большой почет и уважение). А мы туда же не прошли с научной статьей. Но ничего, мы уже переподали статью на другую крутую конфу.
2⃣ Виндовсы, Эпплы и Гуглы активно переходят на ИИзацию интерфейсов взаимодействия с пользователем. Это светится почти в каждом анонсе нового девайса или системы. Вот, пожалуйста, оцените обзор одиннадцатой Винды. Скоро тыкать по экрану или стучать по клавишам мы будем в редких случаях ностальгии по началу XX века. Все остальное - голосом и мимикой. Прямо как в обожаемом мною фильме “Пассажиры” (Эх, вот бы провести годик в одиночестве на космическом корабле, но в зато люксовых условиях!..) Так что, если вы инвестор, возможно, пора вкладываться в стартапы, которые переводят речь в текст и наоборот. 📈🤷♀️💰
3⃣ GPT-4v теперь умеет обрабатывать не только текст, но и изображения. Например, она может дать точные названия мебели из Икеи, попавшей на фото. Полезно, если вы любите продавать старое барахло на Авито.
4⃣ Инсайдер из OpenAI опубликовал в Твиттере запись о том, что к 2025 году компания планирует выкатить AGI, то есть такую модель с искусственным интеллектом, которая обойдет в решении любой (или почти любой) задачи любого (или почти любого) человека. Ну, типа, будет такой же разумной, как Tars из Интерстеллара или робот-бармен Артур из упомянутых “Пассажиров”. Будем посмотреть.
5⃣ Новости из мира людей: вдруг вы пропустили, но... Илон Маск переименовал Твиттер в X. И как теперь это произносить? “Икс”? То есть не твитнуть, а икснуть? А как теперь сказать “твит”?
#байкиизсклепа
❤3
Как обещала, отправляю анонс по интенсиву, который проведу 4 и 5 ноября в СоцГуме ТюмГУ. Завтра буду спамить его по всем собранным за годы проведения Школы компьютерной лингвистики каналам, а пока, можно сказать, эксклюзив только для подписчиков 😉
Интенсив по Питону и машинному обучению
Приглашаем вас на бесплатный интенсив по основам языка программирования Python (первый трек) и машинному обучению (второй трек). Занятия пройдут 4 и 5 ноября 2023 г. в Институте социально-гуманитарных наук ТюмГУ в очном и дистанционном форматах. Можно посетить оба трека или выбрать один из двух.Число мест для очных участников: 40. На площадке вас будут консультировать наши волонтеры.
Подключение онлайн будет осуществляться через Яндекс Телемост.
Расписание занятий (оба дня одинаковое):
1 урок 10:00-11:30
Кофе-брейк
2 урок 11:45-13:15
Обед
3 урок 15:00-16:30
Перерыв
4 урок 16:45-18:00
18:00-18:15 - обратная связь об интенсиве
Уровень сложности: начинающий.
При себе иметь:
- ноутбук, позволяющий wi-fi доступ в Интернет (можно будет подключиться к сети ТюмГУ);
- аккаунт Google либо предустановленный Jupyter Notebook или Anaconda;
- если вы будете работать в облачной среде программирования Google Colaboratory, то на ноутбуке должен быть браузер Google Chrome;
- очным участникам: паспорт или любой другой документ удостоверяющий личность.
NB! Регистрация до 24:00 2 ноября 2023 (включительно). Мы подтвердим ваше участие через электронную почту.
Занятия бесплатные. Если вы посетите 70% занятий и выполните проверочный тест после интенсива, то сможете получить удостоверение о прохождении образовательного курса (повышение квалификации). До Нового года студенты и сотрудники ТюмГУ могут оформить его бесплатно. Подробности вышлем по электронной почте после регистрации.
Регистрируемся тут! 🥳📋
#ниипетпроект
Интенсив по Питону и машинному обучению
Приглашаем вас на бесплатный интенсив по основам языка программирования Python (первый трек) и машинному обучению (второй трек). Занятия пройдут 4 и 5 ноября 2023 г. в Институте социально-гуманитарных наук ТюмГУ в очном и дистанционном форматах. Можно посетить оба трека или выбрать один из двух.Число мест для очных участников: 40. На площадке вас будут консультировать наши волонтеры.
Подключение онлайн будет осуществляться через Яндекс Телемост.
Расписание занятий (оба дня одинаковое):
1 урок 10:00-11:30
Кофе-брейк
2 урок 11:45-13:15
Обед
3 урок 15:00-16:30
Перерыв
4 урок 16:45-18:00
18:00-18:15 - обратная связь об интенсиве
Уровень сложности: начинающий.
При себе иметь:
- ноутбук, позволяющий wi-fi доступ в Интернет (можно будет подключиться к сети ТюмГУ);
- аккаунт Google либо предустановленный Jupyter Notebook или Anaconda;
- если вы будете работать в облачной среде программирования Google Colaboratory, то на ноутбуке должен быть браузер Google Chrome;
- очным участникам: паспорт или любой другой документ удостоверяющий личность.
NB! Регистрация до 24:00 2 ноября 2023 (включительно). Мы подтвердим ваше участие через электронную почту.
Занятия бесплатные. Если вы посетите 70% занятий и выполните проверочный тест после интенсива, то сможете получить удостоверение о прохождении образовательного курса (повышение квалификации). До Нового года студенты и сотрудники ТюмГУ могут оформить его бесплатно. Подробности вышлем по электронной почте после регистрации.
Регистрируемся тут! 🥳📋
#ниипетпроект
Google Docs
Интенсив по Питону и машинному обучению
Приглашаем вас на бесплатный интенсив по основам языка программирования Python (первый трек) и машинному обучению (второй трек). Занятия пройдут 4 и 5 ноября 2023 г. в Институте социально-гуманитарных наук ТюмГУ в очном и дистанционном форматах. Можно посетить…
❤7👍1
🤘Учимся уважать Python Django
Я люблю говаривать, что лучший на свете вводный тьюториал в Питон находится тут, на Джанго Гёрлз. Django Girls - это такая некоммерческая организация, которая вдохновляет девчонок по всему миру заниматься программированием. Девчонок в программировании и правда немного. Одно из последних масштабных исследований за 2022 год показало, что их 27.6%. Но их число растет.
А почему это вообще проблема? Девчонков и среди космонавтов меньшинство, зато в балете они доминируют. Проблема в том, что цифровые технологии проникают во все сферы жизни, массово меняя повседневные практики: от покупок в магазинах до оформления паспорта. Их за это еще называют сквозными. Так вот при разработке такой технологии, если разработчики будут представителями только одной какой-то узкой социальной группы, то они заложат в технологию так называемый bias (бАяс - ударение на А, “предвзятость”).
Как баяс возникает на практике? Создать систему, которая заменяет человека в экспертной работе, чаще всего можно множеством разных способов. Однобокий взгляд небольшой консолидированной во мнении группы, скорее всего, выберет именно такой подход, который максимально удобен и приятен другим представителям этой группы. Если задача более-менее однозначная, типа определить номер машины, то тут вряд ли баяс скажется. Но вот если вопрос стоит в том, чтобы дать человеку ипотеку или поставить оценку за сочинение на ЕГЭ (а цифра и сюда уже активно проникает), то избавление от баяса для всеобщего блага и процветания становится кардинально важным.
С появлением ИИ это стало еще более очевидно. Например, первые попытки выкатить большую генеративную языковую модель всем твиттерянам закончились тем, что модель начала отмачивать расистские и сексистские шутки. Microsoft (мелко-мягкие) потом долго извинялись. Django Girls - это одна из инициатив, которая пытается пробудить интерес к Питону через максимально понятные тьюториалы с примерами (на эту тему есть мемасик про Питон, скину дальше). Плюс они организуют events (ивенты, мероприятия). Вот 4 ноября будет workshop (воркшоп, мастерская) в Челябинске.
Почему гёрлз выбрали не просто Питон, а какое-то Джанго? Ну, вообще, выбрали и выбрали, захотелось так. Имеют право. Но тут есть и посыл: Django - это фреймворк для создания веб-сайтов и приложений. То есть вы не просто Питон поизучаете, но сможете быстро запустить собственный проект. Питон все больше используют именно для веб-технологий, потому что в нем много инструментов, которые out of the box (достал и тут же пользуешься) позволяют и запрос обработать, и аналитику собрать, и ИИ подключить.
А я напоминаю, что провожу собственный воркшоп по основам Питона и ИИ - тоже 4 и 5 ноября, прям как Джанго-девчонки. Скоро выкачу темы занятий. Рега туть.
#эссеиистика #girlpower
Я люблю говаривать, что лучший на свете вводный тьюториал в Питон находится тут, на Джанго Гёрлз. Django Girls - это такая некоммерческая организация, которая вдохновляет девчонок по всему миру заниматься программированием. Девчонок в программировании и правда немного. Одно из последних масштабных исследований за 2022 год показало, что их 27.6%. Но их число растет.
А почему это вообще проблема? Девчонков и среди космонавтов меньшинство, зато в балете они доминируют. Проблема в том, что цифровые технологии проникают во все сферы жизни, массово меняя повседневные практики: от покупок в магазинах до оформления паспорта. Их за это еще называют сквозными. Так вот при разработке такой технологии, если разработчики будут представителями только одной какой-то узкой социальной группы, то они заложат в технологию так называемый bias (бАяс - ударение на А, “предвзятость”).
Как баяс возникает на практике? Создать систему, которая заменяет человека в экспертной работе, чаще всего можно множеством разных способов. Однобокий взгляд небольшой консолидированной во мнении группы, скорее всего, выберет именно такой подход, который максимально удобен и приятен другим представителям этой группы. Если задача более-менее однозначная, типа определить номер машины, то тут вряд ли баяс скажется. Но вот если вопрос стоит в том, чтобы дать человеку ипотеку или поставить оценку за сочинение на ЕГЭ (а цифра и сюда уже активно проникает), то избавление от баяса для всеобщего блага и процветания становится кардинально важным.
С появлением ИИ это стало еще более очевидно. Например, первые попытки выкатить большую генеративную языковую модель всем твиттерянам закончились тем, что модель начала отмачивать расистские и сексистские шутки. Microsoft (мелко-мягкие) потом долго извинялись. Django Girls - это одна из инициатив, которая пытается пробудить интерес к Питону через максимально понятные тьюториалы с примерами (на эту тему есть мемасик про Питон, скину дальше). Плюс они организуют events (ивенты, мероприятия). Вот 4 ноября будет workshop (воркшоп, мастерская) в Челябинске.
Почему гёрлз выбрали не просто Питон, а какое-то Джанго? Ну, вообще, выбрали и выбрали, захотелось так. Имеют право. Но тут есть и посыл: Django - это фреймворк для создания веб-сайтов и приложений. То есть вы не просто Питон поизучаете, но сможете быстро запустить собственный проект. Питон все больше используют именно для веб-технологий, потому что в нем много инструментов, которые out of the box (достал и тут же пользуешься) позволяют и запрос обработать, и аналитику собрать, и ИИ подключить.
А я напоминаю, что провожу собственный воркшоп по основам Питона и ИИ - тоже 4 и 5 ноября, прям как Джанго-девчонки. Скоро выкачу темы занятий. Рега туть.
#эссеиистика #girlpower
Celential.ai
The Percentage of Female Software Engineers in 2023
Discover the percentage of female software engineers in the U.S, their career trajectories, and how big tech stacks up in gender inclusion efforts.
❤5
Дорогие подпИИсчики!
Я интенсивно готовлюсь к интенсиву по Python и искусственному интеллекту, поэтому пропустила пост на этой неделе. Постараюсь наверстать завтра.
А пока напоминаю вам, что у нас идет регистрация. И не просто напоминаю, а в кружочках! Спасибо Музейному комплексу Словцова, что дали посниматься с экспонатами. Выставки реально класс и атмосфера тоже 👍
Всех с приближающимся Хэллоуином! 🎃
Я интенсивно готовлюсь к интенсиву по Python и искусственному интеллекту, поэтому пропустила пост на этой неделе. Постараюсь наверстать завтра.
А пока напоминаю вам, что у нас идет регистрация. И не просто напоминаю, а в кружочках! Спасибо Музейному комплексу Словцова, что дали посниматься с экспонатами. Выставки реально класс и атмосфера тоже 👍
Всех с приближающимся Хэллоуином! 🎃
Google Docs
Интенсив по Питону и машинному обучению
Приглашаем вас на бесплатный интенсив по основам языка программирования Python (первый трек) и машинному обучению (второй трек). Занятия пройдут 4 и 5 ноября 2023 г. в Институте социально-гуманитарных наук ТюмГУ в очном и дистанционном форматах. Можно посетить…
❤2
This media is not supported in your browser
VIEW IN TELEGRAM
❤2❤🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
❤🔥2❤2
This media is not supported in your browser
VIEW IN TELEGRAM
❤2❤🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
❤2❤🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
❤2❤🔥1👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
❤2❤🔥1🔥1🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
❤2❤🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
❤2❤🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
👍2❤🔥1😁1
Я там наобещала в кружочках, что будет ссылка на регистрацию в следующем сообщении. Придется сдержать слово. И вот опять она: ссылка на регистрацию. 💫
Google Docs
Интенсив по Питону и машинному обучению
Приглашаем вас на бесплатный интенсив по основам языка программирования Python (первый трек) и машинному обучению (второй трек). Занятия пройдут 4 и 5 ноября 2023 г. в Институте социально-гуманитарных наук и Институте математики и компьютерных наук ТюмГУ…
👍1
Как оценить эффективность ИИ
Восстанавливаю пропуски за прошлую неделю 😉 Этот пост планировался к выходу в четверг.
Я часто пишу, что ИИ нужен, чтобы решить задачу экспертно, заменить человека на рабочем месте и быть не менее (ну или хотя бы не сильно менее) эффективным, чем человек-эксперт. Но как понять, что замена состоялась? Для оценки эффективности ИИ применяются разные метрики.
Разработка метрик сама по себе является отдельной областью науки. Более того, если вам не о чем писать статью, создайте собственную метрику под какую-нибудь нетривиальную экспертную задачу. И назовите ее своим именем! Можно с приставкой, которая подчеркнет вашу выдающность. Как, например, “альфа Криппендорфа”. Или “коллерряция” Спирмана (это тоже метрика, кстати). Какие еще бывают названия: b-cubed, Bleu, glue, METEOR, mae, RMSE, hgkdsv* (шутка, последнего набора букв нет среди метрик). Метрики обычно привязаны к определенному классу задач: оценка согласованности экспертов, машинный перевод, кластеризация с золотым стандартом, точность выявления отрезка текста или группы пикселей на изображении. Но среди всего этого буйства есть четыре выдающиеся метрики, которые в разных видах применяются чаще остальных: precision (пресИжн, точность), recall (рикОл, полнота), f-score (эфскОр, эф-мера), accuracy (Экьюраси, акУраси - так ее никто и не перевел нормально на русский).
Я очень люблю пример с Википедии про кошек и собак для демонстрации этих метрик. Вот у нас на фото 10 кошек и 12 собаков. Программа нашла 8 собаков. При этом из них 5 - это реально собаки, а 3 - кошки (ошибочка вышла). Пусть наш ИИ-классификатор разработан с целью определять класс “собаки” (именно их против всех остальных животных, не обязательно котиков):
☝ Precision = ⅝, то есть из восьми объектов, идентифицированных как собаки, 5 реально собаки.
✌ Recall = 5/12, то есть из 12 реальных собак на фото 5 реально собаки.
Чем ближе precision и recall к 1, тем лучше. Но тут есть две проблемы:
1⃣ если только одно животное было идентифицировано как собака и при этом это реально собака, то precision = 1
2⃣ если все животные будут идентифицированы как собаки, то recall = 1
Да и непонятно, зачем нам две разные цифры. Чтобы их сбалансировать и уменьшить негативные последствия указанных выше проблем, используется f-мера - среднее гармоническое между precision и recall. Если число объектов в классах примерно одинаково (примерно поровну собак и кошек), то можно применить accuracy: в числителе - все правильно определенные собаки и кошки, в знаменателе общее количество объектов на фото (т.е. собак и кошек).
Надеюсь, что и вы, уважаемые читатели, однажды изобретете метрику и назовете ее своим любимым именем.❤️
#база
Восстанавливаю пропуски за прошлую неделю 😉 Этот пост планировался к выходу в четверг.
Я часто пишу, что ИИ нужен, чтобы решить задачу экспертно, заменить человека на рабочем месте и быть не менее (ну или хотя бы не сильно менее) эффективным, чем человек-эксперт. Но как понять, что замена состоялась? Для оценки эффективности ИИ применяются разные метрики.
Разработка метрик сама по себе является отдельной областью науки. Более того, если вам не о чем писать статью, создайте собственную метрику под какую-нибудь нетривиальную экспертную задачу. И назовите ее своим именем! Можно с приставкой, которая подчеркнет вашу выдающность. Как, например, “альфа Криппендорфа”. Или “коллерряция” Спирмана (это тоже метрика, кстати). Какие еще бывают названия: b-cubed, Bleu, glue, METEOR, mae, RMSE, hgkdsv* (шутка, последнего набора букв нет среди метрик). Метрики обычно привязаны к определенному классу задач: оценка согласованности экспертов, машинный перевод, кластеризация с золотым стандартом, точность выявления отрезка текста или группы пикселей на изображении. Но среди всего этого буйства есть четыре выдающиеся метрики, которые в разных видах применяются чаще остальных: precision (пресИжн, точность), recall (рикОл, полнота), f-score (эфскОр, эф-мера), accuracy (Экьюраси, акУраси - так ее никто и не перевел нормально на русский).
Я очень люблю пример с Википедии про кошек и собак для демонстрации этих метрик. Вот у нас на фото 10 кошек и 12 собаков. Программа нашла 8 собаков. При этом из них 5 - это реально собаки, а 3 - кошки (ошибочка вышла). Пусть наш ИИ-классификатор разработан с целью определять класс “собаки” (именно их против всех остальных животных, не обязательно котиков):
☝ Precision = ⅝, то есть из восьми объектов, идентифицированных как собаки, 5 реально собаки.
✌ Recall = 5/12, то есть из 12 реальных собак на фото 5 реально собаки.
Чем ближе precision и recall к 1, тем лучше. Но тут есть две проблемы:
1⃣ если только одно животное было идентифицировано как собака и при этом это реально собака, то precision = 1
2⃣ если все животные будут идентифицированы как собаки, то recall = 1
Да и непонятно, зачем нам две разные цифры. Чтобы их сбалансировать и уменьшить негативные последствия указанных выше проблем, используется f-мера - среднее гармоническое между precision и recall. Если число объектов в классах примерно одинаково (примерно поровну собак и кошек), то можно применить accuracy: в числителе - все правильно определенные собаки и кошки, в знаменателе общее количество объектов на фото (т.е. собак и кошек).
Надеюсь, что и вы, уважаемые читатели, однажды изобретете метрику и назовете ее своим любимым именем.❤️
#база
👍2
И еще нам тут поступил вопрос по интенсиву: а что такое машинное обучение? в чем отличие от искусственного интеллекта?
Машобуч (машинное обучение) - это часть ИИ, которая решает экспертную задачу, обучаясь на размеченном наборе данных. Вот в примере с кошками и собаками выше изображения были размечены: на них стояли метки - "кошка", "собака". Как линейная регрессия с ирисами - алгоритм берет много таких размеченных данных и выучивает, какие у них бывают типичные признаки. А потом ему можно давать неразмеченные данные - для автоматической разметки.
#база
Машобуч (машинное обучение) - это часть ИИ, которая решает экспертную задачу, обучаясь на размеченном наборе данных. Вот в примере с кошками и собаками выше изображения были размечены: на них стояли метки - "кошка", "собака". Как линейная регрессия с ирисами - алгоритм берет много таких размеченных данных и выучивает, какие у них бывают типичные признаки. А потом ему можно давать неразмеченные данные - для автоматической разметки.
#база
