Современное курсостроение
2.78K subscribers
566 photos
53 videos
1 file
565 links
Про образование, нейросетки и онлайн-курсы. Авторский блог Якова Сомова, основателя Лекториума и методиста школы 239.
Интенсивы по нейросеткам https://project.lektorium.tv/nn-for-work
Услуги издательства https://project.lektorium.tv/production
Download Telegram
Forwarded from Лекториум
Вы знаете, что Говард Лавкрафт был известен своей нелюбовью к современному миру и культуре? Он не интересовался новыми технологиями своего времени, относился с недоверием к таким изобретениям, как радио и телевидение. Лавкрафт предпочитал прежние времена и описывал их с особым восхищением и ностальгией. Именно поэтому в своих произведениях он создавал атмосферу старинного мистического прошлого.

Про миры Лавкрафта и про то, какое отражение они нашли в современной культуре, курс «Базовый Ктулху» в рамках летнего фестиваля курсов на Лекториуме.

🕓 На все курсы летнего фестиваля сейчас действует акция. Чем раньше вы покупаете курс, тем дешевле. До 25 июня действует скидка 20 %!

Узнать больше о Ктулху
6👍3
Показывал сегодня на интенсиве по нейросеткам разницу между "весёлой и мрачной империей" для миджорней.
🔥28😁102👍2
Технический текст про определение текстов, сгенерированных нейросеткой. Не всё понял, но очень интересно
В честь 3000 подписчиков расскажу про наш новый препринт, в котором тексты, сгенерированные ChatGPT, детектируются с помощью анализа их внутренней размерности:

https://arxiv.org/abs/2306.04723

Итак, здесь мои коллеги и я продолжили заниматься полюбившейся с 2021 года темой - детекцией сгенерированного контента. Особое внимание, конечно, уделили детекции текста, сгенерированного моделями семейства GPT-3.5 (davinci, chatgpt). А делали мы это с помощью такой интересной штуки, как дробная размерность. Первое знакомство с ней можно осуществить, посмотрев видео 3blue1brown: https://www.youtube.com/watch?v=gB9n2gHsHN4 (рассказ про размерность начинается со второй половины видео).
Хоть введенная в видео размерность и называется "фрактальной", на деле можно получать приближенные оценки такой размерности не только для фракталов, но и просто для облаков точек, если формы облаков достаточно сложные. И вот возник вопрос: а почему бы не построить облако точек по тексту на естественном языке и не посмотреть, какой будет его размерность?

Далее последовательность действий была такая:
1) Брался достаточно длинный текст (написанный человеком либо сгенерированный ChatGPT/другой моделью) с большим количеством токенов;
2) Текст подавался на вход модели RoBERTa;
3) С последнего слоя RoBERTы извлекались эмбеддинги каждого токена текста;
4) Эти эмбеддинги рассматривались как точки в многомерном пространстве - получалось облако точек;
5) С помощью нескольких довольно технически сложных процедур ( вдохновленных https://arxiv.org/abs/1808.01079 ) оценивалась дробная размерность этого облака точек.

Таким образом, каждому тексту сопоставлялось число - эта самая размерность. И - о чудо! - оказывалось, что средняя размерность текстов, сгенерированных с помощью GPT-3.5 (ChatGPT или davinci), была в среднем существенно меньше, чем размерность текстов, написанных человеком. Эта средняя размерность практически не менялась при смене домена и при замене GPT-3.5 на large GPT-2 или OPT (со стандартными параметрами генерации); даже при применении парафразера DIPPER, специально созданного для избегания детекции, размерность менялась не сильно - в среднем примерно на 3%. Благодаря этому нам удалось сделать пороговый детектор по этой размерности, неожиданно устойчивый к атакам.
Теперь любители генерировать тексты могут менять промпты, тематику или даже модель, но наш детектор не проведешь! 😈

При смене домена и модели точность детекции (true positive) по один раз зафиксированному порогу не опускалась ниже 75% при условии, что false positive rate (FPR) оставался не более 1%. При применении DIPPER к генерации GPT-3.5 точность падала до 40%, снова при FPR 1%. Но даже этот результат оказался лучше всех остальных существующих детекторов - в том числе, и от самих OpenAI. 🫡
(Пояснение: мы зафиксировали низкий FPR потому что хотели как можно меньше дискриминировать настоящих людей при детекции).

Кроме прочего, при использовании мультиязычной RoBERTы можно было получать аналогичный детектор не только для английского, но и для других языков. Средняя внутренняя размерность эмбеддингов, соответствующих текстам на других языках, менялась от языка к языку, но размерность искусственных текстов все равно оставалась в среднем ниже, чем человеческих, для каждого конкретного языка по отдельности.

Главной же слабостью нашего детектора является неустойчивость к большим температурам генерации и к примитивным генераторным моделям. У генераторов с высокой температурой (так сказать, бредящих) внутренняя размерность текстов может быть и выше человеческой, поэтому на них этот детектор сломается. С другой стороны, такие генераторы и так детектятся другими методами. Также остается открытым вопрос, является ли RoBERTa оптимальным средством для извлечения эмбеддингов текстов, ведь их можно получать и с помощью других моделей тоже.

#объяснения_статей
3👍1
Если кто-то завтра в Питере захочет пересечься - приходите на Форум Труда. Правда обещают грозы, ливень и кошмар. ))

***

В рамках Молодежного карьерного форума в эту пятницу состоится Дискуссионный клуб выпускников СПбГУ «на выезде» в новом формате научного стендапа. Поговорим о нескучной карьере в науке и образовании.

Выпускники СПбГУ расскажут об интересных научных направлениях и ответят на вопрос, почему наука сегодня – это интересно и перспективно. После выступлений спикеры обсудят карьерные стратегии в сфере науки и образования.

Участники:
🔷Камилла Нигматуллина, профессор, заведующий кафедрой цифровых медиакоммуникаций СПбГУ с темой «Как написать докторскую, если ты гуманитарий»;
🔷Денис Байгозин, химик-разработчик, преподаватель-методист blogximika.ru с темой «Эта ваша моногамия устарела: как я попробовал 10 карьер в химии и выбрал... 7 из них разом»;
🔷Полина Лобанова, доцент кафедры океанологии, руководитель магистерской программы «Физическая океанография и биопродуктивность океанов и морей (ФОБОС)» с темой «Тайны глубин океана: что знают океанологи»;
🔷 Яков Сомов, основатель Лекториума, руководитель центра онлайн-образования Президентского ФМЛ № 239;
🔷 Кирилл Дорожкин, Эксперт ЦТРР СПбГУ с темой «Как построить лабораторию по исследованию дополненой и виртуальной реальности и причём тут блокчейн».

📅 23 июня в 14:40
📍Культурный квартал Брусницын, Кожевенная линия., 30.
💥Вход на форум свободный
👍7🔥3
Вот у рутрекера есть специальная кнопочка (расширение для браузера chrome). И если на этот сайт пойти, то он открывается без всякого VPN. Видимо, это прокси тоннель, но я не уверен.

Вопрос к знатокам. А есть ещё подобное расширение, которое работает на конкретный сайт? Мне нужно раздать доступы к ChatGPT нескольким десяткам учителей и не хочется мучать их включением/выключением VPN. Хочется простой инструкции.
Интересное исследование о том, как тратят деньги и проводят досуг человеки с 14 до 24. https://mir-young.rbc.ru
👍5
Один из самых моих любимых проектов. Мы сделали невероятный трейлер тогда к этому курсу. Посмотрите по ссылке.

Кстати, на курсе по астрофизике только на Лекториуме более 10 000 слушателей. А ведь на Курсере и Открытом образовании он тоже собрал немалую аудиторию!

Нил Деграсс Тайсон говорил, что если вы встретили астрофизика - надо задать ему ВСЕ ВОПРОСЫ. Так как это шанс на миллион. Всего астрофизиков около 6000 в мире )
🔥6👍3
Forwarded from Лекториум
This media is not supported in your browser
VIEW IN TELEGRAM
«Астрофизика: От звезд до границ Вселенной»: приглашаем на бесплатный онлайн-курс

В курсе вы познакомитесь с работой специалистов астрофизики высоких энергий и нейтринной астрономии и разберетесь, зачем люди изучают вспышки сверхновых, ускорение заряженных частиц на космических ударных волнах и высокоэнергетические нейтрино. А главы, посвященные теоретической и наблюдательной космологии, объяснят, как эта наука отвечает на вопросы о рождении Вселенной и динамике.

Организатор: Санкт-Петербургский политехнический университет Петра Великого
🔥4
Я плохо учился в университете, прогуливал пары и бездумно списывал. Это было чудесное, пьяное и веселое время. В результате за плохую успеваемость меня и отчислили. Это было правильно: я точно был не на своем месте и никогда не стал бы хорошим физиком.

Потом мне невероятно повезло стать одним из основателей Лекториума, с помощью которого можно посмотреть, как и чему учат в разных вузах, и подойти к выбору более осознанно.

Сегодня нашему проекту исполняется 14 лет. И я уверен, что это только начало большого пути. Лекториум соткан из кропотливого труда, тонких договоренностей, случайных встреч, споров и мечтаний сотен человек.

Благодарю всех, кто когда-либо работал в Лекториуме или продолжает развивать его сейчас. Спасибо нашим партнерам, которые доверили нам свои курсы, лекции и сложнейшие проекты.Спасибо вам — нашим читателям! Именно вы придаете смысл нашей работе.

Если вы захотите поделиться впечатлениями, передать нам весточку или поругать — нажмите на эту ссылку. Обещаю все лично прочитать и показать команде.

https://forms.yandex.ru/u/649d7635c417f31f2713c587/
22👍7🔥4🎉4🥰3
Мой любимый stepic прислал сегодня в рассылке (у них письма строго по делу, никакой графомании, в отличие от моей) ссылку на гайд «Как написать продающее описание курса с помощью Chat GPT». Неплохо. https://stepik.org/media/attachments/lesson/1027599/Продающее_описание_Stepik.pdf
6👍2
"Давай два слова тоже скажу про ChatGPT и бакалавриат. Мы совсем недавно проводили вступительные испытания, состоящие из математических задач и задач на программирование (на codeforces). Математические задачки нам пришлось подобрать так, чтобы ChatGPT их решал неправильно. Такие всё ещё есть, хоть ChatGPT и решает и всё больше задач, и сложные тоже решает.

Задачи на программирование (где нужно написать код, который много скрытых тестов в проверяющей системы проходит) ChatGPT не решил совсем — не проходили даже открытые тесты.

Поступающие при решении наших задач ChatGPT использовали и это было хорошо видно: сам код не работает, зато даже к простейшим функциям написаны аккуратные четырёхстрочные комментарии. Это про вступительные испытания и борьбу со списыванием.

В учебном процессе мы будем использовать ChatGPT, но на разных курсах по-разному. В курс по дискретной математике я хочу вживить много доказательств математических утверждений, написанных ChatGPT, и просить студентов отличать правильное доказательство от неправильного (этот навык и раньше был необходим, а ChatGPT его необходимость увеличил)."

Это написал во внутреннем чатике 239 Александр Куликов. Публикую с его разрешения.

Напомню, что он запустил CSCenter и CSClub. Это проекты, которые сильно помогли развитию айтирынка в России. Ну а мы записывали там лекции, они все бесплатно лежат на ютубчике и в сети.
14👍10
В Бюро Горбунова интересно и правильно оформлены сертификаты для выпускников программ. Есть подробности, прямая ссылка на сайте и даже подпись. https://bureau.ru/school/editors/diploma/15/nadezhda-gikalyuk/
🔥102
Forwarded from TechSparks
Выпустили отчет Всемирного экономического форума о десятке перспективных технологий 2023. Что там есть генеративный ИИ — очевидно; интересней, что там есть еще, ибо технологии там оцениваются комплексно по степени влияния на жизнь и планету, а не только по объемам рынков.
Некоторые — интересны уже тем, что особо не на слуху, то есть этот список — отнюдь не подборка хайповых тем.

1. Гибкие аккумуляторы
2. Генеративный ИИ
3. Устойчивое (в экологическом смысле) авиационное топливо
4. Дизайн и инженерия искусственных вирусов
5. Метаверс для психического здоровья
6. Носимые датчики для растений (как раз иллюстрация для поста :))
7. Мэппинг биологических процессов на молекулярном уровне
8. Гибкая нейроэлектроника
9. Устойчивые вычисления (оно же - нейтральные с точки зрения углеродного следа датацентры)
10. ИИ в здравоохранении

Прикольно, что про примерно половину тем читать надо в специализированной прессе; в поле зрения традиционного технологического научпопа они не попадают. Что немало говорит про уровень этого самого научпопа.

https://www3.weforum.org/docs/WEF_Top_10_Emerging_Technologies_of_2023.pdf
👍5
Какова красота!
Forwarded from 40D
Taблицa для пpoвepки зрения, CШA, 1907 гoд. Красиво.
14👍11