Алексей Хохлов
8.08K subscribers
2 photos
2 files
710 links
Блог академика А.Р.Хохлова о событиях, важных для российской науки и образования
Download Telegram
На прошедшей неделе в журнале Nature опубликована заметка о научной статье, которую чат-бот ChatGPT сгенерировал менее, чем за час:

https://www.nature.com/articles/d41586-023-02218-z

Подробное изложение этой заметки на русском языке можно посмотреть здесь:

https://hightech.plus/2023/07/07/chatgpt-za-chas-napisal-nauchnuyu-statyu-s-nulya

Забавный результат, но на сенсацию отнюдь не тянет. Грубо говоря, ChatGPT проанализировал большой объем размещенных в интернете данных и пришел к «совершенно неожиданному» выводу, что физическая активность и диета снижают риск возникновения диабета. Затем все это было «упаковано» в виде текста, написанного по всем правилам научной статьи.

Получившуюся статью трудно отличить от обычной, написанной ученым. Но сами же авторы отмечают, что не может быть полного доверия сгенерированному чат-ботом тексту. Его цель – получить статью, максимально похожую на «настоящую» и в угоду убедительности формулируемых выводов он может неточно передавать факты или даже измышлять их. Так что польза чат-ботов для ученых весьма ограничена, а вот «научным жуликам» они предоставляют простор для фальсификаций.

В целом, период стремительного взлета популярности ChatGPT заканчивается. В июне зафиксировано первое с момента запуска этого чат-бота снижение трафика:

https://dsmedia.pro/analytics/chatgpt-pokazyvaet-pervoe-s-momenta-zapuska-snizhenie-trafika

Думаю, что основная причина в том, что многие стали понимать ограниченность предлагаемого подхода. В частности, для создания «эффективных помощников» ученых нужны другие инструменты искусственного интеллекта – возможно менее универсальные, но нацеленные на решение задач, специфических для данной области науки. Создание таких инструментов – дело ближайшего будущего.
Председателем Совета Российского центра научной информации вместо академика В.Я.Панченко назначен член-корреспондент РАН В.В.Квардаков.

http://publication.pravo.gov.ru/document/0001202307100074
Загрязнение водных сред пластиковыми отходами (в частности – микропластиком) сейчас находится в центре всеобщего внимания. Проблема действительно серьезная, хотя с моей точки зрения в некоторых предлагаемых подходах к ее решению модного «хайпа» больше, чем собственно науки. Тем более надо приветствовать попытки серьезных научных исследований в этой области.

Вчера в журнале Nature опубликована статья коллектива авторов (среди которых два сотрудника географического факультета МГУ), в которой проводится всестороннее исследование содержания мелких частиц пластика (размером свыше 250 микрон) в различных озерах и водохранилищах, расположенных по всему миру (в России было исследовано Можайское водохранилище).

Было обнаружено очень существенное загрязнение исследованных водных сред, которое часто превышает таковое для «мусорных островов» в мировом океане. А ведь это резервуары пресной воды.

Большая часть полученных результатов интуитивно понятна, но хорошо, что исследование было проведено систематически, с использованием различных научных методик. Тем самым было еще раз привлечено внимание к тому, что проблема пластикового загрязнения очень важна для озер и водохранилищ.

С учетом обилия озер и водохранилищ в России это еще раз подчеркивает необходимость разработки российской программы научных исследований по проблеме пластикового загрязнения водных сред (особенно – пресноводных).

Статью в журнале Nature можно прочитать здесь:

https://www.nature.com/articles/s41586-023-06168-4

а ее изложение на русском языке здесь:

https://www.msu.ru/science/main_themes/uchenye-mgu-vyyasnili-chto-ozera-stradayut-ot-zagryazneniya-plastikom-silnee-okeana.html
С учетом чрезвычайно быстрого роста интереса к проблеме загрязнения планеты пластиковыми отходами, в частности – микропластиком, мы с коллегами решили, не откладывая в долгий ящик, провести 1-ую Всероссийскую конференцию «Микропластик в науке о полимерах» уже в октябре этого года в Великом Новгороде. Думаю, что участников конференции ждут интересные обсуждения.

Первый циркуляр конференции приведен ниже. Дедлайн подачи тезисов докладов – 15 сентября.

https://disk.yandex.ru/i/h2QdHVtP77jiQw
Позавчера в журнале Science опубликована интересная заметка о том, что некоторые научные фонды (в частности, National Institute of Health в США) начинают запрещать рецензентам использовать инструменты искусственного интеллекта (ИИ) типа ChatGPT для написания отзывов на заявки по грантам.

Соблазн действительно велик. Ученому интересно заниматься своими собственными исследованиями, и он рецензирует чужие заявки на гранты «скрипя зубами», понимая, что это полезная деятельность, «service for the scientific community». Соответственно, возникает естественное желание минимизировать свои временные затраты за счет использования инструментов ИИ.

На мой взгляд, основная проблема такого метода в том, что имеющиеся на сегодняшний день инструменты ИИ не способны на оригинальность мышления, поэтому они не могут оценить оригинальную научную идею. Более того, они напишут положительную или отрицательную рецензию в соответствии со сформулированным заданием.

Здесь я отсылаю читателя к материалу «Диалог с KoboldGPT» из моего поста от 19 мая, где ИИ с легкостью написал положительную и отрицательную рецензии на один и тот же текст. Эти рецензии были полны общих рассуждений и не содержали каких-либо оригинальных мыслей.

К счастью, ученые обычно обладают и «естественным интеллектом», поэтому они, как правило, легко распознают научные тексты, написанные ИИ. Об этом говорится и в заметке от Science – там описывается прецедент с жалобой в один из австралийских научных фондов о том, что полученные из фонда рецензии написаны ChatGPT.

Но обычно ученые не любят быть втянутыми в разбирательство собственных жалоб, так что проблема действительно серьезная. Особенно с учетом того, что инструменты ИИ имеют тенденцию выдавать недостоверную информацию (попросту врать) в угоду сформулированному техническому заданию.

https://www.science.org/content/article/science-funding-agencies-say-no-using-ai-peer-review
П.Г.Арефьев из Научной электронной библиотеки (РИНЦ, elibrary) провел всесторонний анализ динамики библиометрических показателей российских научных журналов в 2022 году по сравнению с предыдущим годом по базе данных Journal Citation Reports (JCR, аналитическое приложение Web of Science). Приведу здесь лишь некоторые интересные данные.

Всего в JCR индексируется 160 российских научных журналов. Общее число цитирований на статьи в этих журналах по результатам JCR 2022 года снизилось на 7%. При этом 120 журналов ухудшили свои показатели, а 40 журналов – улучшили. Имеет смысл отметить, что в JCR 2022 учитывались цитирования 2020 и 2021 «ковидных» годов.

Тройка лидеров по росту цитируемости: Light & Engineering (39%), Physics of Wave Phenomena (28%), Mechanics of Solids (24%). Тройка отстающих: Journal of Evolutional Biochemistry and Physiology (-70%), Voprosy Psikhologii (-41%), Comparative Cytogenetics (-35%).

В первом квартиле остался всего один российский журнал Russian Chemical Reviews (Успехи химии), по результатам JCR 2021 года там был еще Russian Mathematical Surveys (Успехи математических наук), но сейчас он перешел во второй квартиль. Во втором квартиле теперь 5 российских журналов (в 2021 году было 6), в третьем квартиле – 28 журналов (было 26), в четвертом квартиле 134 журнала (было 136).

В целом, по итогам JCR 2022 наблюдается некоторое не очень значительное снижение числа цитирований статей в российских научных журналах. В анализе П.Г.Арефьева содержится еще много важной библиометрической информации о состоянии российских научных журналов, а также сформулированы предложения, направленные на улучшение ситуации. Надеюсь, что этот анализ будет вскоре опубликован.
Новое впечатляющее расследование телеграм-канала КРИНЖ: 158 миллионов госбюджетных рублей на исследования по «генетической музыке». Вслед за классиком хочется воскликнуть: «О, сколько нам открытий чудных готовит ЕГИСУ НИОКТР»!

https://telegra.ph/MINOBR-i-IMASH-RAN-158-millionov-na-lzhenauchnye-goszadaniya-07-17
Коллеги подтверждают эффект, который описан в данной публикации – ChatGPT-4 сильно поглупел. Интересно, с чем это связано – случайное неудачное обновление, намеренное «оглупление» или эффект общения с большим числом не блещущих интеллектом пользователей.

https://www.ixbt.com/news/2023/07/19/chatgpt-gpt-4.html

В любом случае, хочется процитировать первую фразу этой публикации:

Похоже, страх того, что ChatGPT «захватит мир и лишит всех людей работы», можно как минимум временно считать неактуальным.

Ниже также приводится ссылка на оригинальную публикацию в arXiv ученых из Стэнфордского университета и университета Беркли:

https://arxiv.org/pdf/2307.09009.pdf
Мне понравилась сегодняшняя заметка на сайте block-chain24 о причинах снижения со временем производительности чат-ботов типа ChatGPT:

https://www.block-chain24.com/articles/snizhenie-proizvoditelnosti-chat-botov-problemy-s-dannymi-ugrozhayut-budushchemu

Грубо говоря, ее авторы считают, что из трех упомянутых в моем предыдущем посте причин широко обсуждаемого в последние дни «оглупления» ChatGPT главной является третья причина: «эффект общения с большим числом не блещущих интеллектом пользователей».

Приведу здесь ключевой фрагмент заметки, где говорится об «отравлении данными»:

Если качество обучающих данных ухудшается, то ухудшаются и выходные данные. Это создает проблему для динамичных чат-ботов, которые постоянно получают доступ к контенту, скопированному из Интернета. Отравление данными может привести к снижению производительности чат-ботов.

А также основной вывод, который важен и для перспектив использования инструментов искусственного интеллекта в научной работе:

Для предотвращения снижения производительности чат-ботов необходим надежный контент. В дальнейшем надежные источники контента будут приобретать все большее значение для защиты от негативного воздействия низкокачественных данных.
Сегодня состоялось экстренное заседание Ученого совета Института проблем передачи информации (ИППИ) РАН в связи с полученным из Минобрнауки письмом о достаточно внезапном прекращении полномочий директора института А.Н.Соболевского. В связи с этим Ученый совет ИППИ РАН принял обращение к Минобрнауки России , которое размещено на официальном сайте института:

http://iitp.ru/ru/news/2924.htm

Институт проблем передачи информации – один из лучших институтов РАН, а профессор РАН А.Н.Соболевский, по мнению большинства сотрудников – успешный директор этого института, которым он руководил 7 лет. Так что можно понять недоумение членов Ученого совета.
Коллеги прислали примечательное распоряжение Президента РАН о проведении Всемирного конгресса «Теория систем, алгебраическая биология, искусственный интеллект: математические основы и приложения», которое поражает задействованными именами среди организаторов:

https://disk.yandex.ru/i/C2cszHTp-TEybA

Судя по веб-сайту РАН, это мероприятие действительно состоялось в конце июня:

https://new.ras.ru/activities/news/mezhdistsiplinarnye-aspekty-iskusstvennogo-intellekta/

Тут настораживает не только напыщенное наименование мероприятия «всемирный конгресс», но и непривычный термин «алгебраическая биология» в названии. В приложении 6 к распоряжению Президента РАН этот термин расшифровывается так:

Алгебраическая биология - новая строго математическая наука, анализирующая геном (и свойства биомолекул, в том числе, на основе категорной теории систем) для прогнозирования («вычисления») свойств организмов, развивающихся из генома. В основе алгебраической биологии лежит матричная генетика, открытая доктором физико-математических наук Петуховым С.В. и развитая им и его коллегами. Безусловно алгебраическая биология является одним из математизированных разделов биологии и нейробиологии, имеет практические выходы на моделирование интеллектуальных свойств биообъектов, то есть выходы на искусственный интеллект. Подобно алгебраической геометрии, алгебраическая биология является чётко очерченной наукой со своим предметом и методами (алгебры, моноидальных категорий и т.п.), в отличие от бытующего понятия «математической биологии», представляющей довольно эклектичный набор математических приёмов, оказавшихся полезными для отдельных вопросов в биологии. Таким образом, Конгресс служит продвижению новых перспективных направлений, формированию их понятийного аппарата и терминологии, в частности, алгебраической биологии.

Данный текст можно даже не комментировать, все и так ясно. Коллеги обратили мое внимание, что упомянутый в данном фрагменте С.В.Петухов фигурировал в недавней публикации телеграмм-канала КРИНЖ о «генетической музыке» (см. мой недавний пост здесь от 19 июля).

Отмечу также, что как следует из приложения 4 к распоряжению Президента РАН Отделение биологических наук не согласовало свое участие в организации и проведении данного конгресса, часть тематики которого касается «алгебраической биологии» (так же, как и Отделение физических наук и Отделение химии и наук о материалах).

Мне все же кажется, что руководство РАН должно более внимательно относиться к тематике научных форумов, которые проводятся под эгидой РАН.
Я ознакомился с разработанным Сбером продуктом GigaChat в конце апреля. Уже тогда он включал основные функции, реализованные в ChatGPT и, в дополнение к этому, позволял создавать изображения в диалоговом режиме. С другой стороны, продукт еще требовал определенной «доводки», которая, насколько мне известно, интенсивно осуществлялась в последние три месяца.

Одним из интересных шагов в ходе этой «доводки» стал объявленный открытый конкурс вузовских команд, которым будет предоставлена возможность участвовать в дообучении и донастройке нейросетевых моделй, на базе которых работает GigaChat. Вчера были объявлены победители этого конкурса:

https://www.sberbank.ru/ru/sberpress/all/article?newsID=5a753367-bc8b-4444-a508-f0e96f0c142f&blockID=1303&regionID=77&lang=ru&type=NEWS

Можно надеяться, что участие этих команд в доработке продукта GigaChat будет эффективным. Прежде всего, это касается надежного обеспечения точности информации, выдаваемой данным инструментом искусственного интеллекта (ИИ). В частности, необходимо найти пути противодействия эффекту «оглупления» ИИ с течением времени, который наблюдается у чат-бота ChatGPT (см.выше посты от 20 и 23 июля). Говоря простым языком, надо минимизировать возможности получать на выходе как неверную информацию, так и бессодержательную «болтовню» из общих слов.
В газете «Коммерсант» опубликована заметка с дополнительными подробностями событий, происходящих вокруг неожиданно запущенного процесса смены директора Института проблем передачи информации РАН (начало истории см.выше в посте от 24 июля). Судя по комментарию Минобрнауки, все указывает на то, что инициаторов данного процесса следует искать в бюро Отделения нанотехнологий и информационных технологий РАН.

https://www.kommersant.ru/doc/6125604
Еще в одном институте РАН первой категории – Научно-технологическом центре уникального приборостроения РАН в эти дни происходит смена директора по схеме, описанной в предыдущем посте. Об этом сообщает telegram-канал Русский research:

https://t.me/trueresearch/1703
Продолжаются попытки разработать оптимальную модель российского высшего образования в текущих условиях. Этой теме было посвящено недавнее выступление министра В.Н.Фалькова в Госдуме, которое обсуждается в заметке, опубликованной в «Независимой газете». Автор заметки фактически признает, что цельной картины пока не складывается.

https://www.ng.ru/education/2023-07-26/16_8783_education.html

На мой взгляд, основная проблема предлагаемой модели связана с тем, что понятие «базовое высшее образование» предполагается применять как к тем студентам, которые обучались шесть лет (по-старому к выпускникам специалитета), так и к тем, кто обучался всего четыре года (по-старому к бакалаврам). И те, и другие получат диплом одинакового образца.

Диплом – это документ, который сопровождает человека всю жизнь. Через тридцать лет события 2023 года будут казаться «преданиями старины глубокой», так что выпускникам, скажем, физтеха 2030 года возможно придется объяснять, почему за шесть лет обучения они получили лишь «базовое», а не полноценное высшее образование.

В заметке говорится, что для технических вузов магистратура представляется «лишним звеном», они хотят «обновленного» специалитета. Это так и для большинства естественнонаучных специальностей, и тем более - для медицинских. Так, может быть, не стоит упрямиться, и для этих специальностей вернуться к шестилетнему специалитету (который возможно имеет смысл назвать «интегрированная магистратура»)?

А для другой группы специальностей (прежде всего – социогуманитарных, и, возможно, IT) оставить предлагаемую модель с «базовым» высшим образованием и «специализированным» (то есть с двухлетней магистратурой после базового высшего).
На веб-сайте Института проблем передачи информации РАН размещена любопытная информация об истории отношений этого института с РАН. Там же можно посмотреть и полную хронологию с 1989 года, которая показывает, что эти отношения всегда были непростыми:

http://iitp.ru/ru/news/2927.htm

Биографию члена-корреспондента РАН Максима Валерьевича Федорова, вице-президента Сколтеха и затем короткое время ректора университета «Сириус», который предлагается на замену А.Н.Соболевскому, можно посмотреть, например, по Википедии.
Сегодня состоялась конференция научных работников Института проблем передачи информации РАН. Резолюция конференции размещена на веб-сайте института:

http://iitp.ru/ru/news/2928.htm
Минобрнауки разместило на regulation проект постановления Правительства о новом раунде программы мегагрантов. Там есть новые моменты, в частности наряду с конкурсом для ведущих ученых будет проведен конкурс для молодых исследователей (до 35 лет). В «Коммерсанте» опубликована заметка о предлагаемых изменениях, где есть и мои комментарии:

https://www.kommersant.ru/doc/6136871

Ссылка на проект постановления:

https://regulation.gov.ru/Regulation/Npa/PublicView?npaID=140488
Во вчерашнем выпуске журнала Nature опубликована важная заметка о работе компаний, которые ведут крупнейшие базы данных мировой научной литературы, над внедрением в свои поисковики инструментов искусственного интеллекта:

https://www.nature.com/articles/d41586-023-02470-3

1 августа сразу две такие компании – Elsevier (которая ведет Scopus) и Digital Science (которая ведет базу Dimensions) объявили о начале широкого тестирования разработанных ими поисковых инструментов с использованием ChatGPT.

В заметке отмечается, что решения, предлагаемые этими двумя компаниями, оказались очень схожими. Задается поисковый запрос, затем с помощью обычного поисковика подбираются подходящие статьи из базы, затем они ранжируются по релевантности, затем на основании информации из нескольких наиболее релевантных статей ChatGPT продуцирует резюме, сопровождающееся реальными проверенными ссылками. Дополнительные подробности на русском языке по содержанию данной заметки можно посмотреть здесь:

https://rossaprimavera.ru/news/88da9bec

Судя по всему, данные инструменты пока еще далеки от того, чтобы быть надежными помощниками ученого, но процесс развивается очень быстро. В частности, аналогичные подходы в настоящее время разрабатываются применительно к крупнейшей базе русскоязычных научных текстов, собранных в РИНЦ.
Есть много похожего в событиях вокруг смены директоров Института проблем передачи информации РАН и Научно-технологического центра уникального приборостроения РАН (см.выше посты от 24, 27 и 29 июля и 1 августа). Поэтому не является удивительным появление сегодняшнего совместного обращения советов молодых ученых этих двух академических институтов, которое опубликовано на веб-сайте ИППИ РАН:

http://iitp.ru/ru/news/2929.htm