Интересное что-то

Давеча мне для одного проекта нужно было сделать широкий поиск по всем топ-конференциям в нашей области за последние годы. Это было кстати для того, чтобы попробовать способности GPT-5 к программированию (впрочем, я и более серьёзным проектом уже его тестировал, но тот показать вряд ли смогу).

В итоге GPT-5 написал мне прекрасный скрейпер для всех топ-конференций, и я задумался, что из этого можно сделать. Рисовать тематические кластеры полезно для дела, но уже давно совсем никому не интересно, very 2015. Вот первая небольшая идея, которую мы с GPT-5 реализовали на моём сайте:

Figure Roulette

Это игра "угадай статью по картинке": вам показывают иллюстрацию, вырезанную из статьи, и дают пять вариантов названия. Нужно угадать правильный; игра рудиментарно ведёт счёт внутри вашей сессии, но, конечно, никаких пользователей с авторизацией я к ней не прикручивал. Наверняка там куча багов и недоделок, но вроде забавная штука получилась, а если не работает, попробуйте full refresh.) Добавил пока два NeurIPS'а, но легко будет добавить и ещё, если вдруг это кому-то будет интересно.

Надо сказать, что даже в этой поделке спрятано довольно много нетривиальных подзадач:

— скрейпер, скачивающий статьи с конференций и отдельно ходящий к openalex и crossref за информацией об авторах (увы, её всё равно маловато, очень часто аффилиации нигде не находятся);

— скрипт, вырезающий картинки из pdf; он, конечно, на основе внешнего тула, pdffigures2, но всё равно скрипт немаленький вышел;

— порождение вариантов ответов; это тоже отдельная штука на основе ближайших соседей из paragraph-level embeddings (BGE-M3 в данном случае);

— фронтенд самой игры к моему сайту на next.js, а также ещё сопутствующие вещи вроде того, как и где хранить все эти картинки.

Оценить, лучше ли GPT-5, чем o3[-pro], которой я раньше пользовался, на паре примеров сложно, но одну вещь я уже точно заметил: в GPT-5 очень крутая работа с контекстом. У меня были два супер-длинных чатика, связанных с двумя проектами, и GPT-5 ни разу не потерял контекст, не зашёл в порочный круг, всё время отвечал по делу, и начинать новый чат ни разу не хотелось. Это были первые случаи в истории моего взаимодействия с LLM, когда обновлять контекст приходилось не потому, что для LLM так будет лучше, а потому, что само приложение начинало безбожно тормозить, загружая гигантские чаты.

Может быть, у вас есть идеи, что ещё сделать с этими данными? Считайте, что у меня есть все статьи с A*-конференций по AI за последние пару лет, включая абстракты и pdf.

63 views14:57