genai
92 subscribers
49 photos
14 videos
10 links
Download Telegram
🔥3🤡1
Бенчмаркинг ИИ в 2022 - математика для учеников средней школы

Бенчмаркинг ИИ 2025 - скоко мобов убито в майнкрафте
Наверняка большинство уже слышало про HRM и о том, как эта модель разъебывает ллмки на ARC‑AGI. Но почти никто не говорит о критике.

Вкратце:

- ARC‑AGI‑1: ~32% (впечатляюще для 27М параметров, но ниже заявленных 41%).

- Иерархическая архитектура H/L даёт минимальный вклад по сравнению с обычным трансформером того же размера.

- Основной буст идёт от внешнего итеративного цикла: предсказал → проверил «halt/continue» → доработал → снова. Именно «процедура» (обучение с refinements), а не сама архитектура, тянет результат.

- Система по сути трансдуктивная: «программа» остаётся в весах, эксплицитной процедуры/правила не извлекаются → ограниченная обобщаемость.

В разборе ARC Prize заявляется: «несмотря на одинаковое количество параметров, HRM требует больше вычислительных ресурсов, что может частично объяснять разницу. Увеличение вычислительных ресурсов может привести к снижению эффективности при большем количестве внешних циклов, что соответствует нашим результатам». То есть по факту это просто inference‑time scaling — эдакий специализированный CoT.

На мой взгляд, всё это изначально очевидно, особенно если обратить внимание на манипуляцию авторов — сравнение Large Language Model с узкоспециализированной моделью.

Всё вышесказанное не означает, что стоит забыть об HRM как о страшном сне: вполне возможно, что нечто подобное ещё неплохо себя покажет в задаче обработки языка (а возможно, уже показывает) — у энтузиастов и у Google.
2🌭1
График из статьи - сравнение HRM и трансформера аналогичного размера. Трансформер показывает результаты в пределах нескольких пунктов без какой-либо оптимизации гиперпараметров
🍌2
🔥3
😁3
🤣10
Мой батя ебашит адовые опенсорсы, ну вот рецепт примерно усреднённый, потому что вариаций масса. Берется ллм, она не квантизуется, квантизация - это не про моего батю. Он берет эту ллм, вываливает ее на гит и начинает шитпостить в твиттере. Добавляет в него огромное количество скринов, постов, репостов, смехуечков и жирных МЕМОВ! для вязкости, дает два интервью сверху. Все это хайпится до дыма. Потом снимается с гита и остужается на бенчмарках. Потом батя заносит и щедро полив рагом начинает инферить. При этом инферит прям с хагинфейс со скоростью 3 токена в секунду. Инферит и приговаривает полушепотом ух бля. При этом у него на лбу аж веса выступают. Любезно мне иногда предлагает, но я отказываюсь. Надо ли говорить о том какой дичайший пердеж потом в твитторе? Вонища такая, что апишки от соседних серверов отваливаются.
👍4
prostituerte tollcall
😍3🤣2
😨3👍2
🌭6
Голосовые сообщения в вайбкод IDE.

Its say a lot about society
🤣3
😍5
что этот дидди блад делает на GPU
👍6
😁3🤣3
😁32