⚡️ Daily AI Digest — Sun, Feb 15
🔥 MonarchRT — Real-time video diffusion via Monarch matrix attention + Triton kernels
arxiv.org/abs/2602.12271
🔥 DeepGen 1.0 — 5B model beats 80B HunyuanImage (+28%), open-source
arxiv.org/abs/2602.12205 | github.com/DeepGenTeam/DeepGen
🔥 DreamID-Omni — Unified human-centric audio-video gen, multi-character identity+voice
arxiv.org/abs/2602.12160
UniT — Multimodal CoT test-time scaling
arxiv.org/abs/2602.12279
UniDFlow — Unified discrete flow matching, LoRA per task
arxiv.org/abs/2602.12221
FAIL — Adversarial imitation learning for flow matching
arxiv.org/abs/2602.12155
GigaBrain — VLA from world model RL
arxiv.org/abs/2602.12099
🔥 MonarchRT — Real-time video diffusion via Monarch matrix attention + Triton kernels
arxiv.org/abs/2602.12271
🔥 DeepGen 1.0 — 5B model beats 80B HunyuanImage (+28%), open-source
arxiv.org/abs/2602.12205 | github.com/DeepGenTeam/DeepGen
🔥 DreamID-Omni — Unified human-centric audio-video gen, multi-character identity+voice
arxiv.org/abs/2602.12160
UniT — Multimodal CoT test-time scaling
arxiv.org/abs/2602.12279
UniDFlow — Unified discrete flow matching, LoRA per task
arxiv.org/abs/2602.12221
FAIL — Adversarial imitation learning for flow matching
arxiv.org/abs/2602.12155
GigaBrain — VLA from world model RL
arxiv.org/abs/2602.12099
arXiv.org
MonarchRT: Efficient Attention for Real-Time Video Generation
Real-time video generation with Diffusion Transformers is bottlenecked by the quadratic cost of 3D self-attention, especially in real-time regimes that are both few-step and autoregressive, where...
🔥6🤡2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Я проверяю пуллреквесты Claude Code перед деплоем в прод
1😁62🤣15😢3💯2
Forwarded from r/ретранслятор
Аудиофилы не смогли отличить звук, идущий по медному проводу, от звука, который пустили через банан и грязь.
В эксперименте участвовали «гурманы качественного звука», уверенные, что разные провода и материалы сильно влияют на звучание.
Всего было несколько версий одного и того же аудиофайла:
— Оригинал с CD (контрольная версия);
— Запись через 180 см профессионального медного аудиокабеля;
— Через 20 см мокрой грязи;
— Через старый микрофонный кабель, припаянный к монетам;
— Через банан.
Слушателям предложили вслепую определить, где какой вариант.
Из 43 попыток правильно угадали только 6 раз — то есть на уровне случайного угадывания. Некоторые даже хвалили звук через грязь, называя его лучшим.
Тотальное унижение аудиофилов
r/#LinusTechTips
В эксперименте участвовали «гурманы качественного звука», уверенные, что разные провода и материалы сильно влияют на звучание.
Всего было несколько версий одного и того же аудиофайла:
— Оригинал с CD (контрольная версия);
— Запись через 180 см профессионального медного аудиокабеля;
— Через 20 см мокрой грязи;
— Через старый микрофонный кабель, припаянный к монетам;
— Через банан.
Слушателям предложили вслепую определить, где какой вариант.
Из 43 попыток правильно угадали только 6 раз — то есть на уровне случайного угадывания. Некоторые даже хвалили звук через грязь, называя его лучшим.
Тотальное унижение аудиофилов
r/#LinusTechTips
1😁55👍7❤6🗿2
Forwarded from Neural Shit
Лол, Метачка хочет запатентовать технологию цифрового воскрешения.
Суть патента проста: нейронка жрёт для обучения все твои посты, переписки, лайки и комменты, чтобы создать твою полную цифровую копию.
В документе прямым текстом прописаны два сценария использования этого цифрового голема:
1) Когда ты просто решил отдохнуть от соцсетей (ну да, конечно).
2) Когда ты умер)
То есть, буквально сюжет той самой серии из "Черного зеркала". Ты уже давно почил, а твой аккаунт продолжает сраться в комментах, лайкать мемы и отвечать друзьям "лол, жиза".
Цукерберг решил, что смерть это не повод терять активную аудиторию. Теперь даже на том свете придется генерировать контент.
Суть патента проста: нейронка жрёт для обучения все твои посты, переписки, лайки и комменты, чтобы создать твою полную цифровую копию.
В документе прямым текстом прописаны два сценария использования этого цифрового голема:
1) Когда ты просто решил отдохнуть от соцсетей (ну да, конечно).
2) Когда ты умер)
То есть, буквально сюжет той самой серии из "Черного зеркала". Ты уже давно почил, а твой аккаунт продолжает сраться в комментах, лайкать мемы и отвечать друзьям "лол, жиза".
Цукерберг решил, что смерть это не повод терять активную аудиторию. Теперь даже на том свете придется генерировать контент.
patentscope.wipo.int
WIPO - Search International and National Patent Collections
This patent search tool allows you not only to search the PCT database of about 2 million International Applications but also the worldwide patent collections. This search facility features: flexible search syntax; automatic word stemming and relevance ranking;…
🤡6😁3🗿2
This media is not supported in your browser
VIEW IN TELEGRAM
Image Generation with a Sphere Encoder
Китайцы упоролись и запилиликруглые тензоры сферический латент.
Мапят исходные картинки на сферу, решая проблему "углов" - отсутствия значения латента, которые не мапятся обратно в исходное распределение.
Таким образом, любое значение латента можно превратить в картинку из трейн сета.
project
paper
code - soon
Китайцы упоролись и запилили
Мапят исходные картинки на сферу, решая проблему "углов" - отсутствия значения латента, которые не мапятся обратно в исходное распределение.
Таким образом, любое значение латента можно превратить в картинку из трейн сета.
project
paper
code - soon
🤩7🔥4😁3🌚1
В предыдущем посте был webm видос, пришлось запилить сервис по конвертации webp -> PNG, webm -> MP4
Все локально в браузере.
Webplease
Все локально в браузере.
Webplease
🔥5