Forwarded from Neural Shit
Наконец-то вайбкодеры начали делать по-настоящему нужные миру приложения, а не вот эти вот бестолковые трекеры продуктивности, визуализаторы и прочие дашборды
😁69❤9🤡4👍2🔥1
Forwarded from эйай ньюз
Bonsai Image 4B — чудеса квантизации
Стартап PrismML, специализирующийся на экстремальном сжатии моделек, сделал квантизированную до одного бита FLUX.2 Klein 4B, вышло на удивление достойно. С таким уровнем квантизации Diffusion Transformer занимает всего лишь 930 мегабайт в 1-битном варианте и 1.2 гигабайта в тернарном варианте. Текстовый энкодер настолько же сильно ужать не удалось, поэтому весь комплект весит ~3.5 гига.
Такая квантизация позволяет запускать модель прямо в браузере и на телефонах, используя лишь 2 гигабайта оперативки. На генерацию 512x512 картинки на iPhone 17 Pro Max с такой моделью уходит 9.4 секунды при 4 шагах, что неплохо если учитывать факт офлоадинга. Ждём моделек побольше, для локального деплоймента.
Инференс в браузере
Веса
@ai_newz
Стартап PrismML, специализирующийся на экстремальном сжатии моделек, сделал квантизированную до одного бита FLUX.2 Klein 4B, вышло на удивление достойно. С таким уровнем квантизации Diffusion Transformer занимает всего лишь 930 мегабайт в 1-битном варианте и 1.2 гигабайта в тернарном варианте. Текстовый энкодер настолько же сильно ужать не удалось, поэтому весь комплект весит ~3.5 гига.
Такая квантизация позволяет запускать модель прямо в браузере и на телефонах, используя лишь 2 гигабайта оперативки. На генерацию 512x512 картинки на iPhone 17 Pro Max с такой моделью уходит 9.4 секунды при 4 шагах, что неплохо если учитывать факт офлоадинга. Ждём моделек побольше, для локального деплоймента.
Инференс в браузере
Веса
@ai_newz
🔥33👍3
Forwarded from ParaGraph
Для дизайнеров, у которых весь мудборд заканчивается на шрифте Arial, выпустили футболку
😁53❤26🔥6😱6🤬1👀1
Вышел новый слопус 4.8
Лучше в агентском кодинге, но в терминальной стадии проигрывает гпт 5.5 (привет от openclaw)
Астрологи объявили неделю увеличенных шансов на релиз гемини, а в отделе юнит экономики антропиков снова тряска.
X
@derplearning
Лучше в агентском кодинге, но в терминальной стадии проигрывает гпт 5.5 (привет от openclaw)
Астрологи объявили неделю увеличенных шансов на релиз гемини, а в отделе юнит экономики антропиков снова тряска.
X
@derplearning
🔥23😁6👍3
Forwarded from Love. Death. Transformers.
если опус 4.8 спросить на китайском то окажется что это qwen
😁40❤9
Пора ранжировать закрытые модели по капитализации вместо количества параметров.
Claude opus 4.8 965b
Gpt 5.5 730b
Хоть opus 4.8 и обходит gpt 5.5, последняя ведёт себя неплохо для своей капитализации 🫠
Claude opus 4.8 965b
Gpt 5.5 730b
Хоть opus 4.8 и обходит gpt 5.5, последняя ведёт себя неплохо для своей капитализации 🫠
1😁49❤4
Все эти ваши "сколько букв ЖО П А в слове счастье" решаются через VLM
🫡31😁12🔥5👍1