может чо изменилось за пару месяцев но есть статья о том что сами инженеры гугл не используют антигравити💀
https://medium.com/@shashwatwrites/why-google-mostly-wont-let-its-own-devs-use-antigravity-03844095608c
https://medium.com/@shashwatwrites/why-google-mostly-wont-let-its-own-devs-use-antigravity-03844095608c
😁2
Помните что данный канал существует исключительно по той причине что у автора есть мотивация щитпостить.
Всех неравнодушных к судьбе этого небольшого кусочка интернет культуры в качестве помощи прошу пригласить ещё читателей🙏 коллег, друзей, врагов, однокурсников. Буду очень благодарен🥸
Всех неравнодушных к судьбе этого небольшого кусочка интернет культуры в качестве помощи прошу пригласить ещё читателей🙏 коллег, друзей, врагов, однокурсников. Буду очень благодарен🥸
🔥5🤡2
Стоки производителей RAM слегка корректируются...
Максимальные падения были за сутки:
Sandisk (SNDK) −6.5%
Western Digital (WDC) −4.7%
Seagate (STX) −5.6%
Micron (MU) −4%, при этом уже падал −14% за неделю до этого
На фоне тех иксов которые стоки сделали за последние пару лет это мелочи, но если вам всё же интересно что же случилось: Google выкатил TurboQuant — алгоритм сжатия KV-кеша в 6 раз без потери точности. 8x ускорение на H100. 3 бита вместо 32🤓
Что это значит практически: модель, которой раньше нужно было 8 H100 для 1M токенов контекста ((потенциально)) влезает на 2. Это если верить экстраполяции, production-данных нет)
Тестировали только на 8B моделях на данный момент) Работает ли на 70B+ неизвестно. 8x ускорение — только для одного куска исполнения, не весь инференс так ускоряется если что.
Вообще, статья по этой математике лежала год на arXiv. Всем было пох, и вот Google публикует блогпост на research google — и акции реагируют..
https://research.google/blog/turboquant-redefining-ai-efficiency-with-extreme-compression/
Максимальные падения были за сутки:
Sandisk (SNDK) −6.5%
Western Digital (WDC) −4.7%
Seagate (STX) −5.6%
Micron (MU) −4%, при этом уже падал −14% за неделю до этого
На фоне тех иксов которые стоки сделали за последние пару лет это мелочи, но если вам всё же интересно что же случилось: Google выкатил TurboQuant — алгоритм сжатия KV-кеша в 6 раз без потери точности. 8x ускорение на H100. 3 бита вместо 32🤓
Что это значит практически: модель, которой раньше нужно было 8 H100 для 1M токенов контекста ((потенциально)) влезает на 2. Это если верить экстраполяции, production-данных нет)
Тестировали только на 8B моделях на данный момент) Работает ли на 70B+ неизвестно. 8x ускорение — только для одного куска исполнения, не весь инференс так ускоряется если что.
Вообще, статья по этой математике лежала год на arXiv. Всем было пох, и вот Google публикует блогпост на research google — и акции реагируют..
https://research.google/blog/turboquant-redefining-ai-efficiency-with-extreme-compression/
🔥4😁2
Чел который буквально недавно пришел в Anthropic рассказывает что никто там код руками не пишет, все пользуются клодкодом. Ладно, это уже мало кого удивляет в 26 году.
Что удивляет, ребята, получающие 600к в год, не сидят и не смотрят брейнрот контент пока агент занимается грязной работой.🙈 То есть текущая мета это писать самоитерирующие промпты которые займут достаточно много времени у агента чтобы в это время кожаный смог пойти в другого агента и запромптить что-то ещё
В целом я так тоже делаю, но бошка вскипает часто контекст менять🙊
Что удивляет, ребята, получающие 600к в год, не сидят и не смотрят брейнрот контент пока агент занимается грязной работой.🙈 То есть текущая мета это писать самоитерирующие промпты которые займут достаточно много времени у агента чтобы в это время кожаный смог пойти в другого агента и запромптить что-то ещё
В целом я так тоже делаю, но бошка вскипает часто контекст менять🙊
👀1