This media is not supported in your browser
VIEW IN TELEGRAM
Ну и как бы этим свежим роликом Seedance 2.0 говорит нам, что ему глубочайше фиолетово (как сладкий китайский картофель!) на лицензионные претензии всея американского медиа. Говорю же, будет опенсорц 😋
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Надеюсь, именно с подготовкой к выходу Gemini 3.1 Pro была связана вся та непотребность, творившаяся с Бананой в приложении и на сайте. Всю неделю ей будто мозги через раз отключали и она очень сильно тупила, часто выдавая отправленные ей референсы назад. Хотя до этого будто мысли читала, так хорошо понимала промпты.
Forwarded from Осцилляции WaveCut (WaveCut)
Это было неизбежно: рано или поздно должны были появиться специализированные решения для инференса.
И вот, Taalas (бывшая команда из Tenstorrent) выкатили то, чего я так ждал — настоящий Direct-to-Silicon.
Ребята не стали мелочиться и буквально «запекли» модель в кремний. Никакой внешней памяти, никакого HBM, никакой сложной упаковки. Веса модели и архитектура — это и есть сам чип.
Цифры выглядят дико: 17,000 токенов в секунду на Llama 3.1 8B.
Это на порядок быстрее текущей SOTA GPU, при этом чип стоит в 20 раз дешевле в производстве и потребляет в 10 раз меньше энергии.
Самое крутое, что это не просто красивые слайды для инвесторов. Железо уже существует, и его можно «потрогать» (ссылка на демо внизу).
Upd: не все это волшебство и такая скорость достигается не без компромиссов — запеченные веса урезаны в от 3 до 6 бит точности, а контекст в демо ограничен тысячей токенов на вход и столько же на вывод.
Конечно, это ASIC, и тут есть нюанс: чип заточен под одну конкретную модель. Но Taalas продумали этот момент — они оставили поддержку LoRA-адаптеров и изменяемого контекстного окна. То есть это не совсем уж «кирпич», гибкость для файн-тюнинга остается.
Сейчас у них готов чип с Llama 8B (HC1). Весной обещают выкатить что-то среднеразмерное с ризонингом, а к зиме грозятся показать фронтир-модель на втором поколении кремния.
У меня голова идет кругом от мыслей к чему это может привести.
Ссылки:
• Анонс
• Демо (скорость реально впечатляет)
И вот, Taalas (бывшая команда из Tenstorrent) выкатили то, чего я так ждал — настоящий Direct-to-Silicon.
Ребята не стали мелочиться и буквально «запекли» модель в кремний. Никакой внешней памяти, никакого HBM, никакой сложной упаковки. Веса модели и архитектура — это и есть сам чип.
Цифры выглядят дико: 17,000 токенов в секунду на Llama 3.1 8B.
Это на порядок быстрее текущей SOTA GPU, при этом чип стоит в 20 раз дешевле в производстве и потребляет в 10 раз меньше энергии.
Самое крутое, что это не просто красивые слайды для инвесторов. Железо уже существует, и его можно «потрогать» (ссылка на демо внизу).
Upd: не все это волшебство и такая скорость достигается не без компромиссов — запеченные веса урезаны в от 3 до 6 бит точности, а контекст в демо ограничен тысячей токенов на вход и столько же на вывод.
Конечно, это ASIC, и тут есть нюанс: чип заточен под одну конкретную модель. Но Taalas продумали этот момент — они оставили поддержку LoRA-адаптеров и изменяемого контекстного окна. То есть это не совсем уж «кирпич», гибкость для файн-тюнинга остается.
Сейчас у них готов чип с Llama 8B (HC1). Весной обещают выкатить что-то среднеразмерное с ризонингом, а к зиме грозятся показать фронтир-модель на втором поколении кремния.
У меня голова идет кругом от мыслей к чему это может привести.
Ссылки:
• Анонс
• Демо (скорость реально впечатляет)
🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Рабочие будни граф. дизайнеров в 2К26
😁4
Ну что ж, можно сказать, что Gemini 3.1 Pro стала первой моделью, которая прошла мой личный бенчмарк. У меня было одно простое, но крайне специфичное в смысле контекста задание — создать симулятор эфиролета на эфиродинамике Ацюковского. То есть, симулятор, работающий по законам весьма непопулярной псевдонаучной теории. И именно ввиду того, что эта теория неакадемична, а ее симуляциями не было принято баловаться ни в научном, ни в каком другом сообществе, то для ллмок это превращалось в сущий кошмар. Потому что нет знакомых паттернов. Именно с ваншота. Всегда получалось коряво, если получалось. И только Gemini 3.1 Pro справилась с задачей с первого раза. С крайне простого промпта.
Промпт:
Симулятор: тыц
Промпт:
Создай интерактивный симулятор эфиролета на эфиродинамике Ацюковского
Симулятор: тыц
🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
Чел из Google DeepMind создал при помощи Gemini 3.1 Pro правдоподобный город. Ждем плагины для Cities: Skylines, чтобы уже не ебаться с возведением городов вручную?
This media is not supported in your browser
VIEW IN TELEGRAM
Семейные есть? Прикольная идея для ваших спиногрызов. Фотайтесь с ребенком будто вы в файтинге, кидаете в Seedance 2.0 и вуаля. Не забудьте запромптить, что вы добиваете свое чадо ногами вкровькишки, не в детском саду же.
🔥6
Media is too big
VIEW IN TELEGRAM
Gemini 3.1 Pro + Claude 4.6 Opus = геолокационная система слежения в реальном времени. Не с ваншота, конечно, но и Джеминай 3.1 вышла только вчера. Буквально: данные о самолетах, спутниках, автомобилях, землетрясениях, видео с камер наблюдения подгружаются в РЕАЛЬНОМ ВРЕМЕНИ. Сделал это один чел. И это было не сложно.
А вы выбрали свой пет-проект на этот вечер?
А вы выбрали свой пет-проект на этот вечер?
🔥4
В течение нескольких часов ожидается новый DeepSeek. И по слухам, это затмит все последние успехи западных фронтир-моделей.
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Ещё одна короткометражка, но... на этот раз не на Сидансе, а на третьем Клинге. Автором потрачен один день и 65 баксов.
Nano Banana Pro - картинкогенерация
Kling 3.0 - видеогенерация
ElevenLabs - аудиогенерация
Premiere Pro - монтаж
Claude - JSON и сценарий
Nano Banana Pro - картинкогенерация
Kling 3.0 - видеогенерация
ElevenLabs - аудиогенерация
Premiere Pro - монтаж
Claude - JSON и сценарий
🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
Пошёл ненавязчивый прогрев перед раскаткой второго Сиданса в Кэпкате. И заметьте, никаких взрывов, голливудских знаменитостей и драчек. Виртуозно.
Оказывается, в штатах многим креаторам раздали ранний доступ к Сидансу в Кэпкате и теперь твиттер переполняется 2-, 8-, 10-минутными короткометражечками.
Оказывается, в штатах многим креаторам раздали ранний доступ к Сидансу в Кэпкате и теперь твиттер переполняется 2-, 8-, 10-минутными короткометражечками.
🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
Разница между генерацией анимированного SVG в Gemini 3 Pro и Gemini 3.1 Pro наглядно. Скоро на всех лендингах страны мира.
👍2
Некоммерческая организация METR, изучающая системы искусственного интеллекта и риски их враждебности для человечества, опубликовала свои оценки продолжительности работы Claude 4.6 Opus при выполнении задач программной разработки. Среднее количество бесперебойной работы в 50% случаев составляет около 14,5 часов. В целом рабочий диапазон модели — от 6 до 98 часов.
Без спекуляций, чисто глядя на временной график — это экспонента к сингулярности.
С добрым утром 😉
Без спекуляций, чисто глядя на временной график — это экспонента к сингулярности.
С добрым утром 😉