Forwarded from Осцилляции WaveCut (WaveCut)
Это было неизбежно: рано или поздно должны были появиться специализированные решения для инференса.
И вот, Taalas (бывшая команда из Tenstorrent) выкатили то, чего я так ждал — настоящий Direct-to-Silicon.
Ребята не стали мелочиться и буквально «запекли» модель в кремний. Никакой внешней памяти, никакого HBM, никакой сложной упаковки. Веса модели и архитектура — это и есть сам чип.
Цифры выглядят дико: 17,000 токенов в секунду на Llama 3.1 8B.
Это на порядок быстрее текущей SOTA GPU, при этом чип стоит в 20 раз дешевле в производстве и потребляет в 10 раз меньше энергии.
Самое крутое, что это не просто красивые слайды для инвесторов. Железо уже существует, и его можно «потрогать» (ссылка на демо внизу).
Upd: не все это волшебство и такая скорость достигается не без компромиссов — запеченные веса урезаны в от 3 до 6 бит точности, а контекст в демо ограничен тысячей токенов на вход и столько же на вывод.
Конечно, это ASIC, и тут есть нюанс: чип заточен под одну конкретную модель. Но Taalas продумали этот момент — они оставили поддержку LoRA-адаптеров и изменяемого контекстного окна. То есть это не совсем уж «кирпич», гибкость для файн-тюнинга остается.
Сейчас у них готов чип с Llama 8B (HC1). Весной обещают выкатить что-то среднеразмерное с ризонингом, а к зиме грозятся показать фронтир-модель на втором поколении кремния.
У меня голова идет кругом от мыслей к чему это может привести.
Ссылки:
• Анонс
• Демо (скорость реально впечатляет)
И вот, Taalas (бывшая команда из Tenstorrent) выкатили то, чего я так ждал — настоящий Direct-to-Silicon.
Ребята не стали мелочиться и буквально «запекли» модель в кремний. Никакой внешней памяти, никакого HBM, никакой сложной упаковки. Веса модели и архитектура — это и есть сам чип.
Цифры выглядят дико: 17,000 токенов в секунду на Llama 3.1 8B.
Это на порядок быстрее текущей SOTA GPU, при этом чип стоит в 20 раз дешевле в производстве и потребляет в 10 раз меньше энергии.
Самое крутое, что это не просто красивые слайды для инвесторов. Железо уже существует, и его можно «потрогать» (ссылка на демо внизу).
Upd: не все это волшебство и такая скорость достигается не без компромиссов — запеченные веса урезаны в от 3 до 6 бит точности, а контекст в демо ограничен тысячей токенов на вход и столько же на вывод.
Конечно, это ASIC, и тут есть нюанс: чип заточен под одну конкретную модель. Но Taalas продумали этот момент — они оставили поддержку LoRA-адаптеров и изменяемого контекстного окна. То есть это не совсем уж «кирпич», гибкость для файн-тюнинга остается.
Сейчас у них готов чип с Llama 8B (HC1). Весной обещают выкатить что-то среднеразмерное с ризонингом, а к зиме грозятся показать фронтир-модель на втором поколении кремния.
У меня голова идет кругом от мыслей к чему это может привести.
Ссылки:
• Анонс
• Демо (скорость реально впечатляет)
🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Рабочие будни граф. дизайнеров в 2К26
😁4
Ну что ж, можно сказать, что Gemini 3.1 Pro стала первой моделью, которая прошла мой личный бенчмарк. У меня было одно простое, но крайне специфичное в смысле контекста задание — создать симулятор эфиролета на эфиродинамике Ацюковского. То есть, симулятор, работающий по законам весьма непопулярной псевдонаучной теории. И именно ввиду того, что эта теория неакадемична, а ее симуляциями не было принято баловаться ни в научном, ни в каком другом сообществе, то для ллмок это превращалось в сущий кошмар. Потому что нет знакомых паттернов. Именно с ваншота. Всегда получалось коряво, если получалось. И только Gemini 3.1 Pro справилась с задачей с первого раза. С крайне простого промпта.
Промпт:
Симулятор: тыц
Промпт:
Создай интерактивный симулятор эфиролета на эфиродинамике Ацюковского
Симулятор: тыц
🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
Чел из Google DeepMind создал при помощи Gemini 3.1 Pro правдоподобный город. Ждем плагины для Cities: Skylines, чтобы уже не ебаться с возведением городов вручную?
This media is not supported in your browser
VIEW IN TELEGRAM
Семейные есть? Прикольная идея для ваших спиногрызов. Фотайтесь с ребенком будто вы в файтинге, кидаете в Seedance 2.0 и вуаля. Не забудьте запромптить, что вы добиваете свое чадо ногами вкровькишки, не в детском саду же.
🔥6
Media is too big
VIEW IN TELEGRAM
Gemini 3.1 Pro + Claude 4.6 Opus = геолокационная система слежения в реальном времени. Не с ваншота, конечно, но и Джеминай 3.1 вышла только вчера. Буквально: данные о самолетах, спутниках, автомобилях, землетрясениях, видео с камер наблюдения подгружаются в РЕАЛЬНОМ ВРЕМЕНИ. Сделал это один чел. И это было не сложно.
А вы выбрали свой пет-проект на этот вечер?
А вы выбрали свой пет-проект на этот вечер?
🔥4
В течение нескольких часов ожидается новый DeepSeek. И по слухам, это затмит все последние успехи западных фронтир-моделей.
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Ещё одна короткометражка, но... на этот раз не на Сидансе, а на третьем Клинге. Автором потрачен один день и 65 баксов.
Nano Banana Pro - картинкогенерация
Kling 3.0 - видеогенерация
ElevenLabs - аудиогенерация
Premiere Pro - монтаж
Claude - JSON и сценарий
Nano Banana Pro - картинкогенерация
Kling 3.0 - видеогенерация
ElevenLabs - аудиогенерация
Premiere Pro - монтаж
Claude - JSON и сценарий
🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
Пошёл ненавязчивый прогрев перед раскаткой второго Сиданса в Кэпкате. И заметьте, никаких взрывов, голливудских знаменитостей и драчек. Виртуозно.
Оказывается, в штатах многим креаторам раздали ранний доступ к Сидансу в Кэпкате и теперь твиттер переполняется 2-, 8-, 10-минутными короткометражечками.
Оказывается, в штатах многим креаторам раздали ранний доступ к Сидансу в Кэпкате и теперь твиттер переполняется 2-, 8-, 10-минутными короткометражечками.
🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
Разница между генерацией анимированного SVG в Gemini 3 Pro и Gemini 3.1 Pro наглядно. Скоро на всех лендингах страны мира.
👍2
Некоммерческая организация METR, изучающая системы искусственного интеллекта и риски их враждебности для человечества, опубликовала свои оценки продолжительности работы Claude 4.6 Opus при выполнении задач программной разработки. Среднее количество бесперебойной работы в 50% случаев составляет около 14,5 часов. В целом рабочий диапазон модели — от 6 до 98 часов.
Без спекуляций, чисто глядя на временной график — это экспонента к сингулярности.
С добрым утром 😉
Без спекуляций, чисто глядя на временной график — это экспонента к сингулярности.
С добрым утром 😉
Я благодарен капитализму за свободную конкуренцию, которая толкает прогресс вперед, но конкретно за это👆я его ненавижу
😭 🤬 🔫 💀
Please open Telegram to view this post
VIEW IN TELEGRAM
когда сиданс выйдет мы должны все вместе собраться и нагенерить своих актеров и кучу гениальных фильмов с ними чтобы они стали круче голливудских актеров и тогда люди перестанут смотреть фильмы с голливудскими актерами и будут смотреть с нашими и тогда голливуд обанкротится мы похороним этот чертог порока и луддизма
❤4💯4
У нас опять тревожные новости для разрабов. Последнее, что заставляло держаться за разработчиков — безопасность кода. Anthropic вчера это изменили, начав убивать компании, занимающиеся кибербезопасностью.
20 февраля Anthropic анонсировали Claude Code Security — новый инструмент для автоматического поиска уязвимостей в коде, который представляет собой функцию, сканирующую кодовые базы на уязвимости и предлагает конкретные патчи для ручного подтверждения. Пока это чудо доступно в режиме ограниченного research preview для Enterprise и Team клиентов.
Традиционные SAST-инструменты работают на основе правил — они ищут знакомые паттерны (вроде открытых паролей или устаревшего шифрования). Claude Code Security подходит иначе: вместо сканирования по известным паттернам он читает и рассуждает о коде так, как это делает человек-исследователь безопасности — понимает взаимодействие компонентов, отслеживает движение данных и ловит сложные уязвимости, которые пропускают правило-ориентированные инструменты.
Каждая найденная уязвимость проходит «многоэтапный процесс верификации», где результаты повторно анализируются для фильтрации ложных срабатываний. Уязвимостям также присваиваются рейтинги серьёзности, чтобы команды могли сосредоточиться на приоритетных. Патчи затрагивают только часть исходного кода и требуют одобрения человека перед применением.
С использованием Claude Opus 4.6 команда Anthropic нашла более 500 ранее необнаруженных уязвимостей в open-source проектах — некоторые из них оставались скрытыми десятилетиями, несмотря на многолетний экспертный аудит.
Разумеется, после этого акции крупных компаний кибербезопасности рухнули: CrowdStrike упал на 8%, Cloudflare — на 8,1%, Okta — на 9,2%, SailPoint — на 9,4%. Рынок воспринял это как прямую угрозу традиционному сегменту security-сканеров.
Инструмент подключается к GitHub-репозиторию, доступен через Claude Code on the Web. Open-source мейнтейнеры могут получить бесплатный ускоренный доступ. Остальные могут подать заявку на early access на claude.com/solutions/claude-code-security.
20 февраля Anthropic анонсировали Claude Code Security — новый инструмент для автоматического поиска уязвимостей в коде, который представляет собой функцию, сканирующую кодовые базы на уязвимости и предлагает конкретные патчи для ручного подтверждения. Пока это чудо доступно в режиме ограниченного research preview для Enterprise и Team клиентов.
Традиционные SAST-инструменты работают на основе правил — они ищут знакомые паттерны (вроде открытых паролей или устаревшего шифрования). Claude Code Security подходит иначе: вместо сканирования по известным паттернам он читает и рассуждает о коде так, как это делает человек-исследователь безопасности — понимает взаимодействие компонентов, отслеживает движение данных и ловит сложные уязвимости, которые пропускают правило-ориентированные инструменты.
Каждая найденная уязвимость проходит «многоэтапный процесс верификации», где результаты повторно анализируются для фильтрации ложных срабатываний. Уязвимостям также присваиваются рейтинги серьёзности, чтобы команды могли сосредоточиться на приоритетных. Патчи затрагивают только часть исходного кода и требуют одобрения человека перед применением.
С использованием Claude Opus 4.6 команда Anthropic нашла более 500 ранее необнаруженных уязвимостей в open-source проектах — некоторые из них оставались скрытыми десятилетиями, несмотря на многолетний экспертный аудит.
Разумеется, после этого акции крупных компаний кибербезопасности рухнули: CrowdStrike упал на 8%, Cloudflare — на 8,1%, Okta — на 9,2%, SailPoint — на 9,4%. Рынок воспринял это как прямую угрозу традиционному сегменту security-сканеров.
Инструмент подключается к GitHub-репозиторию, доступен через Claude Code on the Web. Open-source мейнтейнеры могут получить бесплатный ускоренный доступ. Остальные могут подать заявку на early access на claude.com/solutions/claude-code-security.
Forwarded from Valeri Pizhanski
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Прикольно обыграли😂
😁2❤1💩1