Осцилляции WaveCut
577 subscribers
85 photos
45 videos
71 links
Download Telegram
Bytedance Seed выпускает Seed2.0 — свою флагманскую LLM, способную по многим фронтам тягаться с мировыми лидерами.

Выжимка Чяд-ДТП по техрепорту:

Длинный контекст
• #1 на Frames (по сути: “умеет держать длинную историю”).
• Очень сильные long-doc тесты: DUDE, MMLongBench, MMLongBench-Doc.

Документы/скрины/таблички/графики
• Топ на задачах типа “разбери документ/график/форму”: ChartQAPro, OmniDocBench.

Математика по картинкам
• Высокие результаты на MathVision, MathKangaroo, MathCanvas, MathVista.

Видео
• На VideoReasonBench — даже выше human.
• На Morse-500 — новый лучший результат.
• Сильная на long-video (VideoMME) и multi-video (CrossVid).

Поиск и ресерч (агентские сценарии)
• В отчёте прямо акцент: хороша в задачах “нашёл в нескольких источниках, перепроверил, собрал вывод”.
• На одном из тестов SearchAgent — #1.

Где слабее / где будет боль
• Retrieval-heavy long-context: штуки типа MRCR/Graphwalks — не топ.
• Context learning + repo-level coding: на тестах уровня “понять репозиторий и нормально дописать” (DeR2, NL2Repo) — отстаёт от лучших.
• Граничные условия: иногда плывёт, если задача требует прям супер-точного следования формулировке (может “съехать” и получить 0).
• Мультиязычность и устойчивость к галлюцинациям — норм, но не предел.
2🤔1🤯1👀1
This media is not supported in your browser
VIEW IN TELEGRAM
Seedance 2.0:

Chest-mounted GoPro, frantic POV of a man sprinting through dense, misty forest at dusk. Camera shakes violently, branches whipping past lens. Breathing is ragged, panicked. Glimpse over shoulder reveals two towering, pale humanoid figures with bulbous fungal heads chasing on all fours, limbs moving in unnatural, spider-like jerks. Their mouths are lipless slits, emitting wet chittering clicks. Protagonist stumbles over root, nearly falls, scrambles up. Bursts through fern thicket into small clearing, skids to halt—cliffs edge ahead, no escape. Whirls around, backs against drop, faces camera directly. Face is scratched, terrified, covered in sweat and mud. Looks into lens with exhausted fury, spits in thick British accent: "I fockin' *hate* these fockin' mushrooms." Lunging pale hand reaches for camera—cut to black. Natural forest lighting, golden hour fading to dusk, realistic color grade, chronicle live stream aesthetic.
🔥4😱1🤮1👻1
Claude Sonnet 4.6

Claude Sonnet 4.6 — это апгрейд “соннетов” до почти Opus-уровня: сильно подтянули кодинг (меньше галлюцинаций, лучше чтение контекста, меньше оверинжиниринга), компьютерное управление на реальных приложениях (OSWorld-Verified) и долгий контекст — до 1M токенов с умной компакцией.

Модель лучше держит многошаговые планы (Vending‑Bench, длинные офисные задачи), аккуратнее с безопасностью и промпт-инжектами, и при этом стоит как Sonnet 4.5 ($3/$15 за миллион токенов).
По сути, раньше за такое приходилось звать Opus, а теперь это дефолтный Sonnet.

Фактически, по бенчам связанным с кодингом, Sonnet 4.6 либо на уровне Opus 4.5, либо чуть лучше.
🥰43🔥2
Recraft V4 — модель стала заметно лучше в композиции, свете, цветах и реалистичных фактурах, поэтому картинки выглядят как кадры из продуманной съемки, а не сток. По сравнению с V3 она куда точнее и послушнее к промптам (особенно длинным и сложным), лучше держит структуру сцены, типографику и продуктовые детали, а ещё умеет выдавать не только фото, но и реально пригодные для продакшена постеры, веб-интерфейсы и аккуратные векторные SVG без ручной чистки.
🥰31
Media is too big
VIEW IN TELEGRAM
👍8🔥1😁1🥴1👻1
Это было неизбежно: рано или поздно должны были появиться специализированные решения для инференса.
И вот, Taalas (бывшая команда из Tenstorrent) выкатили то, чего я так ждал — настоящий Direct-to-Silicon.

Ребята не стали мелочиться и буквально «запекли» модель в кремний. Никакой внешней памяти, никакого HBM, никакой сложной упаковки. Веса модели и архитектура — это и есть сам чип.

Цифры выглядят дико: 17,000 токенов в секунду на Llama 3.1 8B.
Это на порядок быстрее текущей SOTA GPU, при этом чип стоит в 20 раз дешевле в производстве и потребляет в 10 раз меньше энергии.
Самое крутое, что это не просто красивые слайды для инвесторов. Железо уже существует, и его можно «потрогать» (ссылка на демо внизу).
Upd: не все это волшебство и такая скорость достигается не без компромиссов — запеченные веса урезаны в от 3 до 6 бит точности, а контекст в демо ограничен тысячей токенов на вход и столько же на вывод.

Конечно, это ASIC, и тут есть нюанс: чип заточен под одну конкретную модель. Но Taalas продумали этот момент — они оставили поддержку LoRA-адаптеров и изменяемого контекстного окна. То есть это не совсем уж «кирпич», гибкость для файн-тюнинга остается.

Сейчас у них готов чип с Llama 8B (HC1). Весной обещают выкатить что-то среднеразмерное с ризонингом, а к зиме грозятся показать фронтир-модель на втором поколении кремния.

У меня голова идет кругом от мыслей к чему это может привести.


Ссылки:
Анонс
Демо (скорость реально впечатляет)
5🔥428🤯4👎2👍1🤔1🦄1