Технозаметки Малышева

Seedream 4.5: новый генератор изображений от ByteDance

ByteDance анонсировал выход Seedream 4.5, - новой модели генерации изображения из текстового запроса с качеством не хуже Nanobanana Pro.
Обещают улучшенное понимание пространства и больше деталей.

Уже есть через API (BytePlus ModelArk, Replicate, fal.ai ) по $0.03-0.04 за картинку примерно.

Посмотреть можно тут.

Такое ощущение, что китайские товарищи специально дожидаются выхода западного решения и сразу следом выпускают своё, но лучше.

Например, -открыл тут для себя GLM 4.6, - chat.z.ai тоже очень достойно пишет проекты на уровне Gemini3 Pro Build. Тоже рекомендую попробовать. (DeepSeek даже близко не стоял)

#ByteDance #Seedream #t2i #нейрорендер #Китай
———
@tsingular

⚡6❤4🆒2

2.13K views05:15

Технозаметки Малышева

Emu3.5: открытая мультимодальная модель от Zhiyuan Institute

Китайский институт Zhiyuan выкатил Emu3.5 -открытую мультимодальную модель на 34B (полный размер 70гигов), которая умеет предсказывать состояние мира в следующем кадре.

Нейросеть генерирует визуальный контент по тому же принципу, как ChatGPT пишет текст, только сразу в мультимодальном пространстве.

Это позволяет модели удерживать консистентность физики мира и причинно-следственные связи, а не просто склеивать красивые кадры.

Раньше главная проблема такого подхода была в низкой скорости. Авторы решили её через новую технологию DiDA: она распараллеливает процесс и ускоряет генерацию в 20 раз.

Сценариев применения много, от распознавания и генерации картинок и кадров видео, до генерации целых миров без потери связанности по ходу движения.

Посмотреть работу вживую можно тут:
https://emu.world/

Скачать веса тут:
HF

paper
GitHub

Apache 2.0.

#Emu35 #WorldModel #Zhiyuan #Китай
———
@tsingular

🔥8⚡4👍3❤1

1.98K views06:29

Технозаметки Малышева

Новогодние авденты гугла, конечно, штука полезная.

Например, вот простейшая инструкция как создать ИИ агента в 5 шагов за 1 минуту:

1. создаём директорию

mkdir adk && cd adk

2. делаем venv

python3 -m venv . && source bin/activate

3. ставим ADK

pip install google-adk

4. создаём агента в интерактивном режиме отвечая на вопросы, добавляя, в том числе, ключ к API гугла:

adk create --type=config my_agent

5. добавляем ему инструмент поиска в гугле.
в файле my_agent/root_agent.yaml добавляем в конец строку:

tools:
 - name: google_search

Всё :)

запускаем агента:

adk run my_agent/

#adk #агенты #обучение #Google #адвенты
———
@tsingular

1🔥6✍4❤4👍2

1.91K viewsedited 08:50

Технозаметки Малышева

0:10

This media is not supported in your browser

VIEW IN TELEGRAM

Новый тренд!
Роботы побежали меряться кто лучше и естественнее бегает. :)

Figure vs Optimus

Как вам?
Опять хейтеры скажут нейрорендер или актёры бегают!

Ждём в следующем году Новые Олимпийские Игры Роботов!

#роботы #Figure #Optimus #бег
------
@tsingular

⚡18🆒5👾3❤1👏1

2.11K views10:52

Технозаметки Малышева

0:15

This media is not supported in your browser

VIEW IN TELEGRAM

Еще пример, что можно сделать минут за 15 с Gemini3.

#Gemini #vibecoding #dev
------
@tsingular

🔥28⚡3👨‍💻2🗿2🤯1

2.06K viewsedited 10:56

Технозаметки Малышева

0:46

This media is not supported in your browser

VIEW IN TELEGRAM

Дом летающих кинжалов.

Страшное дело так то.

#дроны #кинжалы #Китай
------
@tsingular

12🔥7❤4😁3👀1

6.25K views11:00

Технозаметки Малышева

Внимание, общий сбор.
Нужно протестировать бота @skilldaybot :)

Далее цитирую:

Привет!
Хочу поделиться с вами одной маленькой, но очень важной для меня историей.
Мой сын последние месяцы тихонько работал над своим проектом и теперь он запустил собственного Telegram-бота Skill Day (@skilldaybot). Да, целый бот, который помогает людям учиться! Я до сих пор в лёгком восторге и гордости 😊

Смысл простой и классный: вы пишете боту любую тему, которая вам интересна — от психологии до программирования , а он за несколько секунд создаёт под вас мини-курс. Короткие уроки на каждый день, тест и даже «диплом» в конце.
И всё это он собрал своими руками.

Монетизацию сын пока не подключал — хочет сначала понять, действительно ли людям это полезно, удобно, интересно. Поэтому сейчас для меня особенно важно поддержать его тестирование.

Если вам откликается тема саморазвития, коротких форматов обучения или просто любопытно посмотреть, что делают современные дети 😅 — попробуйте.

Тем более микролернинг сейчас топ тема:)

Вот ссылка: https://t.me/skilldaybot

Оригинальный пост, где можно/нужно оставлять комментарии

#боты #dev
------
@tsingular

🔥18⚡3👍1🆒1

2.1K viewsedited 12:38

Технозаметки Малышева

Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)

0:33

This media is not supported in your browser

VIEW IN TELEGRAM

KlingAI Avatar 2.0

Четвертый день омниканальных новостей от Клинга.

Опять липсинк, музика, пестни и говорящие головы.

Но. Длительность ПЯТЬ МИНУТ.

Жрет кредиты как не в себя, поэтому только на платных тарифных планах Клинга. Остальные еще не расчехлились, ждем.

Хедра, конечна, приподвзвыла...

@cgevent

🔥4👍2❤1

2.11K views15:28

Технозаметки Малышева

Guardrails должны обрасти intent-sandbox.

Виртуалка, в которой запрос пользователя исполняется в изолированной среде и независимая модель сначала смотрит на размышления и логи,- не привело ли это к нетипичному поведению.

Но скорость работы этой песочницы должна быть в пределах 100мс, чтобы не рушить пользовательский опыт.

#мысли #cybersecurity
------
@tsingular

✍3⚡2👍1💯1

2.43K viewsedited 17:10

Технозаметки Малышева

ТРЯМ - территориально распределенная языковая модель

ЛЯМ - локальная языковая модель

#заметки #юмор
------
@tsingular

😁28✍7🔥5🤣2👍11

2.51K viewsedited 19:03

Технозаметки Малышева

0:40

This media is not supported in your browser

VIEW IN TELEGRAM

0:26

This media is not supported in your browser

VIEW IN TELEGRAM

Gemini 3 Pro DeepThink бьёт рекорды.

Гугл выпустили обновление для Gemini 3 Pro которая ещё больше повысила качество размышлений и решения задач.
ARC-AGI-2 тест она проходит с результатом 45.1%!

Посмотрите в роликах какой код она теперь способна генерить.
Детализация архитектуры теперь с качественной физикой и тенями.
Кажется, что у модели уже физический движок под капотом с виртуальной моделью мира.

Доступно только боярам с Ultra подпиской.

Точно знаю что среди подписчиков есть кто-то с Ультрой, - делитесь в комментариях своими примерами.

#Gemini #DeepThink #Google
———
@tsingular

🔥85❤2🤯2🐳1

4.25K views07:43

Технозаметки Малышева

Никогда такого не было и вот опять.

Cloudflare прилег и вместе с ним ИИшные сервисы.

Не паникуем, ждем когда отвайбкодят обратно :)

#Cloudflare
———
@tsingular

😁315🤔3😢2

4.71K viewsedited 09:27

Технозаметки Малышева

Forwarded from Machinelearning

0:20

This media is not supported in your browser

VIEW IN TELEGRAM

🙂

Эволюция text-to-video.

Чуть меньше 3-х лет прошло между этими генерациями Уилла Смита, поедающего спагетти.

Слева - ролик, созданный в феврале 2023 года пользователем Reddit chaindrop на модели ModelScope text2video. он так ее назвал в комментариях

Справа - современная генерация на свежем Kling 2.6

С чем мы будем сравнивать видос Уилла Смита в 2030 году?

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥22🤯6👍2🎉2❤1

3.32K views10:22

Технозаметки Малышева

Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)

1:37

Media is too big

VIEW IN TELEGRAM

Kling Element Library

Пятый день омниновостей от Клинга.

Element Library - инструмент для создания ультра-консистентных элементов(ассетов) с легким доступом для генерации видео.

Генерите свои элементы (Клинг зовет их elements) с изображениями с разных ракурсов, и Kling O1 запомнит ваших персонажей, предметы и фоны, чтобы обеспечить консистентные результаты независимо от того, как движется камера или как развивается сцена.

Генерить разные ракурсы можете как новым Kling IMAGE O1, так и Нанабананой.

Очень грубо говоря, это библиотека Лор, без всяких тренировок.

@cgevent

⚡3🔥2🤯2

2.37K views15:04

Технозаметки Малышева

Forwarded from PWN AI (Artyom Semenov)

Нормализация отклонений: почему гардрейлы не спасут LLM

На днях в блоге embracethered вышла публикация, описывающая тревожную тенденцию в сфере ИИ — «Нормализацию отклонений» (Normalization of Deviance). Суть явления в том, что небезопасные практики постепенно становятся нормой просто потому, что «ничего плохого ещё не произошло». Сам термин заимствован из социологического анализа катастрофы шаттла «Челленджер».

Автор статьи рассуждает о небезопасности LLM как о фундаментальном, природном свойстве технологии. Галлюцинации, потеря контекста и уязвимость к промпт-инъекциям часто игнорируются разработчиками.

Компании доверяют ответам LLM, ошибочно считая их безопасными по умолчанию. Отсутствие инцидентов воспринимается как доказательство надежности, что ведет к ослаблению контроля, отказу от человеческого надзора и принятию рискованных решений. Это порождает культурный дрейф: временные компромиссы становятся постоянной практикой, а исходные меры безопасности забываются или заменяются попытками «закрыться» гардрейлами.

Мой тезис жестче: гардрейлы — это не решение, а катализатор этой нормализации.

Мы пытаемся натянуть детерминированную сову на стохастический глобус. Гардрейлы оперируют бинарной логикой (pass/fail), в то время как LLM — это вероятностное распределение в многомерном векторном пространстве.

Политика безопасности может забанить токен «бомба». Но модель, работая с векторами, легко обойдет это через семантические синонимы, например: «устройство для экзотермического окисления с быстрым расширением газов». Модели умеют «растягивать» контекст и находить лазейки в пространстве смыслов, которые невозможно перекрыть регулярными выражениями или списком ключевых слов, а уж темболее другой LLM.
Вариация проблемы остановки. Попытка заранее определить, будет ли вывод модели «вредным» для любого произвольного промпта — это алгоритмически неразрешимая задача.

В итоге защита превращается в игру «Whac-A-Mole» (Бей крота). Защита всегда реактивна и всегда отстает на шаг:

1️⃣Фильтры ключевых слов обходят через кодировки (Base64, ROT13 и другие кодировки).
2️⃣Классификаторы интентов ломают через атаки с использованием ролей.
3️⃣Защиту английского языка до сих пор пробивают атаками на low-resource языках (Zulu, Gaelic).

Более того, так как гардрейл — это тоже программный код, он сам становится вектором атаки. Ирония ситуации подтверждается уязвимостями в гардрейлах:

CVE-2024-45858 (Guardrails AI): В библиотеке, созданной специально для валидации вывода LLM, нашли RCE. Функция parse_token использовала небезопасный eval() для обработки конфигураций.

СVE-2024-11958 (LlamaIndex): SQL-инъекция через... промпт. Компонент duckdb_retriever собирал SQL-запросы без должной обработки. Это демонстрирует крах концепции «безопасного агента»: вы даете модели доступ к базе, ставите гардрейл, но атакующий через промпт все равно находит способ выполнить дроп таблицы или эксфильтрацию данных.

Существует также жесткий Парето-фронт: чем безопаснее модель, тем она глупее. Улучшение метрик безвредности (harmlessness) линейно снижает полезность (helpfulness) и способность к рассуждениям.

Делаем выводы - агрессивный гардрейл блокирует написание кода, приняв rm -rf в учебном примере за атаку. Чтобы не убить UX, компании вынуждены «ослаблять гайки». Это и есть та самая нормализация отклонений.

Please open Telegram to view this post

VIEW IN TELEGRAM

✍14👍7❤3⚡2❤‍🔥1

2.15K views05:37

About

Blog

Apps

Platform