Метаверсище и ИИще

Промпты типа "ты эксперт"

Иногда помогают, иногда мешают.

Интересный пост на эту тему:
https://www.linkedin.com/posts/ekiledjian_expert-personas-improve-llm-alignment-but-activity-7442170166022397952-ChNb/
Перевел его почти целиком.

Новое исследование Университета Южной Калифорнии («Экспертные персоны улучшают согласование с языковыми моделями, но ухудшают точность») протестировало экспертные подсказки для создания персон в шести крупных языковых моделях и, наконец, объясняет, почему сообщество получило такие противоречивые результаты.

Вывод прост, но важен: подсказки для создания персон — это инструмент согласования(alignment), а не инструмент получения знаний.

Когда персоны ПОМОГАЮТ:
→ Тон и стиль письма (оценки выросли с 7/10 до 9/10 при составлении профессиональных электронных писем)
→ Безопасность и отказ (устойчивость к взлому улучшилась до 17,7%)
→ Соблюдение формата, структурированный вывод и следование намерениям
→ Более длинные и подробные описания персон усиливают эти преимущества

Когда персоны ВРЕДЯТ:
→ Фактическая точность и поиск знаний (точность снизилась с 71,6% до 68,0%)
→ Математические и логические рассуждения (один пример ухудшился с 9/10 до 1,5/10)
→ Задачи программирования, требующие точного запоминания
→ Более длинные описания персон усугубляют ситуацию

Пять вещей, которые вы можете сделать прямо сейчас:

1. Используйте персоны для творческих, редакционных и задач, требующих соблюдения требований. Откажитесь от них для поиска фактов, вычислений и логики кода.

2. Размещайте описания персон в системном запросе, а не в сообщении пользователя — это важно для хорошо оптимизированных моделей.

3. Если вы используете модели рассуждений (например, DeepSeek R1), полностью откажитесь от использования экспертных персон. Исследования показывают, что случайная персона работает так же хорошо — модель выигрывает только от увеличения контекстной длины, а не от экспертных знаний.

4. Для повышения уровня безопасности одним из самых дешевых и эффективных способов является использование специальной "safety monitor" persona в системном запросе.

5. Когда вам необходимо использовать персону в работе, требующей высокой точности, делайте ее как можно короче, чтобы минимизировать помехи при запоминании фактов.

Итог: рассматривайте подсказки с описанием персон как усилитель тона и согласованности, а не как средство повышения уровня знаний. Знание того, когда их использовать, а когда убирать, является реальным конкурентным преимуществом.

@cgevent

4👍34❤8🔥2😁2😱1

8.17K viewsSergey Tsyptsyn ️️, 09:32

0:29

0:23

0:30

Гигантский датасет трехмерных голов.

Взяли и отсканировали 7547 человек, причем каждого с 11 выражениями лица ( счастье, печаль, гнев, удивление, страх, отвращение)

А дальше тщательно все отретопили и привели к двум топологиям на 200К и 7М полигонов для ВСЕХ лиц. Топологии между собой СОВПАДАЮТ, то есть можно их морфить между собой, как по эмоциям, так и по собственно людям. И получать бесконечное количество новых тварей.

Поглядите на сайт:
https://www.sp-6m.com/

Почитайте цифры.

Помимо 3Д, может пригодится для тренировки нейронок на синтетических лицах и распознавания эмоций.

Ничего скачать нельзя, за лицензированием и использованием надо обращаться в авторам проекта. Координаты на сайте.

Впечатляющий труд.

@cgevent

2🔥63😱16❤9👍1

7.64K viewsSergey Tsyptsyn ️️, 11:33

Dynamic VRAM in ComfyUI: Saving Local Models from RAMmageddon

Dynamic VRAM: гики, обновите ComfyUI

Туда завезли оптимизацию VRAM и RAM. Меньше требования к памяти.

"Функция Dynamic VRAM кардинально меняет подход ComfyUI к обработке весов моделей, что значительно повышает плавность работы для пользователей, использующих оборудование с ограниченным объемом памяти"

https://blog.comfy.org/p/dynamic-vram-in-comfyui-saving-local

@cgevent

blog.comfy.org

A new memory system that makes it possible to efficiently run the largest models on the smallest memory.

2🔥43😱6❤2

7.13K viewsSergey Tsyptsyn ️️, edited 11:44

0:17

Вайб-метаверсинг

Новый и очень интересный проект от Гугла:
Vibe Coding XR: Accelerating AI + XR prototyping with XR Blocks and Gemini

Можно еще сказать - вайб-прототайпинг или вайб-3Дсборка

Речь идет о быстрой разработке приложений дополненной и виртуальной реальности (XR\VR), который позволяет превращать идеи в рабочие прототипы менее чем за минуту.

Ну и правда, обычные приложения уже вайб-кодят, можно взяться за пространственные интерфейсы.

Что внутри:

Связка Gemini + XR Blocks: Gemini выступает в роли эксперта-дизайнера и инженера, понимая пространственную логику.

XR Blocks - это open-source фреймворк на базе WebXR, который берет на себя сложные задачи: физику, распознавание окружения и взаимодействие рук.

Как это работает:

Пользователь описывает желаемое (голосом или текстом, например: «Создай интерактивную лабораторию физики»), и система за 60 секунд генерирует полностью функциональное приложение для Android XR или настольного браузера (в симуляторе).

Обязательно посмотрите примеры по ссылке внизу, вайб-метаверс как он есть.
Google показывает, что такой подход подходит не только для демо, но и для образовательных сценариев. Среди примеров — XR-приложения для геометрии, физики, химии и даже визуализации идеи кота Шрёдингера. По сути, компания продвигает будущее, в котором создание пространственных интерфейсов и учебных XR-опытов станет таким же быстрым и доступным, как сегодня генерация обычных веб-прототипов с ИИ наперевес.

https://research.google/blog/vibe-coding-xr-accelerating-ai-xr-prototyping-with-xr-blocks-and-gemini/

https://github.com/google/xrblocks

Демо: https://xrblocks.github.io/docs/samples/ModelViewer/

https://www.youtube.com/watch?v=nknCzIxHHzw

@cgevent

👍28❤7👎4😱1

6.7K viewsSergey Tsyptsyn ️️, 15:15