Метаверсище и ИИще
35.1K subscribers
4.49K photos
2.61K videos
40 files
5.51K links
Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие.
Для связи: @SergeyTsyptsyn
Download Telegram
Master Camera Movements Like a Pro Director with T2V-01-Director. Часть 2.

2. Главные приёмы движения камеры и их влияние на эмоции
Ниже мы рассмотрим несколько классических движений и обсудим, в каких ситуациях они будут уместны. А главное — поймём, как они незаметно влияют на чувства зрителя.

2.1 Круговые облеты (Circling Shots)

Левый облет

- Напишите: [truck left, pan right, tracking shot]

* Лучше всего подходит для:
- Увеличения напряжения или чувства тревоги
- Показа уязвимости героя
- Раскрытия внутреннего конфликта
- Постепенного нагнетания саспенса

* Психологический эффект:
- Движение против часовой стрелки вызывает лёгкий дискомфорт
- Может напоминать охоту на жертву
- Создаёт впечатление, что персонаж «загнан в угол»

Смотрим: <https://www.youtube.com/watch?v=Hby08EPZV1c>


Правый облет
- Напишите: [truck right, pan left, tracking shot]

* Лучше всего подходит для:
- Создания ощущения ожидания чего-то важного
- Подчеркивания силы героя
- Демонстрации власти или статуса
- Эффектных раскрытий сцены

* Психологический эффект:
- Движение по часовой стрелке кажется «естественным» и придаёт уверенности
- Зритель испытывает чувство открытия, открытия новых деталей
- Подчеркивает лидерские черты персонажа

В общем по против часовой - создаем конфликт. По часовой - создаем любовь)


2.2 Шоты с «идущей» камерой (Walking Shots)

Движение налево (Left Walking)

- Напишите: [truck left, tracking shot]

* Лучше всего подходит для:
- Показа пути, который герой решительно проходит
- Изображения внутренней собранности или поиска решения
- Сюжетных моментов выбора
- Сцен, где движение идёт параллельно основному действию

* Психологический эффект:
- Придаёт ощущение совместного «путешествия»
- Зритель будто идёт рядом, поэтому возникает поддержка героя
- Способствует более крепкой эмоциональной связи
Смотрим: <https://www.youtube.com/watch?v=09JDX42YQ3g>


Движение направо (Right Walking)

- Напишите: [truck right, tracking shot]

* Лучше всего подходит для:
- Демонстрации целеустремлённого движения вперёд
- Позитивных или мотивирующих сцен
- Отражения прогресса, роста, достижения цели
- Моментов, когда персонаж «всё преодолел» и идёт к светлому будущему

* Психологический эффект:
- Ощущается как движение к победе
- Зритель подсознательно верит, что события идут в правильном направлении
- Заряжает энергией и позитивом
Вот еще смотрим: <https://youtu.be/cbqv1kbsNUY?si=wYHKW_E9PWHWP-x8&t=180>

2.3 Горизонтальные «сценические» шоты (Stage Shots)

Слева (Stage Left)

- Напишите: [pan left, zoom in]

* Лучше всего подходит для:
- Театрального представления героя или ключевого предмета
- Усиления ожидания
- Внезапных эффектных выходов
- Фокусировки внимания на чём-то значимом

* Психологический эффект:
- Придаёт особую торжественность происходящему
- Добавляет драматический накал
- Говорит зрителю: «Сейчас будет что-то важное, смотри внимательно!»

Это гениальный Эммануэль Любецки. Кто не знает - срочно гуглите и смотрите его операторскую фильмографию. 

<https://youtu.be/gisQqSu7r44>


Справа (Stage Right)

- Напишите: [pan right, zoom in]

* Лучше всего подходит для:
- Финальных уходов со сцены
- Завершающих аккордов в сюжете
- Окончательных решений или «точки» в конфликте
- Больших эмоциональных кульминаций

* Психологический эффект:
- Даёт ощущение завершённости, будто занавес опускается
- Помогает поставить точку в сцене
- Зрителю комфортнее воспринимать концовку, когда движение камеры идёт «по часовой»

@cgevent
2.4 Вертикальные движения

Наклон вверх (Upward Tilt)

- Напишите: [push in, pedestal up]

* Лучше всего подходит для:
- Подчёркивания роста, победы
- Демонстрации мощи и величия
- Эпичных «геройских» моментов
- Воодушевляющих, вдохновляющих сцен

* Психологический эффект:
- У зрителя возникает чувство восхождения, как будто всё идёт «наверх»
- Добавляет воодушевляющую ноту
- Делает момент более величественным

Вот заявка сцены 

<https://youtu.be/RA0SVlgzbZk?si=nzwqkScZlYRmkY9A&t=4>


Наклон вниз (Downward Tilt)

- Напишите: [pedestal down, tilt up]

* Лучше всего подходит для:
- Подчёркивания уязвимости или ранимости
- Создания более интимной атмосферы
- Выявления деталей, скрытых внизу кадра
- Сцен, где важны «мелочи жизни»

* Психологический эффект:
- Ощущение будто мы «наклоняемся», чтобы лучше разглядеть
- Устанавливает более тесный контакт с персонажем или объектом
- Помогает создать чувство доверия или сочувствия

Еще ныряние вниз может создавать транзишен в юмор 

<https://youtu.be/M_jeYkZVn6U?si=dP1CVbUE1Otfg3bW>

2.5 Пейзажные (Scenic) кадры

Общий вид (Scenic Shot)

- Напишите: [truck left, pedestal up]

* Лучше всего подходит для:
- Открывающих панорам, где нужно сразу показать масштаб
- Выстраивания контекста или атмосферы
- Сцен, в которых локация — полноправный «герой»
- «Погружения» зрителя в новый мир

* Психологический эффект:
- Создаёт ощущение размаха, эпичности
- Помогает глубже окунуться в сюжетный мир
- Работает как «вау-момент», внушающий масштаб

Вообще это называние revealing shot или opening шот. Короче ширик чтобы показать побольше деталей сразу

@cgevent
Master Camera Movements Like a Pro Director with T2V-01-Director. Часть 3

3. Как применять эти приёмы в AI-генерации


3.1 Куда вставлять команды

- Размещение тегов
Пишите свои команды прямо перед или во время описания ключевого действия.
- Правильно: «Рыцарь выходит на арену [pan right, zoom in], завоёвывая внимание публики.»
- Неправильно: «Светлая, тёплая сцена [pan right, zoom in] с рыцарем в центре кадра.»

* Одновременные vs. последовательные движения

- Одновременные: [pan left, pedestal up]

- Последовательные: [pan left][pedestal up]


3.2 В какие моменты использовать готовые пресеты

1. Сюжетные пики
- Выбирайте движение, усиливающее нужную эмоцию
- Соотносите его с поворотным моментом в истории

2. Раскрытие персонажа
- Движения должны подчёркивать внутреннее состояние
- Камера как бы «раскрывает» героя через движение

3. Поддержка атмосферы
- Если сцена сама по себе напряжённая, камерой можно это усилить
- Если она лёгкая, движение камеры может придать дополнительную воздушность

3.3 Сочетание разных движений
- Можно комбинировать два-три движения, чтобы добиться сложного эффекта.
- Не переборщите: чрезмерная акробатика камеры может сбить зрителя с толку, словно вы разом включили «Панораму», «Вести» и «Спорт» в одной трансляции.


4. Частые ошибки

1. Чрезмерность
- Если каждый кадр крутится и летает, зритель устанет.
- Экономьте мощные приёмы на ключевые эпизоды, как драгоценности.

2. Несоответствие настроению
- Не стоит ставить [push in] на резкий экшен, где логичнее [tracking shot].
- Разница между тревожным и воодушевляющим моментом в том, как движется камера.

3. Неправильная синхронизация
- Камера должна идти в такт событию.
- Если персонаж замер на месте, а камера несётся, как на бешеном поезде, может получиться комично (иногда, впрочем, это отличный комедийный ход, привет Леонид Гайдай!).

5. Примеры использования

1. Нервный диалог
- Начать на [static shot] для ровного фона,
- При обострении конфликта добавить [push in], чтобы зритель прочувствовал напряжение.

2. Эпический выход героя
- «напишите: [pan left, zoom in]», когда персонаж эффектно появляется на сцене, словно герой в конце комедии Гайдая, вызывая бурю оваций.

3. Грандиозное открытие локации

- «напишите: [truck left, pedestal up]», медленно раскрывая простор или масштаб здания, как в лучших традициях Эйзенштейна.

6. Итог: осмысленные движения творят магию

Движения камеры — это мощный инструмент, который заставляет нас сопереживать и верить в происходящее на экране. Если подойти с умом:

1. Начинайте аккуратно — не надо с места в карьер махать камерой во все стороны.

2. Соответствуйте эмоции — доверяйте ощущению сцены, не делайте лишних движений.

3. Используйте дозированно — выдавайте эффектные приёмы только там, где они нужны.

4. Думайте о сюжете — ведь камера должна усиливать историю, а не затмевать её.

Всем творческого вдохновения!

@cgevent
This media is not supported in your browser
VIEW IN TELEGRAM
Если вы уже отошли от ночного чтива про управление камерой, то вот вам немного фана.

Поглядите как DeepSeek крутится на айфоне. Локально. В авиарежиме. Оцените скорость.

Это:
deepseek-r1-distill-qwen-1.5b-8bit
https://huggingface.co/mlx-community/DeepSeek-R1-Distill-Qwen-1.5B-8bit

Запускается с помощью MLX и вот такого приложения.

И тут пользователи Apple Intelligence такие: а что так можно было? Без Сири, chatGPT, OpenAI и вот этого вот всего?!?!

Кстати, у Apple Intelligence и Сири большие проблемы, вот тут пишут, что она грандиозно лажает в своих ответах, процент правильных ответов о давно прошедших спортивных матчах - 34% и ниже. И некоторые фейлы просто эпичны. Что бросает тень на большого брата большого брата - OpenAI. А скоро выпуск ИОСь 18.3, где AI по дефолту. А Сири все тупее...

В общем я это к тому, о чем уже писал: похоже грядет поляризация на локальные легкие и шустрые модели, которые крутятся "на кармане" и миллиарды параметров, которые крутятся в облаке. А ноутбуки с 5090 останутся уделом технопсихов (как мы с вами).

Спасибо подписчику Диме.

@cgevent
Кстати, в десктопной телеге наконец-то исправили противный (для тех, кто туда много пишет) баг.
Теперь, когда выделяешь жирный текст и делаешь его ссылкой, он перестает терять свою жирность.

Ну и до кучи, для Google Doc есть Addon, который переводит разметку Google документа в маркдаун.

Маркдаун - это такой html на суперминималках, который понимает Телега.

Вчерашние пост от Мигеля именно так делал - из Гуглдока в Телегу с разметкой.


@cgevent
Forwarded from AI Product | Igor Akimov
Хах. Заменяем Figma прям сразу на прототипы!
В целом, уже приживается такой подход.
Фул-стек продакт-менеджеры и прототипы вместо спецификаций. Все к этому идет
У Suno новая фича: Lyrics Co-Writing

Rewrite, refine, and remix your lyrics with our new co-writing feature—line-by-line edits, real-time tweaks, and version tracking all built in.

Тут я потерялся: будет ли это способом поправить только то слово, которое ИИ произнес с неправильным ударением? Или он все перегенерит?

А real-time tweaks звучат вообще огненно.

Надо пробовать.

@cgevent
А еще в Suno завозят новую модель для генерации текстов.

И она без цензуры! См. скриншот.

Модель называется Remi, но, словам самих Суновцев, не так хорошо слушается промпта - ReMi is meaningfully worse at following instructions

Еще бы, хулиган на то и хулиган, чтобы не слушаться и материться.

@cgevent
Новые возможности для инвестиций и своя "дача" у моря — это Таиланд

Что, не ожидали? Регион активно развивается, рынок не перегрет. Стоимость недвижимости растет, потому что территория для застройки ограничена.

Иностранцам доступны рассрочки, а доходность в валюте составит 5-7% при сдаче в аренду на долгий срок или до 10% посуточно. А еще здесь стабильная к $ валюта и почти 0% инфляции.

Разобраться в недвижимости Таиланда помогает на своем канале аналитик Андрей Негинский. Он каждый день публикует квартиры и виллы для жизни и инвестиций, рассказывает об особенностях рынка недвижки и местного быта.

Подписывайтесь на канал и забирайте подборку объектов в Таиланде в закрепленном сообщении.

#промо
Hugging Face Inference Providers

А вот это интересно. Вот раньше вы находили (ссылку этом канале) интересную модель на Hugging Face. Читали, восхищались и шли искать, где попробовать.

Да, у Hugging Face были и есть свои Spaces, то есть сервера.

Но теперь они переходят на Serverless-решения:
«Бессерверные провайдеры процветают, и настало время для Hugging Face предложить простой и унифицированный доступ к бессерверному выводу через набор отличных провайдеров»

Короче, нашли вы ссылку на модель на Hugging Face и прямо тут же можете ее погонять на сайте Hugging Face.
А не идти на FAL, Replicate, TogetherAI или СамбаНову.
Они сами пришли!

Можно гонять DeepSeek R1, Llama, Flux, Whisper прямо на сайте Hugging Face.

"Hugging Face заявляет, что разработчики, которые пользуются услугами сторонних облачных провайдеров через ее платформу, будут платить стандартные ставки API провайдера, по крайней мере, на данный момент. (В будущем Hugging Face может заключить соглашения о разделе доходов с партнерами-провайдерами)
Все пользователи Hugging Face получают небольшую квоту кредитов для использования, а подписчики Hugging Face Pro, премиум-уровня Hugging Face, получают дополнительные 2 доллара кредитов в месяц."

https://techcrunch.com/2025/01/28/hugging-face-makes-it-easier-for-devs-to-run-ai-models-on-third-party-clouds/

@cgevent
Krea прикрутили у себя Минимаксовскую Hailuo's Subject Reference.

Теперь в Креа можно грузить свои или чужие фотки и надеяться на консистентность этого персонажа.

Не уверен, что на котиках будет работать.

Креа молодцы, в среднем за две недели внедряют новые фичи из всего, что у них шевелится на сайте.

Постепенно превращаются в монстр-аггрегатор всех генераторов и не забывают про свои фишки.

Сейчас Freepik пытается за ними угнаться, тоже аггрегируя у себя разные модели.

Надо, конечно, считать экономику - возможно, если вы пробуете разные генераторы постоянно, то выгоднее брать Krea, но если сидите на чем-то одном, то вряд ли.

Кто плотно сидит в Креа?

@cgevent
Стартапам на заметку

Отчет от a16z про голосовых агентов.

Интересно, что сделано на gamma.app

"Начнем с того, что мы считаем голос одним из самых больших открытий для ИИ. За последние шесть месяцев мы стали свидетелями огромных шагов вперед со стороны моделей. Задержки и надежность теперь в значительной степени решены, а натуральность и эмоциональность также достигли больших успехов. Голосовой искусственный интеллект теперь почти соответствует человеческим стандартам, позволяя технологиям заменить работу по телефону. В результате произошел взрыв стартапов, создающих приложения на основе этих моделей. Только в Y Combinator было представлено 90 проектов голосовых агентов. Многие из них ориентированы на конкретные вертикали - по отраслям (например, бытовые услуги, стоматология) или функциям (например, рекрутинг, поддержка клиентов) - и быстро масштабируются!

В большинстве случаев мы видим, что голос - это wedge, а не продукт. Большинству компаний необходимо задействовать смежные рабочие процессы: передавать данные о звонках в CRM, автоматизировать последующие действия и т. д.

Что мы ищем в стартапах голосовых агентов:
- Работают в отрасли, где телефон является предпочтительным или обязательным средством связи или имеет гораздо более высокий процент успеха по сравнению с другими способами
- Звонки ограничены - как по длительности, так и по формату/результату
- Голосовой агент обеспечивает снижение затрат на 50%+ при одинаковом с человеком проценте успеха
- Звонки являются "жизнью или смертью" для клиента - они заплатят значительные деньги, чтобы их совершили или ответили на них... но не для конечного потребителя
- При продаже на SMB/среднем рынке агентский продукт имеет простую интеграцию. При продажах на корпоративном рынке сложная интеграция может стать moat!"


@cgevent
Кхтулку 405B

Пардон, Tülu 3 405B

Раньше писали "мы побиваем 4o\o1", сейчас пишут "мы уделываем Deepseek"

Ну и акценты смещаются с тренинга на скейлинг.

Институт Пола Аллена выпустил Кхтулку на свободу, в опенсорс.

https://allenai.org/blog/tulu-3-405B

@cgevent
Ну и от такого шума даже французы проснулись после нового года.

Мистраль 3. Лицензия Apachi 2.0 - делай, что хочешь. Опен-сорс. Веса на всех торентах датацентров.

https://mistral.ai/news/mistral-small-3/

@cgevent