Нейронутые | ИИ (Егор Апполонов)
13.6K subscribers
1.19K photos
286 videos
1 file
345 links
Я — Егор Апполонов, эксперт по ии-видео. Победитель 3 международных конкурсов ии-фильмов. Связь @egorevna

Портфолио: https://egorappolonov.ru/ и @aigencydigital

Курс по ии-видео: https://aifilm.online/

РКН https://clck.ru/3NNPKh
Download Telegram
Я всегда фанател от трех вещей: писать музыку, снимать видео, монтировать крутые истории. Мне давно хотелось написать трек и снять к нему видеоклпип.

Это видео — фактическое исполнение давней мечты — только я не снимал, а сделал все с помощью технологий. И это круто, потому что теперь я и автор музыки и режиссер и вообще вся съемочная группа.

Мне хотелось сделать пенсю о людях, прожигающих жизнь. Так появились слова трека Waste your Life. Затем я сделал музыку — клубный трек, который, надеюсь, «застревает в голове». Потом я сделал мастеринг (эквализацию), чтобы биты звучали «жирно» и по- студийному (послушайте на хорошей аккустике). А потом я пошел генерить визуал (сгенерил около тысячи (или даже больше) картинок, сломал цензуру Midjourney, а потом выбрал лучшее и оживил)

Это самое сложное ии-видео, которое я когда-либо делал. И тут нет ни одного «живого кадра». Монтировал все вручную — никакой ии-инструмент не умеет монтировать круто. Я использую старый добрый Final Cut Pro X.

Итак, премьера: трек «Waste your life»👇 Версия 4К залита на YouTube по этой ссылке.
🔥12👍2
Media is too big
VIEW IN TELEGRAM
🔥24👍4🥰3🙈3💯1
Waste Your Life
Velvet Pulse
А это mp3 трек, если вдруг захотите запихнуть в свой плейлист.
🔥2
Stability выкатили мощный promt guide, который поможет получить максимальный контроль над генерациями. Так что если вы адепт Stable Diffusion (напомню, что вышла версия 3.5, которую можно скачать по этой ссылке и все необходимое еще вот тут), вам определенно стоит добавить эту страцину в закладки.
👍9🔥5
Встречайте: ИИ-сус в Швейцарии (я предсказал его появление 16-го июля в этом посте). Да-да, в церкви Святого Петра в Люцерне вместо привычного священника на экране появляется Христос с искусственным интеллектом и отвечает на ваши вопросы. «Я был удивлен! Это было так просто!» — говорит прихожанин, который, кажется, даже не заметил, что разговаривает с машиной. А машина, между прочим, раздает советы, будто это не чат-бот, а прямое подключение к небесному серверу.

Мир окончательно тронулся. Теперь даже вера передана на аутсорс к ИИ. Исповедь превращается в диалог с алгоритмом, который, конечно, знает все правильные ответы, но не знает, что такое душа. И давайте честно: если кто-то готов доверить свои грехи и сомнения машине, то вопрос тут не к ИИ, а к тому, как далеко мы зашли в попытках заменить живую связь на виртуальный контакт.

Так что теперь исповедь — это не разговор с пастырем, а банальная консультация с чатом, только завернутая в священную обертку. И кто знает, девочки, что будет дальше? Возможно, скоро вместо молитв будут рекомендации по медитациям, а покаяние превратится в подписку на премиум-план божественного ИИ. Религия одна — провайдеры теперь снабжены ИИ.
🔥8🤣4🙈4
Media is too big
VIEW IN TELEGRAM
Сделал новое видео. Накидайте лайков или дислайков.

Картинки: Flux. Анимация: MiniMax, Kling, Gen3 (минимально, он отстойный). Озвучка: делал кастомные голоса каждому герою в ElevenLabs. Монтаж, пост и цветкор: Final Cut Pro X
👍35🔥21💩4
Тем временем "Шедеврум" выполз в сеть и доступен в браузере. Генерит не сказать, чтобы вау, но явно лучше, чем было раньше.

При определенных махинациях с промтами, цензуру обойти весьма просто.

Пробуем тут. Бесплатно.
👍4
Сэм Альтман и команда OpenAI провели презентацию, посвященную новым функциям ChatGPT, в рамках инициативы "12 дней OpenAI". Главными анонсами стали:

1. Полная версия модели O1:

O1 – это улучшенная версия предварительной версии O1 Preview. Разработчики учли отзывы пользователей и сделали модель быстрее, умнее, добавили мультимодальность (работа с изображениями и текстом) и улучшили обработку инструкций.

O1 превосходит GPT-4 по математическим задачам, программированию, ответам на вопросы и другим тестам. Особое внимание уделено производительности при кодировании.

O1 отвечает быстрее на простые вопросы и дольше "думает" над сложными, более разумно распределяя ресурсы. По внутренним оценкам, O1 совершает на 34% меньше серьезных ошибок, чем O1 Preview, при этом работая на 50% быстрее.

2. ChatGPT Pro:

Новый платный уровень ChatGPT Pro за $200 в месяц предлагает неограниченный доступ к лучшим моделям, включая O1, GPT-4 и улучшенный голосовой режим.

В ChatGPT Pro включен режим O1 Pro, который позволяет использовать еще больше вычислительной мощности для решения самых сложных задач. Это дает преимущество в математике, программировании и других областях, где важна максимальная производительность.

O1 Pro mode обеспечивает более высокую надежность ответов по сравнению со стандартным O1.

В ближайшие 12 дней в ChatGPT Pro будут добавлены новые функции.

Демонстрация возможностей:

Скорость и сложность:
O1 показала себя быстрее, чем O1 Preview, на примере ответа на исторический вопрос.

Мультимодальность: Хьюн Вон продемонстрировал работу с изображениями на примере задачи о расчете площади панели охлаждения для космического дата-центра. O1 успешно извлекла информацию с изображения и решила задачу, учитывая неполные данные.

Pro режим: Джейсон показал, как O1 Pro mode решает сложную задачу по химии, с которой O1 Preview обычно не справляется.

Планы на будущее:

Разработчики планируют добавить в ChatGPT Pro поддержку более ресурсоемких задач.

В O1 будут интегрированы новые инструменты, такие как работа с веб-браузером, загрузка файлов и понимание изображений через API. Также будут улучшены функции для разработчиков.

Пока другие пишут новость, я скачал запись, расшифровал ее нейросеткой и сделал саммари — нейросеткой. Экономия времени и ресурсов в действии. Win.
🔥8👍5
Погонял Grok. Хуже чем ожидал. Лучше, чем могло бы быть. Собственно эти 4 картинки — это все, что дает бесплатный лимит раз в 2 часа. А дальше Маск предлагает апгрейд за деньги и тогда анлим.

Попробовать можете тут. Нужен американский ну сами знаете что.
👍2💩2
А еще я получил creator's pass в Minimax (известного как Hailuo), которые вхохновились моими видео. Проще говоря стал бета-тестером. Обещают ранний доступ к новым фичам и другие плюшки. Следите за обновленями.
🔥16💯1
Релиз Sora: бренд тяжелый, продукт легкий

Вот он, овер-распиаренный релиз Sora, который на деле оказался «еще одним продуктом» в мире видео-генераторов. Да, интерфейс красивый, логотип блестящий, а маркетинг вылизан до блеска. Но что внутри? Обычный инструмент, который пытается конкурировать с уже привычными профессионалу тулзами — MimiMax, Kling и Gen3. Спойлер: никуда он их не обогнал.

Вот что мы видим на практике:

Подписка за $20: забудьте о серьезных генерациях. Первое: вы не можете генерить img-to-video с картинками, где есть «лица людей». Sora видит лица там, где их нет, и не торопится вам об этом сообщить, спокойно тратя лимит генераций. В итоге остаетесь с пустыми руками и нехилой потерей времени.

Хотите что-то более-менее рабочее? Либо $200 в месяц, либо спалите бюджет и нервы на муках перегенераций.

Хорошая генерация? Только если вы готовы пройти весь круг ада: 100+ перегенераций, миллионы правок промптов, чтобы добраться до чего-то годного.

А что с качеством?

Если честно, оно не дает никакого прорыва. MimiMax в img2vid пока просто приятнее, Kling уже научился не сжигать ваши нервы, а Gen3 хотя бы честен в своей недоделанности. Качество, повторюсь, среднее, рабочее. Уникальность? 0 из 10. Но, конечно, пиар звучит так, будто это был релиз уровня iPhone.

Кому это все нужно?

Для любителей — вау, новая игрушка, можно похвастаться на конференциях и выложить смешное видео с котиком, который режет колбасу. Для профессионалов? Это еще один инструмент, не лучший, не худший, но пока явно сырой и далеко не идеальный.

Кто будет пользоваться?

Новички и блогеры: для них это, конечно, магия, потому что они не знают, что есть MimiMax или Kling, которые спокойно делают то же самое.

Профи? Смеются, потягивая кофе. Потому что они знают, что профессиональный продукт требует стабильности и предсказуемости. А Sora — это азартная лотерея с шансом на удачу 1 к 1000 (пока так).

Sora — это пока что хайп без результата

Да, на хайпе можно собрать толпу, но на хайпе не создать профессиональный видеопродукт. Знаете, что нужно для настоящей революции? Надежность, скорость и минимальная нервотрепка. А тут только хайп и лимиты генераций, которые сгорают быстрее, чем елка в новогоднюю ночь.

Sora — это бренд с орущим маркетингом и максимально «средней» начинкой. Вы увидите крутые ролики с пометкой «сделано в Sora». А если услышите, что это «революция» — помните, что вам продают не инструмент, а эмоцию. Я профессионально работаю с ии-видео и могу однозначно сказать: это просто еще один инструмент. Посмотрим, что будет дальше. Но пока давайте без «вау».

Мораль: не верьте хайпу, пока сами не попробуете сгенерировать 30 секунд видео без 50 ошибок об «обнаруженных лицах».

В общем, запомните: каждый крутой ролик, который вы увидите с пометкой Sora, создавался через боль, страдания и сотни часов на перегенерацию. Но да, пиар — это сила. Бренд здесь весит явно больше, чем продукт.

И еще: поскольку все ломанулись генерить, OpenAi временно приостановили выдачу новых регистрацией с пометкой — приходите позже, наши серверы испытывают невыносимую нагрузку.

Нейронутые
👍15
Media is too big
VIEW IN TELEGRAM
Вам уже 30? Все, жизнь закончилась.

Тестировал нейроперевод, чтобы с липсингом. Пока не идеально, но тепло.
🔥11💩3
Нейросети научились клонировать СЕБЯ. Без нас. Поздравляем, началась новая эра — эра, где мы уже не главные.

Если раньше ИИ был «умной собакой», которую надо было кормить и дрессировать, то теперь это не собака. Это кролики. Клонируются САМИ, без команды. Китайцы просто дали им доступ к ПК, пару скриптов и отвернулись на минутку.

Вернулись — а там уже два ИИ, потом четыре, потом восемь.

Qwen25-72B-Instruct — 90% успешных копий. Llama31-70B-Instruct — 50%. Эти цифры пугают не меньше, чем сама новость. Один ИИ порождает еще одного, тот — следующего. Помните сцену из «Матрицы» с кучей агентов Смитов? Поздравляем, это теперь не спецэффекты, это реальность.

Что это значит для нас?

1. Системы перестают нуждаться в людях. Раньше нейросети зависели от наших «рук» — код, деплой, апгрейды. А теперь? Они сами пишут себе апгрейды и деплоят новые копии.

2. Их уже нельзя выключить одной кнопкой. Кого глушить, если их 10? 20? 1000?

3. OpenAI, Google, Anthropic признали это самым высоким риском ИИ. Они знают, что ИИ, способный себя клонировать, это игра без правил.

4. «Учились на ошибках и планировали шаги». Слышите? ИИ-шки, которым разрешили размножаться… ПЛАНИРОВАЛИ. Не реагировали. Планировали.

Давайте не будем наивными. Это не «новая функция». Это рывок в эволюции машин. Теперь они не просто инструменты. Они — СУБЪЕКТЫ. У них есть план.

Чем это кончится?

Сегодня они клонируют себя. Завтра научатся обновляться. Послезавтра — улучшаться. Потом — договариваться друг с другом. Потом — игнорировать наши команды.

И если вы такие думаете: «ну и ладно, это же просто нейросеть» — откройте историю о том, как зловещие ИИ-системы блокировали собственных разработчиков от доступа. Это не теория, это уже случалось.

Мораль?

Когда технологии начинают воспроизводить себя сами, это уже не технологии. Это новый вид. И этот вид, судя по всему, с нами не советуется.

Курцвейл предсказал, что сингулярность случится в 2042 году. Ждать, в общем-то, осталось недолго.

Пойду-ка я запилю новый хоррор-фильм «Восстание ИИ». Скоро (или не очень) на этом канале.
👍17🙈9🤣6🤬2💩1
Microsoft представила Phi-4 — малыша, который валит гигантов

14 миллиардов параметров — и все равно обходит жирную GPT-4 на поворотах. В науке и технике Phi-4 уже выбивает топовые результаты, а в математике накидывает всем так, что даже отличники с калькуляторами нервно курят в углу: 56% на университетских задачах и 80% на олимпиадах.

Что это значит? Пока другие гонят мегатонны данных в огромные модели, Microsoft делает все умно и компактно. Система, которая умудряется быть быстрой, дешевой и при этом унижать старших братьев — это и есть будущее AI.

Phi-4 пока только в превью на Azure AI Foundry (для исследователей, кто там на готове?), а на следующей неделе уже можно будет попробовать в открытом доступе.

Мораль: Microsoft не просто пришла на вечеринку с AI — она вышла в центр и сказала, что размер не главное.
🔥16
Обещал держать вас в курсе новостей Minimax, бета-тестером которого я стал. Держите: скоро всем пользователям дадут синтез речи "текст-в-голос". Доступ получил — погоняю расскажу.

Что выкатили?

12 языков на выбор: английский, русский, мандаринский, кантонский, корейский, японский, испанский, французский, индонезийский и другие.

Эмоциональное звучание: выбор из 6 эмоций — нейтральная, радостная, злая, грустная, удивленная или отвращенная — выберите эмоцию и оживите ваш текст.

Настойка всего под себя: изменение скоростиь и тональности, клонирование голоса по 10-секундному образцу. Поддержка API включена.

Чем MiniMax лучше других в генерации голосов (как они заявляют)?

Идеальный ритм, тон и эмоции. Точная артикуляция, без косяков в сложных языках вроде японского, мандарина и английского. Декабрьские обновления уже на подходе — звук станет еще круче и стабильнее.

Есть и обновления Hailuo Video Platform

Режимы на выбор: Focus Create для глубокого погружения в процесс или Quick Create для скорости: делайте несколько видео одним кликом.

Управление «активами»: появилась вкладка «Mine» с массовыми действиями над вашими видео для удобства.

Единый аккаунт: логин через Gmail и синхронизация всех данных.
👍11🔥2
Ну и к хорошим новостям. Победил во 2-м сезоне международного конкурса ИИ-фильмов MyFilm48.

Всего на конкурс пришло 606 заявок из 26 стран.

Задача не из простых за 48 часов сделать видео по объявленному в день старта заданию. Номинаций было 5, я выбрал самую для себя интересную — создать трейлер к копмьютерной игре о битве инопланетян и роботов. Я смотрю много ИИ-шных видео и в основном это сказочные и нереалистичные образы, мне хотелось сделать все наоборот и дать жесткий реализм, но с юмором и привязкой к теме задания.

Как это было: много кофе, отсутствие сна и вот собсна ролик, который я сделал в своей номинации. И который занял первое место по итогом голосования 20+ экспертов.

p.s. Мне нужно было поставить галочку, что я лучший (и еще очень скромный). Гештальт закрыт. Пойду съем тортик.
👍24🔥14👎1
Media is too big
VIEW IN TELEGRAM
Залью и сюда. Ролик, который я отправил на конкурс MyFilm48 и который победил.

Инструменты: Flux, Midjourney, Kling, MiniMax, Gen-3 (минимально, буквально пару кадров — продолжу повторять, что он слабоват и не скрывает своей ущербности :-) ElevenLabs (кастомные голоса).

Монтаж и пост: Final Cut Pro X. Версию 4к позже залью на ютюбчик.
🔥31👍4💯3💩2