ИИволюция 👾
6.92K subscribers
375 photos
225 videos
343 links
Авторский канал Сергея Пахандрина про AI, нейросети, ChatGPT (и другие LLM). Рассказываю о своём опыте и экспериментах с AI.

По всем вопросам: @pakhandrin
Download Telegram
Microsoft показали нейросеть, которая по одному портретному фото и аудиодорожке создаст супер реалистичное видео.

Синхронизация губ, живое выражение лица и естественное движение головы при разговоре!😱

Нейросеть называется VASA. На входе одно статичное портретное изображение и аудиодорожка с речью.

Будет поддерживаться даже онлайн-генерация в реальном времени с разрешением 512х512 и 40 кадров в секунду с незначительной задержкой.

Пощупать пока нельзя, есть только paper со множеством примеров https://www.microsoft.com/en-us/research/project/vasa-1/

Но радует, что таких анонсов от различных компаний становится всё больше, а значит уже скоро мы перестанем различать в сети живых людей на видео и сгенерированных.

Давно жду такой инструмент для генерации маркетинговых UGC креативов. Пока ничего адекватного нет.

ИИволюция ☕️
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Попросил ChatGPT сгенерировать изображение кентавра в штанах. Не спрашивайте зачем мне это 🌚

Я конечно ожидал чего-то иного 😅

Кентавр на первой картинке так вообще повеселил 😂

Промпт: фото кентавра в штанах.

ИИволюция🌚
🚩ouTube внедряет AI-ассистента

Я как-то прозевал анонс этой штуки (а был он аж в 2023 и был доступен очень узкому кругу лиц на тесте), но она все равно доступна только в США, только по подписке и только для видео на английском языке, а еще вам должно быть 18+.

1️⃣Conversational AI: появилась возможность задавать вопросы по видео. Можно спросить короткий пересказ, задать вопросы по содержимому видео, и даже попросить что-нибудь похожее порекомендовать. Хотя последнее и так отлично работало через рекомендательную ленту под видео. Но самое интересное, что всё это работает не прерывая воспроизведение. Просто нажимаете на кнопку Ask и задаёте свой вопрос.

2️⃣Основные темы обсуждения в комментариях: комментарии под видео иногда несут больше пользы, чем само видео. Иногда в комментариях идут бурные дебаты, но листать эту огромную ленту утомительно. Поэтому теперь можно просто посмотреть основные темы обсуждения в комментариях и быстро перейти к интересному обсуждению.

Выглядит, конечно, полезным, особенно суммаризация видео. В наше время, когда контента столько, что не хватит и всей жизни на его просмотр, такие вещи очень облегчают жизнь.

ИИволюция🤖
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🤝Многие уже знают Сергея Цыпцына, и я сам давно подписан на его канал "Метаверсище и ИИще". Если вы всё еще не знаете, он ведет один из самых популярных каналов про ИИ. К тому же, Сергей — эксперт в области компьютерной графики, а еще он написал книгу "Понимая Maya", и нет, это книга не про тех Майя, о которых вы могли бы подумать.

Сергей не устаёт "хоронить" профессионалов самых разных направлений — от художников до разработчиков. Но дед пошёл дальше и казнил... камеру-раздеватор. Почитайте, это любопытно.

В последнее время он кажется почти легендарно безумным. Например, он провёл глубокое исследование и открыл кроличью нору, полную бесконечной и бессмысленной музыки.

А еще на его счету 619 употреблений слова «кожаный» в постах (это не шутка, проверено!).

В общем, рекомендую подписаться и читать его блог, чтобы действительно понимать и осмысливать, как развивается всё это ИИ-безобразие в нашем мире.
Please open Telegram to view this post
VIEW IN TELEGRAM
👁Мой персональный AI-ассистент и планировщик дня

Почти год каждый день пользуюсь современным планировщиком дел, где основную роль играет AI-ассистент. Используется GPT-4 под капотом, поэтому очень умная штука!

☕️Озвучиваю ему все свои планы голосом (прям всё-всё наговариваю с утра за чашкой кофе), а он занимается организацией моего дня и легко понимает русский язык. Но если вам неудобно говорить, можно написать ему текстом вашу "команду" (сегодня у меня одни созвоны!!!😂).

Я подключил свои календари и теперь всеми задачами управляю в одном месте. Бац-бац, задачи помечены как выполненные, и сразу такой кайф от того, что видишь прогресс и понимаешь, что вечер пятницы уже близок!

А недавно AI-ассистент прокачался и теперь он легко понимает множество команд (показал вам на скриншотах, что он умеет, и это далеко не всё):

- Может легко передвинуть или отменить встречу.
- Напомнить о дате и времени далекого события. Я вот забыл, когда приём у стоматолога у моей дочери, спросил у ассистента, и он мне сказал дату и время. Дико удобно!
- В каждую задачу ассистент добавляет прикольные и частенько полезные советы и лайфхаки. Это прям моя любимая штука.
- А когда прилетает уведомление с напоминанием о задаче, например, мне он напоминает с вечера, что рано утром у меня пробежка и добавляет короткую пометку, чтобы я не забыл собрать одежду и гели заранее. В общем, заботливый он!
- А еще он теперь отвечает вообще на любые вопросы. Может проанализировать расписание и дать по нему советы или просто подбодрить вас, когда у вас уже нет сил, но очень хочется написать полезный пост на канале в пятницу вечером ❤️

Приложение одно из моих любимых для iPhone, называется Day Flow (для Андроида скоро будет). Я его всем и всегда рекомендую. Нужно идти в ногу со временем и использовать нейросети по максимуму.

Установить можно по ссылке из App Store. Кстати, оно сейчас зафичерено на главной странице App Store, это о чём-то да говорит! Раз даже Apple продвигает это приложение, значит не я один кайфую от него 🏆

Всех с пятницей! ❤️
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Так и живём 🍔
Please open Telegram to view this post
VIEW IN TELEGRAM
AGI уже здесь 😅
Please open Telegram to view this post
VIEW IN TELEGRAM
На прошлой неделе мир узнал о модели LLaMA-3-70b, и она с ноги ворвалась в чарты, расталкивая локтями другие модели на арене чатботов. Пока GPT-4 Turbo держится на вершине, но похоже, его лидерство продержится не долго.

Смотреть на битву моделей так же интересно, как наблюдать за гладиаторскими боями, только теперь на арене выступают языковые модели. Звучит странно, правда?

Что действительно удивляет, так это скорость, с которой мы привыкаем к новинкам. Ещё год назад ChatGPT вызвал фурор, предложив нам общение с машиной, которая почти на все отвечает. Конечно, приходится подождать, пока она “напечатает” ответ, но это было волшебно.

Теперь же, когда привычка взяла своё, начинаешь хотеть большего: чтобы было качественнее и быстрее. И вот Groq добавил поддержку LLaMA-3-70b, и рядом с этим сочетанием скорость GPT-4 Turbo кажется как интернет через модем. Ты просто сидишь и ждешь ответ, и это таааааак медленно! 🐌

Невероятно, как быстро мы привыкаем к хорошему, но когда видишь что-то лучше, уже не хочется возвращаться назад. Groq + LLaMA-3-70B = 🚀

Попробовать можно тут https://groq.com, а я себе даже успел урвать инвайт в TestFlight на неофициальное приложение Groq от одного AI-энтузиаста.

Ждём, когда OpenAI снова будет удивлять, и так по кругу.

ИИволюция🤖
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🤖 Что такое дипфейки, зачем их создают и как от них защититься

Начинаю цикл постов по дипфейкам. Дело в том, что популяризацией нейронок их станет больше, а значит — станет больше мошенников. От таких людей никак не избавится, поэтому лучший способ — заранее узнать о всех способах обмана и не попасться на удочку мошенников.

Что такое дипфейки. Это видео, аудио или фото, которые создаются нейронками. Для этого им скармливают много настоящих записей человека: голосовых сообщений, фотографий и видео. По ним нейронки учатся подделывать лицо, мимику и голос. В итоге получается очень реалистичная, но полностью поддельная запись.

Известные примеры дипфейков — помолодевшие Аль Пачино, Роберт Де Ниро в фильме «Ирландец» (крутой фильм, советую). Там 80-летних актеров омолодили лет до 50.

Как дипфейки используют мошенники. Думаю, все знают тот самый развод «я попал в аварию, скинь деньги на штраф». Сейчас в такое редко верят, поэтому мошенники придумали новую схему: они собирают данные о человеке, ищут его фотки, аудио и видеозаписи в интернете, а потом на основе этого контента создают дипфейк. И уже с созданного дипфейка общаются с жертвами.

Можно выделить 2 способа обмана.

1️⃣ Мошенники копируют голос жертвы, генерируют копию его голоса в нейронке с просьбой перевести деньги или что-то в этом роде. А потом звонят родственникам и друзьям жертвы, включают сгенерированный голос и ждут чуда.

2️⃣ Мошенники взламывают социальные сети жертвы и пишут от её имени кому попало из контактов с просьбой занять денег. А в подтверждение того, что это пишет сама жертва — присылают голосовые сообщения. А если пишут в Telegram или WhatsApp — могут даже круглые видео прислать. И сразу подделку не заметишь — кружок реально выглядит так, будто его записал тот самый человек.

И это не шутки, одну такую историю я читал у Сергея Бурого. А ему про этот обман рассказал подписчик.

На этом первый пост все. В следующих частях расскажу, как отличить дипфейк от оригинала и как постараться защититься себя, чтобы самому не стать дипфейком.