Анонимный телеграм-канал
39 subscribers
1.56K photos
478 videos
11 files
1.13K links
Download Telegram
Сообщество, посвящённое профессиональному использованию генеративного ИИ для полноценных видео. Здесь публикуются результаты генерации Veo, Sora, Hailuo, Kling и подобных инструментов.

🔗 reddit.com/r/aivideo/top/

#AudioVisualGenAI #GenAI
ОК, мы уже находимся в точке, где простые смертные могут генерировать короткие видео, зачастую неотличимые от реальных, живем в очень интересное время, но что будет дальше?

Если экстраполировать произошедшее с LLM-ками и генерацией картинок, технология будет какое-то время дозревать и совершенствоваться, будет меньше артефактов (которые все же сейчас видны — зубы и прочие детализированные объекты второстепенной важности, кривые «сабы» и тд). Вероятно, появятся большие опенсорсные модели (а-ля Stable Video Diffusion), отстающие по качеству от SoTA, но сравнимые с тем, что предлагает Google сегодня. Расцветут комьюнити (вроде CivitAI), естественно, появится большое направление неотличимого от настоящего видео-порно и всяких безумных порно-видеофанфиков.

Попутно старые фильмы будут повально ремастериться в 8K с идеальной картинкой и звуком, будь то древний вестерн или паршивый боевик 90-х.

В это время коммерческие модели по качеству картинки и консистентности выйдут на новый уровень и помогут генерировать полнометражные фильмы. Появится возможность предгенерировать кучу ветвлений и давать зрителю «управлять сюжетом» (см. Bandersnatch, но куда более ветвистый). Появятся популярные синтетические актеры, «снимающиеся» в бесконечном количестве синтетических фильмов (и синтетической рекламе реальных продуктов). Материал будет легко локализовать под множество рынков с учетом языков и культурных особенностей, локализация будет включать и актеров, меняющих расовую принадлежность и прочие внешние и не очень характеристики под любую аудиторию.

Где-то здесь игровая индустрия получит возможность делать игры из дешевых по вычислениям размеченных сцен и генерировать поверх, на их основе, видео в реальном времени, т.е. целостность окружения и все механики обрабатываются традиционными методами, а картинка отрисовывается видеогенератором на ходу, поверх простого 3D-макета.

Модели будут оптимизироваться, вычислительные мощности расти и видеогенерация перейдет от просто быстрого просчета до потокового интерактива, с бесконечными новостными и аналитическими стримами (конечно же, под совершенно разные аудитории), бесконечными безумными сериалами с управлением сюжетом путем голосования зрителей.

Со временем генерация станет такой быстрой и дешевой, что управлять процессом сможет уже каждый персонально. Где-то в этот момент интерактивное кино окончательно сольется с играми, которые будут стабильно генерировать окружение и события на лету, как это когда-то начиналось с LLM-DnD, создавая полноценную симуляцию окружающего мира в VR.

#AudioVisualGenAI #GenAI #Film #Gamedev #Future #ShowerThoughts
🤯2
Magistral — первая «рассуждающая» модель Mistral AI. Вышла в двух версиях: Magistral Small (24B параметров, open-source) и корпоративная Magistral Medium.

🔗 mistral.ai/news/magistral

#LLM #Mistral
🔥2
Reuters: Как минимум 20 высокопоставленных иранских командиров были убиты в результате израильских ударов по Ирану, включая главу Корпуса стражей исламской революции Хосейна Салами, начальника генерального штаба вооруженных сил Ирана Мохаммада Багери, командующего воздушно-космическими силами Амира Али Хаджизаде, командующего штаба по чрезвычайным ситуациям Хатам-Гулям Али Рашида. 🔗

В результате израильских ударов погибли шесть иранских ученых-ядерщиков, сообщило агентство Tasnim. 🔗

Атакованы военные и ядерные объекты в Натанзе, Фордо, Тебризе, Хорремабаде и других городах Ирана. Атакованы аэропорт Тебриз и авиабаза Шахид Факури.
Мужик рассказывает, как начал заниматься разработкой баз данных в тюрьме:

🔗 turso.tech/blog/working-on-databases-from-prison

#Dev
👎1
Google снова вложилась в энергетику будущего, подписав второй контракт с компанией Commonwealth Fusion Systems (CFS) и зарезервировав 200 МВт мощности с их первой коммерческой установки термоядерного синтеза ARC, которая будет построена в Вирджинии.

Основа проекта — компактный токамак с магнитами из высокотемпературных сверхпроводников. Такая система должна позволить достичь энергетического выхода Q > 1 (то есть получить больше энергии, чем потребляется для поддержания реакции) — ни одна частная компания пока этого не достигла.

Демонстрационный реактор SPARC уже монтируется в Массачусетсе и должен подтвердить работоспособность технологии. Google увеличила инвестиции в CFS, чтобы приблизить коммерциализацию управляемого термоядерного синтеза.

🔗 blog.google/our-latest-bet-on-a-fusion-powered-future

#Energy #Google
🔥1
Чем больше и активнее люди пользуются ассистентами на базе LLM, тем больше данных компании, владеющие ассистентами, собирают о пользователях.

Вроде это банальная мысль, но это может изменить мир в будущем неочевидным образом: если отбросить рассуждения про приватность, и допустить, что через какое-то время пользователи добровольно будут предоставлять доступ к анализу сведений о себе на основе (десятков?) тысяч своих чатов с LLM за годы пользования, то появляется интересная возможность профилирования.

Т.к. такие чаты носят более интимный и доверительный характер, чем публичные комментарии, у компаний появится уникальная способность быстро и точно мэтчить людей по огромному набору параметров — оценивать скиллы в той или иной области: образование и HR на стероидах, когда образовательные учреждения и работодатели смогут запрашивать идеальную выборку под свои нужды. Коммерческие структуры и политические силы смогут получать точную информацию о настоящих склонностях, предпочтениях и прочих характеристиках пользователей типа уровня внушаемости и открытости к манипуляциям.

На этих сведениях можно построить что угодно — от рекламных платформ и сервисов знакомств до прогнозирования действий и поступков (готовность к миграции, разводу, преступлению, дорогим покупкам, склонность к выгораниям и депрессиям и тд). Этакая следующая итерация «режима бога» на больших данных. И, что интересно и немного стремно, к этим данным в будущем доступ получат не только люди.

Отсюда, отчасти, и бесплатность всех основных чатботов, где персональные переписки хранятся и используются «для улучшения сервиса» — они представляют повышенную ценность не только для улучшения моделей «здесь и сейчас».

#ShowerThoughts #LLM #Future
🤯1
Анонимный телеграм-канал
https://www.youtube.com/watch?v=d6iQrh2TK98
Если попросить популярные LLM-ки выдать число от 1 до 50, они выдают чаще всего 27.

#LLM
Неочевидная фигня с ЛЛМками – дикая экономия трафика в роуминге с золотым интернетом, не надо лазить по куче говносайтов с видеорекламой, чтобы узнать какую-то простую инфу по путешествию.

#LLM #Travel #ShowerThoughts
🔥3
Знаменитый белый рыбный бургер с кунжутом и водорослями (еще там капуста и морковка) + жасминовый чай + курица в остром кляре из Макдональдса.

В соседнем KFC рекламировали их фирменную острую лапшу быстрого приготовления.

Медан, Индонезия.

#Travel #McDonalds
🤯1😍1
Анонимный телеграм-канал
Photo
В KFC еще есть острый куриный суп с кукурузой и куриный «плов»... 2,6 $ за все, и это в аэропорту!

#Travel
👍1