Конечно, странно требовать от нейросетей, построенных на архитектуре трансформер, понятий о морали, когда у них в принципе не может существовать никаких понятий.
🤯2❤1
Судя по всему, подход к составлению промптов для Nano Banana 2 кардинально изменился. Новые правила генерации требуют полностью отказаться от лишней воды. Больше не нужно использовать такие теги, как «8k», «кинематографичный» или «реалистичный», так как они только сбивают с толку внутренний планировщик модели.
Вместо длинных художественных описаний теперь лучше использовать четко структурированный текст. Очень важно быть максимально конкретным и описывать физику сцены и освещение, например, указывать «верхнее контровое освещение», вместо использования общих прилагательных для описания качества.
Помимо этого, Nano Banana 2 сначала планирует сцену и выстраивает пространственную логику, прежде чем начать рисовать. Это дает гораздо более высокую точность для сложных запросов, где один объект находится за другим. Если прошлая версия Pro была скорее художником с кинематографичным видением, то вторая версия — это точный инженер. Она понимает запросы буквально: если вы попросите нарисовать ровно пять человек, вы получите в кадре ровно пять.
Рендеринг текста стал новой базовой функцией, поскольку модель теперь воспринимает буквы как отдельные символы, а не просто как элементы текстуры. Кроме того, нейросеть стала гораздо активнее опираться на реальные визуальные данные. Из-за этого существующие локации и известные продукты выглядят более достоверно и фактурно, без лишней стилизации.
Вместо длинных художественных описаний теперь лучше использовать четко структурированный текст. Очень важно быть максимально конкретным и описывать физику сцены и освещение, например, указывать «верхнее контровое освещение», вместо использования общих прилагательных для описания качества.
Помимо этого, Nano Banana 2 сначала планирует сцену и выстраивает пространственную логику, прежде чем начать рисовать. Это дает гораздо более высокую точность для сложных запросов, где один объект находится за другим. Если прошлая версия Pro была скорее художником с кинематографичным видением, то вторая версия — это точный инженер. Она понимает запросы буквально: если вы попросите нарисовать ровно пять человек, вы получите в кадре ровно пять.
Рендеринг текста стал новой базовой функцией, поскольку модель теперь воспринимает буквы как отдельные символы, а не просто как элементы текстуры. Кроме того, нейросеть стала гораздо активнее опираться на реальные визуальные данные. Из-за этого существующие локации и известные продукты выглядят более достоверно и фактурно, без лишней стилизации.
🔥4
Сравниваем вторую Нано Банану с первой Pro-версией. Нам заявили, что вторая итерация более точно показывает географические объекты и достопримечательности. Возможно, с популярными в международном масштабе объектами это и стало так, но с региональными городами не в США это не так. С Алматы ровно такая же ситуация, как и в предыдущей итерации. Только два объекта похожи на реальные версии себя, в остальном полное мимо. Ташкентская телебашня на месте 😘
Вообще, на глаз изменения в этом конкретном случае минимальны. Новая Банана даже хуже, обрезала композицию.
P. S. Жесть в Астане дубняк, пожелаем им стойкости
Вообще, на глаз изменения в этом конкретном случае минимальны. Новая Банана даже хуже, обрезала композицию.
P. S. Жесть в Астане дубняк, пожелаем им стойкости
🔥2
Коллеги с утра ругаются, новая вторая Банана отказывается выполнять простейшие запросы, с которыми легко справлялась прошка. Гугл решили не изменять традиции, и сделав офигенный продукт, портят его с обновлениями?
Чтобы перейти обратно на прошку, в селекторе моделей, в правом нижнем углу поля ввода, выбирайте Thinking (Думающая). Там предыдущая банана. На Pro стоит вторая банана.
Чтобы перейти обратно на прошку, в селекторе моделей, в правом нижнем углу поля ввода, выбирайте Thinking (Думающая). Там предыдущая банана. На Pro стоит вторая банана.
👍1
Samsung Electronics официально представили стратегию полной трансформации своих глобальных производств. К 2030 году все фабрики корпорации станут автономными предприятиями, которыми будет управлять искусственный интеллект. Главная цель инициативы — исключить человеческий фактор, радикально повысить операционную эффективность и снизить производственные издержки.
Фундаментом новых заводов станет агентный ИИ (Agentic AI). Эта технология, уже применяемая в линейке Galaxy S26, способна самостоятельно анализировать обстановку, планировать действия и принимать оптимальные решения в режиме реального времени. Искусственный интеллект будет контролировать все этапы: от приемки сырья и складской логистики до сборки и финальной проверки качества продукции.
Для минимизации технических ошибок Samsung внедряет технологию цифровых двойников. Это виртуальные копии реальных производственных линий, которые позволяют тестировать рабочие процессы и прогнозировать возможные сбои оборудования в симуляции, не останавливая реальный конвейер.
Физическую работу на объектах возьмут на себя специализированные машины и гуманоидные роботы. В цехах будут постепенно развернуты роботы-сборщики, логистические боты для транспортировки деталей и системы управления оборудованием. Для опасных зон с экстремальными температурами или высоким уровнем шума предусмотрены особые роботы-контролеры, следящие за безопасностью среды.
Переход к полной автономии требует новых стандартов безопасности. В связи с этим Samsung параллельно разрабатывает строгие механизмы контроля и управления рисками, чтобы гарантировать надежность решений, принимаемых машинами без участия человека.
Фундаментом новых заводов станет агентный ИИ (Agentic AI). Эта технология, уже применяемая в линейке Galaxy S26, способна самостоятельно анализировать обстановку, планировать действия и принимать оптимальные решения в режиме реального времени. Искусственный интеллект будет контролировать все этапы: от приемки сырья и складской логистики до сборки и финальной проверки качества продукции.
Для минимизации технических ошибок Samsung внедряет технологию цифровых двойников. Это виртуальные копии реальных производственных линий, которые позволяют тестировать рабочие процессы и прогнозировать возможные сбои оборудования в симуляции, не останавливая реальный конвейер.
Физическую работу на объектах возьмут на себя специализированные машины и гуманоидные роботы. В цехах будут постепенно развернуты роботы-сборщики, логистические боты для транспортировки деталей и системы управления оборудованием. Для опасных зон с экстремальными температурами или высоким уровнем шума предусмотрены особые роботы-контролеры, следящие за безопасностью среды.
Переход к полной автономии требует новых стандартов безопасности. В связи с этим Samsung параллельно разрабатывает строгие механизмы контроля и управления рисками, чтобы гарантировать надежность решений, принимаемых машинами без участия человека.
Forwarded from Пресидский залив
This media is not supported in your browser
VIEW IN TELEGRAM
промпт - "девушка ест бургер и смотрит в телефон, реалистичная съемка на айфон 16 кадр статичный"
вопрос на миллион, почему kling добавил мне голубя в макасинах на фон🕊
моя единственная гипотеза, это что все "реалистичные" съемки с фастфудом в датасете содержали голубей🤣 🤣 🤣
вопрос на миллион, почему kling добавил мне голубя в макасинах на фон
моя единственная гипотеза, это что все "реалистичные" съемки с фастфудом в датасете содержали голубей
Please open Telegram to view this post
VIEW IN TELEGRAM
😁9🤣3
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Утекли цены на API вызовы Seedance 2.0 (вот-вот!)
28 юаней (4 доллара) за video2video за миллион токенов (вероятно, это продолжение видео)
46 юаней (6.5 долларов) за text2video, image2video за миллион токенов
Формула расчета токенов: Ширина х Высота х FPS х Длительность / 1024
Для создания 15-секундного видео в 720р требуется примерно 308 880 токенов, что соответствует примерно 14,2 юаням (2.17 доллара). Это составляет почти 0.14 доллара за секунду видео.
Итак: 720P 15 секунд в 24фпс = 2.17 доллара
Update: вот ссылка, требуется акк
https://console.volcengine.com/ark/region:ark+cn-beijing/model/detail?Id=doubao-seedance-2-0
Update: Есть режимы: Multimodality-to-video, Video Editing, Video extension
Update: судя по всему Extension - это и есть продолжение видео, которое дешевле - 28 юаней)
А пока смотрим на картинки и ломаем голову.
@cgevent
28 юаней (4 доллара) за video2video за миллион токенов (вероятно, это продолжение видео)
46 юаней (6.5 долларов) за text2video, image2video за миллион токенов
Формула расчета токенов: Ширина х Высота х FPS х Длительность / 1024
Для создания 15-секундного видео в 720р требуется примерно 308 880 токенов, что соответствует примерно 14,2 юаням (2.17 доллара). Это составляет почти 0.14 доллара за секунду видео.
Итак: 720P 15 секунд в 24фпс = 2.17 доллара
Update: вот ссылка, требуется акк
https://console.volcengine.com/ark/region:ark+cn-beijing/model/detail?Id=doubao-seedance-2-0
Update: Есть режимы: Multimodality-to-video, Video Editing, Video extension
Update: судя по всему Extension - это и есть продолжение видео, которое дешевле - 28 юаней)
А пока смотрим на картинки и ломаем голову.
@cgevent
🔥2
Ну что, четыре дата-центра AWS вынесенных чуть более, чем полностью иранскими ракетами за последние 4 дня, сделали реальность орбитальных дата-центров для нас чуть ближе. Маск одобряет.
На самом деле новая война в Персидском заливе довольно радикально изменит ИИ-индустрию, я бы даже сказал — форсирует развитие.
На самом деле новая война в Персидском заливе довольно радикально изменит ИИ-индустрию, я бы даже сказал — форсирует развитие.
💯6
Отрезвляющий пост этим утром, господа!
Крупные увольнения напрямую вызванные внедрением ИИ в рабочие процессы с 1 января 2026 года:
Amazon (январь и март 2026)
Около 16 000 человек в январе и еще около 100 сотрудников подразделения робототехники в начале марта
Pinterest (январь 2026)
15% рабочей силы
Livspace (начало 2026)
Около 1 000 сотрудников
Block (февраль 2026)
Более 4 000 сотрудников (около 40% всего штата)
Dow (февраль 2026)
Около 4 500 рабочих мест
Morgan Stanley (март 2026)
Около 2 500 человек (3% глобального штата)
Нам всем времена ковида покажутся просто невероятно светлыми временами. У меня нет сомнений, нас ждёт глобальный социальный пиздец в ближайшие годы.
Крупные увольнения напрямую вызванные внедрением ИИ в рабочие процессы с 1 января 2026 года:
Amazon (январь и март 2026)
Около 16 000 человек в январе и еще около 100 сотрудников подразделения робототехники в начале марта
Pinterest (январь 2026)
15% рабочей силы
Livspace (начало 2026)
Около 1 000 сотрудников
Block (февраль 2026)
Более 4 000 сотрудников (около 40% всего штата)
Dow (февраль 2026)
Около 4 500 рабочих мест
Morgan Stanley (март 2026)
Около 2 500 человек (3% глобального штата)
Нам всем времена ковида покажутся просто невероятно светлыми временами. У меня нет сомнений, нас ждёт глобальный социальный пиздец в ближайшие годы.
🔥5
Опробовал новую, слегка нашумевшую глобальную ллм-стратегию Paxhistoria. Это просто какой-то позор. Ощущение, будто игра сидит на движке от ChatGPT-3.5. С первых шагов лютые галлюцинации и неследование контексту.
Опечалившись сему, я подумал — а что, если просто попробовать поиграть в классическую штабную игру напрямую в чатботе? И это стало решениемна миллион на четыре последних вечера подряд! Ни одна, даже классическая глобальная стратегия (ни Геополитический симулятор, ни Виктория с Хартс оф Айронами), рядом не стоит с тем реализмом и накалом, с которым вас может столкнуть Gemini 3.1 Pro или Claude 4.6 Opus.
Просто берёте и задаёте в промпте условия и правила игры, таймлайн, уровень реализма и т. п. Всё что угодно. Любой сеттинг. Ограничение только ваша фантазия. И далее запускаете симуляцию, на каждом шаге сами определяете, нужна ли вам пауза для консультаций с советниками, — а это могут быть реальные люди, только представьте, какой кайф когда вам на стол приносят записки ирлшные персонажи, с их стилем подачи, речи и т. д. — или вы хотите скипнуть ход на +6 часов, +7 суток вперед.
При этом, вы можете заставить ллмку опираться на реальные события при симуляции. Это превращается в крайне любопытное шоу, если вы выбираете сеттинг в прошедшем таймлайне. Основную же катку я делал с 1 марта, с событий в Персидском заливе — и очень занятно смотреть, какими могут быть дальнейшие события при том или ином шаге (спойлер: даже ллмка предсказала, что ничего хорошего республиканцам и лично Трампу война с Ираном не сулит, и затянется она надолго, что де-факто признали военные США только этой ночью).
А ещё вы являетесь модератором на всем протяжении игры. То есть, если вы чувствуете, что симуляция буксует однообразностью, или где-то есть несоответствие таймлайну/сеттингу/поведению персонажей, вы просто поправляете ллмку по ходу дела и она справляется с критикой блестяще.
В общем, при моей затянувшейся игровой импотенции, обычный Клодопус на несколько ночей заставил меня забыть про реальный мир, полностью погрузив меня в крайне реалистичную и разнообразную игровую симуляцию.
Мне кажется в чём-то подобном кроется успех следующего поколения глобальных стратегий, но точно не в попытке создать ллм-копию Геополитического симулятора, чем является упомянутая в начале Paxhistoria.
Опечалившись сему, я подумал — а что, если просто попробовать поиграть в классическую штабную игру напрямую в чатботе? И это стало решением
Просто берёте и задаёте в промпте условия и правила игры, таймлайн, уровень реализма и т. п. Всё что угодно. Любой сеттинг. Ограничение только ваша фантазия. И далее запускаете симуляцию, на каждом шаге сами определяете, нужна ли вам пауза для консультаций с советниками, — а это могут быть реальные люди, только представьте, какой кайф когда вам на стол приносят записки ирлшные персонажи, с их стилем подачи, речи и т. д. — или вы хотите скипнуть ход на +6 часов, +7 суток вперед.
При этом, вы можете заставить ллмку опираться на реальные события при симуляции. Это превращается в крайне любопытное шоу, если вы выбираете сеттинг в прошедшем таймлайне. Основную же катку я делал с 1 марта, с событий в Персидском заливе — и очень занятно смотреть, какими могут быть дальнейшие события при том или ином шаге (спойлер: даже ллмка предсказала, что ничего хорошего республиканцам и лично Трампу война с Ираном не сулит, и затянется она надолго, что де-факто признали военные США только этой ночью).
А ещё вы являетесь модератором на всем протяжении игры. То есть, если вы чувствуете, что симуляция буксует однообразностью, или где-то есть несоответствие таймлайну/сеттингу/поведению персонажей, вы просто поправляете ллмку по ходу дела и она справляется с критикой блестяще.
В общем, при моей затянувшейся игровой импотенции, обычный Клодопус на несколько ночей заставил меня забыть про реальный мир, полностью погрузив меня в крайне реалистичную и разнообразную игровую симуляцию.
Мне кажется в чём-то подобном кроется успех следующего поколения глобальных стратегий, но точно не в попытке создать ллм-копию Геополитического симулятора, чем является упомянутая в начале Paxhistoria.
В NotebookLLM начали раскатывать возможность делать длинные кинематографичные видео по вашим источникам. Не просто видеопересказы, что является обычной презой под голос, а именно прям ролики с анимацией.
🔥2
Ну что ж, ChatGPT-5.4 вышла, и это не джипити-четыре-момент (кто бы мог подумать). И даже не джимини-три-момент. Буквально незначительная эволюция по бенчам, и то не по всем. А нам обещали «Гарлик, который изменит всё». Сорян, но эпоха ОпенАИ правда ушла. Окончательно. И не вернётся.
Подробный обзор завтра, когда результаты бенчов с аренками настоятся. А лично пробовать, конечно же, не буду. Я удалил апку гопоты три месяца назад, и возвращать не собираюсь.
Подробный обзор завтра, когда результаты бенчов с аренками настоятся. А лично пробовать, конечно же, не буду. Я удалил апку гопоты три месяца назад, и возвращать не собираюсь.
🤣4
Ахахаха, помните недавно Бен Аффлек на пару со своим дружком Мэттом Деймоном хейтил ИИ, мол, он в целом переоценен, а как инструмент для кино вообще пока что дно? Так вот, этот поц на днях продал Netflix свой стартап InterPositive, который разрабатывает инструменты на основе искусственного интеллекта для кинематографистов. За неплохие деньги.
🤣3
Думается, Дипсик с новой моделью специально решил выйти позже всех кабанчиков (я так называю крупные компании с фронтир-моделями), чтобы как можно громче и очевиднее всех разъ☺️ ать. Стратегия. Вангуют сегодня деплой.
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Media is too big
VIEW IN TELEGRAM
Утопай Студио. Расследование, интриги, схематозы.
Вчера они бахнули на весь мир.
https://www.utopaistudios.com/
Причем вот так:
Announcing Utopai 1.0 | The story-to-movie generation model
https://www.youtube.com/watch?v=qJLv6ltFw04
Весь твиттор забит как под копирку написанными сообщениями от сотен пользователей типа "вместо генерации рандомных клипов, Утопай генерит истории" или "Я со-продюссировал анимацию вместо с Утопай студио". При этом доступ закрыт (вейтлист) и ни одного знакомого имени известных инфлюенсеров в твиттор-постах нет.
Я излазил весь веб-сайт (сделан идеально с маркетинговой точки зрения), корейские основатели, выходцы из Гугла, Меты и пост-продакшена-первиза. С 2022 года на рынке, много пивотов, и, наконец-то, подняли большие деньги на Утопай.
Интересный раздел East:
https://www.utopaistudios.com/east
Custom-trained models optimized for Korean and Japanese language, culture, and storytelling nuances
(теперь я понимаю, что речь про LLMки для промптов)
Ну и тошнотворный сладкий поток заверений про святую интеллектуальную собственность.
Короче, ребята, ашозамодель-то?
Которая влет может генерить по минуте видео и вся из себя умная до жути (судя по описаниям).
Мой нюх прям почуял подвох. Я заманался ломать глаза в твитторе и позвал Грок на помощь (кото-же еще, если речь за твиттор). Грок такой - да, это foundation model, вот погляди и сунул в меня вот такой маркетинговый сироп он GMI:
https://www.gmicloud.ai/case-study/utopai-studios-powering-the-next-generation-of-video-creation-with-gmi-cloud
Тут я говорю Грокскому: ты перечитай эту ссылку, там между строк прямо написано:
- running numerous models concurrently
- rich library of the latest models and APIs ready to use, such as WAN, Veo, and more
- Utopai is scaling its ComfyUI workload into a fully web-based platform (тут стало совсем смешно, это просто Комфи воркфоу)
И только в Планах на будущее написано:
Utopai is preparing to launch foundation-level video generation model training
Они готовяцца!
Короче, я не отрицаю, что продукт задуман и сделан хорошо (об этом след пост), что видосы на сайте наряднейшие, что замысел отличный и команда огонь. И что Комфи ноды у них на миллион.
Но называть новой видео-моделью свой Комфи-воркфлоу - это уже зашквар и маркетинговый схематоз.
На этом уже ловили Freepik, когда они называли своей новой моделью обычный пайплайн из чужих моделей.
Это примета времени. Взять денег (а им дали похоже очень много), заявить о существовании продукта, которого нет, а потом попытаться сделать этот продукт на деньги инвесторов.
Не получится - пивотнемся. Не в первый раз.
Можете записаться в бету:
https://www.utopaistudios.com/waitlist
Язаписалсо.
@cgevent
Вчера они бахнули на весь мир.
https://www.utopaistudios.com/
Причем вот так:
Announcing Utopai 1.0 | The story-to-movie generation model
https://www.youtube.com/watch?v=qJLv6ltFw04
Весь твиттор забит как под копирку написанными сообщениями от сотен пользователей типа "вместо генерации рандомных клипов, Утопай генерит истории" или "Я со-продюссировал анимацию вместо с Утопай студио". При этом доступ закрыт (вейтлист) и ни одного знакомого имени известных инфлюенсеров в твиттор-постах нет.
Я излазил весь веб-сайт (сделан идеально с маркетинговой точки зрения), корейские основатели, выходцы из Гугла, Меты и пост-продакшена-первиза. С 2022 года на рынке, много пивотов, и, наконец-то, подняли большие деньги на Утопай.
Интересный раздел East:
https://www.utopaistudios.com/east
Custom-trained models optimized for Korean and Japanese language, culture, and storytelling nuances
(теперь я понимаю, что речь про LLMки для промптов)
Ну и тошнотворный сладкий поток заверений про святую интеллектуальную собственность.
Короче, ребята, ашозамодель-то?
Которая влет может генерить по минуте видео и вся из себя умная до жути (судя по описаниям).
Мой нюх прям почуял подвох. Я заманался ломать глаза в твитторе и позвал Грок на помощь (кото-же еще, если речь за твиттор). Грок такой - да, это foundation model, вот погляди и сунул в меня вот такой маркетинговый сироп он GMI:
https://www.gmicloud.ai/case-study/utopai-studios-powering-the-next-generation-of-video-creation-with-gmi-cloud
Тут я говорю Грокскому: ты перечитай эту ссылку, там между строк прямо написано:
- running numerous models concurrently
- rich library of the latest models and APIs ready to use, such as WAN, Veo, and more
- Utopai is scaling its ComfyUI workload into a fully web-based platform (тут стало совсем смешно, это просто Комфи воркфоу)
И только в Планах на будущее написано:
Utopai is preparing to launch foundation-level video generation model training
Они готовяцца!
Короче, я не отрицаю, что продукт задуман и сделан хорошо (об этом след пост), что видосы на сайте наряднейшие, что замысел отличный и команда огонь. И что Комфи ноды у них на миллион.
Но называть новой видео-моделью свой Комфи-воркфлоу - это уже зашквар и маркетинговый схематоз.
На этом уже ловили Freepik, когда они называли своей новой моделью обычный пайплайн из чужих моделей.
Это примета времени. Взять денег (а им дали похоже очень много), заявить о существовании продукта, которого нет, а потом попытаться сделать этот продукт на деньги инвесторов.
Не получится - пивотнемся. Не в первый раз.
Можете записаться в бету:
https://www.utopaistudios.com/waitlist
Язаписалсо.
@cgevent
Обозреваем флагманскую ChatGPT-5.4
Часть 1. Текст: всё плохо
Последней нормально общающейся моделью от ОпенаАИ была ChatGPT-4o. Я вот думаю, неужели Альтман в какой-то момент так сильно зазевался, что они теперь просто не успевают зафайнтюнить свои свежие модели? Они выпускают их буквально сырыми. У ОпенАИ правда нету 3-5 месяцев на файнтюн. По меркам ИИ-гонки они безнадежно отстали.
Свежие overall-данные по бордам
Часть 1. Текст: всё плохо
Последней нормально общающейся моделью от ОпенаАИ была ChatGPT-4o. Я вот думаю, неужели Альтман в какой-то момент так сильно зазевался, что они теперь просто не успевают зафайнтюнить свои свежие модели? Они выпускают их буквально сырыми. У ОпенАИ правда нету 3-5 месяцев на файнтюн. По меркам ИИ-гонки они безнадежно отстали.
Свежие overall-данные по бордам
👎1
Обозреваем флагманскую ChatGPT-5.4
Часть 2. Логика и экспертные рассуждения без доступа к интернету
Тут лучше, но за Гуглом опять не угнаться. И если взять в контекст сравнения цену, то эти 2,1% догона до джеминьки стоят определенно дороже: 2,5$/15$ за вход/выход на 1М токенов против 2$/12$ соответственно в Gemini 3.1 Pro.
Часть 2. Логика и экспертные рассуждения без доступа к интернету
Тут лучше, но за Гуглом опять не угнаться. И если взять в контекст сравнения цену, то эти 2,1% догона до джеминьки стоят определенно дороже: 2,5$/15$ за вход/выход на 1М токенов против 2$/12$ соответственно в Gemini 3.1 Pro.
👎2