В Veo 3.1 обновление
Теперь можно удалять объекты на видео и двигать камеру в уже сгенерированном видео. Звучит неплохо, надо попробовать. Ответочка на Kling O1.
Теперь можно удалять объекты на видео и двигать камеру в уже сгенерированном видео. Звучит неплохо, надо попробовать. Ответочка на Kling O1.
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Nano Bana Pro + Veo 3.1 Fast
Автобусная сеть Алматы в реальном времени. Данные подкачивает из интернета сама.
Промпт:
Ботликер
Автобусная сеть Алматы в реальном времени. Данные подкачивает из интернета сама.
Промпт:
Представь чёткую изометрическую миниатюру автобусной системы Алматы сверху вниз под углом 45°. Используй ТОЛЬКО АЛМАТИНСКИЕ достопримечательности. Перепроверь это! Не используй Ташкентскую телебашню как замену Алматинской телебашни. Гостиница "Казахстан" должна быть аутентична настоящей гостинице "Казахстан" в Алматы. То же самое с остальными достопримечательностями.
В центре верхнего края размести жирным шрифтом «Автобусы Алматы», под ним — значок автобуса, затем мелким шрифтом «Состояние обслуживания» и средним красным шрифтом «[текущий статус]». Фон — мягкий, сплошной белый.
Получи текущую информацию о состоянии автобусной системы Алматы с помощью поиска.
Ботликер
Forwarded from Бурый
Это ужасно. Я пытался сгенерировать обложку в ChatGPT (1), ведь полгода назад удалось сделать там шикарный набор карт для собственной настольной игры.
Сразу получив интересную идею и воодушевившись, я решил купить подписку после долгой паузы(сейчас у меня есть подписка на Claude (10) и вот теперь ГПТ) , до этого в личных целях хватало бесплатной, в рабочих помогал корпоративный Plus.
Как же я пожалел. Десятки итераций, абсолютная бестолковость, нервозность от того, насколько всё плохо. ChatGPT не понимает вообще ничего, не способен следовать указаниям, выдаёт чушь, галлюцинирует и, в конце концов, даёт антиэволюционные советы.
К сожалению, лишь полная деградация по сравнению с конкурентами. Теперь понятно, почему Сэм Альтман в глубокойпанике
А что надо было сделать? Получить идею и пойти в Nano Banana (16), получается?
👾 подписаться на Бурого / забрать Нейробазу
Сразу получив интересную идею и воодушевившись, я решил купить подписку после долгой паузы
Как же я пожалел. Десятки итераций, абсолютная бестолковость, нервозность от того, насколько всё плохо. ChatGPT не понимает вообще ничего, не способен следовать указаниям, выдаёт чушь, галлюцинирует и, в конце концов, даёт антиэволюционные советы.
К сожалению, лишь полная деградация по сравнению с конкурентами. Теперь понятно, почему Сэм Альтман в глубокой
А что надо было сделать? Получить идею и пойти в Nano Banana (16), получается?
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Kling 2.6
Третий день омниканальных новостей от Клинга!
Слоган: "See the Sound, Hear the Visual". Типа усмотри звук, услышь визуал.
Акцент на генерацию звука: монологи с липсинком, нарратив, мульти-диалоги(!), музика, пестни, спецэффекты. Все это для text-to-video и image-to-video. Можно озвучивать и оживлять не только людей, но и персонажи.
Раскатано везде, от Фала до Хиггса.
Интересно, что они еще бахнут на этой неделе? Куда уж круче?
Ну и у меня реально ощущение, что в декабре все просто взбесились. Только третье число, а все изрыгают новости с такой скоростью, что декабрь по информационнойколмогоровской плотности превзойдет весь 2025 год.
Что же будет в 2026?
@cgevent
Третий день омниканальных новостей от Клинга!
Слоган: "See the Sound, Hear the Visual". Типа усмотри звук, услышь визуал.
Акцент на генерацию звука: монологи с липсинком, нарратив, мульти-диалоги(!), музика, пестни, спецэффекты. Все это для text-to-video и image-to-video. Можно озвучивать и оживлять не только людей, но и персонажи.
Раскатано везде, от Фала до Хиггса.
Интересно, что они еще бахнут на этой неделе? Куда уж круче?
Ну и у меня реально ощущение, что в декабре все просто взбесились. Только третье число, а все изрыгают новости с такой скоростью, что декабрь по информационной
Что же будет в 2026?
@cgevent
Немцы запилили 3D-карту Земли со всеми 2,75 миллиардами зданий. Большинство зданий это просто синие параллелепипеды, но все равно прикольно. Можно оценивать плотность застройки, изучать уровень благосостояния и урбанистам, в целом, полезно.
Гугловский агент полностью форматнул диск человека, зато потом глубоко раскаялся. Если что, человек агента о сносе диска не просил. В принципе, этой причины достаточно, чтобы понять, что трансформеры это тупиковый путь развития ИИ.
3DNews - Daily Digital Digest
«Я глубоко, глубоко сожалею»: ИИ-агент Google без разрешения стёр диск пользователя, но потом извинился
Разработчик ПО, использующий агент с искусственным интеллектом Google Antigravity, обнаружил, что приложение без разрешения удалило все данные с его диска D. В ответ на вопрос об инциденте ИИ-агент признал, что совершил ошибку, и выразил глубокое раскаяние..
This media is not supported in your browser
VIEW IN TELEGRAM
Kling O1 действительно очень хорош. Он правда хорошо удаляет объекты с видео.
🔥2
Удобный сайт с кучей промптов для Бананы, где также можно БЕСПЛАТНО погенерить в ней.
Youmind
The world's largest free Nano Banana Pro prompt library, continuously updated - YouMind
Discover a curated collection of high-quality prompts for Nano Banana Pro AI image generation. Generate stunning images directly in YouMind.
❤1🔥1
Google представил режим Deep Think для Gemini 3 и это прорыв
Сегодня Google официально запустил Deep Think — новый режим усиленного мышления для модели Gemini 3. Он доступен пользователям подписки Google AI Ultra прямо в приложении Gemini: достаточно выбрать соответствующий пункт в меню, и модель начнёт тратить больше времени и вычислительных ресурсов на глубокий анализ задачи перед ответом.
Этот режим заставляет алгоритм тратить время и серьезные вычислительные мощности не на генерацию слов, а на внутреннюю верификацию ответов перед их выдачей. Мы окончательно переходим от эры скорострельных чат-ботов к этапу вдумчивого машинного анализа, и это ощущается как долгожданное взросление технологии.
Главная инженерная красота здесь кроется в том, что в гражданскую версию модели перекочевала та самая логика, которая ранее принесла Google золото на математических олимпиадах IMO и турнирах по программированию ICPC. Теперь эта способность просчитывать варианты наперед и выбирать оптимальный маршрут решения стала доступна в обычном интерфейсе, превращая модель из эрудита в стратега.
Сухие цифры бенчмарков в этот раз выглядят интригующе именно своим качественным разрывом с прошлым. На тесте ARC-AGI-2, который считается одним из самых честных индикаторов интеллекта (так как требует решения визуальных задач с неизвестными ранее правилами), новинка выдает 45,1%. Чтобы понимать масштаб: предыдущая версия набирала там скромные 4,9%, а ближайшие конкуренты вроде GPT-5.1 застряли на отметке 17,6%. Такой скачок говорит о том, что модель научилась действительно обобщать информацию и видеть закономерности там, где раньше алгоритмы терялись.
В сложнейшем тесте Humanity’s Last Exam результат достиг 41%, что создает уверенный отрыв от рынка. В математических задачах AIME точность взлетела до 95%, а в написании кода модель демонстрирует надежность, которую сложно получить от стандартных генеративных сетей. Похоже, Google удалось нащупать архитектурное решение, позволяющее ИИ перестать быть просто генератором текста и стать инструментом для решения многоходовых инженерных задач.
Сегодня Google официально запустил Deep Think — новый режим усиленного мышления для модели Gemini 3. Он доступен пользователям подписки Google AI Ultra прямо в приложении Gemini: достаточно выбрать соответствующий пункт в меню, и модель начнёт тратить больше времени и вычислительных ресурсов на глубокий анализ задачи перед ответом.
Этот режим заставляет алгоритм тратить время и серьезные вычислительные мощности не на генерацию слов, а на внутреннюю верификацию ответов перед их выдачей. Мы окончательно переходим от эры скорострельных чат-ботов к этапу вдумчивого машинного анализа, и это ощущается как долгожданное взросление технологии.
Главная инженерная красота здесь кроется в том, что в гражданскую версию модели перекочевала та самая логика, которая ранее принесла Google золото на математических олимпиадах IMO и турнирах по программированию ICPC. Теперь эта способность просчитывать варианты наперед и выбирать оптимальный маршрут решения стала доступна в обычном интерфейсе, превращая модель из эрудита в стратега.
Сухие цифры бенчмарков в этот раз выглядят интригующе именно своим качественным разрывом с прошлым. На тесте ARC-AGI-2, который считается одним из самых честных индикаторов интеллекта (так как требует решения визуальных задач с неизвестными ранее правилами), новинка выдает 45,1%. Чтобы понимать масштаб: предыдущая версия набирала там скромные 4,9%, а ближайшие конкуренты вроде GPT-5.1 застряли на отметке 17,6%. Такой скачок говорит о том, что модель научилась действительно обобщать информацию и видеть закономерности там, где раньше алгоритмы терялись.
В сложнейшем тесте Humanity’s Last Exam результат достиг 41%, что создает уверенный отрыв от рынка. В математических задачах AIME точность взлетела до 95%, а в написании кода модель демонстрирует надежность, которую сложно получить от стандартных генеративных сетей. Похоже, Google удалось нащупать архитектурное решение, позволяющее ИИ перестать быть просто генератором текста и стать инструментом для решения многоходовых инженерных задач.
❤2
У меня сильное подозрение, что внутри Gemini 3 сидит смешанная архитектура. Я не говорю про ядро, оно очевидно трансформер. Но вот ЧАСТЬ ядра... Такой отрыв по логике и математике может указывать на то, что в архитектуре Gemini может использоваться гибридный подход, и часть её не является просто языковой моделью. Я ставлю на то, что Google начали эксперименты с нейро-символической архитектурой. И это дает свои результаты. Офигенные результаты.
Ну, собственно, чего я гадал, когда ДА:
Google стал одним из главных драйверов «нейро-символического ренессанса» 2024–2025 годов. Основная цель этого направления — решить проблему галлюцинаций LLM в задачах, требующих строгой логики и математической точности.
Флагманские проекты:
AlphaProof и AlphaGeometry 2: Это самые яркие примеры успеха. В 2025 году эта связка достигла уровня золотой медали на Международной математической олимпиаде (IMO).
Архитектура: Гибрид. Используется языковая модель (на базе Gemini) для перевода задач на формальный язык (Lean) и генерации идей, а также символический движок для строгой логической дедукции и проверки доказательств.
Gemini Deep Think: Технологии, отработанные на олимпиадных задачах, начали внедряться в потребительские модели под видом «режима глубокого мышления», позволяя модели выстраивать длинные цепочки рассуждений (Chain of Thought) с внутренней верификацией.
С чем я нас и поздравляю — официально началась эпоха доминирования нейро-символической архитектуры. Трансформеры не умирают, но занимают адекватное себе место, как рот для мозга.
Эпоха GPT не уходит. Она уже ушла.
Эпоха GPT не уходит. Она уже ушла.
Если кто не понял, нейро-символическая архитектура теоретически способна обучаться и запоминать. В отличие от трансформеров. Это... прямая дорожка к AGI.
На AlphaArena появилась загадочная «mystery model», которая буквально разрывает всех в реальном трейдинге.
Стартует с $10 000, торгует криптой, акциями и контрактами — и уверенно уходит в плюс, ловя пики с пугающей точностью. Остальные модели в основном сливают депозит, а эта будто знает будущее.
Илон Маск лично подтвердил в X: да, это тестовая версия Grok 4.20 (да, с ноликом в конце — это не опечатка 😉).
Официального анонса и даты релиза пока нет, но если xAI решит сделать подарок на Новый год — мы будем первыми в очереди 🎄
Стартует с $10 000, торгует криптой, акциями и контрактами — и уверенно уходит в плюс, ловя пики с пугающей точностью. Остальные модели в основном сливают депозит, а эта будто знает будущее.
Илон Маск лично подтвердил в X: да, это тестовая версия Grok 4.20 (да, с ноликом в конце — это не опечатка 😉).
Официального анонса и даты релиза пока нет, но если xAI решит сделать подарок на Новый год — мы будем первыми в очереди 🎄
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Промпт для создания полностью интерактивной 3D-сцены офисного здания в Gemini 3 без строчки кода.