Botlicker
280 subscribers
260 photos
181 videos
3 files
183 links
Тут любят иишки
Download Telegram
В Veo 3.1 обновление

Теперь можно удалять объекты на видео и двигать камеру в уже сгенерированном видео. Звучит неплохо, надо попробовать. Ответочка на Kling O1.
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Nano Bana Pro + Veo 3.1 Fast

Автобусная сеть Алматы в реальном времени. Данные подкачивает из интернета сама.

Промпт:
Представь чёткую изометрическую миниатюру автобусной системы Алматы сверху вниз под углом 45°. Используй ТОЛЬКО АЛМАТИНСКИЕ достопримечательности. Перепроверь это! Не используй Ташкентскую телебашню как замену Алматинской телебашни. Гостиница "Казахстан" должна быть аутентична настоящей гостинице "Казахстан" в Алматы. То же самое с остальными достопримечательностями.

В центре верхнего края размести жирным шрифтом «Автобусы Алматы», под ним — значок автобуса, затем мелким шрифтом «Состояние обслуживания» и средним красным шрифтом «[текущий статус]». Фон — мягкий, сплошной белый.

Получи текущую информацию о состоянии автобусной системы Алматы с помощью поиска.

Ботликер
Forwarded from Бурый
Это ужасно. Я пытался сгенерировать обложку в ChatGPT (1), ведь полгода назад удалось сделать там шикарный набор карт для собственной настольной игры.

Сразу получив интересную идею и воодушевившись, я решил купить подписку после долгой паузы (сейчас у меня есть подписка на Claude (10) и вот теперь ГПТ), до этого в личных целях хватало бесплатной, в рабочих помогал корпоративный Plus.

Как же я пожалел. Десятки итераций, абсолютная бестолковость, нервозность от того, насколько всё плохо. ChatGPT не понимает вообще ничего, не способен следовать указаниям, выдаёт чушь, галлюцинирует и, в конце концов, даёт антиэволюционные советы.

К сожалению, лишь полная деградация по сравнению с конкурентами. Теперь понятно, почему Сэм Альтман в глубокой панике

А что надо было сделать? Получить идею и пойти в Nano Banana (16), получается?

👾 подписаться на Бурого / забрать Нейробазу
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Kling 2.6

Третий день омниканальных новостей от Клинга!

Слоган: "See the Sound, Hear the Visual". Типа усмотри звук, услышь визуал.

Акцент на генерацию звука: монологи с липсинком, нарратив, мульти-диалоги(!), музика, пестни, спецэффекты. Все это для text-to-video и image-to-video. Можно озвучивать и оживлять не только людей, но и персонажи.

Раскатано везде, от Фала до Хиггса.

Интересно, что они еще бахнут на этой неделе? Куда уж круче?

Ну и у меня реально ощущение, что в декабре все просто взбесились. Только третье число, а все изрыгают новости с такой скоростью, что декабрь по информационной колмогоровской плотности превзойдет весь 2025 год.

Что же будет в 2026?

@cgevent
Немцы запилили 3D-карту Земли со всеми 2,75 миллиардами зданий. Большинство зданий это просто синие параллелепипеды, но все равно прикольно. Можно оценивать плотность застройки, изучать уровень благосостояния и урбанистам, в целом, полезно.
This media is not supported in your browser
VIEW IN TELEGRAM
Kling O1 действительно очень хорош. Он правда хорошо удаляет объекты с видео.
🔥2
Слит маркетинговый план GTA 6 на следующий год 🙈
🤔1
Также прогноз погоды в Банане в реальном времени можно делать не только для городов, но и для целых стран
1
Очередное выражение почтения Банане Про. По горячим следам, в целом верно указан и показан эпицентр землетрясения, которое ощущалось в моем городе 40 минут назад. География полностью верная, текст правильный. Хоть сейчас анимируй и в эфир местных новостей.
🔥7😱3👍1
Google представил режим Deep Think для Gemini 3 и это прорыв

Сегодня Google официально запустил Deep Think — новый режим усиленного мышления для модели Gemini 3. Он доступен пользователям подписки Google AI Ultra прямо в приложении Gemini: достаточно выбрать соответствующий пункт в меню, и модель начнёт тратить больше времени и вычислительных ресурсов на глубокий анализ задачи перед ответом.

Этот режим заставляет алгоритм тратить время и серьезные вычислительные мощности не на генерацию слов, а на внутреннюю верификацию ответов перед их выдачей. Мы окончательно переходим от эры скорострельных чат-ботов к этапу вдумчивого машинного анализа, и это ощущается как долгожданное взросление технологии.

Главная инженерная красота здесь кроется в том, что в гражданскую версию модели перекочевала та самая логика, которая ранее принесла Google золото на математических олимпиадах IMO и турнирах по программированию ICPC. Теперь эта способность просчитывать варианты наперед и выбирать оптимальный маршрут решения стала доступна в обычном интерфейсе, превращая модель из эрудита в стратега.

Сухие цифры бенчмарков в этот раз выглядят интригующе именно своим качественным разрывом с прошлым. На тесте ARC-AGI-2, который считается одним из самых честных индикаторов интеллекта (так как требует решения визуальных задач с неизвестными ранее правилами), новинка выдает 45,1%. Чтобы понимать масштаб: предыдущая версия набирала там скромные 4,9%, а ближайшие конкуренты вроде GPT-5.1 застряли на отметке 17,6%. Такой скачок говорит о том, что модель научилась действительно обобщать информацию и видеть закономерности там, где раньше алгоритмы терялись.

В сложнейшем тесте Humanity’s Last Exam результат достиг 41%, что создает уверенный отрыв от рынка. В математических задачах AIME точность взлетела до 95%, а в написании кода модель демонстрирует надежность, которую сложно получить от стандартных генеративных сетей. Похоже, Google удалось нащупать архитектурное решение, позволяющее ИИ перестать быть просто генератором текста и стать инструментом для решения многоходовых инженерных задач.
2
У меня сильное подозрение, что внутри Gemini 3 сидит смешанная архитектура. Я не говорю про ядро, оно очевидно трансформер. Но вот ЧАСТЬ ядра... Такой отрыв по логике и математике может указывать на то, что в архитектуре Gemini может использоваться гибридный подход, и часть её не является просто языковой моделью. Я ставлю на то, что Google начали эксперименты с нейро-символической архитектурой. И это дает свои результаты. Офигенные результаты.
Ну, собственно, чего я гадал, когда ДА:

Google стал одним из главных драйверов «нейро-символического ренессанса» 2024–2025 годов. Основная цель этого направления — решить проблему галлюцинаций LLM в задачах, требующих строгой логики и математической точности.

Флагманские проекты:

AlphaProof и AlphaGeometry 2: Это самые яркие примеры успеха. В 2025 году эта связка достигла уровня золотой медали на Международной математической олимпиаде (IMO).

Архитектура: Гибрид. Используется языковая модель (на базе Gemini) для перевода задач на формальный язык (Lean) и генерации идей, а также символический движок для строгой логической дедукции и проверки доказательств.

Gemini Deep Think: Технологии, отработанные на олимпиадных задачах, начали внедряться в потребительские модели под видом «режима глубокого мышления», позволяя модели выстраивать длинные цепочки рассуждений (Chain of Thought) с внутренней верификацией.
С чем я нас и поздравляю — официально началась эпоха доминирования нейро-символической архитектуры. Трансформеры не умирают, но занимают адекватное себе место, как рот для мозга.

Эпоха GPT не уходит. Она уже ушла.
Если кто не понял, нейро-символическая архитектура теоретически способна обучаться и запоминать. В отличие от трансформеров. Это... прямая дорожка к AGI.
На AlphaArena появилась загадочная «mystery model», которая буквально разрывает всех в реальном трейдинге.

Стартует с $10 000, торгует криптой, акциями и контрактами — и уверенно уходит в плюс, ловя пики с пугающей точностью. Остальные модели в основном сливают депозит, а эта будто знает будущее.

Илон Маск лично подтвердил в X: да, это тестовая версия Grok 4.20 (да, с ноликом в конце — это не опечатка 😉).

Официального анонса и даты релиза пока нет, но если xAI решит сделать подарок на Новый год — мы будем первыми в очереди 🎄
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Промпт для создания полностью интерактивной 3D-сцены офисного здания в Gemini 3 без строчки кода.