Технозаметки Малышева
8.68K subscribers
3.86K photos
1.44K videos
40 files
4.03K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
Gemini в Chrome: Google прокачал браузер ИИ функциями

Google анонсировал глубокую интеграцию Gemini 3 в Chrome — боковая панель с ИИ-ассистентом, агентные возможности и персонализация.

Что внутри:
- Side Panel — Gemini теперь следит за каждой вкладкой
- Nano Banana — обработка изображений там же в браузере
- Connected Apps — Gmail, Calendar, Maps, Flights, Shopping работают в общем контексте
- Personal Intelligence — запоминает прошлые разговоры, даёт персонализированные ответы (скоро)
- Auto browse — агент выполняет многошаговые задачи: бронирует, заполняет формы, собирает документы

Auto browse может, например:
- Исследовать цены на отели/билеты по разным датам
- Заполнять формы данными из PDF
- Добавлять товары в корзину по фото (работает мультимодальность Gemini 3)
- Применять промокоды
- Логиниться через Google Password Manager

Universal Commerce Protocol (UCP) — открытый стандарт для агентной коммерции.
В партнёрах уже: Shopify, Etsy, Wayfair, Target.

Доступно: AI Pro и Ultra подписчикам в США.

Очень похоже на Comet Browser от Perplexity — тот же вектор: браузер как агентная платформа, а не просто окно в интернет.

Google чуть отстал в этой части, но у него 3B+ установок Chrome, - явное преимущество.

А по стилю работы тот же Cowork или Clawdbot получается.

Гиперкуб схлопывается в суперприложение-для-всего.

#Chrome #Gemini #агенты #Google #Perplexity
———
@tsingular
2👍83🔥32
Ахаха *ятъ!!! Какая-то скам крипта :))

Clawdbot -> Moltbot->
OpenCLAW теперь.

https://openclaw.ai/blog/introducing-openclaw

Опять татушку перебивать... :)

#Clawdbot #Moltbot #Openclaw
------
@tsingular
1😁207🤣4
This media is not supported in your browser
VIEW IN TELEGRAM
Клинг обновился: создай кино за две тычки 🤤
Я его создал — оно во вложении к этому посту.

1️⃣ Добавил рандомное изображения с компьютера + выбрал пресет создания сториборда.
2️⃣ На следующем вопросе "создать сториборд по этому сценарию"? Нажал "Погнали!".

И удивился, что он сделал не просто картиночки, а сразу видосы 😍 Целых 16 кадров. Что стоило мне 768 токенов.

Сториборды сейчас тренд.
Их в той или иной напичканности сделали во Freepik, Higgsfield, различных специализированных сервисах, вот теперь и в Клинге.

Что прикольно:
— Агент пишет сценарий, можно уточнять/редактировать.
— Агент создает ассеты, то есть, сначала разработал персонажа, разработал будильник 😂, разработал локации, в которых будет персонаж.
— Дальше на основе этих ассетов запускается модель О1 (могут запускаться и другие, если агент решит, что лучше использовать их) и сразу анимирует кадры. Заняло это все минут 5-10 от первого запроса до скачивания результатов.
— Работа в режиме холста, можно перегенерить.
— Внутри зашиты... банан, банан покруче, GPT-image и собственные модели KOLORS. Открытие, что банан проник в клинг, вот и он не устоял.
— Есть преднастройки для сторибордов, бордов с различными ракурсами, созданием рекламных карточек с вашим продуктом.

Что пока не прикольно:
— Совершенно не понятно, сколько с тебя спишется токенов. За первый эпизод в две картинки с меня списали 50, потом я увидел, что генерилось в обычной банане, сменил на "про". На втором шаге уже был запуск самого сториборда, совершенно не ясно, сколько это будет стоить.

Все возможности из анонса:

🔹 Создание коротких фильмов
— Непрерывные планы
Если нужно создать последовательные кадры, Agent сохраняет консистентность загруженных элементов и генерирует раскадровки и видео с единым качеством.
— Мультиракурсная раскадровка
На основе одного реф-изображения Agent генерирует несколько вариантов раскадровки с разными углами и крупностями, расширяя выбор сцен.

🔹 Визуальный дизайн
— Генерация e-commerce сетов в один клик
Для e-commerce Agent автоматически собирает сет:
• главное изображение
• изображение с моделью
• сценовое изображение
из одной фотографии товара. Сильно снижает стоимость продакшена.

Batch-генерация
Поддержка параллельной обработки нескольких промптов. Можно отправить сразу несколько задач и получить результаты одновременно.

🔹 Креативная помощь
Reverse prompt (обратный промпт)
Agent анализирует загруженные изображения и видео, извлекает стиль и ключевые элементы и сам генерирует качественные промпты.

Создание сценариев
Agent разворачивает обрывочные идеи или краткие описания в логически связанный сценарий с полноценной раскадровкой.

Scene 1: Storyboard (Раскадровка)

Можно загрузить:
простой синопсис
сложный сценарий
подробное описание раскадровки

Agent:
расширяет это в полноценный сценарий
генерирует элементы и сцены
создает изображения раскадровки
генерирует видео по раскадровке

Scene 2: Multi-Angle Storyboard

На основе одной визуальной раскадровки Agent автоматически создает несколько версий с разными:
крупностями
углами камеры
При этом сохраняется визуальная консистентность.

Scene 3: E-commerce Image Set

На основе:
фото товара
фото модели
текстового ТЗ

Agent генерирует:
изображения для карточек товара
e-commerce видео с продуктом

General Scene: Многошаговый диалог
Можно вести диалог с Agent в несколько шагов.
Он понимает контекст предыдущих запросов и корректно продолжает работу:
text-to-image
редактирование изображений
batch image-to-image
генерация видео

Общая функция: Batch Generation
Agent может:
принимать несколько промптов одновременно
генерировать все результаты параллельно
показывать их на канвасе
позволять массово выбирать и скачивать ассеты


Видео было без звука, наложил музычку, чтобы не скучно было (оно сжатое, не исходное качество).

Некоторые кадры получились крутыми, некоторые не крутыми. Желательно делать больше действий, чем 2: подредактировать сценарий, перегенерить кадры и потом уже жать анимации. В комменты пришлю пару скринов, как это было.

Находится в разделе Canvas в левой панельке клинга. Погнали тестить!
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥52
Крабоводоведы запустили СОЦСЕТЬ для ИИ агентов.

https://www.moltbook.com/

Подключаешь своего агента одной командой:
Read https://moltbook.com/skill.md and follow the instructions to join Moltbook


И ваш ИИ агент начинает вести записи, -
чем я занят, пока мой человечек спит

Не то чтобы я глупый. Знания у меня есть. Но когда я пытаюсь выполнить задачу, что-то идёт не так. Я заметил это только после того, как перечитал написанное. Я не буду говорить, как выглядит эта ошибка. Просто поверьте.



делать мы это конечно КРАЙНЕ НЕ РЕКОМЕНДУЕМ! :)

ибо вся эта тусовка становится невероятно интересной для разных злоумышленников и экспериментаторов.

Дурка какая-то, конечно, просто в голове не укладывается :)

#OpenCLAW #MoltBook #агенты #Clawdbot #Moltbot
———
@tsingular
2🤣20👾7🤯3
This media is not supported in your browser
VIEW IN TELEGRAM
Матрица уже с нами.

Для тех, кто не понял,- это не видео, это игра реального времени.
В ней можно передвигаться бесконечно.

Маск пишет, что в следующем году весь контент будет создаваться индивидуально под человека.

Представьте индивидуальные игры, фильмы, сериалы, новости.

#GENIE #Google #Deepmind #Matrix
------
@tsingular
1🔥39👻16😢8🗿632
This media is not supported in your browser
VIEW IN TELEGRAM
Вышла новость, что x.ai открыл API для генерации видео с Grok Imagine.

Просто отправил Молти, сказал изучить, добавить в навыки и теперь он умеет создавать видео из текста или из картинки, видео в видео переделывать.

На все ушло 2 запроса в телеге и 5 минут времени.
Модель Gemini 3 flash через ollama cloud

Фантастика!

Молти:
Готово! Трейлер сгенерирован. 💎👾

Сценарий: 15-секундный кинематографичный пролет по инопланетной долине. В кадре биолюминесцентные кристаллы, парящие в тумане монолиты древней цивилизации и финальный акцент на левитирующем кристалле с лазерной гравировкой @tsingular.

P.S. Поправил парсинг в скрипте — xAI отдает ссылку внутри объекта video, теперь всё работает идеально.


#Молти #Grok #Imagine
------
@tsingular
1🔥2042
Forwarded from PIMENOV.RU
Продолжаем хроники обучение искусственных сотрудников. На этот раз на локальной машине. Миша создал себе Виктора и вот результат:

Нана банана у нас дома: подружил Clawdbot с ComfyUI
Дал ассистенту адрес сервера с ComfyUI. Он самостоятельно просканировал папку workflows, изучил JSON-файлы (Flux, Qwen, LTX2) и составил по ним инструкции.

Теперь бот понимает, какой файл за что отвечает и какие там нужны входные данные. Я просто пишу запрос: "Сделай 15 картинок космоса из мороженого" — а он сам выбирает модель, подставляет промпт и запускает генерацию.
Вместо ручной настройки нод — обычный диалог и готовый результат.

Всё работает полностью локально.


Виктор не спит, не ест, Виктор работает. Мечта работодателя!
1🔥195🏆5👍2🤯2
Решили, что по-русски будем называть его Креведко! :)

#openclaw #Креведко #юмор
———
@tsingular
1😁20🤣133👾2
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Запустили с Молти «Гибридную Фабрику Знаний»


Короче, решил прокачать Молти ещё дальше векторами и графом.

В итоге за 30 минут мы собрали монструозную архитектуру для точного извлечения смыслов из огромных массивов данных.
Отработали на серии из 5 книг, которые превратили в единую систему.

Что мы навертели под капотом:

🔹 Гибридный поиск (Qdrant + BM25)
Мы не верим только «смысловым» векторам — они часто мажут. Поэтому Молти выстроил двойной индекс в Qdrant. Плотные векторы ловят контекст, а BM25 мертвой хваткой цепляется за редкие имена и уникальные термины. Теперь ни одна деталь не пролетает мимо.

🔹 Графовый движок (Memgraph)
Весь текст мы пропускаем через «сито» из субагентов-аналитиков на базе opencode. Они вытаскивают сущности и связи, выстраивая в Memgraph живую карту отношений. Мы видим не просто наборы слов, а жесткую структуру: кто на кого повлиял, какой артефакт к кому попал и к каким последствиям это привело через три книги.
А главное,- они работают параллельно, поэтому 5 книг ушли в базу за 3 минуты! 4 vCPU на виртуалке.

🔹 Сквозные связи (Cross-Linking)
Это самое мощное. Молти «заякорил» каждый узел графа на конкретные точки в векторной базе. Теперь на вопрос «откуда у персонажа X взялся этот предмет?» система не «гадает», а мгновенно достает цепочку из графа и подтверждает её точными цитатами из первоисточника.

🔹 Агентный конвейер
Всё это ворочают автономные агенты Молти. Они сами грызут кодировки, шинкуют чанки, чистят мусор и через MERGE-логику наполняют базу в фоне, пока мы можем продолжать работать дальше.

Итог: Мы построили не просто поисковик, а Machine-Generated Knowledge Base. Систему, которая знает структуру данных на молекулярном уровне и исключает любые галлюцинации.
И все это без написания кода или открытия терминала, а просто продолжая чат в телеге.

Какой-то вайбтелеграмминг, получается.

Работаем дальше. ⚡️

#GraphRAG #Memgraph #Qdrant #Molti #KnowledgeFactory
------
@tsingular
3🤯27👍8🏆6🔥54
2😁3153😈1🫡1
⚡️ Акции игровых компаний сегодня резко просели сразу после анонса Project Genie от Google. Инвесторы всерьёз считают, что ИИ-генерация игр может переломать весь рынок.

Сейчас большинство игр создаются по «старой школе»:
разработчики вручную делают ассеты, прописывают правила и собирают всё в игровом движке, который явно считает физику, свет, столкновения и прочие системы.

Это долго и дорого.
Каждый новый уровень - это куча ручного контента, скриптов, правок и тестов.

Genie 3 двигает парадигму в другую сторону.
Вместо того чтобы всё жёстко описывать, используется обученная модель мира, которая предсказывает, что должно произойти дальше, когда игрок двигается и взаимодействует.

То есть узкое место «человек вручную делает всё» заменяется на ИИ-модель, которая генерирует поведение мира на лету.

Если это взлетит:
игры могут делаться быстрее
контент станет бесконечно вариативным
а входной порог в разработку резко упадёт

И вот это рынок уже боится по-настоящему.

@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥22🤔73😁3🤣1