Технозаметки Малышева
11.1K subscribers
4.59K photos
1.69K videos
41 files
4.66K links
Новости инноваций из мира Искусственного Интеллекта. 🤖 [РКН: 7021469833 ]

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸: https://pay.cloudtips.ru/p/c8960bb
Download Telegram
Forwarded from Machinelearning
Qwen3.7 уже залетел на Arena😻

Версии
• Qwen3.7-Max-Preview
• Qwen3.7-Plus-Preview


Это пока preview-версии, вот их результаты:

- #6 на Text
- #5 в Vision

Ждём полноценный релиз.

Изначально ожидалось, что её анонсируют и запустят на Alibaba Cloud Summit 20 мая, но, похоже, команда Alibaba Qwen просто не смогла ждать ивент!

chat.qwen.ai

@ai_machinelearning_big_data
🔥14311
Китайские кандзи теперь стали бенчмарком для VLLM

Вышел открытый Chronicles-OCR - новый визуальный бенчмарк для проверки, насколько хорошо мультимодальные модели понимают древние китайские иероглифы.

Идея очень крутая: модели дают не современные аккуратные символы из шрифта, а реальные исторические формы письма за 3000 лет эволюции.

В датасете:

• 7 исторических стилей письма - от гадательных костей до скорописи
• 2800 сбалансированных изображений
• разные физические носители, где символы выглядят совсем не как “чистый OCR”
• задачи на поиск символов, распознавание, разбор древнего текста и классификацию стиля письма

Почему это интересно?

Потому что обычный OCR проверяет, умеет ли модель читать текст. А Chronicles-OCR проверяет другое: понимает ли VLLM, как меняется визуальная форма одного и того же знака во времени, на разных материалах и в разных стилях письма.

Для мультимодальных моделей это больное место. Символ может быть тем же самым по смыслу, но визуально выглядеть как совершенно другой объект. И здесь сразу видно, где модель реально “видит”, а где просто угадывает по паттернам.

Paper: https://arxiv.org/abs/2605.11960
GitHub: https://github.com/VirtualLUOUCAS/Chronicles-OCR
3🔥32🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
KYC можно хоронить.

Kling Motion Control - пока не в реальном времени, но можно же заранее записать движения по скрипту.

#Kling #KYC #нейрорендер
———
@tsingular
🔥22🤯111
на ЦИПР прямой эфир прямо сейчас про ИИ в кибербезе

https://player.rms-cloud.ru/embed/cipr-2026-day2?hall=1&session=3

#ЦИПР
———
@tsingular
👍83🔥3🏆3🤩1
This media is not supported in your browser
VIEW IN TELEGRAM
Следующее поколение роверов.

на огород бы его, конечно :)

#роботы #ровер
———
@tsingular
🤣22🔥1011👾1
Forwarded from VAI
This media is not supported in your browser
VIEW IN TELEGRAM
Недавно тестил возможность создания пользовательского интерфейса с помощью новой модели от GPT Image 2. Результат получался достаточно неплохим. 😎

Долго думал, как попробовать протестировать Claude Design и на каких задачах. Но идея совместить сгенерированный интерфейс и создание игрового прототипа на основе него оказалась удачной - всё хорошо сложилось.

Закинул скриншот и за пару итераций получил игровой прототип UI, предварительно попросив того же Claude написать нужный промпт.

I'm attaching a UI screenshot as a reference.
Your task is to build a fully functional interactive HTML prototype based on it.

Requirements:
1. Recreate all visible screens/windows from the reference as faithfully as possible —
colors, layout, typography, spacing, icons (use emoji or SVG approximations if needed)
2. Implement navigation and transitions between all screens shown or implied
(buttons, tabs, modals, sidebars — make them all clickable and working)
3. Use a single self-contained HTML file with embedded CSS and JS
4. Add smooth CSS transitions between views (fade, slide — match the tone of the UI)
5. Make it responsive if the reference suggests it
6. Preserve the visual style: if it's dark/light, minimal/dense, flat/glassmorphism —
commit fully to that aesthetic
7. All interactive elements must work: menus open, forms are fillable,
navigation switches views
Output: one complete .html file, no external dependencies except Google Fonts if needed.
Do not explain the code — just produce the artifact.


Только представьте: 10 минут назад была идея и вы уже на её основе делаете прототип.
Да, это всего лишь прототип, и нужно рисовать генерировать иконки и дорабатывать в общем. Но какой пласт работы ИИ уже способен забрать на себя. 😱

Кстати, иконки можно так же вытащить с референса, перевести в вектор через ИИ и использовать.

Лично по моему опыту, для создания более-менее вменяемого среднего по сложности интерфейса нужно около месяца. Сейчас, используя всего два инструмента, можно очень сильно сократить этот путь и получить приличный результат.

Скачать можно в ZIP, PDF, HTML, можно Send to Canva или Figma(но тут есть нюансы, так как нет прямого пути для Figma, есть обходные пути, спросите у своей LLM, она расскажет как).

P.S. Обдумывая этот пост, наткнулся ещё на одну мысль. Из-за большого количества инструментов и информационной каши у многих просто нет понимания, как их матчить между собой.
У меня есть крутой скилл ресёрчера с мультиагентной системой. Думаю, как появится время - пройдусь им и соберу стеки инструментов, которые хорошо дополняют друг друга и которые можно применять в работе, ускоряя процессы и помогая себе. Если интересно - поделюсь потом результатами. 🔥

@VAI_ART
#VAI_Practice
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍22🔥821
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Там 3D-генератор Rodin обновился до версии 2.5

Теперь он умеет генерить 10 МИЛЛИОНОВ ПОЛИГОНОВ.

Не уверен, что это главная метрика для генераторов, но размах впечатляет.

Там много и других ништяков и конечно Thinking Mode.

Надо тестировать..

https://hyper3d.ai/

@cgevent
🤯93👀1
Андрей Карпаты ушёл в Антропик:

Я присоединился к Anthropic. Думаю, ближайшие несколько лет на фронтире LLM будут особенно определяющими. Очень рад войти в команду и вернуться к R&D. По-прежнему глубоко увлечён образованием и со временем планирую возобновить работу над ним.​​​​​​​​​​​​​​​​


Сергей Булаев AI 🤖 - об AI и не только
11🤯7👍6🔥42
Forwarded from эйай ньюз
Вышла Gemini 3.5 Flash

Она заметно сильнее чем Gemini 3.1 Pro, но цены за токены выросли в 3 раза, с $0.5/$3 до $1.5/$9 за миллион токенов. 3.1 Pro, для сравнения, стоит $2/$12 за миллион токенов для контекстов меньше 200к. Насколько реально выросла стоимость за задачу по сравнению с прошлой Flash мы узнаем только с тестами.

Самое главное — Google серьёзно отнёсся к проблемам в агентности и особенно прокачал модель в этом. Как пример показали как Gemini 3.5 Flash написала за 12 часов небольшую ОС, которая может запустить Doom. Pro модель существует, её обещают завезти в следующем месяце, страшно какие там заломят цены.

@ai_newz
🤔61👏1
🔥 Google I/O 2026 — главные анонсы

🧠 Gemini 3.5 Flash — новая флагманская модель

- Превосходит Gemini 3.1 Pro по всем бенчмаркам
- Генерация токенов в ~4× быстрее других frontier-моделей
- Демо: сгенерировала игру в стиле Chrome Dino в реальном времени (~1500 токенов/сек)
- Доступна уже сегодня в Gemini App и Search AI Mode

---

🎨 Gemini Omni — мультимодальный генератор

- Принимает любой вход: текст, фото, видео, аудио → генерирует видео
- «Рассуждает» о том, что должно произойти дальше, понимает физику
- 16 разных ракурсов видео из одного фото
- Меняет актёров/стиль сцены без пересъёмки
- Доступна подписчикам AI Plus / Pro / Ultra и бесплатно на YouTube Shorts

---

Gemini Spark — персональный AI-агент

- Работает 24/7 в фоне на базе Gemini 3.5 Flash
- Демо: планирование вечеринки — рассылки, RSVP, Google Sheets + Slides
- Пользователь подтверждает ключевые действия перед исполнением
- Бета на следующей неделе для AI Ultra → летом в Gmail, Workspace, Android, iOS
- Интеграция с Instacart для автоматических заказов

---

💰 Тарифы AI — перетряска

- Новый план $100/мес (AI Ultra для разработчиков) — 5× лимиты Pro, 20TB, YouTube Premium, приоритетный Antigravity
- Старый Ultra снижен с $250 до $200/мес

---

🛒 Universal Cart + Agent Payments (AP2)

- Универсальная корзина: сквозная через Search, Gemini, YouTube, Gmail
- AI ищет скидки, отслеживает цену, уведомляет о переуступке
- AP2 — протокол, позволяющий агентам оплачивать покупки от вашего имени с guardrails (лимиты, бренды, категории)
- Лето 2026, США

---

🔍 AI Search — переработанный поиск

- Поисковая строка динамически расширяется, предвосхищая запрос
- Information Agents — кастомные поисковые агенты, непрерывно работающие в фоне (мониторинг квартир, акций, кроссовок)
- Circle to Search теперь определяет AI-сгенерированные изображения
- SynthID → Search и Chrome

---

🥽 Android XR — умные очки

- Audio Glasses (осень 2026) — без дисплея, Gemini говорит прямо в ухо, музыка и фото hands-free. Партнёры: Warby Parker, Gentle Monster, Samsung
- Project Aura — AR-очки с дисплеем, «лучшие из опробованных» (CNET)
- Демо: очки увидели кофейню → Gemini через DoorDash заказал cold brew → пользователь подтвердил
- Совместимы с Android и iOS

---

💻 Googlebook — новый класс ноутбуков

- Aluminum OS — слияние Android и ChromeOS
- Ноутбуки от HP, Dell, Lenovo, Acer, ASUS — осенью 2026
- Gemini встроен, стриминг приложений с телефона, Android-приложения нативно
- Magic Pointer — взмах мышью вызывает AI-инструменты
- Create My Widget — AI-генерация виджетов

---

📱 Android 17 + Android Halo

- Android Halo — уведомление вверху экрана, показывающее, что делает AI-агент в реальном времени
- Интеграция с Gemini Spark
- App Bubbles — плавающие окна для любого приложения
- Усиленная безопасность: лимит попыток ввода PIN, IMEI на экране блокировки

---

🤖 Antigravity 2.0 — платформа для AI-агентов

- Standalone desktop-приложение
- CLI для разработчиков
- Мультиагентная генерация: одновременно создаёт инфографики, ОС, даже Doom
- Защита данных на уровне Google Cloud

---

📝 Docs Live + Google Pics + Stitch

- Docs Live — создаёшь документ через разговор с Gemini, подтягивает данные из Gmail/Drive
- Google Pics — AI-редактор изображений на базе Nano Banana (летом в Workspace)
- Stitch — 100 млн+ UI-экранов сгенерировано; теперь real-time steering через естественный язык

---

🎵 Flow Music + Ask YouTube

- Flow Music — мобильное приложение, точное редактирование (замена текста в отдельных секциях, генерация из фрагментов)
- Ask YouTube — YouTube как AI-чатбот, ведёт к конкретным таймстампам

#Google #конференции
------
@tsingular
🔥533🆒11
This media is not supported in your browser
VIEW IN TELEGRAM
Эрика Шмидта (exCEO Google) освистали на выпускном в Аризоне после речи про ИИ.

Перевёл для вас.

#Eric #Schmidt
------
@tsingular
2🤔2😁1💯1😈1