Технозаметки Малышева
11.1K subscribers
4.6K photos
1.7K videos
41 files
4.66K links
Новости инноваций из мира Искусственного Интеллекта. 🤖 [РКН: 7021469833 ]

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸: https://pay.cloudtips.ru/p/c8960bb
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Следующее поколение роверов.

на огород бы его, конечно :)

#роботы #ровер
———
@tsingular
🤣23🔥10👾211
Forwarded from VAI
This media is not supported in your browser
VIEW IN TELEGRAM
Недавно тестил возможность создания пользовательского интерфейса с помощью новой модели от GPT Image 2. Результат получался достаточно неплохим. 😎

Долго думал, как попробовать протестировать Claude Design и на каких задачах. Но идея совместить сгенерированный интерфейс и создание игрового прототипа на основе него оказалась удачной - всё хорошо сложилось.

Закинул скриншот и за пару итераций получил игровой прототип UI, предварительно попросив того же Claude написать нужный промпт.

I'm attaching a UI screenshot as a reference.
Your task is to build a fully functional interactive HTML prototype based on it.

Requirements:
1. Recreate all visible screens/windows from the reference as faithfully as possible —
colors, layout, typography, spacing, icons (use emoji or SVG approximations if needed)
2. Implement navigation and transitions between all screens shown or implied
(buttons, tabs, modals, sidebars — make them all clickable and working)
3. Use a single self-contained HTML file with embedded CSS and JS
4. Add smooth CSS transitions between views (fade, slide — match the tone of the UI)
5. Make it responsive if the reference suggests it
6. Preserve the visual style: if it's dark/light, minimal/dense, flat/glassmorphism —
commit fully to that aesthetic
7. All interactive elements must work: menus open, forms are fillable,
navigation switches views
Output: one complete .html file, no external dependencies except Google Fonts if needed.
Do not explain the code — just produce the artifact.


Только представьте: 10 минут назад была идея и вы уже на её основе делаете прототип.
Да, это всего лишь прототип, и нужно рисовать генерировать иконки и дорабатывать в общем. Но какой пласт работы ИИ уже способен забрать на себя. 😱

Кстати, иконки можно так же вытащить с референса, перевести в вектор через ИИ и использовать.

Лично по моему опыту, для создания более-менее вменяемого среднего по сложности интерфейса нужно около месяца. Сейчас, используя всего два инструмента, можно очень сильно сократить этот путь и получить приличный результат.

Скачать можно в ZIP, PDF, HTML, можно Send to Canva или Figma(но тут есть нюансы, так как нет прямого пути для Figma, есть обходные пути, спросите у своей LLM, она расскажет как).

P.S. Обдумывая этот пост, наткнулся ещё на одну мысль. Из-за большого количества инструментов и информационной каши у многих просто нет понимания, как их матчить между собой.
У меня есть крутой скилл ресёрчера с мультиагентной системой. Думаю, как появится время - пройдусь им и соберу стеки инструментов, которые хорошо дополняют друг друга и которые можно применять в работе, ускоряя процессы и помогая себе. Если интересно - поделюсь потом результатами. 🔥

@VAI_ART
#VAI_Practice
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍29🔥1721
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Там 3D-генератор Rodin обновился до версии 2.5

Теперь он умеет генерить 10 МИЛЛИОНОВ ПОЛИГОНОВ.

Не уверен, что это главная метрика для генераторов, но размах впечатляет.

Там много и других ништяков и конечно Thinking Mode.

Надо тестировать..

https://hyper3d.ai/

@cgevent
🤯94👀1
Андрей Карпаты ушёл в Антропик:

Я присоединился к Anthropic. Думаю, ближайшие несколько лет на фронтире LLM будут особенно определяющими. Очень рад войти в команду и вернуться к R&D. По-прежнему глубоко увлечён образованием и со временем планирую возобновить работу над ним.​​​​​​​​​​​​​​​​


Сергей Булаев AI 🤖 - об AI и не только
12🤯7👍6🔥42
Forwarded from эйай ньюз
Вышла Gemini 3.5 Flash

Она заметно сильнее чем Gemini 3.1 Pro, но цены за токены выросли в 3 раза, с $0.5/$3 до $1.5/$9 за миллион токенов. 3.1 Pro, для сравнения, стоит $2/$12 за миллион токенов для контекстов меньше 200к. Насколько реально выросла стоимость за задачу по сравнению с прошлой Flash мы узнаем только с тестами.

Самое главное — Google серьёзно отнёсся к проблемам в агентности и особенно прокачал модель в этом. Как пример показали как Gemini 3.5 Flash написала за 12 часов небольшую ОС, которая может запустить Doom. Pro модель существует, её обещают завезти в следующем месяце, страшно какие там заломят цены.

@ai_newz
🤔9👏31
🔥 Google I/O 2026 — главные анонсы

🧠 Gemini 3.5 Flash — новая флагманская модель

- Превосходит Gemini 3.1 Pro по всем бенчмаркам
- Генерация токенов в ~4× быстрее других frontier-моделей
- Демо: сгенерировала игру в стиле Chrome Dino в реальном времени (~1500 токенов/сек)
- Доступна уже сегодня в Gemini App и Search AI Mode

---

🎨 Gemini Omni — мультимодальный генератор

- Принимает любой вход: текст, фото, видео, аудио → генерирует видео
- «Рассуждает» о том, что должно произойти дальше, понимает физику
- 16 разных ракурсов видео из одного фото
- Меняет актёров/стиль сцены без пересъёмки
- Доступна подписчикам AI Plus / Pro / Ultra и бесплатно на YouTube Shorts

---

⚡️ Gemini Spark — персональный AI-агент

- Работает 24/7 в фоне на базе Gemini 3.5 Flash
- Демо: планирование вечеринки — рассылки, RSVP, Google Sheets + Slides
- Пользователь подтверждает ключевые действия перед исполнением
- Бета на следующей неделе для AI Ultra → летом в Gmail, Workspace, Android, iOS
- Интеграция с Instacart для автоматических заказов

---

💰 Тарифы AI — перетряска

- Новый план $100/мес (AI Ultra для разработчиков) — 5× лимиты Pro, 20TB, YouTube Premium, приоритетный Antigravity
- Старый Ultra снижен с $250 до $200/мес

---

🛒 Universal Cart + Agent Payments (AP2)

- Универсальная корзина: сквозная через Search, Gemini, YouTube, Gmail
- AI ищет скидки, отслеживает цену, уведомляет о переуступке
- AP2 — протокол, позволяющий агентам оплачивать покупки от вашего имени с guardrails (лимиты, бренды, категории)
- Лето 2026, США

---

🔍 AI Search — переработанный поиск

- Поисковая строка динамически расширяется, предвосхищая запрос
- Information Agents — кастомные поисковые агенты, непрерывно работающие в фоне (мониторинг квартир, акций, кроссовок)
- Circle to Search теперь определяет AI-сгенерированные изображения
- SynthID → Search и Chrome

---

🥽 Android XR — умные очки

- Audio Glasses (осень 2026) — без дисплея, Gemini говорит прямо в ухо, музыка и фото hands-free. Партнёры: Warby Parker, Gentle Monster, Samsung
- Project Aura — AR-очки с дисплеем, «лучшие из опробованных» (CNET)
- Демо: очки увидели кофейню → Gemini через DoorDash заказал cold brew → пользователь подтвердил
- Совместимы с Android и iOS

---

💻 Googlebook — новый класс ноутбуков

- Aluminum OS — слияние Android и ChromeOS
- Ноутбуки от HP, Dell, Lenovo, Acer, ASUS — осенью 2026
- Gemini встроен, стриминг приложений с телефона, Android-приложения нативно
- Magic Pointer — взмах мышью вызывает AI-инструменты
- Create My Widget — AI-генерация виджетов

---

📱 Android 17 + Android Halo

- Android Halo — уведомление вверху экрана, показывающее, что делает AI-агент в реальном времени
- Интеграция с Gemini Spark
- App Bubbles — плавающие окна для любого приложения
- Усиленная безопасность: лимит попыток ввода PIN, IMEI на экране блокировки

---

🤖 Antigravity 2.0 — платформа для AI-агентов

- Standalone desktop-приложение
- CLI для разработчиков
- Мультиагентная генерация: одновременно создаёт инфографики, ОС, даже Doom
- Защита данных на уровне Google Cloud

---

📝 Docs Live + Google Pics + Stitch

- Docs Live — создаёшь документ через разговор с Gemini, подтягивает данные из Gmail/Drive
- Google Pics — AI-редактор изображений на базе Nano Banana (летом в Workspace)
- Stitch — 100 млн+ UI-экранов сгенерировано; теперь real-time steering через естественный язык

---

🎵 Flow Music + Ask YouTube

- Flow Music — мобильное приложение, точное редактирование (замена текста в отдельных секциях, генерация из фрагментов)
- Ask YouTube — YouTube как AI-чатбот, ведёт к конкретным таймстампам

#Google #конференции
------
@tsingular
🔥16542🆒111
This media is not supported in your browser
VIEW IN TELEGRAM
Эрика Шмидта (exCEO Google) освистали на выпускном в Аризоне после речи про ИИ.

Перевёл для вас.

Какие мысли? Правильно говорит/нет?

#Eric #Schmidt
------
@tsingular
2😁2🤔2💯2😈1
что то после всех этих историй когда ИИ удаляет данные, я вообще слово "удалить" стараюсь не использовать в запросах.

лучше пусть я потом сам руками почищу что там осталось лишнего, чем такое вот.
Поэтому конечно этого со мной никогда не случится ;)

#юмор
———
@tsingular
😁27👀6🔥31💯1
Media is too big
VIEW IN TELEGRAM
Google Gemini Omni: новый уровень творчества

Google собрал весь мультимодальный стек в одну модель: текст, изображение, аудио, видео на вход - видео на выход.
Первая модель семейства, Gemini Omni Flash, уже доступна подписчикам.

🤖 Что под капотом: Omni принимает любую комбинацию входов (текст + фото + звук + видео) и генерирует видео за один проход модели, а не через цепочку специализированных систем. Каждая инструкция наслаивается на предыдущую: «замени скульптуру на мыльные пузыри», «когда рука касается зеркала - зеркало плывёт» - модель помнит контекст и сохраняет персонажей сквозь правки. Физика улучшена: гравитация, кинетика, динамика жидкости.

💰 Доступ и цены: AI Plus от $20/мес, AI Ultra от $100/мес с приоритетом. Пока только потребительский продукт. Vertex AI API - «в ближайшие недели». Для продакшена пока рано - нет API, нет SLA.

🛡 Безопасность: Каждый ролик маркируется невидимым цифровым водяным знаком SynthID. Google расширяет C2PA Content Credentials и запускает AI Content Detection API для распознавания сгенерированного контента.

Omni - программируемый видеодвигатель по генерации новой реальности кинематографического качества, а не просто игрушка для нейрорендера.
Вариантная реклама, обучающие ролики, визуализация продуктов, фильмы - все можно создавать без студии и привычных рендер инструментов.

#Gemini #Omni #Google #нейрорендер
------
@tsingular
🔥1032🤯2
Forwarded from в IT и выйти
Накопление уникальных данных будет главным условием для прорыва в отечественной робототехнике. Роботы до сих пор отстают от текстовых моделей — всё из-за отсутствия базы для обучения, заявил старший вице-президент Сбера, руководитель блока «Технологическое развитие» Андрей Белевцев на ЦИПР-2026.

Главное из выступления про физический ИИ:
• Прорыв в LLM случился благодаря огромному объему текстов, которые человечество писало веками.

• С роботами это не сработало, так как собирать данные об их движениях в пространстве слишком дорого.

• Сейчас индустрия делает ставку на модели VLA (vision, language, action).

• В моделях VLA текст — связующее звено между «зрением» машины и ее физическим действием.


Сейчас Сбер собирает собственные системы, которые видят происходящее и логично реагируют на него, так что физический киберпанк можно ждать совсем скоро.

@techmedia
👀14👻52💯1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Gemini Omni. Редактирование

Еще три примера редактирования от fofr.

1. исходник
2. сделай её невидимой, надень на неё перчатки
3. пока она говорит, подходят двое мужчин и уносят фотографию в рамке
4. поменяй ее одежду

Ну то есть можно рассматривать Gemini Omni как Нанобанану только для видео. Понимание происходящего в кадре потрясающее, возможности редактирования тоже.

За сим вырисовывается такой пайплайн: генерация в Сиденс, редактирование в Омни.

Да, дороговато получается.

@cgevent
🤯5👍3🔥21❤‍🔥11
Forwarded from Machinelearning
🌟 Nous Research придумала метод предобучения LLM с заявленным ускорением в 2–3 раза

Исследовательская группа опубликовала описание метода Token Superposition Training, который, по утверждению авторов, ускоряет предобучение больших языковых моделей в 2–3 раза по реальному времени при неизменном объёме вычислений.

🟡Суть метода авторы описывают так

На первые 20–40% обучения модель обрабатывает не отдельные токены, а батчи из нескольких идущих подряд токенов, их векторные представления усредняются на входе, а на выходе применяется модифицированная функция потерь.

Никакого отбора по смыслу, частоте или содержанию нет - деление чисто механическое, по позиции в тексте.

Внутри бвтча порядок токенов отбрасывается. Модель не учится предсказывать, какой токен стоит на какой конкретной позиции в ближайшем будущем, - только то, какие токены вообще там встречаются.

Размер батча - один из двух ключевых параметров метода. Оптимальное значение растёт вместе с размером модели: для 270 млн параметров оно лежало в диапазоне от 3 до 8 токенов, а для 10 млрд равнялось 16


Оставшуюся часть обучения модель переводят на обычный режим предсказания следующего токена. По словам Nous Research, готовая модель на инференсе ничем не отличается от обученной стандартным способом - архитектура, оптимизатор, токенизатор или набор данных не изменяются.

Метод протестили на моделях 4-х размеров: 270 млн, 600 млн и 3 млрд параметров, а также на 10 миллиардной MoE.

В самом крупном эксперименте модель с TST достигла более низкого значения лосса, чем сопоставимая по вычислениям базовая модель, примерно за 40% времени и показала лучшие результаты на тестах HellaSwag, ARC и MMLU.

🟡Ограничения

TST расходует обучающие данные быстрее обычного, поскольку модель переваривает больше текста. Если обучающих данных мало, метод становится контрпродуктивным.


🟡Статья
🟡Arxiv


@ai_machinelearning_big_data

#AI #ML #LLM #Pertrain #TST #NousResearch
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥52🤩1