Технозаметки Малышева

🎮 Microsoft представила нейро-версию Quake II на базе Muse и WHAMM.

Microsoft Research представила WHAMM — новую систему или технологию, предназначенную для моделирования окружающего мира в реальном времени, с особым акцентом на интерактивные среды.

Это означает, что WHAMM способна быстро создавать и постоянно обновлять цифровую 3D-модель физического пространства, учитывая изменения, которые происходят в нем, в том числе в результате взаимодействия пользователя или других динамических событий.

▪ ИИ генерирует кадры в реальном времени, анализируя действия игрока.

▪Старая WHAMM — 1 fps, новая — 10 fps при 640×360, почти играбельно.

Модель помнит последние 0,9 секунды, что добавляет случайности.

Ключевая особенность — система работает достаточно быстро, чтобы обновлять модель мира практически мгновенно по мере поступления новых данных от сенсоров (вероятно, камер, датчиков глубины и т.д.). Это критически важно для плавного взаимодействия.

🔗 Играть в ИИ-версию Quake II можно здесь.

@vistehno

#microsoft #ai #quake #muse

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥10❤2👍2

1.71K views09:50

Технозаметки Малышева

Forwarded from PIMENOV.RU

А ещё новый ChatGPT-4o умеет делать смешные несуществующие продукты. Другие примеры создания изображений тут.

🗣

@pimenov_ru

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥13😁4😍3👍1

1.45K views14:30

Технозаметки Малышева

Многотокенное внимание: новый подход к работе с контекстом в LLM

Исследователи предложили новый механизм внимания для языковых моделей — Multi-Token Attention (MTA), который решает ключевое ограничение стандартного механизма внимания.

В обычных трансформерах веса внимания определяются сходством только одной пары векторов query-key. MTA позволяет моделям учитывать несколько токенов одновременно, применяя свёрточные операции над запросами, ключами и головами внимания.

Простой пример: если нужно найти предложение, где упоминаются и "Алиса", и "кролик", стандартное внимание должно кодировать оба токена в одном векторе запроса. MTA же может сначала найти все упоминания "Алисы" и "кролика" по отдельности, а затем определить места, где они встречаются вместе.

Тесты показали, что модели с MTA превосходят базовые трансформеры как в стандартных задачах языкового моделирования, так и в задачах с длинным контекстом, где особенно важно точно находить релевантную информацию.

При этом MTA добавляет всего 0.001% дополнительных параметров и может быть применено выборочно только к нескольким слоям модели без потери эффективности.

#Attention #Architecture #Context
------
@tsingular

👍7✍3⚡2❤1❤‍🔥1🔥1

1.79K views15:23

Технозаметки Малышева

Forwarded from Sinекура

На этой неделе вышел очередной текст с прогнозами развития искусственного интеллекта: "AI 2027" (pdf-версия). Мне он, правда, совсем не кажется "очередным", в основном из-за списка авторов. Так что суммаризировать я его для вас не буду (текст совсем не длинный, рекомендую прочитать целиком), а лучше про этих самых авторов расскажу.

Первый автор, Даниэль Кокотайло — это бывший сотрудник OpenAI. Два самых для нас важных факта про него связаны как раз с этим трудоустройством:

— OpenAI нанял Даниэля после того, как в 2021 году он написал статью "What 2026 Looks Like", где предсказал, как будут развиваться большие языковые модели; сейчас этот текст читается потрясающе, Даниэль оказался прав очень во многом, хотя в 2021-м его прогноз выглядел маловероятно, а для многих и безумно; так что Даниэль Кокотайло — один из лучших людей мира в плане прогнозов о развитии AI;

— а когда в 2024-м Кокотайло увольнялся из OpenAI, он оказался в центре скандала с non-disparagement clause: OpenAI пригрозил ему тем, что не даст продавать акции OpenAI, если Кокотайло будет что-то разглашать о рисках развития AI, и Даниэль... плюнул на акции, чтобы стать whistleblower'ом от AGI (говорят, в акциях OpenAI было около 85% всех денег его семьи).

Второго автора, надеюсь, моим читателям представлять не надо: это Скотт Александр, автор знаменитых блогов SlateStarCodex и AstralCodexTen. Если вы вдруг их не читали, начинайте прямо сейчас (можно начать отсюда или отсюда), хотя навёрстывать придётся много. В связи с "AI 2027" Даниэль Кокотайло и Скотт Александр уже успели появиться в подкасте Дваркеша Пателя, который я тоже, конечно, целиком рекомендую.

Другие авторы не так известны широкой публике; это:
— Томас Ларсен, сооснователь Center for AI Policy;
— Илай Лифланд, один из лидеров команды прогнозистов Samotsvety, один из тех самых superforecasters, которые умеют прогнозировать будущее лучше кого бы то ни было;
— Йонас Фоллмер, VC в Macroscopic Ventures, которому хватило предсказательной силы сделать одну из ранних инвестиций в Anthropic;
— Ромео Дин, магистрант Гарварда и руководитель тамошнего AI Safety Student Team.

В общем, очень внушительная команда. И сейчас все они считают, что вполне реально ожидать появления AGI к 2027–2028 годам. Если гонка разработок в области AGI в итоге победит заботу о безопасности (вам это кажется правдоподобным? мне — вполне), то примерно в 2030–2035 годах нас ждёт тот самый AI takeover, сценарий захвата мира искусственным интеллектом. Это их "плохая концовка", но в тексте предусмотрена и "хорошая", в которой люди сохраняют контроль над ситуацией. Впрочем, в хорошей концовке AGI тоже появляется и тоже трансформирует мир и общество до неузнаваемости.

Читать очень интересно. В интернете этот текст уже начали называть "Situational Awareness 2.0"; прошлогоднюю "Situational Awareness" Леопольда Ашенбреннера я в каждой обзорной лекции упоминаю, теперь, видимо, надо будет упоминать и "AI 2027".

🔥10✍5❤3👍1

2.84K views16:24

Технозаметки Малышева

Полезные инструменты и курсы в меню бота

3✍9🔥7👍4❤2🆒2

2.98K viewsedited 19:59

Открыть

Технозаметки Малышева

Forwarded from Сергей Булаев AI 🤖

0:18

This media is not supported in your browser

VIEW IN TELEGRAM

Adobe опубликовл серьёзный гайд по созданию промптов для генерации видео в Firefly. Но думаю подойдёт и для конкурентов. Качество и эффективность генерации безусловно зависит от того, насколько грамотно составлен запрос.

Вот несколько ключевых моментов, которые они советуют учитывать:

📝 Структурируйте промпт по такой схеме:
- Тип съёмки (ракурс, движение камеры)
- Описание персонажа/объекта
- Действие
- Локация
- Эстетика и стиль

🎬 Указывайте конкретный визуальный стиль:
- Cinematic / Кинематографический (драматичное освещение, высокий контраст)
- Realistic / Реалистичный (естественное освещение, детализация)
- Animated / Анимационный (мультяшность, 2D/3D)
- Artistic / Художественный (импрессионизм, минимализм, абстракция)

🎥 Чётко описывайте план:
- Close-up / Крупный план — для эмоций и деталей
- Wide shot / Общий план — для локации и масштаба
- Shot From Above / Съёмка сверху — для контекста пространства
- Shot From Below / Съёмка снизу — для создания эффекта величия

🌦️ Включайте временные элементы:
- Время суток: dawn (рассвет), golden hour (золотой час), midday (полдень), dusk (сумерки), midnight (полночь)
- Погода: foggy (туманно), rainy (дождливо), stormy (штормово), sunny (солнечно), snowy (снежно)
- Сезон: spring bloom (весеннее цветение), summer heat (летняя жара), autumn leaves (осенние листья), winter frost (зимний мороз)
- Исторический период: medieval (средневековье), Victorian era (викторианская эпоха), 1920s (1920-е), retro-futuristic (ретро-футуризм)

⚡ Используйте описательные прилагательные:
- Для освещения: ethereal (эфирное), harsh (резкое), soft (мягкое), dim (приглушенное), vibrant (яркое), moody (атмосферное)
- Для атмосферы: peaceful (умиротворяющая), mysterious (загадочная), energetic (энергичная), tense (напряженная), dreamy (мечтательная), haunting (тревожная)
- Для движения: graceful (грациозное), frantic (лихорадочное), fluid (плавное), jerky (отрывистое), slow-motion (замедленное)
- Для цветовой гаммы: monochromatic (монохромная), saturated (насыщенная), desaturated (приглушенная), high-contrast (контрастная), pastel (пастельная)

Тнструкция рекомендует ограничиваться максимум четырьмя объектами в кадре — большее количество путает систему (что-то мне это напоминает 😉).

Вот ещё несколько крутых примеров промптов:

Для B-roll:

A low-angle cinematic underwater shot of an ocean full of vibrant, colorful schools of fish swimming in a frenzy.

Для анимации из глины:

A scene showing a beautiful sunrise with vibrant grasslands with a harvester in the foreground made of colorful clay.

Для атмосферных эффектов:

Glitter flying through a colorful room lit by light leaks and fluorescence.

Для боевого киборга:

Cinematic action scene, a group of giant mechs is invading the city, they are menacing, giant black and yellow mechs, yellow and orange matte armor, a dystopian future, in the street of a destroyed city, rubble, fires, decayed buildings, desolate, ominous, high quality, high details, volumetric lighting.

Вот тут ещё примеры интересных промтов есть.

Adobe рекомендует итеративный подход: начинать с простых промптов и постепенно добавлять детали

- Максимальная длина промпта может составлять до 1800 слов, но длиннее не значит лучше
- С помощью Firefly можно создавать маски для переходов между клипами в Premiere Pro
- Можно генерировать эффекты вроде бликов, частиц или огня на чёрном фоне для наложения
- Если вы хотите создать продолжение видео с существующими персонажами, лучше использовать кадры из оригинального видео как отправную точку (вот вам мой собственный пример)

Так что если хотите получить достойный результат в Adobe Firefly Video, учитесь говорить с ним на правильном языке.

Сергей Булаев AI 🤖 - об AI и не только

✍10👍6🆒2❤1

2.67K views04:18

Технозаметки Малышева

Hyundai закупит тысячи роботов Boston Dynamics для фабрик будущего

Hyundai Motor Group планирует приобрести десятки тысяч роботов Boston Dynamics в ближайшие годы.

Автоконцерн уже задействует четвероногих Spot для инспекций и обслуживания на предприятиях.

Следующий этап — внедрение гуманоидов Atlas на производственных линиях.

Корпорация вложит $21 млрд в американский рынок, включая $6 млрд на инновации.

Boston Dynamics расширяет партнёрство с NVIDIA, Google DeepMind и Toyota Research Institute.

Электрическая версия робота Atlas выпущена в апреле 2024, тестирование с Hyundai стартует в 2025.

По прогнозам Goldman Sachs, глобальная индустрия гуманоидной робототехники достигнет $38 млрд к 2035 году.

Программисты по-любому на заводе окажутся. Или за станком или за настройкой роботов.

#Hyundai #BostonDynamics #Atlas
———
@tsingular

👍11💯9

1.58K views13:24

Технозаметки Малышева

Google готовит Sec-Gemini v1 - специализированную модель для кибербеза

Модель натренирована на данных о уязвимостях и может анализировать исходный код, обнаруживать баги и создавать эксплойты.

Уже тестируется внутри Google – инженеры используют её для поиска уязвимостей и защиты инфраструктуры.

Внешним пользователям доступна в Trusted Tester Program.

#Cybersecurity #SecGemini #безопасность #Google
———
@tsingular

👍9✍3

1.57K views13:41

Технозаметки Малышева

Forwarded from Denis Sexy IT 🤖

Помните я тут свои предсказания давал по тому, как будут развиваться продакт менеджеры в эпоху АИ?

CEO Shopify поделился своими ожиданиями от сотрудников, очень похоже на то, что я писал тогда:

TL;DR: Главная мысль CEO Shopify призывает каждого сотрудника немедленно и эффективно внедрять ИИ в свою работу, делая это частью культуры компании и ключевым фактором дальнейшего развития

***

Подробнее:

1. ИИ как базовый навык
• Использование ИИ теперь рассматривается как неотъемлемая часть каждой позиции

• CEO считает неприменение ИИ в работе путём к застою и «медленному провалу»

2. Акцент на прототипирование

• Во время фазы GSD Prototype все должны активно применять ИИ

• Задача: как можно быстрее создавать прототипы, учиться на них и совершенствовать продукт

3. Оценка эффективности через призму ИИ

• Вопросы об использовании ИИ включат в performance-ревью и в peer review

• Сотрудникам нужно научиться правильно «промтить», подбирать контекст и получать обратную связь от коллег

4. Доступ к инструментам ИИ и обмен опытом

• Shopify предоставляет широкий набор AI-инструментов (AI chat, Copilot, Cursor, Claude code)

• Создаются каналы в Slack и Vault, где команды делятся «удачными кейсами» и «промахами»

5. Перед расширением штата – использовать ИИ, чтобы решить задачу

• Руководство ждёт доказательств, что невозможно достичь целей с помощью автономных AI-агентов

• Такой подход должен стимулировать более смелые эксперименты и оптимизировать ресурсы

6. ИИ для всех уровней

• Применение ИИ требуется не только от специалистов, но и от высшего руководства (включая самого CEO)

7. Поддержка предпринимательства

• Главная миссия Shopify – помогать мерчантам становиться предпринимателями нового формата

• ИИ рассматривается как мощный мультипликатор, раскрывающий потенциал команд и продуктов

8. «Red Queen Race» и постоянный рост

• Компания быстро растёт, поэтому каждому нужно совершенствоваться непрерывно

• Работа с ИИ гармонично вписывается в культуру «Постоянного ученика» и стремления к развитию

Подписываюсь под каждым словом, прекрасное понимание ситуации с АИ в бизнесе

X (formerly Twitter)

tobi lutke (@tobi) on X

Reflexive AI usage is now a baseline expectation at Shopify

👍9✍3😐1

1.27K views20:12

Технозаметки Малышева

0:11

This media is not supported in your browser

VIEW IN TELEGRAM

Программирование с ИИ.

- ИИ, исправь ошибку в коде.
- будет сделано. Замесить и порубить.

#юмор #vibecoding
------
@tsingular

😁37❤2💯2👌1

6.01K views20:20

Технозаметки Малышева

Llama-4 - манипуляции с бенчмарками

Вокруг новой модели Llama-4 разгорается серьезный спор: оказывается, для тестирования в сервисе LMArena использовалась специально оптимизированная версия, существенно отличающаяся от той, что доступна пользователям.

Технические подробности обмана
В документации к моделям нашлась пометка мелким шрифтом, что на LMArena загружена "экспериментальная версия", специально "оптимизированная для разговорности" (optimized for conversationality). Именно эта версия взлетела на второе место рейтинга, впечатляюще обойдя GPT-4o с ELO-рейтингом 1417.

Исследователи, изучившие модель, обнаружили серьёзные отличия между публично доступной версией и той, что тестировалась на бенчмарке.

Версия на LMArena использует множество эмодзи и генерирует неоправданно длинные ответы — её поведение описывают как "ювенильное" и неестественное.

Реакция индустрии
Ахмад Аль-Дахле, вице-президент по генеративному ИИ компании-разработчика, отверг обвинения в намеренном обмане. По его словам, распространившиеся слухи о том, что модели обучались на тестовых наборах (что может искусственно завышать результаты), "просто неправда".

Платформа LMArena также отреагировала на скандал, заявив: "Интерпретация нашей политики разработчиками не соответствует тому, что мы ожидаем от поставщиков моделей". В результате инцидента они обновляют правила своего рейтинга, чтобы "усилить приверженность честным, воспроизводимым оценкам".

From whom from whom... но от лидеров рынка такого не ожидаешь, конечно.

#benchmarks #Llama
———
@tsingular

😁9⚡1🤣1👻1

1.28K views04:38

Технозаметки Малышева

🤖 Основатель UiPath: Как агентный AI изменит автоматизацию бизнеса

Интервью на The Verge.
Дэниел Динес, основатель UiPath, после небольшого перерыва вернулся на пост CEO и делает большую ставку на агентный AI как будущее автоматизации.

В 2023 году Динес временно уступил руководство компанией, но вернулся менее чем через шесть месяцев после ухода Роба Энслина.

Революция в RPA через агентный AI

Ключевой момент: UiPath радикально смещает фокус с традиционной RPA (роботизированной автоматизации процессов) на агентный AI. Динес признает, что компания "повернула большую лодку" – более половины инженерных ресурсов переориентировано на создание агентных продуктов.

По словам Динеса, "агентный AI по сути – это AI плюс автоматизация, их слияние". UiPath позиционирует себя как идеальную платформу для этой интеграции, поскольку имеет многолетний опыт в автоматизации.

Детерминированное vs недетерминированное

Технически интересный момент в интервью:

Динес четко разграничивает, где нужны разные подходы:
- LLM не предназначены для выполнения детерминированных задач (например, умножения чисел)
- Транзакционные операции с побочными эффектами в корпоративных системах ДОЛЖНЫ быть детерминированными. "Нельзя иметь 95% вероятность успешной транзакции платежа. Должно быть 100%"

Решение UiPath: объединить лучшее из обоих миров. Роботы UiPath обеспечивают полностью детерминированный способ выполнения транзакций, а LLM от партнеров (OpenAI и Anthropic) дополняют это на участках процесса, которые раньше нельзя было автоматизировать.

Практическое применение: пример с путешествиями

Пример: агент для путешествий. AI-агент выполняет исследование доступных рейсов (недетерминированная задача), представляет варианты, но когда дело доходит до бронирования и оплаты – здесь нужна детерминированная система.

Потеряют ли люди работу?
Динес не считает, что агентный AI приведет к массовой безработице в ближайшее время. По его мнению, работа трансформируется: "Рабочие места будут смещаться в сторону принятия решений. Люди будут анализировать информацию, собранную агентами и автоматизацией, принимать решения, а действия будут выполняться корпоративными рабочими процессами".

Оркестрация процессов
UiPath фокусируется на рабочих процессах как ключевом компоненте. Их агенты - это не столько разговорные помощники, сколько процессные элементы, работающие в контексте корпоративных процессов. Как объясняет Динес: "Критически важная часть – это оркестрация".

Пример: агент для одобрения кредитов. Рабочий процесс запускается при получении заявки, направляет ее агенту для извлечения информации, затем может отправить человеку для базовой проверки, потом агенту для рекомендации по кредиту, который может вызвать инструменты (API или RPA-бот) для проверки кредитного рейтинга.

Что дальше для бизнеса?
Динес подтверждает тренд на коммуникацию с ботами через ключевые слова вместо полных предложений. Интересно, что сам он отмечает: "Если я говорю "пожалуйста", мне кажется, что LLM дают лучшие ответы".

В плане бизнеса стратегия UiPath смещается от "охоты на слонов" (крупные сделки) к подходу "посадка и расширение": начинать с малых подразделений, доказывать ценность и затем расширяться.

Вовремя разворачиваются. Иначе "новички" вроде n8n и langchain быстро отгрызут у них поляну.
По идее ресурса должно хватить.

#Agents #RPA #UiPath
———
@tsingular

👨‍💻5🔥3⚡1

1.46K viewsedited 04:47

Технозаметки Малышева

Forwarded from Machinelearning

🌟 Sakana AI представили AI Scientist v2 — систему, которая автоматизирует научное исследование: от гипотезы до опубликованной статьи.

Sakana AI впервые провела реальный эксперимент: три научные статьи, полностью сгенерированные ИИ (The AI Scientist-v2), были отправлены на слепое рецензирование на ICLR Workshop 2025.

Одна из них получила баллы выше среднего уровня принятия — лучше многих статей, написанных людьми. Это исторический момент в научной публикационной практике.

Статьи были на 100% созданы AI — от идеи до финального форматирования и списка литературы.

Человек не правил ни одного слова: только выбрал тему и три лучшие статьи из набора, сгенерированного AI.

В ICLR Workshop было отправлено 3 статьи из 43 (≈7%) — рецензенты знали, что среди них есть AI-работы, но не знали, какие именно.

- 2 статьи были отклонены.
- 1 статья прошла, получив баллы:

Средняя оценка статьи: 6.33 — это выше, чем у многих человеческих работ, принятых на воркшоп.

🟡 Что умеет AI Scientist-v2:
— Придумывает научные идеи
— Пишет и запускает код для экспериментов
— Анализирует результаты, строит графики
— Сама пишет статью в научном формате
— И… сама себя рецензирует

🟡

Подробнее

🟡

Github

🟡

Эксперимент

@ai_machinelearning_big_data

#ai #ml #Sakana

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥9⚡3✍1🤔1

1.26K views09:21

Технозаметки Малышева

🔍 Gemini Deep Research - теперь в Gemini 2.5 Pro

Полезность тут не только в том, что режим Исследователя теперь работает с ведущей по "разуму" модели, но и в том, что у нее, напомню, 1М контекстное окно.

Технически это означает, что AI может одновременно удерживать и анализировать в "памяти" несколько десятков веб-страниц.
Т.е. потенциально из всех "исследователей" Gemini теперь лучше всех весь этот контекст переработает, не упустив важных деталей.

Техническая начинка:
• Многоступенчатый план исследования (который можно редактировать!)
• Самостоятельное уточнение поисковых запросов на основе найденной информации
• Автоматическое цитирование источников с реальными гиперссылками
• Возможность экспорта в Google Docs одним кликом
• Audio Overviews — конвертация отчёта в аудиоформат (пригодится в дороге)

Практическое применение:
• Стартапам: сбор данных о рынке и конкурентах без найма аналитика
• Продакт-менеджерам: исследование трендов для планирования фич на 2025
• Инвесторам: быстрый сбор информации по нишам/компаниям перед принятием решений

Имейте в виду — функция доступна только подписчикам Gemini Advanced.

Но если считать, сколько часов рабочего времени она экономит, подписка окупается за пару запусков.

#Gemini #DeepResearch #агенты #Google
———
@tsingular

👍5🔥4⚡2

1.17K views05:37

About

Blog

Apps

Platform