Технозаметки Малышева
8.43K subscribers
3.76K photos
1.41K videos
40 files
3.94K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
🎮 Microsoft представила нейро-версию Quake II на базе Muse и WHAMM.

Microsoft Research представила WHAMM — новую систему или технологию, предназначенную для моделирования окружающего мира в реальном времени, с особым акцентом на интерактивные среды.

Это означает, что WHAMM способна быстро создавать и постоянно обновлять цифровую 3D-модель физического пространства, учитывая изменения, которые происходят в нем, в том числе в результате взаимодействия пользователя или других динамических событий.

ИИ генерирует кадры в реальном времени, анализируя действия игрока.

Старая WHAMM — 1 fps, новая — 10 fps при 640×360, почти играбельно.

Модель помнит последние 0,9 секунды, что добавляет случайности.

Ключевая особенность — система работает достаточно быстро, чтобы обновлять модель мира практически мгновенно по мере поступления новых данных от сенсоров (вероятно, камер, датчиков глубины и т.д.). Это критически важно для плавного взаимодействия.

🔗 Играть в ИИ-версию Quake II можно здесь.

@vistehno

#microsoft #ai #quake #muse
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥102👍2
Forwarded from PIMENOV.RU
А ещё новый ChatGPT-4o умеет делать смешные несуществующие продукты. Другие примеры создания изображений тут.

🗣@pimenov_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥13😁4😍3👍1
Многотокенное внимание: новый подход к работе с контекстом в LLM

Исследователи предложили новый механизм внимания для языковых моделей — Multi-Token Attention (MTA), который решает ключевое ограничение стандартного механизма внимания.

В обычных трансформерах веса внимания определяются сходством только одной пары векторов query-key. MTA позволяет моделям учитывать несколько токенов одновременно, применяя свёрточные операции над запросами, ключами и головами внимания.

Простой пример: если нужно найти предложение, где упоминаются и "Алиса", и "кролик", стандартное внимание должно кодировать оба токена в одном векторе запроса. MTA же может сначала найти все упоминания "Алисы" и "кролика" по отдельности, а затем определить места, где они встречаются вместе.

Тесты показали, что модели с MTA превосходят базовые трансформеры как в стандартных задачах языкового моделирования, так и в задачах с длинным контекстом, где особенно важно точно находить релевантную информацию.

При этом MTA добавляет всего 0.001% дополнительных параметров и может быть применено выборочно только к нескольким слоям модели без потери эффективности.

#Attention #Architecture #Context
------
@tsingular
👍7321❤‍🔥1🔥1
Forwarded from Sinекура
На этой неделе вышел очередной текст с прогнозами развития искусственного интеллекта: "AI 2027" (pdf-версия). Мне он, правда, совсем не кажется "очередным", в основном из-за списка авторов. Так что суммаризировать я его для вас не буду (текст совсем не длинный, рекомендую прочитать целиком), а лучше про этих самых авторов расскажу.

Первый автор, Даниэль Кокотайло — это бывший сотрудник OpenAI. Два самых для нас важных факта про него связаны как раз с этим трудоустройством:

— OpenAI нанял Даниэля после того, как в 2021 году он написал статью "What 2026 Looks Like", где предсказал, как будут развиваться большие языковые модели; сейчас этот текст читается потрясающе, Даниэль оказался прав очень во многом, хотя в 2021-м его прогноз выглядел маловероятно, а для многих и безумно; так что Даниэль Кокотайло — один из лучших людей мира в плане прогнозов о развитии AI;

— а когда в 2024-м Кокотайло увольнялся из OpenAI, он оказался в центре скандала с non-disparagement clause: OpenAI пригрозил ему тем, что не даст продавать акции OpenAI, если Кокотайло будет что-то разглашать о рисках развития AI, и Даниэль... плюнул на акции, чтобы стать whistleblower'ом от AGI (говорят, в акциях OpenAI было около 85% всех денег его семьи).

Второго автора, надеюсь, моим читателям представлять не надо: это Скотт Александр, автор знаменитых блогов SlateStarCodex и AstralCodexTen. Если вы вдруг их не читали, начинайте прямо сейчас (можно начать отсюда или отсюда), хотя навёрстывать придётся много. В связи с "AI 2027" Даниэль Кокотайло и Скотт Александр уже успели появиться в подкасте Дваркеша Пателя, который я тоже, конечно, целиком рекомендую.

Другие авторы не так известны широкой публике; это:
— Томас Ларсен, сооснователь Center for AI Policy;
Илай Лифланд, один из лидеров команды прогнозистов Samotsvety, один из тех самых superforecasters, которые умеют прогнозировать будущее лучше кого бы то ни было;
— Йонас Фоллмер, VC в Macroscopic Ventures, которому хватило предсказательной силы сделать одну из ранних инвестиций в Anthropic;
— Ромео Дин, магистрант Гарварда и руководитель тамошнего AI Safety Student Team.

В общем, очень внушительная команда. И сейчас все они считают, что вполне реально ожидать появления AGI к 2027–2028 годам. Если гонка разработок в области AGI в итоге победит заботу о безопасности (вам это кажется правдоподобным? мне — вполне), то примерно в 2030–2035 годах нас ждёт тот самый AI takeover, сценарий захвата мира искусственным интеллектом. Это их "плохая концовка", но в тексте предусмотрена и "хорошая", в которой люди сохраняют контроль над ситуацией. Впрочем, в хорошей концовке AGI тоже появляется и тоже трансформирует мир и общество до неузнаваемости.

Читать очень интересно. В интернете этот текст уже начали называть "Situational Awareness 2.0"; прошлогоднюю "Situational Awareness" Леопольда Ашенбреннера я в каждой обзорной лекции упоминаю, теперь, видимо, надо будет упоминать и "AI 2027".
🔥1053👍1
Полезные инструменты и курсы в меню бота
39🔥7👍42🆒2
This media is not supported in your browser
VIEW IN TELEGRAM
Adobe опубликовл серьёзный гайд по созданию промптов для генерации видео в Firefly. Но думаю подойдёт и для конкурентов. Качество и эффективность генерации безусловно зависит от того, насколько грамотно составлен запрос.

Вот несколько ключевых моментов, которые они советуют учитывать:

📝 Структурируйте промпт по такой схеме:
- Тип съёмки (ракурс, движение камеры)
- Описание персонажа/объекта
- Действие
- Локация
- Эстетика и стиль

🎬 Указывайте конкретный визуальный стиль:
- Cinematic / Кинематографический (драматичное освещение, высокий контраст)
- Realistic / Реалистичный (естественное освещение, детализация)
- Animated / Анимационный (мультяшность, 2D/3D)
- Artistic / Художественный (импрессионизм, минимализм, абстракция)

🎥 Чётко описывайте план:
- Close-up / Крупный план — для эмоций и деталей
- Wide shot / Общий план — для локации и масштаба
- Shot From Above / Съёмка сверху — для контекста пространства
- Shot From Below / Съёмка снизу — для создания эффекта величия

🌦️ Включайте временные элементы:
- Время суток: dawn (рассвет), golden hour (золотой час), midday (полдень), dusk (сумерки), midnight (полночь)
- Погода: foggy (туманно), rainy (дождливо), stormy (штормово), sunny (солнечно), snowy (снежно)
- Сезон: spring bloom (весеннее цветение), summer heat (летняя жара), autumn leaves (осенние листья), winter frost (зимний мороз)
- Исторический период: medieval (средневековье), Victorian era (викторианская эпоха), 1920s (1920-е), retro-futuristic (ретро-футуризм)

Используйте описательные прилагательные:
- Для освещения: ethereal (эфирное), harsh (резкое), soft (мягкое), dim (приглушенное), vibrant (яркое), moody (атмосферное)
- Для атмосферы: peaceful (умиротворяющая), mysterious (загадочная), energetic (энергичная), tense (напряженная), dreamy (мечтательная), haunting (тревожная)
- Для движения: graceful (грациозное), frantic (лихорадочное), fluid (плавное), jerky (отрывистое), slow-motion (замедленное)
- Для цветовой гаммы: monochromatic (монохромная), saturated (насыщенная), desaturated (приглушенная), high-contrast (контрастная), pastel (пастельная)

Тнструкция рекомендует ограничиваться максимум четырьмя объектами в кадре — большее количество путает систему (что-то мне это напоминает 😉).

Вот ещё несколько крутых примеров промптов:

Для B-roll:
A low-angle cinematic underwater shot of an ocean full of vibrant, colorful schools of fish swimming in a frenzy.


Для анимации из глины:
A scene showing a beautiful sunrise with vibrant grasslands with a harvester in the foreground made of colorful clay.


Для атмосферных эффектов:
Glitter flying through a colorful room lit by light leaks and fluorescence.



Для боевого киборга:
Cinematic action scene, a group of giant mechs is invading the city, they are menacing, giant black and yellow mechs, yellow and orange matte armor, a dystopian future, in the street of a destroyed city, rubble, fires, decayed buildings, desolate, ominous, high quality, high details, volumetric lighting.


Вот тут ещё примеры интересных промтов есть.

Adobe рекомендует итеративный подход: начинать с простых промптов и постепенно добавлять детали

- Максимальная длина промпта может составлять до 1800 слов, но длиннее не значит лучше
- С помощью Firefly можно создавать маски для переходов между клипами в Premiere Pro
- Можно генерировать эффекты вроде бликов, частиц или огня на чёрном фоне для наложения
- Если вы хотите создать продолжение видео с существующими персонажами, лучше использовать кадры из оригинального видео как отправную точку (вот вам мой собственный пример)

Так что если хотите получить достойный результат в Adobe Firefly Video, учитесь говорить с ним на правильном языке.

Сергей Булаев AI 🤖 - об AI и не только
10👍6🆒21
Hyundai закупит тысячи роботов Boston Dynamics для фабрик будущего

Hyundai Motor Group планирует приобрести десятки тысяч роботов Boston Dynamics в ближайшие годы.

Автоконцерн уже задействует четвероногих Spot для инспекций и обслуживания на предприятиях.

Следующий этап — внедрение гуманоидов Atlas на производственных линиях.

Корпорация вложит $21 млрд в американский рынок, включая $6 млрд на инновации.

Boston Dynamics расширяет партнёрство с NVIDIA, Google DeepMind и Toyota Research Institute.

Электрическая версия робота Atlas выпущена в апреле 2024, тестирование с Hyundai стартует в 2025.

По прогнозам Goldman Sachs, глобальная индустрия гуманоидной робототехники достигнет $38 млрд к 2035 году.

Программисты по-любому на заводе окажутся. Или за станком или за настройкой роботов.

#Hyundai #BostonDynamics #Atlas
———
@tsingular
👍11💯9
Google готовит Sec-Gemini v1 - специализированную модель для кибербеза

Модель натренирована на данных о уязвимостях и может анализировать исходный код, обнаруживать баги и создавать эксплойты.

Уже тестируется внутри Google – инженеры используют её для поиска уязвимостей и защиты инфраструктуры.

Внешним пользователям доступна в Trusted Tester Program.

#Cybersecurity #SecGemini #безопасность #Google
———
@tsingular
👍93
Forwarded from Denis Sexy IT 🤖
Помните я тут свои предсказания давал по тому, как будут развиваться продакт менеджеры в эпоху АИ?

CEO Shopify поделился своими ожиданиями от сотрудников, очень похоже на то, что я писал тогда:

TL;DR: Главная мысль CEO Shopify призывает каждого сотрудника немедленно и эффективно внедрять ИИ в свою работу, делая это частью культуры компании и ключевым фактором дальнейшего развития

***

Подробнее:

1. ИИ как базовый навык
• Использование ИИ теперь рассматривается как неотъемлемая часть каждой позиции

• CEO считает неприменение ИИ в работе путём к застою и «медленному провалу»

2. Акцент на прототипирование

• Во время фазы GSD Prototype все должны активно применять ИИ

• Задача: как можно быстрее создавать прототипы, учиться на них и совершенствовать продукт

3. Оценка эффективности через призму ИИ

• Вопросы об использовании ИИ включат в performance-ревью и в peer review

• Сотрудникам нужно научиться правильно «промтить», подбирать контекст и получать обратную связь от коллег

4. Доступ к инструментам ИИ и обмен опытом

• Shopify предоставляет широкий набор AI-инструментов (AI chat, Copilot, Cursor, Claude code)

• Создаются каналы в Slack и Vault, где команды делятся «удачными кейсами» и «промахами»

5. Перед расширением штата – использовать ИИ, чтобы решить задачу

• Руководство ждёт доказательств, что невозможно достичь целей с помощью автономных AI-агентов

• Такой подход должен стимулировать более смелые эксперименты и оптимизировать ресурсы

6. ИИ для всех уровней

• Применение ИИ требуется не только от специалистов, но и от высшего руководства (включая самого CEO)

7. Поддержка предпринимательства

• Главная миссия Shopify – помогать мерчантам становиться предпринимателями нового формата

• ИИ рассматривается как мощный мультипликатор, раскрывающий потенциал команд и продуктов

8. «Red Queen Race» и постоянный рост

• Компания быстро растёт, поэтому каждому нужно совершенствоваться непрерывно

• Работа с ИИ гармонично вписывается в культуру «Постоянного ученика» и стремления к развитию


Подписываюсь под каждым словом, прекрасное понимание ситуации с АИ в бизнесе
👍93😐1
This media is not supported in your browser
VIEW IN TELEGRAM
Программирование с ИИ.

- ИИ, исправь ошибку в коде.
- будет сделано. Замесить и порубить.

#юмор #vibecoding
------
@tsingular
😁372💯2👌1
Llama-4 - манипуляции с бенчмарками

Вокруг новой модели Llama-4 разгорается серьезный спор: оказывается, для тестирования в сервисе LMArena использовалась специально оптимизированная версия, существенно отличающаяся от той, что доступна пользователям.

Технические подробности обмана
В документации к моделям нашлась пометка мелким шрифтом, что на LMArena загружена "экспериментальная версия", специально "оптимизированная для разговорности" (optimized for conversationality). Именно эта версия взлетела на второе место рейтинга, впечатляюще обойдя GPT-4o с ELO-рейтингом 1417.

Исследователи, изучившие модель, обнаружили серьёзные отличия между публично доступной версией и той, что тестировалась на бенчмарке.

Версия на LMArena использует множество эмодзи и генерирует неоправданно длинные ответы — её поведение описывают как "ювенильное" и неестественное.

Реакция индустрии
Ахмад Аль-Дахле, вице-президент по генеративному ИИ компании-разработчика, отверг обвинения в намеренном обмане. По его словам, распространившиеся слухи о том, что модели обучались на тестовых наборах (что может искусственно завышать результаты), "просто неправда".

Платформа LMArena также отреагировала на скандал, заявив: "Интерпретация нашей политики разработчиками не соответствует тому, что мы ожидаем от поставщиков моделей". В результате инцидента они обновляют правила своего рейтинга, чтобы "усилить приверженность честным, воспроизводимым оценкам".

From whom from whom... но от лидеров рынка такого не ожидаешь, конечно.

#benchmarks #Llama
———
@tsingular
😁91🤣1👻1
🤖 Основатель UiPath: Как агентный AI изменит автоматизацию бизнеса

Интервью на The Verge.
Дэниел Динес, основатель UiPath, после небольшого перерыва вернулся на пост CEO и делает большую ставку на агентный AI как будущее автоматизации.

В 2023 году Динес временно уступил руководство компанией, но вернулся менее чем через шесть месяцев после ухода Роба Энслина.

Революция в RPA через агентный AI

Ключевой момент: UiPath радикально смещает фокус с традиционной RPA (роботизированной автоматизации процессов) на агентный AI. Динес признает, что компания "повернула большую лодку" – более половины инженерных ресурсов переориентировано на создание агентных продуктов.

По словам Динеса, "агентный AI по сути – это AI плюс автоматизация, их слияние". UiPath позиционирует себя как идеальную платформу для этой интеграции, поскольку имеет многолетний опыт в автоматизации.

Детерминированное vs недетерминированное

Технически интересный момент в интервью:

Динес четко разграничивает, где нужны разные подходы:
- LLM не предназначены для выполнения детерминированных задач (например, умножения чисел)
- Транзакционные операции с побочными эффектами в корпоративных системах ДОЛЖНЫ быть детерминированными. "Нельзя иметь 95% вероятность успешной транзакции платежа. Должно быть 100%"

Решение UiPath: объединить лучшее из обоих миров. Роботы UiPath обеспечивают полностью детерминированный способ выполнения транзакций, а LLM от партнеров (OpenAI и Anthropic) дополняют это на участках процесса, которые раньше нельзя было автоматизировать.

Практическое применение: пример с путешествиями

Пример: агент для путешествий. AI-агент выполняет исследование доступных рейсов (недетерминированная задача), представляет варианты, но когда дело доходит до бронирования и оплаты – здесь нужна детерминированная система.

Потеряют ли люди работу?
Динес не считает, что агентный AI приведет к массовой безработице в ближайшее время. По его мнению, работа трансформируется: "Рабочие места будут смещаться в сторону принятия решений. Люди будут анализировать информацию, собранную агентами и автоматизацией, принимать решения, а действия будут выполняться корпоративными рабочими процессами".

Оркестрация процессов
UiPath фокусируется на рабочих процессах как ключевом компоненте. Их агенты - это не столько разговорные помощники, сколько процессные элементы, работающие в контексте корпоративных процессов. Как объясняет Динес: "Критически важная часть – это оркестрация".

Пример: агент для одобрения кредитов. Рабочий процесс запускается при получении заявки, направляет ее агенту для извлечения информации, затем может отправить человеку для базовой проверки, потом агенту для рекомендации по кредиту, который может вызвать инструменты (API или RPA-бот) для проверки кредитного рейтинга.

Что дальше для бизнеса?
Динес подтверждает тренд на коммуникацию с ботами через ключевые слова вместо полных предложений. Интересно, что сам он отмечает: "Если я говорю "пожалуйста", мне кажется, что LLM дают лучшие ответы".

В плане бизнеса стратегия UiPath смещается от "охоты на слонов" (крупные сделки) к подходу "посадка и расширение": начинать с малых подразделений, доказывать ценность и затем расширяться.

Вовремя разворачиваются. Иначе "новички" вроде n8n и langchain быстро отгрызут у них поляну.
По идее ресурса должно хватить.

#Agents #RPA #UiPath
———
@tsingular
👨‍💻5🔥31
Forwarded from Machinelearning
🌟 Sakana AI представили AI Scientist v2 — систему, которая автоматизирует научное исследование: от гипотезы до опубликованной статьи.

Sakana AI впервые провела реальный эксперимент: три научные статьи, полностью сгенерированные ИИ (The AI Scientist-v2), были отправлены на слепое рецензирование на ICLR Workshop 2025.

Одна из них получила баллы выше среднего уровня принятия — лучше многих статей, написанных людьми. Это исторический момент в научной публикационной практике.

Статьи были на 100% созданы AI — от идеи до финального форматирования и списка литературы.

Человек не правил ни одного слова: только выбрал тему и три лучшие статьи из набора, сгенерированного AI.

В ICLR Workshop было отправлено 3 статьи из 43 (≈7%) — рецензенты знали, что среди них есть AI-работы, но не знали, какие именно.

- 2 статьи были отклонены.
- 1 статья прошла, получив баллы:

Средняя оценка статьи: 6.33 — это выше, чем у многих человеческих работ, принятых на воркшоп.

🟡 Что умеет ​AI Scientist-v2:
— Придумывает научные идеи
— Пишет и запускает код для экспериментов
— Анализирует результаты, строит графики
— Сама пишет статью в научном формате
— И… сама себя рецензирует

🟡 Подробнее
🟡 Github
🟡Эксперимент

@ai_machinelearning_big_data

#ai #ml #Sakana
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥931🤔1
🔍 Gemini Deep Research - теперь в Gemini 2.5 Pro

Полезность тут не только в том, что режим Исследователя теперь работает с ведущей по "разуму" модели, но и в том, что у нее, напомню, 1М контекстное окно.

Технически это означает, что AI может одновременно удерживать и анализировать в "памяти" несколько десятков веб-страниц.
Т.е. потенциально из всех "исследователей" Gemini теперь лучше всех весь этот контекст переработает, не упустив важных деталей.

Техническая начинка:
• Многоступенчатый план исследования (который можно редактировать!)
• Самостоятельное уточнение поисковых запросов на основе найденной информации
• Автоматическое цитирование источников с реальными гиперссылками
• Возможность экспорта в Google Docs одним кликом
• Audio Overviews — конвертация отчёта в аудиоформат (пригодится в дороге)

Практическое применение:
• Стартапам: сбор данных о рынке и конкурентах без найма аналитика
• Продакт-менеджерам: исследование трендов для планирования фич на 2025
• Инвесторам: быстрый сбор информации по нишам/компаниям перед принятием решений

Имейте в виду — функция доступна только подписчикам Gemini Advanced.

Но если считать, сколько часов рабочего времени она экономит, подписка окупается за пару запусков.

#Gemini #DeepResearch #агенты #Google
———
@tsingular
👍5🔥42