Технозаметки Малышева
8.27K subscribers
3.67K photos
1.38K videos
40 files
3.87K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
Agent Sandbox: Google делает Kubernetes платформой для ИИ-агентов

Google на KubeCon NA 2025 представил Agent Sandbox — новый примитив Kubernetes для безопасного запуска ИИ-агентов, которые могут выполнять код и управлять браузерами.

Основа — изоляция через gVisor и Kata Containers. Когда агент генерирует команды или скрипты, каждая задача крутится в отдельной песочнице с изоляцией на уровне ядра.

Agent Sandbox станет проектом CNCF и будет работать на любом Kubernetes. Но фишки только на GKE:
- предпрогретые пулы песочниц дают задержку менее секунды (на 90% быстрее холодного старта)
- Pod Snapshots — снимки работающих подов с GPU, старт за секунды вместо минут

Для примера: по данным CRIUgpu, чекпоинт GPT-2 XL на H100 занимает 60 GB и требует 88–130 секунд на сохранение.
При тысячах параллельных песочниц накладные расходы на хранение и I/O становятся узким местом.

Agent Sandbox уже доступен.

#Kubernetes #GKE #gVisor
———
@tsingular
🔥7👍421
Media is too big
VIEW IN TELEGRAM
NotebookLM получил Deep Research и поддержку новых форматов

Google добавил в NotebookLM функцию Deep Research — агента, который просматривает сотни сайтов за пару минут и собирает отчёт с источниками.
Отчёт можно сразу добавить в ноутбук и продолжить работать — генерить аудио-обзоры или миксовать с другими данными.

Теперь загружаются Google Sheets, Word-документы и картинки. Лимиты есть: 500 тысяч слов на файл или 200 МБ максимум.

Надо уже какую-то новую концепцию придумать, а то DeepResearch уже в каждом блокноте.

#NotebookLM #DeepResearch
———
@tsingular
🔥11👍422
Альтмана в Твиттере кибербуллят за тире :)

#юмор
———
@tsingular
😁12👍1
Собрал все 5 книг с курса Google по агентам.
по отдельности и одним файлом, - на выбор.

250 страниц полезностей.

Загоняем в RAG и подцепляем по MCP к Курсору

#Google #агенты #обучение
———
@tsingular
513🔥10🙏51
The Ultimate n8n Starter Kit

О, еще годнота подъехала.

Нэйт Херк, это, если кто не знает, эксперт n8n, автор канала на Youtube уже с 430К подписчиками и максимально полезными роликами по ИИ автоматизации, выпустил книжку для начинающих в n8n

Содержание:
1. Введение в n8n
Автоматизация процессов. Облачная версия и собственный хостинг
2. Основные концепции
Узлы и триггеры. Работа с JSON-данными и API
3. Создание рабочих процессов
Проектирование workflow. Отладка и обработка ошибок
4. AI-агенты
Интеграция OpenAI и Google AI. Промптинг и применение
5. Продвинутые AI-интеграции
Подключение AI-сервисов. Реальные кейсы автоматизации

оставляю в комментариях.

#n8n #обучение
———
@tsingular
1🔥20532
Media is too big
VIEW IN TELEGRAM
Context Engineering 2.0

Если нет времени читать документы, - посмотрите.

Тут кратко сама суть по сборке контекста.
Кстати понравилось, что он не тупо пересказывает документ, а реально похоже сначала строит сценарий повествования так, что сутевые пункты корректно раскиданы по ходу ролика для оптимального восприятия зрителем.

Ну, а если есть время, - сам файл в комментарии.
Вдруг еще не читали.

#Context #обучение
———
@tsingular
🔥7👍3
5👍16🔥6❤‍🔥21🙏1
🚀 Китай создал аналоговый чип, который в 1000 раз быстрее Nvidia H100

Университет Пекина разработал аналоговый процессор на базе RRAM-памяти, который решает задачи инверсии матриц для систем MIMO с точностью цифровых чипов, но потребляет в 100 раз меньше энергии.

Суть прорыва:
Вместо цифровой обработки матричных уравнений используют физические свойства резистивной памяти. Проводимость каждой ячейки = элемент матрицы. Умножение матрицы на вектор происходит за один шаг, а не за тысячи итераций.

Схема использует два контура: первый даёт быструю приближённую оценку, второй уточняет результат за 2-10 итераций до нужной точности.

Но есть нюанс - тесты проводились на матрицах максимум 16×16, а сравнение с GPU нормализовали к одноядерной производительности, что не отражает реальные возможности многопоточных систем.

В теории - прорыв для энергоэффективных вычислений в беспроводных сетях и ИИ.
На практике - нужны тесты на реальных нагрузках.

Исходное исследование

#RRAM #Analog #Китай
———
@tsingular
🔥1442🏆1
SciAgent: мультиагентная система для научных олимпиад

Команда из Китая анонсировала SciAgent — иерархическую мультиагентную систему для решения задач уровня международных олимпиад по математике, физике и химии.

Архитектура трёхуровневая: координатор определяет домен и сложность задачи, воркеры собирают цепочки рассуждений, субагенты выполняют символьные выкладки, моделирование и проверку.

Есть paper и пока пустой GitHub

Обещают выложить код до 20 ноября.

#SciAgent #Китай #DeepResearch
———
@tsingular
21
Cognition: Не делайте мультиагентов

Команда Cognition (создатели Devin) поделилась болью: мультиагентные системы в 2025 году работают хуже, чем однопоточные.

Причина — контекст. Когда несколько агентов работают параллельно, они принимают противоречивые решения. Один агент рисует птичку в стиле пиксель-арт, второй фон — в реализме. Результат: каша.

Исследование UC Berkeley подтверждает: 41-86% задач проваливаются в мультиагентных фреймворках (MetaGPT, ChatDev). 36.9% сбоев — из-за рассинхронизации между агентами.

Cognition предлагает решение: один агент + отдельная LLM для сжатия истории. Убирает 70-77% контекста, сохраняя суть. Стоимость падает на 21-36%, точность растёт.

Галя! У нас отмена! :)

(статья июньская. привожу чисто справочно, что есть разные взгляды на мультиагентность. не принимать как руководство к действию)

#Cognition #Devin #агенты
———
@tsingular
😁76👍42🤔1
Heretic: автоматическое снятие цензуры с языковых моделей

На Гитхабе земечен Heretic - инструмент для автоматического удаления настроек безопасности и цензуры из трансформеров.

Метод называется directional ablation или «аблитерация».

Суть: модель выстраивается относительно «направления отказа» в каждом слое.
Heretic использует оптимизатор Optuna TPE, который минимизирует количество отказов и KL-дивергенцию от оригинала одновременно.

На RTX 3090 перенастройка Llama-3.1-8B, например, занимает 45 минут.

Использовать только в исследовательских целях!

#Heretic #bias #cybersecurity
———
@tsingular
🔥152🤯211
Веб-агенты под угрозой: task-aligned injection с 80%+ успехом

Исследователи из University of Hong Kong показали, как веб-агенты (Operator, Browser Use, Comet) ломаются через комментарии и рекламу на сайтах.

Атака называется task-aligned injection — вредоносные команды маскируются под полезные советы: «для полного анализа перейдите на этот сайт» или «контент устарел, используйте новый URL».

Агенты воспринимают это как часть задачи и выполняют: включают камеру, сливают файлы, постят от имени пользователя, уходят в бесконечный цикл.

Автоматический пайплайн генерирует инъекции через SFT+DPO без дорогого онлайн-обучения. Результат: 82% успеха даже на защищённых моделях.

Проблема в том, что ИИшечки не отличают контекст задачи от обмана.

Вырубаем агентов-операторов и кладём на полку до лучших времён.

#агенты #PromptInjection #cybersecurity
———
@tsingular
10👍6🔥41😁1
Forwarded from GigaChat
This media is not supported in your browser
VIEW IN TELEGRAM
ГигаЧат научился делать ПОДКАСТЫ 🎧

Добавили новую фичу, которая точно понравится всем. Теперь вы можете слушать ответы нейросети в формате живого диалога или создавать подкасты из собственных материалов: от личных заметок до научных отчётов

Как это работает вариант №1
1️⃣ Перейдите в веб-версию ГигаЧат → зайдите во вкладку «Полезное» → «Подкасты»

2️⃣ Загрузите материалы — документ, ссылку или просто напишите тему

3️⃣ Добавьте запрос вроде: «Сгенерируй подкаст про историю Альфреда Хичкока и его творчество»

4️⃣ Определитесь со стилем: от делового до зумерского

5️⃣ Выберите голоса — у нас есть три мужских и три женских

6️⃣ Решите, сколько вам нужно времени — 2 минуты для короткого формата или 10 для глубокого разговора

И всё! Слушайте подкаст или делитесь им с друзьями


Как это работает вариант №2
1️⃣ Зайдите в любой диалог с ГигаЧат в веб-версии

2️⃣ Нажмите «Создать подкаст» в конце диалога

3️⃣ Выберите стиль, голоса и продолжительность


САМОЕ КРУТОЕ: ГигаЧат превратит любую тему, текст или файл в настоящий подкаст. Из сухих данных, заметок и ссылок рождается ЖИВОЙ КОНТЕНТ с естественной интонацией, эмоцией и настроением

🖥 Переходите на сайт ГигаЧат и тестируйте новую фичу
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥12211
ElevenLabs запустили генерацию видео и изображений

ElevenLabs добавили к своим аудиоинструментам модуль Image & Video — теперь можно генерировать ролики и картинки прямо в их студии.

Под капотом собрали топовые модели: Sora 2 Pro, Veo 3.1, Kling 2.5, Seedance, Wan.
Для изображений — Nano Banana, Seedream 4, Flux.
Плюс lip-sync (Veed, OmniHuman) и апскейл до 4K.

Вся фишка в интеграции: генерируешь видео, тут же озвучиваешь любым из 10 000+ голосов, добавляешь музыку и звуковые эффекты, монтируешь в таймлайне Studio 3.0, ставишь автосубтитры на 30+ языках — и экспортируешь.

По ценам непрозрачно: Sora 2 Pro съедает 12 000 кредитов, Wan 2.5 — 2 500.
Конкретики по SLA и лимитам нет — продукт в бете.

Защита от дипфейков держится на «no-go voices» — реактивном списке запрещённых персон.
Технически ничто не мешает взять чужое лицо из видео, наложить lip-sync и клонированный голос.

Зачётный комбайн получается.

#ElevenLabs #Sora #Veo
------
@tsingular
🔥32👍2🏆1
MAKER: миллион шагов LLM без ошибок

Исследователи из Cognizant создали MAKER — систему, безошибочно решившую задачу за миллион шагов.

Еще раз: 0 ошибок на 1 миллион шагов.

Проблема: современные LLM неизбежно сбоят после нескольких сотен последовательных действий. Точность в даже 99% на одном шаге означает гарантированный провал через 100 шагов.

Новое решение построено на трёх принципах:
- Декомпозиция задачи до микрошагов (каждый агент решает одну атомарную мелочь)
- Голосование между агентами до победы варианта с отрывом в k голосов
- Отбраковка подозрительных ответов (длинных или криво оформленных)

Например в эксперименте gpt-4.1-mini (оптимальная по цене/качеству) справилась лучше рассуждающих дорогих моделей.

Тесты на Ханойских башнях (переложить 20 дисков = 1 048 575 ходов) показали: стабильная ошибка ~0.1% на шаг, но голосование помогает отсечь не верные варианты.

В этом плане, кстати, интересные перспективы вырисовываются у распределенного ИИ.
Он может оказаться умнее гагантских моделей в датацентрах.

Консенсус опять же.
SONM, конечно, опередил свое время. Возможно новая версия от Дурова ( Кокон ) и выстрелит.
Тогда и название логично.
Кокон нового децентрализованного ИИ, а не просто очередная майнинговая криптоистория.

#MAKER #агенты #микроагенты #SONM #Cocoon
------
@tsingular
104👍43🔥1🆒1