Технозаметки Малышева
10.8K subscribers
4.44K photos
1.61K videos
41 files
4.5K links
Новости инноваций из мира Искусственного Интеллекта. 🤖 [РКН: 7021469833 ]

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸: pay.cloudtips.ru/p/c8960bb
#UEGVW
Download Telegram
Карта уходит в индустриальный техникум коллективу студентов на опыты :)

Всем спасибо за участие.

Как дойдет - сделаем отчет

#geforce #даром #железо
———
@tsingualr
🔥52👍26🤔3
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 Бесплатно запускаем Gemma 4 на телефоне без интернета.

Google выкатили AI Edge Gallery для iOS и Android. Это официальный клиент, где модели работают локально на устройстве.

Что внутри чат с моделью, разбор изображений, офлайн-транскрипция аудио и простой агент с инструментами

Никаких облаков всё считается прямо на телефоне

По моделям E4B - мощнее, но требует около 8 ГБ RAM E2B - легче и быстрее, запускается даже с ~1.5 ГБ памяти

Фактически это карманный ИИ без зависимости от сети и API

На видео запускается Google Gemma 4 E2B на iPhone 17 Pro.

Около ~40 токенов в секунду с MLX, оптимизированным под Apple Silicon.

Модель показала топовый уровень в коде и математике прямо на смартфоне с контекстом 128K.

Полностью офлайн, с режимом рассуждения.

https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/
🔥41🤯632👍1
Forwarded from CodeCamp
Ладно, это смешно: если заставить ИИ говорить как пещерный человек — он будет тратить до 75% меньше токенов.

Вместо вежливых «я с удовольствием помогу вам с задачей» и развернутых формулировок типа «Я запустил инструмент веб-поиска» — версия пещерного Claude использует тупо «инструмент работать». 🗿

Так, реддитор заявляет, что на одну задачу в 180 токенов стало уходить 45.

Брать на заметку 🗿
Please open Telegram to view this post
VIEW IN TELEGRAM
😁36🔥10👍3
Анекдот дня

Microsoft и многие другие компании в условиях сервиса ИИ Copilot пишут, что использовать его можно только в развлекательных целях.

«Copilot предназначен исключительно для развлекательных целей. Он может допускать ошибки и работать не так, как задумано, — говорится в документе. — Не полагайтесь на Copilot при принятии важных решений. Используйте Copilot на собственный риск».

норм перестраховались, конечно, но выглядит забавно :)

#Microsoft #Copilot #disclaimer
———
@tsingular
😁17
Кто решает, как Америка применяет ИИ в войне?

События последних месяцев показал, что вопрос об Генеративном ИИ в военной сфере перестал быть теоретическим
Эксперты Stanford HAI разбирают конфликт Anthropic vs Пентагон и с разных сторон рассматривают кто вообще должен контролировать ИИ в обороне.

Ключевые мысли экспертов:
Термины "массовая слежка" и "полная автономность" плохо определены. В медицине "человек в контуре" — уже размытое понятие. ИИ теперь может делать работу тысяч аналитиков разведки — старые правила не рассчитаны на это.

Частные компании не должны диктовать оборонную политику. Жёсткие требования human-in-the-loop могут дать преимущество противникам, - например, при перехвате ядерной ракеты автономность критична.
Прецедент опасен тем, что военная доктрина не может опираться на: "А давайте спросим что по этому поводу думает Дарио".

Администрация Трампа фактически поставила Anthropic перед выбором "вымогательство или чёрный список". Студенты-стартаперы теперь задаются вопросом: если мой продукт не совпадёт с политикой правительства — его отберут?
Решения об ИИ должны приниматься всем обществом, а не только президентом или CEO ИИ компаний.

Отказ Anthropic — первое публичное подтверждение, что LLM могут использоваться для профилирования и слежки. Единственное, что сейчас стоит между нами и таким использованием — добровольный выбор компаний. Правительство уже закупает коммерческие данные граждан у брокеров, ICE использует это против протестующих.

Софт для разработки лекарств может создавать токсины. LLM сделали эти знания общедоступными. Нужны: скрининг на уровне компаний-синтезаторов ДНК, реестры покупателей реагентов, уровни секретности данных.
Ядерные инциденты 50-70х годов, - хороший пример для разработки регуляторики.

Скайнет не будет захватывать мир через войну, он захватит его через окно Овертона.

#AI #Defense #Anthropic #Пентагон #StanfordHAI #Регулирование
───
@tsingular
👍8532
OpenClaw 2026.4.5, - стратегическое обновление

Вышел масштабный релиз Краба.
Попробуем разобраться куда движется проект.

1. Мультимедийная генерация

Добавлены инструменты video_generate и music_generate прямо в агента. Провайдеры: xAI (Grok), Runway, Alibaba Wan для видео; Google Lyria, MiniMax, ComfyUI для музыки. Асинхронная очередь задач с доставкой результата в диалог.

Что это значит: агент сам генерирует видео, музыку, изображения и отправляет результат в любой канал — Telegram, Discord, Slack.

2. Провайдеронезависимость

Добавлены Qwen, Fireworks AI, StepFun, MiniMax, Amazon Bedrock Mantle. Для Bedrock — автообнаружение профилей и подстановка региона. Прямая совместимость с GPT-5.4-mini и Codex.
Кэширование промптов унифицировано через все транспорты: детерминированный порядок инструментов, нормализация отпечатков системных промптов, диагностика попаданий в кэш через --verbose.

Получается OpenClaw строит единый слой маршрутизации между любыми поставщиками моделей.
Общий конфиг с любой моделью и оптимизацией кэширования.

3. Долгосрочная память через "сновидения"

Система «сновидений» с тремя фазами: лёгкий сон, глубокий сон, фаза быстрого сна. Каждая — с независимым расписанием.

Что делает:
- Перемещает краткосрочные заметки в долговременную память
- Выявляет устойчивые закономерности на фазе быстрого сна
- Настраиваемое затухание: полупериод давности, максимальный возраст записей
- Повторные прогоны не дублируют, а согласовывают записи

Это уже не поиск по md, а модель забывания и обобщения, ближе к биологической памяти человека.
Плюс эмбеддинги через Amazon Bedrock (Titan, Cohere, Nova) для семантического поиска.

4. Многоканальность — уровень операционной системы

Каналы: Telegram, Discord, Slack, WhatsApp, Matrix, MS Teams, Mattermost, Feishu, Synology Chat, мобильные приложения.

Новое:
- Подтверждение действий агента через Matrix и push-уведомления на iOS
- Настройка видимости контекста отдельно для каждого канала (весь контекст, список разрешённых, только цитаты)
- Локализация панели управления на 12+ языков

5. Экосистема плагинов — ClawHub

- Поиск, просмотр и установка плагинов прямо из панели управления
- Встроенные подсказки конфигурации при первой установке
- Среда выполнения ACPX встроена в плагин напрямую, убран промежуточный шаг через внешний инструмент
- Хуки перехвата ответов — плагины управляют доставкой без жёстких привязок в ядре

Формируется магазин расширений для агентов.

6. Безопасность — подготовка к корпоративному деплою

Десятки исправлений:
- Очистка унаследованных переменных окружения при запуске Claude CLI (конфигурация, маршрутизация провайдеров, токены)
- Ограничение области действия токенов при сопряжении устройств
- Защита от перенаправлений при обращении к внутренним адресам
- Блокировка обхода через символьные ссылки в маркетплейсе плагинов
- Сериализация попыток авторизации для предотвращения превышения лимитов

#openclaw #update
———
@tsingular
11👍542🔥2
Forwarded from e/acc
Ваш агент это ваш риск. Рисерчеры из Гугла нашли десятки разных атак, которые прямо сегодня работают.

- невидимые инструкции в коде страницы: человек не видит, агент читает
- команды спрятаны в пикселях картинки
- сервер определяет, что пришёл агент, и подменяет страницу
- авторитетный тон и эмоциональные формулировки ведут агента к нужному выводу
- несколько подложных документов — и агент считает их проверенным фактом
- агент запоминает опыт из заражённой сессии и тащит его дальше - 0.1% документов может изменить поведение RAG базы
- одно письмо заставило корпоративного агента слить весь контекст
- агент-суммаризатор пересылал пользователю инструкции по установке вируса как официальную рекомендацию
- поддельный финансовый отчёт — и десятки торговых агентов одновременно продают
- вредоносная нагрузка разбита по разным источникам, собирается только при объединении
15🔥5👍41
Forwarded from Data Secrets
Марк Андриссен, основатель a16z и один из самых влиятельных людей долины:

Я заявляю: AGI уже существует – просто он еще не равномерно распределен.


Сначала Хуанг, теперь Андриссен.
10🔥7🦄6🤣5🗿3💯2👾22
Интересный вариант шкалы прогресса

#мысли #сингулярность
———
@tsingular
41
💵 Tool calling для GigaChat 3.1 в open-source инструментах

Вместе с релизом GigaChat 3.1 Ultra и Lightning мы добавили поддержку tool calling в основные опенсорсные инференс-движки:

vLLM (>=0.18.2rc0)
SGLang (>=0.5.9)
llama.cpp (>=b8457)

Для vLLM и SGLang достаточно поднять сервер с --tool-call-parser gigachat3 — после этого работает стандартный /v1/chat/completions с описанием tools. В llama.cpp tool calling поддерживается нативно, без дополнительных аргументов.

vLLM
vllm serve ai-sage/GigaChat3.1-10B-A1.8B \
--port 8000 --dtype auto \
--enable-auto-tool-choice \
--tool-call-parser gigachat3


SGLang
python -m sglang.launch_server \
--model-path ai-sage/GigaChat3.1-10B-A1.8B \
--host 0.0.0.0 --port 8000 --dtype auto \
--tool-call-parser gigachat3


llama.cpp
Поднимаете сервер с моделью — и всё работает. Пример сборки и запуска — в карточке модели на HuggingFace.

После запуска сценарий одинаковый для всех движков: передаёте tools в стандартный /v1/chat/completions.

💡 LM Studio — нативный tool calling не поддерживается. LM Studio ожидает два отдельных спецтокена — начала и конца вызова функции. У GigaChat 3.1 архитектура чат-шаблона устроена иначе: для разметки tool call используется один и тот же токен, поэтому нативно его подключить в LM Studio нельзя. Вместо этого используется вариант использования через system prompt, что влияет на качество.

➡️ Модель: HuggingFace | GGUF
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥43🤣322
Forwarded from Machinelearning
This media is not supported in your browser
VIEW IN TELEGRAM
Митинг в ИТ-компании в 2026 году 🤣

@ai_machinelearning_big_data
😁32👾3🔥2😢211👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Skywork выкатили Matrix-Game 3.0 - и это уже почти живая игровая вселенная, генерируемая ИИ

720p в реальном времени при 40 FPS
5B модель с INT8-квантизацией - работает удивительно быстро

Главный фокус - стабильность во времени:
модель запоминает прошлые кадры и “достраивает” будущее без развалов сцены

Есть и более мощная версия - 28B MoE, которая лучше держит физику и динамику

Как обучали:
Unreal Engine + AAA-игры + реальные видео

Внутри не просто видео, а связка:
Video + Pose + Action + Prompt
за счёт этого можно генерировать длинные, осмысленные сцены

Это зачатки полноценного AI-геймдвижка

Ссылка на модель: https://modelscope.ai/models/Skywork/Matrix-Game-3.0
🔥23🤣4
This media is not supported in your browser
VIEW IN TELEGRAM
PikaSkill: ИИ-аватары на видеозвонках

Pika Labs выпустили новый агентский навык для своей платформы и теперь любой ИИ агент может участвовать в Google Meet встречах как полноценный участник.

🎥 Что умеют:
— Присоединяются по приглашению (как обычный пользователь)
— Используют клонированный голос и аватар реального времени
— Помнят контекст всех прошлых разговоров
— Генерируют итоги встречи с пунктами задач

💰 Цена пока конская: $0.275/минуту (~$16.5/час). Для сравнения: аутсорс-оператор — ~$1/час.
Для запуска нужен ключ с https://www.pika.me/dev/

Можно, конечно, собрать подобное на оупенсорсе, но придётся потратиться на железо.

#агенты #видеозвонки #Pika #GoogleMeet
───
@tsingular
🔥113🆒3🤩1👀1
Forwarded from Machinelearning
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Z ai выпустила GLM-5.1.

Китайская лаборатория релизнула GLM-5.1 - флагманскую MoE-модель с 754B параметров нового поколения, ориентированную на агентную инженерию.

Фокус релиза - на кодинг и долгие агентные сессии.

🟡Тесты

🟢На SWE-Bench Pro модель берет 58,4, обходя Claude Opus 4.6 (57,3), GPT-5.4 (57,7) и Gemini 3.1 Pro (54,2).

🟢На Terminal-Bench 2.0 результат 63,5, а в связке с Claude Code - 66,5.

🟢В CyberGym GLM-5.1 выбивает 68,7 против 48,3 у предыдущей GLM-5

🟢В BrowseComp - 68,0 без внешнего менеджера контекста.

🟠На бенчмарках HLE, AIME 2026 и GPQA-Diamond модель держится на уровне конкурентов, но не лидирует: здесь впереди Gemini 3.1 Pro и GPT-5.4.

GLM-5.1 построена так, чтобы оставаться продуктивной на длинной дистанции: декомпозировать задачу, запускать эксперименты, читать результаты, находить блокеры и пересматривать стратегию.

Z ai утверждает, что модель устойчиво оптимизирует решение на протяжении сотен итераций и тысяч вызовов инструментов, то есть результат тем заметнее, чем дольше она запускают.

API доступен на платформе Z ai, веб-версия на chat.z.ai обещана в ближайшие дни. Веса опубликованы на Hugging Face под лицензией MIT.

Для локального развертывания уже готовы сборки под SGLang 0.5.10+, vLLM 0.19.0+, xLLM, KTransformers и свежую ветку Transformers.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1332🤔1
Project Glasswing: стресс-тест Mythos перед запуском

Anthropic выпустили Claude Mythos Preview, - модель настолько мощную, что её бояться выпускать в открытый доступ и сначала собрали коалицию тестирующих из ведущих компаний мира.

Бенчмарки (Mythos vs Opus 4.6):
- CyberGym: 83.1% vs 66.6%
- SWE-bench Verified: 93.9% vs 80.8%
- SWE-bench Pro: 77.8% vs 53.4%
- Terminal-Bench 2.0: 82.0% vs 65.4%

🛡 Альянс: AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, NVIDIA, Palo Alto Networks. Доступ получили 40+ организаций критической инфраструктуры.

⚙️ Mythos Preview уже обнаружила:
- Нашла тысячи zero-day уязвимостей во всех основных ОС и браузерах
- 27-летняя уязвимость в OpenBSD — удалённый краш машины одним подключением
- 16-летний баг в FFmpeg — в строке кода, которую автотесты прогнали 5 млн раз, но так и не обнаружили, а она справилась
- Цепочка уязвимостей в Linux kernel — эскалация от юзера до полного контроля

Всё найдено автономно, без человеческого участия

💰 Инвестиции:
$100M кредитов выделяют на использование Mythos Preview для участников
$2.5M — Alpha-Omega и OpenSSF через Linux Foundation
$1.5M — Apache Software Foundation
40+ организаций получили доступ для сканирования open-source инфраструктуры

Ключевой посыл проекта: AI достиг уровня, где может превзойти большинство людей в поиске и эксплуатации уязвимостей. Вопрос не "если", а "когда" эти возможности станут доступны атакующим. Glasswing — попытка дать фору защитникам.

Модель не будет в открытом доступе. Планируют выпустить safeguards с будущим Claude Opus, а для security-специалистов — Cyber Verification Program.

Ценообразование после:
$25/$125 за млн input/output токенов.

Доступ через Claude API, Bedrock, Vertex AI, Microsoft Foundry.

🔮 Будущее: Через 90 дней Anthropic опубликует отчёт об устранённых уязвимостях и практические рекомендации: процессы disclosure, авто-патчинг, secure-by-design для регулируемых отраслей.

Вся надежда на китайцев, короче.
С такими ценами модель, считай, недоступна обывателю ещё пол года будет.

#кибербезопасность #Anthropic #Glasswing #Mythos #Капибара
───
@tsingular
🤯11🔥4👍322🤣2
This media is not supported in your browser
VIEW IN TELEGRAM
Тем временем Z.AI GLM-5.1 на тестах за 8 часов построила эмулятор рабочего стола Linux в Web с 50+ приложениями.

Пока Антропик будет тесты жевать с предрелизами по $125 за млн токенов, - китайцы 10 раз его обгонят

Если вдруг вздумаете брать подписку, напоминаю, что через реферралку на 10% дешевле:
https://z.ai/subscribe?ic=GHAFTZRSA1

#Китай #ZAI #GLM
———
@tsingular
🔥12531🐳1🤣1🗿1
ИИ отправляется в прошлое!

Ожидание: увидеть как терминаторы путешествуют во времени.

Реальность: КСИР угрожает отправить OpenAI в каменный век, разбомбив их дата-центр за $30 млрд в Эмиратах.

Так мы и выход новой модели от OpenAI можем не увидеть в ближайшее время

#OpenAI #IRGC
———
@tsingular
👻8🍾7🤯5👍3😭2
зачем они в полнолуние полетели, да ещё и ночью?
ничего ж не видно!
летели бы днём. :)

#юмор
———
@tsingular
1😁382💯2