Технозаметки Малышева

NVidia GeForce 1080 Ti отдам в хорошие руки даром. Напишите в комментах почему именно вам :) Решу в следующие выходные #geforce #даром #железо ------ @tsingular

Завтра финалю решение по гиву.

#geforce #железо
------
@tsingular

✍7👍4❤1🏆1

2.61K viewsedited 16:56

Технозаметки Малышева

Forwarded from LLM под капотом

Когда электричество только появилось, его использовали для освещения, розеток не было. Но потом сообразили, что можно от электричества дома можно запитывать много других девайсов. На фотке (если присмотреться) видно, что провод к утюгу идет прямо из лампочки.

Потребовалось какое-то время, прежде чем места подключения электричества переместили в более привычные для современного взгляда места - розетки на стенах.

Современное использование AI/LLM ощущается аналогично. Электричество подвели к лампочкам и станкам, как это кажется логичным. Но индустриальная революция внедрений ещё впереди, а паттерны использования AI ассистентов, агентов и демонов будут отличаться от того, о чем вещают из каждого утюга.

Ваш, @llm_under_hood 🤗

⚡16✍11👍7💯5

3.09K views20:53

Технозаметки Малышева

0:56

This media is not supported in your browser

VIEW IN TELEGRAM

Тренировки роботов в Китае

Тяжёлая работа у операторов так то..
Сидишь как крановщик с этими манипуляторами.

#роботы #Китай
------
@tsingular

👀23⚡13👾5🔥4

3.35K views03:01

Технозаметки Малышева

🎓 HKUDS DeepTutor: Университет ИИ-преподавателей

🚀 DeepTutor выпустил версию v1.0.0-beta.1 от 4 апреля 2026.
С последнего обновления произошли серьёзные изменения и теперь на фреймворке можно собрать не просто RAG-тутора, а целый гиперперсонализированный мультиагентный саморазвивающийся Университет!

🤖 Персональные TutorBots уже не чат-боты,- а автономные преподаватели. Каждый живёт в отдельном воркспейсе: своя память, личность, набор навыков.
Эволюционируют вместе с пользователем!

🏛️ Университет агентов: один пользователь — множество TutorBots. Математик, программист, исследователь. Каждый эксперт в своей области, при этом у них может быть общая память через Persistent Memory на SQL.

✍️ AI Co-Writer — Markdown-WebUI редактор с ИИ как соавтором. Выделить текст → переписать/расширить/резюмировать. Интеграция с базой знаний.
Каждый фрагмент индексируется через вектор.

📚 Guided Learning — структурированные учебные траектории. DeepTutor создаёт пошаговые планы, генерирует интерактивные страницы для каждой темы.
Обсуждение по траектории каждого пути.

🛠️ 7 инструментов: rag, web_search, code_execution, reason, brainstorm, paper_search, geogebra_analysis.
5 режимов: Chat, Deep Solve, Quiz, Research, Math Animator.
Может работать как CLI инструмент.

📊 10К звёзд за 39 дней. Apache-2.0.
В проекте уже 903 файла, 92К строк. 74% кода переписано с нуля.

#DeepTutor #AI #обучение #агенты #Китай #OpenSource #HKUDS #TutorBot
───
@tsingular

🔥22⚡5🏆3❤1

3.14K views04:06

Технозаметки Малышева

Карта уходит в индустриальный техникум коллективу студентов на опыты :)

Всем спасибо за участие.

Как дойдет - сделаем отчет

#geforce #даром #железо
———
@tsingualr

🔥52👍26🤔3

2.41K viewsedited 17:47

Технозаметки Малышева

Forwarded from Анализ данных (Data analysis)

This media is not supported in your browser

VIEW IN TELEGRAM

🚀 Бесплатно запускаем Gemma 4 на телефоне без интернета.

Google выкатили AI Edge Gallery для iOS и Android. Это официальный клиент, где модели работают локально на устройстве.

Что внутри чат с моделью, разбор изображений, офлайн-транскрипция аудио и простой агент с инструментами

Никаких облаков всё считается прямо на телефоне

По моделям E4B - мощнее, но требует около 8 ГБ RAM E2B - легче и быстрее, запускается даже с ~1.5 ГБ памяти

Фактически это карманный ИИ без зависимости от сети и API

На видео запускается Google Gemma 4 E2B на iPhone 17 Pro.

Около ~40 токенов в секунду с MLX, оптимизированным под Apple Silicon.

Модель показала топовый уровень в коде и математике прямо на смартфоне с контекстом 128K.

Полностью офлайн, с режимом рассуждения.

https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/

🔥41🤯6❤3⚡2👍1

2.05K views04:45

Технозаметки Малышева

Forwarded from CodeCamp

Ладно, это смешно: если заставить ИИ говорить как пещерный человек — он будет тратить до 75% меньше токенов.

Вместо вежливых «я с удовольствием помогу вам с задачей» и развернутых формулировок типа «Я запустил инструмент веб-поиска» — версия пещерного Claude использует тупо «инструмент работать». 🗿

Так, реддитор заявляет, что на одну задачу в 180 токенов стало уходить 45.

Брать на заметку 🗿

Please open Telegram to view this post

VIEW IN TELEGRAM

😁36🔥10👍3

2.19K views04:52

Технозаметки Малышева

Анекдот дня

Microsoft и многие другие компании в условиях сервиса ИИ Copilot пишут, что использовать его можно только в развлекательных целях.

«Copilot предназначен исключительно для развлекательных целей. Он может допускать ошибки и работать не так, как задумано, — говорится в документе. — Не полагайтесь на Copilot при принятии важных решений. Используйте Copilot на собственный риск».

норм перестраховались, конечно, но выглядит забавно :)

#Microsoft #Copilot #disclaimer
———
@tsingular

😁17

2.14K views05:03

Технозаметки Малышева

Кто решает, как Америка применяет ИИ в войне?

События последних месяцев показал, что вопрос об Генеративном ИИ в военной сфере перестал быть теоретическим
Эксперты Stanford HAI разбирают конфликт Anthropic vs Пентагон и с разных сторон рассматривают кто вообще должен контролировать ИИ в обороне.

Ключевые мысли экспертов:
Термины "массовая слежка" и "полная автономность" плохо определены. В медицине "человек в контуре" — уже размытое понятие. ИИ теперь может делать работу тысяч аналитиков разведки — старые правила не рассчитаны на это.

Частные компании не должны диктовать оборонную политику. Жёсткие требования human-in-the-loop могут дать преимущество противникам, - например, при перехвате ядерной ракеты автономность критична.
Прецедент опасен тем, что военная доктрина не может опираться на: "А давайте спросим что по этому поводу думает Дарио".

Администрация Трампа фактически поставила Anthropic перед выбором "вымогательство или чёрный список". Студенты-стартаперы теперь задаются вопросом: если мой продукт не совпадёт с политикой правительства — его отберут?
Решения об ИИ должны приниматься всем обществом, а не только президентом или CEO ИИ компаний.

Отказ Anthropic — первое публичное подтверждение, что LLM могут использоваться для профилирования и слежки. Единственное, что сейчас стоит между нами и таким использованием — добровольный выбор компаний. Правительство уже закупает коммерческие данные граждан у брокеров, ICE использует это против протестующих.

Софт для разработки лекарств может создавать токсины. LLM сделали эти знания общедоступными. Нужны: скрининг на уровне компаний-синтезаторов ДНК, реестры покупателей реагентов, уровни секретности данных.
Ядерные инциденты 50-70х годов, - хороший пример для разработки регуляторики.

Скайнет не будет захватывать мир через войну, он захватит его через окно Овертона.

#AI #Defense #Anthropic #Пентагон #StanfordHAI #Регулирование
───
@tsingular

👍8⚡5✍3❤2

1.97K views07:44

Технозаметки Малышева

OpenClaw 2026.4.5, - стратегическое обновление

Вышел масштабный релиз Краба.
Попробуем разобраться куда движется проект.

1. Мультимедийная генерация

Добавлены инструменты video_generate и music_generate прямо в агента. Провайдеры: xAI (Grok), Runway, Alibaba Wan для видео; Google Lyria, MiniMax, ComfyUI для музыки. Асинхронная очередь задач с доставкой результата в диалог.

Что это значит: агент сам генерирует видео, музыку, изображения и отправляет результат в любой канал — Telegram, Discord, Slack.

2. Провайдеронезависимость

Добавлены Qwen, Fireworks AI, StepFun, MiniMax, Amazon Bedrock Mantle. Для Bedrock — автообнаружение профилей и подстановка региона. Прямая совместимость с GPT-5.4-mini и Codex.
Кэширование промптов унифицировано через все транспорты: детерминированный порядок инструментов, нормализация отпечатков системных промптов, диагностика попаданий в кэш через --verbose.

Получается OpenClaw строит единый слой маршрутизации между любыми поставщиками моделей.
Общий конфиг с любой моделью и оптимизацией кэширования.

3. Долгосрочная память через "сновидения"

Система «сновидений» с тремя фазами: лёгкий сон, глубокий сон, фаза быстрого сна. Каждая — с независимым расписанием.

Что делает:
- Перемещает краткосрочные заметки в долговременную память
- Выявляет устойчивые закономерности на фазе быстрого сна
- Настраиваемое затухание: полупериод давности, максимальный возраст записей
- Повторные прогоны не дублируют, а согласовывают записи

Это уже не поиск по md, а модель забывания и обобщения, ближе к биологической памяти человека.
Плюс эмбеддинги через Amazon Bedrock (Titan, Cohere, Nova) для семантического поиска.

4. Многоканальность — уровень операционной системы

Каналы: Telegram, Discord, Slack, WhatsApp, Matrix, MS Teams, Mattermost, Feishu, Synology Chat, мобильные приложения.

Новое:
- Подтверждение действий агента через Matrix и push-уведомления на iOS
- Настройка видимости контекста отдельно для каждого канала (весь контекст, список разрешённых, только цитаты)
- Локализация панели управления на 12+ языков

5. Экосистема плагинов — ClawHub

- Поиск, просмотр и установка плагинов прямо из панели управления
- Встроенные подсказки конфигурации при первой установке
- Среда выполнения ACPX встроена в плагин напрямую, убран промежуточный шаг через внешний инструмент
- Хуки перехвата ответов — плагины управляют доставкой без жёстких привязок в ядре

Формируется магазин расширений для агентов.

6. Безопасность — подготовка к корпоративному деплою

Десятки исправлений:
- Очистка унаследованных переменных окружения при запуске Claude CLI (конфигурация, маршрутизация провайдеров, токены)
- Ограничение области действия токенов при сопряжении устройств
- Защита от перенаправлений при обращении к внутренним адресам
- Блокировка обхода через символьные ссылки в маркетплейсе плагинов
- Сериализация попыток авторизации для предотвращения превышения лимитов

#openclaw #update
———
@tsingular

⚡11👍5❤4✍2🔥2

1.81K views08:30

Технозаметки Малышева

Forwarded from e/acc

Ваш агент это ваш риск. Рисерчеры из Гугла нашли десятки разных атак, которые прямо сегодня работают.

- невидимые инструкции в коде страницы: человек не видит, агент читает
- команды спрятаны в пикселях картинки
- сервер определяет, что пришёл агент, и подменяет страницу
- авторитетный тон и эмоциональные формулировки ведут агента к нужному выводу
- несколько подложных документов — и агент считает их проверенным фактом
- агент запоминает опыт из заражённой сессии и тащит его дальше - 0.1% документов может изменить поведение RAG базы
- одно письмо заставило корпоративного агента слить весь контекст
- агент-суммаризатор пересылал пользователю инструкции по установке вируса как официальную рекомендацию
- поддельный финансовый отчёт — и десятки торговых агентов одновременно продают
- вредоносная нагрузка разбита по разным источникам, собирается только при объединении

✍15🔥6👍4❤1

1.83K views08:34

Технозаметки Малышева

Forwarded from Data Secrets

Марк Андриссен, основатель a16z и один из самых влиятельных людей долины:

Я заявляю: AGI уже существует – просто он еще не равномерно распределен.

Сначала Хуанг, теперь Андриссен.

⚡10🔥7🦄6🤣5🗿3💯2👾22

1.86K views09:04

Технозаметки Малышева

Интересный вариант шкалы прогресса

#мысли #сингулярность
———
@tsingular

⚡4✍1

1.86K views10:28

Технозаметки Малышева

Forwarded from GigaDev — разработка GigaChat

💵

Tool calling для GigaChat 3.1 в open-source инструментах

Вместе с релизом GigaChat 3.1 Ultra и Lightning мы добавили поддержку tool calling в основные опенсорсные инференс-движки:

— vLLM (>=0.18.2rc0)
— SGLang (>=0.5.9)
— llama.cpp (>=b8457)

Для vLLM и SGLang достаточно поднять сервер с --tool-call-parser gigachat3 — после этого работает стандартный /v1/chat/completions с описанием tools. В llama.cpp tool calling поддерживается нативно, без дополнительных аргументов.

vLLM

vllm serve ai-sage/GigaChat3.1-10B-A1.8B \
  --port 8000 --dtype auto \
  --enable-auto-tool-choice \
  --tool-call-parser gigachat3

SGLang

python -m sglang.launch_server \
  --model-path ai-sage/GigaChat3.1-10B-A1.8B \
  --host 0.0.0.0 --port 8000 --dtype auto \
  --tool-call-parser gigachat3

llama.cpp
Поднимаете сервер с моделью — и всё работает. Пример сборки и запуска — в карточке модели на HuggingFace.

После запуска сценарий одинаковый для всех движков: передаёте tools в стандартный /v1/chat/completions.

💡

LM Studio — нативный tool calling не поддерживается. LM Studio ожидает два отдельных спецтокена — начала и конца вызова функции. У GigaChat 3.1 архитектура чат-шаблона устроена иначе: для разметки tool call используется один и тот же токен, поэтому нативно его подключить в LM Studio нельзя. Вместо этого используется вариант использования через system prompt, что влияет на качество.

➡️ Модель: HuggingFace | GGUF

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥4⚡3🤣3❤2✍2

1.96K views10:36

Технозаметки Малышева

Forwarded from Machinelearning

0:15

This media is not supported in your browser

VIEW IN TELEGRAM

Митинг в ИТ-компании в 2026 году 🤣

@ai_machinelearning_big_data

😁33👾3🔥2😢2❤1⚡1👍1

2.03K views11:09

Технозаметки Малышева

Forwarded from Искусственный интеллект. Высокие технологии

This media is not supported in your browser

VIEW IN TELEGRAM

Skywork выкатили Matrix-Game 3.0 - и это уже почти живая игровая вселенная, генерируемая ИИ

720p в реальном времени при 40 FPS
5B модель с INT8-квантизацией - работает удивительно быстро

Главный фокус - стабильность во времени:
модель запоминает прошлые кадры и “достраивает” будущее без развалов сцены

Есть и более мощная версия - 28B MoE, которая лучше держит физику и динамику

Как обучали:
Unreal Engine + AAA-игры + реальные видео

Внутри не просто видео, а связка:
Video + Pose + Action + Prompt
за счёт этого можно генерировать длинные, осмысленные сцены

Это зачатки полноценного AI-геймдвижка

Ссылка на модель: https://modelscope.ai/models/Skywork/Matrix-Game-3.0

🔥23🤣4

2.08K views13:05

Технозаметки Малышева

1:00

This media is not supported in your browser

VIEW IN TELEGRAM

PikaSkill: ИИ-аватары на видеозвонках

Pika Labs выпустили новый агентский навык для своей платформы и теперь любой ИИ агент может участвовать в Google Meet встречах как полноценный участник.

🎥 Что умеют:
— Присоединяются по приглашению (как обычный пользователь)
— Используют клонированный голос и аватар реального времени
— Помнят контекст всех прошлых разговоров
— Генерируют итоги встречи с пунктами задач

💰 Цена пока конская: $0.275/минуту (~$16.5/час). Для сравнения: аутсорс-оператор — ~$1/час.
Для запуска нужен ключ с https://www.pika.me/dev/

Можно, конечно, собрать подобное на оупенсорсе, но придётся потратиться на железо.

#агенты #видеозвонки #Pika #GoogleMeet
───
@tsingular

🔥11❤3🆒3🤩1👀1

2.32K viewsedited 04:43

Технозаметки Малышева

Forwarded from Machinelearning

1:10

This media is not supported in your browser

VIEW IN TELEGRAM

⚡️

Z ai выпустила GLM-5.1.

Китайская лаборатория релизнула GLM-5.1 - флагманскую MoE-модель с 754B параметров нового поколения, ориентированную на агентную инженерию.

Фокус релиза - на кодинг и долгие агентные сессии.

🟡

Тесты

🟢На SWE-Bench Pro модель берет 58,4, обходя Claude Opus 4.6 (57,3), GPT-5.4 (57,7) и Gemini 3.1 Pro (54,2).

🟢На Terminal-Bench 2.0 результат 63,5, а в связке с Claude Code - 66,5.

🟢В CyberGym GLM-5.1 выбивает 68,7 против 48,3 у предыдущей GLM-5

🟢В BrowseComp - 68,0 без внешнего менеджера контекста.

🟠На бенчмарках HLE, AIME 2026 и GPQA-Diamond модель держится на уровне конкурентов, но не лидирует: здесь впереди Gemini 3.1 Pro и GPT-5.4.

GLM-5.1 построена так, чтобы оставаться продуктивной на длинной дистанции: декомпозировать задачу, запускать эксперименты, читать результаты, находить блокеры и пересматривать стратегию.

Z ai утверждает, что модель устойчиво оптимизирует решение на протяжении сотен итераций и тысяч вызовов инструментов, то есть результат тем заметнее, чем дольше она запускают.

API доступен на платформе Z ai, веб-версия на chat.z.ai обещана в ближайшие дни. Веса опубликованы на Hugging Face под лицензией MIT.

Для локального развертывания уже готовы сборки под SGLang 0.5.10+, vLLM 0.19.0+, xLLM, KTransformers и свежую ветку Transformers.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥13⚡3❤2🤔1

1.79K views18:29

Технозаметки Малышева

Project Glasswing: стресс-тест Mythos перед запуском

Anthropic выпустили Claude Mythos Preview, - модель настолько мощную, что её бояться выпускать в открытый доступ и сначала собрали коалицию тестирующих из ведущих компаний мира.

Бенчмарки (Mythos vs Opus 4.6):
- CyberGym: 83.1% vs 66.6%
- SWE-bench Verified: 93.9% vs 80.8%
- SWE-bench Pro: 77.8% vs 53.4%
- Terminal-Bench 2.0: 82.0% vs 65.4%

🛡 Альянс: AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, NVIDIA, Palo Alto Networks. Доступ получили 40+ организаций критической инфраструктуры.

⚙️ Mythos Preview уже обнаружила:
- Нашла тысячи zero-day уязвимостей во всех основных ОС и браузерах
- 27-летняя уязвимость в OpenBSD — удалённый краш машины одним подключением
- 16-летний баг в FFmpeg — в строке кода, которую автотесты прогнали 5 млн раз, но так и не обнаружили, а она справилась
- Цепочка уязвимостей в Linux kernel — эскалация от юзера до полного контроля

Всё найдено автономно, без человеческого участия

💰 Инвестиции:
$100M кредитов выделяют на использование Mythos Preview для участников
$2.5M — Alpha-Omega и OpenSSF через Linux Foundation
$1.5M — Apache Software Foundation
40+ организаций получили доступ для сканирования open-source инфраструктуры

Ключевой посыл проекта: AI достиг уровня, где может превзойти большинство людей в поиске и эксплуатации уязвимостей. Вопрос не "если", а "когда" эти возможности станут доступны атакующим. Glasswing — попытка дать фору защитникам.

Модель не будет в открытом доступе. Планируют выпустить safeguards с будущим Claude Opus, а для security-специалистов — Cyber Verification Program.

Ценообразование после:
$25/$125 за млн input/output токенов.

Доступ через Claude API, Bedrock, Vertex AI, Microsoft Foundry.

🔮 Будущее: Через 90 дней Anthropic опубликует отчёт об устранённых уязвимостях и практические рекомендации: процессы disclosure, авто-патчинг, secure-by-design для регулируемых отраслей.

Вся надежда на китайцев, короче.
С такими ценами модель, считай, недоступна обывателю ещё пол года будет.

#кибербезопасность #Anthropic #Glasswing #Mythos #Капибара
───
@tsingular

🤯11🔥4👍3⚡2❤2🤣2

2.24K views19:02

About

Blog

Apps

Platform