Технозаметки Малышева
11.3K subscribers
4.62K photos
1.71K videos
41 files
4.69K links
Новости инноваций из мира Искусственного Интеллекта. 🤖 [РКН: 7021469833 ]

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸: https://pay.cloudtips.ru/p/c8960bb
Download Telegram
AGI в Qwen

Интересный момент, - оказывается у Qwen в описании прямо написано, что их цель не просто IDE сделать, а - "сделать AGI доступным для мирового сообщества через инициативы с открытым исходным кодом"

Очень крутая миссия, считаю.

#Qwen #Китай #AGI
———
@tsingular
🔥32👏85🤩4😁21🥰1🫡1
Пользоваться AI агентами мы +- научились. А что у них под капотом - кто-то залезал?

Смотрите, какая штука. В компьютерные игры играют миллионы. А делают игры, по-настоящему понимают движок изнутри, доли процента. С искусственным интеллектом ровно та же история: юзеров вся планета, а тех, кто понимает, что крутится под капотом, маловато...


И вот это «под капотом» я попробовал разобрать. Чтобы и вы и я лучше понимали "как оно блин работает"

---

🤔 Почему это вообще важно?

Потому что вокруг одного механизма (он называется tool calling) выросла вся индустрия AI-агентов. Claude Code, Cursor, автономные ассистенты, все эти миллиарды долларов. Когда ассистент «сходил в интернет» или «запустил ваш код» - под капотом всегда происходит одно и то же.

И тут главный спойлер: модель не выполняет ваш код. Она просто просит. Пишет записку «хочу вызвать вот это вот так», а обычная программа-обвязка (никакого AI внутри неё нет, 200 строк кода) эту записку выполняет и возвращает результат. Честный, неволшебный пинг-понг.

---

🔬 Что внутри статьи

Разобрал по винтикам: как модель дёргает скрипты, что такое песочница и почему без ее код агента нельзя запускать на проде, что за зверь MCP (тот самый «USB-C для инструментов») и Skills, из каких кубиков собрана типичная агентская система 2026 года и где она громко ломается (привет, prompt injection).

И да - на странице 7 интерактивных тренажёров. Можно покликать, прогнать цикл агента по шагам, потрогать всё руками. Концепции вроде «вызова инструмента» честнее показать, чем описать словами.

---

🎯 Кому особенно зайдёт

Если вы просто пользуетесь AI - после статьи будете видеть ассистентов насквозь. Без лишнего страха и без лишнего доверия.

А если вы профессионал и строите агентские системы (или внедряете их в компании) - это вообще must read (сможете проверить все ли вы знаете😉). Там есть список правильных вопросов к подрядчику: где песочница? какие стоят бюджеты? что с защитой от инъекций? Внедрять агентов сегодня, не понимая этой кухни - идейка рискованная.

---

🔗 Сама статья (минут на 25 + тренажёры):

https://rasskazov.io/blog/tool-calling-explained/

—-

Залетайте, тыкайте тренажёры, разбирайтесь. И пульните двум друзьям которые варят агентов (ну или думают что варят😜)

#AI #ToolCalling #MCP #agents #LLM

---

@rasskazov_io_channel
👍3541
Forwarded from эйай ньюз
Cerebras запустили Kimi K2.6 на скорости в тысячу токенов в секунду

Модель на триллион параметров на такой скорости запускается впервые, перед этим самой большой модель у Cerebras была GLM 4.7 на 358B. К сожалению это пока что доступно только энтерпрайз клиентам.

Кстати компания ещё вышла на IPO на прошлой неделе, привлекла 5.5 миллиардов долларов и теперь стоит 60 миллиардов. У них всё хорошо, жду чего-то большего чем Codex Spark из их коллаборации с OpenAI.

@ai_newz
👍832🔥2
Media is too big
VIEW IN TELEGRAM
WiFi, который вас видит

Ваш роутер уже умеет видеть сквозь стены. Открытый фреймворк РуView превращает обычный WiFi в систему пространственного зрения: присутствие, дыхание, пульс, поза тела, падения и даже счёт людей в комнате, без единой камеры и носимого устройства.

⚙️ Как это работает: RuView использует отражения WiFi-сигнала от людей и предметов, но уровень возможностей зависит от режима запуска.
Бесплатно можно поднять Docker-демо с симулированными данными — оно показывает пайплайн без реального железа.
Для живого сенсинга нужен ESP32-S3 примерно за $9: он снимает CSI и даёт presence, motion, breathing/heart-rate и fall detection на edge.
Полная конфигурация с Cognitum Seed примерно за $140 добавляет mesh-сценарии, persistent memory, kNN, witness chain, каталог edge-модулей и продвинутую обработку. Предобученная модель на Hugging Face включает 128-мерный CSI-энкодер и presence-head; 4-битная версия весит 8 КБ и показывает 100% точность определения присутствия на тестовых данных, а 17-точечное определение позы заявлено как отдельный пайплайн, но его веса ещё не входят в текущий HF-релиз.

🛡 Приватность как двусторонний меч: Камер нет, изображений нет, данных для шантажа тоже. Зато $9 чип + открытый код = любой может развернуть слежку через стены в съёмной квартире.
Стандарт IEEE 802.11bf-2025 уже встраивает WiFi-сенсинг в каждый новый роутер, но ни в США, ни в Европе нет правил, ограничивающих использование этих данных.

💼 Зачем бизнесу: Умный дом и медицина первыми заберут технологию: мониторинг пожилых без камер, подсчет посетителей, мониторинг перемещения сотрудников и животных, экономия на носимых устройствах, обнаружение вторжений.

Уехал из дома,- поставил на охрану через Wi-Fi мониторинг.
Удобно и без доп оборудования.

🔗 Аналогичные проекты:
CMU DensePose from WiFi - академический предшественник, ~60-70% PCK, положил начало подходу
ESP32-CSI-Tool - сбор CSI с ESP32, библиотека для исследования
IEEE 802.11bf-2025 - стандарт WiFi-сенсинга, ратифицирован 2025, войдёт в каждый чип

#WiFi #сенсинг #приватность #ESP32 #RuView #IoT #edgeAI
------
@tsingular
🤯431511🔥10😁3👍1
Forwarded from Machinelearning
✔️ Китай ввел в эксплуатацию первый в мире подводный дата-центр

Близ Шанхая запущен подводный центр обработки данных, питающийся от ветроэнергетики, - об этом сообщили китайские СМИ со ссылкой на разработчиков проекта.

Объект вышел на полноценную коммерческую эксплуатацию на прошлой неделе, после серии пробных запусков ранее в этом году.

ЦОД мощностью 24 МВт размещён под водой рядом с турбинами ветроэлектростанции и вмещает около 2 тысяч серверов, включая GPU-кластеры China Telecom и оператора LinkWise.

Оборудование поводного дата-центра используется для задач искусственного интеллекта, разметки больших данных, развития 5G и обучения китайских языковых моделей.

Стоимость проекта оценивается примерно в 226 млн долларов, его строительство завершилось в октябре 2025 года.


В проекте полностью отказались от промышленных систем охлаждения: тепло от серверов отводит морская вода, а электричество поступает напрямую от близлежащих ветряков.

Данные о технических параметрах в публикациях расходятся. Часть источников указывает глубину размещения модулей около 10 метров, другие - 35 метров.

Специалисты, причастные к проекту, признают, что технология находится на ранней стадии.

К числу нерешённых вопросов относят коррозию от солёной воды, долговременную герметизацию под давлением, надёжность подводных кабелей, доступность оборудования для обслуживания и возможное воздействие на морскую среду.


Ранее схожий эксперимент, Project Natick, проводила Microsoft, однако в коммерческую эксплуатацию его не вывели.

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
156🔥3🤣2
OCR и VLLM проверяем теперь только так 🙂🙃

Пока не прочитает,- не AGI

#юмор #OCR
------
@tsingular
😁3711🤯3
Forwarded from НИИ ИИ
DeepSeek V4-Pro: скидка 75% теперь навсегда

🐋 DeepSeek сначала запустила V4-Pro со скидкой 75% и поставила дедлайн. Вчера объявили: цена остаётся такой навсегда. Получилось, что флагман с миллионом контекста теперь стоит дешевле большинства флагманских моделей прошлого поколения.


Так что конкретно произошло

Когда V4-Pro выходила, её поставили в 25% от плановой цены и назвали промо-акцией с дедлайном 31 мая. Большинство ждало, что после этой даты прайс умножится на четыре.

Не умножится. DeepSeek зафиксировала постоянный тариф: $0.435 за миллион входных токенов и $0.87 за миллион выходных. В рублях по текущему курсу это примерно 35 ₽ за миллион входных и 70 ₽ за миллион выходных. Кеш-хит на входе и вовсе $0.003625 — почти бесплатно. За модель уровня фронтира с честным окном в 1 000 000 токенов.

Чтобы было нагляднее: миллион выходных токенов — это больше тысячи страниц связного текста, целая толстая книга. И генерация такой книги топовой моделью стоит меньше доллара. Сопоставимые западные модели с похожим окном — от GPT-5.4 и Sonnet 4.6 до Opus 4.6 и GPT-5.5 — на выходе дороже в 10–30 раз.

Почему это не просто очередное «китайцы демпингуют»

Раньше разговор про дешёвые китайские модели звучал предсказуемо: да, дешевле, но качество на полступени позади, длинный контекст компромиссный, на проде ставить страшно. V4-Pro этот разговор закрывает.

По задачам рассуждения, кода и длинных документов модель идёт вровень с топами, местами обгоняет: на SWE-bench Verified — 80.6%, в полшага от Claude Opus 4.6. Миллион токенов у неё реально рабочий до нескольких сотен тысяч — можно загнать кодовую базу или книгу и получать осмысленные ответы. Дальше точность постепенно проседает: на 400–500K модель уже скорее пересказывает архитектуру, чем цитирует строчки дословно. Но даже с этой оговоркой при такой цене её можно гонять как рабочую лошадку под весь конвейер: парсинг, классификация, рассуждение, генерация.

Если коротко: китайцы победят. Если не качеством, то ценой, а судя по V4-Pro — уже и тем, и другим одновременно. DeepSeek в этой истории молодцы: они переписывают экономику использования LLM в проде, а не играют в ценовые войны на месяц.

Где это реально пригодится

- Анализ больших кодовых баз. Кладёте весь проект в контекст и просите найти баг, описать архитектуру или предложить рефакторинг. Один вызов вместо нарезки на куски.

- Длинные документы и переписки. Контракт на 200 страниц, годовая почта с клиентом, стенограмма созвона. Без RAG, эмбеддингов и векторной базы.

- Агенты с длинной памятью. Длинный контекст из роскоши становится нормой. Можно не изобретать схемы саммари и не терять детали между шагами.

- Q&A по корпоративным данным. Wiki, регламенты, тикеты — задаёте вопросы напрямую, без отдельной поисковой инфраструктуры.

- Массовая обработка. Классификация писем, разметка лидов, извлечение данных из тысяч PDF, перевод документации. То, что упиралось в бюджет, помещается в обычную месячную смету.

Как попробовать у себя

Зарегистрируйтесь в platform.deepseek.com и возьмите API-ключ. Эндпоинт совместим с OpenAI-форматом: в большинстве библиотек хватит поменять base_url и api_key, код трогать не нужно. Перенесите на V4-Pro один не критичный пайплайн (классификацию или саммари), сравните по качеству и цене со своей текущей моделью на неделе реальных данных. Не устроило — вы потеряли пару долларов на тестах.

💡 Практический шаг на эту неделю: возьмите свой ИИ-сценарий, который вы откладывали из-за стоимости, и пересчитайте его экономику на V4-Pro. С большой вероятностью он уже окупается.


pimenov.ai
🔥256🎉31
This media is not supported in your browser
VIEW IN TELEGRAM
🏎 LM Studio 0.4.14, - MTP теперь в релизе

Предсказание сразу нескольких токенов (MTP) — это встроенная в саму модель голова-предсказатель, которая угадывает 2–3 токена наперёд, опираясь на собственные скрытые состояния.

На видеокарте RTX 5060 Ti 16 ГБ: Qwen3.6-35B-A3B (со MoE) разгоняется с 98 до 144 т/с (в 1,47 раза). В ответ, правда, сжирает дополнительный объём памяти под рассуждения — 262 тыс. → 65 тыс. при сжатии KV cache-значений до q4_0, либо 98 тыс. при turbo3.
Dense модель на 27 млрд становится на 42 % медленнее — подход помогает только тем моделям, у которых есть запас по пропускной способности памяти.

Поддержку влили в основную ветку llama.cpp.
В LM Studio работает с GGUF/llama.cpp. На Mac — сборки под MLX (oQ8-mtp).

Как включить: обновить LM Studio до 0.4.14 → скачать модель с поддержкой MTP (Qwen3.6-35B-A3B-MTP-GGUF / Qwen3.6-27B-MTP-GGUF) → включить его при загрузке.

🔗 Changelog | llama.cpp PR #22673 | Бенчмарк MTP на 16GB

#LMStudio #MTP #llamacpp #Qwen3
———
@tsingular
9🔥632
Anthropic Project Glasswing: 10 000 уязвимостей за месяц

Anthropic опубликовал первый отчёт по Project Glasswing (бабочка стеклянница от слова прозрачность) — совместной программе с ~50 партнёрами по защите критического ПО до того, как ИИ-модели начнут использоваться атакующими.
Claude Mythos Preview за месяц нашёл более 10 000 уязвимостей высокого и критического уровня.

🔍 Масштаб: Cloudflare обнаружила 2000 багов (400 — высокого/критического уровня) в своих системах. Уровень ложных срабатываний ниже, чем у людей. Mozilla исправила 271 уязвимость в Firefox 150 — в 10 раз больше, чем при тестировании Firefox 148 с Claude Opus 4.6.

🛡 Open Source: Mythos просканировал 1000+ проектов. Оценка: 6202 уязвимости высокого/критического уровня. Из 1752 проверенных независимыми аудиторами — 90.6% истинные срабатывания.
Пример: CVE-2026-5194 в wolfSSL — подделка сертификатов, затрагивающая миллиарды устройств.

Узкое место: Найти баги стало проще. Патчить — нет. Мейнтейнеры просят замедлить раскрытие. Средний цикл патча — 2 недели. Из 530 раскрытых уязвимостей запатчены только 75.

🤖 Инструменты: Anthropic выпустил Claude Security (public beta для Enterprise) — сканирование кода с автопатчами. За 3 недели Opus 4.7 закрыл 2100+ уязвимостей. Также запущен Cyber Verification Program для легитимного пентеста.

💼 Зачем бизнесу: ИИ находит уязвимости быстрее людей. Компании, которые не сокращают циклы патчей, будут жить в окне риска. Palo Alto Networks уже выпустил в 5 раз больше патчей. Microsoft прогнозирует рост объёмов патчей на неопределённый срок.
Уязвимое ПО с незакрытыми дырами — наша реальность на ближайшие годы.

🔮 Будущее: Мир делится на два лагеря: те, кто использует ИИ для защиты кода, и те, чей код ИИ уже взломал. Mythos-class модели появятся у атакующих достаточно скоро.

#ИИ #кибербезопасность #Anthropic #Glasswing #уязвимости #Mythos
───
@tsingular
843🤯1💯1
Вчера впервые в разговоре механически оценил трудоемкость задачи в млрд токенов.

А надо бы сразу в электричестве.

#мысли
------
@tsingular
😁2664
Forwarded from Denis Sexy IT 🤖
Тут это, шведский стартап строит 6-метровые дроны для добычи леса – ноль повреждения почвы, дрон подлетает и просто крадет дерево: airforestry.com

Ну хоть ясно теперь как добыча леса будет выглядеть лет через 10-20 🌳
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥27🤯128😁1
В итоге Qwen3.6-35B-A3B-MTP-GGUF на M5 max (запускал с 3мя предсказателями) показывает 92 т/с при том что это Q8 квант

brew install llama.cpp
llama-server -hf ggml-org/Qwen3.6-35B-A3B-MTP-GGUF \
--spec-type draft-mtp --spec-draft-n-max 3 --port 8080


на этой же машине qwen3.6:35b в олламе (который Q4) показывает 62 т/с

Т.е. еще раз, - MoE MTP с Q8 быстрее Q4 без MTP в 1.5 раза!

Очень быстро, очень нравится :)

#MTP #llamacpp #бенчмарки
———
@tsingular
🔥29442👍1
Forwarded from Machinelearning
⚡️ NousResearch выкатила новую 9B-модель, заточенную под tool calling и агентные coding workflows в Hermes Agent.

. На срезе из 200 задач SWE-bench модель набрала 53.33%. Для 9B это очень хорошая цифра, потому что обычно такие результаты ждут от моделей заметно крупнее и дороже в запуске.

Отдельно модель прогнали на HermesAgent-20. Там она получила 85 баллов против 71 у базовой версии. То есть дообучение дало не косметический прирост, а нормальный скачок именно в агентных сценариях.

Интересная деталь: авторы прямо советуют запускать её «горячо», с --temp примерно 1. Для таких fine-tune моделей это помогает сильнее отходить от поведения базовой модели и меньше застревать в чрезмерном обдумывании.

Если начинает вести себя нестабильно, температуру можно постепенно снижать.

Следом обещают выпустить Qwopus 3.6 27B. Предварительная оценка уже лежит в HF-репозитории автора, полный релиз модели должен выйти скоро.

https://huggingface.co/Jackrong/Qwopus3.5-9B-Coder-GGUF

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥43
Anthropic качает цифровых сотрудников - 11 ролей для Cowork

Мы уже рассматривали ранее коллекцию из 60+ навыков для Cowork для юридических агентов, а тем временем Антропики дополнили репозиторий ещё 10-ю ролями.

📋 11 ролей из коробки:
- Productivity (задачи и календарь),
- Sales (досье на клиентов, пайплайн),
- Customer Support (триаж тикетов, база знаний),
- Product Management (спецификации, роадмапы),
- Marketing (контент, кампании, фирменный стиль),
- Legal (триаж NDA, таблицы претензий, комплаенс),
- Finance (проводки, аудит),
- Data (SQL-запросы, дашборды),
- Enterprise Search (поиск по Slack/Notion/Jira),
- Bio Research (геномика, PubMed).
Плюс мета-навык для создания собственных ролей!

🔧 Как устроены: каждый плагин = папка с markdown-навыками, командами и MCP-коннекторами. Настройка под свою компанию: поменял коннектор на нужный CRM, добавил терминологию, подправил процесс, и Claude работает как нанятый специалист.

💡 Фишка: навыки подхватываются автоматически, без промпта. Сказал «сделай NDA-триаж», получил результат. Коннекторы тянут данные из Slack, Notion, Jira, HubSpot, Snowflake и ещё десятков систем через протокол MCP.

💼 Зачем бизнесу: 80% выручки Anthropic = корпоративные клиенты (Axios). Плагины закрывают главный запрос enterprise: агент должен знать наши процессы, а не только хорошо писать текст. Каждая роль превращает Claude из ассистента-универсала в сотрудника, который знает термины и инструменты конкретного отдела.
Для опенсорс-проекта это серьёзный ход: кастомизация за часы, а не месяцы.

Собственно пол года назад был создан прорывной навык "создай навык", а теперь создан навык "создай профессию"!
Время натравить Гермеса на этот репозиторий и вытащить каждый навык в отдельного агента, а мета навык по созданию новых ролей, - в основного.

#Anthropic #Claude #Cowork #навыки
------
@tsingular
5🔥52🤣21
Deepseek словил сбой в РФ

В редакцию «Кода Дурова» поступают жалобы о недоступности китайской ИИ-платформы DeepSeek в России. Сайт не загружается, сообщения не отправляются без VPN.

Мы проверили соединение с сайтом специальной утилитой и обнаружили обрыв на этапе TLS — такое поведение характерно для сайтов, заблокированных Роскомнадзором.


РКН заявили, что они не связаны с проблемами в работе DeepSeek

Одна из версий - причина в блокировке cloudflare или AWS

#DeepSeek #РКН
———
@tsingular
21👀10
Barclays: Китай заменит миллионы рабочих на роботов

К 2035 году, в силу демографического спада, Китай потеряет 37 млн рабочих рук. Вариант решения проблемы, - 24 млн гуманоидных роботов.

📋 Что происходит:
- Рабочая сила Китая сократится на 37 млн человек за десятилетие
- 24 млн гуманоидов компенсируют до 60% потерь (оптимистичный сценарий)
- Китай отгрузил 85% мировых инсталляций гуманоидов в 2025 году
- Unitree дропает цену ниже $20 000 за промышленного робота, зарплаты на фабриках растут 6-8% в год
- Пекин целит в 300 млрд юаней ($41 млрд) оборот рынка к 2035 году

🔧 Подводные камни: Из 150+ производителей лишь 23% покупателей довольны купленными роботами, а весь рынок отгрузил 13 000 единиц в 2025 году. Эффективность лучшего гуманоида еле дотягивает до половина человеческой.
От 13 тысяч до 24 миллионов - три порядка масштабирования, которые ещё нужно достичь.

💼 Зачем бизнесу: Гуманоиды сдвигают границу автоматизации с конвейерных задач на те, где нужны руки.
С другой стороны рост зарплат в китайском производстве робота всё привлекательнее с точки зрения рентабельности.
Barclays сравнивает физический ИИ со смартфонами 2007: рынки систематически недооценивают эффект.
Второй сдвиг: когда вместо людей дефицитом станут редкоземельные металлы и энергия, Китай уже доминирует на обоих фронтах.

Запоминаем, - Китай планирует произвести 24 млн роботов.
Конечно они все будут дружелюбно работать на заводах.
Верим.

#роботы #Китай #Barclays #гуманоиды #демография #автоматизация
------
@tsingular
55👾32❤‍🔥1👍11