AGI в Qwen
Интересный момент, - оказывается у Qwen в описании прямо написано, что их цель не просто IDE сделать, а - "сделать AGI доступным для мирового сообщества через инициативы с открытым исходным кодом"
Очень крутая миссия, считаю.
#Qwen #Китай #AGI
———
@tsingular
Интересный момент, - оказывается у Qwen в описании прямо написано, что их цель не просто IDE сделать, а - "сделать AGI доступным для мирового сообщества через инициативы с открытым исходным кодом"
Очень крутая миссия, считаю.
#Qwen #Китай #AGI
———
@tsingular
🔥32👏8❤5🤩4😁2⚡1🥰1🫡1
Технозаметки Малышева
Все-таки создание презентаций теперь какой-то новый уровень крутоты с этими вашими нейронками. одно удовольствие надо ролик будет собрать на выходных. #презентации ——— @tsingular
Media is too big
VIEW IN TELEGRAM
Grok Imagine хорош.
Понял где подвигать, где оставить, сам зум камеры и пролёт сделал вдоль линии повествования и анимацию фона оживил.
#Grok #Imagine
———
@tsingular
Понял где подвигать, где оставить, сам зум камеры и пролёт сделал вдоль линии повествования и анимацию фона оживил.
#Grok #Imagine
———
@tsingular
🔥15❤5⚡1🤯1
Forwarded from Diving Deep 🤿 • Василий Рассказов
❓ Пользоваться AI агентами мы +- научились. А что у них под капотом - кто-то залезал?
И вот это «под капотом» я попробовал разобрать. Чтобы и вы и я лучше понимали "как оно блин работает"
---
🤔 Почему это вообще важно?
Потому что вокруг одного механизма (он называется tool calling) выросла вся индустрия AI-агентов. Claude Code, Cursor, автономные ассистенты, все эти миллиарды долларов. Когда ассистент «сходил в интернет» или «запустил ваш код» - под капотом всегда происходит одно и то же.
И тут главный спойлер: модель не выполняет ваш код. Она просто просит. Пишет записку «хочу вызвать вот это вот так», а обычная программа-обвязка (никакого AI внутри неё нет, 200 строк кода) эту записку выполняет и возвращает результат. Честный, неволшебный пинг-понг.
---
🔬 Что внутри статьи
Разобрал по винтикам: как модель дёргает скрипты, что такое песочница и почему без ее код агента нельзя запускать на проде, что за зверь MCP (тот самый «USB-C для инструментов») и Skills, из каких кубиков собрана типичная агентская система 2026 года и где она громко ломается (привет, prompt injection).
И да - на странице 7 интерактивных тренажёров. Можно покликать, прогнать цикл агента по шагам, потрогать всё руками. Концепции вроде «вызова инструмента» честнее показать, чем описать словами.
---
🎯 Кому особенно зайдёт
Если вы просто пользуетесь AI - после статьи будете видеть ассистентов насквозь. Без лишнего страха и без лишнего доверия.
А если вы профессионал и строите агентские системы (или внедряете их в компании) - это вообще must read (сможете проверить все ли вы знаете😉). Там есть список правильных вопросов к подрядчику: где песочница? какие стоят бюджеты? что с защитой от инъекций? Внедрять агентов сегодня, не понимая этой кухни - идейка рискованная.
---
🔗 Сама статья (минут на 25 + тренажёры):
https://rasskazov.io/blog/tool-calling-explained/
—-
Залетайте, тыкайте тренажёры, разбирайтесь. И пульните двум друзьям которые варят агентов (ну или думают что варят😜)
#AI #ToolCalling #MCP #agents #LLM
---
@rasskazov_io_channel
Смотрите, какая штука. В компьютерные игры играют миллионы. А делают игры, по-настоящему понимают движок изнутри, доли процента. С искусственным интеллектом ровно та же история: юзеров вся планета, а тех, кто понимает, что крутится под капотом, маловато...
И вот это «под капотом» я попробовал разобрать. Чтобы и вы и я лучше понимали "как оно блин работает"
---
🤔 Почему это вообще важно?
Потому что вокруг одного механизма (он называется tool calling) выросла вся индустрия AI-агентов. Claude Code, Cursor, автономные ассистенты, все эти миллиарды долларов. Когда ассистент «сходил в интернет» или «запустил ваш код» - под капотом всегда происходит одно и то же.
И тут главный спойлер: модель не выполняет ваш код. Она просто просит. Пишет записку «хочу вызвать вот это вот так», а обычная программа-обвязка (никакого AI внутри неё нет, 200 строк кода) эту записку выполняет и возвращает результат. Честный, неволшебный пинг-понг.
---
🔬 Что внутри статьи
Разобрал по винтикам: как модель дёргает скрипты, что такое песочница и почему без ее код агента нельзя запускать на проде, что за зверь MCP (тот самый «USB-C для инструментов») и Skills, из каких кубиков собрана типичная агентская система 2026 года и где она громко ломается (привет, prompt injection).
И да - на странице 7 интерактивных тренажёров. Можно покликать, прогнать цикл агента по шагам, потрогать всё руками. Концепции вроде «вызова инструмента» честнее показать, чем описать словами.
---
🎯 Кому особенно зайдёт
Если вы просто пользуетесь AI - после статьи будете видеть ассистентов насквозь. Без лишнего страха и без лишнего доверия.
А если вы профессионал и строите агентские системы (или внедряете их в компании) - это вообще must read (сможете проверить все ли вы знаете😉). Там есть список правильных вопросов к подрядчику: где песочница? какие стоят бюджеты? что с защитой от инъекций? Внедрять агентов сегодня, не понимая этой кухни - идейка рискованная.
---
🔗 Сама статья (минут на 25 + тренажёры):
https://rasskazov.io/blog/tool-calling-explained/
—-
Залетайте, тыкайте тренажёры, разбирайтесь. И пульните двум друзьям которые варят агентов (ну или думают что варят😜)
#AI #ToolCalling #MCP #agents #LLM
---
@rasskazov_io_channel
👍35❤4⚡1
Forwarded from эйай ньюз
Cerebras запустили Kimi K2.6 на скорости в тысячу токенов в секунду
Модель на триллион параметров на такой скорости запускается впервые, перед этим самой большой модель у Cerebras была GLM 4.7 на 358B. К сожалению это пока что доступно только энтерпрайз клиентам.
Кстати компания ещё вышла на IPO на прошлой неделе, привлекла 5.5 миллиардов долларов и теперь стоит 60 миллиардов. У них всё хорошо, жду чего-то большего чем Codex Spark из их коллаборации с OpenAI.
@ai_newz
Модель на триллион параметров на такой скорости запускается впервые, перед этим самой большой модель у Cerebras была GLM 4.7 на 358B. К сожалению это пока что доступно только энтерпрайз клиентам.
Кстати компания ещё вышла на IPO на прошлой неделе, привлекла 5.5 миллиардов долларов и теперь стоит 60 миллиардов. У них всё хорошо, жду чего-то большего чем Codex Spark из их коллаборации с OpenAI.
@ai_newz
👍8❤3⚡2🔥2
Media is too big
VIEW IN TELEGRAM
WiFi, который вас видит
Ваш роутер уже умеет видеть сквозь стены. Открытый фреймворк РуView превращает обычный WiFi в систему пространственного зрения: присутствие, дыхание, пульс, поза тела, падения и даже счёт людей в комнате, без единой камеры и носимого устройства.
⚙️ Как это работает: RuView использует отражения WiFi-сигнала от людей и предметов, но уровень возможностей зависит от режима запуска.
Бесплатно можно поднять Docker-демо с симулированными данными — оно показывает пайплайн без реального железа.
Для живого сенсинга нужен ESP32-S3 примерно за $9: он снимает CSI и даёт presence, motion, breathing/heart-rate и fall detection на edge.
Полная конфигурация с Cognitum Seed примерно за $140 добавляет mesh-сценарии, persistent memory, kNN, witness chain, каталог edge-модулей и продвинутую обработку. Предобученная модель на Hugging Face включает 128-мерный CSI-энкодер и presence-head; 4-битная версия весит 8 КБ и показывает 100% точность определения присутствия на тестовых данных, а 17-точечное определение позы заявлено как отдельный пайплайн, но его веса ещё не входят в текущий HF-релиз.
🛡 Приватность как двусторонний меч: Камер нет, изображений нет, данных для шантажа тоже. Зато $9 чип + открытый код = любой может развернуть слежку через стены в съёмной квартире.
Стандарт IEEE 802.11bf-2025 уже встраивает WiFi-сенсинг в каждый новый роутер, но ни в США, ни в Европе нет правил, ограничивающих использование этих данных.
💼 Зачем бизнесу: Умный дом и медицина первыми заберут технологию: мониторинг пожилых без камер, подсчет посетителей, мониторинг перемещения сотрудников и животных, экономия на носимых устройствах, обнаружение вторжений.
Уехал из дома,- поставил на охрану через Wi-Fi мониторинг.
Удобно и без доп оборудования.
🔗 Аналогичные проекты:
• CMU DensePose from WiFi - академический предшественник, ~60-70% PCK, положил начало подходу
• ESP32-CSI-Tool - сбор CSI с ESP32, библиотека для исследования
• IEEE 802.11bf-2025 - стандарт WiFi-сенсинга, ратифицирован 2025, войдёт в каждый чип
#WiFi #сенсинг #приватность #ESP32 #RuView #IoT #edgeAI
------
@tsingular
Ваш роутер уже умеет видеть сквозь стены. Открытый фреймворк РуView превращает обычный WiFi в систему пространственного зрения: присутствие, дыхание, пульс, поза тела, падения и даже счёт людей в комнате, без единой камеры и носимого устройства.
⚙️ Как это работает: RuView использует отражения WiFi-сигнала от людей и предметов, но уровень возможностей зависит от режима запуска.
Бесплатно можно поднять Docker-демо с симулированными данными — оно показывает пайплайн без реального железа.
Для живого сенсинга нужен ESP32-S3 примерно за $9: он снимает CSI и даёт presence, motion, breathing/heart-rate и fall detection на edge.
Полная конфигурация с Cognitum Seed примерно за $140 добавляет mesh-сценарии, persistent memory, kNN, witness chain, каталог edge-модулей и продвинутую обработку. Предобученная модель на Hugging Face включает 128-мерный CSI-энкодер и presence-head; 4-битная версия весит 8 КБ и показывает 100% точность определения присутствия на тестовых данных, а 17-точечное определение позы заявлено как отдельный пайплайн, но его веса ещё не входят в текущий HF-релиз.
🛡 Приватность как двусторонний меч: Камер нет, изображений нет, данных для шантажа тоже. Зато $9 чип + открытый код = любой может развернуть слежку через стены в съёмной квартире.
Стандарт IEEE 802.11bf-2025 уже встраивает WiFi-сенсинг в каждый новый роутер, но ни в США, ни в Европе нет правил, ограничивающих использование этих данных.
💼 Зачем бизнесу: Умный дом и медицина первыми заберут технологию: мониторинг пожилых без камер, подсчет посетителей, мониторинг перемещения сотрудников и животных, экономия на носимых устройствах, обнаружение вторжений.
Уехал из дома,- поставил на охрану через Wi-Fi мониторинг.
Удобно и без доп оборудования.
🔗 Аналогичные проекты:
• CMU DensePose from WiFi - академический предшественник, ~60-70% PCK, положил начало подходу
• ESP32-CSI-Tool - сбор CSI с ESP32, библиотека для исследования
• IEEE 802.11bf-2025 - стандарт WiFi-сенсинга, ратифицирован 2025, войдёт в каждый чип
#WiFi #сенсинг #приватность #ESP32 #RuView #IoT #edgeAI
------
@tsingular
🤯43⚡15❤11🔥10😁3👍1
Forwarded from Machinelearning
Близ Шанхая запущен подводный центр обработки данных, питающийся от ветроэнергетики, - об этом сообщили китайские СМИ со ссылкой на разработчиков проекта.
Объект вышел на полноценную коммерческую эксплуатацию на прошлой неделе, после серии пробных запусков ранее в этом году.
ЦОД мощностью 24 МВт размещён под водой рядом с турбинами ветроэлектростанции и вмещает около 2 тысяч серверов, включая GPU-кластеры China Telecom и оператора LinkWise.
Оборудование поводного дата-центра используется для задач искусственного интеллекта, разметки больших данных, развития 5G и обучения китайских языковых моделей.
Стоимость проекта оценивается примерно в 226 млн долларов, его строительство завершилось в октябре 2025 года.
В проекте полностью отказались от промышленных систем охлаждения: тепло от серверов отводит морская вода, а электричество поступает напрямую от близлежащих ветряков.
Данные о технических параметрах в публикациях расходятся. Часть источников указывает глубину размещения модулей около 10 метров, другие - 35 метров.
Специалисты, причастные к проекту, признают, что технология находится на ранней стадии.
К числу нерешённых вопросов относят коррозию от солёной воды, долговременную герметизацию под давлением, надёжность подводных кабелей, доступность оборудования для обслуживания и возможное воздействие на морскую среду.
Ранее схожий эксперимент, Project Natick, проводила Microsoft, однако в коммерческую эксплуатацию его не вывели.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
⚡15❤6🔥3🤣2
Forwarded from НИИ ИИ
DeepSeek V4-Pro: скидка 75% теперь навсегда
Так что конкретно произошло
Когда V4-Pro выходила, её поставили в 25% от плановой цены и назвали промо-акцией с дедлайном 31 мая. Большинство ждало, что после этой даты прайс умножится на четыре.
Не умножится. DeepSeek зафиксировала постоянный тариф: $0.435 за миллион входных токенов и $0.87 за миллион выходных. В рублях по текущему курсу это примерно 35 ₽ за миллион входных и 70 ₽ за миллион выходных. Кеш-хит на входе и вовсе $0.003625 — почти бесплатно. За модель уровня фронтира с честным окном в 1 000 000 токенов.
Чтобы было нагляднее: миллион выходных токенов — это больше тысячи страниц связного текста, целая толстая книга. И генерация такой книги топовой моделью стоит меньше доллара. Сопоставимые западные модели с похожим окном — от GPT-5.4 и Sonnet 4.6 до Opus 4.6 и GPT-5.5 — на выходе дороже в 10–30 раз.
Почему это не просто очередное «китайцы демпингуют»
Раньше разговор про дешёвые китайские модели звучал предсказуемо: да, дешевле, но качество на полступени позади, длинный контекст компромиссный, на проде ставить страшно. V4-Pro этот разговор закрывает.
По задачам рассуждения, кода и длинных документов модель идёт вровень с топами, местами обгоняет: на SWE-bench Verified — 80.6%, в полшага от Claude Opus 4.6. Миллион токенов у неё реально рабочий до нескольких сотен тысяч — можно загнать кодовую базу или книгу и получать осмысленные ответы. Дальше точность постепенно проседает: на 400–500K модель уже скорее пересказывает архитектуру, чем цитирует строчки дословно. Но даже с этой оговоркой при такой цене её можно гонять как рабочую лошадку под весь конвейер: парсинг, классификация, рассуждение, генерация.
Если коротко: китайцы победят. Если не качеством, то ценой, а судя по V4-Pro — уже и тем, и другим одновременно. DeepSeek в этой истории молодцы: они переписывают экономику использования LLM в проде, а не играют в ценовые войны на месяц.
Где это реально пригодится
- Анализ больших кодовых баз. Кладёте весь проект в контекст и просите найти баг, описать архитектуру или предложить рефакторинг. Один вызов вместо нарезки на куски.
- Длинные документы и переписки. Контракт на 200 страниц, годовая почта с клиентом, стенограмма созвона. Без RAG, эмбеддингов и векторной базы.
- Агенты с длинной памятью. Длинный контекст из роскоши становится нормой. Можно не изобретать схемы саммари и не терять детали между шагами.
- Q&A по корпоративным данным. Wiki, регламенты, тикеты — задаёте вопросы напрямую, без отдельной поисковой инфраструктуры.
- Массовая обработка. Классификация писем, разметка лидов, извлечение данных из тысяч PDF, перевод документации. То, что упиралось в бюджет, помещается в обычную месячную смету.
Как попробовать у себя
Зарегистрируйтесь в platform.deepseek.com и возьмите API-ключ. Эндпоинт совместим с OpenAI-форматом: в большинстве библиотек хватит поменять base_url и api_key, код трогать не нужно. Перенесите на V4-Pro один не критичный пайплайн (классификацию или саммари), сравните по качеству и цене со своей текущей моделью на неделе реальных данных. Не устроило — вы потеряли пару долларов на тестах.
pimenov.ai
🐋 DeepSeek сначала запустила V4-Pro со скидкой 75% и поставила дедлайн. Вчера объявили: цена остаётся такой навсегда. Получилось, что флагман с миллионом контекста теперь стоит дешевле большинства флагманских моделей прошлого поколения.
Так что конкретно произошло
Когда V4-Pro выходила, её поставили в 25% от плановой цены и назвали промо-акцией с дедлайном 31 мая. Большинство ждало, что после этой даты прайс умножится на четыре.
Не умножится. DeepSeek зафиксировала постоянный тариф: $0.435 за миллион входных токенов и $0.87 за миллион выходных. В рублях по текущему курсу это примерно 35 ₽ за миллион входных и 70 ₽ за миллион выходных. Кеш-хит на входе и вовсе $0.003625 — почти бесплатно. За модель уровня фронтира с честным окном в 1 000 000 токенов.
Чтобы было нагляднее: миллион выходных токенов — это больше тысячи страниц связного текста, целая толстая книга. И генерация такой книги топовой моделью стоит меньше доллара. Сопоставимые западные модели с похожим окном — от GPT-5.4 и Sonnet 4.6 до Opus 4.6 и GPT-5.5 — на выходе дороже в 10–30 раз.
Почему это не просто очередное «китайцы демпингуют»
Раньше разговор про дешёвые китайские модели звучал предсказуемо: да, дешевле, но качество на полступени позади, длинный контекст компромиссный, на проде ставить страшно. V4-Pro этот разговор закрывает.
По задачам рассуждения, кода и длинных документов модель идёт вровень с топами, местами обгоняет: на SWE-bench Verified — 80.6%, в полшага от Claude Opus 4.6. Миллион токенов у неё реально рабочий до нескольких сотен тысяч — можно загнать кодовую базу или книгу и получать осмысленные ответы. Дальше точность постепенно проседает: на 400–500K модель уже скорее пересказывает архитектуру, чем цитирует строчки дословно. Но даже с этой оговоркой при такой цене её можно гонять как рабочую лошадку под весь конвейер: парсинг, классификация, рассуждение, генерация.
Если коротко: китайцы победят. Если не качеством, то ценой, а судя по V4-Pro — уже и тем, и другим одновременно. DeepSeek в этой истории молодцы: они переписывают экономику использования LLM в проде, а не играют в ценовые войны на месяц.
Где это реально пригодится
- Анализ больших кодовых баз. Кладёте весь проект в контекст и просите найти баг, описать архитектуру или предложить рефакторинг. Один вызов вместо нарезки на куски.
- Длинные документы и переписки. Контракт на 200 страниц, годовая почта с клиентом, стенограмма созвона. Без RAG, эмбеддингов и векторной базы.
- Агенты с длинной памятью. Длинный контекст из роскоши становится нормой. Можно не изобретать схемы саммари и не терять детали между шагами.
- Q&A по корпоративным данным. Wiki, регламенты, тикеты — задаёте вопросы напрямую, без отдельной поисковой инфраструктуры.
- Массовая обработка. Классификация писем, разметка лидов, извлечение данных из тысяч PDF, перевод документации. То, что упиралось в бюджет, помещается в обычную месячную смету.
Как попробовать у себя
Зарегистрируйтесь в platform.deepseek.com и возьмите API-ключ. Эндпоинт совместим с OpenAI-форматом: в большинстве библиотек хватит поменять base_url и api_key, код трогать не нужно. Перенесите на V4-Pro один не критичный пайплайн (классификацию или саммари), сравните по качеству и цене со своей текущей моделью на неделе реальных данных. Не устроило — вы потеряли пару долларов на тестах.
💡 Практический шаг на эту неделю: возьмите свой ИИ-сценарий, который вы откладывали из-за стоимости, и пересчитайте его экономику на V4-Pro. С большой вероятностью он уже окупается.
pimenov.ai
🔥25⚡6🎉3❤1
This media is not supported in your browser
VIEW IN TELEGRAM
🏎 LM Studio 0.4.14, - MTP теперь в релизе
Предсказание сразу нескольких токенов (MTP) — это встроенная в саму модель голова-предсказатель, которая угадывает 2–3 токена наперёд, опираясь на собственные скрытые состояния.
На видеокарте RTX 5060 Ti 16 ГБ: Qwen3.6-35B-A3B (со MoE) разгоняется с 98 до 144 т/с (в 1,47 раза). В ответ, правда, сжирает дополнительный объём памяти под рассуждения — 262 тыс. → 65 тыс. при сжатии KV cache-значений до q4_0, либо 98 тыс. при turbo3.
Dense модель на 27 млрд становится на 42 % медленнее — подход помогает только тем моделям, у которых есть запас по пропускной способности памяти.
Поддержку влили в основную ветку llama.cpp.
В LM Studio работает с GGUF/llama.cpp. На Mac — сборки под MLX (oQ8-mtp).
Как включить: обновить LM Studio до 0.4.14 → скачать модель с поддержкой MTP (Qwen3.6-35B-A3B-MTP-GGUF / Qwen3.6-27B-MTP-GGUF) → включить его при загрузке.
🔗 Changelog | llama.cpp PR #22673 | Бенчмарк MTP на 16GB
#LMStudio #MTP #llamacpp #Qwen3
———
@tsingular
Предсказание сразу нескольких токенов (MTP) — это встроенная в саму модель голова-предсказатель, которая угадывает 2–3 токена наперёд, опираясь на собственные скрытые состояния.
На видеокарте RTX 5060 Ti 16 ГБ: Qwen3.6-35B-A3B (со MoE) разгоняется с 98 до 144 т/с (в 1,47 раза). В ответ, правда, сжирает дополнительный объём памяти под рассуждения — 262 тыс. → 65 тыс. при сжатии KV cache-значений до q4_0, либо 98 тыс. при turbo3.
Dense модель на 27 млрд становится на 42 % медленнее — подход помогает только тем моделям, у которых есть запас по пропускной способности памяти.
Поддержку влили в основную ветку llama.cpp.
В LM Studio работает с GGUF/llama.cpp. На Mac — сборки под MLX (oQ8-mtp).
Как включить: обновить LM Studio до 0.4.14 → скачать модель с поддержкой MTP (Qwen3.6-35B-A3B-MTP-GGUF / Qwen3.6-27B-MTP-GGUF) → включить его при загрузке.
🔗 Changelog | llama.cpp PR #22673 | Бенчмарк MTP на 16GB
#LMStudio #MTP #llamacpp #Qwen3
———
@tsingular
✍9🔥6❤3⚡2
Anthropic Project Glasswing: 10 000 уязвимостей за месяц
Anthropic опубликовал первый отчёт по Project Glasswing (бабочка стеклянница от слова прозрачность) — совместной программе с ~50 партнёрами по защите критического ПО до того, как ИИ-модели начнут использоваться атакующими.
Claude Mythos Preview за месяц нашёл более 10 000 уязвимостей высокого и критического уровня.
🔍 Масштаб: Cloudflare обнаружила 2000 багов (400 — высокого/критического уровня) в своих системах. Уровень ложных срабатываний ниже, чем у людей. Mozilla исправила 271 уязвимость в Firefox 150 — в 10 раз больше, чем при тестировании Firefox 148 с Claude Opus 4.6.
🛡 Open Source: Mythos просканировал 1000+ проектов. Оценка: 6202 уязвимости высокого/критического уровня. Из 1752 проверенных независимыми аудиторами — 90.6% истинные срабатывания.
Пример: CVE-2026-5194 в wolfSSL — подделка сертификатов, затрагивающая миллиарды устройств.
⚡ Узкое место: Найти баги стало проще. Патчить — нет. Мейнтейнеры просят замедлить раскрытие. Средний цикл патча — 2 недели. Из 530 раскрытых уязвимостей запатчены только 75.
🤖 Инструменты: Anthropic выпустил Claude Security (public beta для Enterprise) — сканирование кода с автопатчами. За 3 недели Opus 4.7 закрыл 2100+ уязвимостей. Также запущен Cyber Verification Program для легитимного пентеста.
💼 Зачем бизнесу: ИИ находит уязвимости быстрее людей. Компании, которые не сокращают циклы патчей, будут жить в окне риска. Palo Alto Networks уже выпустил в 5 раз больше патчей. Microsoft прогнозирует рост объёмов патчей на неопределённый срок.
Уязвимое ПО с незакрытыми дырами — наша реальность на ближайшие годы.
🔮 Будущее: Мир делится на два лагеря: те, кто использует ИИ для защиты кода, и те, чей код ИИ уже взломал. Mythos-class модели появятся у атакующих достаточно скоро.
#ИИ #кибербезопасность #Anthropic #Glasswing #уязвимости #Mythos
───
@tsingular
Anthropic опубликовал первый отчёт по Project Glasswing (бабочка стеклянница от слова прозрачность) — совместной программе с ~50 партнёрами по защите критического ПО до того, как ИИ-модели начнут использоваться атакующими.
Claude Mythos Preview за месяц нашёл более 10 000 уязвимостей высокого и критического уровня.
🔍 Масштаб: Cloudflare обнаружила 2000 багов (400 — высокого/критического уровня) в своих системах. Уровень ложных срабатываний ниже, чем у людей. Mozilla исправила 271 уязвимость в Firefox 150 — в 10 раз больше, чем при тестировании Firefox 148 с Claude Opus 4.6.
🛡 Open Source: Mythos просканировал 1000+ проектов. Оценка: 6202 уязвимости высокого/критического уровня. Из 1752 проверенных независимыми аудиторами — 90.6% истинные срабатывания.
Пример: CVE-2026-5194 в wolfSSL — подделка сертификатов, затрагивающая миллиарды устройств.
⚡ Узкое место: Найти баги стало проще. Патчить — нет. Мейнтейнеры просят замедлить раскрытие. Средний цикл патча — 2 недели. Из 530 раскрытых уязвимостей запатчены только 75.
🤖 Инструменты: Anthropic выпустил Claude Security (public beta для Enterprise) — сканирование кода с автопатчами. За 3 недели Opus 4.7 закрыл 2100+ уязвимостей. Также запущен Cyber Verification Program для легитимного пентеста.
💼 Зачем бизнесу: ИИ находит уязвимости быстрее людей. Компании, которые не сокращают циклы патчей, будут жить в окне риска. Palo Alto Networks уже выпустил в 5 раз больше патчей. Microsoft прогнозирует рост объёмов патчей на неопределённый срок.
Уязвимое ПО с незакрытыми дырами — наша реальность на ближайшие годы.
🔮 Будущее: Мир делится на два лагеря: те, кто использует ИИ для защиты кода, и те, чей код ИИ уже взломал. Mythos-class модели появятся у атакующих достаточно скоро.
#ИИ #кибербезопасность #Anthropic #Glasswing #уязвимости #Mythos
───
@tsingular
⚡8✍4❤3🤯1💯1
Вчера впервые в разговоре механически оценил трудоемкость задачи в млрд токенов.
А надо бы сразу в электричестве.
#мысли
------
@tsingular
А надо бы сразу в электричестве.
#мысли
------
@tsingular
😁26✍6⚡4
Forwarded from Denis Sexy IT 🤖
Тут это, шведский стартап строит 6-метровые дроны для добычи леса – ноль повреждения почвы, дрон подлетает и просто крадет дерево: airforestry.com
Ну хоть ясно теперь как добыча леса будет выглядеть лет через 10-20🌳
Ну хоть ясно теперь как добыча леса будет выглядеть лет через 10-20
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥27🤯12⚡8😁1
В итоге Qwen3.6-35B-A3B-MTP-GGUF на M5 max (запускал с 3мя предсказателями) показывает 92 т/с при том что это Q8 квант
на этой же машине qwen3.6:35b в олламе (который Q4) показывает 62 т/с
Т.е. еще раз, - MoE MTP с Q8 быстрее Q4 без MTP в 1.5 раза!
Очень быстро, очень нравится :)
#MTP #llamacpp #бенчмарки
———
@tsingular
brew install llama.cpp
llama-server -hf ggml-org/Qwen3.6-35B-A3B-MTP-GGUF \
--spec-type draft-mtp --spec-draft-n-max 3 --port 8080
на этой же машине qwen3.6:35b в олламе (который Q4) показывает 62 т/с
Т.е. еще раз, - MoE MTP с Q8 быстрее Q4 без MTP в 1.5 раза!
Очень быстро, очень нравится :)
#MTP #llamacpp #бенчмарки
———
@tsingular
🔥29⚡4❤4✍2👍1
Forwarded from Machinelearning
. На срезе из 200 задач SWE-bench модель набрала 53.33%. Для 9B это очень хорошая цифра, потому что обычно такие результаты ждут от моделей заметно крупнее и дороже в запуске.
Отдельно модель прогнали на HermesAgent-20. Там она получила 85 баллов против 71 у базовой версии. То есть дообучение дало не косметический прирост, а нормальный скачок именно в агентных сценариях.
Интересная деталь: авторы прямо советуют запускать её «горячо», с
--temp примерно 1. Для таких fine-tune моделей это помогает сильнее отходить от поведения базовой модели и меньше застревать в чрезмерном обдумывании. Если начинает вести себя нестабильно, температуру можно постепенно снижать.
Следом обещают выпустить Qwopus 3.6 27B. Предварительная оценка уже лежит в HF-репозитории автора, полный релиз модели должен выйти скоро.
https://huggingface.co/Jackrong/Qwopus3.5-9B-Coder-GGUF
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥4⚡3
Anthropic качает цифровых сотрудников - 11 ролей для Cowork
Мы уже рассматривали ранее коллекцию из 60+ навыков для Cowork для юридических агентов, а тем временем Антропики дополнили репозиторий ещё 10-ю ролями.
📋 11 ролей из коробки:
- Productivity (задачи и календарь),
- Sales (досье на клиентов, пайплайн),
- Customer Support (триаж тикетов, база знаний),
- Product Management (спецификации, роадмапы),
- Marketing (контент, кампании, фирменный стиль),
- Legal (триаж NDA, таблицы претензий, комплаенс),
- Finance (проводки, аудит),
- Data (SQL-запросы, дашборды),
- Enterprise Search (поиск по Slack/Notion/Jira),
- Bio Research (геномика, PubMed).
Плюс мета-навык для создания собственных ролей!
🔧 Как устроены: каждый плагин = папка с markdown-навыками, командами и MCP-коннекторами. Настройка под свою компанию: поменял коннектор на нужный CRM, добавил терминологию, подправил процесс, и Claude работает как нанятый специалист.
💡 Фишка: навыки подхватываются автоматически, без промпта. Сказал «сделай NDA-триаж», получил результат. Коннекторы тянут данные из Slack, Notion, Jira, HubSpot, Snowflake и ещё десятков систем через протокол MCP.
💼 Зачем бизнесу: 80% выручки Anthropic = корпоративные клиенты (Axios). Плагины закрывают главный запрос enterprise: агент должен знать наши процессы, а не только хорошо писать текст. Каждая роль превращает Claude из ассистента-универсала в сотрудника, который знает термины и инструменты конкретного отдела.
Для опенсорс-проекта это серьёзный ход: кастомизация за часы, а не месяцы.
Собственно пол года назад был создан прорывной навык "создай навык", а теперь создан навык "создай профессию"!
Время натравить Гермеса на этот репозиторий и вытащить каждый навык в отдельного агента, а мета навык по созданию новых ролей, - в основного.
#Anthropic #Claude #Cowork #навыки
------
@tsingular
Мы уже рассматривали ранее коллекцию из 60+ навыков для Cowork для юридических агентов, а тем временем Антропики дополнили репозиторий ещё 10-ю ролями.
📋 11 ролей из коробки:
- Productivity (задачи и календарь),
- Sales (досье на клиентов, пайплайн),
- Customer Support (триаж тикетов, база знаний),
- Product Management (спецификации, роадмапы),
- Marketing (контент, кампании, фирменный стиль),
- Legal (триаж NDA, таблицы претензий, комплаенс),
- Finance (проводки, аудит),
- Data (SQL-запросы, дашборды),
- Enterprise Search (поиск по Slack/Notion/Jira),
- Bio Research (геномика, PubMed).
Плюс мета-навык для создания собственных ролей!
🔧 Как устроены: каждый плагин = папка с markdown-навыками, командами и MCP-коннекторами. Настройка под свою компанию: поменял коннектор на нужный CRM, добавил терминологию, подправил процесс, и Claude работает как нанятый специалист.
💡 Фишка: навыки подхватываются автоматически, без промпта. Сказал «сделай NDA-триаж», получил результат. Коннекторы тянут данные из Slack, Notion, Jira, HubSpot, Snowflake и ещё десятков систем через протокол MCP.
💼 Зачем бизнесу: 80% выручки Anthropic = корпоративные клиенты (Axios). Плагины закрывают главный запрос enterprise: агент должен знать наши процессы, а не только хорошо писать текст. Каждая роль превращает Claude из ассистента-универсала в сотрудника, который знает термины и инструменты конкретного отдела.
Для опенсорс-проекта это серьёзный ход: кастомизация за часы, а не месяцы.
Собственно пол года назад был создан прорывной навык "создай навык", а теперь создан навык "создай профессию"!
Время натравить Гермеса на этот репозиторий и вытащить каждый навык в отдельного агента, а мета навык по созданию новых ролей, - в основного.
#Anthropic #Claude #Cowork #навыки
------
@tsingular
⚡5🔥5❤2🤣2 1
Deepseek словил сбой в РФ
РКН заявили, что они не связаны с проблемами в работе DeepSeek
Одна из версий - причина в блокировке cloudflare или AWS
#DeepSeek #РКН
———
@tsingular
В редакцию «Кода Дурова» поступают жалобы о недоступности китайской ИИ-платформы DeepSeek в России. Сайт не загружается, сообщения не отправляются без VPN.
Мы проверили соединение с сайтом специальной утилитой и обнаружили обрыв на этапе TLS — такое поведение характерно для сайтов, заблокированных Роскомнадзором.
РКН заявили, что они не связаны с проблемами в работе DeepSeek
Одна из версий - причина в блокировке cloudflare или AWS
#DeepSeek #РКН
———
@tsingular
Barclays: Китай заменит миллионы рабочих на роботов
К 2035 году, в силу демографического спада, Китай потеряет 37 млн рабочих рук. Вариант решения проблемы, - 24 млн гуманоидных роботов.
📋 Что происходит:
- Рабочая сила Китая сократится на 37 млн человек за десятилетие
- 24 млн гуманоидов компенсируют до 60% потерь (оптимистичный сценарий)
- Китай отгрузил 85% мировых инсталляций гуманоидов в 2025 году
- Unitree дропает цену ниже $20 000 за промышленного робота, зарплаты на фабриках растут 6-8% в год
- Пекин целит в 300 млрд юаней ($41 млрд) оборот рынка к 2035 году
🔧 Подводные камни: Из 150+ производителей лишь 23% покупателей довольны купленными роботами, а весь рынок отгрузил 13 000 единиц в 2025 году. Эффективность лучшего гуманоида еле дотягивает до половина человеческой.
От 13 тысяч до 24 миллионов - три порядка масштабирования, которые ещё нужно достичь.
💼 Зачем бизнесу: Гуманоиды сдвигают границу автоматизации с конвейерных задач на те, где нужны руки.
С другой стороны рост зарплат в китайском производстве робота всё привлекательнее с точки зрения рентабельности.
Barclays сравнивает физический ИИ со смартфонами 2007: рынки систематически недооценивают эффект.
Второй сдвиг: когда вместо людей дефицитом станут редкоземельные металлы и энергия, Китай уже доминирует на обоих фронтах.
Запоминаем, - Китай планирует произвести 24 млн роботов.
Конечно они все будут дружелюбно работать на заводах.
Верим.
#роботы #Китай #Barclays #гуманоиды #демография #автоматизация
------
@tsingular
К 2035 году, в силу демографического спада, Китай потеряет 37 млн рабочих рук. Вариант решения проблемы, - 24 млн гуманоидных роботов.
📋 Что происходит:
- Рабочая сила Китая сократится на 37 млн человек за десятилетие
- 24 млн гуманоидов компенсируют до 60% потерь (оптимистичный сценарий)
- Китай отгрузил 85% мировых инсталляций гуманоидов в 2025 году
- Unitree дропает цену ниже $20 000 за промышленного робота, зарплаты на фабриках растут 6-8% в год
- Пекин целит в 300 млрд юаней ($41 млрд) оборот рынка к 2035 году
🔧 Подводные камни: Из 150+ производителей лишь 23% покупателей довольны купленными роботами, а весь рынок отгрузил 13 000 единиц в 2025 году. Эффективность лучшего гуманоида еле дотягивает до половина человеческой.
От 13 тысяч до 24 миллионов - три порядка масштабирования, которые ещё нужно достичь.
💼 Зачем бизнесу: Гуманоиды сдвигают границу автоматизации с конвейерных задач на те, где нужны руки.
С другой стороны рост зарплат в китайском производстве робота всё привлекательнее с точки зрения рентабельности.
Barclays сравнивает физический ИИ со смартфонами 2007: рынки систематически недооценивают эффект.
Второй сдвиг: когда вместо людей дефицитом станут редкоземельные металлы и энергия, Китай уже доминирует на обоих фронтах.
Запоминаем, - Китай планирует произвести 24 млн роботов.
Конечно они все будут дружелюбно работать на заводах.
Верим.
#роботы #Китай #Barclays #гуманоиды #демография #автоматизация
------
@tsingular
✍5❤5👾3 2❤🔥1👍1 1