Вчера впервые в разговоре механически оценил трудоемкость задачи в млрд токенов.
А надо бы сразу в электричестве.
#мысли
------
@tsingular
А надо бы сразу в электричестве.
#мысли
------
@tsingular
😁29✍6⚡4
Forwarded from Denis Sexy IT 🤖
Тут это, шведский стартап строит 6-метровые дроны для добычи леса – ноль повреждения почвы, дрон подлетает и просто крадет дерево: airforestry.com
Ну хоть ясно теперь как добыча леса будет выглядеть лет через 10-20🌳
Ну хоть ясно теперь как добыча леса будет выглядеть лет через 10-20
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥28🤯13⚡8❤2😁2
В итоге Qwen3.6-35B-A3B-MTP-GGUF на M5 max (запускал с 3мя предсказателями) показывает 92 т/с при том что это Q8 квант
на этой же машине qwen3.6:35b в олламе (который Q4) показывает 62 т/с
Т.е. еще раз, - MoE MTP с Q8 быстрее Q4 без MTP в 1.5 раза!
Очень быстро, очень нравится :)
#MTP #llamacpp #бенчмарки
———
@tsingular
brew install llama.cpp
llama-server -hf ggml-org/Qwen3.6-35B-A3B-MTP-GGUF \
--spec-type draft-mtp --spec-draft-n-max 3 --port 8080
на этой же машине qwen3.6:35b в олламе (который Q4) показывает 62 т/с
Т.е. еще раз, - MoE MTP с Q8 быстрее Q4 без MTP в 1.5 раза!
Очень быстро, очень нравится :)
#MTP #llamacpp #бенчмарки
———
@tsingular
🔥32❤5⚡4✍2👍1
Forwarded from Machinelearning
. На срезе из 200 задач SWE-bench модель набрала 53.33%. Для 9B это очень хорошая цифра, потому что обычно такие результаты ждут от моделей заметно крупнее и дороже в запуске.
Отдельно модель прогнали на HermesAgent-20. Там она получила 85 баллов против 71 у базовой версии. То есть дообучение дало не косметический прирост, а нормальный скачок именно в агентных сценариях.
Интересная деталь: авторы прямо советуют запускать её «горячо», с
--temp примерно 1. Для таких fine-tune моделей это помогает сильнее отходить от поведения базовой модели и меньше застревать в чрезмерном обдумывании. Если начинает вести себя нестабильно, температуру можно постепенно снижать.
Следом обещают выпустить Qwopus 3.6 27B. Предварительная оценка уже лежит в HF-репозитории автора, полный релиз модели должен выйти скоро.
https://huggingface.co/Jackrong/Qwopus3.5-9B-Coder-GGUF
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🔥5⚡3
Anthropic качает цифровых сотрудников - 11 ролей для Cowork
Мы уже рассматривали ранее коллекцию из 60+ навыков для Cowork для юридических агентов, а тем временем Антропики дополнили репозиторий ещё 10-ю ролями.
📋 11 ролей из коробки:
- Productivity (задачи и календарь),
- Sales (досье на клиентов, пайплайн),
- Customer Support (триаж тикетов, база знаний),
- Product Management (спецификации, роадмапы),
- Marketing (контент, кампании, фирменный стиль),
- Legal (триаж NDA, таблицы претензий, комплаенс),
- Finance (проводки, аудит),
- Data (SQL-запросы, дашборды),
- Enterprise Search (поиск по Slack/Notion/Jira),
- Bio Research (геномика, PubMed).
Плюс мета-навык для создания собственных ролей!
🔧 Как устроены: каждый плагин = папка с markdown-навыками, командами и MCP-коннекторами. Настройка под свою компанию: поменял коннектор на нужный CRM, добавил терминологию, подправил процесс, и Claude работает как нанятый специалист.
💡 Фишка: навыки подхватываются автоматически, без промпта. Сказал «сделай NDA-триаж», получил результат. Коннекторы тянут данные из Slack, Notion, Jira, HubSpot, Snowflake и ещё десятков систем через протокол MCP.
💼 Зачем бизнесу: 80% выручки Anthropic = корпоративные клиенты (Axios). Плагины закрывают главный запрос enterprise: агент должен знать наши процессы, а не только хорошо писать текст. Каждая роль превращает Claude из ассистента-универсала в сотрудника, который знает термины и инструменты конкретного отдела.
Для опенсорс-проекта это серьёзный ход: кастомизация за часы, а не месяцы.
Собственно пол года назад был создан прорывной навык "создай навык", а теперь создан навык "создай профессию"!
Время натравить Гермеса на этот репозиторий и вытащить каждый навык в отдельного агента, а мета навык по созданию новых ролей, - в основного.
#Anthropic #Claude #Cowork #навыки
------
@tsingular
Мы уже рассматривали ранее коллекцию из 60+ навыков для Cowork для юридических агентов, а тем временем Антропики дополнили репозиторий ещё 10-ю ролями.
📋 11 ролей из коробки:
- Productivity (задачи и календарь),
- Sales (досье на клиентов, пайплайн),
- Customer Support (триаж тикетов, база знаний),
- Product Management (спецификации, роадмапы),
- Marketing (контент, кампании, фирменный стиль),
- Legal (триаж NDA, таблицы претензий, комплаенс),
- Finance (проводки, аудит),
- Data (SQL-запросы, дашборды),
- Enterprise Search (поиск по Slack/Notion/Jira),
- Bio Research (геномика, PubMed).
Плюс мета-навык для создания собственных ролей!
🔧 Как устроены: каждый плагин = папка с markdown-навыками, командами и MCP-коннекторами. Настройка под свою компанию: поменял коннектор на нужный CRM, добавил терминологию, подправил процесс, и Claude работает как нанятый специалист.
💡 Фишка: навыки подхватываются автоматически, без промпта. Сказал «сделай NDA-триаж», получил результат. Коннекторы тянут данные из Slack, Notion, Jira, HubSpot, Snowflake и ещё десятков систем через протокол MCP.
💼 Зачем бизнесу: 80% выручки Anthropic = корпоративные клиенты (Axios). Плагины закрывают главный запрос enterprise: агент должен знать наши процессы, а не только хорошо писать текст. Каждая роль превращает Claude из ассистента-универсала в сотрудника, который знает термины и инструменты конкретного отдела.
Для опенсорс-проекта это серьёзный ход: кастомизация за часы, а не месяцы.
Собственно пол года назад был создан прорывной навык "создай навык", а теперь создан навык "создай профессию"!
Время натравить Гермеса на этот репозиторий и вытащить каждый навык в отдельного агента, а мета навык по созданию новых ролей, - в основного.
#Anthropic #Claude #Cowork #навыки
------
@tsingular
⚡7🔥7❤4🤣2👍1 1
Deepseek словил сбой в РФ
РКН заявили, что они не связаны с проблемами в работе DeepSeek
Одна из версий - причина в блокировке cloudflare или AWS
#DeepSeek #РКН
———
@tsingular
В редакцию «Кода Дурова» поступают жалобы о недоступности китайской ИИ-платформы DeepSeek в России. Сайт не загружается, сообщения не отправляются без VPN.
Мы проверили соединение с сайтом специальной утилитой и обнаружили обрыв на этапе TLS — такое поведение характерно для сайтов, заблокированных Роскомнадзором.
РКН заявили, что они не связаны с проблемами в работе DeepSeek
Одна из версий - причина в блокировке cloudflare или AWS
#DeepSeek #РКН
———
@tsingular
Barclays: Китай заменит миллионы рабочих на роботов
К 2035 году, в силу демографического спада, Китай потеряет 37 млн рабочих рук. Вариант решения проблемы, - 24 млн гуманоидных роботов.
📋 Что происходит:
- Рабочая сила Китая сократится на 37 млн человек за десятилетие
- 24 млн гуманоидов компенсируют до 60% потерь (оптимистичный сценарий)
- Китай отгрузил 85% мировых инсталляций гуманоидов в 2025 году
- Unitree дропает цену ниже $20 000 за промышленного робота, зарплаты на фабриках растут 6-8% в год
- Пекин целит в 300 млрд юаней ($41 млрд) оборот рынка к 2035 году
🔧 Подводные камни: Из 150+ производителей лишь 23% покупателей довольны купленными роботами, а весь рынок отгрузил 13 000 единиц в 2025 году. Эффективность лучшего гуманоида еле дотягивает до половина человеческой.
От 13 тысяч до 24 миллионов - три порядка масштабирования, которые ещё нужно достичь.
💼 Зачем бизнесу: Гуманоиды сдвигают границу автоматизации с конвейерных задач на те, где нужны руки.
С другой стороны рост зарплат в китайском производстве робота всё привлекательнее с точки зрения рентабельности.
Barclays сравнивает физический ИИ со смартфонами 2007: рынки систематически недооценивают эффект.
Второй сдвиг: когда вместо людей дефицитом станут редкоземельные металлы и энергия, Китай уже доминирует на обоих фронтах.
Запоминаем, - Китай планирует произвести 24 млн роботов.
Конечно они все будут дружелюбно работать на заводах.
Верим.
#роботы #Китай #Barclays #гуманоиды #демография #автоматизация
------
@tsingular
К 2035 году, в силу демографического спада, Китай потеряет 37 млн рабочих рук. Вариант решения проблемы, - 24 млн гуманоидных роботов.
📋 Что происходит:
- Рабочая сила Китая сократится на 37 млн человек за десятилетие
- 24 млн гуманоидов компенсируют до 60% потерь (оптимистичный сценарий)
- Китай отгрузил 85% мировых инсталляций гуманоидов в 2025 году
- Unitree дропает цену ниже $20 000 за промышленного робота, зарплаты на фабриках растут 6-8% в год
- Пекин целит в 300 млрд юаней ($41 млрд) оборот рынка к 2035 году
🔧 Подводные камни: Из 150+ производителей лишь 23% покупателей довольны купленными роботами, а весь рынок отгрузил 13 000 единиц в 2025 году. Эффективность лучшего гуманоида еле дотягивает до половина человеческой.
От 13 тысяч до 24 миллионов - три порядка масштабирования, которые ещё нужно достичь.
💼 Зачем бизнесу: Гуманоиды сдвигают границу автоматизации с конвейерных задач на те, где нужны руки.
С другой стороны рост зарплат в китайском производстве робота всё привлекательнее с точки зрения рентабельности.
Barclays сравнивает физический ИИ со смартфонами 2007: рынки систематически недооценивают эффект.
Второй сдвиг: когда вместо людей дефицитом станут редкоземельные металлы и энергия, Китай уже доминирует на обоих фронтах.
Запоминаем, - Китай планирует произвести 24 млн роботов.
Конечно они все будут дружелюбно работать на заводах.
Верим.
#роботы #Китай #Barclays #гуманоиды #демография #автоматизация
------
@tsingular
❤8✍7👍3👾3 3 3❤🔥1
Forwarded from Tech Crunch
Китайский военный ИИ во время испытаний превзошел реальных командиров
Национальный университет оборонных технологий Китая (NUDT) представил модель ИИ, действующего как «цифровой начальник штаба». Во время имитации десантных атак он превзошел многих опытных командиров, принимая решения на 43 % быстрее и сохраняя точность более 90 % при помехах связи. Это означает, что в сложной боевой ситуации ИИ может действовать эффективнее человека.
По имеющейся информации, данный ИИ уже внедряется в командные структуры батальонного звена Народно-освободительной армии Китая (НОАК). Система объединяет большие языковые модели с ситуацией на поле боя в режиме реального времени. При этом она отсеивает информационный шум, давая возможность командирам увидеть скрытые угрозы.
Таким образом, ИИ определяет «критически важные информационные потребности» — факторы, от которых зависит успех миссии. В качестве проверки эффективности командного ИИ, NUDT предложил сразиться ему с пятью опытными военными с 12-летним стажем службы.
ИИ ускорил цикл OODA (наблюдение, ориентирование, решение и действие), что позволило людям-командирам действовать на 43 % быстрее, чем раньше. В реальности, пока командиры выбирали алгоритм операции, ИИ уже действовал. Когда же на участников поединка обрушился вал радиоэлектронных помех, ИИ сохранил полное самообладание, действуя с эффективностью на уровне 90 %.
Национальный университет оборонных технологий Китая (NUDT) представил модель ИИ, действующего как «цифровой начальник штаба». Во время имитации десантных атак он превзошел многих опытных командиров, принимая решения на 43 % быстрее и сохраняя точность более 90 % при помехах связи. Это означает, что в сложной боевой ситуации ИИ может действовать эффективнее человека.
По имеющейся информации, данный ИИ уже внедряется в командные структуры батальонного звена Народно-освободительной армии Китая (НОАК). Система объединяет большие языковые модели с ситуацией на поле боя в режиме реального времени. При этом она отсеивает информационный шум, давая возможность командирам увидеть скрытые угрозы.
Таким образом, ИИ определяет «критически важные информационные потребности» — факторы, от которых зависит успех миссии. В качестве проверки эффективности командного ИИ, NUDT предложил сразиться ему с пятью опытными военными с 12-летним стажем службы.
ИИ ускорил цикл OODA (наблюдение, ориентирование, решение и действие), что позволило людям-командирам действовать на 43 % быстрее, чем раньше. В реальности, пока командиры выбирали алгоритм операции, ИИ уже действовал. Когда же на участников поединка обрушился вал радиоэлектронных помех, ИИ сохранил полное самообладание, действуя с эффективностью на уровне 90 %.
🔥20🤯12😢8❤2👍1💯1
Энциклика Папы Льва XIV про ИИ — не про ИИ
Ватикан выпустил первую в истории папскую энциклику об ИИ. «Magnifica Humanitas» — 200 страниц про то, что концентрация власти в руках нескольких элит не стала новее от того, что к ней добавились нейросети.
🏛️ Контекст: Папа Лев XIV (бывший кардинал Превост) представил документ 25 мая в Ватикане вместе с Крисом Олой, сооснователем Anthropic. Не каждый день глава Католической церкви приглашает айтишника на презентацию энциклики.
⚖️ Суть документа: ИИ усиливает тех, у кого уже есть деньги, данные и доступ. Цитата: «Когда такая власть концентрируется в руках немногих, она стремится стать непрозрачной и уходить от общественного контроля». Лев XIV прямо называет это новой формой зависимости и манипуляции.
🕊️ Разоружение ИИ: Папа призывает остановить гонку за «всё более мощными алгоритмами и большими датасетами» ради геополитического или коммерческого доминирования. «Разоружение означает дискредитацию допущения, что техническая власть автоматически даёт право управлять».
🧠 Три вопроса Олы: Крис Ола в своём выступлении сформулировал три проблемы, где голос Церкви необходим: (1) долг перед глобальными бедными — ИИ вытеснит труд миллионов, и механизма распределения выгод нет; (2) моральное воображение — что значит процветание человека, семьи, мира в эпоху ИИ?; (3) природа самих моделей — Ола признал, что внутри ИИ-систем находят структуры, «зеркалящие результаты нейронауки», включая состояния, функционально похожие на радость, страх и горе.
🔥 Политический фон: Энциклика вышла через 4 дня после того, как Трамп отложил подписание executive order по ИИ — по настоянию Дэвида Сакса, бывшего AI-царя Белого дома и венчурного инвестора. Символично.
💼 Зачем бизнесу: Документ Ватикана — не юридический акт, а моральный компас. Но он формирует глобальный нарратив: концентрация ИИ-власти без общественного контроля теряет легитимность. Компании, игнорирующие этот тренд, получат регуляторное давление и репутационные риски. ESG-рейтинги уже учитывают AI governance.
🔮 Будущее: Риторика Папы совпадает с растущим запросом на «disarm AI» — от EU AI Act до разговоров о международных договорах. Энциклика легитимизирует позицию, что ИИ — не частное дело лабораторий, а общественный вопрос. Anthropic, кстати, оказался единственной AI-компанией, допущенной к трибуне.
#ИИ #Ватикан #Anthropic #регулирование #этика #MagnificaHumanitas
───
@tsingular
Ватикан выпустил первую в истории папскую энциклику об ИИ. «Magnifica Humanitas» — 200 страниц про то, что концентрация власти в руках нескольких элит не стала новее от того, что к ней добавились нейросети.
🏛️ Контекст: Папа Лев XIV (бывший кардинал Превост) представил документ 25 мая в Ватикане вместе с Крисом Олой, сооснователем Anthropic. Не каждый день глава Католической церкви приглашает айтишника на презентацию энциклики.
⚖️ Суть документа: ИИ усиливает тех, у кого уже есть деньги, данные и доступ. Цитата: «Когда такая власть концентрируется в руках немногих, она стремится стать непрозрачной и уходить от общественного контроля». Лев XIV прямо называет это новой формой зависимости и манипуляции.
🕊️ Разоружение ИИ: Папа призывает остановить гонку за «всё более мощными алгоритмами и большими датасетами» ради геополитического или коммерческого доминирования. «Разоружение означает дискредитацию допущения, что техническая власть автоматически даёт право управлять».
🧠 Три вопроса Олы: Крис Ола в своём выступлении сформулировал три проблемы, где голос Церкви необходим: (1) долг перед глобальными бедными — ИИ вытеснит труд миллионов, и механизма распределения выгод нет; (2) моральное воображение — что значит процветание человека, семьи, мира в эпоху ИИ?; (3) природа самих моделей — Ола признал, что внутри ИИ-систем находят структуры, «зеркалящие результаты нейронауки», включая состояния, функционально похожие на радость, страх и горе.
🔥 Политический фон: Энциклика вышла через 4 дня после того, как Трамп отложил подписание executive order по ИИ — по настоянию Дэвида Сакса, бывшего AI-царя Белого дома и венчурного инвестора. Символично.
💼 Зачем бизнесу: Документ Ватикана — не юридический акт, а моральный компас. Но он формирует глобальный нарратив: концентрация ИИ-власти без общественного контроля теряет легитимность. Компании, игнорирующие этот тренд, получат регуляторное давление и репутационные риски. ESG-рейтинги уже учитывают AI governance.
🔮 Будущее: Риторика Папы совпадает с растущим запросом на «disarm AI» — от EU AI Act до разговоров о международных договорах. Энциклика легитимизирует позицию, что ИИ — не частное дело лабораторий, а общественный вопрос. Anthropic, кстати, оказался единственной AI-компанией, допущенной к трибуне.
#ИИ #Ватикан #Anthropic #регулирование #этика #MagnificaHumanitas
───
@tsingular
👍15❤5🔥3⚡2🤔1
Stable Audio 3.0: музыка без копирайт ограничений
Stability AI выпускает сразу четыре звуковых модели с открытыми весами, лицензированными данными и правом коммерциализации. Композиция на телефоне, треки до шести минут, LoRa-дообучение из коробки.
📋 Что в семействе:
- Small SFX (0.6B) - звуковые эффекты прямо на телефоне, без GPU
- Small (0.6B) - полноценная музыка на устройстве
- Medium (2B) - связные треки до 6:20, мелодическая цельность
- Large - флагман для платформ, через API и self-hosting
🔧 Под капотом: Архитектура с семантико-акустическим автоэнкодером (SAME). Генерация переменной длины с точностью до секунды. Small выдаёт до 2 минут вместо 11 секунд у прошлой версии. Впервые опубликована документация по LoRa-дообучению на собственной фонотеке.
Аудио-инпейнтинг: редактирование фрагментов, продление треков без пересоздания.
💡 Ключевое: Три из четырёх моделей обучены на лицензированных данных. Под Community License ты владеешь результатом и можешь продавать.
Конкуренты с открытыми весами обычно либо ограничивают коммерцию, либо тренируются на нелицензированной музыке.
Для оборота свыше $1 млн - Enterprise License с юридической защитой.
💼 Зачем бизнесу: Генеративный звук перестаёт быть юридической лотереей.
Разработчикам игр, рекламных платформ и контент-сервисов - единый конвейер от прототипа до продакшена без угрозы авторских исков.
🔗 Альтернативы:
- ACE-Step - Suno-киллер, open-source, вокал + полные треки
- Suno / Udio - закрытые, с авторскими спорами
#StableAudio #генеративныйзвук #openweights #музыкальныйИИ #StabilityAI
------
@tsingular
Stability AI выпускает сразу четыре звуковых модели с открытыми весами, лицензированными данными и правом коммерциализации. Композиция на телефоне, треки до шести минут, LoRa-дообучение из коробки.
📋 Что в семействе:
- Small SFX (0.6B) - звуковые эффекты прямо на телефоне, без GPU
- Small (0.6B) - полноценная музыка на устройстве
- Medium (2B) - связные треки до 6:20, мелодическая цельность
- Large - флагман для платформ, через API и self-hosting
🔧 Под капотом: Архитектура с семантико-акустическим автоэнкодером (SAME). Генерация переменной длины с точностью до секунды. Small выдаёт до 2 минут вместо 11 секунд у прошлой версии. Впервые опубликована документация по LoRa-дообучению на собственной фонотеке.
Аудио-инпейнтинг: редактирование фрагментов, продление треков без пересоздания.
💡 Ключевое: Три из четырёх моделей обучены на лицензированных данных. Под Community License ты владеешь результатом и можешь продавать.
Конкуренты с открытыми весами обычно либо ограничивают коммерцию, либо тренируются на нелицензированной музыке.
Для оборота свыше $1 млн - Enterprise License с юридической защитой.
💼 Зачем бизнесу: Генеративный звук перестаёт быть юридической лотереей.
Разработчикам игр, рекламных платформ и контент-сервисов - единый конвейер от прототипа до продакшена без угрозы авторских исков.
🔗 Альтернативы:
- ACE-Step - Suno-киллер, open-source, вокал + полные треки
- Suno / Udio - закрытые, с авторскими спорами
#StableAudio #генеративныйзвук #openweights #музыкальныйИИ #StabilityAI
------
@tsingular
👍11🔥6⚡3
Claude API: скам прокси со скидками под 95%
Официальная цена Anthropic: $15 за миллион токенов для многих достаточно кусачая.
Но на Taobao и Xianyu появились предложения с доступом к Claude Opus за $1-2 в день.
Разница в десятки раз, но по факту, - это тот самый бесплатный сыр в мышеловке.
📋 Как устроен сервис: Прокси-станции на VPS за $5. Тысячи фейковых аккаунтов через браузеры с защитой от обнаружения.
Паспорта генерирует ИИ.
Для KYC - дипфейк лица в реальном времени.
Маржа перепродажи: 80%+.
Результат: 24 000 фейковых аккаунтов и 16 млн+ запросов от лабораторий DeepSeek, Moonshot (Kimi) и MiniMax, которые системно откачивали рассуждения Claude для дистилляции.
🔧 Подмена модели: Исследование Oxford (ChinaTalk, май 2026): в ~46% случаев прокси подменяет Opus на Haiku, GLM, Kimi или Gemini Flash.
Дашборд токенов фальшивый. Т.е. пользователь думает, что получил Opus, а по факту работает Haiku.
На простых задачах разница не заметка, но вот на сложных - падение качества очевидно.
💡 Настоящая цель - данные: Каждый промпт, ответ, строка кода, документ, вызов инструмента и цепочка рассуждений логируется.
Данные перепродаются или используются для дистилляции китайских моделей.
Миллионы разговоров и десятки миллиардов токенов уже попали в обучающие выборки.
💼 Зачем бизнесу: Если ваша команда использует сторонние прокси для доступа к облачным моделям - вы сливаете коммерческую тайну, код, стратегию и переписку туннелирующиму сервису.
Anthropic фиксирует популярные прокси и блокирует аккаунты. Экономия в $13 за миллион токенов обходится в утечку данных и подмену моделей.
#Claude #Anthropic #API #скам #cybersecurity
------
@tsingular
Официальная цена Anthropic: $15 за миллион токенов для многих достаточно кусачая.
Но на Taobao и Xianyu появились предложения с доступом к Claude Opus за $1-2 в день.
Разница в десятки раз, но по факту, - это тот самый бесплатный сыр в мышеловке.
📋 Как устроен сервис: Прокси-станции на VPS за $5. Тысячи фейковых аккаунтов через браузеры с защитой от обнаружения.
Паспорта генерирует ИИ.
Для KYC - дипфейк лица в реальном времени.
Маржа перепродажи: 80%+.
Результат: 24 000 фейковых аккаунтов и 16 млн+ запросов от лабораторий DeepSeek, Moonshot (Kimi) и MiniMax, которые системно откачивали рассуждения Claude для дистилляции.
🔧 Подмена модели: Исследование Oxford (ChinaTalk, май 2026): в ~46% случаев прокси подменяет Opus на Haiku, GLM, Kimi или Gemini Flash.
Дашборд токенов фальшивый. Т.е. пользователь думает, что получил Opus, а по факту работает Haiku.
На простых задачах разница не заметка, но вот на сложных - падение качества очевидно.
💡 Настоящая цель - данные: Каждый промпт, ответ, строка кода, документ, вызов инструмента и цепочка рассуждений логируется.
Данные перепродаются или используются для дистилляции китайских моделей.
Миллионы разговоров и десятки миллиардов токенов уже попали в обучающие выборки.
💼 Зачем бизнесу: Если ваша команда использует сторонние прокси для доступа к облачным моделям - вы сливаете коммерческую тайну, код, стратегию и переписку туннелирующиму сервису.
Anthropic фиксирует популярные прокси и блокирует аккаунты. Экономия в $13 за миллион токенов обходится в утечку данных и подмену моделей.
#Claude #Anthropic #API #скам #cybersecurity
------
@tsingular
🤯13⚡7💯2❤1
SkillOpt: качалка для навыков от Microsoft
Промпт-инженеринг мёртв, fine-tuning дорог. Microsoft Research предложила третий путь: оптимизировать текст навыка агента как обучаемые параметры, не трогая саму модель.
Эпохи, батчи, learning rate, валидация - всё как в глубоком обучении, только в пространстве текста.
📋 Что получаем:
- Средний прирост +24.9pp на GPT-5.4-nano, +23.5pp на GPT-5.5 без единого изменения весов
- 52 из 52 конфигураций:
SkillOpt лучше или равен всем бейзлайнам (no-skill, human skill, LLM skill, TextGrad, GEPA, Trace2Skill)
- Перенос навыка между моделями (+15.2pp), харнесами (+31.8pp из Codex в Claude Code) и задачами
- На выходе - один файл best_skill.md, который можно версионировать, аудировать и деплоить
🔧 Как устроено:
Цикл напоминает обучение нейросети.
Rollout - target model выполняет задачи с текущим навыком, собирая траектории успешности.
Reflect - отдельный optimizer анализирует батчи удач и провалов.
Edit - предлагает ограниченные правки (add/delete/replace) в пределах бюджета - это текстовый learning rate, предотвращающий разрушительные переписывания.
Gate - правка принимается только если улучшает результат на отложенной выборке.
Rejected-буфер и slow update работают как память сессии, не давая оптимизатору повторять ошибки.
💡 Фишка:
Навык - не промпт, а внешний артефакт. SkillOpt превращает ad-hoc инструкции в систематически оптимизируемое процедурное знание.
Например GPT-5.4-nano как свой собственный оптимизатор даёт +10.4pp на SpreadsheetBench - цикл работает даже без сильного оптимизатора.
Код открыт: github.com/microsoft/SkillOpt, 804 звезды, есть WebUI для мониторинга.
💼 Зачем бизнесу:
Агентные системы часто застревают на ручной оптимизации промптов.
SkillOpt автоматизирует эволюцию: запустил цикл, получил best_skill.md, деплой.
Для Hermes Agent и аналогичных фреймворков навыки - центральный артефакт.
Перенос между моделями и харнесами означает, что один оптимизированный навык обслуживает несколько агентов без перенастройки.
Конкуренты: TextGrad, GEPA (Databricks/DSPy), Trace2Skill (Alibaba/Qwen). SkillOpt обходит всех по стабильности на 52 конфигурациях.
#SkillOpt #Microsoft #навыки #оптимизация
------
@tsingular
Промпт-инженеринг мёртв, fine-tuning дорог. Microsoft Research предложила третий путь: оптимизировать текст навыка агента как обучаемые параметры, не трогая саму модель.
Эпохи, батчи, learning rate, валидация - всё как в глубоком обучении, только в пространстве текста.
📋 Что получаем:
- Средний прирост +24.9pp на GPT-5.4-nano, +23.5pp на GPT-5.5 без единого изменения весов
- 52 из 52 конфигураций:
SkillOpt лучше или равен всем бейзлайнам (no-skill, human skill, LLM skill, TextGrad, GEPA, Trace2Skill)
- Перенос навыка между моделями (+15.2pp), харнесами (+31.8pp из Codex в Claude Code) и задачами
- На выходе - один файл best_skill.md, который можно версионировать, аудировать и деплоить
🔧 Как устроено:
Цикл напоминает обучение нейросети.
Rollout - target model выполняет задачи с текущим навыком, собирая траектории успешности.
Reflect - отдельный optimizer анализирует батчи удач и провалов.
Edit - предлагает ограниченные правки (add/delete/replace) в пределах бюджета - это текстовый learning rate, предотвращающий разрушительные переписывания.
Gate - правка принимается только если улучшает результат на отложенной выборке.
Rejected-буфер и slow update работают как память сессии, не давая оптимизатору повторять ошибки.
💡 Фишка:
Навык - не промпт, а внешний артефакт. SkillOpt превращает ad-hoc инструкции в систематически оптимизируемое процедурное знание.
Например GPT-5.4-nano как свой собственный оптимизатор даёт +10.4pp на SpreadsheetBench - цикл работает даже без сильного оптимизатора.
Код открыт: github.com/microsoft/SkillOpt, 804 звезды, есть WebUI для мониторинга.
💼 Зачем бизнесу:
Агентные системы часто застревают на ручной оптимизации промптов.
SkillOpt автоматизирует эволюцию: запустил цикл, получил best_skill.md, деплой.
Для Hermes Agent и аналогичных фреймворков навыки - центральный артефакт.
Перенос между моделями и харнесами означает, что один оптимизированный навык обслуживает несколько агентов без перенастройки.
Конкуренты: TextGrad, GEPA (Databricks/DSPy), Trace2Skill (Alibaba/Qwen). SkillOpt обходит всех по стабильности на 52 конфигурациях.
#SkillOpt #Microsoft #навыки #оптимизация
------
@tsingular
1✍9🔥5⚡2👏1
DuckDuckGo: спрос вырос на 30%, - пользователи бегут от принудительного ИИ-поиска Google
На I/O 2026 Google объявил о замене классических ссылок с результатами поиска на ИИ-агента, который отвечает на запросы, выполняет задачи и запускает фоновый мониторинг. Народ не оценил.
📉 Отток: Установки DuckDuckGo в США выросли на 18,1% за неделю (20–25 мая) с пиком 30,5% 25 мая. На iOS — ещё агрессивнее: средний рост 33%, пик 69,9%. Посещения страницы noai.duckduckgo.com (где все ИИ-фичи отключены по умолчанию) росли на 22,7% неделю к неделе.
🗳️ Выбор без принуждения: Опрос DuckDuckGo на 110,000 респондентов — 93% активно отвергают ИИ-функции в поиске. CEO Габриэль Вайнберг: «Google впихивает ИИ без возможности отказаться. Результаты становятся хуже, а не лучше. Мы чтобы решал пользователь».
🛡️ Приватность с пользой: шлюз Duck.ai так же даёт доступ к Claude 4.5 Haiku, Llama 4 Scout, Mistral Small 3 и GPT-5 mini — без аккаунта, с удалением IP-адресов перед отправкой запросов, удалением чатов через 30 дней и запретом на обучение моделей на ваших данных.
⚖️ Контекст: На антитрастовом процессе 2023 года Вайнберг заявил, что эксклюзивные контракты Google о поиске по умолчанию блокировали DuckDuckGo от дистрибуции. А теперь по сути Google сам гонит к ним пользователей.
💼 Бизнес аспект: Монополия на привычку пользователя хрупка. Google только что доказал: навязывание ИИ без возможности отключения не улучшает продукт.
Так мы дойдём и до момента, когда "без ИИ" станет маркетинговой фичей 😀
#Google #DuckDuckGo #поиск
───
@tsingular
На I/O 2026 Google объявил о замене классических ссылок с результатами поиска на ИИ-агента, который отвечает на запросы, выполняет задачи и запускает фоновый мониторинг. Народ не оценил.
📉 Отток: Установки DuckDuckGo в США выросли на 18,1% за неделю (20–25 мая) с пиком 30,5% 25 мая. На iOS — ещё агрессивнее: средний рост 33%, пик 69,9%. Посещения страницы noai.duckduckgo.com (где все ИИ-фичи отключены по умолчанию) росли на 22,7% неделю к неделе.
🗳️ Выбор без принуждения: Опрос DuckDuckGo на 110,000 респондентов — 93% активно отвергают ИИ-функции в поиске. CEO Габриэль Вайнберг: «Google впихивает ИИ без возможности отказаться. Результаты становятся хуже, а не лучше. Мы чтобы решал пользователь».
🛡️ Приватность с пользой: шлюз Duck.ai так же даёт доступ к Claude 4.5 Haiku, Llama 4 Scout, Mistral Small 3 и GPT-5 mini — без аккаунта, с удалением IP-адресов перед отправкой запросов, удалением чатов через 30 дней и запретом на обучение моделей на ваших данных.
⚖️ Контекст: На антитрастовом процессе 2023 года Вайнберг заявил, что эксклюзивные контракты Google о поиске по умолчанию блокировали DuckDuckGo от дистрибуции. А теперь по сути Google сам гонит к ним пользователей.
💼 Бизнес аспект: Монополия на привычку пользователя хрупка. Google только что доказал: навязывание ИИ без возможности отключения не улучшает продукт.
Так мы дойдём и до момента, когда "без ИИ" станет маркетинговой фичей 😀
#Google #DuckDuckGo #поиск
───
@tsingular
😁10⚡7❤5🔥2🤣1
Microsoft MAI-Image-2.5, - новый генератор изображений на подходе
По версии Arena.ai на сегодняшний день лидером по генерации изображений является GPT-Image-2 с отрывом в +242 Elo от Google, который на втором месте с Flash Image.
И вот Microsoft врывается в тройку: MAI-Image-2.5 стартовал с Elo 1254, на 72 очка выше предшественника.
📋 Что умеет: Рендер текста в изображениях, визуальная композиция сложных сцен, точное следование промпту. Mustafa Suleyman подчёркивает: модель заточена под профессиональную графику, а не игрушки.
Чистые макеты, упаковка, постеры с читаемым текстом.
- Текст: шрифты без артефактов, логотипы, вывески
- Композиция: масштаб, свет, пространственные отношения
- Промпт-адекватность: сложные коммерческие и стилизованные запросы
🔧 Как разрабатывали: Microsoft выстроила собственную линейку с нуля, без OpenAI. MAI-Image-1 (конец 2025), MAI-Image-2 (март 2026), MAI-Image-2-Efficient (апрель), MAI-Image-2.5 (май). Четыре релиза за полгода.
🔗 Аналогичные проекты:
- GPT-Image-2 - лидер Arena.ai, Elo 1512, лучший рендер текста
- Gemini 2.5 Flash Image - второй на Arena, силён в фотореализме и редактировании
- Luma UNI-1.1 - открытый конкурент, ~1254 Elo
- Recraft V4.1 - вошла в топ-10, 1243 Elo
#Microsoft #MAI #ArenaAI
------
@tsingular
По версии Arena.ai на сегодняшний день лидером по генерации изображений является GPT-Image-2 с отрывом в +242 Elo от Google, который на втором месте с Flash Image.
И вот Microsoft врывается в тройку: MAI-Image-2.5 стартовал с Elo 1254, на 72 очка выше предшественника.
📋 Что умеет: Рендер текста в изображениях, визуальная композиция сложных сцен, точное следование промпту. Mustafa Suleyman подчёркивает: модель заточена под профессиональную графику, а не игрушки.
Чистые макеты, упаковка, постеры с читаемым текстом.
- Текст: шрифты без артефактов, логотипы, вывески
- Композиция: масштаб, свет, пространственные отношения
- Промпт-адекватность: сложные коммерческие и стилизованные запросы
🔧 Как разрабатывали: Microsoft выстроила собственную линейку с нуля, без OpenAI. MAI-Image-1 (конец 2025), MAI-Image-2 (март 2026), MAI-Image-2-Efficient (апрель), MAI-Image-2.5 (май). Четыре релиза за полгода.
🔗 Аналогичные проекты:
- GPT-Image-2 - лидер Arena.ai, Elo 1512, лучший рендер текста
- Gemini 2.5 Flash Image - второй на Arena, силён в фотореализме и редактировании
- Luma UNI-1.1 - открытый конкурент, ~1254 Elo
- Recraft V4.1 - вошла в топ-10, 1243 Elo
#Microsoft #MAI #ArenaAI
------
@tsingular
⚡6👍5❤1🆒1
Anthropic встроила security-ревьюера в Claude Code
Пока конкуренты цепляют security-сканирование к CI/CD, Anthropic встроил проверки кода на безопасность в момент написания. Security-guidance plugin для Claude Code ловит уязвимости, пока агент их пишет, в той же сессии, а не на PR.
📋 Что получаешь:
- Pattern match на каждой редакции:
- Фоновый model review после каждого хода: authorization bypass, SSRF, слабая криптография, отдельный вызов Claude с чистым контекстом
- Агентный ревью на коммитах: читает окружающий код, отличает опасный код в изоляции от безопасного в контексте
- Кастомные орг-правила через
🔧 Как устроено:
Плагин работает на хуках, тех же, что доступны любому разработчику Claude Code. Три слоя: deterministic match → background diff review → agentic commit review. Проверяет не тот экземпляр, который писал код, а отдельный с чистым контекстом. Не блокирует записи: обнаружения и выводы приходят как инструкции, которые Claude адресует следующим шагом.
💡 Фишка:
Anthropic dogfooding (испробовали на себе): 30-40% снижение security-комментов на PR. Кастомные правила в
💼 Зачем бизнесу:
Shift-left security в агентном программировании, это плагин с измеримым результатом, а не абстракция. Единственный минус пока, - плагин не сканирует пакеты перед установкой. Паттерн «фоновый ревьюер» повторяем: performance, accessibility, cost, следующие кандидаты.
Скоро такие плагины станут стандартом в агентной обвязке.
Было бы полезно не только для кодовых агентов, кстати.
#ClaudeCode #cybersecurity #Anthropic
------
@tsingular
Пока конкуренты цепляют security-сканирование к CI/CD, Anthropic встроил проверки кода на безопасность в момент написания. Security-guidance plugin для Claude Code ловит уязвимости, пока агент их пишет, в той же сессии, а не на PR.
📋 Что получаешь:
- Pattern match на каждой редакции:
eval(), pickle, dangerouslySetInnerHTML, без модели, мгновенно- Фоновый model review после каждого хода: authorization bypass, SSRF, слабая криптография, отдельный вызов Claude с чистым контекстом
- Агентный ревью на коммитах: читает окружающий код, отличает опасный код в изоляции от безопасного в контексте
- Кастомные орг-правила через
.claude/claude-security-guidance.md🔧 Как устроено:
Плагин работает на хуках, тех же, что доступны любому разработчику Claude Code. Три слоя: deterministic match → background diff review → agentic commit review. Проверяет не тот экземпляр, который писал код, а отдельный с чистым контекстом. Не блокирует записи: обнаружения и выводы приходят как инструкции, которые Claude адресует следующим шагом.
💡 Фишка:
Anthropic dogfooding (испробовали на себе): 30-40% снижение security-комментов на PR. Кастомные правила в
security-patterns.yaml (до 50 regex) превращают повторяющиеся замечания из разовых комментов в политику репозитория.💼 Зачем бизнесу:
Shift-left security в агентном программировании, это плагин с измеримым результатом, а не абстракция. Единственный минус пока, - плагин не сканирует пакеты перед установкой. Паттерн «фоновый ревьюер» повторяем: performance, accessibility, cost, следующие кандидаты.
Скоро такие плагины станут стандартом в агентной обвязке.
Было бы полезно не только для кодовых агентов, кстати.
#ClaudeCode #cybersecurity #Anthropic
------
@tsingular
❤5⚡4🔥3 1
SearXNG: Личный поисковик из 246 движков за 5 минут
SearXNG предлагает решение для хостинга обработки поисковой выдачи локально: вы хостите его сами, поисковики видят только IP вашего сервера, а результат чистится, - без рекламы, ИИ подсказок и трекинга.
📋 Что получаешь:
- Агрегация результатов от 246 поисковых сервисов: Google, Bing, DuckDuckGo, Brave, Qwant, Wikipedia, GitHub и десятки других
- JSON API из коробки: программный доступ к результатам для скриптов, агентов, RAG-пайплайнов
- Ноль логов, ноль профилей, ноль рекламы. Работает через Tor
- Docker-деплой одной командой, обновления подтягиваются сами
🔧 Как устроено:
SearXNG работает как прокси-оркестратор. Параллельно шлёт ваш запрос сразу десяткам движков, дедуплицирует и ранжирует результат. API Google и Bing видят запрос с IP сервера, а не с вашего ноутбука. Конфигурация через
💡 Фишка:
Уже 30K звёзд на GitHub, активное комьюнити (22% контрибьюторов возвращаются каждый квартал), AGPLv3. SearXNG появился в 2021 как форк заброшенного Searx, когда команда мейнтейнеров ушла из-за конфликтов по code-review. За четыре года форк обогнал оригинал по всем фронтам.
💼 Зачем бизнесу:
Компании встраивают SearXNG в AI-пайплайны как приватный слой поиска: нет сторонних API, нет ключей, нет логов у провайдера. Для самохостинга подойдёт Raspberry Pi или самый дешёвый VPS. Прогноз: метапоиск станет стандартным компонентом self-hosted AI-стеков, как Nginx для веб-серверов.
Команда для Гермеса:
Ключи не нужны. Всё бесплатно.
UPD: Внимание - конфиг по умолчанию поднимает его на 0.0.0.0 для всех - обязательно переконфигурировать на 127.0.0.1
#SearXNG #поиск #self-hosted #Docker #метапоиск
------
@tsingular
SearXNG предлагает решение для хостинга обработки поисковой выдачи локально: вы хостите его сами, поисковики видят только IP вашего сервера, а результат чистится, - без рекламы, ИИ подсказок и трекинга.
📋 Что получаешь:
- Агрегация результатов от 246 поисковых сервисов: Google, Bing, DuckDuckGo, Brave, Qwant, Wikipedia, GitHub и десятки других
- JSON API из коробки: программный доступ к результатам для скриптов, агентов, RAG-пайплайнов
- Ноль логов, ноль профилей, ноль рекламы. Работает через Tor
- Docker-деплой одной командой, обновления подтягиваются сами
🔧 Как устроено:
SearXNG работает как прокси-оркестратор. Параллельно шлёт ваш запрос сразу десяткам движков, дедуплицирует и ранжирует результат. API Google и Bing видят запрос с IP сервера, а не с вашего ноутбука. Конфигурация через
settings.yml: включаете нужные движки, настраиваете прокси, отключаете категории. Кэш на Valkey (Redis-форк) ускоряет повторные запросы.💡 Фишка:
Уже 30K звёзд на GitHub, активное комьюнити (22% контрибьюторов возвращаются каждый квартал), AGPLv3. SearXNG появился в 2021 как форк заброшенного Searx, когда команда мейнтейнеров ушла из-за конфликтов по code-review. За четыре года форк обогнал оригинал по всем фронтам.
💼 Зачем бизнесу:
Компании встраивают SearXNG в AI-пайплайны как приватный слой поиска: нет сторонних API, нет ключей, нет логов у провайдера. Для самохостинга подойдёт Raspberry Pi или самый дешёвый VPS. Прогноз: метапоиск станет стандартным компонентом self-hosted AI-стеков, как Nginx для веб-серверов.
Команда для Гермеса:
изучи и установи себе как навык для поиска:
https://docs.searxng.org/admin/installation-searxng.html#installation-basic
перед установкой проверь свободные порты
устанавливай только на 127.0.0.1
режим установки контейнера - с автоподнятием после перезагрузки
Ключи не нужны. Всё бесплатно.
UPD: Внимание - конфиг по умолчанию поднимает его на 0.0.0.0 для всех - обязательно переконфигурировать на 127.0.0.1
#SearXNG #поиск #self-hosted #Docker #метапоиск
------
@tsingular
🔥20👍8✍4⚡2
xAI выкатила Grok Build: CLI агент-разработчик
Лавры Антропика не дают успокоиться Илону Маску, - xAI выпустил Grok Build с 14 мая в бете для SuperGrok Heavy, а 25 мая открылся для всех подписок SuperGrok и X Premium+.
📋 Что дают:
- Plan Mode: агент составляет пошаговый план, вы утверждаете, комментируете или переписываете шаги до начала выполнения
- Параллельные субагенты: крупные задачи делегируются специализированным воркерам, каждый в своём git worktree
- ACP (Agent Coordination Protocol) из коробки: мультиагентная оркестрация и headless-режим для CI/CD
- Читает AGENTS.md, CLAUDE.md, .grok/ - полная совместимость с экосистемой Claude Code
- Imagine встроен: генерация изображений и видео прямо из CLI
🔧 Как устроено:
Grok Build работает как оркестратор. Plan Mode включает режим «только чтение»: агент исследует кодовую базу, предлагает план действий, вы редактируете шаги и даёте добро. Только после одобрения начинается выполнение.
Субагенты запускаются параллельно в отдельных git worktree, не конфликтуя между собой.
С 20 мая под капотом grok-build-0.1,- модель заточенная под программирование.
💡 Фишка:
Grok Build подхватывает привычки Claude Code: плагины, хуки, навыки, MCP-серверы. Переезд с Claude Code минимален: AGENTS.md работает без изменений. Есть управление с клавиатуры: Ctrl+W для нового worktree, Ctrl+S для резюме, Ctrl+Q для выхода.
Установка:
Сложно сказать зачем нам ещё один агент-программист по цене в 2 раза дороже Дипсика v4 pro в opencode - но пусть будет :) вдруг где-то лимиты закончатся.
#GrokBuild #xAI #CodingAgent #CLI #Grok
------
@tsingular
Лавры Антропика не дают успокоиться Илону Маску, - xAI выпустил Grok Build с 14 мая в бете для SuperGrok Heavy, а 25 мая открылся для всех подписок SuperGrok и X Premium+.
📋 Что дают:
- Plan Mode: агент составляет пошаговый план, вы утверждаете, комментируете или переписываете шаги до начала выполнения
- Параллельные субагенты: крупные задачи делегируются специализированным воркерам, каждый в своём git worktree
- ACP (Agent Coordination Protocol) из коробки: мультиагентная оркестрация и headless-режим для CI/CD
- Читает AGENTS.md, CLAUDE.md, .grok/ - полная совместимость с экосистемой Claude Code
- Imagine встроен: генерация изображений и видео прямо из CLI
🔧 Как устроено:
Grok Build работает как оркестратор. Plan Mode включает режим «только чтение»: агент исследует кодовую базу, предлагает план действий, вы редактируете шаги и даёте добро. Только после одобрения начинается выполнение.
Субагенты запускаются параллельно в отдельных git worktree, не конфликтуя между собой.
С 20 мая под капотом grok-build-0.1,- модель заточенная под программирование.
💡 Фишка:
Grok Build подхватывает привычки Claude Code: плагины, хуки, навыки, MCP-серверы. Переезд с Claude Code минимален: AGENTS.md работает без изменений. Есть управление с клавиатуры: Ctrl+W для нового worktree, Ctrl+S для резюме, Ctrl+Q для выхода.
Установка:
curl -fsSL https://x.ai/cli/install.sh | bash
grok
Сложно сказать зачем нам ещё один агент-программист по цене в 2 раза дороже Дипсика v4 pro в opencode - но пусть будет :) вдруг где-то лимиты закончатся.
#GrokBuild #xAI #CodingAgent #CLI #Grok
------
@tsingular
👍9✍2🔥2