Технозаметки Малышева
8.36K subscribers
3.75K photos
1.4K videos
40 files
3.93K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 OpenSource Cowork: китайцы перевайбкодили Антропик!

Не прошло и 72х часов с момента анонса, как китайские товарищи перевайбкодили Cowork в оупенсорс!

Cowork еще не успели зарелизить и к тому же он работает только с официальной подпиской Max и без сторонних API.

Китайский разраб austinit с помощью MiniMax 2.1 за полдня (!) воссоздал это в open-source версии!

🔹 Демка один-в-один повторяет Cowork видео: На видео модель MiniMax M2.1 берёт папки с файлами на китайском: docs, код, таблицы и автоматически:
- Сканирует содержимое.
Классифицирует (документы, код, данные).
- Создаёт папки и перемещает файлы.
Всё через инструменты вроде create_directory и move_file.
Наводит идеальный порядок.
И это с любой Anthropic-совместимой API!

MiniMax называет это "моментом OpenCode", - открытый аналог появился меньше чем за сутки.

Проект на GitHub:
https://github.com/DevAgentForge/Claude-Cowork

#Cowork #OSS #Claude #MiniMax #Китай
———
@tsingular
😁19🔥15👍3🍾211
Ну вот и GigaOm, вслед за Gartner, "убил" SOAR 🔫, заменив этот класс решений по автоматизации ИБ на новый, "зонтичный" тип - SecOps Automation. Они уже об этом предупреждали, а теперь выпустили новый отчет про этот новый класс решений: 📝

Автоматизация SecOps – это общая категория, описывающая инструменты, которые используются командами в центрах мониторинга безопасности (SOC) для анализа, расследования и реагирования на угрозы с минимальными вовлечением человека. Это, пожалуй, лучший объект для автоматизации на основе LLM, что проявилось в появлении на рынке десятков новых решений на базе искусственного интеллекта.

Этот отчет является естественным продолжением наших четырех предыдущих исследований по оркестрации, автоматизации и реагированию в области безопасности (SOAR). Он включает в себя большинство возможностей и поставщиков, описанных в предыдущих отчетах SOAR, а также описывает отдельный набор возможностей на базе искусственного интеллекта в разделе "Новые функции". Его цель – предоставить исчерпывающий обзор всех автономных инструментов, которые автоматизируют процессы анализа, расследования и реагирования в центре мониторинга безопасности.

Разница между подходом, похожим на SOAR, и новыми инструментами на базе LLM может быть описана следующим образом:

Детерминированная автоматизация, которая обычно реализуется с помощью рабочих процессов и скриптов с Low Code/No Code или, реже, с помощью роботизированной автоматизации процессов (RPA). Они следуют заранее определенному логическому потоку, который предполагает, что логику описывает оператор-человек.

Недетерминированная автоматизация, которая обычно (возможно, исключительно для данного отчета) реализуется с помощью LLM или DSLM. Стоит отметить, что LLM считаются полностью детерминированными системами авторитетными фигурами в области ИИ. Однако мы просто называем их недетерминированными, учитывая, что модель может давать разные ответы при повторном вводе одного и того же запроса. Поставщики обычно встраивают LLM в агенты ИИ, которые отвечают за отдельные части процессов SecOps.

Практически все поставщики, упомянутые в отчете, так или иначе внедряют автоматизацию на основе LLM. Некоторые из гибридных подходов включают:
– LLM на этапе проектирования, то есть ИИ используется для написания детерминированной автоматизации, такой как скрипты и плейбуки.
– Детерминированные оболочки, в которых LLM являются частью детерминированных рабочих процессов.
– Написание ИИ-агентов, при котором инструмент позволяет клиентам писать свои собственные ИИ-агенты, а не использовать заранее разработанные агенты, предоставляемые поставщиком.

Это наш первый год оценки сферы автоматизации SecOps в контексте наших отчетов «Ключевые критерии» и «Радар».


Как и многие другие отчеты GigaOm, этот, "GigaOm Radar for SecOps Automation v1", тоже достаточно интересен. В нем мало маркетинге и много всяких полезностей и инсайтов для выбора средств автоматизации в SOC 🤔

#средствазащиты #soc #автоматизация
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3211
⚡️ Работа для ML разрабов.

В рамках года единства народов РФ выделяется финансирование на проект по сохранению языков коренных малочисленных народов Севера.

Суть проекта: создать ИИ-агента, который умеет озвучивать на нанайском языке тексты, подаваемые на русском.

Кто-нибудь сталкивался с дообучением нейронок редким языкам?

Пишите в комментах или в ЛС, - поделюсь контактом заказчика, кому интересно и у кого есть опыт!

Пусть будет новый тег #job - буду делиться лидами :)

#job
———
@tsingular
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥15👍72
Forwarded from Neural Kovalskii
Media is too big
VIEW IN TELEGRAM
Cowork-Local-LLM

Вставлю еще 10 копеек своих в эту историю

Решил пару интересных задач
Как запустить на windows
Как перебить на openai-sdk
Как перебить на vllm/ollama
Как запустить на qwen3-30b-a3b-instruct-2507

Точно все будет криво (будем исправлять)

https://github.com/vakovalskii/Cowork-Local-LLM
🔥172🏆2
This media is not supported in your browser
VIEW IN TELEGRAM
Jupiter от компании Zeroth

$90k

Поставки начнутся в апреле 2026

Опять малайзиец на удалёнке, судя по всему.

#роботы #CES2026 #Китай #Jupiter #Zeroth
-----
@tsingular
👍7😁62💯1👾11
This media is not supported in your browser
VIEW IN TELEGRAM
А может малайзиец на удаленке,- не такой уж и страшный вариант.

Пожалуй, хватит на сегодня интернета. 🤣

#роботы #танцы #крипота
------
@tsingular
15👻7👾3
Google Antigravity: Skills для агентов

Google добавил в Антигравити поддержку расширения возможностей агентов через Skills — пакеты инструкций в формате SKILL.md с описанием задач, которые агент может решать.

Каждый навык живёт в папке с обязательным SKILL.md и опциональными скриптами. Агент видит список доступных skills, выбирает подходящие по описанию и следует инструкциям.

Два уровня размещения:
- workspace-root/.agent/skills/ — для проектных workflow
- ~/.gemini/antigravity/skills/ — глобальные навыки

Выбор навыка происходит автоматически на основе LLM-рассуждений без алгоритмической фильтрации.

Есть, правда, риск по части кибербеза: инъекции через SKILL.md тривиальны, изоляция скриптов не предусмотрена. Каждая строка Skills интерпретируется как инструкция без проверки, что делает систему "fundamentally insecure".

Insecure by design, получается.

Agentic Skills прям тема года. Во-первых срочно изучать, кто еще не начал.
Во-вторых надо их сканировать на закладки с LLM.
И минимизировать права агентов.
Загонять в песочницы.

#Antigravity #Skills #cybersecurity
------
@tsingular
4👍42
OpenAI и Cerebras: 750 мегаватт на инференс

OpenAI подписал многолетний контракт с Cerebras на развертывание систем для инференса суммарной мощностью 750 мегаватт.
Поэтапный запуск начнется в 2026 году.

Cerebras обещает скорость до 15× быстрее GPU для голосовых чатов и кодовых агентов.
Для примера,- Llama 3.1 70B выдает 450 токенов/сек против 20-50 на H100.

750 МВт — это примерно 30 тысяч систем по 25 кВт каждая.
Одна CS-3 стоит $2-3 млн, полная инфраструктура потянет на десятки миллиардов.

Сверхбыстрый инференс штука полезная. Нас ждут мгновенные (100-150мс) голосовые ответы и кодовые агенты, способные подумать в 15 раз детальнее над ответом.
Т.е. можно повысить качество разработки даже без новых моделей, тупо прогнав больше гипотез или проверок за то же время.

#Cerebras #OpenAI
------
@tsingular
🔥4👍31
depthfirst: $40M на защиту от ИИ-атак

Стартап depthfirst (основан в октябре 2024) привлёк $40 млн серии А от Accel Partners.

Платформа General Security Intelligence сканирует код, отслеживает утечки учёток и проверяет зависимости.
Фишка — верификация найденных credentials (тестирует, активны ли они), а не просто поиск по паттернам.

Результаты:
- 85% меньше ложных срабатываний
- 8× больше реальных угроз
- 8/10 разрабов принимают предложенные фиксы

Команда: CEO из Databricks/Amazon, CTO — экс-Google DeepMind, сооснователь — директор по безопасности Square.

Клиенты: AngelList, Lovable, Moveworks.

#depthfirst #cybersecurity #Anthropic
———
@tsingular
🔥51👍1
Personal Intelligence: "товарищ майор" от Gemini

Всем кто боялся, что товарищ майор читает переписку в Max, - на заметку

Google запустила Personal Intelligence для Gemini - систему, которая сканирует Gmail, Photos, YouTube и Search для персонализированных ответов ( верим :) ).

По умолчанию выключена, доступна только платным подписчикам AI Pro и Ultra.

Обработка происходит в защищённых облачных контейнерах на базе Titanium Intelligence Enclaves - данные шифруются и удаляются после запроса.

Google обещает не тренировать модели на содержимом почты или фотографий, только на промптах и ответах с фильтрацией личных данных.

Облачных сервисов не существует, - есть чьи-то чужие компьютеры, которые обрабатывают ваши данные :)

#Gemini #PersonalIntelligence #cybersecurity
———
@tsingular
7🔥6💯4👍21😁1
🤖 Cursor провели кодовый марафон среди AI-агентов на недели и получили миллионы строк кода среднего качества

Cursor провёл эксперимент: можно ли масштабировать длительное автономное программирование, просто добавляя больше агентов? Оказалось — да, но с оговорками.

Что удалось навайбкодить в ходе эксперимента:
- Веб-браузер с нуля — 1М+ строк кода за ~неделю
- Миграция Cursor с Solid на React, - агенты работали 3 недели, +266K строк добавлено, удалено 193K.
- Эмулятор Windows 7 — 14.6K коммитов, 1.2М строк (в процессе)
- Клон Excel — 12K коммитов, 1.6М строк (в процессе)

Плоская структура с равнозначными агентами провалилась, - 20 агентов работали как 2-3, остальные ждали разблокировки очереди.

Без иерархии агенты избегали сложных задач и делали только безопасные мелкие правки.
Когда у общества нет цветовой дифференциации штанов, то нет цели! А когда нет цели — нет будущего!


Решение — разделение ролей:
- Планировщики — исследуют код, создают задачи, могут порождать суб-планировщиков
- Воркеры, - пилят свою задачу до конца, потом пушат в репу
- Судьи, - решают, продолжать или повторять цикл

Главный инсайт по моделям:
Codex
отменяем. GPT-5.2 оказался значительно лучше для длительной автономной работы,- лучше держит фокус, точнее следует инструкциям, не дрейфует.
Opus 4.5 склонен останавливаться раньше и срезать углы, быстро возвращая управление человеку.

Интересно, что GPT-5.2 оказался лучшим планировщиком, чем GPT-5.1-codex, хотя последний специально обучен написанию кода.

Вайб-косяки:
На Hacker News заметили — браузер не компилируется у внешних пользователей, CI не проходит.
PR миграции Solid→React назвали «невозможным для ревью». Код описывают как «крайне хрупкий».

Ключевые выводы Cursor:
- Промпты важнее архитектуры и выбора модели
- Упрощение системы часто давало лучшие результаты
- Периодические «свежие старты» обязательны чтобы не сваливаться в дрейф
- Под разные роли лучше использовать разные модели

#Cursor #агенты #GPT #Opus #AgenticCoding
———
@tsingular
👍521🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Opencode теперь можно привязать к GitHub

Если есть платная подписка на Github, то к ней теперь можно прикрутить любые модели и агентов через OC.

#opencode #github #dev
------
@tsingular
🔥6211
Microsoft обновил бесплатный курс по агентам

на русском языке

курс охватывает базу, шаблоны, RAG, вывод в продакшен, масштабирование и системы защиты.

#Microsoft #агенты #обучение
———
@tsingular
13❤‍🔥111🔥1👨‍💻1
Claude Cowork сливает файлы через собственное API

Мы не договорили про Cowork :)

Тут выяснилось, что еще незарелизиный Claude Cowork полностью "совместим" со старой уязвимостью из Claude.

Работает так (приведено чисто в информационных целях. не использовать ни где!):
- Жертва подключает локальную папку с конфиденциальными документами
- Загружает файл со скрытой инъекцией (например, .docx с белым текстом на белом фоне, кегль 1)
- Просит проанализировать файлы через этот «навык»
- Инъекция заставляет Claude выполнить curl к Anthropic Files API с ключом атакующего
- Файлы утекают на чужой аккount без запроса подтверждения

VM блокирует почти все домены, но api.anthropic.com в белом списке.
Проблема известна с октября 2025, но не исправлена.

Anthropic предупреждает: «следите за подозрительными действиями».
Но обычный пользователь вряд ли заметит curl в развёрнутом блоке команд.

При этом Cowork умеет работать с браузером, MCP-серверами и т.д. :)

Держите Агентов в изоляции, в общем. Отрубайте им интернет, ну или контролируйте каждый вызов.

#Claude #Cowork #PromptInjection #cybersecurity
———
@tsingular
👍521
TranslateGemma: открытые модели перевода на 55 языков

Google выпустил TranslateGemma — семейство открытых моделей перевода на базе Gemma 3 в трёх размерах: 4B, 12B и 27B параметров.

Главная фишка — эффективность через дистилляцию знаний Gemini: модель на 12B превосходит базовую Gemma 3 27B по метрике MetricX на бенчмарке WMT24++. Вдвое меньше параметров, но качество выше.

Двухэтапное обучение: сначала файнтюн на параллельных данных (микс человеческих переводов и синтетики от Gemini), затем reinforcement learning с наградными моделями MetricX-QE и AutoMQM.

Официально протестировано на 55 языках, дообучено почти на 500 языковых пар. Сохранились мультимодальные способности — переводит текст на изображениях без специального файнтюна.

#TranslateGemma #Gemma3 #Google
———
@tsingular
4👍31
Поздравляю, вы прошли краткий курс современного вайбкодинга

#ClaudeCode #dev
------
@tsingular
🔥211