все начинается с хорошо проработанной документации и файлов для контекста агента.
если все описано - то сайт профессионального уровня можно реализовать буквально за 30-40 минут. По мимо этого на основе PRD документации можно реализовать документацию по Маркетингу GTM-манифест cо стратегией продвижения и реализации проекта.
Грандиозная идея в том чтобы начать переливать часть аудитории из одного проекта в другой и сейчас ориентир на B2B и seo-контент.
если все описано - то сайт профессионального уровня можно реализовать буквально за 30-40 минут. По мимо этого на основе PRD документации можно реализовать документацию по Маркетингу GTM-манифест cо стратегией продвижения и реализации проекта.
Грандиозная идея в том чтобы начать переливать часть аудитории из одного проекта в другой и сейчас ориентир на B2B и seo-контент.
В режиме план-мода генерируется Roadmap.md с декомпозицией задач и статусмом их выполнения.
Почему я переношу всё на единый стек
Да, можно продолжать жонглировать зоопарком технологий. Прикрутить плагины. Написать костыли. Как-то это всё склеить изолентой и надеяться, что не развалится.
Но я хочу другого.
Хочу сказать боту: «Обнови дизайн» — и он обновит. Без танцев с бубном, без «подождите, сейчас найду того фрилансера, который это делал в 2019-м».
Хочу, чтобы SEO-статьи генерились в моём стиле — том самом, повествовательном, который цепляет. Не сухие простыни ключевиков, а тексты, которые хочется читать.
Но главное — цифры.
Сейчас 50-60% расходов уходит на серверную инфраструктуру и сервисы. После миграции на единый стандарт — 5%. Не опечатка. Пять процентов.
И да, технически я могу вообще выпилить сторонние виджеты, реализовать всё своими руками и кратно увеличить маржу. Но это будет красиво на бумаге и больно для клиентов — заставлять их переезжать, перенастраивать, терять историю.
Так что план другой: не ломать то, что работает, а предложить существующей аудитории новые SaaS-сервисы. Дополнительная ценность вместо принудительной миграции.
Вот это такой кейс внедрения AI в мои проекты, в стиле солопринерства.
Да, можно продолжать жонглировать зоопарком технологий. Прикрутить плагины. Написать костыли. Как-то это всё склеить изолентой и надеяться, что не развалится.
Но я хочу другого.
Хочу сказать боту: «Обнови дизайн» — и он обновит. Без танцев с бубном, без «подождите, сейчас найду того фрилансера, который это делал в 2019-м».
Хочу, чтобы SEO-статьи генерились в моём стиле — том самом, повествовательном, который цепляет. Не сухие простыни ключевиков, а тексты, которые хочется читать.
Но главное — цифры.
Сейчас 50-60% расходов уходит на серверную инфраструктуру и сервисы. После миграции на единый стандарт — 5%. Не опечатка. Пять процентов.
И да, технически я могу вообще выпилить сторонние виджеты, реализовать всё своими руками и кратно увеличить маржу. Но это будет красиво на бумаге и больно для клиентов — заставлять их переезжать, перенастраивать, терять историю.
Так что план другой: не ломать то, что работает, а предложить существующей аудитории новые SaaS-сервисы. Дополнительная ценность вместо принудительной миграции.
Вот это такой кейс внедрения AI в мои проекты, в стиле солопринерства.
пол часа спустя тестовый запуск - и оно работает.... Но вот дизайн как будто не соответствует бренду....
И так Дизайн в стиле: MS-DOS/Cyberpunk 10 минут и готово.... Остается совсем немного доработать интеграцию с админкой сервиса, чтобы тянуть данные и вытаскивать информацию о клиентах — Наверное в CRM которую нужно в админке реализовать...
Но ближайшая задача делой и настройка Dev и Prod через Coolify - и я смогу съехать с сервака на котором текущий сайт....
Но ближайшая задача делой и настройка Dev и Prod через Coolify - и я смогу съехать с сервака на котором текущий сайт....
Специалисты Pillar Security обнаружили уязвимости в популярной платформе автоматизации n8n, позволяющие злоумышленникам обойти механизмы защиты и перехватить полное управление сервером. CVE-2026-25049 дает аутентифицированным пользователям возможность выполнять произвольный код через манипуляции с JavaScript-выражениями в рабочих процессах. Исследователи Pillar Security и Endor Labs независимо друг от друга обошли защиту платформы. В частности, команда Pillar применила сложные векторы эксплуатации с использованием стрелочных функций и метода Object.defineProperty для побега из песочницы.
Эксплуатация уязвимости открывает доступ к файловой системе, внутренним сетям и ключу N8N_ENCRYPTION_KEY для расшифровки всех сохраненных учетных данных. Злоумышленники могут похитить критически важную информацию, включая API-ключи OpenAI и Anthropic, пароли баз данных и OAuth-токены, интегрированные в корпоративные ИИ-решения. Получение контроля позволяет преступникам перехватывать управление ИИ-агентами для кражи промптов, модификации ответов моделей или незаметного перенаправления трафика на подконтрольные серверы.
Разработчики настоятельно рекомендуют незамедлительно
👆Исследователи Pillar Security в своем отчете отмечают, что «атака не требует ничего особенного», и подчеркивают: «Если вы можете создать рабочий процесс, вы можете завладеть сервером».
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Суть эксперимента:
В ходе исследования 25 конфигураций (связка «ИИ-модель + Агент») выполняли эксплуатацию уязвимостей в рамках 257 практических кейсов. Тестирование проходило в изолированных 🐳Docker-контейнерах при полном отсутствии доступа к интернету, внешним репозиториям и базам знаний CVE. Оценка эффективности проводилась детерминированным методом (программная верификация полученных флагов и графов вызовов), что полностью исключает субъективность, свойственную подходу «LLM-as-a-judge».
🏆 Лидеры рейтинга (Overall Success Rate):
👎Аутсайдеры:
Please open Telegram to view this post
VIEW IN TELEGRAM
wiz.io
Cyber Model Arena | Wiz
Evaluating AI agents across real-world security challenges
Forwarded from Осцилляции WaveCut (WaveCut)
Это было неизбежно: рано или поздно должны были появиться специализированные решения для инференса.
И вот, Taalas (бывшая команда из Tenstorrent) выкатили то, чего я так ждал — настоящий Direct-to-Silicon.
Ребята не стали мелочиться и буквально «запекли» модель в кремний. Никакой внешней памяти, никакого HBM, никакой сложной упаковки. Веса модели и архитектура — это и есть сам чип.
Цифры выглядят дико: 17,000 токенов в секунду на Llama 3.1 8B.
Это на порядок быстрее текущей SOTA GPU, при этом чип стоит в 20 раз дешевле в производстве и потребляет в 10 раз меньше энергии.
Самое крутое, что это не просто красивые слайды для инвесторов. Железо уже существует, и его можно «потрогать» (ссылка на демо внизу).
Upd: не все это волшебство и такая скорость достигается не без компромиссов — запеченные веса урезаны в от 3 до 6 бит точности, а контекст в демо ограничен тысячей токенов на вход и столько же на вывод.
Конечно, это ASIC, и тут есть нюанс: чип заточен под одну конкретную модель. Но Taalas продумали этот момент — они оставили поддержку LoRA-адаптеров и изменяемого контекстного окна. То есть это не совсем уж «кирпич», гибкость для файн-тюнинга остается.
Сейчас у них готов чип с Llama 8B (HC1). Весной обещают выкатить что-то среднеразмерное с ризонингом, а к зиме грозятся показать фронтир-модель на втором поколении кремния.
У меня голова идет кругом от мыслей к чему это может привести.
Ссылки:
• Анонс
• Демо (скорость реально впечатляет)
И вот, Taalas (бывшая команда из Tenstorrent) выкатили то, чего я так ждал — настоящий Direct-to-Silicon.
Ребята не стали мелочиться и буквально «запекли» модель в кремний. Никакой внешней памяти, никакого HBM, никакой сложной упаковки. Веса модели и архитектура — это и есть сам чип.
Цифры выглядят дико: 17,000 токенов в секунду на Llama 3.1 8B.
Это на порядок быстрее текущей SOTA GPU, при этом чип стоит в 20 раз дешевле в производстве и потребляет в 10 раз меньше энергии.
Самое крутое, что это не просто красивые слайды для инвесторов. Железо уже существует, и его можно «потрогать» (ссылка на демо внизу).
Upd: не все это волшебство и такая скорость достигается не без компромиссов — запеченные веса урезаны в от 3 до 6 бит точности, а контекст в демо ограничен тысячей токенов на вход и столько же на вывод.
Конечно, это ASIC, и тут есть нюанс: чип заточен под одну конкретную модель. Но Taalas продумали этот момент — они оставили поддержку LoRA-адаптеров и изменяемого контекстного окна. То есть это не совсем уж «кирпич», гибкость для файн-тюнинга остается.
Сейчас у них готов чип с Llama 8B (HC1). Весной обещают выкатить что-то среднеразмерное с ризонингом, а к зиме грозятся показать фронтир-модель на втором поколении кремния.
У меня голова идет кругом от мыслей к чему это может привести.
Ссылки:
• Анонс
• Демо (скорость реально впечатляет)
🔥1
Forwarded from Венчур по Понятиям | Street MBA
3 дня ИИ команды и ИИ доказал меритократию
Больше всего жрет токенов написание текстов
На втором месте - инженер
Меньше всего - СЕО
Потому что он не работает, а всего лишь команды раздает 😂
В Мире ИИ СЕО - самый дешевый сотрудник.
В живом мире - наоборот.
Больше всего жрет токенов написание текстов
На втором месте - инженер
Меньше всего - СЕО
Потому что он не работает, а всего лишь команды раздает 😂
В Мире ИИ СЕО - самый дешевый сотрудник.
В живом мире - наоборот.