DEKSDEN notes
2.68K subscribers
416 photos
8 videos
1 file
531 links
Мои заметки на разные темы, уровень - "для продолжающих")
Vibe Coding -> AI SWE, AI Coding Tools, Agents: Claude Code, Codex, news, links
Чат (!!!): https://t.me/+B1fB3sZbaVthMDhi

(с) 2025-2026, @deksden
Download Telegram
⚪️ Топ Кодер за свои деньги!


Тут 5.6 не вышла, зато вышел Xiaomi Mimo Code 0.1.0. Штука основана на openCode, идет в комплекте с моделями Сяоми - временно бесплатно Mimo Auto на Mimi v2.5 (не Про!). Есть русская локализация, что конечно странно выглядит - меняется /lang

Что можно отметить? Блог весьма концептуально подает дизайн агента.

▶️ Они сделали управление компьютом при работе агента: встроенный мультисемплинг (режим Max) - включает создание 5 независимых сэмплов решения на каждый ход, причем, модель создает только цепочку размышлений и план вызова тулов, не реализуя саму эту схему. Далее модель выбирает из 5 решений лучшее, и его делает. То есть буквально релизуется поговорка "7 (тут - 5 по дефолту) раз отмерь, один - отрежь!".

▶️ Сразу сделали режим Goal чтобы на самом деле доделывать задачу.

▶️ Предложили заменить JSON вызов тулов на форму CLI вызова как для bash - считают что так лучше. Правда, убедиться что это так пока нельзя, так как они это только придумали, но не сделали. Мысль, в целом, интересная и в меру оригинальная.

▶️ Уперли Dynamic Workflows один в один: и даже js функции названы идентично. Только вот workflow() позволяет большую глубину вложенных вызовов.

▶️ Unlimited Context: агентный цикл состоит из основного агента (работает как обычно) и writer агента, который постоянно пишет состояние сессии на диск. Как только заполняется контекст, основной агент сбрасывает контекст и восстанавливает его по записям от writer. Они назвали это циклом (cycle). Говорят, что не делают handoff при приблежении к полному заполнению контекста, потому что способности модели с ростом контекста деградируют, и полный контекст модель обрабатывает сильно хуже чем неполный. Логично. Чекпоинты с сохранением состояния они делают на 20%, 45% и 70% контекста.

👉 Также они вывели, что основной агент хуже ведет лог работы, чем специализированный - потому что лог его отвлекает. Тоже логично. Чекпоин состоит из 11 пунктов (типичный handoff файл, который во мнгих флоу присутствует). checkpoint.md называется этот уровень памяти - сессионный лог.

👉 Проектная память - в memory.md: архитектура, правила, тех факты. Writer поднимает в этот слой факты, когда они присутствуют в нескольких чекпоинтах как стабилизированные решения.

👉 Глобальная память: на уровне профиля пользователя - применяется ко всем проектам.

👉 История: база данных всех сессий (полный трейс, сообщения и тулколы), с индексированием. Агент может обратиться к этой памяти, если данных нет в других слоях памяти.


👉 Памятью заниается только writer агент, у основного агента доступ read only. Но у основного агента есть notes.md файл - это записная книжка для агента (scratchpad), в которую он может записывать что-то, что ему кажется важным. На каждом чекпоинте writer агент анализирует содержимое этого файла, и, при необходимости, поднимает содержимое по уровням памяти, очищая записную книжку.

👉 Ребилд контекста при новом цикле: список todo - чекпоинт - последние сообщения пользователя (без сжатия, чтобы не утерять/не исказить намерения и задачи пользователя) - memory.md - global memory - notes -

▶️ Само-развивающаяся система: предыдущий раздел - это работа агента на уровне агентного хода / сессии.

Агент ведет память проекта в виде md файлов. Логика - в возможности пользователя смотреть чего там агент упомнил про проект. Система ведет полнотекстовый индекс для ускорения чтения этих файлов.

Dream: каждый 7 дней обслуживается файл памяти - специальный агент читает сессии, фай памяти, верифицирует пути, выполняет дедупликацию, мержи, поднимает знания в глбальную память.

Distill: каждые 30 дней специальный агент аткже читает все сессии, но "достает" оттуда не знания, а процессы - и обновляет скиллы, CLI команды, кастомных агентов, и прочие такие штуки.

... окончание там: https://t.me/deksden_notes/858

@deksden_notes
1👍13🔥92
⚪️ Топ Кодер за свои деньги! (окончание)

... (начало тут: https://t.me/deksden_notes/857)


▶️ Compose: это встроенный флоу в упряжку, портированный из superpowers. Когда агент использует скиллы для работы по этапам флоу - брейнсторм, план, реализация, merge, и тп (в справке есть список команд, но тут надо скорее superpowers изучать). Использует неймспейс compose: для вызова скиллов, который рабоатет только в режиме compose.

На моей памяти - первая упряжка со встроенным флоу.

▶️ Эвалы: говорят что на бенчах упряжка mimo code уделывает СС на аналогичных моделях. А Mimo Pro уделывает Sonnet 4.6. Ну, - говорят, да.

Совместимо с Claude, умеет импортировать все что только можно с СС - скиллы, память.

🔗 Оффсайт : https://mimo.xiaomi.com/coder
🔗 Интересный бложик : https://mimo.xiaomi.com/blog/mimo-code-long-horizon
🔗 Репо: https://github.com/XiaomiMiMo/MiMo-Code

В общем, интересное весьма оказалось, внезапно

(ц) топ за свои деньги оказался - весьма!

@deksden_notes
🔥8👍61
Forwarded from Evgeniy Rasyuk
Рекомендую новый OpenSource для кодегенирации - базу знаний для агентов на графах и векторах
(это порт GitNexus и с добавлением поддержки кодовых баз от 10 тыс файлов )

Немного мотивации 👻😢

ИИ-агент без графа кода — это джун с бензопилой: быстро, уверенно, иногда даже красиво, но всё равно страшно. 👻

grep найдёт строку. Но он не скажет, кто вызывает эту функцию, какие тесты надо запускать и что агент сейчас может сломать. Проблема ведь не в том, что агент ошибается. Проблема в том, что он часто ошибается очень убедительно.😡

OntoIndex — это не ещё один поиск по коду. Это карта местности и стоп-кран перед тем, как агент унесёт пол-репозитория в красивом диффе.😃

Хочешь, чтобы ИИ реально менял код? Тогда сначала дай ему локальный граф проекта , a не не фонарик и самоуверенность😇

#opensource
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🤔5🔥31🕊1
⚪️ Управляемые ресеты Codex и рефералки


Я уже писал про рефералки с ресетами - https://t.me/deksden_notes/851

Теперь их выкатили публично для всех. У меня тоже завелось! Как работает. Шлёте инвайт на почту (видимо, ту, на которую openai аккаунт) - если друг отправляет первое сообщение в кодексе, ВАМ и ЕМУ дают по ресету.

Ресеты сохраняются на 30 дней, и их можно использовать в любое время пока они живые. Обещано по одному ресету на аккаунт, как я понял, для пробы. Мне пока ничего не пришло.

▶️ Правила инвайтов:
• дают 3 инвайта на промо-период (ближайшие 2 недели);
• самому себе отправить инвайт нельзя (RLY? А на другой акк)));
• приглашаемый не должен был использовать кодекс в ПОСЛЕДНИЕ 2 месяца (значит, расчехляем старые аккаунты)
• у приглашаемого не должно быть уже активированной рефералки (то есть у каждог приглашаемого - только один приглашающий, слать по 3 приглашения не надо)


👉 Как то так!

Напишите кому добавят пробный ресет. Может, его в codex app искать надо. Непонятно пока

——

Upd 1️⃣ : ресеты у меня видны только в Codex.app, в разделе (внезапно!) usage. Скрин в комментах. В web упорно искал и не нашел, может не по глазам, но подозреваю что это еще один сравнительно честный способ продвинуть codex.app.

Поэтому если вы используете CPA - нужен прямой логин. Все умеют сделать и так, и так на компе? Или написать обзор?



@deksden_notes
🔥5👍32
⚪️ OpenAI Platform добавили Search and Command Bar


Маленькое, но действительно удобное QoL улучшение - теперь в строке поиска на платформе доступны и быстрые действия

Вызывается Cmd+K с сайта (если у вас с кодексом не конфликтует шорткат

Поиск умеет искать:
→ Pages
→ Settings
→ Quick Actions
→ Resources
→ Developer Docs

Удобно, да

@deksden_notes
❤‍🔥4🔥2👍1
⚪️ Релиз Kimi-2.7-Code


Специализированные каналы может про детали напишут, но я не мог пройти мимо релиза.

Отмечу несколько моментов:

• модель по прежнему в районе 1T и на кофеварках не завеется
• это кодинговая модель, редкость в наше время выпуска универсальных моделей; бенчи от вендора показывают что она заметно выше 2.6, чуть хуже Опуса 4.8 (достойный уровень);
• скоро обещана Turbo модель с х6 скоростью, хотя кими и так не особо задумчива
• 2.7 экономит токены - что даст чуть более щедрые практические лимиты

Почитать:

🔗 Анонс: https://x.com/Kimi_Moonshot/status/2065377579130142937

🔗 Бэта программа с первью новых фич: https://kimi.com/code/beta

Опенсорс развивается!

(ц) Крута

@deksden_notes
🔥29👍74🤝1
⚪️ GLM 5.2 релиз


На фоне обсуждения новости о блокировке Фубли (американское правительство по соображениям безопасности приказало антропикам не предоставлять доступ к последнй модели иностранным гражданам, а антропик не имеет возможности фильтра по гражданству, пока, - и отрубило доступ всем) - новый релиз выглядит интересным.

Блога про 5.2 с бенчмарками пока нету, буду дополнять пост как появится.

Из интересного: появился контекст на 1m токенов. Уровень размышлений - или high, или max.

🔗 Как правильно апгрейдить в СС на 5.2: https://docs.z.ai/devpack/latest-model

——

Upd 1️⃣ : Наконец то опубликован блог с бенчами про глм 5.2. Отличный и подробный блог. Бенчи, как водятся, достойные

В чат модель тоже добавлена.

🔗 Блог : https://z.ai/blog/glm-5.2
🔗 Анонс: https://x.com/Zai_org/status/2066938937344495629

(ц) в интересное время живём!
🔥18👍11
⚪️ Кешбек токенами


Интересную новость прочитал, не мог не поделиться:

🔗 Новость: https://t.me/ai_machinelearning_big_data/10317

В Китае вводят кешбек токенами Кими. Причем, госбанк, что немного необычно - это же вроде консервативные организации.

Вижу несколько выводов:
• ИИ становится частью "большой" экономики
• ИИ довольно близко к государству, раз госбанки в теме, и явно носит стратегический характер

В общем, к сожалению, времена "дикого" развития ИИ, похоже, подходят к концу. Ждем ИИ "по госуслугам", и прочие фокусы регулирования - с некоторой печалью.

(ц) хроники интересного времени
6😢6🔥3
⚪️ OpenRouter Fusion


Интересную штуку сделали OpenRouter - Fusion называется. Работает так: есть "модель" openrouter/fusion который выглядит как обычная модель. Внутри вы настраиваете основную модель, которая генерирует итоговый ответ, а также "панель моделей". Рутер именно такой термин использует, а по мне он весьма смешной, "модели на панели". Но альтернативы которые я слышал - это "ансамбль" моделей (весьма отдает фрактальным промптингом), ну или "совет" моделей. Хорошего русского прижившегося термина нету. Пусть будет "панель".

В панель вы можете включить несколько моделей, по умолчагнию - три штуки, максимум - 8. Они получают задание от вашей главной модели через вызов тула openrouter:fusion, можно сделать вызов обязательным.

Тул openrouter:fusion исполняется так: fan out агентный запрос, параллельно каждая модель из панели выполняет запрос, ей выданы инструменты openrouter:web_search , openrouter:web_fetch, дан бюджет на количество ходов и вызовов тулов, установлен ризонинг и температура. Рекурсию делать нельзя.

потом делаем fan in на модель-судью. Судья НЕ ПРОСТО делает синтез ответа - он возвращает структурированный ответ: в чем модели согласились, где были спорные моменты, инсайты из ответов каждой модели и слепые зоны, которрые остались не покрыты никем. Также возвращаются полны еиндивидуальные ответы. Я бы сказал, что это ответ не судьи, а структурированный отчет.


🔗 Попробовать плейграунд: https://openrouter.ai/fusion
🔗 Почитать про fusion "модель": https://openrouter.ai/docs/guides/routing/routers/fusion-router
🔗 Серверный тул fusion : https://openrouter.ai/docs/guides/features/server-tools/fusion

Итак, опенроутер изобрел мульти-модель. Т акими темпами они еще и до мульти-семплинга дойдут, и до фокусной аспектной проработки. Но - не все сразу, да?)

Результаты: на мой взгляд, охренительно. Gemini 3 Flash + Kimi K2.6 + DeepSeek V4 Pro (fusion) дают результаты чуть хуже Falbe 5 solo (замеры на DRACO deep research benchmark by Perplexity) - график на картинке КДПВ.

🔗 Про бенчмарк: https://arxiv.org/abs/2602.11685

Ценник очевиден: 1 модель синтезирует ответ, 3 модели дают ответы в панели, 1 модель судит. Итого х5 цены! но при текущей разнице фронтира и китов - панель китов на 50% дешевле фубли выходила.

Мне понравилась идея прятать систему за модулью через роутер. Задумался))

(ц) оч интересно

@deksden_notes
1🔥25👍104
Forwarded from ABI
Обновление bash-скрипта для кастомизации статус-бара в Antigravity CLI. 🚀
Интерфейс там консольный (TUI), поэтому раскрасить вывод ANSI-кодами не вышло, зато получилось аккуратно вытащить через jq всю самую важную стату из JSON-плейлоада:
🤖 Текущую модель и тир подписки
🔄 Статус агента (idle, etc.)
📉 Детальный расход токенов (Контекст ↓ / Вывод ↑)
📊 Процент использования контекстного окна
Теперь перед глазами всегда понятно, сколько контекста сожрала сессия и сколько еще осталось, всё в одну компактную строку. Видно все модели и лимиты 5h/1w.

Закинул исходник в Gist, кому актуально для работы с LLM — забирайте:

https://gist.github.com/ABIvan-Tech/1c979e29a378a67b88a313dfaee18464


#opensource
👍14🔥2
THEGOD SHOP

thegod shop - магазин по продаже подписок на нейросети по самым дешевым ценам!

🌟🌟🌟🌟🌟🌟🌟🌟🌟🌟🌟
Gemini Pro 18m. - от 99р.

⭐️ Kiro Pro+ (12k cred.) - от 500р.

🤖 Super Grok - от 200р.

💬 Chat GPT Plus - от 240р.

🌟🌟🌟🌟🌟🌟🌟🌟🌟🌟🌟

🟢Автоматическая выдача товара после оплаты
🟢Ассортимент в боте постоянно пополняется
🟢 На каждый товар имеется определенная гарантия


зачем переплачивать когда можно взять тут за копейки?

➡️ @bothegreategod_bot

🎵 Наш канал
Please open Telegram to view this post
VIEW IN TELEGRAM
👍64👀4
Media is too big
VIEW IN TELEGRAM
⚪️ Kimi Code 2.7 ⚡️HIGHSPEED⚡️


Релиз анонсирвоанной при запуске фичи - х6 скорость. На практике получается от 150 до 260 tps в зависимости от сложности / размера задачи

Доступ раскатывают участникам Kimi Beta Program, в API, и для Kimi Business. Для обычного Kimi Code Plan пока нету - записывайтесь в Beta программу.

200 tps - это, конечно, другой опыт.

Ценники на апи - в табличке в комментах ⬇️ (х2)

@deksden_notes
🔥19👍331
⚪️ Xiaomi MiMo UltraSpeed


Тут вторая новость про высокоскоростную генерацию - вот Сяоми предлагает бэту своего высокоскоростного решения. Анонсировано 1000 tps - это прям оч быстро.

интересная тенденция!

🔗 Записть тут : https://platform.xiaomimimo.com/ultraspeed

🔗 Промик живет тут в карусели, первый слайд: https://mimo.mi.com/docs/en-US/quick-start/summary/welcome


@deksden_notes
👍4
⚪️ Расценки для Claude -p / Agents SDK


Мы все помним как в мае антропики всех "обрадовали" что с 15 июня програмное использование их агента - Claude -p или Agents SDK (который поверх claude -p) будет расцениваться по апи ценам с баланса счета over usage.

Это автоматически убивает все продукты, построенные сверху SDK.

15 июня, на секундочку, настало ВЧЕРА. ТАК ВОТ! "Фраер сдал назад"!

Антропики ТИХО разослали клиентам рассылочку, что передумали, и использврание claude -p / Agents SDK по-прежнему будет идти с подписки.

Если вы клиент - посомтрите почту!

Хорошая новость, так то! Но то, что она так "тихо" анаонсирована - вызывает какие то смутные подозрения про будущее.

(ц) Посмотрим

@deksden_notes
👏9🔥4
Forwarded from A M
если интересно, то можно расшарить пост -

Провел небольшой A/B-тест моделей Spark, mini и 5.5-medium на реальной задаче обогащения базы своего теннисного сайта. 

Зачем: у нас большой объем data scraping и обработки фактов, и хотелось понять, можно ли снизить расход токенов за счет дешевых subagents без потери качества.   Как известно, у Spark отдельные лимиты и в теории выглядит очень привлекательно использовать его для простых data scraping задач.
Задача была такая: извлечь source-backed данные с официальных страниц академий: контакты, цены, лагеря/программы, затем сохранить raw JSONL для строгой проверки перед добавлением в базу.
Итог: Spark не подходит как дефолтный worker для такого workflow.
Почему:
Хрупкий в длинных тредах
Spark один раз упал на скрытом ограничении контекста/инструментов, и его пришлось перезапускать с fork_context=false. Для автономных batch-задач это риск.
Слабая дисциплина схемы
Все модели немного отклонялись от заданного формата, но Spark чаще уходил от нужной vocabulary для type/status. Его выход нельзя считать готовым к выдаче в базу.
Плохо подходит для broad discovery
Spark нормален, если есть точный URL и очень маленькая задача: например, “достань email и телефон с этой страницы”. Но он слабее, когда надо ходить по ссылкам, отличать официальный сайт от third-party, разбирать неоднозначные цены или отделять настоящие academy facts от общей информации о клубе/кортах.
Экономия токенов может исчезнуть на QA
Если main agent потом тратит много времени на исправление слабого extraction, отклонение vague facts и починку malformed JSONL, выгода от дешевой модели быстро уменьшается.
Текущий routing после теста:
Spark — только для очень маленьких exact-URL, text-only задач или bounded QA. Короткий prompt, fork_context=false.
5.5-mini — дефолтный worker для обычных небольших batch-задач, если official URLs уже известны.
5.5 medium — для сложных случаев: non-English pages, PDFs, несколько связанных официальных страниц, booking/form gates, contact repair, ambiguity.
Главный вывод: дешевые subagents должны генерировать только raw candidates. Main agent все равно делает строгую нормализацию, duplicate checks, helper dry-run и только потом promotion.

То есть Spark не бесполезен, но как general scraping/research agent он ОЧЕНЬ слабый. Это узкий инструмент для простого extraction, а не надежный enrichment worker.
👍10
Forwarded from A M
В нашем тесте mini выглядит заметно эффективнее 5.5-medium для типовых extraction-задач, но не как полная замена.
Практический вывод:
mini лучше по cost/performance, когда:
известен официальный URL;
задача простая: контакты, email, phone, social, базовые pricing/program facts;
страницы на английском или простые по структуре;
не нужно много reasoning.

5.5-medium лучше, когда:
сайт неочевидный или надо искать новый официальный URL;
есть PDF, booking portal, формы, логин-гейты;
страница не на английском;
надо отличить реальную академию от клуба/кортов/мерча;
mini вернул мало, расплылся или дал сомнительные факты.

По качеству:
mini дал достаточно хорошие raw candidates, которые main agent мог проверить и нормализовать. Он намного надежнее Spark и обычно дешевле/быстрее, чем medium.
По риску:
mini все еще нельзя пускать напрямую в базу. Он может:
принять court booking price за program pricing;
не заметить, что цена устарела;
не отличить camp от generic junior page;
дать слабый status/type.
Итоговая оценка:
mini должен быть default worker для 70-80% обычного enrichment batch, а 5.5-medium надо держать как escalation model для сложных/ambiguous случаев. Это, вероятно, лучший баланс между ценой, скоростью и качеством.
Forwarded from A M
Продолжение после реального A/B-теста 5.5-low vs 5.5-medium.

Прогнали обе модели на одинаковом sample из 8 академий, без promotion в базу. Цель была не “кто написал больше строк”, а кто дает больше реально полезных source-backed candidates при меньшей нагрузке на QA.

Короткий итог: 5.5-low полезна, но не как замена mini и не как замена medium.

Она занимает узкую middle-tier позицию.

Что показал тест:

5.5-low
- лучше держится на простых exact-URL задачах;
- дает более чистые contact/program rows;
- меньше расползается в лишние рассуждения;
- выглядит дешевле по QA для простых страниц;
- но пропускает более сложные источники: PDFs, linked pages, padel/pricing details, неоднозначные программы.

То есть 5.5-low хороша, когда надо быстро извлечь очевидные факты с уже известной официальной страницы.

5.5-medium
- нашла больше materially useful facts;
- лучше справилась с pricing, PDF, padel и более сложными linked sources;
- полезнее там, где нужна интерпретация;
- но output был менее promotion-ready;
- требовала больше нормализации и main-agent QA.

То есть medium лучше как reasoning/research модель, но ее нельзя использовать как “просто дешевый extractor”: она может дать больше ценности, но и больше шума.

Главный вывод по workflow

5.5-low не заменяет mini, потому что mini все еще остается default для массового простого extraction, если official URL уже известен.

Но 5.5-low можно добавить как промежуточный слой:

- mini — обычный default worker для простых known-URL batches;
- 5.5-low — когда задача чуть сложнее mini, но еще не требует полноценного reasoning;
- 5.5-medium — когда есть PDF, non-English, booking gates, pricing ambiguity, multiple official pages, contact repair или слабый результат от mini/low.

Практическое правило после теста:

Использовать 5.5-low для:
- exact official URL;
- contact + simple program extraction;
- простых англоязычных страниц;
- bounded QA;
- случаев, где Spark слишком слабый, а medium избыточна.

Не использовать 5.5-low для:
- broad discovery;
- dead URL / rebrand repair;
- pricing через booking portals;
- PDF-heavy pages;
- non-English pages;
- финального решения по ambiguous facts.

И важное: ни 5.5-low, ни 5.5-medium нельзя считать promotion-ready. Обе модели должны писать только raw JSONL candidates. Main agent дальше делает strict normalization, duplicate checks, pricing filters и helper dry-run.

Финальная рекомендация:
5.5-low стоит добавить в routing, но как narrow middle tier. Она экономит QA на простых задачах, но medium все еще нужен для сложных случаев, где low просто не достает часть ценных фактов.
🔥7👍41
⚪️ Software Factory


Тут Factory.ai (авторы droid, довольно крутого агента) разродился интро-постом о том, что мы переходим от индивидуальных агентов к автоматизации полного SDLC через Software Factories. Предлагает услуги их построить!

Это ровно то, о чем мы на одном из созвонов говорили - про полный SDLC, и что это сильно отличается от ИИ-разработки. Разработка - это все таки часть бизнеса, еще может оказаться, что и не самая большая! Автоматизация только ее - это формирвоание бутылочных горлышек по цепочке дальше.

▶️ Фэктори правильно все этапы пишет:
• signal in: хотелка пользователя
• triage: проработка хотелки, снятие неопределенностей, устранение Gaps
• plan: делаем подробный план реализации
• code: реализация
• test: тестируем (я сценариями прежде всего тетсирую)
• review: почему после тестов? нелогично; я делаю тесты ДО ревью, чтобы код корректный был, и ревью по цепочке с тестами бегает; а вот сценарии фичи - после смотрим, чтобы типа окончательный вариант;
• ship: у меня тут разделено - есть отдельно release (это выпуск версии, то есть паковка определенного набора фич в версию) и deploy (деплой - это выпуск некоего артефакта на определенный Stage, или в репозиторий, или в магаз); есть совмещенный флоу publish - это когда разделить не получается выпуск версии и делой на stage;
• monitor, automate: я хз как именно они за деплоями следят - у меня это индивидуально в паре проектов автоматизировано (в квн моем, например) через агента-администратора системы, он мне отчеты шлет как оно там поживает;
• software out: ну - концептуально тоже мне не понятно; оно у меня out когда я деплой сделал;

В общем, тема знакомая)) концепция не новая - мы про такое еще со времен Code Machine отслеживаем, всякие такие гравицапы (Auto Claude, например). Просто лишний раз убеждаешься, что тенденция усмотрена верно, жизнь туда и развивается.

Мне понравилось как сделана визуализация дашборда на их фабрике! Скрин в комменты кину для понимания. ⬇️

▶️ Надо будет упереь для своего dd-flow. Я как раз все свои этапы снабдил html-отчетами, и щас вот дашборд надо красивый вкрутить)) Спасибо за inspiration


🔗 Пост в бложик : https://factory.ai/news/software-factory

Вы что то подобное делаете?

@deksden_notes
🔥116
⚪️ Codex Referal Reset


Как вы знаете, Кодекс ввел систему рефералок, - если по вашей ссылке регистрируется пользователь, вам и ему дают ресет.

▶️ Так как у меня много аккаунтов, я решил не брать плюс подписку на очередной аккаунт "из старых", а сделать новый аккаунт, благо доменов то у меня много! )) Аккаунты я делаю на свои домены, но вместо почты завожу алиас на simplelogin.io (там у меня премиум) куда у меня эти домены подключены.

Зарегавшись в chatgpt.com, я вернулся в кодекс.апп и оттуда на этот новый аккаунт отправил рефералку.

▶️ Не забываем на chagpt.com для новых аккаунтов включить для аккаунта passkey / 2fa. Я забыл, и у меня просила авторизацию через телефон (благо у меня этих ваших esim с номерами верификации щас полно). Надо будет еще раз попробовать - но уже со включенным 2fa/passkey, есть мнение, что в этом случае может НЕ просить верификацию, но не факт, надо проверять.

Тут надо сделать выход из своего аккаунта в кодекс.апп. На всякий случай взял с почты реферальную ссылку, и по ней перешел - она открывает кодекс.апп. Там вошел в новый аккаунт, и в чате поздоровался с кодексом. В этот момент ресет пришел)

▶️ В общем, для нового аккаунта все сработало: ресет дали и моему аккаунту, с которого я реферал делал, и новому (даже free) аккаунту! Понятно, что тратить ресет на free аккаунте довольно неразумно, надо будет его апнуть до Плюса.

▶️ Не на всех аккаунтах включилась возможность отправлять инвайты. Наверное, это только честно купленные аккаунты - но я не отслеживал закономерность. Имейте ввиду.

——
Upd 1️⃣ : проверил - нет, для новых аккаунтов 2fa/passkey не спасает от требования верификации - скорее всего, это защита от фрода.

И еще наблюдение: логин и логаут из кодекс.апп инвалидирует сессии в CPA / web.


@deksden_notes
1🔥83
⚪️ HTML отчеты - небольшой апдейт


Я уже говорил про тему с HTML отчетами

🔗 Вот оригинальный пост про подход: https://t.me/deksden_notes/837

Я их использую на каждый этап своих флоу, стараюсь что то важное показать, и, желательно, как то посимпатичнее, графиком там разбавить, или табличками.

▶️ Делаю просто: есть html шаблон, данные он берет из json, а этап флоу должен только сформировать этот json - не нужно каждый раз агенту упражняться с html, да и формат выходит консистентнее. Шаблоны - в доп материалах промпта (скилла)

▶️ Еще момент: агент, конечно, напишет в своем заключении по этапу что сделал такой то отчет. Но это надо кликнуть - а ведь еще удобнее, когда отчет просто сразу видно. Я сделал блок в промпт, чтобы оно работало почти везде - я использую CMUX сейчас, в нем есть скилл Cmux Browser: если он доступен, отчет откроется в CMUX. Если нет - использую скилл Agents Browser.

Вы можете аналогичным образом прописывать браузер вашей ADE, встроенные браузеры сейчас почти у всех - от кодекс апп, до курсора.

Пользуете такое для UX разработки? Или только отладку фронта?

@deksden_notes
16👍32