DEKSDEN notes
2.64K subscribers
403 photos
7 videos
1 file
518 links
Мои заметки на разные темы, уровень - "для продолжающих")
Vibe Coding -> AI SWE, AI Coding Tools, Agents: Claude Code, Codex, news, links
Чат (!!!): https://t.me/+B1fB3sZbaVthMDhi

(с) 2025-2026, @deksden
Download Telegram
⚪️ Долго мы ждали 5.6


... в последнюю неделю, тут кодекс лихорадит с лимитами который день, и замедления - а рыбный день принес нам нежданчик: Опус 4.8! omfg)) Это было внезапно - ведь 4.7 вышел буквально несколько недель назад!

Может, удачнее квантанули мифос и выродили 4.8? В общем, он еще агентнее, немного поумнее. В общем, ждем теперь deepSWE бенч, посмотрим насколько 4.8 ровняется против 5.6!

▶️ Новинка: fast теперь не х6, а х2! Что конкуренция чудодейственная делает

▶️ Новое: dynamic workflows, это флоу на сварме. Отдельно буду разбирать, это стоит отдельного поста

▶️ Дефолтом теперь идет high effort - будет меньше проблем с криками "опус отупел" как было при смене дефолта недавно у опуса, но расход токенов по-умолчанию будет выше! Клодоводам на заметку - обращаем внимание.

▶️ В гайд по промптингу добавлена специфика 4.8

🔗 Must read: https://platform.claude.com/docs/en/build-with-claude/prompt-engineering/claude-prompting-best-practices


(ц) фронтир снова поапгрейден

@deksden_notes
👍8🔥54🌚1
⚪️ Эпопея: OpenAI против дешевых подписок


Битва клозедов и вендоров дешевых аккаунтов продолжается

Не так давно была введена верификация сообщением - в ряде стран это был whatsapp, в некоторых - по смс.

Народ быстро нашел вариант обхода требований верификации через прокидывание веб-сессии (для которой верификацию не требовали) в codex сессию. Да, они не проверяли. Через несколько дней такой обход прикрыли.

Все стали пользоваться верификацией через стандартные сервисы отправки смс для активации. Аккаунты по-прежнему продавались дешево, с триалами из третьих стран.

Буквально вчера-сегодня сделан новый шаг в этой эпической битве: триальные аккаунты клозеды стали эпизодически (раз в несколько дней) случайным образом (логика пока непонятна) инвалидиировать, и просить повторное сообщение с номера, который использовали для первичной верификации. Если это был виртуальный номер с сервиса - это проблема: смена номера в ui не предусмотрена.

Ждем развития ситуации))

П.С. По прежнему работет простая схема: вы просто покупаете аккаунт за номинал у вендора. Тогда верификацию не требуют! Более того, работает довольно долго грейс период, что продлит ваше использование на некоторое время свыше оплаченного месяца (если хотите).


——
Upd 1️⃣ : нет, при повторной авторизации в openai обычного Плюс аккаунта (оплаченного, что характерно) я такие получил запрос на верификацию номера на старом аккаунте! А номер там виртуальный..

В поддержке написано - возможности сменить номер нету!

Чат с поддержкой - там только ИИ. Оператора нету. Думаю чего делать))

Пока купил eSim у giffGaff.

——

@deksden_notes
11👍3
⚪️ Workflows от Антропика


Ну вот мы и дождались полноценного оркестратора от вендора! Тема - огромная, как уместить даже в серию постов - не совсем ясно. Спрашивайте в комментах если нужно.

Почитал первые обзоры - все оч поверхностно, повторяет документацию, а ее вы и сами прочитаете. Я решил начать с конца/с сути: сначала скажу анатомию воркфлоу, а всю обвязку разберем в последующих постах.

▶️ Workflow - это детерминированный скрипт на js, написанный с применением специальных функций для флоу. Вот они, главные кирпичики флоу:
* phase: устанавливает фазу вашего воркфлоу, этап в прогрессе;
* agent: запускает субагента; можно пускать в worktree; можно указать фазу; можно указать кастомный промпт для субагента; можно выбрать модель; важно - указываем SCHEMA для генерации агентом ответа по схеме - мы же в детерминированном скрипте, для обработки это нужно;
* parallel(tasks): запускает переданные элементы tasks параллельно, и как барьер ждет чтобы все они завершились результатом (или упали) - как promise.all()
* pipeline(items, ...stages): этот примитив КАЖДЫЙ item запускает через этапы STAGES независимо; то есть элемент 2 может быть на 2м этапе, а элемент 4 уже все этапы пройти; элементы обрабатываются независимо и параллельно; считай - fan-out;
* workflow: запуск суб-воркфлоу (вложенность ограничена 1, то есть из воркфлоу можно пустить еще один суб-воркфлоу) - выполнит воркфлоу и вернет все что воркфлоу возвращает;

▶️ Воркфлоу описан на верхнем уровне из двух секций - meta описание (фазы), параметры запуска, и далее тело воркфлоу на js состоящее из примитивов воркфлоу и обычного кода js. Часть функций внутри js нелоступна - так как воркфлоу можно возобновлять, Date(), math.random() запрещены, они нарушают возможность сохранять состояние воркфлоу и возобновлять его.

▶️ Паралелльные задачи выполняются с учетом общей конкурентности вашей системы. Если вы дали parallel например 100 задач, а максимальная конкурентность в системе 10, то заачи будут выполняться пачками по 10. Но логика барьера parallel сохранится - он дождется всех задач.

▶️ Есть встроенный /deep-research воркфлоу, из 5 фаз:
* scope: декомпозировать вопрос в пять разныз углов зрения;
* search: сделать parallel с 5 воркерами, по одному на каждый угол зрения;
* fetch: получить итоги поиска, сделать дедупликацию, и достать top-15 из каждого угла зрения;
* verify: интересная штука - запускаем parallel со скептиками, которые должны покритиковать релевантность результата; остаются только те, кто прошел;
* synthesize: синтезировать результат из отфильтрованных итогов

Этот ворфлоу можно вызывать из своих воркфлоу, если нужно что-то качнственно поискать в интернете (например, решение для какого то бага в коде)

▶️ Сам Workflow это тул в СС, вызывается с указанием скрипта из .claude/workflows
Команда /workflows показывает список ваших воркфлоу/их запусков, включая текущий - можно смотреть как там каждая фаза, как там агент и что делает (промпт/результат), ставить флоу на паузу/останавливать.

(ц) вот такое!

@deksden_notes
👍10🔥103
⚪️ Workflows от Антропика, дальше


В общем, конструкцию вы уловили, надеюсь - вся суть именно в детерминирвоанном коде. Именно он ставит рельсы, чтобы создать схему работы для 1000 агентов. Да, именно такой лимит для агентов на воркфлоу, так что оцените масштаб.

Да, BUN переписывали именно этим.

Да, это сильно похоже на кучу оркестраторов которые ранее были - типа OmO. Теперь смотрим что придумали вендоры.

▶️ Табличку отличий Subagent, Agent Team (сварм) и Workflow вы все уже видели - это очень разного масштаба инструменты.

Субагенты выполняют задачи изолированно, получили задачу, сделали, вернули в контекст оркестратору.

Сварм работает коллаборативно, может обмениваться результатами друг с другом, но все равно получает задачу от оркестратора и отдает итоги в контекст.

Флоу работает по детерминирвоанному скрипту, и является полноценной программой: с параметрами, фиксированной логикой, результатами. Все передается и обрабатывается через детерминирвоанный код.

▶️ Ultracode переводит СС в режим xhigh режима размышлений и делает из текущей сессии скрипт для выполнения поставленных задач.

▶️ По мне - так весьма прилично сделано:

* паралелльность есть в двух формах; думаю больше всего в интерентах будут пережовывать тему отличия pipeline от parallel;
* есть композиция через вызов суб-воркфлоу;
* есть условная надежность в виде перезапусков - вроде как состяоние сохраняется; с этим надо еще разбираться, как все работает;
* документация полноценная традиционно отсутствует; ну - хоть сам клод понимает как эти воркфлоу писать! думаю надо расковырять промпт/скилл которым ему это объяснили, он будет самый поучительный с точки зрения документации;
* это конечно мощно sherlocked все независимые оркестраторы - что и так было понятно; я вот свой dd-flow по этим соображениям и не выпускал, хотя механики похожие; я просто думал раньше выпустят, февраль - а не в мае; но team тоже можно для флоу использовать, хотя менее надежно;

▶️ Токены: это машина по истреблению токенов. Думаю, кейсы с $500m чеками такие системы только умножат. Прикиньте: если в один поток у вас лимиты заметно тратятся, то Agent Team тратит их кратно - запустил х6 агентов, расход вырос в 7 раз, оркестратор тоже кушает. И если у вас лимит уходил, например, за 4 часа, то х7 сделает это за 35 минут.

А в воркфлоу лимит субагентов - 1000. Поэтому аккаунтами надо запасаться, да. Жалею конторы, которым приходится за апи покупать такое - это жесть, думаю уже сравнимо с оплатой за труд, так что замена программистов может отложиться, технологии весьма подорожали))

Кстати, именно поэтому на Плюс тарифе оно отключено по дефолту. можно включить, да - но чтобы убедиться что выжигает оно быстро))

(ц) такое, да - но интересно))

@deksden_notes
7😱3
Forwarded from Phantom AI
♥️ПОДПИСКИ НА ИИ ДО 80% ДЕШЕВЛЕ

🚀 @phantomAI_shop_botКлюч к вашей экономии на нейросетях

🔥 Больше не придется платить 100% стоимости и искать способ оплаты из РФ, потому что мы создали собственного бота, где вы сможете приобрести подписки со скидкой на все самые популярные ИИ:
⚡️SuperGrok 1мес:
На ваш аккаунт (CDK) — 959₽
Готовый аккаунт729₽

😮Gemini Pro 18мес:
Ссылка активация на ваш аккаунт469₽

🤞ChatGpt Plus 1 мес:
На ваш аккаунт (CDK) — 1 359₽
Готовый аккаунт639₽

😎Claude Pro 1 мес:
На ваш аккаунт (CDK) — 1 549₽

😵‍💫Cursor Pro 1 мес:
Готовый аккаунт1 490₽

⚡️Perplexity Pro 1 ГОД
На ваш аккаунт (CODE) — 2 059₽

Полная гарантия на все периоды!

⚡️В чем преимущество именно нашего магазина?

Бот работает на автовыдаче товаров. Оформление подписки 24/7 без ожидания. Подписка на вашем аккаунте будет через 5 минут после оплаты

Активируемая подписка как на ваш личный аккаунт, так и выдаем готовый. Данные давать не нужно!

Поддержка и гарантия на протяжении всего периода подписок

Цены в среднем ниже на 50% ниже оригинала

По промокоду
FIRST101 скидка 5% на первый заказ

КУПИТЬ ПОДПИСКУ - https://t.me/phantomAI_shop_bot
Please open Telegram to view this post
VIEW IN TELEGRAM
😁5👍3🔥21
⚪️ Claude Workflows, еще немного оценок


Да, оркестратор сам себе пишет рельсы по которым потом бегает.

Материализованные детерминирвоанные воркфлоу это большой шаг вперед: работает сильно надежнее.

Я отошел от чисто агентных воркфлоу еще в сентябре 2025, начал в той или иной форме делать рельсовые воркфлоу и использовал разные прибулды ставшие потом моими оркестраторами.

▶️ Оркестраторов было уже 4 штуки:

1️⃣ на агентных воркфлоу СС недетерминированный алгоритм (зато были красивые визуализации в mermaid диаграммах, которые понмиали агенты в том числе);
2️⃣ потом сделал сложный универсальный ai-kod, это был максимально навороченный комбайн - и бандлы, и скриптовые этапы, и observability, и свой DSL; как раз все паттерны паралелльности - fan-out, parallel с барьерами, суб-воркфлоу, что то про стек вызовов, трейсы, и тп;
3️⃣ потом сделал легкий dd-flow чисто под кодинг, ипользовал его под проекты с codex начиная с 5.1;
4️⃣ последним сделал снова гибридный кодинговый флоу, перенеся dd-flow на ванильный кодекс cli + легкая обвязка в виде хуков и своих cli.

👉 я немного в теме.

▶️ Вы же понимаете, что каждый Agent() в воркфлоу внутри себя может звать Agent Team? )) И вызвать суб-воркфлоу внутри которого снова будут агенты и agent team? We need to go deeper!

А если серьезно - то скромный на первый взгляд набор кубиков для флоу я оцениваю как весьма комплектным для ОЧЕНЬ сложных флоу. Не уверен даже что его стоит далее усложнять.

▶️ На таких кубиках вполне можно сделать то, что я называю dd-flow: свой SDLC:

хотелка ➡️ задача+сценарий ➡️ планирование ➡️ реализация ➡️ верификация сценарием на хотелку

Все это замешивается на рабочих деревьях, на графовом плане - делаем волнами, паралелльные линии. Делать проверки по согласованному сценарию и вам сдавать фичу с готовым доказательством работы на скриншотах и видосах как оно там сработало.

И вот такие флоу будут крутится с детерминированной надежностью, а не через раз по настроению агента.

▶️ почему оркестратор от антропиков все еще базовый, чего по фичам нету (хотя я не сторонних набить продукт фичами - не всегда полезно):

* нет встроенной политики ретраев - надежность работы нужно обеспечить самостоятельно, что сильно осложняет воркфлоу;
* нету встроенного мультисемплинга - я это пользую;
* не нашел политики работы с ошибками - как сбоями агентов (это больше в части ретраев), так и логическими ошибками в воркфлоу; для себя я делал отдельные цепочки во флоу для обработки логических exceptions;
* ноль документации как правильно применять: best practice хотя бы - типа, пояснялки про паттерны map/reduce, fan-out, про lessons learned и эвалы для флоу (как настраивать и отлаживать);
* не совсем внятно описана observability и какие имеем трейсы в системе и как их смотреть; я делал папку .runs где каждый ран воркфлоу лежал с папками для каждого "шага" воркфлоу; шаг содержал промпты агента, его артефакты которые он сгенерировал, и ответ агента (у меня был yaml зачем то, но думаю json надо ставить раз json output прижился);
* нету организации воркспейса для флоу - каждый будет выдумывать для себя; я делал описанную передачу отдельных файлов между шагами флоу; то есть оркестратор проверял не только наличие json по схеме в конце агентного хода, но и наличие пучка файлов с какими то детерминированными проверками; типа, чтобы не просто выполнить ревью и выдать вердикт, но и на каждый косяк оформить карточку;
* нет подходов к отладке флоу - для себя я делал на флоу "эвалы"; это когда берем стандартизированное состояние воркспейса для флоу, прогоняем какой то кусок флоу, и смотрим как флоу отработало; например, для флоу "ревью" берем заранее сделанное состояние подопытного репо с косяками, гоняем флоу, и проверяем потом что косяки найдены и правильно оформлены;

Не уверен, что все фичи такого рода нужны и всем, но мне представляется что это полезное - я такое пользую.

▶️ Если это кому то интересно, можно развернуть отдельные аспекты в отдельных постах - пишите комменты ⬇️


(ц) да, это сложно


@deksden_notes
👍14🔥10❤‍🔥6
Forwarded from Вайб-кодинг
Официальная цена ChatGPT Pro составляет 200 долларов, но для региона Филиппин она составляет всего 149,55 доллара, а для региона Египта версия Pro за 100 долларов обходится примерно в 88 долларов.

Ниже приведены два доступных на данный момент варианта с пониженной ценой, а также краткое описание шагов для их получения.

Проверенные цены (данные на май 2026 года):
Pro 20x (Филиппины): около 150 долларов
Pro 5x (Египет): около 88 долларов / 603 юаня

Традиционный способ предполагает подключение VPN с IP-адресом Филиппин или Египта перед оформлением подписки.

На практике при этом часто возникают следующие проблемы:

- Стабильные VPN-узлы сложно найти, а их стоимость обычно невысока лишь условно
- Платежи нередко отклоняются, из-за чего приходится постоянно переключать узлы
- Весь процесс получается довольно неудобным и трудоёмким

Сейчас появился более прямой способ: через скрипт вызвать платёжный интерфейс, указать платёжные данные нужной страны и напрямую обойти ограничения, основанные на IP-адресе.

Суть метода заключается в том, чтобы напрямую отправить запрос к платёжному API OpenAI, передав в параметрах объект billing_details с данными целевой страны. В ответ API возвращает страницу оформления оплаты для соответствующего региона, что позволяет оформить подписку по локальной цене.

Вся процедура выполняется на уже авторизованном сайте ChatGPT и не требует использования дополнительных IP-адресов. Ниже приведены два скрипта, которые можно использовать напрямую.

Pro 5x (регион Египет):

Откройте сайт ChatGPT и войдите в свой аккаунт.
Нажмите F12, чтобы открыть инструменты разработчика, затем перейдите на вкладку Console.
Полностью скопируйте приведённый ниже скрипт, вставьте его в консоль и нажмите Enter для выполнения.
Страница автоматически перенаправит вас на страницу оплаты для региона Египет.
В качестве платёжного адреса выберите штат США без налога с продаж (рекомендуются Oregon, Delaware, Montana и другие).
Завершите оплату с помощью поддерживаемой банковской карты.

Скрипт для Egypt 5x (скопируйте весь блок целиком):
javascript:(async function(){try{const t=await(await fetch("/api/auth/session")).json();if(!t.accessToken){alert("Please log in to ChatGPT first!");return}const p={"entry_point":"all_plans_pricing_modal","plan_name":"chatgptprolite","billing_details":{"country":"EG","currency":"EGP"},"checkout_ui_mode":"custom"};const r=await fetch("https://chatgpt.com/backend-api/payments/checkout",{method:"POST",headers:{Authorization:"Bearer "+t.accessToken,"Content-Type":"application/json"},body:JSON.stringify(p)});const d=await r.json();d.checkout_session_id?window.location.href="https://chatgpt.com/checkout/openai_llc/"+d.checkout_session_id:alert("Extraction failed: "+(d.detail||JSON.stringify(d)))}catch(e){alert("An error occurred: "+e)}})();


Перед выполнением скрипта обязательно убедитесь, что вы вошли в свой аккаунт.

Pro 20x (регион Филиппины):

Процедура полностью аналогична предыдущей, отличается только используемый скрипт.

Скрипт для Philippines 20x (скопируйте весь блок целиком):
javascript:(async function(){try{const t=await(await fetch("/api/auth/session")).json();if(!t.accessToken){alert("Please log in to ChatGPT first!");return}const p={"entry_point":"all_plans_pricing_modal","plan_name":"chatgptpro","billing_details":{"country":"PH","currency":"PHP"},"checkout_ui_mode":"custom"};const r=await fetch("https://chatgpt.com/backend-api/payments/checkout",{method:"POST",headers:{Authorization:"Bearer "+t.accessToken,"Content-Type":"application/json"},body:JSON.stringify(p)});


Покупку необходимо оформлять с использованием IP-адреса США. Для генерации адреса можно использовать сервис: meiguodizhi.com генератор адресов США

😁😁😁
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥12🌚10🤔2❤‍🔥1
⚪️ Fast уикэнд на Кодексе!


Тибо обещает завтра ресет.

Ну - х2 еще кончается, кстати - анонсов пока нету о продлении акций.

Так что можно нажать на педали, кому актуально!

(ц) ... пляшем!

@deksden_notes
👍5🔥4
⚪️ Kimi K2.6 (free)


Такое на опенроутере. Кому надо - берем, пользуемся пока дают. 40tps, не быстро, но есть fast c 70 tps

Впрочем, стоматологическое ревью дареных коней обычно не практикуют

@deksden_notes
🔥109👍1🤡1
Forwarded from Horo
#Обзор FreeModel.dev
Часть 1
🔍 #обзор FreeModel.dev — китайский реселлер Claude & GPT
Всем привет! Попробовал значит сервис, который сейчас хайпится, а он не просто так хайпится, и делюсь выводами.
Писал обзор в чате, а это прилизанная версия для канала. Плюс я не поленился и соскрапил их чат. Поэтому обзор в 3х частях.
👍1
Forwarded from Horo
📌 Что ты такое FreeModel.dev?
Провайдер-посредник между тобой и китайскими роутерами Claude/GPT. Схема:
• Закупают токены у китайских ферм (не по офф. ценам Anthropic/OpenAI)
• Продают через подписки в £ (фунтах) с раздутым курсом. А в фунтах потому что платежки проводят через stripe в UK
• Расчёты на сайте в «долларах», но это не настоящие USD. Если вы попробуете пополнить кошелек, то вам будут поплнять доллары по курсу юаней.

Доступны: Claude Opus 4.7, Sonnet, ChatGPT 5.5
Эндпоинты: api-cc.freemodel.dev (T1), vip-sg.freemodel.dev (T2)

Начнем сначала, если зайти на сайт, то вы увидите огромный баннер 300$ приветственный бонус. Так вот⚠️ Про «300$ бонус» — РАЗВОД!!⚠️ Нету их.
Баннер висит, но акцию свернули 23 мая. В офф. чате (t.me/freemodel123) админ подтвердил: новым юзерам теперь только 1 месяц Pro бесплатно, никаких $300.
При это есть переодическая акция на 100$ для claude code которая то появляется, то исчезает.

💳 Что по Подпискам: (цены в £, оплата Stripe)
Pro — £5/мес (~$6.75)
├ $10 каждые 5ч, $67/неделю
└ ~$291 эквивалент API/мес

Pro+ — £10/мес (~$13.50)
├ $20/5ч, $132/неделю
└ ~$574/мес

Max — £20/мес (~$27)
Ultra — £100/мес (~$135)
Power — £200/мес (~$270)

🎚 Что по Тирам: (T0/T1/T2)
T0 — халявщики, медленно, лимит body 3MB
T1 — подписчики Pro+, body 10MB
T2 — если пополнил >$10 (по их курсу), body больше
Для верификации и доступа к API нужна верификация телефона ИЛИ 0.3 GBP (~2.7¥) на счет.

💸 Есть еще прикол местной экономики
Реальный курс: 0.3 GBP → «$10» кредита (×26 инфляция)
+ множитель потребления 0.1x–0.7x (акции)
= в сотни раз дешевле номинала
Пример из чата: «2.7 юаня = $10 кредита ≈ 0.3 фунта»

Причем смотрите за руками🙌 стоимость апи считается по курсу от оффа, 5/25 для opus да, плюс якобы есть кеширование.но при этом на сайте траты влепят x2 от того что мне показывает claude code в usage. Если цены в долларах совпадают с апи потребление в этих долларах должно быть одинаковым в чиселках, а оно нет. Разница ровно в 2 раза. С учетом всех этих приколов фиг пойми как считать потребление.
2
Forwarded from Horo
## Часть 2 (жалобы и риски)

🚩 А что у нас там в основном чате - 17 306 сообщений, 10–30 мая

📊 Топ-темы:
862 — «как настроить» (Claude Code, env, base_url)
690 — оплата/возврат/баланс
568 — ошибки (429/500/timeout/限流)
312 — баны аккаунтов
255 — похвала (в основном за халяву)
72 — подмена модели / «отупление»

Жалобы платных юзеров:
• «Заплатил за VIP — разницы с free нет» (Yomi)
• «Перешёл на VIP — всё равно overload» (Ailurus Lee)
• «Пополнил — всё равно медленно» (anyin)
• «Привязал карту, сгенерил ключ — 401, не работает» (user «.»)
• «Подозрительно много токенов жрут» (Siraj)
• «Списание за каждый retry» (Allen Lucas)

Вы мне скажете, это обычный вой у любого нового проекта. А я вам отвечу, даже если вы отравили запрос и не получили ответ - С ВАС СПИСЫВАЕТСЯ ПОЛНАЯ СУММА!
То есть плохой сервис не компенсируется никак сверху. А на бесплатных тирах эндпоинтах при высокой нагрузки вечером можно просто не дождаться ответа, с полным списанием потрбления.

🎭 Подмена модели (твой кейс):
• «is that real gpt 5.5 or fake?»
• «i see gpt not opus» — заказал Opus, детектор показал GPT
• «5.5 用起来会不会降智?» — отупляет ли 5.5?
• Админ: «真假源头靠大家用力蹬» — «настоящий или нет — узнаете, загрузив до отказа»

💀 «Это скам?» — регулярная тема:
• «yea just got scammed haha» (Bobizzz)
• «don't trust this website, took my money» (user «.»)
• «不敢充, 怕跑路» — боятся, что сервис сбежит с деньгами
• Десятки «is this scam?» за 3 недели

🧪 Что было конкретно у меня тест:
На хвое все проверки проходят на 100 баллов ( На момент обзора!)
Аквариум прошёл со 2-го раза. Похож на настоящий.
1-й раз — ответ не пришёл, но списалось x2. Я про это писал.
Были ошибки, ваншот не получился

Почему проект на хайпе: потому что проект в фазе агрессивного маркетинга.
Сейчас за каждого приглашённого (с верификацией) — $10 кредита обоим.
Но: $5 кредита стоят ~1.5¥ примерно.Плюс махинации с курсом. Нафармить себе долларов в проекте типа можно, но хз насколько это выгодно с учетом траты на esim, акки в телеге.
Ну и искали промоутеров в RU регионе, за безлимитный opus.

⚠️ Риски:
1. Ребят,код идёт через 2 прослойки: FreeModel + китайская ферма
→ это значит что твой датасет 100% утечет на маркет.
2. Нестабильность: ни беслпатные, ни vip тиры не показывают сейчас стабильной работы.
3. Нихуёво высокий шанс ragpull'а после набора трафика. Свои личные живые деньги подумаете 2 раза стоит влвать.
4. Подмена модели (в чате прилетали жалобы)

📈 Динамика чата:
10–21 мая: ~500–900 сообщений/день
26 мая: 1699 (авария T0)
28 мая: 2098 (пик после промо + жалоб)

Вывод: дёшево, но сомнительно. По чату видно, что лояльность держится на цене, не на качестве.
Я лично пользуюсь другими сервисами, расскажу вам о них тоже

Офф. чат: t.me/freemodel123
8👍1👻1
⚪️ Qoder предлагает немного бесплатного Qwen 3.7


Чтобы отпразновать день защиты детей (нет), алибаба решила забустить использование своего нового топового квена 3.7 max в своем ИИ dev продукте qoder. Напомню, что именно в него предлагалось переходить с закрытого iflow. Совпадение с выпуском М3 и кодинговыми планами байтденса считать случайными.

Получаем 200 бесплатных запросов, а после этого действует вторая акция - квен в полцены и 100 бесплатных сообщений qwen 3.7 новеньким. Интересно - оно стекается?)

Бесплатные сообщения обещаны всем тарифным планам, включая бесплатный Community Edition.

🔗 Паспорт акции: https://docs.qoder.com/events/qwen-max-daily-free
🔗 Вторая акция с пол-ценой: https://docs.qoder.com/events/qwen-max-discount


(ц) такое можно и потестить

@deksden_notes
👍5
⚪️ Advisory Strategy в СС


Тут копался в СС разбираясь с Dynamic Workflows и наткнулся на штуку, которую пропустил в анонсах - в апреле выпустили. Побуду слоупоком, но напишу и спрошу чего интересно.


Называется Advisor, пускается командой /advisor, работает только с эндпоинтами самих антропиков, потому что серверная.

Идея в том, чтобы более слабая модель (соннет или хайку) звали более умную модель (опус) в случаях когда им надо бы подумать и чего то придумать. А старшая модель сразу получает тот же самый контекст, то есть его набирать отдельно не надо.

Фишка в том, чтобы черновую более механистическую работу делала более дешевая и быстрая модель, а если надо подумать - зовем более дорогую, крупную и умную.

Бенчи показывают заметный рост качества.


▶️ Предполагаю, что мифос и предполагается в таком формате использовать - глупо такой большой и умной модели ворочать тулами, не царское это дело!

▶️ Вообще, инлайн-оркестрация моделей в ходе сессии - это видится перспективной и крутой технологией, особенно если это все делается "само собой", без ручного регулирования.

Возможно, это будет работать лучше "роутеров", которые гпт придумывало на момент выхода гпт-5.

🔗 Анонс: https://claude.com/blog/the-advisor-strategy
🔗 Дока на тул: https://platform.claude.com/docs/en/agents-and-tools/tool-use/advisor-tool

Кто то использует в таком формате соннет? Как впечатления - работает схема или не особо? поделитесь обратной связью


@deksden_notes
👍72🔥2
⚪️ Верификация аккаунтов кодекс через WhatsApp


▶️ В общем, для верификации заказал и использовал giffGaff esim. esim дают в мобильно приложении, сим ставится сразу на устройство, на счет надо 10 фунтов кредитами загнать, есть план без абонентки.

▶️ Далее решил сделать схему: на компе авторизуюсь в устройство Whatsapp, и типа туда получаю одноразовые коды. А с телефона ставлю тот номер, который надо

Во первых, сменить номер в мобильном приложении whatsapp я придумал только перестановкой приложения (ios). Не удобно. Хорошо щас whatsapp особо не пользуюсь!

▶️ Во вторых, фокус с whatsapp на компе не удался - в whatsapp web/desktop коды подтверждения не отображаются))) Прочитать можно только с основного телефона.

Так что если уж телефон использовать - то особого смысла в whatsapp на компе или в целом в кодах по whatsapp я не вижу. Единственное что - может быть надежнее доставка (мы все таки в роуминге, интернет видимо понадежнее).

▶️ Искренне надеюсь, что удаление аккаунта поможет "освободить" номер телефона для привязки нового аккаунта. Это я пока не проверял, да еще и до 30 дней на удаление данных может уйти.


Как вы решили вопрос с верификацией номеров?


@deksden_notes
👍8
⚪️ Composer 2.5 в Grok Build


x.AI анонсирует доступность модели Composer 2.5 в Grok Build. Вроде бы даже в полписках есть, начиная с SuperGrok (которая $30).

Кстати, аккаунты SuperGrok вроде продают ниже номинала.

В общем, комании явно взаимодействуют

Лимиты использования не указаны.

@deksden_notes
👍2👀1
⚪️ Гадания на некофейной х-уще!


Тут в твиттере (русское название для Х-ком как то у нас не прижилось) греть публику начали новинками клозедов.

Вот такие утечки.

5.5-codex-spark? хм. Ну - прошлый спарк был весьма туповат

Этот вроде может быть и поумнее и покрупнее, раз церебры придумали как кими 2.6 в свою железку засунуть! может и гпт туда какая то поприличнее встроилась

Но, блин - только Про? wft


(ц) впрочем, посмотрим! Это ж слухи

@deksden_notes
🔥6👍2
⚪️ Бенчмаксинг или плохие бенчмарки?

Тут чел хейтит минимаксов за плохую модель и за бенчмаксинг, при этом основывает свое мнение на другом бенчмарке (deepSWE), где у минимаксов все плохо.

▶️ Помимо очевидной странной логики критиковать бенчмаксинг на данных другого бенчмарка, странно смотреть просто на цифры, и не говорить сути.

▶️ Хороший повод сказать про бенчмарки. По мне - ориентация на бенчмарки возможна только в том случае, если ты достаточно ясно понимаешь ЧТО и КАК измеряет бенчмарк

Иначе мы приходим к ситуации "Петька, приборы! Восемь! Что - восемь? А что - приборы?"

Если такого понимания нету, то цифры любого бенчмарка будут для вас "попугаями" разной степени условности. Конечно, удав в попугаях - длиннее!

▶️ А если про эту конкретную метрику - то deepSWE достаточно нашумевший бенчмарк. Заявляется что измеряет агентность и длительность работы. Использует свою упряжку.

▶️ Суть бенчмарка в том, что по мотивам известных open source репо агенту даются некие "большие" задачи чтобы посмотреть работу модели на задачах уровня репозитория, посмотреть как будет изучен репо и как будет сделана работа.

В бенче агенту выдается репо, дается задача, отключен интернет, модель работает в некоем harness с неким промптом от этой упряжки.

Дальше агент работает, что то делает.

Далее работает верификатор - смотрит все ли сделано, тесты, поведение.

▶️ Что меня смущает:
• бенчмарк измеряет в своей упряжке - очевидно что модели тренированы на разыне упряжки
• упряжка в бенче весьма убога
• даем задачи уровня полного ai SDLC, при этом флоу которым мы это обеспечиваем почти отсутсвует
• фактически мы измеряем насколько модель может скомпенсировать убогую упряжку и убогое флоу за счет собственных подходов к работе
• мутно описаны критерии приемки, а мы знаем что если нету цикла обратной связи - модели оч тяжело всделать все норм; впрочем, это тоже претензия к флоу

▶️ На мой взгляд, этот бенч - это параолимпиада для моделей, где проверяется как они ползают с отрезанными руками/ногами и слегка выколотыми глазами.

Ну - получается что морально волевые качества измеряем.

Как это соотносится с реальной отдачей модели от работы - отдельный вопрос!

(ц) простите, накипело!)

@deksden_notes
🔥10😁5👍43💯2
⚪️ deepSWE


▶️ В результате довольно бурного обсуждения в чате тезисов про бенчмарки, могу резюмировать:

* основная масса людей ориентируются на то, что называют "по своим ощущениям", "на своем опыте" - что логично, ведь мы все прмиеняем модели в своих задачах;
* бенчмарк deepSWE зашел потому, что ранжирует модели примерно понятным образом для выполнения кодинговых задач - которые явно требуют хорошей агентности; и то, как именно отранжировал модели этот банчмарк, вызывает понмиание у многих

▶️ В итоге, надо резюмировать - раз совпадает с мнением и ощущением многих, это хороший бенчмарк, который отражает какую то важную грань работы.

▶️ Я лишь подчеркну, что та ось координат, относительно которой ранжирует модели бенчмарк, она довольна специфична, и идеально будет - понимать про что этот бенчмарк.

По мне так он про самостоятельность моделей при решении сложных кодинговых задач. Как модель без особых вводных, без особой помощи от упряжки, без опоры на флоу, без предоставленной опоры на критерии успеха задачи - как модель сама может разобраться с кодинговыми задачами.

Модель, имеющая большой скор на этом бенчмарке безусловно хорошая.


▶️ Полезны ли модели с низким скором на этом бенче для кодинговых задач? Или это плохая модель?

Модель может быть полезна и может быть даже эффективной - но этот бенчмарк ясно говорит: НЕОБХОДИМО сменить условия в которых они работают. Если дать им те самые инструменты и опоры - флоу, схему сбора контекста, критерий для сверки успешности задач.

▶️ Наверное, из всего обсуждаения - самое полезное было развести эти мухи и котлеты.

Как раз этот бенчмарк дает ответ - почему у некоторых людей, которые без навыков ИИ разработки, без понмиания подходов пускают какого то агента на задчу по своему кода - почему у них иногда выходит крайне посредственный результат.

👉 Для сложных условий надо пускать только модели с топовым скором на этом бенче, которые сами могут во многом разобраться.

👉 Ну а умеючи и топором можно много что исполнить))


(ц) как то так резюмировалось!

@deksden_notes
👍13🔥32