⚠️ Проблемы с кэшированием Qwen3.7 max на стороне провайдера. Точных сроков по фиксу не дано. Остальные модели работают штатно
Привет! Обновление уже загружено на сайт. Мы полностью убрали разделение на шлюзы и теперь концентрируемся на одном едином канале для обеспечения максимальной стабильности.
В связи с этим изменился эндпоинт - теперь актуальный адрес api.aigate.shop. Пожалуйста, обновите его в своих конфигах.
В связи с этим изменился эндпоинт - теперь актуальный адрес api.aigate.shop. Пожалуйста, обновите его в своих конфигах.
🌭3
Посмотрите наглядный пример того, как система умного кэширования экономит ваши деньги в реальном времени.
На скриншоте видно работу с GPT-5.5: при общем контексте запроса около 150 000 токенов, система стабильно считывает из кэша (колонка кэш) долю - порядка 140 000-155 000 токенов. Благодаря этому за каждый такой огромный запрос списывается всего по $0.01 - $0.02.
Как это работает на практике?
При обычном использовании без кэша ваши условные $3 улетели бы всего за 1 миллион токенов. С включенным кэшированием те же самые $3 превращаются в 5 миллионов токенов и более. Повторные токены идут с огромной скидкой x0.1, поэтому вы платите только за небольшую часть нового текста (входные токены) и генерацию (выходные).
Всё работает полностью автоматически на всех моделях, включая новые версии OpenAI, Anthropic и Google - вам не нужно ничего настраивать вручную.
На скриншоте видно работу с GPT-5.5: при общем контексте запроса около 150 000 токенов, система стабильно считывает из кэша (колонка кэш) долю - порядка 140 000-155 000 токенов. Благодаря этому за каждый такой огромный запрос списывается всего по $0.01 - $0.02.
Как это работает на практике?
При обычном использовании без кэша ваши условные $3 улетели бы всего за 1 миллион токенов. С включенным кэшированием те же самые $3 превращаются в 5 миллионов токенов и более. Повторные токены идут с огромной скидкой x0.1, поэтому вы платите только за небольшую часть нового текста (входные токены) и генерацию (выходные).
Всё работает полностью автоматически на всех моделях, включая новые версии OpenAI, Anthropic и Google - вам не нужно ничего настраивать вручную.
🌭6❤3
AIgate
Добавлена реферальная система! Приглашая пользователей по реферальной программе, вы получаете 7% с каждого пополнения баланса вашего реферала: https://aigate.shop/dashboard/referrals При возникновении ошибок или в случае незачисления бонусов обращайтесь в…
⚠️ Важное предупреждение
Ежедневный трафик увеличивается, Однако вместе с этим мы фиксируем резкий рост попыток абузить нашу реферальную систему. Некоторые пользователи массово создают твинки по собственным ссылкам, пытаясь таким образом сэкономить или заработать.
Мы хотим еще раз официально предупредить всех, кто использует или только планирует использовать подобные схемы обхода правил:
Все выявленные твинки будут отправлены в бан. Более того, за подобные махинации в обязательном порядке блокируется и ваш основной аккаунт.
Даже если вы не получили бан моментально и успели воспользоваться бонусными средствами, это не значит, что нарушение осталось незамеченным. Блокировка может быть отложенной, но она обязательно произойдет.
Любые денежные средства, находящиеся на балансе заблокированных аккаунтов (как основных, так и дополнительных), будут аннулированы. Никаких возвратов или компенсаций для нарушителей не предусмотрено.
Пожалуйста, используйте платформу честно и уважайте правила. Мы ценим каждого честного пользователя, но любые попытки мошенничества будут пресекаться максимально жестко.
Ежедневный трафик увеличивается, Однако вместе с этим мы фиксируем резкий рост попыток абузить нашу реферальную систему. Некоторые пользователи массово создают твинки по собственным ссылкам, пытаясь таким образом сэкономить или заработать.
Мы хотим еще раз официально предупредить всех, кто использует или только планирует использовать подобные схемы обхода правил:
Все выявленные твинки будут отправлены в бан. Более того, за подобные махинации в обязательном порядке блокируется и ваш основной аккаунт.
Даже если вы не получили бан моментально и успели воспользоваться бонусными средствами, это не значит, что нарушение осталось незамеченным. Блокировка может быть отложенной, но она обязательно произойдет.
Любые денежные средства, находящиеся на балансе заблокированных аккаунтов (как основных, так и дополнительных), будут аннулированы. Никаких возвратов или компенсаций для нарушителей не предусмотрено.
Пожалуйста, используйте платформу честно и уважайте правила. Мы ценим каждого честного пользователя, но любые попытки мошенничества будут пресекаться максимально жестко.
❤2🌭2
Deepseek v4 pro чтение кэша 0.1х --> 0.01х
То есть теперь за чтение кэша вы получаете скидку 99% вместо 90%
То есть теперь за чтение кэша вы получаете скидку 99% вместо 90%
❤6🌭1
На openrouter для Google моделей есть выбор приоритета. Вопрос к вам, нужно ли такое добавлять к нам? 3 тира.
Flex - цена модели в 2 раза дешевле, но модель отвечает в разы медленнее.
Default - Обычный тир
Priority - Цена модели в 1.8 раза дороже, но отвечает в разы быстрее.
Данные тиры действуют только на гугл модели, и если оно вам нужно, отпишите в комментариях.
Flex - цена модели в 2 раза дешевле, но модель отвечает в разы медленнее.
Default - Обычный тир
Priority - Цена модели в 1.8 раза дороже, но отвечает в разы быстрее.
Данные тиры действуют только на гугл модели, и если оно вам нужно, отпишите в комментариях.
Alibaba сделали скидку на 50%. В связи с этим понижение в ценах:
Qwen3.7 Max - 0.55$/1.3$M cache read 0.2x —> 0.32$/0.7$M cache read 0.1x
Qwen3.7 Max - 0.55$/1.3$M cache read 0.2x —> 0.32$/0.7$M cache read 0.1x
❤1
Новая модель - gpt image 2
Цена: от 0.0015$ до 0.03$ за картинку. Цена зависит от качества/размера изображение. Используйте эндпоинт https://api.aigate.shop/v1/images/generations подробности в документации.
В ближайшее время добавим и другие модели для генерации картинок.
На данный момент эндпоинт для редактирование картинок недоступен. Мы добавим его в течение пары дней.
Цена: от 0.0015$ до 0.03$ за картинку. Цена зависит от качества/размера изображение. Используйте эндпоинт https://api.aigate.shop/v1/images/generations подробности в документации.
В ближайшее время добавим и другие модели для генерации картинок.
На данный момент эндпоинт для редактирование картинок недоступен. Мы добавим его в течение пары дней.
GPT Image 2 нейросеть — это новейшая модель генерации изображений от OpenAI, которая тихо, без громкого анонса, начала раскатываться на пользователей ChatGPT в апреле 2026 года. Это второе поколение встроенного генератора изображений GPT, и оно делает то, чего индустрия ждала годами: правильно рендерит текст — в том числе кириллицу с точностью выше 99%. Если вы хотите создавать баннеры, посты, инфографику, мокапы и логотипы с помощью ИИ — GPT Image 2 меняет правила игры.
❤3
Новая модель - gemma-4-31b-it
Цена: 0.1$/M input 0.2$/M output
Цена: 0.1$/M input 0.2$/M output
Gemma 4 31B Instruct — это плотная мультимодальная модель Google DeepMind объемом 30,7 млрд параметров, поддерживающая ввод текста и изображений с выводом текста. Модель отличается контекстным окном объемом 256 тыс. токенов, настраиваемым режимом мышления/рассуждения, встроенной поддержкой вызова функций и многоязычной поддержкой более 140 языков. Модель демонстрирует высокую эффективность при решении задач по программированию, рассуждению и пониманию документов. Лицензия Apache 2.0.
🌭1
Новая модель - Kimi k2.6
Цена: 0.25$/M input 0.65$/M output
Цена: 0.25$/M input 0.65$/M output
Kimi K2.6 — это новейшая мультимодальная модель от китайского стартапа Moonshot AI, совершившая настоящий прорыв в области длительного автономного программирования (long-horizon coding) и управления агентными системами. Построенная на продвинутой архитектуре MoE (Mixture of Experts), модель получила полноценную поддержку контекста на 256 000 токенов и научилась эффективно координировать до 300 параллельных субагентов для выполнения сложнейших сквозных задач: от написания комплексного full-stack кода и тонкой оптимизации производительности до мгновенной сборки интерактивных UI-интерфейсов из обычных набросков или картинок.
Новая модель - mimo-v2.5-pro
Цена: 0.3$/M input 0.65$/M output
Цена: 0.3$/M input 0.65$/M output
MiMo-V2.5-Pro — это флагманская MoE-модель нового поколения от Xiaomi с открытым исходным кодом, созданная как ультимативный «мозг» для автономных ИИ-агентов и масштабной full-stack разработки. Обладая монструозным контекстным окном в 1 миллион токенов и гибридной архитектурой внимания, модель способна часами выполнять сквозные инженерные задачи, совершая более тысячи последовательных вызовов инструментов (Tool Calling) без потери нити рассуждения и критических ошибок. Благодаря встроенной технологии Multi-Token Prediction (MTP) скорость генерации выросла почти в три раза, а по эффективности в сложнейших агентных бенчмарках уровня ClawEval и SWE-bench Pro китайский гигант вплотную подобрался к Claude 4.6 Opus. При этом MiMo-V2.5-Pro предлагает беспрецедентную экономичность: при базовой цене инпута в $1 за миллион токенов, модель поддерживает 80%-ю скидку на чтение из кэша (всего $0.20/1M), что делает её главным фаворитом для развертывания тяжелых корпоративных экосистем и DevOps-инструментов.