ИИволюция 👾
11.6K subscribers
976 photos
370 videos
1 file
824 links
Авторский канал Сергея Пахандрина про AI, нейросети, AI-разработку, ChatGPT (и другие LLM). Строю AI-first компанию. Рассказываю о своём опыте и экспериментах с AI.

По всем вопросам: @pakhandrin
РКН: https://clck.ru/3QJLiL

В ВП и папках не участвую
Download Telegram
Приплыли

Похоже, GPT-5.6 мы теперь увидим примерно как свои уши.

Если верить утечке, OpenAI хотела выпустить новую модель, но администрация США попросила идти через ограниченный релиз. Доступ будут одобрять буквально клиент за клиентом, и видимо только после верификации.

Раньше мы ждали новые модели как продуктовый релиз, а теперь решает правительство: кому можно, кому нельзя, кому сначала, кому потом.
😭24🤣8👍1
Токены в подарок другу

В Codex замечена экспериментальная фича «Подарить другу токены»

Токены новая валюта, токены правят миром! Лучший подарок на др, скинуться всей толпой другу на токены ❤️‍🔥
9🤣5🔥3
– “Не радуйся, GPT-5.6 следующая на очереди”.
🤣24😭8👍3
Opus 4.8 со скидкой 90%

В Китае вырос отдельный черный рынок токенов на топовые модели OpenAI и Anthropic. Вы можете купить токены к Opus 4.8 со скидкой аж до 90%, выглядит капец как дешево. А в чем прикол? Как китайцы умудрились достать такие дешевые токены?

Схема выглядит очень интересно:

Claude и ChatGPT в Китае официально недоступны. Нужен VPN, иностранная карта, нормальный аккаунт, телефон, иногда еще верификация личности. Для обычного разработчика это боль. Поэтому вокруг этого выросли так называемые transfer stations, то есть прокси-сервисы, которые продают доступ к Claude и другим моделям как к обычному API.

Ты платишь им через WeChat или Alipay, меняешь адрес API на их прокси и вроде бы пользуешься Claude. Только запрос уже идет не напрямую в Anthropic, а через непонятного посредника.

В некоторых местах токены продают на 70-90% дешевле официального API Anthropic. На Hacker News обсуждали один такой сервис, где Claude Opus 4.8 был якобы на 93% дешевле официальной цены. Поверхностно не понятно, как на этом можно заработать, но есть нюансик!

ChinaTalk провела большое расследование и выяснила, что зарабатывают на таком подходе по разному:

Первый подход очень простой и тупой. Берут подписки Claude Max за $200, режут их на много пользователей и продают лимиты по часам или токенам. Плюс корпоративные скидки, студенческие аккаунты, бесплатные стартовые кредиты, неиспользованные квоты, пачки аккаунтов. В серой зоне это все превращается в такой токенный секонд-хенд.

Второй вариант уже менее приятный. Пользователь думает, что купил дорогой Opus, а ему могут подсовывать что-то дешевле. Например Sonnet, Haiku или вообще китайскую модель типа Qwen. Снаружи это почти невозможно проверить. Пока задача простая, ответ может выглядеть нормально. А на сложной задаче внезапно ощущение, что модель как будто поглупела.

И третий вариант самый, вероятно, главный в этой истории. Логи.

Если весь запрос идет через прокси, то у владельца прокси остаются промпты, ответы, tool calls, куски кода, контекст репозиториев, рабочие документы, цепочки рассуждений и все итерации. Для обычного пользователя это просто чат. Для рынка данных это золото!

Такие логи можно чистить, паковать и продавать как датасеты для обучения моделей. Особенно если речь про Claude Code и агентные сценарии, где есть реальные инженерные задачи, реальные ошибки, реальные правки и финальные рабочие решения.

То есть дешевая цена может быть не скидкой, а скрытом обменом: ты платишь меньше, но доплачиваешь своими данными сам не зная того.

И это довольно важный момент для всей истории с дешевыми китайскими моделями. Когда мы видим, что DeepSeek, GLM или Qwen стоят сильно дешевле западных моделей, кажется, что это просто такая агрессивная экономика. Но внутри Китая им еще приходится конкурировать не только с официальными ценами OpenAI и Anthropic, а с серым рынком, где Claude можно купить почти даром.

Отдельная ирония в том, что чем сильнее Anthropic закрывает доступ, тем жирнее становится рынок обхода. Геоблокировки, иностранные карты, телефоны, KYC, селфи с документами. Все это должно было усложнить доступ. Но по факту вокруг этого появляется целая инфраструктура: аккаунты, SMS-фермы, прокси, платежи, подставные документы, люди, которые проходят верификацию за деньги.

Получается странная картина. Американские компании пытаются не дать доступ к frontier-моделям из Китая, но китайские пользователи все равно получают доступ через посредников (и не только китайские). Посредники зарабатывают на арбитраже, подмене моделей и данных. А сами данные потом могут возвращаться в обучение новых моделей.

Самое смешное и грустное, что в этой схеме пользователь думает, что он просто нашел Claude подешевле. А на деле он может быть одновременно клиентом, источником обучающих данных и человеком, который отдал свой код или документы неизвестно кому.

Так, что если видите замануху в стиле “У нас Claude дешевле в 10 раз”, знайте, что вы всё равно оплачиваете разницу, но не деньгами, а своими данными и вероятно они могут быть даже ценнее, чем официальная подписка за $200
👍20🔥62
Первый день вайб-разработчика
🤣37
Выбирать железо для обучения и инференса моделей больше не нужно

Qwen, Whisper, Deepseek и другие нейросети уже готовы к работе на приватной инфраструктуре. Просто выбираете нужную модель и получаете готовый инференс-сервис в пару кликов в Selectel.

Каталог ИИ-моделей Selectel — удобный инструмент для работы с нейросетями, когда нужны безопасность и производительность.

Что вы получаете в пару кликов:

Большой выбор моделей для ваших задач: для генерации текстов и кода, распознавания речи, создания контента и других.
Производительность и гибкое масштабирование. Инференс-сервис развернут на современном железе с актуальными видеокартами и автоматически адаптируется при росте или снижении нагрузки.
Прогнозируемая стоимость: платите за фактическое время потребления вычислительных ресурсов.

Начните работать с ИИ-моделями на выделенной инфраструктуре: https://slc.tl/ezqj5

Реклама. АО "Селектел". erid:2W5zFGtAkP3
👍31🤔1
Обычно новость про еще одну open source модель, которая бьет все бенчмарки, прилетает из Китая, но тут новость из США!

Вышла Ornith-1.0 — открытая LLM для agentic coding.

В линейке есть 9B, 31B, 35B MoE и 397B MoE. Старшая модель показывает очень сильные цифры:

77.5 в Terminal-Bench
82.4 в SWE-bench Verified
62.2 в SWE-bench Pro
78.9 в SWE-bench Multilingual
77.1 в ClawEval

Фишка в обучении: модель учат не только искать ответ, но и самой выстраивать план решения под задачу.

И все это под MIT лицензией, то есть можно использовать в коммерческих продуктах.

Похоже, в гонке open source моделей для кодинга США решили напомнить, что они тоже умеют. Похвально!

Детали:
https://deep-reinforce.com/ornith_1_0.html
и на хаггингфейсе https://huggingface.co/collections/deepreinforce-ai/ornith-10
🔥262👍1
Правительство США сняли бан с Mythos.

Модель снова станет доступна ограниченному кругу компаний и организаций (но это не про нас с вами).

Антропики заверяют, что продолжают «биться» за то, чтобы Fable 5 снова стала доступна. Интересно, если это и произойдет, на сколько подрежут модели крылышки?
🔥5
OpenAI выкатили GPT-5.6

У нас новая линейка моделей: Sol, Terra и Luna.

Sol идет как флагманская модель для самых сложных задач. Terra выглядит как более сбалансированный вариант для повседневной работы, примерно на уровне GPT-5.5, но в 2 раза дешевле. Luna сделали самой быстрой и доступной моделью для задач с большим объемом запросов.

По ценам за 1M токенов получается так:

Sol: $5 input / $30 output
Terra: $2.5 input / $15 output
Luna: $1 input / $6 output


Главный акцент у Sol сделали на agentic coding, биологии, генетике и кибербезопасности. OpenAI пишет, что Sol новая SOTA на Terminal-Bench 2.1, где проверяют сложные workflow в командной строке с планированием, итерациями и координацией инструментов.

Sol называют самой сильной моделью OpenAI для security-задач. На ExploitBench она, по графикам OpenAI, идет близко к Mythos Preview, но при этом использует сильно меньше output-токенов. Отдельно подчеркивают, что Sol не достигает критического уровня риска в кибербезопасности, хотя видно, что тему безопасности вокруг релиза закрутили максимально плотно.

Еще появляются новые режимы. Max reasoning effort — это по сути развитие уже знакомых настроек глубины рассуждений: раньше подобные вещи были, но теперь их явно выделили и усилили, давая модели больше времени и вычислений на сложные задачи. Ultra mode выглядит более новым: там модель использует subagents, то есть подключает дополнительных агентов для больших и сложных задач, что раньше либо не было доступно, либо не выносилось как отдельный режим.

Доступ пока ограниченный. GPT-5.6 Sol, Terra и Luna дают небольшому числу trusted partners в API и Codex. Причем OpenAI прямо пишет, что такой старт делают по запросу правительства США. Широкий доступ обещают в ближайшие недели.

В июле еще планируют запустить Sol на Cerebras со скоростью до 750 токенов в секунду, сначала тоже в ограниченном режиме.

Короче, OpenAI показали таки своего Mythos, только сразу в виде в виде линейки моделей: дорогой флагман, более дешевая рабочая модель и быстрый массовый вариант.

Детали: https://openai.com/index/previewing-gpt-5-6-sol/
🔥73🍓1
А прикольно теперь релизы можно делать, у нас новая СОТА, лучшая модель на рынке, это просто пушка-бомба, но мы вам её не дадим, потому что у вас «докУмента» нет, да и вообще нам правительство запретило вам её показывать, но вы верьте нам на слово.
🤣21
Forwarded from Закиев Василь. (AI)ron manager (Василь Закиев)
#мемы про ИИ
🤣11👍41