Заметки одного архитектора
61 subscribers
21 photos
1 video
4 links
👋 Я Максим Мельников — 👨‍💻 архитектор MTS HR Tech, 🤖 ИИ-энтузиаст.
🏛️ Архитектура ПО • AI-эксперименты • 🚀 Карьера • 🎒 Закулисье.
Подписывайтесь, чтобы строить системы, команды и будущее вместе!
Download Telegram
Насмотрелись у наших сми в правильную инфографику 🥹

#ии #openai #gpt5
🕵️ OpenAI тайно ворует данные у Google (и это довольно цинично)

Пока OpenAI пытается побороть Google в поиске, они втихую используют данные того самого Google для ChatGPT. Парадокс века! 🤖

Как это работает

OpenAI получает доступ к результатам поиска Google через SerpApi - сервис веб-скрапинга из Остина. Этот сервис собирает поисковый индекс Google и продает его клиентам.
Благодаря этому ChatGPT может отвечать на актуальные вопросы о новостях, спорте и финансах. Собственные инструменты OpenAI пока не дотягивают до уровня Google, поэтому приходится «занимать» 😄

Как их поймали на горячем 🎯

Детективную работу провел бывший инженер Google Абхишек Айер. Классическая «операция по поимке»:
Создал фиктивные веб-страницы, которые отображались только в индексе Google
Попросил ChatGPT рассказать о содержимом этих страниц
ChatGPT выдал информацию прямо с них - попался!
Брайан Дин из Backlinko подтвердил результаты своим экспериментом с вымышленным термином «NexorbalOptimization», к которому ChatGPT мог получить доступ только через Google.

Они не одни такие

Среди клиентов SerpApi засветились:
- Meta
- Apple
- Perplexity (конкурент в поиске с ИИ)
До мая 2024 OpenAI публично числилась клиентом SerpApi, пока упоминание тихо не удалили с сайта. Любят они секретничать 🤫

Пикантные детали

Google отказала OpenAI в прямом доступе к поисковому индексу (об этом стало известно из антимонопольного дела с Минюстом США). Но OpenAI продолжает арендовать серверы Google Cloud для ChatGPT.
Получается забавная ситуация: «Мы с тобой конкуренты, но твои серверы нам нужны, и данные тоже стырим через третьих лиц» 😂

Амбиции vs реальность

Ник Тёрли из OpenAI заявлял в суде, что хотят обслуживать 80% трафика собственным поисковым индексом. Но признал, что они «далеки от достижения» этой цели.
Google пока не подает в суд на SerpApi - возможно, из-за давления регуляторов, которые могут заставить их открыть индекс для конкурентов.

Почему это важно

Вскрывается фундаментальная зависимость ИИ-компаний от поисковой инфраструктуры Google. Все хотят конкурировать с Google, но без его данных никуда.
Это может серьезно повлиять на будущие антимонопольные регулирования и заставить компании быть честнее в вопросах сбора данных для ИИ.

А что думаете? Это нормальная практика или OpenAI переходят границы? 💭

#openai #google #chatgpt #serpapi #ai #ии
🤔2