XMLstock
197 subscribers
10 photos
43 links
XMLstock.com - биржа купли/продажи XML-лимитов Яндекс. Парсинг Яндекс и Google в формате XML
Download Telegram
⚡️ 02.05 Парсинг Видео из поиска Google

Добавили парсинг результатов выдачи из вкладки Видео в поисковой системе Google.

Для этого в нашем инструменте Google Xml Search необходимо использовать параметр &tbm=video или указать Результаты поиска - Видео в настройках по умолчанию. Для указания страны поиска необходимо задать параметры &gl=, &hl=

Обратите внимание, что для Google XML Search теперь доступен парсинг сразу 4-х видов поиска: Поисковая Выдача, Картинки, Новости и Видео.
👍2
⚡️31.05 Новые параметры для поиска Google

Добавили поддержку новых параметров для поиска Google:

&nfpr - Исправление опечаток
&safe - Безопасный поиск

Подробное описание всех доступных параметров:
https://xmlstock.com/?do=help-googlexml-params
👍1
⚡️ 06.07 Парсинг живой выдачи Яндекс на Turbo скорости без ошибок

Пользователи, которые собирают выдачу с помощью инструмента ЯндексLive наверняка заметили медленную скорость сбора и нестабильность работы данного инструмента. Сегодня мы хотим анонсировать обновление системы ЯндексLive, а именно добавление режима "Turbo скорость".

С помощью этого режима можно парсить поисковую выдачу Яндекса в формате xml, json, html на огромной скорости без каптчи и ошибок. Переключение режима сбора осуществляется в настройках личного кабинета (выбор Типа поиска). Также можно выбирать режим, отправляя параметр &tbm=turbo в GET-параметрах запросов. Турбо режим доступен только для поисковой выдачи и недоступен для сбора картинок и видео.

Turbo скорость обладает рядом существенных преимуществ:

👉 Моментальная скорость получения результатов
👉 Неограниченное количество потоков
👉 Никаких ошибок из-за высокой загрузки инструмента
👉 Десктоп и мобильная версия поиска
👉 Результаты поиска также доступны в HTML формате
👉 Возможность получения рекламных блоков TopAds и BottomAds

Стоимость режима Turbo: +10 руб за 1000 запросов к вашему тарифному плану.
🔥2👍1
⚡️ 11.07 Парсинг карусели с товарами в Яндекс Live

В инструмент Яндекс Live добавили возможность собирать данные в XML и JSON формате из карусели с товарами, расположенной вверху страницы с результатами поиска. Карусель встречается не на всех запросах, наличие сильно зависит от региона поиска.

Позволяет собрать следующие данные: адрес сайта (магазина), ссылка на товар в зашифрованном виде, название товара, его изображение и цена; название и ИНН организации, разместившей данное объявление.

Чтобы включить вывод данных из карусели, необходимо в настройках по умолчанию поставить соответствующую галку, либо использовать параметр &scroller=1. Одним запросом можно парсить и карусель, и рекламные объявления, используя сочетание параметров &ads=1&scroller=1.
👍2
⚡️ 15.07 Проблемы на стороне Яндекса


Сегодня с 15:40 до 16:00 наблюдались технические проблемы на стороне Яндекса, в связи с этим инструменты ЯндексXML и ЯндексLive могли работать с ошибками.

Также некорректно работала сама выдача Яндекса, на ya.ru показывалась только первая страница выдачи и не верно определялся регион поиска. В связи с этим, по запросам, проведенным в это время с помощью инструмента ЯндексLive, отдавались результаты с кодом 15 (результатов не найдено).

На данный момент работа сервисов восстановлена.
👍3
⚡️ 03.09 Проблемы с открытием сайтов

Со вчерашнего дня наблюдаются проблемы с открытием многих сайтов в интернете, в том числе и xmlstock.com.

Это глобальные проблемы на уровне DNS-сервисов интернет-провайдеров. Также могут быть проблемы при пополнении баланса.

По всем вопросам пишите в поддержку.
👍2
⚡️ 08.11 Яндекс ухудшит условия по Search Api. Синхронный и асинхронный режим.

❗️В Яндекс Cloud долго думали, как испортить то, что хорошо работает и придумали асинхронную, то есть отложенную выдачу. Выдача в реальном времени, как сейчас, теперь будет называться синхронной.

Принцип работы нового метода следующий:
1. Вы отправляете запрос;
2. Получаете в ответ ID операции, запоминаете его;
3. Через 5 минут делаете повторный запрос с использованием полученного ранее ID-запроса и только тогда появится результат поиска, а может и не появится. Зависит от настроения Яндекса 😊

🕓 Каждая операция будет обрабатываться минимум 5 минут, однако возможны дополнительные задержки, так как точное время формирования ответа на стороне Яндекса предсказать невозможно.

💸 Новые цены на асинхронную и синхронную выдачу пока неизвестны, но точно известно что синхронная выдача будет значительно дороже и станет фактически заградительной для обычных пользователей. Все изменения планируют окончательно ввести с начала следующего года. Пока работаем по-старому и есть время подготовиться.

Что мы можем спрогнозировать уже сейчас:
👉 Ваши скрипты и программы продолжат работать с синхронной выдачей, но стоить будет дорого.
👉 Для работы с асинхронным режимом необходимо будет переписать свой софт в соответствии с новым алгоритмом работы.
👉 KeyCollector для съема позиций в Яндексе в асинхронном режиме станет непригодным, т.к. программа больше не обновляется.
👉 Возможна нестабильная работа или длительное ожидание ответа асинхронной системы запросов при высоких нагрузках.
👉 Парсинг живой выдачи станет актуален как никогда.

В ближайшее время мы запустим тестовый функционал для асинхронных запросов с подробными инструкциями. Ожидайте анонсов и следите за обновлениями!
Please open Telegram to view this post
VIEW IN TELEGRAM
😱7😁1
⚡️ 14.01 Пользователи массово жалуются на сбои в работе операторов связи и сети интернет

В данный момент наблюдаются массовые сбои в сети Интернет, в связи с этим некоторые сайты и сервисы могут быть недоступны, в том числе и наш сайт. В случае возникновения неполадок - ожидайте восстановления работоспособности.
😱1
⚡️16.01 Проблемы с GoogleXML

Наблюдаются проблемы с парсингом Google. Срабатывает новая защита от поисковой системы на наличие включенного javascript, вследствие чего обычный парсинг теперь невозможен. Инструмент Google XML временно остановлен. Приносим извинения за доставленные неудобства.
😱1
⚡️16.01 Частичное восстановление GoogleXML

Частично восстановили работу сервиса для некоторых пользователей с ограничением на количество запросов в секунду. Новых пользователей будем подключать по мере возможностей. Проблема в том, что новый метод потребляет значительные ресурсы сервера (В десятки раз больше), поэтому нам не хватает мощностей обслужить все запросы. Для стабильной работы, при превышении определенных порогов нагрузки, сбор может отключаться на короткий промежуток времени и выдавать ошибку 101. В ближайшие дни будем работать над оптимизацией алгоритмов и увеличением количества серверов.

Внимание! Если у вас есть соображения, как обойти новую блокировку Google без использования Javascript, пишите нам в чат поддержки или на почту. Вознаграждение гарантируем!
👍2👏1
⚡️ 19.01 Последние новости по GoogleXML

Компания Google заявила, что начала требовать от пользователей включения JavaScript для использования поиска Google.

"В электронном письме TechCrunch представитель компании заявил, что изменение призвано «лучше защитить» Google Search от вредоносной активности, такой как боты и спам, и улучшить общий опыт Google Search для пользователей."


С нашей стороны работы по прежнему продолжаются, вся команда работает в усиленном режиме и пытается как можно скорее привести сервис GoogleXML в полную работоспособность. На данный момент Desktop работает в формате XML и JSON, Mobile - временно отключен.
😱1
⚡️ 21.01 Восстановили парсинг Google: обходим JavaScript защиту

Уважаемые пользователи! Рады сообщить, что на данный момент мы практически полностью восстановили работу наших инструментов для парсинга ПС Google, несмотря на серьезные изменения, внедренные Google 15 января, приведшие к временным перебоям в работе сервиса.

Что сейчас работает:
Парсинг Google поиска (десктоп): доступен XML и JSON. Формат HTML временно недоступен. Обратите внимание: в теге found priority="all" отображается количество документов на текущей странице, а блоки «Вопросы по теме», «Запросы по теме» и «Другие также ищут» временно не выводятся.

Парсинг мобильной выдачи Google: функционирует полностью, поддерживаются форматы XML, JSON и HTML.
Парсинг Google Картинок: полностью восстановлен, доступны XML, JSON и HTML.
Парсинг Google Новостей: полностью восстановлен, доступны XML, JSON и HTML.
Парсинг Google Видео: полностью восстановлен, доступны XML, JSON и HTML.

Важное замечание
Из-за новых требований Google к протоколам взаимодействия скорость парсинга временно ограничена 15 потоками, этого вполне достаточно для большинства сценариев использования. Мы активно работаем над оптимизацией системы и устранением оставшихся ограничений.

Изменения Google включают новые меры защиты, использование JavaScript и пересмотренные требования к обработке сессий, что усложняет обработку данных, но мы готовы адаптироваться и развивать наши инструменты для предоставления надежных решений.

Если вы нашли какие то ошибки в работе инструмента пишите в поддержку чтобы мы могли оперативно их исправить!
👍31
❗️ 30.01 Технические работы по GoogleXML

Внимание! Сервис GoogleXML работает в ограниченном режиме. Ведутся технические работы. Приносим извинения за неудобства. Постараемся восстановить полную работоспособность в кратчайшие сроки.
👍4
⚡️ 07.02 Добавили асинхронные запросы в ЯндексXML Search Api

Уважаемые пользователи! В конце прошлого года Яндекс анонсировал в своем Search Api ввод асинхронных (отложенных) запросов. Новость об этом мы публиковали в ноябре.

Уже сейчас мы добавили поддержку асинхронных запросов в нашу систему и рекомендуем заранее протестировать и адаптировать свой софт для работы с асинхронной выдачей, так как цены на синхронную выдачу Яндекс может поднять в несколько раз уже в марте.

Как это работает?

Асинхронный режим позволяет выполнять поиск в два этапа:
1. Отправляете запрос с параметром &delayed=1.
2. Получаете req_id в ответе.
3. Через 5 минут запрашиваете результат с этим req_id.
4. Если ответ не готов, повторяете запрос результатов с интервалом 10-60 секунд.

Пример запроса:
https://xmlstock.com/yandex/xml/?user=ID&key=KEY&query=окна&delayed=1


Пример ответа с req_id:
<?xml version="1.0" encoding="UTF-8"?>
<yandexsearch version="2.0">
<response date="20250204T185502">
<req_id>spr3s0ngc4citnd30muk</req_id>
</response>
</yandexsearch>


Забираем результаты через 5 минут:
https://xmlstock.com/yandex/xml/?user=ID&key=KEY&req_id=spr3s0ngc4citnd30muk


Важные моменты:
- Ответ обычно готов через 5 минут, но в редких случаях может занять несколько часов (зависит от нагрузки на стороне Яндекса).
- Запросить результат можно не чаще чем раз в 10 секунд.
- Ответ хранится 24 часа.
- Стоимость на асинхронные запросы сейчас такая же как на синхронные. Окончательные цены, которые будут в марте, пока неизвестны.
- Функционал на стадии тестирования. При обнаружении ошибок и багов, просьба сообщить нам в чате поддержки.

Коды ошибок для асинхронных запросов:
201 - Повторный запрос результатов можно совершать не чаще одного раза в минуту
202 - Запрос еще не обработан, попробуйте позже
203 - Запроса c заданным ID не существует либо вышло время его хранения

Подробнее о формате запросов в документации
Обновленный список кодов ошибок

Также можно переключать режимы работы по умолчанию в настройках инструмента Яндекс XML Proxy, выбирая тип поиска Синхронный (delayed=0), Асинхронный (delayed=1).
👍1
⚡️ 26.02 Обновление Яндекс SearchAPI и изменение стоимости с 1 марта

Уважаемые пользователи!

С 1 марта 2025 года Яндекс вносит глобальные изменения в работу SearchAPI, разделяя его на два формата выдачи:

👉 Синхронный (в реальном времени)
👉 Асинхронный (с задержкой)

Стоимость синхронных запросов составит 480 рублей за 1000 запросов, независимо от объемов потребления, что выходит за рамки нашего понимания и здравого смысла. В связи с этим мы приняли решение полностью отказаться от этого формата и перейти на асинхронный режим.


❗️Что изменится для пользователей?
Мы сделали всё возможное, чтобы для наших пользователей переход был максимально комфортным.
В течение месяца мы обновляли систему и подготовили два варианта работы с нашим API:

👉 Гибридный режим (начнет работать с 1 марта)
👉 Асинхронный режим (работает уже сейчас)

❗️Новая стоимость ЯндексXML с 1 марта 2025 года
ТП Базовый — 24 рубля за 1000 запросов
ТП Оптимальный — 22 рубля за 1000 запросов
ТП Максимум — 20 рублей за 1000 запросов

Индивидуальные тарифные планы для оптовых клиентов будут пересмотрены. Также отменяются скидки на ночные запросы.


❗️Описание режимов работы

Гибридный режим:
Этот режим максимально близок к синхронному и в большинстве случаев не потребует доработки вашего софта, программы такие как Key Collector, Top-Site и другие также будут с ним работать. Включен по умолчанию в инструменте Яндекс XML Proxy на основном URL для совершения запросов. Все запросы кешируются в течение 3-х часов, поэтому повторный запрос данных из кеша - бесплатный. При необходимости кеш можно сбросить вручную.

1) Отправляете запрос, как обычно.
2) В течение 2-5 секунд получаете либо сразу готовый результат, либо ошибку 210 (запрос поставлен в очередь).
3) Через 5–10 секунд отправляете повторный запрос (делаете перепроверку запроса): Если данные готовы, то моментально получаете результат. Если нет — ошибку 202 (запрос еще не обработан).
4) Повторяете запрос с интервалом 5–10 секунд, пока не получите результат.
5) Тарификация происходит в момент первой отправки запроса на наше API, независимо от того получили вы ответ сразу или отправили запрос в очередь.
6) Повторный запрос результатов из кеша в течение 3-х часов - бесплатный

Асинхронный режим:
Процесс поиска выполняется в два этапа.

1) Отправляете запрос с параметром &delayed=1.
2) Получаете req_id в ответе.
3) Через 5–10 секунд запрашиваете результат по этому req_id.
4) Если данные еще не готовы, повторяете запрос с интервалом 10–60 секунд.
5) Тарификация происходит в момент отправки запроса на наше API.
6) Запрос результатов через req_id - бесплатный. Он хранится в течение 3-х часов

❗️Будущее Яндекс SearchAPI
Яндекс пока что снизил задержку асинхронной выдачи: вместо заявленных 5 минут, она варьируется в зависимости от загрузки сервисов, и запрос может быть обработан уже через несколько секунд. Однако в будущем задержка получения результатов может быть увеличена.

К сожалению, Яндекс SearchAPI как приемник Яндекс XML перестает быть надежным и быстрым инструментом получения поисковой выдачи:
- Вводятся жесткие требования к объему потребления
- Ужесточаются лимиты и ограничения
- Повышаются тарифы

По итогам марта мы проанализируем работу нового формата и примем решение о дальнейшей судьбе этого инструмента в рамках нашего сервиса. Также из-за роста затрат на парсинг живой выдачи, с 1 апреля планируется пересмотр стоимости и других инструментов.

По всем вопросам пишите в наш чат или телеграм, мы поможем вам с переходом на новое API. Спасибо, что остаётесь с нами!
😢7😡1
⚡️ 20.03 Медленная скорость сбора Google

Сегодня Google обновил верстку, из-за чего многие сервисы временно вышли из строя. В результате наблюдается большой приток пользователей и повышенная активность, что влияет на скорость работы системы.

⚠️ Не переживайте – всё работает, просто нагрузка высокая. Просим набраться терпения. Спасибо за понимание!
⚠️ 17.04 Проблемы с парсингом Google (мобильная выдача)

Сегодня зафиксированы массовые сбои при парсинге Google, по большей части мобильной версии. Десктопная выдача пока работает более менее стабильно. Предположительно, Google внедрил новые механизмы защиты от автоматизированных запросов. Мы анализируем изменения и ищем рабочее решение.
⚡️ 15.07 Небольшое обновление в Яндекс SearchAPI

👉 Обновлены доменные зоны (типы поиска), параметр &domain=.

Теперь доступны:
ru — Российский
by, be — Белорусский
kz, kk — Казахский
com — Международный
com.tr, tr — Турецкий
uz — Узбекский

👉 Также добавлен необязательный параметр &noreask= — режим обработки опечаток в поисковом запросе:

0 (по умолчанию) - опечатки автоматически исправляются.
1 - поиск выполняется строго по переданному запросу, без исправлений.
⚡️ 21.07 Проблемы с работой API.

Сегодня ночью наблюдались проблемы с работой API Google и ЯндексLive.
На данный момент работа систем полностью восстановлена. Приносим извинения за неудобства.
🔧 Технические работы с 21:00 до 22:00 (по МСК)

Сегодня, 28.07 с 21:00 до 22:00 по московскому времени, на сайте будут проводиться плановые технические работы. Возможны кратковременные перерывы в работе сервиса продолжительностью от 5 до 20 минут.

Благодарим за понимание!