XMLstock
225 subscribers
11 photos
46 links
Инструменты для парсинга поисковой выдачи Яндекс и Google в реальном времени. Новости сервиса и обновления.

Сайт: https://xmlstock.com
Поддержка: @hh_developer
Download Telegram
❗️30.01.2023 Проблемы с резолвом доменных имен

Наблюдаются глобальные проблемы с резолвом доменных имен. Часть сервисов может не работать или работать не стабильно.

Причиной проблемы являются глобальные неполадки в ru-зоне доменных имен, что может затрагивать работу всех сервисов, обращение к которым осуществляется с помощью доменов в зоне .RU

UPD 21.20 Похоже на данный момент времени аварию устранили. Сейчас наши сервисы должны работать в штатном режиме. Мы продолжаем следить за ситуацией.
👍1🤔1😱1
⚡️ 04.03.2024 Прокачали тарифные планы!

Наши тарифные планы стали более универсальными! Мы включили во все тарифные планы траты по Яндекс XML Proxy, а это значит, что теперь можно подключить выгодный тариф и пользоваться всеми инструментами с общего баланса. Условия тарифных планов при этом не изменились!

При активации выбранного тарифного плана, с вашего баланса будет списана его стоимость и заморожена на 30 календарных дней. Зарезервированная сумма отобразится в соответствующей строке и будет расходоваться в первую очередь при совершении запросов на любом из наших инструментов. При использовании всех замороженных средств, дальнейшее списание за запросы будет происходить с основного баланса аккаунта по цене активного тарифного плана.

По окончании срока действия тарифа неиспользованные зарезервированные средства на новый период не переносятся.
👍1🎉1
Сегодня обнаружили что программа KeyCollector не совсем корректно отправляет данные в ЯндексXML.
KeyCollector в своих запросах отправляет параметр фильтрации результатов filter=none, тогда как в Яндекс XML значение по умолчанию идет filter=moderate

https://cloud.yandex.ru/ru/docs/search-api/concepts/get-request

none
— фильтрация отключена. В выдачу включаются любые документы вне зависимости от содержимого.
moderate — умеренный фильтр (значение по умолчанию). Из выдачи исключаются документы, относящиеся к категории "для взрослых", если запрос явно не направлен на поиск подобных ресурсов.
strict — семейный фильтр. Вне зависимости от поискового запроса из выдачи исключаются документы, относящиеся к категории "для взрослых", а также содержащие ненормативную лексику.

Пользователи могут получать некорректные данные в связи с этим.

Eсли необходимо, чтобы выдача точно соответствовала стандартной, в настройках региональности в KeyCollector в поле GET-параметры также надо прописать filter=moderate.

Подробнее тут https://xmlstock.com/?do=help-yaxml-settings
👍7
⚡️ 22.03.2024 Вывод результатов из блоков "Запросы по теме" и "Люди Ищут"

Добавили в XML и JSON выдачу дополнительные результаты поиска из блоков "Люди Ищут" для Яндекс Live и "Запросы по теме" для Google XML Search.

Активируется в обоих инструментах с помощью добавления параметра &related=1 или через настройки по умолчанию. В ПС Google также дополнительно показывается блок "Похожие Вопросы".
👍3
⚡️ 05.04 Парсинг дополнительной информации из Яндекс Директ

Улучшили парсинг Яндекс Директ из живой выдачи.

Теперь в инструменте Яндекс Live дополнительно выводятся следующие данные из рекламных объявлений : номера телефонов, ссылка на профиль компании в Яндекс, город и станция метро; название и ИНН организации, разместившей данное объявление (рекламные агентства). Если какая-то информация отсутствует, то она не выводится.

Также номера телефонов выводятся из основной выдачи (при наличии)

Эти данные пока доступны только в десктоп выдаче.
👍1🔥1
⚡️ 02.05 Парсинг Видео из поиска Google

Добавили парсинг результатов выдачи из вкладки Видео в поисковой системе Google.

Для этого в нашем инструменте Google Xml Search необходимо использовать параметр &tbm=video или указать Результаты поиска - Видео в настройках по умолчанию. Для указания страны поиска необходимо задать параметры &gl=, &hl=

Обратите внимание, что для Google XML Search теперь доступен парсинг сразу 4-х видов поиска: Поисковая Выдача, Картинки, Новости и Видео.
👍2
⚡️31.05 Новые параметры для поиска Google

Добавили поддержку новых параметров для поиска Google:

&nfpr - Исправление опечаток
&safe - Безопасный поиск

Подробное описание всех доступных параметров:
https://xmlstock.com/?do=help-googlexml-params
👍1
⚡️ 06.07 Парсинг живой выдачи Яндекс на Turbo скорости без ошибок

Пользователи, которые собирают выдачу с помощью инструмента ЯндексLive наверняка заметили медленную скорость сбора и нестабильность работы данного инструмента. Сегодня мы хотим анонсировать обновление системы ЯндексLive, а именно добавление режима "Turbo скорость".

С помощью этого режима можно парсить поисковую выдачу Яндекса в формате xml, json, html на огромной скорости без каптчи и ошибок. Переключение режима сбора осуществляется в настройках личного кабинета (выбор Типа поиска). Также можно выбирать режим, отправляя параметр &tbm=turbo в GET-параметрах запросов. Турбо режим доступен только для поисковой выдачи и недоступен для сбора картинок и видео.

Turbo скорость обладает рядом существенных преимуществ:

👉 Моментальная скорость получения результатов
👉 Неограниченное количество потоков
👉 Никаких ошибок из-за высокой загрузки инструмента
👉 Десктоп и мобильная версия поиска
👉 Результаты поиска также доступны в HTML формате
👉 Возможность получения рекламных блоков TopAds и BottomAds

Стоимость режима Turbo: +10 руб за 1000 запросов к вашему тарифному плану.
🔥2👍1
⚡️ 11.07 Парсинг карусели с товарами в Яндекс Live

В инструмент Яндекс Live добавили возможность собирать данные в XML и JSON формате из карусели с товарами, расположенной вверху страницы с результатами поиска. Карусель встречается не на всех запросах, наличие сильно зависит от региона поиска.

Позволяет собрать следующие данные: адрес сайта (магазина), ссылка на товар в зашифрованном виде, название товара, его изображение и цена; название и ИНН организации, разместившей данное объявление.

Чтобы включить вывод данных из карусели, необходимо в настройках по умолчанию поставить соответствующую галку, либо использовать параметр &scroller=1. Одним запросом можно парсить и карусель, и рекламные объявления, используя сочетание параметров &ads=1&scroller=1.
👍2
⚡️ 15.07 Проблемы на стороне Яндекса


Сегодня с 15:40 до 16:00 наблюдались технические проблемы на стороне Яндекса, в связи с этим инструменты ЯндексXML и ЯндексLive могли работать с ошибками.

Также некорректно работала сама выдача Яндекса, на ya.ru показывалась только первая страница выдачи и не верно определялся регион поиска. В связи с этим, по запросам, проведенным в это время с помощью инструмента ЯндексLive, отдавались результаты с кодом 15 (результатов не найдено).

На данный момент работа сервисов восстановлена.
👍3
⚡️ 03.09 Проблемы с открытием сайтов

Со вчерашнего дня наблюдаются проблемы с открытием многих сайтов в интернете, в том числе и xmlstock.com.

Это глобальные проблемы на уровне DNS-сервисов интернет-провайдеров. Также могут быть проблемы при пополнении баланса.

По всем вопросам пишите в поддержку.
👍2
⚡️ 08.11 Яндекс ухудшит условия по Search Api. Синхронный и асинхронный режим.

❗️В Яндекс Cloud долго думали, как испортить то, что хорошо работает и придумали асинхронную, то есть отложенную выдачу. Выдача в реальном времени, как сейчас, теперь будет называться синхронной.

Принцип работы нового метода следующий:
1. Вы отправляете запрос;
2. Получаете в ответ ID операции, запоминаете его;
3. Через 5 минут делаете повторный запрос с использованием полученного ранее ID-запроса и только тогда появится результат поиска, а может и не появится. Зависит от настроения Яндекса 😊

🕓 Каждая операция будет обрабатываться минимум 5 минут, однако возможны дополнительные задержки, так как точное время формирования ответа на стороне Яндекса предсказать невозможно.

💸 Новые цены на асинхронную и синхронную выдачу пока неизвестны, но точно известно что синхронная выдача будет значительно дороже и станет фактически заградительной для обычных пользователей. Все изменения планируют окончательно ввести с начала следующего года. Пока работаем по-старому и есть время подготовиться.

Что мы можем спрогнозировать уже сейчас:
👉 Ваши скрипты и программы продолжат работать с синхронной выдачей, но стоить будет дорого.
👉 Для работы с асинхронным режимом необходимо будет переписать свой софт в соответствии с новым алгоритмом работы.
👉 KeyCollector для съема позиций в Яндексе в асинхронном режиме станет непригодным, т.к. программа больше не обновляется.
👉 Возможна нестабильная работа или длительное ожидание ответа асинхронной системы запросов при высоких нагрузках.
👉 Парсинг живой выдачи станет актуален как никогда.

В ближайшее время мы запустим тестовый функционал для асинхронных запросов с подробными инструкциями. Ожидайте анонсов и следите за обновлениями!
Please open Telegram to view this post
VIEW IN TELEGRAM
😱7😁1
⚡️ 14.01 Пользователи массово жалуются на сбои в работе операторов связи и сети интернет

В данный момент наблюдаются массовые сбои в сети Интернет, в связи с этим некоторые сайты и сервисы могут быть недоступны, в том числе и наш сайт. В случае возникновения неполадок - ожидайте восстановления работоспособности.
😱1
⚡️16.01 Проблемы с GoogleXML

Наблюдаются проблемы с парсингом Google. Срабатывает новая защита от поисковой системы на наличие включенного javascript, вследствие чего обычный парсинг теперь невозможен. Инструмент Google XML временно остановлен. Приносим извинения за доставленные неудобства.
😱1
⚡️16.01 Частичное восстановление GoogleXML

Частично восстановили работу сервиса для некоторых пользователей с ограничением на количество запросов в секунду. Новых пользователей будем подключать по мере возможностей. Проблема в том, что новый метод потребляет значительные ресурсы сервера (В десятки раз больше), поэтому нам не хватает мощностей обслужить все запросы. Для стабильной работы, при превышении определенных порогов нагрузки, сбор может отключаться на короткий промежуток времени и выдавать ошибку 101. В ближайшие дни будем работать над оптимизацией алгоритмов и увеличением количества серверов.

Внимание! Если у вас есть соображения, как обойти новую блокировку Google без использования Javascript, пишите нам в чат поддержки или на почту. Вознаграждение гарантируем!
👍2👏1
⚡️ 19.01 Последние новости по GoogleXML

Компания Google заявила, что начала требовать от пользователей включения JavaScript для использования поиска Google.

"В электронном письме TechCrunch представитель компании заявил, что изменение призвано «лучше защитить» Google Search от вредоносной активности, такой как боты и спам, и улучшить общий опыт Google Search для пользователей."


С нашей стороны работы по прежнему продолжаются, вся команда работает в усиленном режиме и пытается как можно скорее привести сервис GoogleXML в полную работоспособность. На данный момент Desktop работает в формате XML и JSON, Mobile - временно отключен.
😱1
⚡️ 21.01 Восстановили парсинг Google: обходим JavaScript защиту

Уважаемые пользователи! Рады сообщить, что на данный момент мы практически полностью восстановили работу наших инструментов для парсинга ПС Google, несмотря на серьезные изменения, внедренные Google 15 января, приведшие к временным перебоям в работе сервиса.

Что сейчас работает:
Парсинг Google поиска (десктоп): доступен XML и JSON. Формат HTML временно недоступен. Обратите внимание: в теге found priority="all" отображается количество документов на текущей странице, а блоки «Вопросы по теме», «Запросы по теме» и «Другие также ищут» временно не выводятся.

Парсинг мобильной выдачи Google: функционирует полностью, поддерживаются форматы XML, JSON и HTML.
Парсинг Google Картинок: полностью восстановлен, доступны XML, JSON и HTML.
Парсинг Google Новостей: полностью восстановлен, доступны XML, JSON и HTML.
Парсинг Google Видео: полностью восстановлен, доступны XML, JSON и HTML.

Важное замечание
Из-за новых требований Google к протоколам взаимодействия скорость парсинга временно ограничена 15 потоками, этого вполне достаточно для большинства сценариев использования. Мы активно работаем над оптимизацией системы и устранением оставшихся ограничений.

Изменения Google включают новые меры защиты, использование JavaScript и пересмотренные требования к обработке сессий, что усложняет обработку данных, но мы готовы адаптироваться и развивать наши инструменты для предоставления надежных решений.

Если вы нашли какие то ошибки в работе инструмента пишите в поддержку чтобы мы могли оперативно их исправить!
👍31
❗️ 30.01 Технические работы по GoogleXML

Внимание! Сервис GoogleXML работает в ограниченном режиме. Ведутся технические работы. Приносим извинения за неудобства. Постараемся восстановить полную работоспособность в кратчайшие сроки.
👍4
⚡️ 07.02 Добавили асинхронные запросы в ЯндексXML Search Api

Уважаемые пользователи! В конце прошлого года Яндекс анонсировал в своем Search Api ввод асинхронных (отложенных) запросов. Новость об этом мы публиковали в ноябре.

Уже сейчас мы добавили поддержку асинхронных запросов в нашу систему и рекомендуем заранее протестировать и адаптировать свой софт для работы с асинхронной выдачей, так как цены на синхронную выдачу Яндекс может поднять в несколько раз уже в марте.

Как это работает?

Асинхронный режим позволяет выполнять поиск в два этапа:
1. Отправляете запрос с параметром &delayed=1.
2. Получаете req_id в ответе.
3. Через 5 минут запрашиваете результат с этим req_id.
4. Если ответ не готов, повторяете запрос результатов с интервалом 10-60 секунд.

Пример запроса:
https://xmlstock.com/yandex/xml/?user=ID&key=KEY&query=окна&delayed=1


Пример ответа с req_id:
<?xml version="1.0" encoding="UTF-8"?>
<yandexsearch version="2.0">
<response date="20250204T185502">
<req_id>spr3s0ngc4citnd30muk</req_id>
</response>
</yandexsearch>


Забираем результаты через 5 минут:
https://xmlstock.com/yandex/xml/?user=ID&key=KEY&req_id=spr3s0ngc4citnd30muk


Важные моменты:
- Ответ обычно готов через 5 минут, но в редких случаях может занять несколько часов (зависит от нагрузки на стороне Яндекса).
- Запросить результат можно не чаще чем раз в 10 секунд.
- Ответ хранится 24 часа.
- Стоимость на асинхронные запросы сейчас такая же как на синхронные. Окончательные цены, которые будут в марте, пока неизвестны.
- Функционал на стадии тестирования. При обнаружении ошибок и багов, просьба сообщить нам в чате поддержки.

Коды ошибок для асинхронных запросов:
201 - Повторный запрос результатов можно совершать не чаще одного раза в минуту
202 - Запрос еще не обработан, попробуйте позже
203 - Запроса c заданным ID не существует либо вышло время его хранения

Подробнее о формате запросов в документации
Обновленный список кодов ошибок

Также можно переключать режимы работы по умолчанию в настройках инструмента Яндекс XML Proxy, выбирая тип поиска Синхронный (delayed=0), Асинхронный (delayed=1).
👍1
⚡️ 26.02 Обновление Яндекс SearchAPI и изменение стоимости с 1 марта

Уважаемые пользователи!

С 1 марта 2025 года Яндекс вносит глобальные изменения в работу SearchAPI, разделяя его на два формата выдачи:

👉 Синхронный (в реальном времени)
👉 Асинхронный (с задержкой)

Стоимость синхронных запросов составит 480 рублей за 1000 запросов, независимо от объемов потребления, что выходит за рамки нашего понимания и здравого смысла. В связи с этим мы приняли решение полностью отказаться от этого формата и перейти на асинхронный режим.


❗️Что изменится для пользователей?
Мы сделали всё возможное, чтобы для наших пользователей переход был максимально комфортным.
В течение месяца мы обновляли систему и подготовили два варианта работы с нашим API:

👉 Гибридный режим (начнет работать с 1 марта)
👉 Асинхронный режим (работает уже сейчас)

❗️Новая стоимость ЯндексXML с 1 марта 2025 года
ТП Базовый — 24 рубля за 1000 запросов
ТП Оптимальный — 22 рубля за 1000 запросов
ТП Максимум — 20 рублей за 1000 запросов

Индивидуальные тарифные планы для оптовых клиентов будут пересмотрены. Также отменяются скидки на ночные запросы.


❗️Описание режимов работы

Гибридный режим:
Этот режим максимально близок к синхронному и в большинстве случаев не потребует доработки вашего софта, программы такие как Key Collector, Top-Site и другие также будут с ним работать. Включен по умолчанию в инструменте Яндекс XML Proxy на основном URL для совершения запросов. Все запросы кешируются в течение 3-х часов, поэтому повторный запрос данных из кеша - бесплатный. При необходимости кеш можно сбросить вручную.

1) Отправляете запрос, как обычно.
2) В течение 2-5 секунд получаете либо сразу готовый результат, либо ошибку 210 (запрос поставлен в очередь).
3) Через 5–10 секунд отправляете повторный запрос (делаете перепроверку запроса): Если данные готовы, то моментально получаете результат. Если нет — ошибку 202 (запрос еще не обработан).
4) Повторяете запрос с интервалом 5–10 секунд, пока не получите результат.
5) Тарификация происходит в момент первой отправки запроса на наше API, независимо от того получили вы ответ сразу или отправили запрос в очередь.
6) Повторный запрос результатов из кеша в течение 3-х часов - бесплатный

Асинхронный режим:
Процесс поиска выполняется в два этапа.

1) Отправляете запрос с параметром &delayed=1.
2) Получаете req_id в ответе.
3) Через 5–10 секунд запрашиваете результат по этому req_id.
4) Если данные еще не готовы, повторяете запрос с интервалом 10–60 секунд.
5) Тарификация происходит в момент отправки запроса на наше API.
6) Запрос результатов через req_id - бесплатный. Он хранится в течение 3-х часов

❗️Будущее Яндекс SearchAPI
Яндекс пока что снизил задержку асинхронной выдачи: вместо заявленных 5 минут, она варьируется в зависимости от загрузки сервисов, и запрос может быть обработан уже через несколько секунд. Однако в будущем задержка получения результатов может быть увеличена.

К сожалению, Яндекс SearchAPI как приемник Яндекс XML перестает быть надежным и быстрым инструментом получения поисковой выдачи:
- Вводятся жесткие требования к объему потребления
- Ужесточаются лимиты и ограничения
- Повышаются тарифы

По итогам марта мы проанализируем работу нового формата и примем решение о дальнейшей судьбе этого инструмента в рамках нашего сервиса. Также из-за роста затрат на парсинг живой выдачи, с 1 апреля планируется пересмотр стоимости и других инструментов.

По всем вопросам пишите в наш чат или телеграм, мы поможем вам с переходом на новое API. Спасибо, что остаётесь с нами!
😢7😡1