This media is not supported in your browser
VIEW IN TELEGRAM
Scrapling
Самое раздражающее в написании парсеров это обновления сайта. Как только страница меняется, старые селекторы ломаются, и приходится заново разбирать структуру и дебажить код.
Недавно я наткнулся на Scrapling это open source-библиотека адаптивного парсера, которая решает эту проблему. Она умеет автоматически переназначать элементы, если структура сайта изменилась.
Кроме того, Scrapling может отслеживать изменения в расположении элементов и имеет встроенные механизмы обхода антибот-защиты: маскировку TLS-отпечатков, обход Cloudflare и другие. Благодаря этому парсер работает стабильнее и надежнее.
После установки через pip нужно дополнительно выполнить scrapling install, чтобы скачать зависимости для браузера. Если занимаешься веб-скрейпингом — стоит глянуть.
📁 Language: #Python 97.8%
⭐️ Stars: 7.8k
➡️ Cсылка на GitHub
📱 @git_developer
Самое раздражающее в написании парсеров это обновления сайта. Как только страница меняется, старые селекторы ломаются, и приходится заново разбирать структуру и дебажить код.
Недавно я наткнулся на Scrapling это open source-библиотека адаптивного парсера, которая решает эту проблему. Она умеет автоматически переназначать элементы, если структура сайта изменилась.
Кроме того, Scrapling может отслеживать изменения в расположении элементов и имеет встроенные механизмы обхода антибот-защиты: маскировку TLS-отпечатков, обход Cloudflare и другие. Благодаря этому парсер работает стабильнее и надежнее.
После установки через pip нужно дополнительно выполнить scrapling install, чтобы скачать зависимости для браузера. Если занимаешься веб-скрейпингом — стоит глянуть.
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤4👍3🔥2