GitHub Разработчика
16.5K subscribers
440 photos
314 videos
2 files
752 links
Здесь ты найдешь полезные репозитории с GitHub

Связь: @devmangx

РКН: https://clck.ru/3FocDP
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Scrapling

Самое раздражающее в написании парсеров это обновления сайта. Как только страница меняется, старые селекторы ломаются, и приходится заново разбирать структуру и дебажить код.

Недавно я наткнулся на Scrapling это open source-библиотека адаптивного парсера, которая решает эту проблему. Она умеет автоматически переназначать элементы, если структура сайта изменилась.

Кроме того, Scrapling может отслеживать изменения в расположении элементов и имеет встроенные механизмы обхода антибот-защиты: маскировку TLS-отпечатков, обход Cloudflare и другие. Благодаря этому парсер работает стабильнее и надежнее.

После установки через pip нужно дополнительно выполнить scrapling install, чтобы скачать зависимости для браузера. Если занимаешься веб-скрейпингом — стоит глянуть.

📁 Language: #Python 97.8%

⭐️ Stars: 7.8k

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
14👍3🔥2