tag:screen-scraping

Python 请求-html，尝试在 Jscript 中加载所有信息

我不想访问这个提供免费代理的网站，而是想抓取信息然后过滤。我尝试使用请求 html 来执行此操作，但到目前为止，按照教程并阅读库，它没有发生，当我运行它时，它只是输出 []。这是我目前拥有的代码，我试图抓取具有 IP 的页面部分import requestsfrom bs4 import BeautifulSoupfrom requests_html import HTMLSession# cre

2021-06-19

从 ajax 驱动的弹出框中的工具提示中抓取文本

我知道之前有人问过类似的问题，但似乎没有一个适用于这种特殊情况。我在几个网站上都遇到过这个问题，所以对于这个问题，我随机选择了SO 自己的标签列表的第一页。如果你看第一页上的第一个条目，你会看到这个：显示标签描述的开头、问题总数以及今天和本周提出的问题数量。这些信息很容易选择：from selenium.webdriver import Chromedriver = Chrome()driver.

python selenium web-scraping beautifulsoup screen-scraping

2019-04-30

无法使用 Puppeteer 点击元素

url：我如何用木偶单击左蓝色按钮（使用隐身模式打开URL以查看按钮）？

screen-scraping puppeteer

2020-02-02