我不想访问这个提供免费代理的网站,而是想抓取信息然后过滤。我尝试使用请求 html 来执行此操作,但到目前为止,按照教程并阅读库,它没有发生,当我运行它时,它只是输出 []。这是我目前拥有的代码,我试图抓取具有 IP 的页面部分import requestsfrom bs4 import BeautifulSoupfrom requests_html import HTMLSession# cre
2021-06-19
我知道之前有人问过类似的问题,但似乎没有一个适用于这种特殊情况。我在几个网站上都遇到过这个问题,所以对于这个问题,我随机选择了SO 自己的标签列表的第一页。如果你看第一页上的第一个条目,你会看到这个:显示标签描述的开头、问题总数以及今天和本周提出的问题数量。这些信息很容易选择:from selenium.webdriver import Chromedriver = Chrome()driver.
2019-04-30