tor

    • 2023.05.15 | admin | 218次围观
      网站不能抓取?6种爬虫破禁方法!
      除了处理网站表单,requests模块还是一个设置请求头的利器。HTTP 的请求头是在你每次向网络服务器发送请求时,传递的一组属性和配置信息。HTTP 定义了十几种古怪的请求头类型,不过大多数都不常用。只有下面的七个字段被大多数浏览器用来初始化所有网络请求(表中信息是我自己浏览器的数据)。 经典的 Python 爬虫在使用urllib标准库时,都会发送如下的请求头: 如果你是一个防范爬虫的网站管理员,你会让哪个请求头访问你的网站呢? 安装 Requests 可在模块的网站上找...
    • 2023.05.07 | admin | 155次围观
      如何让自己的浏览器没有广告2
      这次的推荐的浏览器成本就有点高,它需要有点技术能力或者能够科学上网的人才能更好的使用,不适合给小白。这款让自己浏览器没有广告的浏览器就是众所周知的Tor浏览器。 我们都知道,在大多数情况下,当我们与一台远程服务器建立连接的时候,会将自己的IP地址泄漏给这台服务器。这似乎是不可避免的,否则电脑上没有任何浏览器,服务器怎么知道我们在哪儿,从而返回数据包给我们呢?泄漏IP地址会造成隐私泄漏,比如用户的地理位置信息会因为IP地址的泄漏而被服务器知道。这也是为什么我们浏览器会有很多广告...
    1