• 0
  • 0
分享
  • Selenium 最强反反爬方案来了!——软件测试圈
  • 橙子 2024-06-14 11:56:11 字数 2304 阅读 1797 收藏 0

  提到目前网上的反检测方法几乎都是掩耳盗铃,因为模拟浏览器有几十个特征可以被检测,仅仅隐藏 webdriver 这一个值是没有任何意义的。

  今天我们就来说说应该如何正确解决这个问题。

  我们首先给出解决方案,然后再说明这个解决方案,我是通过什么方式找到的。

  解决这个问题的关键,就是一个 js 文件,叫做stealth.min.js,稍后我会说明如何生成这个文件。

  我们需要设定,让 Selenium 或者 Pyppeteer 在打开任何页面之前,先运行这个 Js 文件。

  这里,我以 Selenium 为例来说明如何操作,我们编写如下代码:

  import time
  from selenium.webdriver import Chrome
  from selenium.webdriver.chrome.options import Options
  chrome_options = Options()
  chrome_options.add_argument("--headless")
  chrome_options.add_argument('user-agent=Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36')
  driver = Chrome('./chromedriver', options=chrome_options)
  with open('/Users/kingname/test_pyppeteer/stealth.min.js') as f:
      js = f.read()
  driver.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", {
    "source": js
  })
  driver.get('https://bot.sannysoft.com/')
  time.sleep(5)
  driver.save_screenshot('walkaround.png')
  # 你可以保存源代码为 html 再双击打开,查看完整结果
  source = driver.page_source
  with open('result.html', 'w') as f:
      f.write(source)

  运行截图如下:

1-1.png

  可以看到,虽然我使用的是无头模式,但是能够被识别的特征都被成功隐藏。大家还可以双击打开保存下来的 html 文件,看看是不是结果跟普通浏览器几乎一样。

  如果你使用的是 Pyppeteer,那么可以根据我上面文章中给出的方法,试着加载一下这个 js 文件,看看是不是也能成功隐藏特征。

  那么,这个stealth.min.js文件是怎么来的呢?这就要说到puppeteer了。我们知道,Python 版本的pyppeteer已经很久没有人维护了,但是Node.js 版本的 puppeteer持续有人维护,并且在持续更新,生态也越来越好。

  有开发者给 puppeteer 写了一套插件,叫做puppeteer-extra。其中,就有一个插件叫做puppeteer-extra-plugin-stealth。这个东西,就来专门用来让 puppeteer 隐藏模拟浏览器的指纹特征。

  这个东西是专门给 puppeteer 用的。所以,如果你使用的是 puppeteer,那么你可以根据它的 Readme说明,直接使用。

  那么,我们用 Python 的人怎么办呢?实际上也有办法。就是把其中的隐藏特征的脚本提取出来,做成一个单独的 js 文件。然后让 Selenium 或者 Pyppeteer 在打开任意网页之前,先运行一下这个 js 文件里面的内容。

  puppeteer-extra-plugin-stealth的作者还写了另外一个工具,叫做extract-stealth-evasions。这个东西就是用来生成stealth.min.js文件的。

  如果你在国外,并且网速足够快的话。那么你根据它的 Readme,首先安装 Node.js,然后安装 Npm,接着运行如下命令:

  npx extract-stealth-evasions

  就会在你执行命令的文件夹下面生成一个stealth.min.js文件。然后你就可以正常使用了。

  如果你在国内,那么执行这个命令的过程中,会有一个下载 Chromium 的过程,速度非常慢,虽然只有130MB,但是可能会下载好几个小时。

  此时,你需要把它的package.json和index.js两个文件保存到本地。然后打开package.json文件,修改其中的dependencies这一项,把里面的puppeteer改成puppeteer-core,如下图所示:

1-2.png

  然后修改index.js,给.launch()函数增加一个参数executablePath,指向你电脑上的 Chrome 浏览器,如下图所示:

1-3.png

  修改完成以后。首先执行yarn install安装依赖包。然后执行node index.js运行程序。1秒钟以后就会生成stealth.min.js了。


作者:kingname    

来源:http://www.51testing.com/html/78/n-7796778.html

  • 【留下美好印记】
    赞赏支持
登录 后发表评论
+ 关注

热门文章

    最新讲堂

      • 推荐阅读
      • 换一换
          •   接口一般指发生在系统的多个子服务之间,本系统与外部系统之间的信息交换。接口也就是大家熟称的API。例如电商平台中订单服务子系统中,订单中商品sku详细信息需要到商品服务中获取,订单服务调取商品服务的商品信息接口。  接口测试属于集成测试阶段,接口应用于多个系统或服务间的信息获取或者信息更新。这部分工作由于涉及到多个开发人员,测试人员通常站在系统全局或者系统端到端流程的立场,更容易发现问题和定位责任方。  接口测试大家经常觉得难度很大,一般是两个方面的问题没得到解决:测试需求分析和测试手段。本篇文章详细为大家解决这两方面的问题,一方面提供测试需求分析方法和案例,另一方面讲解接口自动化测试之p...
            12 12 1880
            分享
          •   苹果 Vision Pro的新用户可能会对发布时的原生应用选择感到失望,据称大约有 150 款应用是为该头显开发的体验。1 月 16 日,苹果公司为 Apple Vision Pro 开放了一个版本的应用商店,让开发者有机会在该头显 2 月 2 日发布日期之前添加自己的应用程序。不过,似乎很少有开发者会在一开始就向用户提供真正利用头显功能的应用程序。  上周末,据TechCrunch报道,AppFigures 的研究表明,已经更新以包含 Vision Pro 特定功能(即某种形式的虚拟现实或混合现实组件)的应用程序可能不超过 150 个。到用户使用苹果 Vision Pro 时,可能还会有...
            0 0 759
            分享
          •       前言Cypress 的测试报告模块脱胎于 Mocha 的测试报告,故任何 Mocha 支持的测试报告均可直接用于 Cypress。下面将利用 Cypress-example 提供的 web 应用程序作为例子,需要先启动本地服务。      进入被测应用 logging-in__html-web-forms 的目录C:\Users\user\Desktop\py\cypress-example-recipes\examples\logging-in__html-web-forms    &nbs...
            2 1 2504
            分享
          •   在几天内即将提交议会的立法中,澳大利亚打算让 Apple Pay 和其他数字支付平台接受与信用卡同等程度的监管。一段时间以来,澳大利亚一直试图对 Apple Pay、Google Pay 等数字钱包应用和支付平台进行监管。本周三,澳大利亚将向议会提交新的立法,以改变法律并影响应用程序和服务的监管方式。  这项立法将有效地使澳大利亚储备银行对新兴技术的支付进行监管。新版本将授权澳大利亚储备银行在其认为合适的情况下进行修改,而不是限制澳大利亚储备银行权力范围的已有 25 年历史的现行法律。  据路透社报道,澳大利亚财政部长吉姆-查莫斯(Jim Chalmers)表示:"我们正在对澳大...
            0 0 870
            分享
          • 本篇文章以Java为主线对测试开发进行技术栈分析Java基础知识数据类型8种基本数据类型:byte、short、int、long、float、double、char、boolean3种引用数据类型:类、接口、数组条件语句应用循环语句应用String的常用方法使用,字符串的查找、拼接、替换、删除数组和动态数组(arraylist)hashmap正则表达式java函数,包括函数的定义,参数和返回值Java的异常机制Java命名规范面向对象继承,封装和多态JavaIO概念与文件的读写maven基础,重点是:安装maven环境,创建maven工程,maven工程结构,pom.xml,在ide中使用ma...
            0 0 3076
            分享
      • 51testing软件测试圈微信