• 1
  • 0
分享
  • selenium ,webdriver 运行原理与机制
  • 曼倩诙谐 2022-08-15 11:23:34 字数 8019 阅读 1604 收藏 0

  最近在看一些底层的东西。driver翻译过来是驱动,司机的意思。如果将webdriver比做成司机,竟然非常恰当。

  我们可以把WebDriver驱动浏览器类比成出租车司机开出租车。在开出租车时有三个角色:

  · 乘客:他/她告诉出租车司机去哪里,大概怎么走。

  · 出租车司机:他按照乘客的要求来操控出租车。

  · 出租车:出租车按照司机的操控完成真正的行驶,把乘客送到目的地。

  在WebDriver中也有类似的三个角色:

  · 自动化测试代码:自动化测试代码发送请求给浏览器的驱动(比如火狐驱动、谷歌驱动)。

  · 浏览器的驱动:它来解析这些自动化测试的代码,解析后把它们发送给浏览器。

  · 浏览器:执行浏览器驱动发来的指令,并最终完成工程师想要的操作。

  所以在这个类比中:

  · 工程师写的自动化测试代码就相当于是乘客。

  · 浏览器的驱动就相当于是出租车司机。

  · 浏览器就相当于是出租车。

  下面再从技术上解释下WebDriver的工作原理:

  从技术上讲,也同样是上面的三个角色:

  · WebDriver API(基于Java、Python、C#等语言)。

  · 对于java语言来说,就是下载下来的selenium的Jar包,比如selenium-java-3.8.1.zip包,代表Selenium3.8.1的版本。

  · 浏览器的驱动(browser driver),每个浏览器都有自己的驱动,均以exe文件形式存在。比如谷歌的chromedriver.exe、火狐的geckodriver.exe、IE的IEDriverServer.exe浏览器。

  浏览器当然就是我们很熟悉的常用的各种浏览器。那在WebDriver脚本运行的时候,它们之间是如何通信的呢?为什么同一个browser driver即可以处理java语言的脚本,也可以处理python语言的脚本呢?让我们来看一下,一条Selenium脚本执行时后端都发生了哪些事情:

  · 对于每一条Selenium脚本,一个http请求会被创建并且发送给浏览器的驱动。

  · 浏览器驱动中包含了一个HTTP Server,用来接收这些http请求。

  · HTTP Server接收到请求后根据请求来具体操控对应的浏览器。

  浏览器执行具体的测试步骤

  浏览器将步骤执行结果返回给HTTP Server。HTTP Server又将结果返回给Selenium的脚本,如果是错误的http代码我们就会在控制台看到对应的报错信息。

  为什么使用HTTP协议呢?

  因为HTTP协议是一个浏览器和Web服务器之间通信的标准协议,而几乎每一种编程语言都提供了丰富的http libraries,这样就可以方便的处理客户端Client和服务器Server之间的请求request及响应response,WebDriver的结构中就是典型的C/S结构,WebDriver API相当于是客户端,而小小的浏览器驱动才是服务器端。

  WebDriver基于的协议:JSON Wire protocol。

  JSON Wire protocol是在http协议基础上,对http请求及响应的body部分的数据的进一步规范。

  我们知道在HTTP请求及响应中常常包括以下几个部分:http请求方法、http请求及响应内容body、http响应状态码等。

  常见的http请求方法:

  GET:用来从服务器获取信息。比如获取网页的标题信息。

  POST:向服务器发送操作请求。比如findElement,Click等。

  http响应状态码:

  在WebDriver中为了给用户以更明确的反馈信息,提供了更细化的http响应状态码,比如:

  7:NoSuchElement
  11:ElementNotVisible
  200:Everything OK

  现在到了最关键的http请求及响应的body部分了:

  body部分主要传送具体的数据,在WebDriver中这些数据都是以JSON的形式存在并进行传送的,这就是JSON Wire protocol。

  Selenium 是将各个浏览器的API封装成" Selenium自己设计定义的协议,名字叫做The WebDriver Wire Protocol " 的webdriver API

  操作层面:

  1、测试人员编写UI自动化测试脚本(java,python等等),运行脚本后,程序会打开指定的webdriver浏览器。

  webdriver浏览器作为一个remote-server 接受脚本的命令,同时webservice会打开一个端口:http://localhost:9515 浏览器则会监听这个端口。

  2、webservice会将脚本语言翻译成json格式传递给浏览器执行操作命令。

  逻辑层面:

  1、测试人员执行测试脚本后,就创建了一个session, 通过http 请求向webservice发送了restfull的请求。

  2、webservice翻译restfull的请求为浏览器能懂的脚本,然后接受脚本执行结果。

  3、webservice将结果进行封装--json 给到客户端client/测试脚本 ,然后client就知道操作是否成功,同时测试也可以进行校验了。

  我们可以验证一下:

  下载好chromedriver,放到环境变量里,注意要和chrome浏览器版本对上,然后执行chromedriver

  可以看到,会启动一个server, 并开启端口9515:

  andersons-iMac:~ anderson$ chromedriver
  Starting ChromeDriver 2.39.562713 (dd642283e958a93ebf6891600db055f1f1b4f3b2) on port 9515
  Only local connections are allowed.
  GVA info: Successfully connected to the Intel plugin, offline Gen9

  强调了只允许本地连接。前面已经提过了,乘客向司机发一个请求,行为是构造一个http请求。构造的请求是这样子的:

  请求方式 :POST

  请求地址 :http://localhost:9515/session

  请求body :

  capabilities = {
      "capabilities": {
          "alwaysMatch": {
              "browserName": "chrome"
          },
          "firstMatch": [
              {}
          ]
      },
      "desiredCapabilities": {
          "platform": "ANY",
          "browserName": "chrome",
          "version": "",
          "chromeOptions": {
              "args": [],
              "extensions": []
          }
      }
  }
  我们可以尝试使用python requests 向 ChromeDriver发送请求
  import requests
  import json
  session_url = 'http://localhost:9515/session'
  session_pars = {"capabilities": {"firstMatch": [{}], \
                        "alwaysMatch": {"browserName": "chrome",\
                                        "platformName": "any", \
                                        "goog:chromeOptions": {"extensions": [], "args": []}}}, \
                  "desiredCapabilities": {"browserName": "chrome", \
                               "version": "", "platform": "ANY", "goog:chromeOptions": {"extensions": [], "args": []}}}
  r_session = requests.post(session_url,json=session_pars)
  print(json.dumps(r_session.json(),indent=2))
  结果:
  {
    "sessionId": "44fdb7b1b048a76c0f625545b0d2567b",
    "status": 0,
    "value": {
      "acceptInsecureCerts": false,
      "acceptSslCerts": false,
      "applicationCacheEnabled": false,
      "browserConnectionEnabled": false,
      "browserName": "chrome",
      "chrome": {
        "chromedriverVersion": "2.40.565386 (45a059dc425e08165f9a10324bd1380cc13ca363)",
        "userDataDir": "/var/folders/yd/dmwmz84x5rj354qkz9rwwzbc0000gn/T/.org.chromium.Chromium.RzlABs"
      },
      "cssSelectorsEnabled": true,
      "databaseEnabled": false,
      "handlesAlerts": true,
      "hasTouchScreen": false,
      "javascriptEnabled": true,
      "locationContextEnabled": true,
      "mobileEmulationEnabled": false,
      "nativeEvents": true,
      "networkConnectionEnabled": false,
      "pageLoadStrategy": "normal",
      "platform": "Mac OS X",
      "rotatable": false,
      "setWindowRect": true,
      "takesHeapSnapshot": true,
      "takesScreenshot": true,
      "unexpectedAlertBehaviour": "",
      "version": "71.0.3578.80",
      "webStorageEnabled": true
    }
  }

  如何打开一个网页,类似driver.get(url)

  那么构造的请求是:

  请求方式 :POST

  请求地址 :http://localhost:9515/session/:sessionId/url

  注意:上述地址中的 ":sessionId"

  要用启动浏览器的请求返回结果中的sessionId的值

  例如:我刚刚发送请求,启动浏览器,返回结果中"sessionId": "44fdb7b1b048a76c0f625545b0d2567b"  

  然后请求的URL地址

  请求地址:http://localhost:9515/session/b2801b5dc58b15e76d0d3295b04d295c/url

  请求body :{"url": "https://www.baidu.com", "sessionId": "44fdb7b1b048a76c0f625545b0d2567b"}

  即:

  import requests
  url = 'http://localhost:9515/session/44fdb7b1b048a76c0f625545b0d2567b/url'
  pars = {"url": "https://www.baidu.com", "sessionId": "44fdb7b1b048a76c0f625545b0d2567b"}
  r = requests.post(url,json=pars)
  print(r.json())

  如何定位元素,类似driver.finde_element_by_xx:

  请求方式 :POST

  请求地址 :http://localhost:9515/session/:sessionId/element

  注意:上述地址中的 ":sessionId"

  要用启动浏览器的请求返回结果中的sessionId的值。

  例如:我刚刚发送请求,启动浏览器,返回结果中"sessionId": "b2801b5dc58b15e76d0d3295b04d295c"  

  然后我构造 查找页面元素的请求地址

  请求地址:http://localhost:9515/session/b2801b5dc58b15e76d0d3295b04d295c/element

  请求body :{"using": "css selector", "value": ".postTitle a", "sessionId": "b2801b5dc58b15e76d0d3295b04d295c"}

  即:

  import requests
  url = 'http://localhost:9515/session/b2801b5dc58b15e76d0d3295b04d295c/element'
  pars = {"using": "css selector", "value": ".postTitle a", "sessionId": "b2801b5dc58b15e76d0d3295b04d295c"}
  r = requests.post(url,json=pars)
  print(r.json())

  如何操作元素:类似click()

  请求方式 :POST

  请求地址 :http://localhost:9515/session/:sessionId/element/:id/click

  注意:上述地址中的 ":sessionId"

  要用启动浏览器的请求返回结果中的sessionId的值

  :id 要用元素定位请求后返回ELEMENT的值

  例如:我刚刚发送请求,启动浏览器,返回结果中"sessionId": "b2801b5dc58b15e76d0d3295b04d295c"  

  元素定位,返回ELEMENT的值"0.11402119390850629-1"

  然后我构造 点击页面元素的请求地址

  请求地址:http://localhost:9515/session/b2801b5dc58b15e76d0d3295b04d295c/element/0.11402119390850629-1/click

  请求body :{"id": "0.11402119390850629-1", "sessionId": "b2801b5dc58b15e76d0d3295b04d295c"}

  即:

  import requests
  url = 'http://localhost:9515/session/b2801b5dc58b15e76d0d3295b04d295c/element/0.11402119390850629-1/click'
  pars ={"id": "0.5930642995574296-1", "sessionId": "b2801b5dc58b15e76d0d3295b04d295c"}
  r = requests.post(url,json=pars)
  print(r.json())

  从上面可以看出来,UI自动化,其实也可以写成API自动化。

  只是,只是

  好繁琐,没有封装好的wedriver指令好用,有点脱裤子放屁的感觉。

  我们来写段代码感觉一下:

  import requests
  import time
  capabilities = {
      "capabilities": {
          "alwaysMatch": {
              "browserName": "chrome"
          },
          "firstMatch": [
              {}
          ]
      },
      "desiredCapabilities": {
          "platform": "ANY",
          "browserName": "chrome",
          "version": "",
          "chromeOptions": {
              "args": [],
              "extensions": []
          }
      }
  }
  # 打开浏览器 http://127.0.0.1:9515/session
  res = requests.post('http://127.0.0.1:9515/session', json=capabilities).json()
  session_id = res['sessionId']
  # 打开百度
  requests.post('http://127.0.0.1:9515/session/%s/url' % session_id,
                json={"url": "http://www.baidu.com", "sessionId": session_id})
  time.sleep(3)
  # 关闭浏览器,删除session
  requests.delete('http://127.0.0.1:9515/session/%s' % session_id, json={"sessionId": session_id})

  其实搞懂真正的原理,也就是为了方便解决问题,在debug的时候,更方便的查看和解决问题。

  当然,如果在接口自动化里面也需要调用少量的UI自动化,可以考虑这种方式。



作者:谢小玲    

来源:http://www.51testing.com/html/36/n-4479336.html


  • 【留下美好印记】
    赞赏支持
登录 后发表评论
+ 关注

热门文章

    最新讲堂

      • 推荐阅读
      • 换一换
          • 概念Hamcrest是用于编写匹配器对象的框架。他提供了一套匹配符Matcher,这些匹配符更接近自然语言,可读性高,更加灵活。Hamcrest还有很好的可扩展性,能够创建自定义的匹配器。支持语言Hamcest支持多种语言,在Hamcest 官网便可以看到:http://hamcrest.org/JavaPythonRubyObjective-CPHPErlangSwift示例from hamcrest import * import unittest class BiscuitTest(unittest.TestCase):  &...
            1 1 1844
            分享
          • 简介LoadRunner是一种常用的性能测试工具,支持脚本录制,也支持编程,最新的版本是12.6,但是在win10系统上controller是打不开的,需要授权码。以下操作都是以12.50版本为例进行说明。loadRunner是商业软件,社区版本的话一台机器最多能开50,多并发的话就只能多台每台机器装一个。对于网站来说,loadrunner本质是通过http协议压测的。模拟多个浏览器发送不同的数据包给服务器。通过多线程/多进程来做下面的事情:client---->server: 发送请求client<----server: 发送服务器处理结果三大组件Virtual User Gen...
            0 0 1574
            分享
          • 接上文,下面继续介绍Jmeter的测试元件。3. 控制器         JMeter有两种类型的控制器:取样器和逻辑控制器。         取样器指示JMeter向一个服务器发送请求。例如,如果你想让JMeter发送HTTP请求,那么添加一个HTTP请求器。你可以向一个取样器中添加一个或多个配置元件来定制请求。        逻辑控制...
            0 0 1075
            分享
          •   随着中国防疫措施优化调整,越来越多的跨国公司高管正计划前往中国拜访客户、参加活动。  2月13日,澎湃新闻记者从梅赛德斯-奔驰方面了解到,梅赛德斯-奔驰集团股份公司董事会主席康林松(Ola K?llenius)计划将访华。2022年,奔驰在全球范围内交付204.39万辆乘用车。其中,中国市场全年累计交付75.17万辆,同比下滑0.9%,新能源车型则同比增长143%。  此前据《华尔街日报》12日报道,跨国公司高管正在重返中国寻求商机。大众汽车公司的高管在1月底2月初访问了中国,梅赛德斯-奔驰公司的管理层人员也在近日有访问中国的计划,苹果公司CEO蒂姆·库克(Tim Cook)、辉瑞CEO艾...
            0 0 601
            分享
          •   在测试行业,一个一直被讨论的问题就是:手工测试没有前途,自动化测试会取代手工测试?  首先说结论:自动化测试不会取代手工测试,这完全是两个维度的事情。为什么不会呢?我们需要从本源上说起。  什么是自动化  世界上有很多职业,比如艺术家、维修人员、销售等等,每种职业都需要人来参与,而每种职业也都有部分工作交给机器来做。  但无论哪种职业,几乎都是人来主导,然后将越来越多的工作交给机器来做,而机器无法实现的工作,比如创新、情感、思维等,只能由每个具体的人来完成。而这些必须由具体的人来完成的事情,我们称之为“手工”,机器完成的部分,我们称之为“自动 化”。  因此,手工、自动化不是测试专属的概念...
            0 0 575
            分享
      • 51testing软件测试圈微信