• 0
  • 0
分享

     视觉回归测试最常见的情况是使用基线图像进行测试。然而,视觉测试的不同方面也值得讨论。我们将介绍模板匹配(使用OpenCV)、布局测试(使用Galen)和OCR(使用Tesseract),并展示如何将这些工具无缝集成到现有的Appium和Selenium测试中。

     我们使用Java(以及OpenCV和Tesseract的Java包装器),但类似的解决方案也可以通过其他技术堆栈实现。

     这篇文章是2020年9月在新加坡的Taqelah和2020年Selenium会议期间(以较短的形式)发表的快速演讲的配套文章。

     我希望这个总结能帮助你选择对你的用例最有影响的工具,并给你一些关于如何将它们集成到你自己的工具箱中的想法。

模板匹配

     对于移动测试,Appium在其1.9版本中以图像定位器策略的形式添加了此功能。

     使用图像定位器(image locator),你可以像任何其他WebElement一样与结果元素交互。例如:

WebElement element = 
driver.findElementByImage(base64EncodedImageFile);
element.click();

     或

By image = MobileBy.image(base64EncodedImageFile);
new WebDriverWait(driver, 10).until(ExpectedConditions.presenceOfElementLocated(image)).click();

     开发人员采用的方法是将功能添加到Appium服务器的一部分,并使用OpenCV(这将成为运行Appium服务器的实例的依赖项)来增强实际的图像识别能力。

     有趣的是,客户端与服务器之间的流程如下所示:

  • 从Appium服务器请求截图。

  • 将屏幕截图和模板都发送到Appium服务器进行匹配。

     感觉并不完美,尤其是如果我们想在同一个屏幕上匹配多个模板。

     当我在2018年首次实现模板匹配时(当时还不知道Appium团队已经在开发模板匹配),我也选择了    OpenCV,而是在客户端运行了它。使用OpenCV Java包装器,我的代码要点如下所示:

Mat result = new Mat(resultRows, resultCols, CvType.CV_32FC1);
Imgproc.matchTemplate(image, templ, result, Imgproc.TM_CCOEFF_NORMED);
MinMaxLocResult match = Core.minMaxLoc(result);
if (match.maxVal >= threshold) {
  // found
}

     这种方法不需要向上述Appium服务器发出额外的请求。实际上,除了屏幕截图的功能外,它不需要WebDriver的任何功能。它还可以与Selenium和Appium一起使用。也就是说,这也增加了对OpenCV的依赖,这次是对运行测试执行的实例的依赖。

     我将以上两种方法(客户端和服务器端执行)都包装到TemplateMatcher接口中,以展示其用法(将其视为PoC)。

     布局测试

     另一种视觉测试类型涉及验证页面或屏幕的布局。你可以通过图像比较来做到这一点,图像比较也会隐式检查布局。一种更简单的方法是使用像Galen这样的专用布局测试工具(在我看来,这是最被低估的UI测试框架之一)。

     Galen使用每个屏幕的规范来定义屏幕上的所有(重要)元素及其大小以及它们之间的绝对或相对位置。

     让我们以Google搜索页为例:

图1.png

     我们可以使用以下规范表示它:

SEARCH_FIELD:
   below LOGO
   centered horizontally inside viewport
   visible
LOGO:
   above SEARCH_FIELD
   centered horizontally inside viewport
   width < 100% of SEARCH_FIELD/width
   visible
SEARCH_BUTTON:
   near LUCKY_BUTTON 20px left
   visible

     注意,上面使用的是JustTestLah!框架的语法(通过在页面对象的YAML文件中定义的唯一键引用UI元素)。在纯Galen中,这些需要在spec文件的顶部定义:

@objects
    LOGO          id        hplogo
    SEARCH_FIELD  css       input[name=q]    
    ...

     有多种执行这些检查的方法。我更喜欢将verify方法作为BasePage抽象类的一部分:

private T verify() {
  String baseName = this.getClass().getSimpleName();
  String baseFolder = this.getClass().getPackage().getName().replaceAll("\\.", File.separator);
  String specPath = baseFolder
              + File.separator
              + configuration.getPlatform()
              + File.separator
              + baseName
              + ".spec";
  galen.checkLayout(specPath, locators);
  return (T) this;
}

     这样,每当我们第一次与屏幕交互时,我们都可以轻松地从测试中调用验证(顺便说一句,我使用类似的方法来集成Applitools进行视觉测试):

public class GoogleSteps extends BaseSteps {
  private GooglePage google;
  @Given("I am on the homepage")
  public void homepage() {
    google.verify().someAction().nextAction();
  }
}

     光学字符识别(OCR)

     视觉断言的另一种形式是光学字符识别,其首字母缩写为OCR。每当由于某种原因将文本渲染为图像并且无法使用标准测试工具进行验证时,此功能将非常有用。

     对于那些使用Selenium进行Web抓取而不是进行测试的用户来说,这可能也很有趣,因为这是网站开发人员采取的反措施之一,以使其变得更加困难。

     我们使用Tesseract(一种最初由HP在1980年代开发,目前由Google赞助的OCR工具)。

     我们的示例不是最实际的示例,而是要展示Tesseract在检测不同类型的字体方面的强大功能:我们将验证Google徽标是否确实拼写出“ Google”:

public class GooglePage extends BasePage<GooglePage> {
  @Autowired private OCR ocr;
  ...
  public String getLogoText() {
    return ocr.getText($("LOGO"));
  }
}
public class GoogleSteps extends BaseSteps {
  private GooglePage google;
  ...
  @Then("the Google logo shows the correct text")
  public void checkLogo() {
    assertThat(google.getLogoText()).isEqualTo("Google");
  }
}

     使用的OCR服务如下所示:

public class OCR implements qa.justtestlah.stubs.OCR {
  private Logger LOG = LoggerFactory.getLogger(OCR.class);
  private TakesScreenshot driver;
  private Tesseract ocr;
  @Autowired
  public OCR(Tesseract ocr) {
    this.ocr = ocr;
  }
  /**
   * @param element {@link WebElement} element to perform OCR on
   * @return recognised text of the element
   */
  public String getText(WebElement element) {
    return getText(element.getScreenshotAs(OutputType.FILE));
  }
  /** @return all text recognised on the screen */
  public String getText() {
    return getText(getScreenshot());
  }
  private String getText(File file) {
    LOG.info("Peforming OCR on file {}", file);
    try {
      return ocr.doOCR(file).trim();
    } catch (TesseractException exception) {
      LOG.warn("Error performing OCR", exception);
      return null;
    }
  }
  /**
   * Usage:
   *
   * <pre>
   * new OCR().withDriver(driver);
   * </pre>
   *
   * @param driver {@link WebDriver} to use for capturing screenshots
   * @return this
   */
  public OCR withDriver(WebDriver driver) {
    this.driver = (TakesScreenshot) driver;
    return this;
  }
  /**
   * Usage:
   *
   * <pre>
   * new OCR().withDriver(driver);
   * </pre>
   *
   * @param driver {@link TakesScreenshot} to use for capturing screenshots
   * @return this
   */
  public OCR withDriver(TakesScreenshot driver) {
    this.driver = driver;
    return this;
  }
  private File getScreenshot() {
    return driver.getScreenshotAs(OutputType.FILE);
  }
  @Override
  public void setDriver(WebDriver driver) {
    this.driver = (TakesScreenshot) driver;
  }
}

     这要求在运行测试的实例上安装Tesseract。


作者:磐创 AI

原文链接:https://blog.csdn.net/fendouaini/article/details/109015349#comments_13557259


  • 【留下美好印记】
    赞赏支持
登录 后发表评论
+ 关注

热门文章

    最新讲堂

      • 推荐阅读
      • 换一换
          •   1、引言  在撸码过程中,99.1%的大佬,都不敢说自己的撸出来的代码,是不需要debug的。换句话说,码农在撸码过程中,最痛苦的,莫过于撸出来的代码,为了能避坑,小鱼也是在撸码过程中,总结的一点避坑方法,请各位大佬笑纳。  2、避坑内容总结  2.1无法定位到元素  遇到问题:  找不到元素,脚本报“NoSuchElementException:Unable to find element”,或"定位到了,不能操作,点击无效。  解决方法:  1)查看自己的“属性值”是否写正确  2)元素的标签不唯一,默认找到第一个  3)向上查看,元素是否在frame或iframe框架中  ...
            0 0 1187
            分享
          • 安装插件JunitGeneratorfile-setting-plugins下载Junit的相关jar包链接https://github.com/junit-team/junit4/wiki/Download-and-Install分别点击上面两个链接,然后选择下面第一项jar。(第二项是帮助文档,第三项是Maven配置文件,第四项是源码,有需要可下载。)将下载的jar包添加到项目File -> Project Structure->Modules-> Dependencies找到刚刚的下载目录,添加jar包添加完成后,需要有以下俩包:实例建立和src文件夹同目录的test文...
            0 0 1409
            分享
          •   近年来,随着国际形势和网络空间环境日趋复杂,各方面对网络安全重视程度日益提升,网络安全也已纳入了国家战略。在此背景下,系统的安全测试与防护就显得越来越重要,项目组在进行基于owasp zap工具进行安全扫描过程中,对工具的使用及扫描流程进行了深入分析,对常规扫描方式进行了优化。  zap提供了强大的路径爬虫及漏洞扫描功能,常规方式下,可以通过配置代理来录制前台页面,点击系统页面功能后抓取网站路径,再通过“爬行”、“强制浏览目录”等功能进行路径的分析与扩展,最后通过“主动扫描”功能进行漏洞扫描,生成漏扫报告。但这种方式抓取到的网站路径并不能保证是系统的全量路径,也就可能会导致扫描结果不详尽。...
            15 15 904
            分享
          •   有的人求职很顺利,一周便搞定了下家,成功拿到了offer;有的人求职路可谓历经坎坷,简历都很难通过,难道仅仅是因为不优秀吗?  其实不然,在整个求职过程中,从简历的书写到面试技巧,每一关都不可忽视。下面我们就来盘点下,求职时,有哪些容易让我们忽视的小细节。  简历请用数字化结果不要只是堆砌工作经历  以下场景,你是否很熟悉:觉得自己工作经历、工作能力都和企业十分匹配,信心满满地投递了简历,结果两分钟不到,便收到了对方的拒绝消息,难道简历都没过关?顿时对自己过往的工作经历产生了质疑。  有一类简历,猎头浏览的时间通常不会超过10秒——就是那种在一家公司工作时间不满1年的简历。  那么,是不是...
            0 0 735
            分享
      • 51testing软件测试圈微信