• 0
  • 2
分享
  • 在我们做UI自动化的时候,经常会遇到图片验证码的问题——软件测试圈
  • 恬恬圈 2022-08-01 11:45:02 字数 2176 阅读 6798 收藏 2

在我们做UI自动化的时候,经常会遇到图片验证码的问题。

1.png

当开发不给咱们提供万能验证码,或者测试第三方网站比如知乎的时候,我们就需要自己去识别验证码。

OCR

OCR是一种图像文字识别的技术,例如图中的验证码,我们用肉眼识别就是c5s3,但机器可不比咱们肉眼。所以我们要利用ocr技术,让我们的Python脚本自动通过图片识别出对应的文字。

常见的识别类库

在Python中其实有许多识别类库,这里只介绍博主自己实践过的成功率还不错的:百度ocr。

简单的说,就是百度提供了一个SDK,让我们传入图片数据,从而拿到识别的结果。ocr的细节我们不需要关心。

申请开通OCR

首先我们得有一个百度账号,这个相信大家都有,没有的可以申请一个。

  • 登录百度控制台

进入https://login.bce.baidu.com/并登录。

  • 选择文字识别

左上角展开->产品服务->文字识别

2.png

  • 创建应用

点击创建应用按钮

3.png

  • 填写相关应用信息

简单描述下应用是干嘛的就行,因为我们只需要识别文字,所以其他也不用勾上。

4.png

创建好了之后可以看到具体的应用信息,记住这3个关键信息。待会会用到。

  • appid

  • apikey

  • secretkey

熟悉OCR文档

官方文档地址:https://cloud.baidu.com/doc/OCR/s/wkibizyjk

文档会写的比较清楚,简单的说就是通过你的appid,apikey和secretkey获取一个client,接着你就可以调用client的api去获取图片中的文字了。官方的SDK还是比较贴心的。

  • 安装SDK

pip install baidu-aip

讲完了文字怎么识别,接着就来说说标题中的动态图片验证码。

动态图片验证码

这个概念是我自己命名的,一般来说,我们的一张图片都是对应唯一一个url的,比如:

https://yuque.com?image=dshqadiau

(这个地址是我编的)

一般来说image字段的值不同,图片也就不同,都是一串随机的或者规律的不重复数据,确保图片不会重复。

但是博主最近遇到了这样一种情况:

输入一个url,每次输入,拿到的图片都不一样。

这样就会带来一个很严重的问题,页面上你虽然读取了图片的信息。我们把图片的url传递给百度sdk的时候,url由于再次调用,导致图片发生了变化。

比如网站上显示的是:c5s3,调用百度sdk的时候,百度会通过url读取图片,但再次读取,图片可能变成lfew。

不信大家可以看看这个图片地址:

5.gif

每次刷新,这个图片都会变,但是url不变。

怎么解决呢?

好在百度sdk,他不仅仅支持url,还支持图片文件和base64的图片数据。我们看看官方文档:

6.png

所以此时我们用图片的base64数据就行了。

再回到Selenium里面,我们怎么才能获取到验证码那张图片呢?

思考一下:

1、读取img标签的src,然后下载图片,保存图片文件再转为base64

很显然这个方法行不通,为什么呢?

因为img的src属性就是刚才这个url,你去获取一遍url,它同样会变化。

2、截图,裁剪出验证码部分,扔给百度去识别

可行是可行,但是会不会太复杂了??

如果我只对验证码的img元素进行截图,生成base64的数据是不是更方便?

其实呢,selenium作为一款老牌的自动化测试工具,很多方法供大于求了。所以它是有这样的功能的!

Selenium对指定区域截图

我们都知道,selenium有一些截图方法。

driver.get_screenshot_as_file(filename)

但其实,针对元素,也是有截图方法的。

伪代码如下:

#通过id获取到图片
img=driver.find_element_by_id("image")
#调用WebElement的screenshot_as_png属性方法,获取到png的数据,因为百度需要png
data=img.screenshot_as_png

接着我们就可以用这个获取到的图片数据去找百度要答案了!

完整版代码:

fromaipimportAipOcr
fromseleniumimportwebdriver
client=AipOcr("你的appid","你的app_key","你的secret_key")
driver=webdriver.Chrome()
driver.get("https://iam.pt.ouchn.cn/am/UI/Login")
img=driver.find_element_by_id("kaptchaImage")
data=img.screenshot_as_png
res=client.basicGeneral(data,{})
print(res)

7.png

可以看到,只识别到了CFX,而且图片没有继续变化了。

毕竟文字识别是从图片里面找文字,而且文字会有一些横线这样的干扰,所以如果一次不行,可以多试几次。

思路就是写一个while循环,不断尝试去识别验证码并登录,接着判断是否登录成功,没成功则重复上一个步骤。

以我个人的经验,一般1-10次就可以成功。

好了,以上简单替大家尝试一下UI自动化过程中对于验证码的识别。主要重点在于验证码的识别和对部分区域截图。


作者:软件测试木木

原文链接:https://blog.csdn.net/m0_67419887/article/details/123450829

  • 【留下美好印记】
    赞赏支持
登录 后发表评论
+ 关注

热门文章

    最新讲堂

      • 推荐阅读
      • 换一换
          •   本文主要针对填写BUG时,bug分类共分为多少项,每一项内容都有哪些场景,并结合具体错误案例进行简单分析。  一 UI表示层  在软件测试和开发中,当提到“用户UI”类型的bug时,通常是指与用户界面(User Interface)相关的问题。用户界面是用户与软件交互的部分,它包括视觉元素、布局、导航以及用户可以与之交互的所有组件。  以下是一些常见的用户UI类型的bug:  1.布局问题:UI元素未正确对齐,或者在不同分辨率或屏幕尺寸下显示不正确。  2.样式问题:颜色、字体大小或样式不符合设计规范,或者在不同的操作系统或浏览器上显示不一致。  3.导航问题:用户无法通过预期的方式在应用...
            0 0 708
            分享
          •   周六,美国宇航员巴里-威尔莫尔(Barry Wilmore)致电美国国家航空航天局(NASA)地面工作人员,请求帮助解决从波音"Starliner"飞船上发出的重复敲击声。美国国家航空航天局太空飞行论坛的一名成员捕捉到了这次互动,并在Ars Technica发现的一篇帖子中附上了录音。  "我有一个关于'Starliner'的问题,"威尔莫尔通过无线电向休斯顿约翰逊航天中心的任务控制中心报告。"扬声器里传出了奇怪的声音......我不知道是什么发出的。"  威尔莫尔说,他不确定是空间站和航天器之间的连接出现了异常,...
            0 0 87
            分享
          •   如果你曾经用过Fiddler来调试某个web应用程序,你就会知道它是一个多么好用且具有价值的工具!  如果这个web应用恰好你也在iPhone或iPad上调试过,那你也会知道,要从web服务器日志中找出问题是多么困难的一件事情。  别着急,下面笔者将解释如何配置Fiddler来代理iPhone/iPad,让你的测试变得更加容易且高效。  HTTP通信  首先,您需要启用来自远程设备的连接。启动Fiddler,并从工具菜单中选择Fiddler选项,选中“Fiddler监听端口”,在下一步中需要我们会用到这个选项。  现在,选择“允许电脑远程连接”选项并单击确定,这一步之后Fiddler会提醒...
            12 12 1639
            分享
          •   据 404Media.co 报道,微软的 Skype 移动应用存在一个严重的漏洞,可能导致黑客通过发送一个链接就能检测到用户的 IP 地址。  该漏洞只需利用 Skype 的文本消息功能发送一个链接,无需用户点击该链接,就能暴露用户的 IP 地址。  这个漏洞最初是由一位化名为“Yossi”的独立安全研究员发现的,文章描述了利用这个漏洞的过程:  文章补充说,这个问题只影响 Skype 的移动应用,而不影响桌面版的 Skype。出于安全原因,文章没有透露黑客方面如何利用这个漏洞的细节,但是文章称这个漏洞“非常容易被利用,只涉及改变链接相关的某个参数”。  Yossi 把他发现的漏洞信息发送...
            0 0 764
            分享
      • 51testing软件测试圈微信