• 0
  • 0
分享
  • 有此库,做WebUI自动化,再也不怕图片类型验证码了。
  • Carl_奕然 2022-11-24 12:10:59 字数 1746 阅读 1634 收藏 0

1、引言

小屌丝: 鱼哥,你说爬虫或者登录网页,最烦的是那个操作?

小鱼:图片验证码了。

小屌丝:确实是的,那有没有什么办法,能破解这种繁琐的验证呢?

小鱼:方法嘛,有啊,例如:cookie啊,或者利用第三方库啊

小屌丝:真的有第三方库,可以解决这个问题?

小鱼:对啊,很方便的,

小屌丝:演示一下如何?

小鱼:怎么突然点饿了 ~

小屌丝:我懂我懂, 你分享完,咱们泡澡去~

7951f3976f804344a46fc07f0adc5623.gif

2、 ddddocr

2.1 介绍

验证码,复杂一点的有滑块验证码,点选文章和点选图片验证码。这些都是爬虫和WebUI自动化测试中中的老大难问题,今天介绍一款通用验证码识别 SDK 对他们彻底说拜拜,它的名字是 ddddocr 带带弟弟 OCR 通用验证码识别 SDK 免费开源版。

2.2 安装

老规矩,在使用前,必须要安装。

安装方式逃不了 pip方式:

pip install ddddocr

其他方式安装:

Python3,选择Python自动安装第三方库,从此跟pip说拜拜!!

Python3:我低调的只用一行代码,就导入Python所有库!!

2.3 使用

2.3.1 滑块验证码

滑块验证码这里用的是豆瓣的滑块验证。下滑块是单独的透明背景图 hycdn.png。


badba81b538a4ca48fe4513bddb6ef17.jpg

背景图是带小滑块坑位的 background.jpg。

9ac7923d473848448ce72d81b73f3555.jpg

上代码

# -*- coding:utf-8 -*-
# @Time   : 2022-03-06
# @Author : carl_DJ
import ddddocr
det = ddddocr.DdddOcr(det=False, ocr=False)
with open('hycdn.png', 'rb') as f:
        target_bytes = f.read()
    
with open('background.jpg', 'rb') as f:
    background_bytes = f.read()
res = det.slide_match(target_bytes, background_bytes, simple_target=True)
print(f"{res}")

运行结果:

{'target_y': 0, 'target': [486, 126, 622, 262]}

target 属性的前两个值正好和豆瓣验证滑块 url 中提交的 ans 差不多。

ae308dc1bde34a44bc41c03833902d48.jpg

2.3.2 点选类验证码

点选类验证码

d8779bfec2394a9483248b5d864fef9c.jpg

上代码

# -*- coding:utf-8 -*-
# @Time   : 2022-03-06
# @Author : carl_DJ
import ddddocr
det = ddddocr.DdddOcr(det=True)
with open("eb.jpg", 'rb') as f:
    image = f.read()
poses = det.detection(image)
im = cv2.imread("eb.jpg")
for box in poses:
    x1, y1, x2, y2 = box
    im = cv2.rectangle(im, (x1, y1), (x2, y2), color=(0, 0, 255), thickness=2)
cv2.imwrite("result.jpg", im)

运行结果

30dc6a0d148a4707bc520359aadaca63.jpg

2.3.3 字母数字验证码

字母数字验证码的图片来自于 google 搜索

a205acc1911b4d12aaa2a3a8f3ad2364.jpg

上代码

# -*- coding:utf-8 -*-
# @Time   : 2022-03-06
# @Author : carl_DJ
import ddddocr
ocr = ddddocr.DdddOcr(old=True)
with open("z1.jpg", 'rb') as f:
    image = f.read()
res = ocr.classification(image)
print(res)

运行结果

2wkc

3、总结

今天的分享,就到这里了。

奇奇怪怪的知识,是不是又增加了。

曾经编写WebUI自动化脚本,为了不在验证码识别大费周折,就让开发大佬把验证码给注释掉。

现在,有了ddddocr, 就再也不用麻烦开发大佬注释验证码了,

我是奕然,

关注我,带你学习更多更有趣Python知识。

  • 【留下美好印记】
    赞赏支持
登录 后发表评论
+ 关注

热门文章

    最新讲堂

      • 推荐阅读
      • 换一换
          • 测试用例阶段场景用例覆盖--增加开发对需求的全局理解深度已确认优化需求重点提醒--确保开发和测试对需求的信息同步提供开发自测用例--增加开发自测的认知在测试用例评审阶段,也就是程序开发阶段,用例覆盖率尽可能的全面,能进一步提高开发设计方法或对业务逻辑的理解,减少不必要的缺陷产生。测试阶段测试整体至少分为三轮:测试环境:核心测试,包括ui细节、字段规则、逻辑 校验等。(时间占比:60%)预生产环境:二次进行全流程场景测试(时间占比:30%)上线tag验证:确保代码合并到master后没有问题(时间占比:10%)代码扫描/错误监测:sonar声呐代码扫描工具,检测开发代码一些常规的语法规则错误;b...
            0 0 1338
            分享
          • 利用Jmeter做接口测试怎么做呢?过程真的是超级简单。明白了原理以后,把零碎的知识点填充进去就可以了。这篇文章就来介绍一下如何利用Jmeter做接口测试的流程,主要针对的是功能测试。暂不涉及到自动化测试和性能测试的内容。一把来说,主要的步骤都大差不差。第一步:通过分析API文档和需求文档提取接口清单。接口测试工作人员工作的开始就是从API文档和需求文档开始的。所以进入公司的第一件事情就是要拿到API文档和需求文档来了解,来看,来分析。从其中提取接口清单的话,主要是因为API文档中有很多冗余,不必要的信息。这些信息可能对于开发人员是有用的,但是对于我们测试人员是没有用的,所以要去除冗余,提取关...
            0 0 1769
            分享
          •   前言  在做自动化的过程中,编写用例时候需要用到用例的前置和用例的后置,其中pytest中有setup_class和teardown_class可以帮助我们完成这些,但是不够完善而且灵活性不够强。举个简单的例子,一个calss中有3条用例,其中2条需要登录,1条不需要登录,这个时候如果在用setup和teardown来做就有点不方便。这个时候就引入了新的知识点fixture。  fixture简单介绍  fixture属于pytest中的一个方法。fixture可以用作测试用例的前置和后置操作,其中fixture命令规范没有像setup和teardown固定格式。可以随意命名。控制fixt...
            13 13 4793
            分享
          • 读者提问:测试用例怎么写?阿常回答:这个问题我将从三点回答:1、用例给谁看;2、如何发现用例;3、用例三要素。一、用例给谁看一)用例评审产品、研发、测试看。产品需要检查用例是否把需求都覆盖到了;研发需要确认自己理解的业务逻辑是否有偏差;测试需要在评审会后补充和修正现有的用例。二)冒烟测试研发看。任务提测之前,研发需要根据测试提供的冒烟测试用例,把主要功能和流程跑一遍,没问题了再把任务转给测试。三)系统测试测试看。任务提测之后,测试根据写好的用例执行第一轮、第二轮……第 N 轮测试。二、如何发现用例用例是需求的细化。每一条需求要实现的目标就是用例的来源。譬如,需求中有一条描述 “ 为用户提供支付...
            0 0 680
            分享
          •   缘起  众所周知,系统测试是需要编写测试用例的,它是保证测试执行正确性、有效性的基础。但是,大家可能很难想象神秘的黑客在挖掘漏洞的时候会提前编写测试用例,然后按照用例去执行。因为他的漏洞挖掘思路是存在脑海中,并且不断的根据实际情况进行调整的。  当然,关于黑客单打独斗挖掘漏洞的这种想象,显然已不大符合当前安全界的实际情况。从网络及信息安全的攻击角度来说,恶意攻击分子已经逐渐形成了目标精准、分工明确、技术先进的网络黑色产业链条,相应的从安全保护和防御角度来说,国家加大了对网络攻击等犯罪行为的打击力度,企业也逐渐加大了网络安全投入。  那么,当安全测试成为企业安全建设中的一个重要环节,安全测试...
            0 0 1804
            分享
      • 51testing软件测试圈微信