• 12
  • 13
分享

  前言

  虽然笔者是一个测试老人了,但是基本上所有的测试经验都停留在手工测试方面,对于自动化测试方面的实战经验少之又少,可以说,从这个角度来说,就像生活在原始社会,一切靠双手解决问题。

  其实,究其原因:一方面是,自动化方面不求上进,觉得会手工测试就可以了,自动化就能躲就躲吧;另一方面是,觉得自动化是个慢慢积累的过程,不是那么容易学会的,既然不是那么学会的,那是不是......就先不学了,然后,就一拖再拖,能拖就拖,殊不知,自动化已经逐步成为测试领域必备的生存技能了。

  所以,为了顺应测试行业发展的潮流,我就开始了从测试“原始人”到测试“现代人”的转变。(顺便说一下,想快速成长,有两个方面的因素也很重要,一方面想学习,是内因,感兴趣的事情,一般效率都会高很多;另一方面项目迫切需要,是外因,正所谓有压力才有动力)。

  考虑到python语言相对于大部分语言的语法简单,容易上手的特点,再加之python在自动化测试方面的广泛应用,我选择了python语言进行学习。

  一、菜鸟是怎样炼成的

  这一部分主要讲讲从一无所知到正式入门,Python从零开始学习的步骤。

  1、基本语法的学习——打铁还需自身硬

  首先,找一个适合零基础的学习网站,粗略过一遍python基本语法,推荐https://www.sharetechnote.com/和https://www.runoob.com/python/python-tutorial.html。Str、List、dict、set、loop、if等等,这些都是最最基本的语法知识。

  需要注意的是,学习教程中的练习实例,一定要一步一步跟着敲下来,这样学习效果最佳。

  等到基本语法学的差不多了,就可以直接进入实战阶段了。

  需要特别指出的是,没有必要在语法方面反复看,看过一遍基础就可以了,看再多遍也只是纸上谈兵,重要的还是通过实战来巩固前面学习到的知识,也更加深对语法的使用技巧的理解。

  2、项目实战——上阵练兵

  有了一些语法基础之后,接下来要结合项目,实现一些自动化功能。或者,如果没有合适的项目进行练习,给自己定一个目标作为项目,限定时间,实现一定的功能需求。

  我学习python的时候,由于项目中有一个几乎是日常需要做的事情,比较适合进行自动化,提高工作效率。

  具体需求是这样的。从客户返回的产品日志log中提取关键信息,然后以固定的模板填写excel表格,回传给客户。再详细一点呢,就是从txt多个文件和excel文件中,提取某些数据的值,填写到表格中,便于做问题定位和分析,其中涉及到平均值,最大值,同时涉及到几种固定的类别(就不更具体了,免得读者对号入座,联想到自己身边的同事~~)

  接下来我就来说说,我是如何完成这个项目的。

  程序初版面世:通过日夜奋战,到处求医问药,搞定功能

  第一步

  最开始,从待处理的txt文件出发,先实现一些特点比较明显的,看起来比较简单的数据处理,比如搜索含有特定的关键字的所有行,然后,取这些行中某一特定位置的值,然后计算这些值的平均值。

  大体思路是:

  ·遍历txt文件中所有的行

  ·然后通过关键字搜索

  ·搜索到的行,通过一定的字符进行分割,然后存为list

  ·按照list下标取值,然后把所有的值加起来求和,再除以个数

  虽然我知道这个方法不是最聪明最快的,但是我知道它是我当前的水平能做到的一种方法,至少能实现功能,满足项目需求。

  这个阶段学习到的方法是:

  ·open()打开文件

  ·readlines()读取行

  ·find()找到关键字,后来发现find只能找到一次,并且返回值是所在的位置,不方便,随后改为使用if X in Y来实现了

  ·re.split

  这个阶段,用到的基础知识点是list、for循环、str。

  第二步

  随后,另一个需求随之而来,我上面计算出来的值,得想个办法存下来,等自动化执行完之后,好去统计,然后填表。

  因此,我想了一个办法:把重要数据print出来,然后把执行的log保存下来(从网上找的方法),然后人工进行查看和填表。

  这个阶段学习到的方法是:

  ·class类

  ·write写文件

  第三步

  后来发现,这种方法的工作效率貌似有点低,明明是很高大上的自动化,怎么成了半自动化了?

  所以,我想到的是,把计算出来的数据,保存成表格,然后去表格里查看,就不用从茫茫执行记录里边去找了。

  这个阶段学习到的方法是:

  ·读EXCEL的模块xlrd

1-1.jpg

  ·写EXCEL的模块xlwt

1-2.jpg

  第四步

  最初生成的表格,基本上是几个类似的数据就生成一个EXCEL,其他类似的再生成一个EXCEL。所以,如果一旦填写的数据有上百个(这个项目就是这种情况),那差不多也要10几个甚至20多个表格。

  因此,我的想法是,能不能把这些生成的数据统统生成到一个表格里,然后再去这个表格里去找我需要的数据。

  有了这个想法之后,我的想法就不止停留在了这个层面了。而是,既然我打算自动生成数据到统一的一个表格里边,然后去取数据,再填到我的结果表格里边,那不如一步到位,通过程序直接把计算出来的结果,填到我创建的结果模板表格里边,实现计算---填表全自动化。

1-3.jpg

  这个阶段用到的主要方法是仍然是读EXCEL的模块xlrd和写EXCEL的模块xlwt,不过,改变了一下这两种方法的用途,原来只用于把txt提取的数据存下来备用,现在直接用于写入最终的结果表格中。

  第五步

  需要特别指出的是,经过上面几个过程之后,所有的txt部分的需求才终于实现了,但是EXCEL数据读取、计算还没有进行。所以,接下来的主要目标,就是实现EXCEL表格的数据统计。

  我首先想到的方法是,获取Excel的单元格的值,然后进行计算。有了之前txt数据的类似的经验,只要解决了如何获取单元格的值,就能实现此功能。

  这个阶段,我学习到的方法是cell().value,取单元格的值。

  程序优化改版:通过试用和代码审查,优化代码

  至此,需要实现的需求都一步一步的通过探索实现了。

  但是,由于时间紧迫,第一版代码以自己最容易hold住的方式实现功能,没有特别去思考是否最优方案,所以,此时的代码只能用“水”来形容。

  所以,接下来我做的是:

  一方面:推广试用

  让同事们试用我的代码,发现一些明显的问题,事实证明,实践是检验真理的唯一标准。试用过程中,发现的问题见python学习和工具试用过程中遇到的问题部分。

  另一方面:代码检视

  算法优化

  在让团队成员试用工具的同时,重新审视自己的代码,寻找优化点。首先是算法方面的优化。

  ·提取代码逻辑完全相同的复制粘贴的代码,使用for循环进行结构简化。示意图如下:

1-4.jpg

  ·对于代码逻辑类似的,可酌情通过自定义函数库,来进行调用,这样可以使代码更加简洁,逻辑更加清晰。

  例如,查找文件夹下的文件;通过一定的关键字搜索txt文件的所有行,然后把找到的行切割,然后取出需要的列,形成列表,最后形成dataframe,便于计算平均值等。

import re
def txt_cut(filel,keyws,cutby=r'[|]\s*'):
    file = open(str(filel), "r")
    txtlines = file.readlines()
    data_is_need_num = 0
    all_data = []
    for line_num in range(len(txtlines)):
        cur_line_data = txtlines[line_num]
        for i in range(len(keyws)):
            if keyws[i] in cur_line_data:
                data_is_need_num = data_is_need_num + 1
                data_split = re.split(cutby, cur_line_data)
                all_data.append(data_split)
    if data_is_need_num == 0:
        print("没有找到您想找的关键字:")
        for i in range(len(keyws)):
            print(keyws[i])
    file.close()
    return all_data

  ·寻找内置库或者第三方库中是否有更简便的方法,替代代码中一坨代码实现的功能。例如,计算平均值用mean()替代求和后再除以数量:

df.groupby("A").B.mean()

  ·用dataframe的groupby和value_counts()方法来输出一坨数据中,某一属性为A的数据中,另一属性值中数量最多的项:

max = df.groupby("A")['B'].apply(lambda x: x.value_counts().head(1))

  可以说,代码优化的过程,更是一个各方面飞速进步的过程。

  效率及易用性优化

  除了上面的代码结构和调用的模块方法的优化,审视代码过程中,还识别出了一些执行效率和易用性方面的需求:

  ·控制循环中某一分支执行次数,获取到一次数据之后,就停止循环。

time_ex = 0
if (条件1) and (time_ex != 1):
        time_ex = 1
        语句1

  ·将log打印信息以一定的颜色输出,方便提示用户一些重要的文件存储信息。

print("\033[0;31m我爱你中国\033[0m")

  可靠性优化

  除了效率和易用性方面,在这个项目过程中,也识别出了可靠性方面的需求。例如,存放txt文件名的list,优化之前是通过动态获取目标路径下的所有txt,然后通过list下标来取,这种方法最大的问题是,如果目标路径下有多余的txt,则用下标可能取的不对。

1-5.jpg

  优化后,将待处理的文件,通过文件名进行关键字搜索,如果搜索到,则统一放到新建的文件夹下,并重命名为固定的文件名,这样做可以保证后面调用文件列表的时候,一定是我需要的,不会取错 。

1-6.jpg

  二、python学习和工具试用过程中遇到的问题

  1、int越界

File "pandas\_libs\lib.pyx", line 615, in pandas._libs.lib.astype_intsafe
OverflowError: Python int too large to convert to C long

  大体意思就是:溢出错误,Python int太大,无法转换为C long。

1-7.jpg

  python的int是没有上限的,但是C有,如果传入参数大于C语言的int上限就会出错。

  解决方案:

  把data_df_phy_ipa["IPA"] = data_df_phy_ipa["IPA"] .astype('int')

  改为data_df_phy_ipa["IPA"] = data_df_phy_ipa["IPA"] .astype('int64')

  或data_df_phy_ipa["IPA"] = data_df_phy_ipa["IPA"] .astype('float')

  遇到此类问题,其他参考方案是:

  ·修改算法,不用这个c写的函数。

  ·升级python版本,有的时候这个错误是python2的,将python升级为3。

  2、重命名文件或文件夹时,提示已存在,异常结束执行

  FileExistsError: [WinError 183] 当文件已存在时,无法创建该文件。

1-8.jpg

  解决方案:

  对目标文件夹或文件做判空处理:

if not Path.exists(Path.joinpath(newdir,newname))

  3、使用round方法时,提示错误

AttributeError: 'float' object has no attribute 'round'

1-9.jpg

  错误提示:AttributeError: ‘float’ object has no attribute ‘round’

  方案一:

  该错误是由于numpy库版本较低导致的,需要更新numpy库至最新版本。

pip install --upgrade numpy

  更新时需要保证pip版本比较新,否则会提示pip版本更新较低更新失败:

python3 -m pip install --upgrade pip


1-10.jpg


F:\Log_Analysis_Auto\0_log_all_auto_fill>pip install --upgrade numpy
Requirement already satisfied: numpy in c:\python36\lib\site-packages (1.19.5)
WARNING: You are using pip version 21.0.1; however, version 21.1 is available.
You should consider upgrading via the 'c:\python36\python3.exe -m pip install --upgrade pip' command.
F:\Log_Analysis_Auto\0_log_all_auto_fill>c:\python36\python3.exe -m pip install --upgrade pip
Requirement already satisfied: pip in c:\python36\lib\site-packages (21.0.1)
Collecting pip
  Downloading pip-21.1-py3-none-any.whl (1.5 MB)
     |████████████████████████████████| 1.5 MB 328 kB/s
Installing collected packages: pip
  Attempting uninstall: pip
    Found existing installation: pip 21.0.1
    Uninstalling pip-21.0.1:
      Successfully uninstalled pip-21.0.1
Successfully installed pip-21.1

   

  方案二:

  如果方案一解决不了问题,请将如下这种格式的代码

rb_s2 = df[df['Cell']=='SCC2'].RB.mean().round(2)

  修改为:

rb_s2 = round(df[df['Cell']=='SCC2'].RB.mean(),2)

  4、提示含有gbk或者utf-8解码错误的报错

  原因:

  这种情况是因为txt文件没有存为utf-8 无bom格式。

  解决方案:

  Ultra edit打开txt文件,然后另存为格式选择“UTF-8-无BOM”。

1-11.jpg

  5、提示无权限Permission denied

  PermissionError: [Errno 13] Permission denied:

1-12.jpg

  原因:

  程序执行完成之前,需要读写的文件不能打开,否则会读写冲突,执行终止。

  解决方案:

  程序执行过程中,不要打开文件。

  6、invalid literal for int() with base 10

  报错:

ValueError: invalid literal for int() with base 10

  原因:

  原因为参数有误,int()函数可以把数字字符串转化成int类型的数字,但是不能传入非数字的字符串。

  解决方案:

  非数字字符串改成数字字符串。

  三、python学习总结

  1、处理数据pandas库的dataframe比较强大

  数据被DataFrame了之后,就像是操作EXCEL表格中的数据一样,只要你敢想,它就敢做。就我目前用到的DataFrame功能,我总结如下:

  ·统计均值

  ·统计最大值

  ·统计哪个值最多

  ·整列删除

  ·筛选数据

  ·整列合并

  DataFrame的功能远远不止这些,感兴趣的小伙伴可以自行学习。

  2、对于读写EXCEL的方法,有如下的总结:

  openpyxl可以处理xlsx文件和XLSM文件,可以写入单页sheet超过65535行,可以同时读写Excel;xlrd、xlwt只能处理xls,最大可以写65535行的表格。

  不过,如果EXCEL表格的数据量不是很大时,还是建议使用xlrd、xlwt套装。

  后记

  最后,一些Python学习心得分享给大家,希望对大家有所帮助。

  ·自动化脚本写作,重在实战

  ·潜力是逼出来,有压力才有动力

  ·写代码之前最好先构思好代码逻辑,躺石头过河的笨方法只适合初学者,并且后期维护成本较高,返工的概率也高一些

  ·Python编码选模块很重要,选对模块事半功倍

  希望本文能够帮助那些“原始人”快速“进化”为“现代人”,或者对那些已经成为“现代人”有一些启发。

  我下一步的计划是,学习和实践Python+Selenium的自动化框架,我将在后续的文章中把我的学习心得分享给大家,敬请关注。



作者:快乐至上   

来源:51Testing软件测试网原创

  • 【留下美好印记】
    赞赏支持
登录 后发表评论
+ 关注

热门文章

    最新讲堂

      • 推荐阅读
      • 换一换
          •   一般做银行测试,会给到测试人员需求说明书,用需求说明书怎么编写测试用例呢?我这次带大家一步一步的编写测试用例。  需求描述:  业务规则:1.大额存单兑取类型分为发售期内兑付、提前部分支取(利随本清支取部分靠档计息,定期付息支取部分活期计息并进行倒扣处理)、提前全部支取(利随本清支取部分靠档计息,定期付息支取部分活期计息并进行倒扣处理)、到期兑付和逾期兑付(只允许全部兑付)。系统自动根据兑取交易日期及兑取金额默认兑取类型。大额存单兑付后将本息资金划转到投资人认购本期大额存单的活期存款账户内,但因办理存款证明、质押、冻结等业务导致状态异常的大额存单不可兑付。  通过这个需求,可以分析出以下的...
            0 1 711
            分享
          • 敏捷质量实践中提倡测试左移,测试人员要尽早介入需求阶段,越早越好。测试人员需要关注需求的有效性,以及在需求产生和传递的过程中,交付价值是否被准确的描述、理解和对齐。在这个过程中很容易遇到一个常见问题:验收标准是验收测试要测的吗?验收标准到底是不是测试用例?这两者之间有什么区别和联系?本文主要想解决的就是这个具体的困惑。验收标准是确保需求实现的最小集合验收标准是什么回顾一下需求由厚厚的《软件需求规格说明书》演化为一张用户故事卡片的过程,在这个过程中我们舍弃了大量的细节描述,突出了需求需要交付的客户/用户价值。在需求交付的过程中,我们会一直关注价值,在保证价值的前提下,实现方式和技术细节都是可以讨...
            0 0 1817
            分享
          • 做为功能测试人员来讲,从发展方向上可分两个方面:1、业务流程方向2、专业技能方向。 当确定好方向后,接下来就是如何达到了一、业务流程方向1、熟悉底层的业务作为功能测试工程师来讲,了解开发的框架、开发的业务设计流程以及数据库的底层结构,不管是对于我们熟悉业务还是在测试过程中遇到问题进行问题定位,都能给我们带来很大的帮助。所以在这个方面建议大家尽量去参加开的设计评审、数据库评审,另外在参加开发设计评审和数据库评审时还能提前发现问题。举个很简单的例子,之前我在工作中就真实的遇到过的,开发在设计数据库时,将一个URL字段设计成了64长度的字符串,这肯定是不合理的,为URL的长度很容易就超过64。当我们...
            0 0 1153
            分享
          • 第一章 软件工程概论软件:是计算机程序、方法、规则、相关的文档以及运行计算机系统时所必需的数据的总和(狭义定义:软件=程序+数据+文档)软件的特性:软件是复杂的、软件是不可见的、软件是不断变化的和软件质量难以稳定。软件的质量特性:功能性、可靠性、易用性、效率、维护性、可移植性。软件危机:指在计算机软件的开发和维护过程中所遇到的一系列严重问题。软件危机的主要表现:对软件开发成本和进度估计常常很不准确用户对"已完成"的系统不满意的现象经常发生软件产品的质量往往靠不住软件常常是不可维护的软件成本在计算机系统总成本所占的比例逐年上升软件危机产生的主要原因:软件日益复杂和庞大软件开发...
            0 0 3005
            分享
          • 岁月流逝,万物轮回依旧,人生苦短,酸甜苦辣咸,构造丰富多彩人生。也曾失落彷徨,也曾泪水流淌,也曾过度失望!但内心那颗不骄不躁,不卑不亢的心一直在挣扎徘徊。我不否认我是一个患得患失,多愁善感的人。即便如此,骨子里流淌着的不乏那一种不安于现状,不妥协沉望的劲头。一辈子很长也很短,有时候长的让人浮想联翩,有时候短的让人一蹴而就,似乎一转眼生命就到了尽头。好吧,我不想引申这方面。总之一句话,人生苦短,干!目前从事测试工程师职位,说起来也是不可思议。行伍出身的我,在退伍复员后,没有明确追求,机缘巧合,加入到测试大军中去。这一个转身,简直没谁了。外表强壮的我,说话谈吐硬汉腔调的我,怎么也跟戴眼镜穿格子衫的...
            0 0 5417
            分享
      • 51testing软件测试圈微信