• 12
  • 12
分享
  • 大数据测试的范围可不简单,大致总结为四点——软件测试圈
  • 曼倩诙谐 2021-01-21 10:39:31 字数 2024 阅读 1435 收藏 12

  小伙伴们对传统测试已经非常熟悉了,从测试手段来区分:功能测试、性能测试、自动化测试、安全测试、接口测试就有多种。

  那么大数据测试到底测啥以及如何测,非常遗憾的告诉伙伴们,目前业界没有通用的方法定义大数据测试,本篇借鉴传统测试的思想跟大伙一起探讨下大数据测试的范围。

  目录如下:

  1、传统测试范围的定义

  2、大数据的功能性与易用性

  3、大数据的可靠性与效率

  4、大数据的可维护性与可移植性


  1 传统测试范畴的定义

  ISO9126软件质量模型标准定义了软件评估的6大特性分别是:功能性、易用性、可靠性、效率性、可维护性、可移植性,也就意味着软件测试基本上围绕着这6个特性展开。

  2 大数据的功能性与易用性

  我们借鉴ISO9126软件质量模型,看看大数据的功能性、易用性需考虑方面。

  2.1 功能性

  说明:ISO9126 里面指满足需求文档和相关标准能力,分别从适合性、准确性、互操作性、保密安全性、功能的依从性去定义,好比测试一台手机:确保它功能完整(能打电话、发短信、运行app、拍照..),满足用户日常的需求,并且符合互操作性(确保打电话的时能运行手机上的app),发出去的短信传输过程是通过加密、安全的,并且该手机的功能在国际上具备一定的规范一致性。

  2.2 数据全面性

  质疑下拿到的爬虫数据对应的友商是否全面,除了友商A的数据应该获取,友商B、C、D的数据是否有考虑;每个友商选取的对标门店是否具有代表性,需考虑;通常在需求评审阶段提出。

  2.3 数据完整性

  质疑拿到的数据是否完整,这里完整指:

  数据确保指定时间范围内每天有数据,排除被风控了的情况;

  数据是否重复,例:同1条URL对应2条结果数据;

  数据预期与结果总条数一致;

  通常在etl测试阶段考虑。

  2.4 数据合理性

  质疑拿到的数据是否符合数据库规定类型、以及是否出现出现异常值;

  字段类型check,如对重要字段类型check,例:int型下出现其他字符类型情况;

  字段异常值check,例:null、空、或者另外一些约定异常值;

  字段默认值一致性验证check,例: 从A表同步到B表后,某字段枚举值含义相同;

  在etl测试阶段 或者 数据应用层测试考虑。

  2.5 数据准确性

  质疑拿到数据的结果表与数据源头表是否一致,可能源表经过A -> B -> C处理后得到结果表,所以需要验证整个过程数据是否失真,确保数据的准确与一致。

  基于总数的验证,即 A -> B -> C后总数一致,可能到C后有聚合的数据,视情况而定,即在A时有10万条数据,到C阶段理论也有10万。

  基于总数额的验证,即 A -> B -> C后总额一致,这里的总额可能是:金额、销量等。

  在etl测试阶段 或者 数据应用层测试考虑。

  2.6 安全性验证

  对于某些敏感的数据往往需要考虑其安全性,可以是从获取数据的方式,也可以是数据本身安全性上。

  账号的隔离,测评是否有必要采用账号隔离访问数据。

  基于对某些数据字段,测评是否有必要对某些字段进行加密考虑,例:身份证、家庭住址、金钱等方面的加密。

  在需求评审阶段考虑。

  2.7 易用性验证

  确保数据获取的过程顺畅,如果数据需要通过很多命令执行并且连接多个环境才能获取到,这样的数据易用性则不强,以及每个指定的一定能被人所理解。

  数据获取的交互是否过于复杂。

  数据对应的指标能被人所理解,例:MAU-月活人数、DAU-日活人数。

  在需求评审阶段 或 研发设计阶段考虑。

  3 大数据的可靠性与效率

  同样的当处理大数据的平台出现不可预知的错误时,或者数据处理变慢时,我们得有一些处理方案让其能短时间内恢复,或者即便恢复不了也有一些应急的方案,让其不影响到整个链路的上下游,这里其实就是对处理大数据的平台可靠性与效率性的保证。

  数据恢复性,当平台出现异常时,可以有一些重试机制进行重试,确保系统短时间内能恢复。

  数据容错性,即便通过重试机制不能恢复时,需保证上游数据不能影响到下游的数据,可以有一些默认数据的预置,确保下游总能获取到数据。

  时间与资源,当平台运算资源紧张任务繁重的时候,可能会出现长时间的等待,这时候除了需要跟研发一起优化SQL线程,还需要设计一些交互展示一些页面给用户,减少等待带来的用户体检差的问题。

  4 大数据的可维护性与可移植性

  可维护性指:数据可用且及时被维护,可移植性指:无论数据的迁入与迁出都不会影响到数据的使用。

  维护库表之间关系,由于通常大数据随着时间的推移数据库表会越来越多,需要确保有地方能维护数据库表之间的关系。

  维护单表字段含义,例:某天业务上新定义销售类型,那么需要在对应的表内注解出及时维护。

  数据的迁入/迁出:确保数据迁入/迁出字段不丢失以及数据完整性(参考2.3 数据完整性)。



作者:无精疯   

来源:CSDN


  • 【留下美好印记】
    赞赏支持
登录 后发表评论
+ 关注

热门文章

    最新讲堂

      • 推荐阅读
      • 换一换
          • 关于测试用例设计的方法,相信每一位测试工程师都会如数家珍,我更是在很多测试工程师的简历上看到了「精通测试用例设计的基本方法」。但到面试时一问,却发现不少候选人也仅能说出一些概念性的东西,对这些方法的理解还不够深入和透彻,在实际设计用例的过程中更是不知道这些方法该怎么用。这一节,我就以测试用例设计基本方法中最常用的等价类划分法和边界值法为例,重新梳理这些方法,让大家对这测试用例的设计方法有更深入的理解和认识。等价类划分法关于等价类划分法的基本定义和概念,这里就不赘述了。我们需要理解,等价类划分法的意义,在于选择合适的数据子集来代表整个数据集,以实现用尽可能少的用例做完整的覆盖。等价类对应的功能点...
            0 0 36
            分享
          • 在《基于Django的电子商务网站设计》这本书中,我不仅介绍了如何利用Django框架搭建电子商务网站,也论述了如何利用python的requests类对所创建的电子商务产品进行接口测试。在书写极乐口测试代码过程中,我遇到的最大的困难就是如何通过测试程序绕过Django的防止CSRF攻击的插件,通过近一个多月的努力我终于解决了这个问题,但是同时也揭露了Django框架的防止CSRF攻击的插件的漏洞。首先我们来看一下什么是CSRF攻击。1、什么是CSRF攻击?我们假设一个网站http://www.a.com/login.html的HTML代码如下:<html> <head>...
            0 0 909
            分享
          • 事情是这样的,女朋友昨天跟我吐槽说她闺蜜玩“羊了个羊” 刷到朋友圈榜前10,而她连第二关都过不了,已经开始怀疑自己了。于是我拿起了她的手机打开了羊了个羊小程序,打开了Charles和Apifox,并且结合了Apifox的自动化测试功能不小心把她刷到榜一!准备工作抓包工具:Charles 获取token接口管理工具:Apifox 地址:apifox.cnCharles 抓包1.获取PC的IP地址2.配置代理这里以iPhone手机为例:在iPhone的设置 -> 无线局域网 -> 局域网信息 -> 配置代理 -> 手动中配置代理,服务器输入框中填写PC的IP地址,端口输入框...
            0 0 2324
            分享
          • 上一篇我们分别介绍了机器学习及机器学习的类型 ,其中机器学习分为监督学习、无监督学习及强化学习,下面我们来了解一下机器学习中的人工神经网络什么是人工神经网络?神经网络的激活函数人工神经网络的结构人工神经元网络示例1. 什么是人工神经网络?ANN 属于机器学习。它是由多个神经元节点组成的计算模型。这些节点接收输入,使用激活函数处理输入并将输出传递到下一层。2. 神经网络的激活函数一个基本的人工神经网络由输入层、权重、激活函数、隐藏层和输出层组成。激活函数用于将输入转换为输出。其中一些是二元、双极、S 型和斜坡函数。人工神经网络中使用的几个常见激活函数是:#1) 身份功能对于 ...
            0 0 794
            分享
          •   今天一看日历,才突然意识到自己毕业已经四年了。四年时间里一直在测试行业摸爬滚打,现在是时候记录一下了。  下面我来分享下我这4年软件测试经验及成长历程,或许能帮助你解决很多工作中的迷惑。  我是如何开始做测试的?  2013年开始上大学,一个不算好的小二本,专业也是被调剂的-信息与计算科学,看起来高大上的专业,实际到真正学习的时候才发现,学习的东西泛而不精,数学知识与计算机知识掺杂,导致大学学了四年后,对什么都一知半解,更找不到毕业后的方向和职业规划。  一个偶然的机会,接触到了嵌入式,听说发展前景很好。由于当时对就业的迷茫,终于没能抵挡住诱惑,就这样,大四那年基本都是在嵌入式学习中度过的...
            0 0 646
            分享
      • 51testing软件测试圈微信