• 0
  • 0
分享
  • 性能测试之测试指标——软件测试圈
  • 北极 2022-07-01 16:18:42 字数 5554 阅读 1424 收藏 0

前言

本指标适用于使用性能测试进行性能测试项目技术质量评价依据,规范技术测试结果评价,统一性能测试

技术测试质量度量。应用系统技术质量度量指标范围广泛,本文难以涵盖全部。预期读者为测试管理人员、测

试实施人员、技术支持人员、项目管理人员等系统技术质量相关人员。

系统性能指标

1、交易响应时间

  • 定义及解释

响应时间指用户从客户端发起一个请求开始,到客户端接收到从服务器端返回的响应结束,整个过程所耗费的时间。在性能检测中一般以压力发起端至被压测服务器返回处理结果的时间为计量,单位一般为秒或毫秒。平均响应时间指系统稳定运行时间段内,同一交易的平均响应时间。一般而言,交易响应时间均指平均响应时间。平均响应时间指标值应根据不同的交易分别设定,一般情况下,分为复杂交易响应时间、简单交易响应时间、特殊交易响应时间。其中,特殊交易响应时间的设定必须明确该交易在响应时间方面的特殊性。

  • 简称

ResponseTime:RT

  • 参考标准

不同行业不同业务可接受的响应时间是不同的,一般情况,对于在线实时交易:

  1. 互联网企业:500毫秒以下,例如淘宝业务10毫秒左右。

  2. 金融企业:1秒以下为佳,部分复杂业务3秒以下。

  3. 保险企业:3秒以下为佳。

  4. 制造业:5秒以下为佳。

对于批量交易:

  1. 时间窗口:即整个压测过程的时间,不同数据量则时间不一样,例如双11和99大促,数据量级不一样则时间窗口不同。大数据量的情况下,2小时内可完成压测。

2、系统处理能力

  • 定义及解释

系统处理能力是指系统在利用系统硬件平台和软件平台进行信息处理的能力。系统处理能力通过系统每秒钟能够处理的交易数量来评价,交易有两种理解:一是业务人员角度的一笔业务过程;二是系统角度的一次交易申请和响应过程。前者称为业务交易过程,后者称为事务。两种交易指标都可以评价应用系统的处理能力。一般的建议与系统交易日志保持一致,以便于统计业务量或者交易量。系统处理能力指标是技术测试活动中重要指标。

  • 简称

一般情况下,用以下指标来度量:

  1. HPS(HitsPerSecond):每秒点击次数,单位是次/秒。

  2. TPS(TransactionperSecond):系统每秒处理交易数,单位是笔/秒。

  3. QPS(QueryperSecond):系统每秒处理查询次数,单位是次/秒。对于互联网业务中,如果某些业务有且仅有一个请求连接,那么TPS=QPS=HPS,一般情况下用TPS来衡量整个业务流程,用QPS来衡量接口查询次数,用HPS来表示对服务器单击请求。

  • 标准

无论TPS、QPS、HPS,此指标是衡量系统处理能力非常重要的指标,越大越好,根据经验,一般情况下:

  • 金融行业:1000TPS~50000TPS,不包括互联网化的活动。

  • 保险行业:100TPS~100000TPS,不包括互联网化的活动。

  • 制造行业:10TPS~5000TPS。

  • 互联网电子商务:10000TPS~1000000TPS。

  • 互联网中型网站:1000TPS~50000TPS。

  • 互联网小型网站:500TPS~10000TPS。

3、并发用户

  • 定义及解释

并发用户数指在同一时刻内,登录系统并进行业务操作的用户数量。并发用户数对于长连接系统来说最大并发用户数即是系统的并发接入能力。对于短连接系统而言最大并发用户数并不等于系统的并发接入能力,而是与系统架构、系统处理能力等各种情况相关。例如系统吞吐能力很强,加上短连接一般都有连接复用,往往并发用户数大于系统的并发接入连接数。所以对于大部分短连接类型的系统,吞吐量模式(RPS模式,RequestPerSecond)比较适合,也是阿里的最佳实践,PTS支持RPS模式的压测,吞吐量的压测构建和衡量一步到位。在测试中,采用虚拟用户来模拟现实中用户进行业务操作。

  • 简称

VirtualUser:VU

  • 标准

一般情况下,性能测试是将系统处理能力容量测出来,而不是测试并发用户数,除了服务器长连接可能影响并发用户数外,系统处理能力不受并发用户数影响,可以用最小的用户数将系统处理能力容量测试出来,也可以用更多的用户将系统处理能力容量测试出来。

4、错误率

  • 定义及解释

错误率指系统在负载情况下,失败交易的概率。错误率=(失败交易数/交易总数)×100%。稳定性较好的系统,其错误率应该由超时引起,即为超时率。

  • 简称

VirtualFailureRatio:FR:VU

  • 标准

不同系统对错误率的要求不同,但一般不超出千分之六,即成功率不低于99.4%。

资源指标

1、CPU

  • 定义及解释

中央处理器是一块超大规模的集成电路,是一台计算机的运算核心(Core)和控制核心(ControlUnit)。它的功能主要是解释计算机指令以及处理计算机软件中的数据。CPULoad:系统正在干活的多少的度量,队列长度。系统平均负载。

  • 简称

CentralProcessingUnit:CPU

  • 标准

CPU指标主要指的CPU使用率、利用率,包括用户态(user)、系统态(sys)、等待态(wait)、空闲态(idle)。CPU使用率、利用率要低于业界警戒值范围之内,即小于或者等于75%、CPUsys%小于或者等于30%,CPUwait%小于或者等于5%。单核CPU也需遵循上述指标要求。CPULoad要小于CPU核数。

2、Memory

  • 定义及解释

内存是计算机中重要的部件之一,它是与CPU进行沟通的桥梁。计算机中所有程序的运行都是在内存中进行的,因此内存的性能对计算机的影响非常大。

  • 简称

Memory就是内存的简称。

  • 标准

现代的操作系统为了最大利用内存,在内存中存放了缓存,因此内存利用率100%并不代表内存有瓶颈,衡量系统内有瓶颈主要靠SWAP(与虚拟内存交换)交换空间利用率,一般情况下,SWAP交换空间利用率要低于70%,太多的交换将会引起系统性能低下。

3、磁盘吞吐量

  • 定义及解释

磁盘吞吐量是指在无磁盘故障的情况下单位时间内通过磁盘的数据量。

  • 简称

DiskThroughput。

  • 标准

磁盘指标主要有每秒读写多少兆,磁盘繁忙率,磁盘队列数,平均服务时间,平均等待时间,空间利用率。其中磁盘繁忙率是直接反映磁盘是否有瓶颈的重要依据,一般情况下,磁盘繁忙率要低于70%。

4、网络吞吐量

  • 定义及解释

网络吞吐量是指在无网络故障的情况下单位时间内通过的网络的数据数量。单位为Byte/s。网络吞吐量指标用于衡量系统对于网络设备或链路传输能力的需求。当网络吞吐量指标接近网络设备或链路最大传输能力时,则需要考虑升级网络设备。

  • 简称

NetworkThroughput

  • 标准

网络吞吐量指标主要有每秒有多少兆流量进出,一般情况下不能超过设备或链路最大传输能力的70%。

5、内核参数

操作系统内核参数主要包括信号量、进程、文件句柄,一般不要超过设置的参数值即可,具体如下:

一级指标二级指标单位解释
内核参数Maxuprc限制每个用户的用户进程的最大数量
Max_thread_proc定义每个进程允许的最大线程数量
Filecache_max字节最大可用于cachefileI/O的物理内存
Ninode内存中HFS文件系统打开i节点的最大数量
Nkthread限制允许同时运行的线程数量
Nproc限制允许同时运行的进程数量
Nstrpty基于STREAMS的伪终端(pts)的最大数量
Maxdsiz字节任何用户进程的数据段的最大大小(以字节为单位)
maxdsiz_64bit字节任何用户进程的数据段的最大大小(以字节为单位)
maxfiles_lim每个进程的文件描述符的最大数目硬限制
maxssiz_64bit字节任何用户进程的堆栈的最大大小
Maxtsiz字节任一用户进程的文本段的最大大小
nflocks文件锁的最大数量
maxtsiz_64bit字节任一用户进程的文本段的最大大小
msgmni系统级SystemVIPC消息队列(ID)所允许的最大数量
msgtql系统中任意时间的最大SystemVIPC消息数
nptyBSD伪终端(pty)的最大数量
nstrtel指定内核可支持传入telnet会话的telnet设备文件的数量
nswapdev可用于交换的设备的最大数量
nswapfs可用于交换的文件系统的最大数量
semmniSystemVIPC系统级信号量标识符的数量
semmnsSystemV系统级信号量的数量
shmmax字节SystemV共享内存段的最大大小
shmmni系统中SystemV共享内存段标识符的数量
shmseg每个进程SystemV共享内存段的最大数量

中间件指标

1、定义及解释

常用的中间件例如Tomcat、Weblogic等指标主要包括JVM、ThreadPool、JDBC,具体如下:

一级指标二级指标单位解释
GCGC频率每秒多少次Java虚拟机垃圾部分回收频率
Full GC频率每小时多少次Java虚拟机垃圾完全回收频率
Full GC平均时长用于垃圾完全回收的平均时长
Full GC最大时长用于垃圾完全回收的最大时长
堆使用率百分比堆使用率
Thread PoolActive Thread Count活动的线程数
Pending User Request处于排队的用户请求个数
JDBCJDBC Active ConnectionJDBC活动连接数

2、标准

  • 当前正在运行的线程数不能超过设定的最大值。一般情况下系统性能较好的情况下,线程数最小值设置50和最大值设置200比较合适。

  • 当前运行的JDBC连接数不能超过设定的最大值。一般情况下系统性能较好的情况下,JDBC最小值设置50和最大值设置200比较合适。

  • GC频率不能频繁,特别是FULLGC更不能频繁,一般情况下系统性能较好的情况下,JVM最小堆大小和最大堆大小分别设置1024M比较合适。

数据库指标

1、定义及解释

常用的数据库例如MySQL指标主要包括SQL、吞吐量、缓存命中率、连接数等,具体如下:

1.png

2、标准

  • SQL耗时越小越好,一般情况下微秒级别。

  • 命中率越高越好,一般情况下不能低于95%。

  • 锁等待次数越低越好,等待时间越短越好。

前端指标

1、定义及解释

前端指标主要包括页面展示和网络所花的时间,具体如下:

2.png

2、标准

  • 页面要尽可能小及压缩。

  • 页面展示和花费时间越短越好。

稳定性指标

1、定义及解释

最短稳定时间:系统按照最大容量的80%或标准压力(系统的预期日常压力)情况下运行,能够稳定运行的最短时间。一般来说,对于正常工作日(8小时)运行的系统,至少应该能保证系统稳定运行8小时以上。对于7×24运行的系统,至少应该能够保证系统稳定运行24小时以上。如果系统不能稳定的运行,上线后,随着业务量的增长和长时间运行,将会出现性能下降甚至崩溃的风险。

2、标准

  • TPS曲线稳定,没有大幅度的波动。

  • 各项资源指标没有泄露或异常情况。

批量处理指标

1、定义及解释

指批量处理程序单位时间内处理的数据数量。一般用每秒处理的数据量来衡量。处理效率是估算批量处理时间窗口最重要的计算指标。关于批量处理时间窗口,不同系统的批量处理时间窗口在起止时间上可以部分重叠。另外,同一系统内部,也可能存在多个批量处理过程同时进行,其时间窗口相互叠加。长时间批量处理将会对联机在线实时交易产生重大的性能影响。

2、标准

  • 在数据量很大的情况下,批处理时间窗口时间越短越好。

  • 不能影响实时交易系统性能。

可扩展性指标

1、定义及解释

指应用软件或操作系统以集群方式部署,增加的硬件资源与增加的处理能力之间的关系。计算公式为:(增加性能/原始性能)/(增加资源/原始资源)×100%。扩展能力应通过多轮测试获得扩展指标的变化趋势。一般扩展能力非常好的应用系统,扩展指标应是线性或接近线性的,现在很多大规模的分布式系统的扩展能力非常好。

2、标准

  • 理想的扩展能力是资源增加几倍,性能就提升几倍。

  • 扩展能力至少在70%以上。

可靠性指标

1、双机热备

对于将双机热备作为可靠性保障手段的系统,可衡量的指标如下:

  • 节点切换是否成功及其消耗时间。

  • 双机切换是否有业务中断。

  • 节点回切是否成功及其耗时

  • 双机回切是否有业务中断。

  • 节点回切过程中的数据丢失量。在进行双机切换的同时,使用压力发生工具模拟实际业务发生情况,对应用保持一定的性能压力,保证测试结果符合生产实际情况。

2、集群

对于使用集群方式的系统,主要通过以下方式考量其集群可靠性:

  • 集群中某个节点出现故障时,系统是否有业务中断情况出现。

  • 在集群中新增一个节点时,是否需要重启系统。

  • 当故障节点恢复后,加入集群,是否需要重启系统。

  • 当故障节点恢复后,加入集群,系统是否有业务中断情况出现。

  • 节点切换需要多长时间。在验证集群可靠性的同时,需根据具体情况使用压力工具模拟实际业务发生相关情况,对应用保持一定的性能压力,确保测试结果符合生产实际情况。

3、备份和恢复

本指标为了验证系统的备份、恢复机制是否有效可靠,包括系统的备份和恢复、数据库的备份和恢复、应用的备份和恢复,包括以下测试内容:

  • 备份是否成功及其消耗时间。

  • 备份是否使用脚本自动化完成。

  • 恢复是否成功及其消耗时间。

  • 恢复是否使用脚本自动化完成指标体系的运用原则。

  • 指标项的采用和考察取决于对相应系统的测试目的和测试需求。被测系统不一样,测试目的不一样,测试需求也不一样,考察的指标项也有很大差别。

  • 部分系统涉及额外的前端用户接入能力的,需要考察用户接入并发能力指标。

  • 对于批量处理过程的性能验证,主要考虑批量处理效率并估算批量处理时间窗口。

  • 如测试目标涉及到系统性能容量,测试需求中应根据相关指标项的定义,明确描述性能指标需求。

  • 测试指标获取后,需说明相关的前提条件(如在多少的业务量、系统资源情况等)。


作者:Edisonyao

原文链接:https://www.cnblogs.com/Sweettesting/p/15322879.html

  • 【留下美好印记】
    赞赏支持
登录 后发表评论
+ 关注

热门文章

    最新讲堂

      • 推荐阅读
      • 换一换
          •   C端重体验B端重逻辑基本已经成为大部分产品世界的共识了,因此需求梳理成为了B端产品经理重要的工作场景。而如何进程需求梳理,首选应该先确定你是设计的一款标准化商业垂直型产品,还是基于内外部客户明确需求的定制化产品。  标准商业化产品  面向市场对多个行业B端客户销售的产品被称为标准化产品,这类产品主要采用单套产品私部署模式或SAAS云服务模式进行销售,后者是目前市场主流。因为是面向全市场标准化销售产品,在梳理需求前需要先确定产品是面向大部分公司内部标准化业务的业务垂直产品还是面向不同行业用户的行业垂直产品,前者强调解决大部分企业内部一类标准业务,如OA、CRM、HRM等,这种产品需要梳理企业...
            0 0 1042
            分享
          • 9 月 5 日消息,当地时间上周六,美国国家航空航天局 (NASA) 再次取消太空发射系统(SLS)火箭的既定发射计划,这是 NASA 在一周内第二次取消 SLS 火箭发射。NASA 官员们称,取消发射只是暂时的。而大部分业内人士表示,考虑到对整个登月计划的重要性,NASA 的谨慎是明智之举。NASA 高管们表示支持周六取消火箭发射的决定,并表示将准备等待更长时间,在弄清楚氢燃料泄漏的原因并彻底解决这一问题后,本月晚些时候或 10 月份再次尝试发射。NASA 局长比尔 纳尔逊 (Bill Nelson) 在周六下午举行的新闻发布会上说,“两次取消的成本显然要比一次失败要低得多。”虽然有近 10...
            0 0 1326
            分享
          •   据 Display Supply Chain Consultants 称,苹果即将推出的iPad Pro机型将采用"迄今为止市场上最好的 OLED 平板面板"。定于 5 月 7 日发布的OLED iPad Pro机型将采用 LTPO(一种更省电的 OLED)、120Hz ProMotion 刷新率、串联堆叠和玻璃减薄技术,从而带来"超薄、超轻显示屏",支持高亮度、更长的电池续航时间和更长的使用寿命。  与之前的传言一样,今天的报道显示 iPad Pro 机型将有 12.9 英寸和 11.1 英寸两种尺寸可供选择,两种选择都将采用纤薄边框和更薄的设计。...
            0 0 728
            分享
          •   小B是某业务方向的QA(Quality Assurance Engineer,质量保障工程师)负责人,该方向共3名QA同学,按双周对齐需求测试进展时发现,该方向有多个需求提测后需要等待几天时间,QA同学才能介入测试。虽然出现这种情况,跟该方向近期的需求数量变多有直接关系,但依然有两个可持续的改进方向:需求测试效率的进一步提升;部分需求应推动RD(Research and Development Engineer,研发工程师)自测,实行QA免测。  小D是该方向的一名QA,工作3年左右,对于这两个改进方向,他能理解,但也有一点困惑。需求测试效率提升很容易理解,因为效率提升后,QA资源能够尽快...
            0 0 664
            分享
          • 摘要 敏捷开发已深入互联网产品的研发和团队管理过程,当前互联网+时代要求软件研发企业在面对市场需求是要能够做到快速响应,传统的瀑布开发模式已经不能满足互联网企业一系列的需求。敏捷开发提倡拥抱变化、高效沟通、持续交付、紧密协作,强调团队的自组织,本文根据实际应用情景,谈一谈在敏捷开发过程中,通过简化工作流,提升团队协作和沟通,来提高项目管理的效率,降低成本、实现产品的快速交付。关键词 敏捷开发;信息系统;项目管理;软件开发敏捷开发(Agile Development)是一种以人为核心、迭代、循序渐进的开发方式,目前主要有Scrum、XP和看板模式。敏捷采用的是迭代式开发,主要驱动核心是人。目前许...
            13 13 1155
            分享
      • 51testing软件测试圈微信