测试核心：如何减少线上故障？——软件测试圈-软件测试文章-51Testing软件测试圈

首页文章问答 51讲堂活动

写文章提问题

我的主页通知已购设置我的钱包
退出

测试核心：如何减少线上故障？——软件测试圈
北极 2022-12-07 16:27:45 字数 1679 阅读 1110 收藏 0

测试管理自动化测试

质量保障的核心目标

质量保障的核心目标在实际的项目或团队中很少有明确的约定或口径，就实际经验而言，可以归于一条：线上故障的减少。这个经验得来的目标实际是一个非常宽泛的目标了，通过团队成员的多方努力，这个目标仍然是“若即若离”。

站在不同人员的角度，对测试目标会有共同的期望：故障的减少 & 人效的提升 & 迭代周期的缩短。但对测试结果的期望，线上故障的减少可以说是最核心的一个目标。

产品故障的广泛定义

从广义上来说，故障同时包括了：硬性质量引发的问题、软性质量引发的问题、需求定义引发的问题。

硬性质量引发的问题

指上线/配置修改等直接引发的线上不可用问题(用户直接不可用)

软性质量的引发的问题

指新功能上线/改版等引发的不好用问题(用户直接产生不好用的感受，当然，这部分实际项目中往往不被直接当成线上故障通过回滚版本的方式来处理。)

需求定义引发的问题

指新功能上线/改版后立即重新上线推翻修改。比如推翻之前的实现；走回头路；由于大 Boss 推翻 3 周的实现等。

故障发生有种种可能的情况，这里更多的是从狭义角度来定义故障的，即：给用户带来不可用的问题，并常常通过回滚版本的方式进行处理，对应硬性质量引发的问题。

如何减少线上故障？

减少故障需要考虑的研发阶段

由于故障可能在需求、技术设计、开发、漏测、上线不规范等过程产生，因而，故障的控制必须从各个阶段分别入手。

针对已有的故障，在复盘时找到最根本的原因

线上的故障，最多的呈现形式往往是某个边缘功能的漏测，上线新功能问题等等，但这些问题的出现需要更深层次的深挖。例如，某个功能的漏测，可能是 QA/开发人员对影响点评估不足，但也可能是频繁快速的超负荷迭代，导致无暇东顾；上线新功能问题，可能是因为开发人员/QA 人员对上线 checklist 评估不到位，也可能是项目管理混乱导致，或是线上线下环境 gap 导致。

根据业务成熟度、团队成员特点有针对性应对

不同阶段的业务需要不同程度的质量侧重，例如，在产品的野蛮增长期，为了实现产品原型的快速上线，允许不影响使用的问题存在。

不同团队成员(产品、研发)有略微不同的合作模式，例如，有的团队人员都特别有经验，本身需求、提测质量都很高，这时不妨和团队成员一起制定更加成熟的产品质量数据；相反，则需要从最基础的需求变动、提测等流程开始一点一滴的实践起来了。

具体评估整个项目迭代成熟度

1. 整个迭代周期是否合适，保证反复迭代时不会对质量产生风险。

具体来说就是，需求变动方面、开发周期、测试后期、上线周期等是否存在时间过紧的情况。或许偶尔几次的赶上线，对质量没有太大问题，但长期如此，出问题可能就是必然了。

2. 测试人力的效率。

主要指为了测试的深度和广度，是否采用了性价比较高的测试执行手段，当然了，这里并一定说自动化执行就一定比手工执行效率高，关键在特定场景下，哪种效率更高。

3. 测试覆盖度。

指整个测试方案是否足够深、广，保证了测试的覆盖度。

4. 需求特点。

根据需求量做特别考虑，例如，重写代码的时候往往过于乐观，结果过于乐观，此时就需要周知团队成员特别重视了。

5. 业务耦合度。

需要考虑紧密耦合的业务，在开发/测试方面是否合理。记得很久之前接触过一个业务 B，强依赖与业务 A，而业务 A、B 是隶属于两个团队的，带来的问题就是：不仅开发的时候需要多方周知，测试的时候往往需要找业务 A 的人员创造场景，当然了，因此也引发了一些耦合度太高导致的测试不充分，进而引发了线上故障。

6. 风险控制。

主要包括故障降级、灰度发布、迭代频次/发布周期等。需要针对不同的业务特点，制定不同的风险控制方案。比如，有的业务本身就多个业务强依赖，一旦出问题，原因特别难排查，那么就可以提供 debug 工具/方案来更加精准、快速定位问题；有的业务本身新增的功能/服务特别多，那么就需要提供上线演练/预发布等方案，来尽量降低上线不规范/误操作/环境 gap 等引发的问题了。

作者：测试人

原文链接：https://xie.infoq.cn/article/f35dfd71faae8cc148833f3e1

-1.00 查看剩余0%
【留下美好印记】

赞赏支持

登录后发表评论

北极测试员

+ 关注

最新讲堂

推荐阅读
换一换

- 使用postman进行接口自动化测试——软件测试圈
  09-08
  
  在使用postman进行接口自动化测试前，需要对postman的基本使用有一定的了解首先，既然是自动化测试，那么我们肯定需要工具 (Postman) 或者代码帮我们直接判断结果是否符合预期。那么在接口测试上，大体就两个思路：判断请求返回的 code 是否符合预期；判断请求返回的内容中是否包含预期的内容（关键字）。接下来我们看看如何利用 Postman 来解决上述的问题，这是三个模拟天气的接口集合，点击扩展按钮，找到RUN，进入这里我们先简单运行一次：发现，运行成功。里面我每个接口都写了两个tests进行校验字段，所以上面一共有6条tests测试点被测试到，并且是成功的每个接口里的tests数据...
  - 饭团🍙
  接口测试
  0 0 1050
  分享
  复制链接
  
  新浪微博
  
  微信扫一扫
- 中国互联网的标志倒下了？天涯论坛停止发帖90后的青春没了——软件测试圈
  11-29
  
  11月28日，有媒体称，国内知名互联网平台天涯论坛已经无法发帖，各个板块都冻结在了11月22日18时。天涯论坛停止发帖，意味着不久后将会终止服务，直到退出历史舞台。这一切来得很突然，小雷的同事表示前几天还在该论坛的莲蓬鬼话板块看故事。据小雷了解，天涯论坛创办于199年3月1日，曾经是国内互联网行业中极具影响力的论坛。这个论坛饱含着80、90后的回忆，对于他们来说，曾经的天涯论坛不亚于今天的微博，每天上网第一件事就是打开论坛看八卦，看互联网发生了什么，据说很多的一些经典的八卦传闻以及网络梗都出自天涯论坛。而“自古二楼出人才”的梗，也是出自天涯论坛，据说帖子评论区里第二个回复的用户总能说出一些让人...
  - 恬恬圈
  信息资讯
  0 0 713
  分享
  复制链接
  
  新浪微博
  
  微信扫一扫
- 测试管理工具JIRA之API应用及实践案例——软件测试圈
  05-22
  
  　　1 JIRA API 简介　　JIRA 在不同的企业行业应用的方法都是不一样的，有的需求通过JIRA配置就可以实现，有的需求无法通过配置来实现，或者基于提效的目的，就需要基于 JIRA API 进行二次开发。比如：批量导入团队成员，批量配置项目空间，两个不同问题类型状态的关联转换等等。　　JIRA官网的指导手册是基于 Java的，只有英文版的。由于我没有java基础，所以我是用的python来实现的二次开发。python的jira库，功能是完整的，官网上有接口，库里都有。　　python 版：https://jira.readthedocs.io/ind...
  - 饼干
  测试管理其他工具或框架
  0 0 1393
  分享
  复制链接
  
  新浪微博
  
  微信扫一扫
- 职场女性必备攻略：宝妈如何重返职场？——软件测试圈
  07-19
  
  　　虽然当代社会已经是一个男女平等的社会，但是在职场中男女平等真的做到了吗？　　真实情况是还是有区别对待的，特别是已经结婚但是未生育的职场女性。同样的工作能力，同样的薪资要求，一般企业更会倾向于选择一位男性求职者。　　那么作为一个重返职场的宝妈或者是即将成为宝妈的女性来说，在职场中更是不占优势的，那么这部分人在求职或者工作的过程中，应该注意一些什么呢？　　准宝妈之求职篇　　作为一位准宝妈来说，如果目前是有工作的，那么是不建议在妊娠期间更换工作的，出去应聘的时候，企业会考虑到实际情况：要产检、不能加班、又很快会面临产假......　　在员工本身还没有给企业创造价值的时候，企业还需要支付员工的产假...
  - 曼倩诙谐
  职业发展
  0 0 1137
  分享
  复制链接
  
  新浪微博
  
  微信扫一扫
- 接口测试Jmeter：登录篇——软件测试圈
  10-21
  
  在接口测试的工作中我们一般首先面对的时登录操作，由于部分系统出于对安全性的考虑，登录做的都比较复杂如：参数加密传输；需要输入验证码；需要进行ToKen等。面对这里都是让我们接口测试时比较头疼的，那我们就先从易到难说下去。1、常规登录：首先我们要建一个HTTP请求默认值，将公共用到的协议，服务器或ip，端口进行录入如：然后新建一个线程组，在线程组中我们建一个cookie管理器（不需要任何设置），这个的作用就是将下面登录的获得cookie共享给整个线程（如需共享给整个计划，将cookie管理器放置到线程组同级即可）。最后我们就可以做接口请求了：新建一个HTTP请求这里需要填入：方法post；路径/...
  - 北极
  Jmeter 接口测试
  0 0 1441
  分享
  复制链接
  
  新浪微博
  
  微信扫一扫