• 3
  • 2
分享

      说到性能测试,我们到底是想谈论什么?

      任何做产品的,都希望自己家的产品,品质优,性能好,服务海量用户,还不出问题。

      任何使用产品的,都喜欢自己购买的产品功能全,性能优,不花一分冤枉钱。

      不过理想很丰满,现实很骨感。实际产品的性能与开发周期,部署方式,软硬件性能等都息息相关。所以真正提到做性能测试的场景,多数是为满足特定需求而进行的度量或调优。

      比如:

  • 针对交付客户的软硬件环境,提供性能测试报告,证明对客户需求的满足

  • 针对特定的性能瓶颈,进行针对性测试,为问题定位提供帮助

  • 重大功能迭代,架构设计上线前的性能评估

      所有的这些场景,都隐含着对性能测试目标的确认,这一点非常重要。因为如果没有明确的测试目标,为了做而做,多数情况是没有价值的,浪费精力。

      而性能测试的目标一般是期望支持的目标用户数量,负载,QPS等等,这些信息一般可以从业务负责人或者产品经理处获得。当然如果有实际的业务数据支持,也可以据此分析得出。所以在开展性能测试之前,一定要先搞清楚测试目标。

      目标明确之后,如何开展性能测试?

      有了性能测试目标,之后还需要进一步拆解,做到具体可执行。根据经验,个人认为性能测试的执行,最终会落地到以下两个场景:

  • 在特定硬件条件,特定部署架构下,测试系统的最大性能表现

  • 在相同场景,相同硬件配置下,与竞品比较,与过往分析,总结出优劣

      不同的目的,做事的方式也不一样。

      第一类场景,因为结果的不确定性,测试时需要不断的探索测试矩阵,找出尽可能优的结果。

      第二类场景,首先需要理清楚,业界同类产品,到底比的是什么,相应的测试工具是什么,测试方法是什么。总之要在公平公正的条件下,遵循业界标准,得出测试结果,给出结论。

      所有的性能测试场景,都需要有明确的分析与结论,以支持上述两个场景下的目的达成。测试场景要贴近实际的目标场景,测试数据要贴近实际的业务数据,最好就用目标业务场景下的数据来进行性能测试。

      服务端性能测试到底要看哪些指标?

      不同的领域,业务形态,可能关注的性能指标是不一样的,所以为了表述精确,我们这里只谈服务端的性能测试指标。

      一般我们会用以下指标来衡量被测业务: QPS, 响应时间(Latency), 成功率,吞吐率,以及服务端的资源利用率(CPU/Memory/IOPS/句柄等)。

      不过,这里有一些常识需要明确:

  • 响应时间不要用平均值,要用百分值。比如常见的,98值(98th percentile)表示。

  • 成功率是性能数据采集标准的前提,在成功率不足的情况下,其他的性能数据是没意义的(当然这时候可以基于失败请求来分析性能瓶颈)。

  • 单独说QPS不够精确,而应结合响应时间综合来看。比如 "在响应时间TP98都小于100ms情况下,系统可以达到10000qps" 这才有意义。

  • 性能测试一定要持续一定时间,在确保被测业务稳定的情况下,测出的数据才有意义。

      要多体会下这些常识,实战中很多新手对这块理解不深,导致有时出的性能数据基本是无效的。

      为什么性能测试报告一定要给出明确的软硬件配置,以及部署方式?

      前面说到,性能数据是与软件版本,硬件配置,部署方式等息息相关的。每一项指标的不同,得出的数据可能是天差万别。所以在做性能测试时,一定要明确这些基础前置条件,且在后期的性能测试报告中,清晰的说明。

      jmeter, ab, wrk, lotust, k6 这么多性能测试工具,我应该选择哪个?

      业界性能测试数据工具非常多,不过适用的场景,以及各自特点会有不同。所以针对不同的性能测试需求,应当选择合适的性能工具。比如:

  • jmeter: 主要提供图形化操作以及录制功能,入门简单,功能也较强大。缺点是需要额外安装。

  • ab(apech benchmark): 简单好用,且一般系统内置了,应对简单场景已足够

  • lotust:简单好用,支持python编写自定义脚本,支持多worker,图形化界面汇总性能数据。

      这里不一一介绍工具,大家有兴趣的都可以自行去网上搜索。

      其实笔者在实践过程中发现,其实绝大多数性能测试场景,都需要编码实现。所以如何优雅的结合现有的测试代码,环境,以及基础设施,来方便的进行性能测试反而是个可以考量的点。

      笔者比较认可Go+Prometheus+Kubernetes的模式。首先go语言因其独有的并发模式,上手简单等特点,在云服务,服务端程序领域使用已经非常广了,采用其写脚本,也许与被测程序天然紧密结合。且服务端程序要想很好的运维,必然有一套完整的监控告警体系,而Prometheus基本是其中热度最高的,使用范围最广的,同时我们也可以将测试程序性能数据打点到Prometheus,这样在计算QPS,成功率等指标上,非常方便。

      另外大家知道,在性能测试时,多数需要不断的调整metrix,比如并发数,worker数量等,来探测系统的性能表现,这时候如果将测试程序跑在Kubernetes上,就可以借助其能力,比如Deployment,灵活的部署和水平扩展,体验相当优雅。

      单机10000并发为什么可能不靠谱?

      我们知道使用goroutine,可以瞬间开很多并发,非常好用。于是可能就会有同学觉得用它做性能测试很方便,直接写个脚本,起超多的并发,去做性能测试。但这样真的靠谱吗?

      虽然go语言的并发,通过P,G,M模型,在调度goroutine时,比较高效,但无论如何,任何的程序执行,最终消耗的都是系统资源,测试脚本也同样。所以单机上执行的并发效果,最终会受限于,你脚本的复杂程序,也就是对CPU,IO,网络等系统资源的消耗。所以,并不是并发越多越好,一定是基于实际环境,通过不断调节并发数量,worker数量等,来达到最佳姿势。

      构建业务性能数据的持续可观测性对产品质量意义重大

      一次专项性的性能分析,可以观察当前业务的性能表现,进一步的分析性能瓶颈,为之后的改进提供帮助,意义挺大。但只这样可能不够全面,因为指不定的某次迭代,句柄没关,goutinue泄露,就会造成性能问题,如果我们没有常态化的检测手段,等上线后才发现,很明显不是我们想看到的。

所以更优雅的做法是,将性能测试常态化的持续运营,甚至可以做到每次PR触发,都自动执行性能测试,检测性能问题。


作者:大卡尔

原文链接:https://www.cnblogs.com/jinsdu/p/10646278.html

  • 【留下美好印记】
    赞赏支持
登录 后发表评论
+ 关注

热门文章

    最新讲堂

      • 推荐阅读
      • 换一换
          •   Vue 正在不断发展,目前,在Vue 3  中有多种定义组件的方法。从选项到组合再到类 API,情况大不相同,如果您刚刚开始,可能会感到困惑。让我们定义一个简单的组件并使用所有可用的方法重构它。  1.  Options API  这是在 Vue 中声明组件的最常见方式。从版本 1 开始可用,您很可能已经熟悉它。一切都在对象内声明,数据在幕后由 Vue 响应。它不是那么灵活,因为它使用 mixin 来共享行为。  <script>   import TheComponent from './components/TheC...
            0 0 33
            分享
          •   接前一篇:  《蚂蚁金服测试大佬的职场总结:抛开技术,还有它》  在这个篇章中,我们共同深度探讨面试这一关乎职业生涯发展的重大课题。作为一个在软件行业沉浸十余载的资深人士,我不仅亲历了技术研发的艰辛与喜悦,更在招聘面试环节扮演了举足轻重的角色。据粗略统计,经我面试过的候选人数量已然突破四位数,而我自身作为被面试者所经历的面试也同样不在少数,可以说积累了相当丰富的实战经验。  面试的本质,如果我们把它比喻为市场营销,其实就是将自己当作一款极具竞争力的产品,竭尽全力地向面试官呈现最优质的自己,以期在众多竞争者中脱颖而出,赢得他们的青睐与信任。  许多求职者往往聚焦于自身专业技术与技能,误以为面...
            0 0 436
            分享
          •   笔者从08年开始做软件测试,到现在有10多年的时间了,以功能测试为主,做过将近两年的自动化测试,目前在家里做电商。  大家都知道今年的行情不太好,前段时间在各大网站上投了几百份简历,只收到了一个面试通知,公司在宝安的一个工业园,坐车过去需要一个多小时。  笔试  约好的面试时间是上午10点,为了不迟到,我8点就出发了,大概9点45分到达公司。然后前台让我填了一下表,接着给了我一份面试题,让我做完以后交给她。  我看了一下题目并不难,基本上都是问答题,主要是关于逻辑思维能力以及如何设计测试用例方面的。由于我有一年多的时间没做测试了,所以很多东西都荒废了,导致有几道题没答好,卷子做完之后就交给...
            0 0 891
            分享
          •   波音公司本周三披露细节,称 2023 年 11 月公司遭到勒索软件攻击,黑客索要高达 2 亿美元(当前约 14.44 亿元人民币)的赎金,最终公司决定拒绝支付。  网络犯罪分子于 2023 年 10 月使用 LockBit 勒索软件平台,开始尝试攻击波音公司,于 11 月初窃取了大约 43GB 的公司机密文件,相关文件随后被发布到 LockBit 网站上。  波音公司拒绝向黑客支付赎金,表示黑客攻击影响了公司的全球服务业务部门和零部件部门,未对飞行安全造成影响。  网络安全公司 Emsisoft 的勒索软件分析师布雷特?卡洛(Brett Callow)表示:“这可能是目前黑客索要第二多的赎...
            0 0 490
            分享
          • 1、引言今天分享的这部分内容,应该算是Locust的进阶篇,毕竟针对一般的性能自动化测试人员来说,掌握小鱼写的前5章节的知识,就能足够应对大部分情况。但是,针对有些需要进阶自己的技术,那么,可以持续关注小鱼的博客,让我们一起探索Locust,探索性能自动化。那么,话不多说,我们开始今天的进阶篇,自定义负载测试图形2、定义有些时候,默认的形状已经无法满足我们的特定要求,那么这个时候,我们就需要完全自定义负载测试的图形形状。而这并不难,就是通过设置 用户或者更更改用户数和产生率来实现的。2.1 列举实例例如:我们想自定义时间生成负载峰值或上下倾斜。如何实现呢??直接使用 LoadTestshape...
            1 0 2965
            分享
      • 51testing软件测试圈微信