关于缺失值和异常值等数值处理的疑问-软件测试问答-51Testing软件测试圈

我的主页通知已购设置我的钱包
退出

关于缺失值和异常值等数值处理的疑问
其它

网上看了很多关于异常值处理，缺失值填充的文章，感觉有些简单化处理了。。不知道是否我自己钻牛角尖了。。
我手头有一组数据，其中数据是不同企业各自的数据记录。其中不少记录是有异常值和缺失值的。
1. 不同企业之间差别较大，异常值的判定，需要通过对企业分组进行判定。换句话说，一个数值在这个企业可能是正常值，而对另外一个企业可能就是异常值。
2. 关于缺失值的填充，同样存在类似问题。。不同企业之间的数据差别可能较大，如果数据填充时，用简单的均值或是线性插值法填充，就会导致数据填充的可信度较低。我个人以为，也应该按照企业分组来进行分别填充处理。
我不知道是否我的想法有些极端了，亦或是本身数据处理就不必思考过多。毕竟数据本身就很可能存在不少异常或缺失情况，而有些模型对异常或缺失值又并不敏感。。
想请教下各位，具体数据处理过程中，是怎样做呢？

凌末 2019-05-29 13:27:39
阅读 1621 收藏 0 回答 1

邀请
收藏
分享

登录后发表评论

推荐问答
换一换

1.00元如何实现从001到110
浏览 1 回答 06-15
- 西西
- python
fiddler 抓包怎么看信息
浏览 2 回答 01-21
- 任我行
- 测试技术
asp.net 点击按钮后DataDrid里的文本框显示单选框
浏览 1 回答 07-23
- 啊啊咦咦呦呦
- 其它
API接口测试用例编写有哪些规则
浏览 1 回答 09-24
- 饼干
- 移动测试
在软件测试中UT，IT，ST，UAT分别是什么意思？
浏览 1 回答 03-25
- 落叶凌飒
- 测试技术

关于我们联系我们版权声明广告服务站长统计
建议使用IE 11.0以上浏览器，800×600以上分辨率，法律顾问：上海兰迪律师事务所项棋律师
投诉及意见反馈：webmaster@51testing.com; 业务联系：service@51testing.com021-64471599-8017

51testing软件测试圈微信