- 什么是可靠性测试:
系统的可靠性是指在发生故障的情况下,系统的数据部丢失,故障恢复后系统能够正常工作。可靠性测试是有针对性的对系统注入特定的故障的一种测试活动。
- 什么是故障模型库
故障模型库是将故障整理分类后的故障集合。
- 故障模型库分类
-
- 操作系统
按网络资源分类:创建大量socket连接(tcp连接)、配置ip地址(占用指定的ip)、删除指定网卡ip地址
按系统操作分类:操作系统吊死、关闭主机(poweroff -f)、修改用户密码、重启主机(shutdown -r)
按系统资源分类:部分cpu核心失效、限制用户资源(cpu、句柄、进程,修改/etc/security/limits.conf)消耗jvm、消耗cpu、消耗内存、消耗系统io、消耗系统进程数、消耗句柄
2.网络QoS
按网卡分类:禁用网卡、删除网卡驱动、网卡启停断续、修改网卡工作模式(ethtool)
按网络服务分类:FTP服务吊死、停止网络服务(rcnetwork stop命令停止所有网卡服务)
按网络连接分类:TCP端口占用、TCP连接吊死、网络单通(iptables)、网络风暴、网络闪断(iptables 反复丢掉数据报文来模拟)、限制网络带宽(tc)、消耗网络带宽
按网络数据分类:数据报文错误(tc)、数据报文丢失(iptables)、数据报文丢失(tc)、数据报文乱 序(tc)、数据报文延迟抖动(tc)、数据报文重复(tc)
3.文件系统
按文件系统分类:抢占文件系统空间(dd)、修改文件系统权限、损坏文件、修改目录
4.系统进程
按进程操作分类:挂起进程、挂起线程、结束进程、结束线程、进程启动、进程死循环
按进程状态分类:进程转为D状态、进程转为Z状态
5.磁盘
磁盘系统故障类型主要有:DF(device fault)全F坏道,不提供读写
UNC坏道,读出错,写可修复,此故障发生最为频繁
WP(write projected)写保护,写出错,读正常
ICRC 链路传输出现误码,持续出现的话会导致I/O阻塞
DS(disk slow)慢盘
这些都是平时项目过程中测试过的可靠性场景,这些故障有些可以通过shell命令模拟,有些需要特定的工具(磁盘就需要rdisk.ko工具),系统进程的操作都是通过内部开发的一个工具实现的,可靠性测试深不可测啊 ,需要在这条路上继续摸索。
---------------------------------------------------------------------------------------------------------------
如需转载,请注明出处,多谢!