找回密码
 会员注册
查看: 32|回复: 0

Python-凯斯西储大学(CWRU)轴承数据解读与分类处理

[复制链接]

2万

主题

0

回帖

7万

积分

超级版主

积分
73219
发表于 2024-9-4 16:34:27 | 显示全部楼层 |阅读模式
目录1数据集解读1.1 振动信号数据通常以时域显示1.2 凯斯西储大学轴承数据集描述的是什么数据?1.3实验平台介绍待测轴承:1.4以上三个不同位置的振动数据的区别解读1.5官网数据集介绍2数据集分类与制作2.1数据集分类解读2.2数据集处理与制作3基于Python的故障诊断和分类的研究思路3.1关于轴承故障类型分类的方法探讨3.2重点介绍关于轴承故障数据时频图像分类的方法   往期精彩内容:Python-凯斯西储大学(CWRU)轴承数据解读与分类处理Python轴承故障诊断(一)短时傅里叶变换STFTPython轴承故障诊断(二)连续小波变换CWT_pyts小波变换故障-CSDN博客Python轴承故障诊断(三)经验模态分解EMD_轴承诊断pytorch-CSDN博客Pytorch-LSTM轴承故障一维信号分类(一)_cwru数据集pytorch训练-CSDN博客Pytorch-CNN轴承故障一维信号分类(二)-CSDN博客Pytorch-Transformer轴承故障一维信号分类(三)-CSDN博客Python轴承故障诊断(四)基于EMD-CNN的故障分类-CSDN博客Python轴承故障诊断(五)基于EMD-LSTM的故障分类-CSDN博客Python轴承故障诊断(六)基于EMD-Transformer的故障分类-CSDN博客Python轴承故障诊断(七)基于EMD-CNN-LSTM的故障分类-CSDN博客Python轴承故障诊断(八)基于EMD-CNN-GRU并行模型的故障分类-CSDN博客基于FFT+CNN-BiGRU-Attention时域、频域特征注意力融合的轴承故障识别模型-CSDN博客基于FFT+CNN-Transformer时域、频域特征融合的轴承故障识别模型-CSDN博客大甩卖-(CWRU)轴承故障诊数据集和代码全家桶-CSDN博客Python轴承故障诊断(九)基于VMD+CNN-BiLSTM的故障分类-CSDN博客Python轴承故障诊断(十)基于VMD+CNN-Transfromer的故障分类-CSDN博客Python轴承故障诊断(11)基于VMD+CNN-BiGRU-Attenion的故障分类-CSDN博客交叉注意力融合时域、频域特征的FFT+CNN-BiLSTM-CrossAttention轴承故障识别模型-CSDN博客交叉注意力融合时域、频域特征的FFT+CNN-Transformer-CrossAttention轴承故障识别模型-CSDN博客轴承故障诊断(12)基于交叉注意力特征融合的VMD+CNN-BiLSTM-CrossAttention故障识别模型-CSDN博客Python轴承故障诊断入门教学-CSDN博客Python轴承故障诊断(13)基于故障信号特征提取的超强机器学习识别模型-CSDN博客Python轴承故障诊断(14)高创新故障识别模型-CSDN博客Python轴承故障诊断(15)基于CNN-Transformer的一维故障信号识别模型-CSDN博客轴承故障全家桶更新|基于时频图像的分类算法-CSDN博客Python轴承故障诊断(16)高创新故障识别模型(二)-CSDN博客Python轴承故障诊断(17)基于TCN-CNN并行的一维故障信号识别模型_pytorch使用tcn网络进行故障诊断csdn-CSDN博客引言本文深入浅出地讲解经典轴承故障数据集,可以作为轴承故障诊断和分类的入门级文章。1数据集解读1.1 振动信号数据通常以时域显示在轴承故障数据集振动信号的时域表示中,通常将时间作为横轴,振动信号的幅值作为纵轴。具体来说:横轴(X轴)代表时间:时间是指振动信号采集的时刻或时间序列中的时间点。它表示了信号采集的顺序和时间间隔。横轴上的单位通常是秒(s)或毫秒(ms),取决于信号采集的频率和持续时间。纵轴(Y轴)代表振动信号的幅值:振动信号的幅值表示了在特定时间点或时间段内的振动强度或振幅。它反映了振动信号的能量或振幅大小。在轴承故障数据集中,纵轴(Y轴)代表的是轴承的振动信号的幅值,以加速度(Acceleration)作为单位。纵轴上的数值表示轴承在特定时间点或时间段内的振动加速度值。振动加速度是指物体在振动过程中的加速度变化,它是描述振动强度和振动频率的重要指标之一。在轴承故障数据集中,通过对轴承进行传感器测量,可以获取到轴承在运行过程中产生的振动信号,其幅值通过加速度来表示。通过时域显示,我们可以观察到振动信号随时间的变化情况,包括振动的周期性、幅值的变化、脉冲或波形的形状等。这有助于分析信号中的特征、频率成分、周期性或随机性等,并对振动信号的特征进行故障诊断、频谱分析、波形分析等进一步处理和解释。1.2 凯斯西储大学轴承数据集描述的是什么数据?该数据集是一个常用的轴承故障数据集,用于故障诊断和预测的研究。该数据集包含了来自不同故障模式和工作条件下的轴承振动数据。数据集描述的是在旋转机械系统中使用的轴承的振动信号数据。轴承是旋转机械中的重要组件,常常承受着高速和高负荷的工作环境,因此容易发生故障。自身内部的缺陷有很多种像在加工生产时产生的或者在组装过程中导致的形变,外部环境所导致的故障也有很多种例如变形、磨损、裂变等。通过监测轴承的振动信号,可以获得关于轴承运行状态的信息,进而进行故障诊断和预测。1.3实验平台介绍该实验台如图所示,其组成为:一个1.5KW(2马力)的电动机(图左侧);一个扭矩传感器/译码器(图中间连接处);一个功率测试计(图右侧);电子控制器(图中没显示)。待测轴承:基座数据电机驱动端电机风扇端1.4以上三个不同位置的振动数据的区别解读通过在电机壳体的驱动端、风扇端和基座上放置加速度计,可以获取到三个不同位置的振动数据。这些数据的区别在于它们所测量的振动信号反映的是不同的物理现象和特征,因而可以提供不同的信息用于故障诊断和监测。驱动端数据:位于电机壳体的驱动端的加速度计测量的是电机驱动端的振动信号。这个位置上的振动信号主要受到电机转子的旋转和传动系统的激励影响,因此可以提供关于电机传动系统和驱动端的故障信息,例如轴承故障、齿轮啮合故障等。风扇端数据:位于电机壳体的风扇端的加速度计测量的是电机风扇端的振动信号。这个位置上的振动信号主要受到风扇叶片的旋转和风扇系统的激励影响,因此可以提供关于风扇系统的故障信息,例如风扇叶片失衡、风扇轴承故障等。基座数据:位于电机底座的加速度计测量的是整个电机系统的振动信号。这个位置上的振动信号受到电机整体结构和运行状态的影响,可以提供关于整个电机系统的故障信息,例如电机不平衡、底座松动等。因此,通过收集不同位置上的振动数据,可以综合分析不同位置所提供的故障特征,从而更全面地了解电机系统的健康状况和故障状态。这有助于提高故障检测的准确性和针对性,以便及时采取适当的维护和修复措施。1.5官网数据集介绍这是西储大学轴承数据中心网页下载数据的界面DE-驱动端加速度计数据 FE-风扇端加速度计数据 BA-基座加速度计数据 time-时间序列数据RPM-rpmduringtesting转每分钟第一个数据集:正常基线数据MotorLoad(HP)的中文意思是电机负载(马力)。它表示施加在电动机上的功率或负载,通常以马力(HP)为单位进行衡量。它代表电机所执行的工作量或所生成的功率。在0、1、2和3马力的电机负载工况工作条件下记录振动加速度信号数据。MotorSpeed(rpm):近似电机转速(rpm) 在不同负载和转速下一共有四组正常的数据,数据文件为Matlab格式。用Python读取第一个数据集结果如下:data=loadmat('97_0.mat')data{'__header__':b'MATLAB5.0MAT-file,PlatformCWIN,Createdon:MonJan3115:28:202000','__version__':'1.0','__globals__':[],'X097_DE_time':array([[0.05319692],    [0.08866154],    [0.09971815],    ...,    [-0.03463015],    [0.01668923],    [0.04693846]]),'X097_FE_time':array([[0.14566727],    [0.09779636],    [0.05485636],    ...,    [0.14053091],    [0.09553636],    [0.09019455]]),'X097RPM':array([[1796]],dtype=uint16)}数据为字典格式,包括了创建版本信息、驱动端、风扇端、RPM转速信息等第二个数据集:12k驱动端轴承故障数据采样频率为12kHz,数据收集在12,000次/秒。故障直径(FaultDiameter):指轴承或其他机械部件上出现的故障或损伤的直径尺寸。故障直径通常用来描述故障的大小和程度,对于故障诊断和预测维护非常重要。单位为英寸,1英寸=25.4mm0.007英寸=7mils=0.1778mm0.014英寸=14mils=0.3556mm 0.021英寸=21mils=0.5334mm0.028英寸=28mils=1.016mm MotorLoad(HP)电机负载和MotorSpeed(rpm)电机转速同上。在轴承中,"InnerRace"(内圈)、"Ball"(滚珠)和"OuterRace"(外圈)是三个重要的组成部分,它们一起构成了轴承的基本结构。下面是它们的具体含InnerRace(内圈):内圈是轴承的一个环状部件,通常位于滚珠或滚子之内,与轴相配合。内圈通过与滚动体接触,在轴上旋转,承受和传递轴向和径向负荷。Ball(滚珠):滚珠是轴承中的滚动体,它们通常是小球状的物体,可以在内圈和外圈之间滚动。滚珠在轴承中起到支撑和传递负荷的作用,减少摩擦和滑动。OuterRace(外圈):外圈是轴承的另一个环状部件,位于滚珠或滚子的外部。外圈与内圈和滚珠配合,提供轴承的外部支撑和固定。这三个部分共同工作,形成了轴承的基本结构,以支撑和传递轴上的负荷,减少摩擦,并使轴承能够平稳运转。它们的材料和设计会根据不同的应用和轴承类型而有所差异,以满足特定的负荷和工作环境要求。驱动端和风扇端轴承外圈的损伤点分别放置在3点钟、6点钟、12点钟三个不同位置。所以外圈的损伤有三个数据集。用Python读取第一个数据集IR007_0结果如下:data=loadmat('105.mat')data{'__header__':b'MATLAB5.0MAT-file,PlatformCWIN,Createdon:MonJan3113:49:592000','__version__':'1.0','__globals__':[],'X105_DE_time':array([[-0.08300435],    [-0.19573433],    [0.23341928],    ...,    [-0.31642363],    [-0.06367457],    [0.26736822]]),'X105_FE_time':array([[-0.40207455],    [-0.00472545],    [-0.10663091],    ...,    [0.31598909],    [0.35091636],    [0.03307818]]),'X105_BA_time':array([[0.06466148],    [-0.02309626],    [-0.08852226],    ...,    [0.09648926],    [0.08405591],    [-0.02015893]]),'X105RPM':array([[1797]],dtype=uint16)}数据为字典格式,包括了创建版本信息、驱动端、风扇端、基座RPM转速信息等查看一下驱动端数据条数data1['X105_DE_time'].shape(121265,1)将近12万条,也就是采集了近10秒的数据第三个数据集:48k驱动端轴承故障数据驱动端轴承故障还包含采样频率为48kHz的数据,数据收集在48,000次/秒。其分析同上。区别是采样频率不同,故障直径(FaultDiameter)少一种。第四个数据集:风扇端轴承故障数据风扇端采样频率为12kHz的数据,数据收集在12,000次/秒。其分析同上。区别是对象和采样频率不同,故障直径(FaultDiameter)也少一种。上述四种数据集下载后如下2数据集分类与制作2.1数据集分类解读凯斯西储大学轴承数据集包含了以上四种不同故障模式的振动数据,包括内圈故障、外圈故障、滚动体故障。数据集提供了不同工作条件下的实验数据,包括不同转速、载荷和工作时间等参数。每个故障模式都有多个不同工况的样本,按照不同条件约束,其分类形式有多种。当然,如果需要处理这些数据,来进行故障诊断和分类任务,并不是需要网站中的所有数据,可以只选择我们需要的,比如选择驱动端+0HP的故障数据。以 12kDriveEndBearingFaultData举例说明:首先,有四种故障类型,只取前三种,因为0.028没有外圈故障。其次,比如0.007文件,只取前三类,因为第三种负载和第四种负载差不多。最后,外圈故障 只取OuterRace _6,即6点钟的数据集,因为每个文件都有,而且数据差别也不大。综上:三种直径数据和三种故障数据,所以每个工况共有3*3+1(正常数据)=10种数据。所以根据工况的不同可以把数据分为A、B、C三种。每个工况有10种数据。如下:正常0hp为一类0.007 0hp 内圈 滚珠 外圈0.014 0hp 内圈 滚珠 外圈0.021 0hp 内圈 滚珠 外圈2.2数据集处理与制作第一步,数据读取:十类数据集,每类数据集中只获取DE_time数据,Python读取数据如下所示:#采用驱动端数据data_columns=['X097_DE_time','X105_DE_time','X118_DE_time','X130_DE_time','X169_DE_time',        'X185_DE_time','X197_DE_time','X209_DE_time','X222_DE_time','X234_DE_time']columns_name=['de_normal','de_7_inner','de_7_ball','de_7_outer','de_14_inner','de_14_ball','de_14_outer','de_21_inner','de_21_ball','de_21_outer']data_12k_1797_10c=pd.DataFrame()forindexinrange(10):  #读取MAT文件  data=loadmat(f'E:\\codeing\\VscodeProjects\\DeepLearning\\故障诊断\\data_deal\\0_1797\\{file_names[index]}')  dataList=data[data_columns[index]].reshape(-1)  data_12k_1797[columns_name[index]]=dataList[:119808] #121048 min:121265print(data_12k_1797_10c.shape)(121265,1)把数据生成后放在一张表格里(矩阵形式)10列不同分类故障数据标签,一共将近12万行数据,如下图所示然后保存为CSV形式,以便后续处理。data_12k_1797_10c.set_index('de_normal',inplace=True)data_12k_1797_10c.to_csv('data_12k_1797_10c.csv')对10分类数据时序图数据可视化,二维图像辨识度比较高。第二步,制作数据集:数据集的切分方式也多种多样,切分步长也具有多样性,下面按照固定的参数设置进行数据的切分:步长window_step:512(每个样本长度为512个点)重叠率 overlap_ratio:0.5(切分相邻两个样本重叠率)怎么理解重叠率呢?举例如下:切分样本点后,按照7:2:1划分训练集、验证集、测试集,最后保存数据:3基于Python的故障诊断和分类的研究思路3.1关于轴承故障类型分类的方法探讨第一类是对一维故障数据进行分类一是直接对一维故障数据,添加分类标签进行处理,送进CNN、LSTM等网络进行分类;二是先对一维故障数据做一些处理或者去噪,然后再进行分类;第二类是把一维故障数据转换为图像进行分类一是转换为二维时序图进行分类;二是转换为时频图像进行分类;三是基于格拉姆角场(GAF)转换为二维图像进行分类;3.2重点介绍关于轴承故障数据时频图像分类的方法滚动轴承发生故障时,其振动信号往往具有非线性、非平稳性特点。相比传统的时域和频域分析方法,在处理非线性、非平稳信号时,时频分析方法更加有效。时频分析方法采用时域和频域的二维联合表示,可以实现非平稳信号局部特性的精确描述,具有时域和频域等传统方法无法比拟的优势,已经被广泛地应用于机械故障诊断领域。常用的时频分析方法有:傅里叶变换(FourierTransform,FT)短时傅里叶变换(ShortTimeFourierTransform,STFT)小波变换(WaveletTransform,WT)连续小波变换(CWT)下面以连续小波变换(CWT)作为轴承故障数据的处理方法进行讲解:第一步,Python中连续小波变换(CWT)介绍导入相关包,pywt 用于小波变换importnumpyasnpimportmatplotlib.pyplotaspltimportpywtimportpandasaspd加载轴承数据集 驱动端故障数据data3=loadmat(r'21_2.mat')data_list3=data3['X222_DE_time'].reshape(-1)data=data_list3[0:512]设置连续小波变换参数  设置采样周期为1/12000,总尺度为128,小波基函数选择'cmor1-1'sampling_period =1.0/12000totalscal=128  wavename='cmor1-1'计算小波基函数的中心频率 fcfc=pywt.central_frequency(wavename)然后根据 totalscal 计算参数 cparam​cparam=2*fc*totalscal 通过除以 np.arange(totalscal,0,-1) 来生成一系列尺度值,并存储在 scales 中scales=cparam/np.arange(totalscal,0,-1)生成时频图第二步,生成时频图像数据集如图所示为生成的图像数据集第三步,定义数据加载器和VGG网络模型制作数据标签,保存数据定义VGG网络模型第三步,设置参数,训练模型30个epoch,准确率将近90%,继续调参可以进一步提高分类准确率参考资料[1]杜岩. 基于时频图像识别的滚动轴承故障诊断方法研究[2]GShang.博客园(cnblogs.com) -https://www.cnblogs.com/gshang/p/10712809.html代码、数据集如下:对数据集和代码感兴趣的,可以关注最后一行#加载数据importtorchfromjoblibimportdump,loadimporttorch.utils.dataasDataimportnumpyasnpimportpandasaspdimporttorchimporttorch.nnasnn#参数与配置torch.manual_seed(100)#设置随机种子,以使实验结果具有可重复性device=torch.device("cuda"iftorch.cuda.is_available()else"cpu")#代码和数据集:https://mbd.pub/o/bread/ZZablJdp
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 会员注册

本版积分规则

QQ|手机版|心飞设计-版权所有:微度网络信息技术服务中心 ( 鲁ICP备17032091号-12 )|网站地图

GMT+8, 2025-1-12 19:50 , Processed in 0.788136 second(s), 25 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表