摘要:针对自动睡眠分阶技术目前存在的一系列问题和限制,本文围绕小样本数据无法充分发挥特征提取能力和单一网络无法充分表征复杂的脑电信号问题,研究讨论了基于迁移学习和融合网络的自动睡眠分阶方法,最后经过实验验证了本方法,最终的结果表明:(1)采用迁移学习可以很好地解决目前基于脑电信号研究中的数据量不足的缺陷;(2)使用单通道的 EEG 信号与之前的脑电信号(EEG)、眼电信号(EOG)和下颌骨肌电信号(EMG)三种信号拼接相比采集数据更加便捷,仅在受试者的额头中央和头顶中央放置电极使得数据收集过程更加舒适、更易于采集到有效的数据,同时也适用于家庭自助检测设备。
第一章 绪论
1.1 研究背景介绍
根据 2021 年 1 月中国睡眠研究会发布睡眠调查报告,当下中国 3 亿多的人口都患有不同程度的睡眠障碍[1]。在过去的一年中,国民的整体入睡时间延迟了 2-3 小时,并且根据互联网搜索统计,人们对于睡眠问题的搜索量增长了 43%,由此可见睡眠质量问题困扰着很大一部分人。针对频繁出现的睡眠困扰现象,市面上很多自动睡眠检测的产品也应运而生了,包括基于心率的睡眠检测手环、基于呼吸节律的移动设备APP、基于生物雷达的睡眠带、基于脑电信号的多导睡眠仪等。然而,由于生物医疗高精确度的要求,对睡眠分阶检测最准确的还是基于脑电信号的多导睡眠图记录PSG[2]。在医院的睡眠医学中心里临床常用的睡眠诊断设备就是多导睡眠检测仪,将它的多个电极通道贴放在患者的头部、胸部和腿部,用来收集患者睡眠过程中不同部位发出的电生理信号。医生根据反馈到的患者睡眠结构图来判断潜在的睡眠问题,如图 1 所示。传统医院的睡眠医生需要通过视觉观察来根据信号波的特征和走势,判断每个时期隶属于哪个睡眠周期,然后统计每个睡眠阶段在整个睡眠周期的占比,以此来确定测试者的睡眠质量对其进行评估。诊断的过程需要医生在长达 8 个小时的电信号记录中综合根据眼电、脑电、下颌肌电、心电、血氧、呼吸信号和腿动信号来标记患者的睡眠事件,由此对患者的睡眠质量进行评价。该过程费时费力,并且需要专业的睡眠专家进行人为的判断,很容易产生主观方面的判断偏差。
图 1 EEG、EOG、EMG、事件标记、呼吸和体温的睡眠结构图 ...................................
1.2 基于 EEG 自动睡眠分阶技术的发展现状
自动睡眠分阶技术一般由脑电数据预处理、提取特征波和评判分阶结果三个主要阶段组成[11]。基于脑电数据自动睡眠分阶的方法有:基于特定特征选择的机器学习算法[12]、基于人工神经网络训练的方法[13]等。本文现对以上两类方法的研究现状进行简要介绍。
1.2.1 基于特征选择的自动睡眠分阶研究
传统的机器学习方法主要包括决策树[14]、随机选择[15]、人工神经网络[16]、贝叶斯学习[18]等方法。以上这些方法在智能信息分析处理领域获得了很大的关注,由此有学者使用机器学习方法处理脑电信号。脑电信号处理的大致流程是特征提取、特征选择和分类三个步骤。一般的 EEG 信号特征提取常用算法有 AR 模型[21]、共空间模式(CSP, Common Spatial Pattern)[17]、功率谱密度(PSD, Power Spectral density)[19]和小波变换DWT[20]。由于头皮记录的脑电信号噪声大并且失真严重,所以在进行脑电信号分析时,进行特征提取是非常重要的。从 EEG 数据中提取出具有代表的特征是成功进行分类的基础[22]。CSP 是一种二分类任务下的空域滤波特征提取算法,多通道的单类空间分布成分能够从 EEG 数据里面提取。为了使两个分类信号的方差值之差最大化,通常通过找到一组最优的空间滤波器进行投影来实现这个目的,在进行投影时利用了矩阵对角化操作,这样得到的特征向量具有很高的辨识度。通过对空间频率和时间频率进行局部分析,小波变换使用伸缩、平移操作可以从多个尺度逐步对信号进行细化分析,实现高、低频不同的时间细分和频率细分,从而满足时频信号分析需求,对特征选择和信号细节关注有较大帮助。另一种特征提取方法是功率谱密度,通过统计信号功率在各频率点的分布情况,进行特征标记。自回归模型(Auto Regressive Model, AR)是一种线性回归模型,它是通过线性组合之前几个时间的随机变量来描述后续时间的随机变量。由于睡眠过程是一种基于时间序列的数据集,所以可以利用 AR 模型进行分析。1987 年,Stanus 等人根据 R K 规则[23],通过一个基于小波检测和贝叶斯近似的方法对 EEG 数据进行睡眠分类。2017 年,Patti 等人[24]开发了一种基于聚类的自动检测睡眠纺锤波的方法。具体实现是使用高斯混合模型(GMM,Gaussian Mixture Model)对脑电信号进行三个阶段的带通滤波,然后从滑动窗口中提取特征波,将 GMM 应用于提取的特征,将样本聚类为潜在的纺锤波和非纺锤波。最终实验结果表明,在 59.55%-119.7%的假阳性比例下,获得了整体的灵敏度范围是 65.1%-74.1%。
..............................
第二章 自动睡眠分阶方法相关理论介绍
2.1 睡眠数据集处理介绍
2.1.1 非侵入式 EEG 采集
非侵入式脑电图[42(]Electroencephalography, EEG)的大脑信号常使用头皮上放置电极的方法采集。EEG 信号主要是采集大脑皮质中的电活动,大脑皮质中神经元呈柱状排列且靠近颅骨,通常 EEG 的空间辨识度在单位平方厘米内较低,毫秒级别的时间辨识度较好。通过这种方式采集到的 EEG 信号反映了放射状地面向头皮的上千个神经元产生的突触后电位的总和。
EEG 空间分辨率低最主要的原因是信号源与安置在头皮上的电极之间夹着不同的分层组织,脑膜、脑脊液、颅骨、头皮等分层容易影响原始信号的容积导体和低通滤波器,需要后续使用进行信号处理来提升信号可用度。另外,EEG 信号容易被肌肉活动干扰或附近的电气设备污染,眼睛眨动、眉毛运动、口腔咀嚼、声带震颤等类似动作对 EEG 信号都有较大干扰。
通常采集脑电信号的设备是使用标准化电极位置的国际 10-20 系统,如图 4 所示。其中 Fpz-Cz 和 A1-C4 通道分别位于额极中点到中央点、左耳到右中央,测量每一对电极之间的电位差形成 EEG 信号,如图 5 所示。在经典的实验设置中,EEG 电极与各自差分放大器的输入相连,主动电极和参考电极之间的电压通常会被放大 103-105倍。放大后的信号由 A/D 转换器进行数字化处理之前都会经过一个抗混叠滤波器进行滤波操作。根据用途,A/D 转换器的采样频率可以到达 20kHz。脑电信号需要进行数字化处理和后续滤波处理,1-50Hz 的带通滤波器可以去除 EEG 信号中在低频和高频范围内的信号干扰和动作伪迹。
图 5 A1-C4 通道和 Fpz-Cz 通道示意图 ................................
2.2 针对特征选择的自动睡眠分阶方法介绍
随着目前失眠人数的爆炸式增长,传统医院的睡眠医生需要通过视觉观察来根据信号波的特征和走势,判断每个时期隶属于哪个睡眠周期,然后统计每个睡眠阶段在整个睡眠周期的占比,以此来确定测试者的睡眠质量对其进行评估。然而,睡眠专家手动人工进行大量睡眠信号的标注是一件非常费时费力并且易出错的工作,所以在过去的一段时间内,自动睡眠分阶技术成为了脑机接口研究的一个热点。
有很多的学者基于睡眠过程中的具有代表性的脑电特征波来进行自动睡眠分阶。大致的过程是通过对样本数据进行不同维度的特征提取,根据提取到的特征进行睡眠阶段分类。AhnafRashik Hassan[50]等人计算了从可调 Q 因子小波变换(TQWT)的子带中提取的频谱特征,该方法是小波变换的扩展。
2.2.1 特征提取相关知识
在预处理步骤之后,对生物信号的进一步分析需要进行单一或者多种特征提取方法。自动睡眠分阶方法的一般步骤是首先进行特征提取,然后选择合适的特征进行学习分类,最后得到最终的分类结果。
(1)频谱特征
频谱特征与所分析的生物信号的频率成分有关,之前就有学者使用各种方法来计算光谱特征。Hassan A R 等人[51]使用了类似的频谱特征,将离散傅里叶变换应用于脑电数据而不是 TQWT。同年,除了上述频谱特征和特征选择之外,作者[52]还从 EEG信号中计算出了统计度量。 Huang C S 等人[53]从两个 EEG 通道信号的功率谱密度(PSD)中提取了特征,这是通过短时傅里叶变化计算得出的。除了脑电图外,Yaghouby F 等人[54]还结合其他生物信号,计算了 7 个功率比和 EMG、EOG 信号的均方根,以实现自动睡眠分阶。
(2)能量和熵特征
能量和熵特征描述了记录信号的功率以及通过各个域观察到的每个信号的变化。首先,在 Orestis Tsinalis 等人的文章[55]中,对脑电信号进行了时频域的分析,使用复杂的 Mortlet 小波对多个频段进行分析。作者利用复杂的 Mortlet 小波对多个频段的脑电信号进行了时频域分析,提取的特征包括每个频段的功率,用滑动窗口计算的功率,各频段功率之间的相关性,以及信号在时域的自相关性。Aboalayon K A I 等人[56]计算了 5 个脑电图子频段(δ,θ,α,β 和 γ)的能量、熵和标准差,以区分清醒和睡眠时段。
................................
第三章 基于迁移学习的自动睡眠分阶方法 .......................... 23
3.1 迁移学习的意义 ................................ 23
3.2 基于迁移学习的自动睡眠分阶方法的具体设计 ............................................ 25
3.3 知识迁移训练 ........................................ 26
第四章 基于融合网络的自动睡眠分阶方法 .................................... 35
4.1 多特征融合网络的意义 ............................................. 35
4.2 融合网络的具体方法设计 ................................. 36
4.3 基于时序特征提取的 Seqsleepnet 网络 ............................... 37
总结和展望 ............................ 49
总结 ................................... 49
展望 ................................ 51
第四章 基于融合网络的自动睡眠分阶方法
4.1 多特征融合网络的意义
在自动睡眠分阶研究中为了更好的对脑电信号进行特征表达,一般采用时域、频域、时频域、振幅、非线性等特征作为睡眠分阶的特征。时域特征可以显示脑电信号随时间的活动性、复杂性和移动性。频域特征描述了睡眠阶段的 5 种特征波(δ:0.5-4Hz,θ:4-8Hz,α:8-12Hz,σ:11-15Hz,β:15-30Hz)的变化趋势。时频特征能够提供目标信号各频段的频率信息,振幅特征描述信号的强度。非线性特征将 EEG 描述为一个非线性的动态系统可以为具体脑电波形状和睡眠的每个阶段补充相应的信息。因此传统的自动睡眠分阶研究可以分为基于单特征的睡眠分阶研究和基于多特征融合的睡眠分阶研究。相对而言,多种特征融合对睡眠阶段脑电特征解读更加充分,能够显著提高睡眠阶段准确率,在机器学习领域也称为集成学习(Ensemble Learning)。
深度学习方法被应用到自动睡眠分阶中,它通过多层线性和非线性处理单元对输入的数据进行表征学习进而完成复杂的识别任务。目前有很多种类的深度网络应用于睡眠分阶:CNNs,DBNs,RNNs。CNN 网络可以表征 EEG 中频域特征,RNN 网络随着序列数据的演进方向进行递归学习,解读 EEG 中时域特征。DBNs 通过无监督的贪婪分层训练对 EEG 进行频率成分分析。不同的网络对于信息的学习有不同的侧重点,有学者将不同网络结构组合应用在睡眠分阶领域,例如 DNN+RNN 和CNN+RNN。
..........................
总结和展望
总结
随着当今智能信息处理技术的快速发展,脑机接口领域的相关研究对人类社会的发展和生活质量的提高发挥了重要的作用。深度学习技术在医疗领域也逐渐成为医生诊断疾病的得力助手,带有自动睡眠分阶技术的智能设备对失眠患者的睡眠质量进行快速的评估,这一技术的发展大大地缩短了睡眠科医生的诊断时间,提高了诊断的准确率。然而对于自动睡眠分阶技术中,如何有效并且相对便捷的采集患者睡眠数据和如何提高自动诊断识别率是该研究领域最重视的问题。本文针对如何在少量数据样本的基础上达到深度学习睡眠脑电信号来提高自动睡眠分阶的准确率这两方面进行了研究,主要的工作有以下几方面:
1、基于迁移学习的自动睡眠分阶技术。传统的深度网络模型能在自然语言处理、文本处理和图像处理领域大获成功的原因是,深度网络要想达到专家级的识别结果是基于海量数据的特征提取来对样本进行分类识别的。然而在脑机接口领域并没有充足的生物信号来进行大基数的学习处理过程,往往一项研究可用的数据只有 10-20 例样本,这样的数据量级别是无法让神经网络发挥出该有的水准。
因此使用迁移学习可以放松对于训练集和测试集的限制,将来源于不同研究、不同信号采集标准、不同脑区电极通道的数据进行数据增益,来解决深度学习中数据匮乏的问题。迁移学习可以要求训练集和测试集来自于不同的样本群体,可以忽略电极通道不匹配的问题,从另一个角度来说增大了数据样本数量,使得网络模型的特征学习能力得到充分的训练。本章使用在 MASS 数据集上训练的公开可获取的预训练模型。使用该预训练模型来初始化 Seqsleepnet 和 Deepsleepnet 网络,并使用 SC 数据集对 网 络 进 行 微 调 。结 合 两 种 网 络 特 征抽 取 层 的 共 通 点 采用 了 四 种 微 调 策 略{finetune_all、finetune_softmax、finetune_softmax_EPB、finetune_softmax_SPB},进行实验验证。最终的结果为使用以上四种微调策略对自动分阶的识别率都有大幅提升。具体来讲对于 Seqsleepnet 网络针对四种微调策略分别提升了:43.41%、40.59%、43.11%、43.04%,同样对于 Deepsleepnet 网络也分别提升了:30.83%、28.61%、28.06%、31.23%。
参考文献(略)
相关文章:
建筑论文怎么写?04-26
工程管理论文:某建设集团公司租赁站物资管理推广思考04-26
工商管理论文:邮储银行宁德分行零售业务转型策略思考04-26
教育硕士毕业论文怎么写及范文案例04-26
基于BP算法的数字字符识别技术的研究04-26
基于TCP的拥塞控制策略研究04-26
教育论文:基于机器学习的流动儿童问题行为的预测探讨04-26
基于数据仓库的超市进销存系统的设计04-26