用 python 进行可靠性分析 python 可以进行可靠性和有效性数据分析
前言
NeuroKit2是一个开源的、社区驱动的、以用户为中心的Python库,可用于多种生理信号的分析处理(例如ECG、PPG、EDA、EMG、RSP),还包括用于特定处理步骤(如频率)的工具提取和过滤方法,并在易用性和参数微调之间进行权衡。其目标是提高神经生理学研究的透明度和再现性,并促进探索和创新,它的设计理念以用户体验和对新手和高级用户的可用性为中心。
1 安装
从PyPI安装NeuroKit2代码如下:
pip install neurokit2
或conda-forge
conda install -c conda-forge neurokit2
2 读入数据
import neurokit2 as nk
# 下载样例
data = nk.data("bio_eventrelated_100hz")
# 数据预处理 (滤波, 查找峰值,等.)
processed_data, info = nk.bio_process(ecg=data["ECG"], rsp=data["RSP"], eda=data["EDA"],sampling_rate=100)
# 计算相关特征
results = nk.bio_analyze(processed_data, sampling_rate=100)
3 设计原理
NeuroKit2的目标是让初学者能够快速访问的同时,也为有经验的用户提供最大水平的自主设计控制。这是通过允许初始用户使用一些函数实现复杂的处理管道来实现的,同时仍然为有经验的用户提供对参数的微调控制。具体来说,这种权衡是由一个由三层组织的API结构来实现的。
3.1 基础层:基础信号预处理的函数
基础信号处理的函数包括滤波、重采样、插值、峰值检测等。这些函数是与具体的生理信号数据类型无关,并且包括可调参数(例如,可以通过设置参数来改变滤波方法)。这些函数大多是基于scipy实现的算法(Virtanen等人,2020),包括signal_filter(), signal_interpolate(), signal_resample(), signal_detrend()和 signal_findpeaks().
3.2 中间层:生理信号的预处理
中间层的函数基于基础信号处理函数对不同生理模态的生理信号进行分析(如ECG、RSP、EDA、EMG、PPG)。这些函数执行特定模态的生理信号的处理步骤,如清洗、峰值检测、分类或频率计算。重要的是,对于每种类型的信号,同一处理目的都使用统一的函数名(以生理信号类型_函数名()的形式),使不同模态生理信号处理分析的实现更加直观和一致。例如, * clean(), * findpeaks(), process(), * plot()。
例如,rsp_clean()函数使用signal_filter()和signal_detrend(),它们具有不同的默认参数,可以通过一个“method”参数进行切换。例如,设置method=“khodadad2018”将使用khododadad等人(2018)中使用的数据清理流程。但是,如果用户想要构建自己的自定义清理管道,他们可以使用清理函数作为模板,并在基础信号处理操作中根据自己的需求调整参数。
3.3 高级层:用于处理和分析的顶层函数
中间层的函数被组装在顶层的函数中,这是为新手用户提供快速使用的函数。例如,ecg process()函数内部组装了中层函数,Ecg_clean(), ecg_peaks(), ecg_quality(), ecg_delineate(),和ecg_phase(),如图1所示。可以使用method参数选择不同的处理管道/方法。在处理管道之间的轻松切换允许对不同方法进行比较,并简化了可重复研究中的一些关键步骤,如数据准备和质量控制的验证(Quintanaetal.,2016)。最后,该包提供一个简便的函数(例如bio_process),能够同时组合处理多种类型的信号(例如bio_process(ecg=心电数据,eda=皮电数据))。
NeuroKit2软件包架构的说明(以心电信号处理为例)
4 数据分析
在本节中,我们将展示两类范式的数据分析示例来说明最常见的用例。第一个例子是一个与时间间隔相关的范式,其中在一定时间间隔内的生理活动特征(不一定与一个特定的和突发的事件有关)被提取出来。第二个例子展示了一个与事件相关的范式,其中人们的兴趣在于与特定事件相关的短期生理变化。
4.1 时间间隔相关的范式(Interval-related paradigm)
使用的数据集是参与者在休息(闭着眼睛坐着)5分钟的生理活动,三个通道(ECG、PPG和RSP)的采样频率为100Hz。
import neurokit2 as nk
# 数据加载
data = nk.data("bio_resting_5min_100hz")
# 数据处理
df,info = nk.bio_process(ecg=data["ECG"],rsp=data["RSP"], sampling_rate=100)
# 特征提取
results = nk.bio_analyze(df,sampling_rate=100)
# 结果显示
results[["ECG_Rate_Mean","HRV_RMSSD","RSP_Rate_Mean","RSA_P2T_Mean"]]
分析结果:
4.2 事件相关的范式(Event-related Paradigm)
这个示例数据集包含了一个参与者的ECG、RSP和EDA信号,他得到了四种情绪图像(来自NAPS数据库;Marchewka等人,2014),这些信号时长为2.5分钟(150秒),记录的频率为100Hz,有4个通道,包括3个生理信号信号和1个对应于标记事件(photosensor)通道(当刺激出现在屏幕上时,信号强度下降)。
import neurokit2 as nk
# 数据加载
data = nk.data("bio_eventrelated_100hz")
# 数据预处理
df,info= nk.bio_process(ecg=data["ECG"],rsp=data["RSP"], eda=data["EDA"], sampling_rate=100)
# 查找事件
conditions =["Negative","Neutral","Neutral","Negative"]
events = nk.events_find(event_channel=data["Photosensor"],threshold_keep='below',event_conditions=conditions)
# 数据分段
epochs = nk.epochs_create(data=df,events=events,sampling_rate=100, epochs_start=-0.1, epochs_end=4)
# 抽取事件相关的特征
results = nk.bio_analyze(epochs,sampling_rate=100)
# 结果显示
results[["Condition","ECG_Rate_Mean","RSP_Rate_Mean","EDA_Peak_Amplitude"]]
分析结果:
5 总结
NeuroKit2为神经生理数据处理提供免费的、以用户为中心的、全面的解决方案,主要关注的生理信号包括ECG(测量心脏活动)、PPG(血流的光学测量)、RSP(呼吸)、EDA(皮肤电活动测量)、EMG(测量肌肉活动)和EOG(测量眼球运动)。
下一篇: 桥接设计模式
推荐阅读
-
【视频】Python用LSTM长短期记忆神经网络对不稳定降雨量时间序列进行预测分析|数据分享|附代码数据
-
实战教程:用Python从雅虎财经获取数据并进行分析与可视化
-
行动中的数据分析--用 Python 对博客评论数据进行情感分析
-
使用Python进行数据分析和自动化
-
使用 Python (9)进行数据分析--重采样和频率转换
-
使用 python 和 Selenium 进行数据分析:北京二手房价格
-
用 Python 进行词云可视化,带您分析《海贼王》、《火影忍者》和《死神》这三部经典动漫
-
使用 python 和 Selenium 进行数据分析:北京二手房价格
-
包婷婷 (201550484)作业一 统计软件简介与数据操作-SPSS(Statistical Product and Service Solutions),"统计产品与服务解决方案"软件。最初软件全称为"(SolutionsStatistical Package for the Social Sciences),但是随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司已于2000年正式将英文全称更改为"统计产品与服务解决方案",标志着SPSS的战略方向正在做出重大调整。为IBM公司推出的一系列用于统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品及相关服务的总称SPSS,有Windows和Mac OS X等版本。 1984年SPSS总部首先推出了世界上第一个统计分析软件微机版本SPSS/PC+,开创了SPSS微机系列产品的开发方向,极大地扩充了它的应用范围,并使其能很快地应用于自然科学、技术科学、社会科学的各个领域。世界上许多有影响的报刊杂志纷纷就SPSS的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予了高度的评价。 R统计软件介绍 R是一套完整的数据处理、计算和制图软件系统。其功能包括:数据存储和处理系统;数组运算工具(其向量、矩阵运算方面功能尤其强大);完整连贯的统计分析工具;优秀的统计制图功能;简便而强大的编程语言:可操纵数据的输入和输出,可实现分支、循环,用户可自定义功能。 与其说R是一种统计软件,还不如说R是一种数学计算的环境,因为R并不是仅仅提供若干统计程序、使用者只需指定数据库和若干参数便可进行一个统计分析。R的思想是:它可以提供一些集成的统计工具,但更大量的是它提供各种数学计算、统计计算的函数,从而使使用者能灵活机动的进行数据分析,甚至创造出符合需要的新的统计计算方法。 该语言的语法表面上类似 C,但在语义上是函数设计语言(functional programming language)的变种并且和Lisp 以及 APL有很强的兼容性。特别的是,它允许在"语言上计算"(computing on the language)。这使得它可以把表达式作为函数的输入参数,而这种做法对统计模拟和绘图非常有用。 R是一个免费的*软件,它有UNIX、LINUX、MacOS和WINDOWS版本,都是可以免费下载和使用的。在R主页那儿可以下载到R的安装程序、各种外挂程序和文档。在R的安装程序中只包含了8个基础模块,其他外在模块可以通过CRAN获得。 二、R语言 R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个*、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。 R作为一种统计分析软件,是集统计分析与图形显示于一体的。它可以运行于UNIX,Windows和Macintosh的操作系统上,而且嵌入了一个非常方便实用的帮助系统,相比于其他统计分析软件,R还有以下特点: 1.R是*软件。这意味着它是完全免费,开放源代码的。可以在它的网站及其镜像中下载任何有关的安装程序、源代码、程序包及其源代码、文档资料。标准的安装文件身自身就带有许多模块和内嵌统计函数,安装好后可以直接实现许多常用的统计功能。[2] 2.R是一种可编程的语言。作为一个开放的统计编程环境,语法通俗易懂,很容易学会和掌握语言的语法。而且学会之后,我们可以编制自己的函数来扩展现有的语言。这也就是为什么它的更新速度比一般统计软件,如,SPSS,SAS等快得多。大多数最新的统计方法和技术都可以在R中直接得到。[2] 3. 所有R的函数和数据集是保存在程序包里面的。只有当一个包被载入时,它的内容才可以被访问。一些常用、基本的程序包已经被收入了标准安装文件中,随着新的统计分析方法的出现,标准安装文件中所包含的程序包也随着版本的更新而不断变化。在另外版安装文件中,已经包含的程序包有:base一R的基础模块、mle一极大似然估计模块、ts一时间序列分析模块、mva一多元统计分析模块、survival一生存分析模块等等.[2] 4.R具有很强的互动性。除了图形输出是在另外的窗口处,它的输入输出窗口都是在同一个窗口进行的,输入语法中如果出现错误会马上在窗口口中得到提示,对以前输入过的命令有记忆功能,可以随时再现、编辑修改以满足用户的需要。输出的图形可以直接保存为JPG,BMP,PNG等图片格式,还可以直接保存为PDF文件。另外,和其他编程语言和数据库之间有很好的接口。[2] 5.如果加入R的帮助邮件列表一,每天都可能会收到几十份关于R的邮件资讯。可以和全球一流的统计计算方面的专家讨论各种问题,可以说是全世界最大、最前沿的统计学家思维的聚集地.[2] R是基于S语言的一个GNU项目,所以也可以当作S语言的一种实现,通常用S语言编写的代码都可以不作修改的在R环境下运行。 R的语法是来自Scheme。R的使用与S-PLUS有很多类似之处,这两种语言有一定的兼容性。S-PLUS的使用手册,只要稍加修改就可作为R的使用手册。所以有人说:R,是S-PLUS的一个“克隆”。 但是请不要忘了:R是免费的(R is free)。R语言源代码托管在github,具体地址可以看参考资料。[3] 。 R语言的下载可以通过CRAN的镜像来查找。 R语言有域名为.cn的下载地址,有六个,其中两个由Datagurn,由 中国科学技术大学提供的。R语言Windows版,其中由两个下载地点是Datagurn和 USTC提供的。 三、stata Stata 是一套提供其使用者数据分析、数据管理以及绘制专业图表的完整及整合性统计软件。它提供许许多多功能,包含线性混合模型、均衡重复反复及多项式普罗比模式。用Stata绘制的统计图形相当精美。 新版本的STATA采用最具亲和力的窗口接口,使用者自行建立程序时,软件能提供具有直接命令式的语法。Stata提供完整的使用手册,包含统计样本建立、解释、模型与语法、文献等超过一万余页的出版品。 除此之外,Stata软件可以透过网络实时更新每天的最新功能,更可以得知世界各地的使用者对于STATA公司提出的问题与解决之道。使用者也可以透过Stata. Journal获得许许多多的相关讯息以及书籍介绍等。另外一个获取庞大资源的管道就是Statalist,它是一个独立的listserver,每月交替提供使用者超过1000个讯息以及50个程序。 四、PYTHON
-
用 python 进行可靠性分析 python 可以进行可靠性和有效性数据分析