医学数据科研数据自定义导出
2025/2/14 来源:不详编辑导语:数据统计分析是各行业的常见业务,此时如果能提升数据分析的效率,将可以为业务人员降低操作成本,比如在数据导出时,我们是否能实现自定义导出,快速整理目标字段?本篇文章里,作者结合医疗场景,对数据自定义导出一事做了解读,一起来看一下。
一、背景
医学科研是医学进步的动力。通过科学的方法对医学数据进行整理分析,进而得出医学中的诊疗规律,并应用于相同病症的患者,进而提高患者的治愈率。
患者医院的信息系统中。医院信息系统并未提供医学科研相关的分析工具,所以需要使用专业的分析软件对数据进行统计分析。
首先,通过搜索功能找到符合要求的患者记录。然后,设法将科研相关的字段导出。
如果人工将数据导出,那么操作过程将会变成如下过程:从患者列表逐个进入患者详情,从患者详情中找到目标数据。
如果科研的数据涉及到多种业务,那么在同一条患者记录内部,就需要跨多张表单查找目标数据。并手动复制粘贴到系统外的Excel表格中。
整个数据导出过程中涉及多次打开系统、关闭系统,打开表单、关闭表单,在表单内查找目标字段,耗费了大量的时间成本,还存在数据粘贴在错误位置的可能。
如何能够快速将目标字段整理出来?就是我们今天讨论的主题——数据自定义导出。
二、数据自定义导出
数据自定义导出,指的是从变量池中根据需求选中符合要求的目标变量,以某种格式的文件一次性从系统中全部导出。
例如,系统提供个变量可用于数据导出。在做胃部分切除术相关的研究时,从中选择了30个字段导出为CSV文件。
其中,“个变量”就是“变量池”,指的是系统中允许被导出的所有字段。
“30个字段”就是“目标变量”,指的是本次需要导出的变量。“CSV文件”就是“某种格式的文件”,指的是以数据导出后的使用目的为导向,生成相应格式的文件。“从个变量里根据需求选择了30个变量”,即“自定义”,指的是用户可以根据需要从变量池中选择任何变量,并且变量数量不受限制。首先,将不同业务内、不同表单内的导出频率高的字段组合在一起形成变量池。省去查找目标字段时的,表单切换和表单阅读的时间。
然后,将在数据导出时,对数据格式进行处理,使其满足目标软件的要求,然后将导出后的数据直接导入到目标软件中。缩短了数据格式进一步加工的时间。
通过这两步,大大提高数据导出的效率。
1.变量池
医疗业务复杂,一个人无法处理所有的业务,所以需要将业务拆分成不同的部分,由不同的专业人员负责不同的业务范围,只有这样才能让系统正常运行。
例如,张技师和王技师分别负责实验室检验部分和影像检查部分的业务。如果张技师去负责影像检查部分的业务,由于对影像业务的完全不熟悉,该段时间内的影像检查部分的业务将停滞。与之相关的业务都将收到影响。
医院信息系统中与患者诊疗相关的系统包括门急诊电子病历系统、住院电子病历系统、实验室检验系统、影像学检查系统、手术麻醉系统等系统。
住院电子病历系统中包括住院医生工作站、住院护士工作站、病案管理工作站等,存储了患者的长临医嘱、用药信息、日常病程记录、既往病史、家族史等信息。
不同的模块、不同的表单存放不同的患者信息。查找需要导出的字段时,需要翻阅不同的系统,在系统内部切换不同的表单,在表单中找到需要导出的字段。整个过程耗费大量时间,严重影响字段查找效率。
例如,导出患者胃部分切除术手术及手术前后的相关信息,则需要前往手麻系统、电子病历系统、检查系统、检验系统等。在某个子系统中,仍然需要找到患者,并且进入患者详情找到对应表单内容。整个过程耗费大量时间。
有没有一种可能将可能用于导出的字段放在一起,不需要切换系统、表单逐个查找。
变量池就是将不同业务系统、不同表单中可能会用于导出的字段名称放在一起。
变量池具备字段数量多、字段多值性的特点。
1)字段数量多
字段数量多,指的是可以用于导出的字段数量比较大。
出现这种情况的原因是,不同科室在做数据分析时