登陆注册
19084100000009

第9章 医学信息的管理(5)

3)关联规则

在两个或多个变量之间存在着某种规律性,就称其为关联(association)。关联规则(association rule)是指在同一事件中出现不同项的相关性。关联分析(association analysis)就是用于发现隐藏在大型数据集中的令人感兴趣的联系。所发现的联系可以用关联规则或者频繁项集的形式表示。关联规则挖掘就是从大量的数据中挖掘出描述数据项之间相互联系的有价值的有关知识。

应用关联规则的很常用的一个例子是关于有个购物篮的分析。

(1)用于DNA 序列间相似搜索与比较:在基因分析中一个重要的搜索问题是DNA序列中的相似搜索和比较。对分别来自带病和健康组织的基因序列进行比较以识别两类基因间的差异。通常在带病样本中出现的频度超过健康样本的序列,可认为是致病因素;另一方面,在健康样本中出现频度超出带病样本的序列,则认为是抗疾病因素。

(2)用于识别同时出现的基因序列:目前许多研究关注的是一个基因与另一个基因的比较。大部分疾病不是由单一基因引起的,而是基因组合共同作用的结果。关联分析方法可用于帮助确定在目标样本中同时出现的基因的种类,此类分析将有助于发现基因组和对基因间的交叉和联系的研究。

(3)在患者生理参数分析中的作用:生理参数数据是医学诊断最基本也是最主要的依据。例如上海同济大学附属医院冯波等人用关联分析研究糖尿病患者肌肉组织和脂肪组织含量与骨密度之间的联系,得出高肌肉和高脂肪组织含量可降低患者髋骨骨折危险性的结论。

(4)用于疾病相关因素分析:在病案信息库中存有大量关于患者病情和患者个人的信息,包括年龄,性别,居住地,职业,生活情况等,对数据库中的信息进行关联规则分析可以发现有意义的关系及模式,某种疾病的相关发病危险因素分析可以指导患者如何预防该疾病。

(5)用于疾病预测:确定某些疾病的发展模式,根据患者的病史和以往病例归纳出诊断,规则预测疾病的发展趋势,从而有针对性地预防疾病的发生。

4)OLAP 联机规则

数据仓库中包含了大量的、有价值的历史数据,现代的信息应用需要方便的工具对其中的数据进行分析处理。OLAP(on‐line analytical processing,即联机分析处理)可较好地实现数据汇总/聚集,建立多维度的分析,查询和报表,同时还提供切片、切块、钻取和旋转等数据分析功能,使人们从交互方式中获得信息并为预测业务发展提供辅助。OLAP的功能特征包括快速分析,共享性和多维特性。

OLAP 的基本涵义及特性。

OLAP 访问来自数据源(如数据仓库)经过聚合的多维数据集数据。利用OLAP 技术,分析人员、管理人员或执行人员能够针对同一个主题,从多个角度对数据进行分析,从而快速、交互地得出决策支持的分析结论。OLAP 技术核心是维的概念,因此,OLAP 也被称为多维数据分析。OLAP 技术主要是针对海量数据的查询,通常不对数据做修改。这种数据访问有别于OLTP(online transaction processing,在线事务处理)中对数据进行增删改操作。

“维”是OLAP 的关键技术。“维”通常是指人们观察事物的角度,如时间,地理位置,产品等,多维性是OLAP 的关键属性,OLAP 系统能够提供对数据分析的多维视图和分析。OLAP 能快速响应用户的查询请求,并实现数据的共享。

按照数据的存储结构基本上又分为MOLAP(多维multidimensional OLAP),ROLAP(关系relational OLAP)和HOLAP(混合hybrid OLAP)。

利用OLAP 数据维的概念,不同的用户可以根据需要从不同的角度去分析同样的数据。切片和切块的概念就是其中的一个应用实例。选定多维数据集中的一个二维子集的动作称为切片,选定多维数据集的一个三维子集的动作称为切块。

5)粗糙集理论

粗糙集是波兰理工大学Z.Pawlak 教授提出用来研究不完整数据,不精确知识的表达、学习,归纳等的一套理论。从数学的角度看,粗糙集是研究集合的;从编程的角度看,粗糙集的研究对象是一些特殊的矩阵;从人工智能的角度来看,粗糙集研究的是决策表。

粗糙集是建立在分类机制的基础上,它将分类理解成为在特定空间上的等价关系,而等价关系构成了对该空间的划分。粗糙集理论的主要思想是利用已知的知识库,将不精确或不确定的知识用已知的知识库中的知识来(近似)刻画。有关粗糙集和OLAP 理论及其在数据挖掘中的应用读者可阅读附录的参考文献。

6)传统统计方法

数据挖掘来源于统计分析,而又不同于统计分析。数据挖掘不是为了替代传统的统计分析技术,相反,数据挖掘是统计分析方法的扩展和延伸。大多数的统计分析技术都基于完善的数学理论和高超的技巧,其预测的准确程度还是令人满意的,但对于使用者的知识要求比较高。而随着计算机能力的不断发展,数据挖掘可以利用相对简单和固定程序完成同样的功能。新的计算算法的产生如神经网络、决策树使人们不需了解到其内部复杂的原理也可以通过这些方法获得良好的分析和预测效果。

由于数据挖掘和统计分析根深蒂固的联系,通常的数据挖掘工具都能够通过可选件或自身提供统计分析功能。这些功能对于数据挖掘的前期数据探索和数据挖掘之后对数据进行总结和分析都是十分必要的。统计分析所提供的诸如方差分析、假设检验、相关性分析、线性预测、时间序列分析等功能都有助于数据挖掘前期对数据进行探索,发现数据挖掘的题目,找出数据挖掘的目标,确定数据挖掘所需涉及的变量,对数据源进行抽样等等。所有这些前期工作对数据挖掘的效果产生重大影响。而数据挖掘的结果也需要统计分析的描述功能(最大值、最小值、平均值、方差、四分位、个数、概率分配)进行具体描述,使数据挖掘的结果能够被用户了解。因此,统计分析和数据挖掘是相辅相成的过程,两者的合理配合是数据挖掘成功的重要条件。

事实上,传统的统计方法也是一个非常主要的数据挖掘方法。诸如方差分析、假设检验、相关性分析、线性预测、时间序列分析等方法依然在医学数据挖掘中发挥着重要的作用。本节仅以时间序列数据挖掘为例加以说明。

随着信息技术的飞速发展,数据库应用的规模、范围和深度不断扩大,计算机系统中存储的带有时间序列性质的信息越来越多,例如医院信息系统中积累了多年的门诊人次、住院人次、药品消耗量等与时间序列有关的资料。在时间序列问题中,对序列的分析通常是以时间为轴进行分析的。具体又可以分为以下4种方法:①时间序列数据挖掘;②时间序列的趋势分析;③时间序列的相似性搜索;④时间序列模式和周期模式挖掘。

时间序列预测模型已在医学中广泛应用。比如季节性时间序列医院月门诊量的预测研究可以准确地把握今后一段时间门诊、急诊动向。因此国内在该领域的研究比较活跃,提出了若干预测算法。

(1)举例说明你所理解的信息概念。举例说明信息的特征。说明信息和数据的关系。

(2)就你所知道的实例说明医学信息所涵盖的范围。

(3)举例说明你所理解的医学信息管理的内容和功能。

(4)当你第一次听到“数据挖掘”的说法时,你是怎么猜想它的实际含义的?通过本章学习,你对于“数据挖掘”又有了怎样的新的理解?

(冯正永)

同类推荐
  • 中学理科课程资源-点击材料化学

    中学理科课程资源-点击材料化学

    追溯数理化的演变历程,对话最新颖权威的方法,探索最成功的课程教学,感受最前沿的科技动态,理科教育的全程解码,数理化的直面写真。
  • 教师必备的十大职业能力

    教师必备的十大职业能力

    关注教师专业发展,提升教师职业能力。本书从教学组织、掌握教材、驾驭课堂、语言表达、组织开展活动课、实际操作、教育科研、心理疏导、生活指导和社会交往等十个方面对教师必备的职业能力进行了生动而详细的分析与阐述,并提出了一系列具体可行的操作方法,融理论性、实践……
  • 青少年如何高效率读书

    青少年如何高效率读书

    本书就适合于青少年的读书方法、读书技巧问题,做了完整的论述与详尽的阐释。内容切合实际,简明实用,对青少年增强学习效果,巩固所学知识,成就未来人生都大有益处。
  • 太阳味道

    太阳味道

    《太阳味道》是作家平萍个人精心打造自选的一本极品小小说作品集。《太阳味道》一方面热情讴歌了当代人民警察的无私奉献精神,真实再现了其苦难的生存状态,用悬疑推理手法对犯罪嫌疑人心理弗洛伊德似地进行了描述和剖析,也对公安战线上警花进行了深刻的人性写意;另一方面也将作家本人超凡想象力与历史与现实与当下各色人生进行了深入细腻的文学融合,是对万物生长灵性的艺术写照,充溢着昂扬向上的青春、励志与正义气息。
  • 课外名篇

    课外名篇

    读名著,更要读名篇,精彩纷呈的名家名篇独到精辟的名师导读实战备考的经典素材。精彩纷呈的名家名篇,独到精辟的名师导读,实战备考的经典素材,真材实料打通语文读写。
热门推荐
  • 我在异界当皇帝

    我在异界当皇帝

    我本是大天朝的一个普普通通的上班族,因为一次不幸,我重生到了一个叫做疾风大陆的异世界,并且成为这个大陆上最强大的王朝疾风帝国的唯一皇子,而且最幸运的是,我刚来到这里,老皇帝没了,我即位了!从此,我踏上了一条帝王之路,以前在地球上无法完成的许多梦想,我觉得吧,我应该在这里实现……于是,我开始不停的娶媳妇玩……于是,我开始不停的周游天下……于是,我开始不停的说一不二……这世界,我是老大我说了算!
  • 等我们再相遇的时候

    等我们再相遇的时候

    喂,我们还能见面吗?那个,你叫什么名字?
  • 军少:男神太难当

    军少:男神太难当

    当高智商的她女扮男装进军娱乐圈,一张盛世美颜吸粉无数。注册了个公司却当起了甩手BOSS!接了一部戏后却没见了人影,粉丝们表示,有这样的偶像他们心好累。什么?偶像当了CV?那必须去捧场啊!只是……偶像你怎么在不知不觉中做了这么多事啊?
  • shi年

    shi年

    人生若只如初见,就不会有相濡以沫不如相忘于江湖的叹息,牵着你的手,我想知道两个人究竟可以走多远,十年?十年的时间可以有多远?当泪水滑落眼眶还没有降落至接近两公尺高度的地面,我的思绪却已将十年的遥远走完。十年改变了你的容颜,十年错过的你的微笑,十年欠了多少次的拥抱,十年……属于我们的十年只有一个,我要用怎样的速度生活,才能与你再次相见……纪念曾经的你,爱——我不想说再见...
  • 1分钟读懂顾客心理

    1分钟读懂顾客心理

    顾客的心理有多种,其中包括“求实惠”和“求便宜”的心理,对抱有这种心理的顾客,一般可以用价格和产品的质量来说服,重点指出自己产品的“物美价廉”,那么他们就很容易被打动。抓住顾客的“面子”心理,给顾客“面子”不要吝惜你的赞美之词,这点对任何顾客都适用。另外顾客的求“效率”心理,求“舒适”心理,求“安全”心理,求“方便”心理等,在读懂消费者心理的旅途中,本书将为您一一展现!让您1分钟之内读懂顾客心理,打开顾客的钱袋!
  • 废材鬼逆袭记

    废材鬼逆袭记

    一只什么多不会的鬼逆袭记…我要走向人生顶峰,孩子你洗洗睡吧!
  • 俞敏洪内部讲话

    俞敏洪内部讲话

    本书深刻剖析了新东方发展过程中关键性的时间点,以及其精神领袖俞敏洪所扮演的角色,他如何创业,指引企业的成长,如何以一人引领创业团队,因理想而实用,战胜种种困难,成功应对企业所面临的一次次危机。在创业过程中难免会遇到种种困难,如资金不足,人才亟缺,没有市场等,纵观商海风云,每个成功的企业都有自己的核心价值理念。只有具备社会责任感的企业才会在市场激烈的竞争中愈挫愈勇,只有秉承“永不言败,不畏艰难”精神的企业才能走得更远、更长久。俞敏洪的创业经历告诉我们,只要拥有坚强的意志和不怕吃苦的精神,同样可以创出一番伟大的事业。创业不仅需要一颗有远见的头脑来规划蓝图,更需要秉持一颗激情的心将梦想落实于行动。
  • 虚空进化

    虚空进化

    操纵虚空之力,锤炼意识的力量,脱离种族漫长的进化过程,于虚空之中,完成神圣的进化!林逸,也许是拥有过人的天资,在茫茫宇宙中经历了战争的洗礼,穿过了无数虫洞背后的神秘空间,了解了存在于上古的神话,一步步按照自己的理想与命运的指引而走向了进化的终点。奇异的种族,诡异的神话遗迹,变幻莫测的虫洞世界。所构成的,只是一条通向终点的坎坷路。
  • 博弈

    博弈

    博弈是一种理论,历史上人类社会发展和演变的一个过程,博弈是人类社会的生活中提炼出来的,也是从历史的演变过程中抽象出来的,这就是历史和博弈的关系。博弈讲究的是一种策略,策略决定输赢。在人生、事业不顺的时候,如何能够快速突破困境呢?找到合理的策略是解决这种问题的关键。这个策略必须要建立在一个坚实的基点上,而这个基点又必须是建立在对前途及周围所处环境等多方考虎基础上的,只有这样,你才能够在人生的道路上顺利前行。人要生存,必须要同周围的人交际。在与人交际的过程中,难免会有一些磕磕碰碰的事情发生。要想让自己不受损失,就需要充分运用博弈论,对事情进行周详考虑,作出恰当的选择。
  • 将夜之白

    将夜之白

    (看过好多著名网文大神的同人小说,却发现从来没有猫大的小说同人的,这真是一件令人哀伤的事实啊……既然如此,我就来一发吧。)普通简介:一个来自异世的灵魂,恰好重生到那人最落魄的时刻。没有宁缺的小侍女,没有叶红鱼的剽悍兄长,没有大师兄的天赋,没有二师兄的骄傲,没有观主的逆天,没有夫子的无敌。他所有的,只是那个原来名为隆庆的青年看似辉煌却一文不值的前半生。那么那个男人该如何做,才能在自己注定沦亡的命运长河中奋起,持剑朝天?