医疗大数据的分析和挖掘机前景发展现状如何?未来会有什么样的应用前景

中国式大数据与分析的现状和未来趋势
发表于 17:32|
来源企业网|
摘要:大数据分析需要通过数据分析来发现现状,并且通过模型与预测分析技术来对改善进行预测与优化,国内,不论是国企还是民企,真正在业务决策中以数据分析结果为依据的,主要集中在银行、保险、电信和电商等几个行业。
【编者按】数据分析能力的高低,决定了价值发现过程的好坏与成败。可以说,没有数据分析,“大数据”只是一堆IT库存,成本高而收益为零。但是国内热潮的“大数据”概念,目前仍然停留在数据收集、整理、存储和简单报表等几个初级阶段。能够对大数据进行基本分析和运用的,只有少数几个行业的少数企业。本文来自企业网。
免费订阅“CSDN云计算”微信公众号,实时掌握第一手云中消息!
CSDN作为国内最专业的云计算服务平台,提供云计算、大数据、虚拟化、数据中心、OpenStack、CloudStack、Hadoop、Spark、机器学习、智能算法等相关云计算观点,云计算技术,云计算平台,云计算实践,云计算产业资讯等服务。
以下为原文:
“大数据”时代到来了吗?
潮流是一股可笑又可敬的力量:今天,如果打开任何媒体,要是不提“大数据”,恐怕都不好意思出版。这股潮流,铺天盖地,连国家领导人都不例外。问题在于:为什么人人言必称大数据?
数据的价值,随着数据量的几何级数增长,已经不再能够通过传统的图表得以显现,这正是为什么商业智能还没来得及流行,便已被“数据分析”挤下舞台。因为,价值隐藏在数据中,需要数据分析方可释放这些价值。
数据分析能力的高低,决定了价值发现过程的好坏与成败。可以说,没有数据分析,“大数据”只是一堆IT库存,成本高而收益为零。但是国内热潮的“大数据”概念,目前仍然停留在数据收集、整理、存储和简单报表等几个初级阶段。能够对大数据进行基本分析和运用的,只有少数几个行业的少数企业。关于这一点,我们可以通过谷歌搜索结果来简单揭示这一现状的:
挑选四个关键词,并且分别搜索,并且对搜索结果计数用JMP数据分析软件进行制图:
很明显,英文世界里,“big data”的搜索结果计数比中文世界里的“大数据”搜索结果计数要多了不少; 而“analytics”(分析)的搜索量不仅仅高于“big
data”,更是远远高于“分析”在中文世界里的搜索结果,大概是169倍!
这个结果,尽管不能100%还原中国业界对“大数据“和”分析“的重视程度,但仍然可以揭示一个起码的事实:作为大数据概念源头的西方国家尤其是美国业界对于”分析”的重视,远甚于中国业界对分析的关注。
这个来自谷歌搜索的简单分析结果,和我们对于中国企业大数据实施现状的理解不谋而合。
中国式大数据与分析的现状
所谓”大数据分析“,其和”小数据分析“的唯一差别在于数据量以及数据量带来的对于数据存储、查询及分析吞吐量的要求。本质上,”大数据分析“仍然需要通过数据分析来发现现状,找到导致现状的根源要素,并且通过模型与预测分析技术来对改善进行预测与优化,并且实现企业运营各个领域的持续改善与创新。要谈”大数据分析”的中国现状,首先必须深入了解”数据分析“在国内的应用情况。
国内企业,不论是国企还是民企,真正在业务决策中以数据分析结果为依据的,主要集中在银行,保险,电信和电商等几个行业。以IT预算最充沛,人员能力最强的银行为例,目前主要是大型银行在导入数据分析。中小银行尚在观望与学习阶段,人员与能力建设正在起步阶段。数据分析的应用范围主要集中在信用风险、流程优化、市场营销、成本与预算等几个方面,深度尚可,但广度一般,尚未扩充到运营管理的所有领域。
而谈到“大数据”或者数据仓库,上述行业中的绝大多数企业早已实施了各种数据仓库,以管理数据。这种买药再看病的模式,完全本末倒置。数据仓库与数据库不一样,其使命就是为了分析而存在的。没有分析,仓库何用之有?
四大行之一的某大型国有银行,90年代末期就开始花费好几亿元IT预算,建设“数据大集中”项目,受该行影响,其他国内银行掀起了一股数据集中的热潮。而当时连商业智能还是个尚未传入中国IT概念,更遑论数据分析了。15年过去了,这些被集中的数据,还在么?
至于支撑起我国庞大GDP的制造业、建筑业和贸易业,在运用数据分析进行业务决策方面,则尚未见规模。其IT开支仍然主要集中在基础架构与流程化的软件套件领域(如ERP,CRM,HRM,
SCM等),部分企业开始导入商业智能(报表、制图、管理驾驶舱),而数据分析应用远远没有进入规模发展阶段。以我国制造业企业为例,从五、六年前开始热炒“六西格玛”、”全面质量管理“,”精益生产“,尽管这些举措对中国制造、中国创造等带来本质变化尚需时日,但是就提升企业决策能力和管理水平而言,这些举措的的确起到了一定的作用,对于中国企业从拍脑袋到用数据决策这一本质转变打下了一个基础。
这一现状的原因,我们认为主要体现在如下几个方面:
1.企业的权力来源
数据分析才是真正的一把手工程。分析的使命,在于改善决策。决策的第一责任人,也就是企业最高层管理人员。国企,尤其是大型央企,职业经理人体系并不完善,董事长、总经理级别的任命是由组织部门而不是经济部门来决定的。“讲政治”的人事任命体系决定了企业决策的复杂性和特殊性,科学管理方法和决策手段的推广,完全取决于企业最高领导人本身对于这些手段的认可程度。
另外,数据分析带来的不仅仅是分析软件和分析方法论,更需要决策、运营进行相应的改善与调整,我们通常称之为“变革”。 任何变革都会带来相匹配的风险与收益。国企的权力架构和民企、外企非常不同,哪怕总经理决定了要变革,还得征求企业内部各路权力部门的认可与接受,变革的难度导致了我们通常看到和听到的“转型极其艰难”,“身为大家长要对几十万张嘴负责”等煽情苦情的自我表白。不要说数据分析,就连开除几个绩差员工,一不小心就要得罪人,严重了还要危及乌纱帽,改革谈何容易。
相比之下民企和外企在这方面的转变要敏捷、迅速很多。比如苹果,很多年前就开始全球范围导入JMP数据分析平台,在我们的跨国团队的帮助下从搭建数据分析能力、规范数据分析流程、导入高级数据分析方法、直到生产与研发环节的数据分析全球标准化等工作。整个过程长达数年,涉及到庞大的机构、人员、方法、流程的转变,却平稳有序。其间还发生了Steve
Jobs辞世,新任CEO上台等足以中断一切的重大企业事件,但导入数据分析能力这一过程丝毫没有受到任何影响。
2.企业的运营能力储备
能力储备也是个关键要素。哪怕管理层决心一致,雄心壮志,重大变革能否落地,还得取决于团队能否升级与被变化。意志力尽管重要,体能却是个关键。数据分析对于参与者的统计、概率、数学、计算机、业务理解等几个方面的能力要求甚高。尽管“能力是可以培养的”,但是我们在国内这么多年的众多数据分析导入项目中,面临最多的挑战就是人员培训和流程变革。
以电信运营业为例,BOSS系统,各种业务系统和数据仓库搭建了许多年,数据分析对于客户行为的理解与促销产品的层出不穷也使得这个行业的数据分析应用远远超过绝大多数其他行业。但电信业在大规模导入数据分析方面面临的首要问题,仍然是专业人才储备以及与数据分析有关的规章制度、决策流程与文化体系的建立。
我们在市场上看到更多的,是IT部门主导的数据分析项目。项目名称是数据分析,而内容仔细一了解,往往都是数据仓库+企业报表。不是传统财务三表,而是用于展现核心KPI的图表。对“数据分析”不了解,把报表和制图当成“分析”,是这一现状的根源。
3.市场环节与竞争压力
不同企业对市场竞争的变化是非常不同而有趣的。比如三桶油,建立竞争力的方法,在于找油田、收购加油站,利用垄断性政策优势抬高行业准入门槛。三大电信运营商,若干年前曾经有子公司互相攻击,甚至发展到人员斗殴,割断对方光线网络的事件。而华为与中兴的竞争,若干年前除了口水仗,还有互相挖对方技术团队。
政策性垄断行业,尽管有压力,但是在提升生产力和生产效率的手段方面,改变缓慢而低效。 高度市场化领域,比如家电,汽车,消费电子,华工、医药等领域,对以数据分析为代表的“高级能力”的接受程度则高了不少。
综上所述,我国企业界对于数据分析的应用仍然停留在个别行业与个别应用的阶段。不过,尽管导入数据分析的过程是如此艰难而挫折,我仍然认为,随着我国各行业市场化进程的推动,随着互联网、数据分析技术不断对传统产业的颠覆过程,“数据分析”或者“大数据分析”迟早会成为中国企业界突破藩篱的关键手段。
数据大不大其实一点也不重要
只要是数据,里面必然有故事。与其在能力毫不匹配的情况下片面追求大数据,还不如立即行动起来,从手头、身边保有的小数据当中提取价值,进而为真正的大数据时代的数字化决策打下基础。
从微观角度来看,我们以中国零售及消费品行业为例,看看数据分析在这一领域的应用现状:
1.企业内部采用的分析手段是非标准化的,零散的—--例如把图表当分析;
2.更多地关注数据获取和管理,而不是开展面向客户的预测性建模与数据挖掘。前者是IT工作,后者才是从数据里获取价值的过程。
3.尚未在公司真正地运行或者构建持续的分析能力、分析流程和与数据分析有关的业务与管理决策机制。
而根据我们为中国企业提供JMP数据分析战略拓展与项目支持的多年经验,我们的建议是:
1.从项目级别的数据分析应用开始,逐渐现成项目组级别的标准化分析流程与业务决策制度。借助项目拓展出有基本分析与应用能力的团队;
2.将项目分析经验扩展到部门级别,拓展 数据分析—价值获取—业务决策 这一价值链。 根据部门级数据分析应用的需要来开展数据获取和管理。借助部门级引用导入拓展出数据分析与业务决策的流程,以及统一、先进的数据分析平台与业务实践库。
3.从部门级到企业级应用,纵横两个维度都在拓展,需要企业管理层的高度参与与制度支持,推广基于数据分析为核心的文化与模式转变,建立支撑这些变化的长远的数据分析战略
4.至于数据是不是够大,是不是需要“云计算“,全看业务需要而定!
原文链接:&(责编/魏伟)
推荐阅读相关主题:
CSDN官方微信
扫描二维码,向CSDN吐槽
微信号:CSDNnews
相关热门文章医疗大数据的分析和挖掘发展现状如何?未来会有什么样的应用前景_百度知道大数据时代医学生物信息的挖掘和利用_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
大数据时代医学生物信息的挖掘和利用
上传于||暂无简介
阅读已结束,如果下载本文需要使用1下载券
想免费下载本文?
定制HR最喜欢的简历
下载文档到电脑,查找使用更方便
还剩4页未读,继续阅读
定制HR最喜欢的简历
你可能喜欢24小时更新医疗健康领域的要闻,打造最及时、最鲜活的资讯平台。
基于电子病历的医疗大数据现状与未来
来源:中国数字医学
医学信息学研究人员通过对海量医疗数据的分析可以发现与医疗质量,医疗安全以及药物效果相关的重要证据。
随着电子病历系统在医疗机构的迅速普及,大量医疗相关的重要信息以电子形式存储于医疗信息系统中。经过不断积累,各种形式的电子化医疗系统产生了体量庞大的医疗大数据。这些数据记录了临床医疗中的重要信息,例如,病人的主诉,检测结果,诊断信息,服用药物,以及不良反应等。医学信息学研究人员通过对海量医疗数据的分析可以与医疗质量,医疗安全以及药物效果相关的重要证据,从而提高公共医疗的质量和效率,加强医疗安全,并促进新治疗方法和药物的研发。根据麦肯锡发布的全球医疗机构分析报告,到2020年,医疗大数据分析市场将为全球节约1900亿美元。但是,使用临床数据进行科学研究需要解决一系列有关医疗信息采集,信息安全,数据整合以及分析方法等重要问题。本文从介绍美国医疗数据分析现状出发,对医疗大数据分析相关的关键技术和重要应用进行深入探讨。文章最后对医疗大数据分析的发展进行了总结和展望。美国电子病历数据分析现状临床电子病历数据(泛指医院所有医疗信息系统的总集,包括HIS, 医生报告, 医嘱,化验等系统)是医疗大数据的最重要的组成部分。 电子病历系统在美国普及较早,很多大型医疗机构积累了长达10年以上的电子病历信息。除了医院积累的电子病历信息,美国的医疗大数据还包括保险公司索赔记录,药房记录,政府医疗救助等多种来源的医疗信息。医院,保险公司,政府医疗救助部门以及大学的科研机构等,都有科研人员和团队进行医疗大数据分析。另外,各大制药厂也通过医疗大数据进行药物效果分析和药物重定向研究。2011年,为了推动使用医疗信息技术来提高医疗质量和减少医疗成本,美国医疗保障和医疗救助中心(Centers for Medicare & Medicaid Services,CMS) 起草并实施了“电子病历应用激励计划”。CMS通过制定电子病历系统的功能规范,评估医疗机构是否达到有效使用的标准。达标的医疗机构可以从CMS获得电子病历应用专项推动资金。CMS寄希望于这项激励计划推动“有效使用 (meaningful use)”电子病历数据来提高医疗水平的效果。所谓“有效使用”是指通过使用电子病历数据来:1)提高医疗的质量,安全性和效率;2)使病人和病人家庭充分参与到医疗中;3)提高医疗机构的协作能力;4)提高公共医疗水平;5)维护病人医疗信息的隐私和安全。该计划通分三个阶段进行。第一个阶段()旨在“加强数据采集和共享”,第二阶段()目标是“优化临床服务流程”,第三阶段()的最终目标是“提高医疗服务质量”。美国国家卫生研究院(National Institute of Health)和其他政府机构也同时资助了一系列研究项目来推动使用电子病历进行临床医学的研究。例如,临床和转化医学项目(CTSA by NIH),电子病历基因组计划(eMERGE by NIH),战略性先进医疗信息研究计划(SHARP by ONC),以及临床医学数据研究网络(CDRN by PCORI)等。以此为契机,生物医学信息学在美国得到了快速发展. 生物医学信息学是一门以提高人类健康为目的的新兴交叉学科,它学习和追求对生物医学数据,信息,和知识的有效使用来解决科学问题和提供决策支持,是医疗数据分析的原动力。 目前,提供医学信息学学位的学校和研究机构在全美迅速普及。在美国医学信息协会的主导下,生物医学信息学的研究逐渐成为当前的医学和计算机科学的研究热点。医疗大数据分析技术对采集到的海量医疗数据进行分析存在许多挑战。首先,医疗信息系统通常不是为了科研和数据分析设计的。从数据分析的角度看,医疗数据通常比较复杂,数据的异构度较大,存在很多缺失信息和不一致信息。其次,理解医疗数据通常需要不同领域的知识,包括医学,生物统计学,流行病学和信息学等。在某些涉及基因疗法的医学数据中,还需要有基因学背景的领域专家。对于海量医疗数据,分布式计算平台的支持也必不可少。因此,医疗大数据分析需要一系列技术和方法的支持。本小节就其中一些关键的技术进行简介。医学术语和本体知识库医学术语提供了标准化描述并减少歧义的医学术语,而医学本体知识库进一步提供了标准化且一致的医学本体词汇来描述医学概念和概念之间的关系。通过使用医学术语和本体知识库,复杂、异构的医疗数据之间可以相互交流, 使后续的科学分析得以进行。在美国,常用的医学术语和医学本体知识库包括“国际疾病分类(International Classification of Diseases)”,“CPT医疗服务(操作)编码系统(Current Procedural Terminology)”“医学系统命名法-临床术语(SNOMED CT)”以及“检测指标标识符逻辑命名与编码系统(LOINC)]”等。一体化医学语言系统(The Unified Medical Language System-UMLS)是美国国立卫生研究院经过20年的积累和开发完成的一个大型医学本体知识库。它集成了大部分常用的医学术语词典和本体库 (137个), 是医学信息学领域最广泛使用的医学本体知识库之一。医学自然语言处理由于大量详细的病人信息以文本形式存储,而文本描述的信息通常存在歧义和很多非标准化描述,如何把这些非结构化数据转化为统一的结构化数据是医学信息处理的重要步骤。自然语言处理是解决方案之一。 将非结构化医疗数据转化为结构化数据需要一系列医学自然语言处理技术,包括:“医学名实体识别”,“名实体自动编码”,“名实体修饰词识别”,“时间信息抽取”等。作为信息抽取的关键技术,医学信息抽取一直是医学自然语言处理 的研究热点。美国国立卫生研究院资助的i2b2中心曾经组织了多次国际范围内的医学信息抽取测评任务,推动了电子病历语料标注和医学自然语言处理的发展。医疗数据模型和软件为了有效提高后续数据的分析, 把临床医疗数据转化成研究用的数据模型是当前普遍的方法之一。目前,常用的医疗数据模型有: SHARPn项目开发的数据标准化流程(使用了 “临床元素模型(Clinical Element Model)”),PCORI 提出的“通用数据模型(PCORNET common data model)”,OMOP/OHDSI提出的“通用数据模型(OMOP common data model)” 等。除了数据模型, 美国科研人员还开发了不少支持临床数据管理和分析的软件。 其中以“I2B2”和“transSMART”最具代表。医疗大数据分析应用这里我们简单介绍一下和药物研究相关的几个临床数据分析应用:药物警戒(Pharmacovigilance)药物警戒是药物流行病学的一种,通过监测药物投放市场后的临床副作用,进行关联性研究。这就需要把病历数据中的药物治疗信息和不良药物反应提取出来, 进行关联形成分析。从而产生各种概率的分布,供药物安全性专家筛查和进一步分析提供线索。疗效比较研究 (Comparative effectiveness research)疗效比较研究的目的是为病人,医生,公共医疗政策制定者提供有效的信息来提高患者个人乃至整个公共医疗的质量。此类研究通常就几种可用治疗方案的优缺点进行对比,从医疗大数据中寻找相关证据。例如,通过对糖尿病病人的电子病历数据进行分析,比较发现不同糖尿病药物对不同年龄段的病人的治疗效果。从中医中药的角度看,大数据有助于慢性病人的管理,研究中药的适应症和禁忌症。基于药物基因组学的精准医疗(Precision medicine)药物基因组学是药理学的一个分支,研究基因变异如何影响个体对药物反应,包括疗效和不良反应。由于医疗技术发展的限制,传统医疗通常通过传统的病理特征对病人制定治疗方案,还未深入到个体基因表达差异。随着人类基因组学和药物基因组学的发展,医疗技术的进步使得针对个体基因表达差异来制定更精准的治疗方案成为可能, 这就是精准医疗的概念。例如,通过对电子病历数据进行分析,相关研究发现由于基因差异导致病人对“华法林(Warfarin)”摄入剂量的不同产生不同的反应。带有某些基因变异的病人甚至会出现出血,乃至死亡。精确医疗可以根据个体基因的差异以及病人其它的身体状况制定算法来预测单个病人的华法林剂量。结论与展望医院系统的电子化积累了海量的医疗数据, 是支持临床医学研究的宝贵资源。但是快速而有效的医疗大数据分析还存着很多挑战和困难。生物医学信息学是支持医疗大数据分析的原动力。我们希望看到更多中文的基础性的医学信息学研究,尤其在标准化层面(比如中国的UMLS),从而为中国医疗大数据研究和产业化奠定坚实基础。(原标题:基于电子病历的医疗大数据现状与未来)
本文转载自其他网站,不代表健康界观点。
相关附件下载:
意见内容:
还可输入500字
(C)2012&&北京华媒康讯信息技术有限公司&&All Rights Reserved.&&注册地址:北京&&联系电话:
京公网安备54号
您的申请提交成功

我要回帖

更多关于 数据挖掘的应用前景 的文章

 

随机推荐