女生得过精神分裂症治好了,25岁参加高考,学人工智能好吗?

外界普遍认为,美国的医疗系统已经崩溃。大数据能不能帮助美国修复它的医疗系统?请看《财富》杂志的深入报道。

去年12月,CVS提出以690亿美元收购安进保险公司。今年1月,又有三大巨头——亚马逊、摩根大通和伯克谢尔哈撒韦表示要成立合资公司,降低共100万左右员工的医疗成本并提高效果。之后3月,信诺保险表示将出资超过500亿美元收购医药福利管理机构Express Scripts。

为何近来医疗领域交易如此热闹?猛一看你可能以为是为了追求量级。也就是管理学中常说的“规模”。但实际上有个强大的催化剂,一种无限大又无限小的东西似乎能回答所有问题。答案就是数据。

更确切地说,是你的数据:个体生物信息、病史、健康不断波动的情况,以及去过何处、消费习惯、睡眠状况,饮食和排泄等等。日常生活中产生的数据,实验室检测结果、医学影像、基因档案、液体活检、心电图……这些都只是一小部分,但已涵盖大量数据。再加上医疗索赔、临床实验、处方和学术研究等等,每天产生的数据约750万亿字节,约占全世界数据量的30%。

海量数据已存在许久,多亏现在层出不穷的新科技,先进的测量仪器,无处不在的连接和云技术,再加上人工智能,企业终于可以利用这些数据。“收集数据只是一方面。”斯克利普斯研究所主任埃里克·托普尔表示。“但更重要的是分析。就在三五年前,数据还只能闲置,现在已经可以分析解读。这是医疗领域最大的变化。”

因此,获取、分析并利用数据已成为新的淘金潮。一群科技大鳄,还有一帮热门初创公司都在积极试水。

谷歌母公司Alphabet旗下的生物科技公司Verily就在追踪10000名志愿者提供的生物特征信息,努力制定人类健康“基准”(流言称其对医疗保险行业也有兴趣)。苹果刚宣布了iPhone上的新功能,可以立即对接几家大医疗系统,上传医疗数据,此外苹果还与斯坦福大学进行心脏领域研究,测试可穿戴设备是否能检测严重的心脏疾病。

根据医疗保险和医疗补助服务中心的数据,合理利用数据最终可以提升患者健康水平并降低医疗成本,仅2018年医疗成本就预计增长5.3%。 当然,这是远期理想。但最起码能带动潜在的相关业务。BDO董事总经理大卫·弗兰德指出,坐享海量数据的Facebook和谷歌通过广告赚钱,他估计相关业务价值2000亿美元。“医疗行业规模要大15倍,”他表示。“医疗支出达3万亿美元。理论上说,如果路走对了就能打造15个Facebook和15个谷歌。这就是竞争激烈的原因。”

也正因如此,从医院到保险公司到福利管理机构,再到医疗和仪器制造商,如此多传统医疗公司都在急切地重组创新,要知道相关行业体量可达经济总量五分之一。行业重组不仅意味着企业层面重新划定医疗行业版图,也会影响到每个人。

埃森哲首席技术和创新官保罗·多尔蒂比较乐观,他估计由于“信息不对称”存在,掌握自身生物数据的病人会从中受益,享受更多红利。

为了更好地了解未来如何实现权力均衡,也为了更深入探究目前的情况,《财富》杂志采访了三十几位涉及医疗行业各细分领域的高管,以及企业家、医生、病人和其他专家。以下就是大数据革命在促进医药行业方面的各种说法。

数据药丸:病患诊断新范式

雅各比八岁生日前后,林德赛·阿莫斯开始注意儿子的异常。雅各比很活泼,经常打冰球和长曲棍球,但突然变得有些懒洋洋,而且总想去洗手间。医生测量雅各比的血糖后,通知家人赶紧送孩子去急诊。路上孩子开始意识模糊。阿莫斯后来才知道,当时雅各比的血糖水平高达735毫克/分升,而健康范围是70-140毫克/分升。幸运的是,雅各比病情没有发展到糖尿病酮酸血症,简称DKA。DKA是一种可能致命的并发症,由于血糖水平持续升高,血液变酸性,导致器官衰竭。

阿莫斯一家住在丹佛郊区,可怕事件发生后医生给出的应对方案却极为随意,也不明确。她的家人上了速成课程学习1型糖尿病,了解高血糖和低血糖如何危及生命。他们得知要计算雅各比的糖分摄入,一天里要多次检查血糖,刺破手指用糖尿病测试条,然后手写记录在日志中。

压力,训练,胰岛素,各种食物……再加上各项的影响因素相互作用,导致血糖水平出了名的难掌控,要把雅各比的血糖水平保持在健康范围内让人精疲力尽也很可怕。阿莫斯处处小心计算,但效果不佳,雅各比的血糖就像坐过山车,时而飙升到极高水平(他会感觉疲劳),时而又会降到极低(他会头晕)。

但雅各比的生死就看这些数字。阿莫斯希望能时刻了解血糖水平,雅各比诊断后几个星期,她用尽一切努力测试儿子的血糖,一天能测20多次,远远超过保险覆盖的次数。

每年都有数百万美国家庭遇到类似疾病冲击;但2015年开始,新出现的智能手机技术部分缓解了担忧。加州一家名叫Dexcom的公司将血糖持续监测仪(已经问世十多年)与智能手机(或智能手表)无线连接,用户可以监测,绘制并分享血糖数据,每隔五分钟即可获得最新数据,全天待命,血糖达到危险水平时还能发出警报。

一些专家认为,随时在线的设备会告诉病人太多信息,但阿莫斯半开玩笑地介绍自己如何“跟踪”儿子血糖水平时说,这种仪器堪称救生员。她说,雅各比现在可以正常地读小学三年级,只要注意看看Apple Watch上的血糖数据就可以,不用再一天跑很多趟校医院。(阿摩斯也在iPhone上随时盯着。)而且现在雅各比可以安心睡整晚,不用隔几个小时就起床扎手指测血糖。

设备提供的还不仅仅是安心,其收集的数据确实可以帮阿莫斯和雅各比了解糖尿病情况以及如何控制。他们能发现哪些食物导致血糖飙升,以及何时注射胰岛素能更好地控制比萨之类复杂碳水化合物。是的,他的糖尿病没有治愈。但现在至少可以预测,很少出现意外。很明显,这项技术已经完全融入他们的日常生活。“跟汽车安全带和自行车头盔没有区别。”阿莫斯表示。

这只是智能手机和联网设备改变病人与健康数据关系的方式之一,过程中也能帮助病人改善健康状况。

Virta和Omada Health之类数字糖尿病预防和治疗平台还连接起社区和健康教练,教练可以远程监控体重、血糖、饮食和服药等情况。现在还有Proteus Digital Health可食入传感器,都值得《黑镜》拍一集了,这种传感器可以帮助患者(以及医生和家属)随时查看是否服药。Froedtert医院及威斯康星医疗网络医学院首席创新和数字官迈克尔·安德烈斯介绍,每粒药片接触胃酸时都会启动应用程序,传感器把整个过程显示得像游戏一样。根据Froedtert测试,丙肝患者服用Gilead Harvoni等昂贵药物期间,配合传感器按时服药比例达98.6%。按时服药不仅有利于治愈疾病,还能省下不少钱,因为多吃一个月药费用会多出数万美元。这就是Froedtert(而不是患者)支付传感器费用的原因。

流行的Apple Watch或Android系统可穿戴健康设备已经普及,提醒各种健康事项,从睡眠呼吸暂停到高血压,甚至是严重心律失常。人们越发关注自己的基因组,希望预测患上某些疾病(如癌症和阿尔茨海默病)的风险,有些暂时还无法实现,有些技术尚不完备(并且有争议)。消费者开始利用Colour Genomics和23andMe等公司非常便宜又方便的基因检测试剂盒,检测结果会提示罹患某些疾病几率较高。支持者认为,了解风险有时可以帮人们采取相应预防措施,从而降低风险。

突然之间,类似家庭基因测试变成必需品:最近的黑色星期五,23andMe的标准DNA测试销量跻身亚马逊前五,差点赶上亚马逊自家出品的智能音箱Echo Dot和多功能高压锅“Instant Pot”。

所有革新技术的卖点都很简单:消费者主导。

一些大型保险公司甚至发现,让患者参与数据有助于改善结果和控制成本。这也是安泰保险首席执行官个马克·贝尔托里尼下的赌注。贝尔托里尼正争取与CVS达成合作,他认为,如果企业能明确告知消费者享受的益处,消费者就可能甚至会积极共享数据。“我们制定了各种规则保护数据,”贝尔托里尼表示,“但如果换个角度告诉客户,‘如果我们能掌握有关你的信息,服务起来更方便,’他或她就会愿意提供数据。这也是社交媒体作用很大的原因。”

掌握个性化数据后,公司可以与患者共同制定健康计划,贝尔托里尼说:“我们会告诉患者,如果一起制定计划就可以免除共同支付金额,也不必再授权,就因为计划是一起制定的。”

指挥中心:通过数据实现更好决策

疼痛来袭时,罗德尼·M正在给妻子挑选生日礼物。这位52岁的公关公司首席执行官抓紧胸口,挣扎着做在椅子上,腰部以上都失去了知觉,只感到麻木。他感觉就像“被卡车撞了一样”。

两年前罗德尼刚治疗过癌症,又患上一种新重病——为身体输送血液的关键动脉撕裂导致的“主动脉夹层”。

他还算幸运,急救车及时赶到把他送到马里兰州哥伦比亚市的霍华德县总医院,五分之一罹患动脉夹层的病人送到医院之前就去世了。这还没折腾完,几分钟内罗德尼又被飞机送到巴尔的摩的约翰霍普金斯医院,经过七个小时的复杂手术终于活了下来。

当时他并不知道,其实是霍普金斯医院人工智能驱动的数据“指挥中心”救了他的命。“41分钟。从监控系统报警到飞机从医院起飞只用了41分钟。”首席行政官吉姆·舒伦表示,他负责医疗中心不断扩大的急诊部门。

指挥中心从十几个数据流中实时提取信息,包括病历、紧急调度服务更新、实验检测结果,以及在特定时间医院有多少张病床。然后通过人工改进的算法,系统可以瞬间完成患者分级并根据需要进行安排,例如在罗德尼的案例中提前安排好外科手术团队。

对于医院来说,数据管理产生的经济效益无可争议。“霍普金斯医院指挥中心2016年启动以来,收治复杂癌症患者的能力增加了约60%,急诊室等床时间(等待住院病床)减少了25%以上,而手术室的等候时间减少了60%,“霍普金斯指挥中心设计方——通用电气医疗该项目负责人杰夫·特里说。霍普金斯医院的舒伦表示,应用该技术后,相当于医院不用实际投入,而收治能力增加15到16张病床。今年通用电气计划宣布新成立10个指挥中心,覆盖30家不同的医院。特里称,未来五年里医疗中心的投资回报率可达近4比1。

电子病历(EHR)也是近期大数据最新突破,可能没那么吸睛,但同样具有革新性。

电子病历是医疗圈少有人人讨厌的技术。医生抱怨称浪费的时间太多,跟其他医疗记录系统也没法顺利协作,并且其中大部分患者都读不懂。2015年以来,至少有593篇学术论文和一条说唱视频吐槽过该技术导致医生耗尽精力。如果大数据真能革新行业,机会可能就在这,应该将电子病历从耗时工作转变为可行的研究工具。

密歇根州西南部一个非盈利社区卫生系统Lakeland Health里,大数据确实发挥了作用。2012年,Lakeland开始启用电子病历系统,但基本由纸和笔组成。护士先在图表里记录每个病人的生命体征,回到电脑边再手动重新输入医院的电子系统,这一转录过程需要15到20分钟,并且经常出现错误。2016年中,医院启动全新流程,通过患者的腕带自动上传,或护士利用手持设备的床边输入数据。

Lakeland首席护理信息官阿瑟·巴拉奇表示,从一开始就有个明显变化:护士们花在输入数据上的时间减少,有更多时间照顾患者。但更彻底也令人惊讶的变化是“蓝色警报”下降:即患者心脏和呼吸停止。自英荷健康巨头飞利浦开发的新系统于2016年6月推出后,蓝色警报已下降56%。为什么?部分原因是警报系统嵌入了人工智能技术,不仅能检测生命体征的细微变化,还能根据病情打出风险评分,方便护士优先照顾病情更危急的病人。

“重要的是诚实地认识现状。”飞利浦战略与创新首席医疗官罗伊·史麦斯表示。许多新数字和数据工具关注的重点不是护理,而是如何使护理更高效、更智能、更精确地实现。

史麦斯跟《财富》杂志采访的许多位专家观点一致,即使是对数字健康极感兴趣的人。他们都警告不要过度使用新医疗技术。

“我们过度承诺,真正实现的不多。”西达斯西奈医学中心医生兼健康服务研究主任布伦南·斯皮格尔表示。“我认为自己是对技术保持怀疑的技术狂。但硅谷这个“回声室”里有太多人从来没接触过病人,也不理解数字医疗多么困难。“斯皮格尔还在加州洛杉矶分校担任医学和公共健康教授,他举了亲身经历的失败案例为证,包括2015年西达斯西奈想通过Fitbit、Apple Watch、Withings等可穿戴设备将病人与电子病历连接起来,结果一败涂地。“我们没能给病人适合的信息,也没诚挚邀请他们参与项目。”潜在参与者没什么理由参与连接和项目,因为项目没有明确的价值主张。“数字健康不是计算机科学或工程科学,而是社会科学和行为科学。”

斯科利普斯研究所的埃里克·托普尔同时也是一位著名的心脏病专家,他也提出了类似警告。“承诺很多,但大部分没实现。”他表示原因是存在各种系统性障碍。挑战之一便是美国僵化又“长期存在”的医疗机构。美国医生有半数超过50岁,他们抗拒改变,“除非获得更多补偿。”

按照安进公司的说法,大数据已然颠覆加州生物医药研发过程,还大大影响了研发阶段新药。事情是2011年开始的,时任研发主管的肖恩·哈珀前往冰岛旅行。他的目的是解决公司面临的“故障问题”,也是行业的问题。简单来说,90%的研发新药都没法进入市场。

研发新药非常昂贵而且低效。企业经常投资数十亿美元,花很多年努力验证可能有希望的科学假设。药品科学家渴望化学试验时突降好运,实际上并没完全理解努力追求的生物复杂性,也不明白为何某些药在白鼠身上作用明显,对人类却不起作用。

对哈珀来说,冰岛似乎可以提供一些独特的医疗数据。数据由冰岛政府提供,包括16万公民的基因排序信息,还有医疗和家谱,数据由总部位于雷克雅未克的人类基因设备公司deCode存储分析。该公司1996年成立,一直在苦苦经营。

尽管偿付能力存在问题,但deCode在基因探索领域成果丰硕。其拥有的大量数据可以用来挖掘遗传变异人群,并将变异与癌症到精神分裂症等疾病的临床结果联系起来。随着计算机处理能力提升,测序成本大幅下降,哈珀发现该公司对药物研发来说是价值低估的资产,于是2012年安进公司以4.15亿美元将其收入囊中。

此次收购彻底改变了安进的研发过程。收购之前,安进候选分子中只有15%针对特定的遗传目标进行了验证。收购完成后,安进开始利用deCode的数据库评估所有候选药物。审核发现了一些明显不起作用的药物。证据显示,有5%的候选分子没有疗效。管理层立刻关停相关项目(包括一种非常受期待的冠状动脉药物,而且即将进入人体试验阶段),转而优先考虑基因靶点明确的药物。经deCode基因数据库确认后,安进也通过了十多种药物。

哈珀表示,现在安进公司四分之三的研发产品都会参考基因数据,大部分都来自deCode数据库,如今收购成本早已收回。

尽管对药物靶点进行基因验证并不能保证最后成功,但科学家们还是得弄清楚如何安全有效地给药,应对大量生物学上的挑战,确实开了个好头。哈珀表示,“如果回报率能提高50%,变化已经很大。”

生物科技公司再生元也曾想与deCode合作,跟安进公司收购deCode时间差不多,其策略也跟安进类似。最终再生元没有寻求收购,而是以再生元遗传学中心(RGC)的形式建立自己的研究中心,花费四年给大量外显组完成测序(蛋白质编码部分的基因组)尽可能与病历配对,并加速药物研发。

再生元基因组生物信息学负责人杰夫·里德表示,很多人在讨论药品研发时利用基因技术,“却没有提前设计样本流。”简单来说:他们没有数据。后来里德得知再生元与盖辛格公司有合作,便加入了再生元(参见《基础护理》),盖辛格是位于宾夕法尼亚州的健康管理系统,计划从10万名病历完整的患者中收集样本并对完成测序。“他们希望获得数据后能切实改善对患者的护理。”再生元遗传学中心负责人阿里斯·巴拉斯说。

如今再生元合作方已超过60个,包括已招募50万名参与者的英国生物银行。巴拉斯和里德说,其掌握的数据规模和多样性都不断发展,内部研究数据能力也不断增强,这点至关重要。迄今为止已启动50个靶点生物学项目。

隐藏的数字:病历未尽之用

肿瘤科医生和前杜克大学教授艾米·阿伯内西认为,杂乱的健康信息没什么意义,除非符合两个关键标准:质量和背景。“不了解医学实践核心的人都不知道到底多么混乱。”四年前担任Flatiron Health首席医疗官的阿伯内西表示,这家创业公司由谷歌风投(GV)投资。

以Flatiron专长的癌症病历为例。肿瘤学电子病历中的许多重要信息(实际上约一半)可能都在医生的笔记中,但笔记没法组成特定的数据字段。各种观察结果没法按类整理在表格中。

“过去电子病历只是收费和收藏工具,医生按规矩撰写才能保住工作。”田纳西肿瘤中心的医生兼首席执行官杰弗里·巴顿解释说。田纳西肿瘤中心是基于社区的医疗机构,收治了该州大部分癌症患者,也是数百个使用Flatiron系统的社区癌症中心之一。

讽刺的是,Flatiron的真正卖点是人类。遇到此类数据,人类往往能发现计算机系统可能错过的细节。阿伯内西说,真正的挑战不是收集数据,而是要“清理干净”。“如果不理解相关背景真的很难做到。”

Flatiron现在掌握美国20%主动治疗的癌症患者数据,“数据结构很清晰。”罗氏制药公司首席执行官丹尼尔·奥蒂表示,今年2月罗氏出资19亿美元收购了Flatiron公司。“Flatiron特别之处在于能整理出符合监管要求的真实数据。”奥蒂告诉《财富》。他表示,Flatiron的数据非常完备,“理论上可以取代罗氏为癌症免疫治疗药物Tecentriq设置的临床试验‘对照组’之一”。

理论上,Flatiron的数据系统可能对临床试验招募产生更广泛的影响。数十年来,癌症药物研究中病人招募都是最大挑战之一。举例来说,如果招募顺利就更容易根据病人情况匹配适合的药物。

IBM沃森在该领域初见成效。梅奥诊所今年3月报告称,使用IBM先进的认知计算系统后,乳腺癌临床试验参与人数增加了80%。 “沃森帮我们更快更准确地匹配患者与潜在的临床试验,以往肿瘤医生很难做到。”梅奥诊所首席信息官克里斯托弗·罗斯接受贸易出版物MobiHealthNews采访时表示。

即使是以前很少有机会接触患者的机构,例如药房福利管理结构,由于掌握海量数据,也可能为改善人类健康和降低成本贡献力量。

以密苏里州的药房福利管理结构Express Scripts为例,今年 3月刚刚由信诺保险收购。Express Scripts每年为1亿美国人管理14亿个处方,人们什么时候不按时吃药都知道。不遵医嘱服药每年导致的成本达1000亿美元至3000亿美元,数字差异是由于测算方式不同。成本出现的原因是患者不遵医嘱出现并发症,引起后续治疗。

Scripts首席数据官汤姆·亨利表示,已经发现300种可能让病人放弃照处方配药的因素。各项因素包括从基本的人口统计数据(收入水平和邮政编码)到行为数据(根据患者不取处方药后的调查问卷,判断患者健忘程度和拖延倾向)再到直观性较低的因素,如开药者和患者的性别(接受女性医生诊治的男性不遵从医嘱可能性更大)。该公司称,算法准确率达到94%,可以用算法为患者风险评分,并采取不同的提醒服务。亨利称提醒服药的方式“比较温和,不会强迫”。总之,Express Scripts称不遵医嘱服药现象减少了37%,为客户节省了1.8亿美元。

与其他领域的革命一样,许多人没考虑清楚下一步,也没准备好承担相应后果便纷纷涌入。在医疗大数据社交实验中问题也有多方面,从病人隐私到警告人们有些风险无法避免时的道德困境等。对许多数字医疗支持者来说,大数据仿佛是苦苦等待的一粒“魔术子弹”。问题是这颗子弹究竟往哪里打。(财富中文)

本文另一版本发表于2018年4月《财富》杂志,标题为《当大数据遇上生物学》。

编者按:本文由编译自IBM,参与:吴攀、黄小天、Nurhachu Null;36氪经授权发布。

人工智能的发展曾经经历过几次起起伏伏,近来在深度学习技术的推动下又迎来了一波新的前所未有的高潮。近日,IBM 官网发表了一篇概述文章,对人工智能技术的发展过程进行了简单梳理,同时还图文并茂地介绍了感知器、聚类算法、基于规则的系统、机器学习、深度学习、神经网络等技术的概念和原理。对本文进行了编译。

人类对如何创造智能机器的思考从来没有中断过。期间,人工智能的发展起起伏伏,有成功,也有失败,以及其中暗藏的潜力。今天,有太多的新闻报道是关于机器学习算法的应用问题,从癌症检查预测到图像理解、自然语言处理,人工智能正在赋能并改变着这个世界。

现代人工智能的历史具备成为一部伟大戏剧的所有元素。在最开始的 1950 年代,人工智能的发展紧紧围绕着思考机器和焦点人物比如艾伦·图灵、冯·诺伊曼,迎来了其第一次春天。经过数十年的繁荣与衰败,以及难以置信的高期望,人工智能及其先驱们再次携手来到一个新境界。现在,人工智能正展现着其真正的潜力,深度学习、认知计算等新技术不断涌现,且不乏应用指向。

本文探讨了人工智能及其子领域的一些重要方面。下面就先从人工智能发展的时间线开始,并逐个剖析其中的所有元素。

1950 年代初期,人工智能聚焦在所谓的强人工智能,希望机器可以像人一样完成任何智力任务。强人工智能的发展止步不前,导致了弱人工智能的出现,即把人工智能技术应用于更窄领域的问题。1980 年代之前,人工智能的研究一直被这两种范式分割着,两营相对。但是,1980 年左右,机器学习开始成为主流,它的目的是让计算机具备学习和构建模型的能力,从而它们可在特定领域做出预测等行为。

图 1:现代人工智能发展的时间线

在人工智能和机器学习研究的基础之上,深度学习在 2000 年左右应运而生。计算机科学家在多层神经网络之中使用了新的拓扑学和学习方法。最终,神经网络的进化成功解决了多个领域的棘手问题。

在过去的十年中,认知计算(Cognitive computing)也出现了,其目标是打造可以学习并与人类自然交互的系统。通过成功地击败 Jeopardy 游戏的世界级选手,IBM Watson 证明了认知计算的价值。

在本文中,我将逐一探索上述的所有领域,并对一些关键算法作出解释。

1950 年之前的研究提出了大脑是由电脉冲网络组成的想法,正是脉冲之间的交互产生了人类思想与意识。艾伦·图灵表明一切计算皆是数字,那么,打造一台能够模拟人脑的机器也就并非遥不可及。

上文说过,早期的研究很多是强人工智能,但是也提出了一些基本概念,被机器学习和深度学习沿用至今。

人工智能中的很多问题可以通过强力搜索(brute-force search)得到解决。然而,考虑到中等问题的搜索空间,基本搜索很快就受影响。人工智能搜索的最早期例子之一是跳棋程序的开发。亚瑟·塞缪尔(Arthur Samuel)在 IBM 701 电子数据处理机器上打造了第一款跳棋程序,实现了对搜索树(alpha-beta 剪枝)的优化;这个程序也记录并奖励具体行动,允许应用学习每一个玩过的游戏(这是首个自我学习的程序)。为了提升程序的学习率,塞缪尔将其编程为戏,以提升其游戏和学习的能力。

尽管你可以成功地把搜索应用到很多简单问题上,但是当选择的数量增加时,这一方法很快就会失效。以简单的一字棋游戏为例,游戏一开始,有 9 步可能的走棋,每 1 个走棋有 8 个可能的相反走棋,依次类推。一字棋的完整走棋树包含 362,880 个节点。如果你继续将这一想法扩展到国际象棋或者围棋,很快你就会发展搜索的劣势。

感知器是单层神经网络的一个早期监督学习算法。给定一个输入特征向量,感知器可对输入进行具体分类。通过使用训练集,网络的权重和偏差可为线性分类而更新。感知器的首次实现是 IBM 704,接着在自定义硬件上用于图像识别。

图 3:感知器与线性分类

作为一个线性分类器,感知器有能力解决线性分离问题。感知器局限性的典型实例是它无法学习专属的 OR (XOR) 函数。多层感知器解决了这一问题,并为更复杂的算法、网络拓扑学、深度学习奠定了基础。

使用感知器的方法是有监督的。用户提供数据来训练网络,然后在新数据上对该网络进行测试。聚类算法则是一种无监督学习(unsupervised learning)方法。在这种模型中,算法会根据数据的一个或多个属性将一组特征向量组织成聚类。

图 4:在一个二维特征空间中的聚类

你可以使用少量代码就能实现的最简单的聚类算法是 k-均值(k-means)。其中,k 表示你为样本分配的聚类的数量。你可以使用一个随机特征向量来对一个聚类进行初始化,然后将其它样本添加到其最近邻的聚类(假定每个样本都能表示一个特征向量,并且可以使用 Euclidean distance 来确定「距离」)。随着你往一个聚类添加的样本越来越多,其形心(centroid,即聚类的中心)就会重新计算。然后该算法会重新检查一次样本,以确保它们都在最近邻的聚类中,最后直到没有样本需要改变所属聚类。

尽管 k-均值聚类相对有效,但你必须事先确定 k 的大小。根据数据的不同,其它方法可能会更加有效,比如分层聚类(hierarchical clustering)或基于分布的聚类(distribution-based clustering)。

决策树和聚类很相近。决策树是一种关于观察(observation)的预测模型,可以得到一些结论。结论在决策树上被表示成树叶,而节点则是观察分叉的决策点。决策树来自决策树学习算法,其中数据集会根据属性值测试(attribute value tests)而被分成不同的子集,这个分割过程被称为递归分区(recursive partitioning)。

考虑下图中的示例。在这个数据集中,我可以基于三个因素观察到某人是否有生产力。使用一个决策树学习算法,我可以通过一个指标来识别属性(其中一个例子是信息增益)。在这个例子中,心情(mood)是生产力的主要影响因素,所以我根据 Good 一项是 Yes 或 No 而对这个数据集进行了分割。但是,在 Yes 这边,还需要我根据其它两个属性再次对该数据集进行切分。表中不同的颜色对应右侧中不同颜色的叶节点。

图 5:一个简单的数据集及其得到的决策树

决策树的一个重要性质在于它们的内在的组织能力,这能让你轻松地(图形化地)解释你分类一个项的方式。流行的决策树学习算法包括 C4.5 以及分类与回归树(Classification and Regression Tree)。

最早的基于规则和推理的系统是 Dendral,于 1965 年被开发出来,但直到 1970 年代,所谓的专家系统(expert systems)才开始大行其道。基于规则的系统会同时存有所需的知识的规则,并会使用一个推理系统(reasoning system)来得出结论。

基于规则的系统通常由一个规则集合、一个知识库、一个推理引擎(使用前向或反向规则链)和一个用户接口组成。下图中,我使用了知识「苏格拉底是人」、规则「如果是人,就会死」以及一个交互「谁会死?」

图 6:基于规则的系统

基于规则的系统已经在语音识别、规划和控制以及疾病识别等领域得到了应用。上世纪 90 年代人们开发的一个监控和诊断大坝稳定性的系统 Kaleidos 至今仍在使用。

机器学习是人工智能和计算机科学的一个子领域,也有统计学和数学优化方面的根基。机器学习涵盖了有监督学习和无监督学习领域的技术,可用于预测、分析和数据挖掘。机器学习不限于深度学习这一种。但在这一节,我会介绍几种使得深度学习变得如此高效的算法。

图 7:机器学习方法的时间线

神经网络的强大力量源于其多层的结构。单层感知器的训练是很直接的,但得到的网络并不强大。那问题就来了:我们如何训练多层网络呢?这就是反向传播的用武之地。

反向传播是一种用于训练多层神经网络的算法。它的工作过程分为两个阶段。第一阶段是将输入传播通过整个神经网络直到最后一层(称为前馈)。第二阶段,该算法会计算一个误差,然后从最后一层到第一层反向传播该误差(调整权重)。

图 8:反向传播示意图

在训练过程中,该网络的中间层会自己进行组织,将输入空间的部分映射到输出空间。反向传播,使用监督学习,可以识别出输入到输出映射的误差,然后可以据此调整权重(使用一个学习率)来矫正这个误差。反向传播现在仍然是神经网络学习的一个重要方面。随着计算资源越来越快、越来越便宜,它还将继续在更大和更密集的网络中得到应用。

卷积神经网络(CNN)是受动物视觉皮层启发的多层神经网络。这种架构在包括图像处理的很多应用中都有用。第一个 CNN 是由 Yann LeCun 创建的,当时 CNN 架构主要用于手写字符识别任务,例如读取邮政编码。

由好几层能够分别实现特征提取和分类的神经网络组成。图像被分为多个可以被接受的区域,这些子区域进入到一个能够从输入图像提取特征的卷积层。下一步就是池化,这个过程降低了卷积层提取到的特征的维度(通过下采样的方法),同时保留了最重要的信息(通常通过最大池化的方法)。然后这个算法又执行另一次卷积和池化,池化之后便进入一个全连接的多层感知器。卷积神经网络的最终输出是一组能够识别图像特征的节点(在这个例子中,每个被识别的数字都是一个节点)。使用者可以通过反向传播的方法来训练网络。

对深层处理、卷积、池化以及全连接分类层的使用打开了神经网络的各种新型应用的大门。除了图像处理之外,卷积神经网络已经被成功地应用在了视频识别以及自然语言处理等多种任务中。卷积神经网络也已经在 GPU 上被有效地实现,这极大地提升了卷积神经网络的性能。

长短期记忆(LSTM)

记得前面反向传播中的讨论吗?网络是前馈式的训练的。在这种架构中,我们将输入送到网络并且通过隐藏层将它们向前传播到输出层。但是,还存在其他的拓扑结构。我在这里要研究的一个架构允许节点之间形成直接的回路。这些神经网络被称为循环神经网络(RNN),它们可以向前面的层或者同一层的后续节点馈送内容。这一特性使得这些网络对时序数据而言是理想化的。

在 1997 年,一种叫做长短期记忆(LSTM)的特殊的循环网络被发明了。LSTM 包含网络中能够长时间或者短时间记忆数值的记忆单元。

图 10. 长短期记忆网络和记忆单元

记忆单元包含了能够控制信息流入或者流出该单元的一些门。输入门(input gate)控制什么时候新的信息可以流入记忆单元。遗忘门(forget gate)控制一段信息在记忆单元中存留的时间。最后,输出门(output gate)控制输出何时使用记忆单元中包含的信息。记忆单元还包括控制每一个门的权重。训练算法(通常是通过时间的反向传播(backpropagation-through-time),反向传播算法的一种变体)基于所得到的误差来优化这些权重。

LSTM 已经被应用在语音识别、手写识别、语音合成、图像描述等各种任务中。下面我还会谈到 LSTM。

深度学习是一组相对新颖的方法集合,它们从根本上改变了机器学习。深度学习本身不是一种算法,但是它是一系列可以用无监督学习实现深度网络的算法。这些网络是非常深层的,所以需要新的计算方法来构建它们,例如 GPU,除此之外还有计算机集群。

本文目前已经介绍了两种深度学习的算法:卷积神经网络和长短期记忆网络。这些算法已经被结合起来实现了一些令人惊讶的智能任务。如下图所示,卷积神经网络和长短期记忆已经被用来识别并用自然语言描述图片或者视频中的物体。

图 11. 结合卷积神经网络和长短期记忆来进行图像描述

深度学习算法也已经被用在了人脸识别中,也能够以 96% 的准确率来识别结核病,还被用在自动驾驶和其他复杂的问题中。

然而,尽管运用深度学习算法有着很多结果,但是仍然存在问题需要我们去解决。一个最近的将深度学习用于皮肤癌检测的应用发现,这个算法比经过认证的皮肤科医生具有更高的准确率。但是,医生可以列举出导致其诊断结果的因素,却没有办法知道深度学习程序在分类的时候所用的因素。这被称为深度学习的黑箱问题。

另一个被称为 Deep Patient 的应用,在提供病人的病例时能够成功地预测疾病。该应用被证明在疾病预测方面比医生还做得好——即使是众所周知的难以预测的精神分裂症。所以,即便模型效果良好,也没人能够深入到这些大型神经网络去找到原因。

人工智能和机器学习充满了生物启示的案例。尽管早期的人工智能专注于建立模仿人脑的机器这一宏伟目标,而现在,是认知计算正在朝着这个目标迈进。

认知计算建立在神经网络和深度学习之上,运用认知科学中的知识来构建能够模拟人类思维过程的系统。然而,认知计算覆盖了好多学科,例如机器学习、自然语言处理、视觉以及人机交互,而不仅仅是聚焦于某个单独的技术。

认知学习的一个例子就是 IBM 的 Waston,它在 Jeopardy 上展示了当时最先进的问答交互。IBM 已经将其扩展在了一系列的 web 服务上了。这些服务提供了用于一些列应用的编程接口来构建强大的虚拟代理,这些接口有:视觉识别、语音文本转换(语音识别)、文本语音转换(语音合成)、语言理解和翻译、以及对话引擎。

本文仅仅涵盖了关于人工智能历史以及最新的神经网络和深度学习方法的一小部分。尽管人工智能和机器学习经历了很多起起伏伏,但是像深度学习和认知计算这样的新方法已经明显地提升了这些学科的水平。虽然可能还无法实现一个具有意识的机器,但是今天确实有着能够改善人类生活的人工智能系统。

我要回帖

更多关于 精分的孩子还有未来吗 的文章

 

随机推荐