舍恩伯格的著作《大数据时代》讲了这样一个故事:2009年出现了一种新的流感病毒。这种甲型H1N1流感在短短几周之内迅速传播,全球的公共卫生机构都担心一场致命的流行病即将来袭。有的评论家甚至警告说,可能会爆发类似1918年在西班牙爆发那场影响了5亿人口并夺走了数千万人性命的大规模流感。而最终2009年这场流感在美国被控制的原因,却是因为一家知名的互联网公司提前预测了这场流感。
这家公司曾表示,他们不仅可以预测到这场流感在美国甚至全球的爆发,甚至可以具体到特定的地区和州。这家公司是通过观察人们在网上的搜索记录来完成这个预测的。他们每天都会收到来自全球超过30亿条的搜索指令,通过分析人们的搜索记录来判断这些人是否患上了流感。他们不是简单地以“哪些是治疗咳嗽和发热的药物”之类检索词条来判断,而是通过检索词条的组合建立了一个数学模型。所以,这一年甲型H1N1流感爆发的时候,与习惯性滞后的官方数据相比,这家公司建立了一个更有效、更及时的指示标。
确实如此,如果想要预防控制传播性疾病,必须先知道病源,但糟糕的是,人们一般感冒不会去医院,等到病重去医院时,基本上已经是一到两周之后了,医院搜集到这个信息再传到疾控中心,延迟的时间将更久。对于一种可能飞速传播的疾病,信息滞后两到三周的后果将是致命的。就如这次禽流感上海的死者吴亮亮,在病亡后21天,才被确诊为H7N9流感。死者家属以“诊断失误”向医院索赔百万巨款,这种“医疗事故”是患者的悲哀,也不应该医院来买单,如果疾控中心早发现,早预测,早播报,也就不会出现这种悲剧。
而在H7N9流感确认以后,政府的公开信息仅是将患者数量、死亡数量进行通报,并未把真实数据、就诊情况进行公示,而农业部一句“不排除更大范围检出H7N9禽流感的可能”,更是将市民推向了恐慌。板蓝根断货,口罩断货,医药股涨停,农副业风声鹤唳,死猪死鸭满河漂流……一波又一波的社会事件冲击着人们脆弱的神经。
舍恩伯格的故事是想告诉大家,大数据深刻地改变了公共卫生,改变了人们的思维方式。试想:如果我们有一个“公众大数据模型”,有能力对海量数据进行有效的分析,让疾控中心的疫情预报走在疾病传播的前面;不仅能预测,更能在流感传播前进行有效预防,最大限度减少公众恐慌。如今,是否建立一个“公众大数据模型”,显然应引起有关部门的重视。