大数据能否掀起工业卫生的变革
2018-05-29艾德鲁特科夫斯基张朝彬
艾德·鲁特科夫斯基|文 张朝彬|译
2014年美国工业卫生协会(AIHA)的年会上,美国国家职业安全与卫生研究所负责人约翰·霍华德博士发表主旨演讲。会议恰逢AIHA成立75周年,霍华德借此机会展望了工业卫生未来75年的发展前景。他说,“在下一个发展时期,进行暴露评估就要先对工作环境进行持续监测。”霍华德指出,可直接读数的测量设备能让工人自行控制风险暴露;而工业卫生领域的抽样检测可能只需将传感器的暴露数据传输至中央存储器就能完成。他还提出了问题,我们如何处理传感器产生的数据?会不会因为数据量庞大而认同数据揭示的相关关系?各位安全从业人员是否会转型成为“暴露数据科学家”?
然而,在接下来的4年内,霍华德的提问却成为当下最紧迫的问题。传感器技术的进步、电子设备的增加,已经让“大数据”从报刊中流行词变成了现实。据预测,到2020年,将有200亿~300亿的设备连入互联网,不仅是手机、平板电脑、家用电器,还包括工业生产设备。各生产车间通过互联网,将机器和监测器的大量数据接入软件平台,经过分析处理,达到预测事故的目的。
随着直接读数设备和便携式传感器的普及,工人的安全健康数据成为日常收集项目,工业卫生也将从大数据强大的预测功能中获益。运用算法处理原来不可直接比较的数据流,不仅能准确定位当前的健康安全风险,还能预测未来可能出现的问题。但实现这一点,需要克服重重困难,比如人们对于隐私与数据安全的担忧,对工业卫生专家角色的疑虑。
什么是大数据
对有些工业卫生专家而言,可能挑战之一就是对“大数据”这一概念的认知。多年工作期间收集的暴露测量数据,可以称作大数据吗?AIHA的董事罗斯·海沃德的答案是否定的。他说,“仅有一个大型的电子数据表并不意味着有了大数据。”
海沃德于2017年11月份在AIHA总部组织了一次大数据相关的会议,参会的有工业卫生领域的机构组织、软件销售商、包括谷歌在内的科技公司。会上人们总结道,区别于一般数据,大数据具有3个明显特征:数量庞大、种类纷繁、处理迅速。数量庞大指大数据的规模浩繁,通常以太字节(TB)为单位计数。种类纷繁指大数据的种类,除文本和数字外,还包括到图像和视频。处理迅速指大数据产生的速度快,数据处理耗时很短。通常,大数据分析首先从众多的数据源实时获取大量数据,随后运用预定算法在数秒之间完成处理。
现代大多数工业卫生专家接触到的数据具有这3个特点吗?海沃德的回答仍然是否定的,但他强调不久以后这会成为现实,“当前的工具可以获取数据并将其与卫星定位相关联,AIHA几年之前就开始将噪声测量数据与工厂绘图相关联。但我们无法做到一次性完成所有过程,很多步骤还需手动。好在设备一直在升级换代,数据量上和处理速度上都有了很大提升。但数据的多样性还要进一步提高。”
另外,海沃德还认为,隐私和数据安全是目前要重点探讨的问题,美国和欧洲都有严格的法律要求,公司也会有相关的内部政策。任何数据分析都要考虑数据安全的问题。
工业卫生如何运用大数据
工作场所相互连接,源源不断的数据流从机器和监测器流向软件平台,经过运算最终提供预测性结果,这似乎并不遥远。
Corvex公司正在与行为经济学家合作,研发一种应对风险的评分模型,该模型能够基于操作和生产环境,预测可能会出现问题的环节。平台首先收集工人的健康信息和来自机器的数据;然后将这些数据传输到网络云端;数据在云端经过有关算法处理后输出到仪表盘;最后工业卫生专家或安全经理会根据仪表信息预测风险。这一切都将实时进行。在这一系列过程中,设备之间相互连接,工人也被相互连接。
Cority公司主要针对质量、环境和职业健康领域开发软件,利用另外一种方式帮助工业卫生专家进行大数据分析。Cority的客户利用其软件平台储存、管理、分析他们的质量、环境和职业健康数据。公司系统中的数据一般包括职业健康信息、安全信息以及相关测量数据。Cority还与Fatigue Science公司合作,后者专注于生产便携式员工疲劳监测设备。Cority公司工业卫生经理莫妮卡·迈尔克尼安希望公司制造的设备能够基于工人的疲劳程度,通过整合分析数据,发现可能受伤的工人。
迈尔克尼安也参加了AIHA组织的会议,看到了大数据在工业卫生领域的潜能,同时她也清晰看到了其中的困难。她说:“软件的解决方案不同,储存数据的设备也不一样;运用不恰当的算法,可能会产生错误结果,不利于决策。”因此,算法要建立在合理假设、推测的基础上,这就给工业卫生从业人员带来了新的职业发展机遇,他们能为公司提供必要的知识和背景,确保大数据分析的可信度。因此,她认为,如果这些从业人员能掌握数据科学的基本技能,将会给其职业发展带来非常大的帮助。这与约翰·霍华德在2014年年会上的展望不谋而合。迈尔克尼安希望数据科学课程能够添加到工业卫生专业的本科生或研究生的教学中,或者作为相关专业资格证考察的一部分。
大数据应用前景
据海沃德透露,AIHA计划探索大数据相关的活动,先用一些公开数据作测试。通过与技术公司合作,AIHA能发现自己在教育培训、工具、算法设计等方面的需求。另外,AIHA还会建立一项认证体系,通过AIHA认证实验室为制造直接读数设备的公司进行认证。
随着互联世界越来越大,有公司开始专门从事工业卫生领域的数据管理。Corvex公司预测,大数据将对工业卫生实践产生革命性影响,未来会出现更多的数据分析平台,实时分析健康、安全和暴露风险。
以前,工业卫生专家需要走到设备周围,分别测量数据,再回到电脑前,将数据录入到文档,然后进行数学计算,最后再根据计算结果推算出风险何在。而在不久的将来,上述过程会自动完成,直接将推算结果实时传输给工人、工业卫生专家或安全经理面。
相比于Corvex公司的乐观,迈尔克尼安却心存疑虑,她认为大数据不会从根本上改变工业卫生,“我一直认为大数据仅是工具箱中一个工具而已,没有格外优越之处,使用时还要经过我们的专业判断。”