麻省理工学院研发数据科学机器助力数据分析
2015-09-10
中国远程教育 2015年11期
据合众国际社(UPI)的报道,麻省理工学院通过装有促销销售日期和每周利润的数据库测试了一个计算机系统——“数据科学机器”(The Data Science Machine),并认为该系统在数据模式发现方面优于人类。
通常,人类在模式识别领域的表现优于计算机。直到现在,数据分析和数据挖掘过程还需要人工介入。但麻省理工的科学家们认为他们可能已经破解人类完成模式识别任务的密码,并声称他们的“数据科学机器”在大数据分析和模式提取方面比人类速度更快且更可靠。他们的机器参加过三次和人的比赛,任务是通过N种算法对几个月的数据进行模式预测。“数据科学机器”预测的准确率分别为94%、96%和87%。其中一次比赛中,“数据科学机器”与906人组成的团队对抗,最后机器战胜了其中的615人。报告称计算机通过使用一些数字标识符试图找到数据中的相关关系,然后更新标识符,继续紧缩数据,随后,机器改进其过程并开始分辨数据中的趋势。
这些测试如果成功,将大大减轻人类的工作量,特别是数据分析方面的工作量。目前,“数据科学机器”在预测学生是否会放弃在线课程方面已经有了较高的准确度,但是系统至少需要两套算法才能做出预测。它需要分析学生在在线课程上所花的时间以及学生在截止日期前花在作业上的时间。哈佛大学的一位计算机科学家认为,这类新机器不仅能解决问题,还能为如何看待问题提供不同的视角。
http://www.themarketbusiness.com
谢 洵 编译
(本栏目由北京师范大学远程教育研究中心、交互媒体与远程学习实验室同本刊合办)