“数据分析与计算专栏”主持人语
2020-03-27许云峰
中国大数据和人工智能技术正处于蓬勃发展阶段,先进模型算法不断涌现。本期专栏推出3篇论文,以大数据和人工智能应用为中心,面向工业界和学术界的应用场景,介绍前沿模型算法的相关应用案例。
第1篇是张冬雯等撰写的《基于长短期记忆神经网络模型的空气质量预测》。这是一篇算法类的文章,主要针对当前空气质量预测研究中预测精度低、效率低、缺失时间因素等问题,从时间角度提出了一种简单的空气质量预测方法——LSTM神经网络模型,使用MAPE,RMSE,R,IA和MAE等指标检测LSTM神经网络与对比模型的预测性能。实验结果表明,LSTM神经网络可以适应多个变量或多输入的时间序列预测问题,具有预测精度高、速度快和鲁棒性较强等优点,使用LSTM神经网络进行空气质量预测可以有效提高预测的准确性。
第2篇是周万珍等撰写的综述性文章《推荐系统研究综述》,对传统的推荐方法和当前深度学习技术中神经网络在推荐方法上的应用进行了归纳。传统的推荐方法分为3类:1)基于内容的推荐方法;2)协同过滤的推荐方法;3)混合推荐方法。基于深度学习的推荐方法依据神经网络的类别主要分为4类:1)基于深度神经网络(DNN)的推荐方法;2)基于卷积神经网络(CNN)的推荐方法;3)基于循环神经网络(RNN)和长短期记忆神经网络(LSTM)的推荐方法;4)基于图神经网络(GNN)的推荐方法。研究表明,将深度学习技术应用到推荐领域,构成的推荐模型具有较多优势。在推荐领域中融入深度学习技术,可以解决传统推荐方法中存在的问题,提高推荐质量。
第3篇是瞿英等撰写的《基于文本分析的软件项目风险研究演化脉络解析》。软件项目风险管理是软件项目管理中的重点问题之一,随着软件行业的发展,软件项目风险也呈现出新的特点,风险管理内容也产生了新的变化。为了追踪软件项目风险管理研究的脉络和发展趋势,此篇论文以CNKI及ScienceDirect数据库为数据基础,运用爬虫技术,获取了国内外软件项目风险相关文献2 092篇,利用分词技术方法,对文献作者、摘要等内容进行了词频分析,挖掘研究主体的空间分布情况,梳理出软件项目风险概念界定、研究阶段、研究方法等方面的演化进程。通过对文献主题进行分析,梳理出软件项目风险研究将面临以下新挑战:一是“新风险”对风险识别过程带来的挑战;二是风险管理从静态到动态转变的挑战;三是风险知识库构建的挑战。这些探索将为软件项目风险防控、提升软件项目成功率提供新的解决思路。
主持人简介
许云峰,男,1980年出生,河北盐山县人,河北科技大学信息科学与工程学院副教授,硕士生导师。主要研究方向:社区发现、机器学习等。参研近30项横纵向课题,主持多项河北省科技厅和河北省教育厅研究项目,參研国家自然科学基金项目2项。在国内外公开刊物发表学术论文20余篇,其中SCI 2区及3区论文3篇,被EI收录12篇,论文被引用200多次。