APP下载

高鑫:构建尖端机器学习模型的科学家

2023-12-29知之

知音海外版(上半月) 2023年10期

天津,这个历史悠久、活力满满的城市,不仅孕育了众多杰出的人才,还见证了无数年轻人的奋斗与成长。其中,高鑫——一位出生在天津的应用科学家,就在人工智能领域展现了创新精神和卓越才华,她的学术与研究经历铸就了她的成功之路。

从数学竞赛到机器学习

高鑫的学术之路在童年时期就埋下了伏笔。早自小学时,她就展现出了卓越的计算才能,获得了全国珠心算等级考试能手四级资格证,并夺得了海峡两岸珠心算大赛的优胜奖。

高鑫并未满足于此,她积极参加各类数学竞赛,屡获殊荣。高考后,成绩优异的她,毫无悬念地被南开大学录取,就读全校最具挑战性的专业——信息安全与法学双学位试点班。在这里,她不仅需要学习复杂的编程知识,还要掌握法学知识。面对挑战,她满怀热情,坚定地前行。

同时,高鑫积极参与实验室研究,在南开大学本科科研创新百项工程中与同学合作,应用三维建模技术,提出了一种基于2D头部图像的3D重构方法。她运用3D渲染技术增强了头部模型的逼真度和立体感,使其能够进行360°展示。这项技术在刑侦、饰物佩戴、发型选择等领域具有潜在应用前景。

2012年,高鑫获得了美国新泽西理工学院的全额助教奖学金,前往该大学攻读计算机科学博士学位。在这个阶段,高鑫专注于人工智能、机器学习和深度学习等领域,掌握了数据挖掘、数据处理与分析、人工智能模型构建等多项技能。

在攻读博士学位的初期,高鑫以她在算法设计方面的优势,致力于研究各种算法应用。她探索了无线传感器网络(WSNs)入侵者检测和异构传感器网络在户外环境监视中的应用,解决了两个重要问题:首先,她与算法实验室的研究员共同提出了二维k-屏障覆盖模型,旨在减少传感器节点数量,通过传感器的本地邻居信息来建立覆盖,以实现低检测延迟和低能耗的目标。其次,为了克服户外环境对传感器节点的不利影响,她们设计了一种异构传感器网络,其中传感器节点具备不同的环境适应性。她们提出了自适应贪心调度算法,通过调度这些传感器节点,以在不同的环境条件下尽可能长时间地监视关键位置,以最小化和平衡网络能耗。

高鑫逐渐认识到,要在研究中取得更大成就,机器学习模型的应用是不可或缺的。她深刻理解到机器学习和人工智能不仅仅局限模式识别和机器人设计,还可广泛应用于不同系统和领域。她积极学习机器学习知识,研究尚未解决的问题,通过数据采集、处理、模型构建和优化,不断解决现实问题。

高鑫还认识到,将机器学习应用于交通领域可以有效解决许多亟待解决的问题,比如提高交通效率、避免拥堵,提升驾驶员和乘客的安全,等等。因此,她在新泽西理工学院进行了积极的研究。

高鑫研究了自动导航系统,该系统通过分析用户的当前位置和历史轨迹数据,来自动预测用户未来可能的目的地和路线,无须用户干预。这种导航系统可以大大减少用户的操作次数,特别是在行走或驾驶时,降低了潜在的危险性。

此外,高鑫还关注了交通安全领域的分心驾驶问题。她设计了一款iPhone应用程序,通过检测用户的驾驶行为来锁定智能手机屏幕,以减少分心驾驶。这个应用程序使用机器学习的决策树算法检测用户的交通模式,以提高道路安全,减少事故风险。此外,她的应用程序可以在后台运行,这样更加节省能源,有助于延长智能手机的电池寿命。

凭借以上研究成果,高鑫获得了HERE地图公司的实习机会。HERE地图公司是一家全球领先的地理信息技术和地图服务提供商,专注于收集、整理和更新世界各地的地理数据,为导航、自动驾驶、智能交通管理和位置服务等领域提供高度准确的地图和位置智能解决方案。

在实习期间,高鑫的研究主要集中在交通拥堵预测和云端交通控制系统方面。通过分析交通信号的相位和定时数据,以及车辆通过交叉口的探针数据,她和团队成员开发了一个机器学习模型,用于预测交通拥堵。该模型能够计算通过交通信号灯的车辆数量、停留在或无法通过信号灯的车辆数量,并基于这些数据来预测交通拥堵程度。此外,她和团队成员还提出了一种基于云的交通控制系统,将数据实时发送到云端进行分析,以确定交通信号灯的修正信号相位和定时,从而控制道路几何形状网络的交通灯。这两项研究成果以HERE地图公司名义申请了专利,并在美国、中国和欧洲等地获得了授权。它们已成功应用于HERE地图公司的业务,显著提升了交通拥堵预测的准确性和交通控制的效率。

这项工作对于解决城市交通拥堵问题具有重要意义,不仅提高了出行体验,还减少了环境污染和交通事故的风险。这些研究有望在未来为城市交通管理和出行提供更多创新的解决方案。

科研成果工业化

高鑫的博士研究主要集中在机器学习和深度学习在基因组学领域的应用,并在这个方向取得了巨大成功。高鑫的研究团队一直专注于利用最先进的计算技术来解析大规模基因组数据,并帮助解决尚未完全理解的生物学问题。

高鑫的研究着重于深度学习在识别各种基因组序列模式方面的性能。与传统机器学习方法相比,她的深度学习方法可以直接应用于原始序列数据,无须复杂的特征工程。通过对模拟数据和真实基因组序列数据进行广泛实验,她还提出了新的深度学习模型来解决多聚腺苷酸位点预测和tRNA基因检测等具体问题。

第一个是多聚腺苷酸位点的预测,它在真核生物中起着重要的调控作用,尤其是在mRNA的转录、定位和翻译中。她们提出了一个名为DeepPolyA的深度卷积神经网络方法,用于准确地预测拟南芥基因组序列中的多聚腺苷酸位点。第二个是转运RNA基因的检测和功能预测,这些基因在蛋白质翻译中扮演关键角色。尽管有一种广泛使用的工具叫作tRNAscan-SE,可以用于识别基因组中编码的tRNA基因,但它在区分tRNA和伪tRNA方面效果有限,可能会输出大量虚假阳性结果。为此,她提出了一种混合卷积神经网络和循环神经网络方法,名为tRNA-DL,它能显著降低虚假阳性率,为tRNA注释提供了更可靠的工具。这些模式的发现对于理解基因的功能和变异以及医学研究具有重要意义。

目前,高鑫的DeepPolyA论文已被广泛引用,并被认为是多聚腺苷酸位点预测领域的先驱和当时最先进的模型。时至今日,DeepPolyA论文中提到的深度学习模型还被作为基准模型,用于帮助检测多聚腺苷酸位点预测的精准度。高鑫的研究对于理解基因组序列的重要模式具有重要意义,在基因组学研究、医学诊断、药物开发和疾病治疗等领域具有广阔的应用前景,有望推动生物医学领域的发展。

未来,高鑫还计划继续扩展她的研究范围,包括在自然语言处理领域挖掘更多序列模式,提高预测精确度,减少虚假信息的生成。她还将继续努力推动机器学习的应用研究,为科学社区作出贡献。

高鑫的研究不仅在学术界受到高度评价,还在工业界产生了深远的影响。她的研究和贡献为人工智能领域的发展提供了有力支持,为改善人类生活质量和解决实际问题作出了积极贡献。她致力于将人工智能技术与社会和人类的进步相结合,为社会带来积极的变革。

目前,高鑫在亚马逊公司担任应用科学家职位,继续在计算机科学和人工智能领域进行研究和应用。她的研究重点是将最先进的人工智能技术应用于解决实际问题,并与团队一起探索新的模型和解决方案。

在亚马逊的MachineLearningUniversity组里,她既从事教学工作,又积极参与研究项目。通过教学,她能够与来自世界各地的同事互动,分享机器学习知识,并借此机会深入了解不同领域的专业知识。与同事一起工作也激发了她更深入地研究机器学习模型和算法,以解决实际问题的动力。

目前,高鑫和团队成员一起研究并合作发表两篇论文,分别涉及动物收容和心理健康。在心理健康领域,她的研究旨在通过分析大量的心理健康研究论文,识别该领域的总体趋势和高影响力研究主题。这项研究有助于了解心理健康领域的发展趋势和不同心理特征之间的关联。而在动物收容方面的研究则关注了动物福祉和收容所运营的问题,旨在提高动物领养机会,同时提高收容所效率。

尽管这两个研究领域看似不同,但都与社会福祉相关。通过研究和数据分析,高鑫努力找到改善动物福祉和心理健康支持的方法,这不仅具有学术意义,还对社会和人们的生活产生了积极影响。

高鑫的一系列科研工作,体现了人工智能在解决现实问题中的潜力,为社会的不同领域带来了创新和改进。让我们祝愿她的科研道路越走越宽!

编辑/朱艳君