高精度数据,为人工智能按下“加速键”
2020-10-27姜红德
姜红德
近两年来,人工智能市场继续快速增长。IDC认知/人工智能系统研究主管David Schubmehl表示,希望利用人工智能、深度学习和机器学习的供应商需要迅速采取行动,在这个新兴市场中占据一席之地。德勤在《全球人工智能发展白皮书》中预测2025年世界人工智能市场将超过6万亿美元,2017-2025年复合增长率达30%。
艾瑞报告数据显示,在政策、经济等利好消息的刺激下,中国人工智能市场异常火热。受此影响,其独特的数据需求带动了以数据清洗和标注为主的AI数据服务行业的快速发展;同样,物联网技术的发展使线下业务的数据被大量采集起来,数据量呈指数级发展;人工智能下的智能安防、智能驾驶、智能家居等应用场景的需求剧增,作为AI的底层技术支撑,AI数据服务行业尤为重要。
过去我们在谷歌上搜索一个单词或者图片,经常可能会被误导,很大一个原因就是数据质量不高。2018年初,谷歌的一款人工智能APP出现将一名亚洲男性识别为女性关键错误,最后导致了该APP下架。谷歌发言人对此表示:导致这种原因的结果是因为目前图库所存的图片不够多,历史画作无法对应现实世界的真实性。今天,在不断发展的人工智能、机器学习技术和商业模式创新基础上,AI数据服务行业对数量和质量的要求也有了显著提高。
追求AI数据质量的人工智能时代
作为人工智能的三大决定性影响因素,算法、算力和数据,在过去的几年时间里也纷纷取得了突破。机器学习、深度神经网络等算法理论的升级,让人工智能在核心技术方面取得重要进展;GPU、并行计算等异构计算及AI芯片、5G的普及,成为人工智能计算能力的重要支撑;此外,全球数据的快速增长催生AI数据产业蓬勃发展,在AI数据的加持之下,新一代人工智能的发展也成为热点。
艾瑞数据显示,2019年中小型数据供应商份额比预期缩小了20.8%,头部效应逐渐显现。随着应用端的业务复杂度增加、需求多样化,数据服务领域势必面临竞争和洗牌,AI数据领域正向着专业化、高质量的方向发展。作为人工智能的三要素之一,“数据”从本质上决定了人工智能的落地水平。通常来说,数据标注得越准确,数量越多,模型效果越好,最后的AI产品效果就越好。
9月6日,云测数据在北京服贸会上发布的“无数据不AI,云测数据服务标准发布”备受行业关注。作为数据标注行业的头部企业,云测数据代表行业首次对外展示了其一项重要成果,“云测数据项目最高交付精准度达到了99.99%”,这是目前数据标注领域可达到的最高服务标准,成为AI数据服务迈入更高质时代的一大里程碑。据了解,数据准确率=验收合格数量/全部数量。在数据标注行业发展初期,数据标注准确率只有70%-80%左右,随着行业的不断沉淀,当下整个行业数据标注准确率一般是在95%左右。
当前,中国经济发展已从高速发展时代走向高质量发展阶段,科技赋能正发挥着重要的推动力量。围绕AI数据产业的升级和发展,云测数据总经理贾宇航表示,目前人工智能行业已经从感知智能上升到认知智能,需要处理更深入的信息等能力。
作为AI数据行业由劳动密集转为技能密集的见证者和践行者,云测数据具备以下几个优势:自建数据标注基地,有对应作业类目的经验丰富数据标注人员完成作业;完善的平台体系,云测数据自研标注平台的各个标注、审核、质检环节全流程在线流转;领先的技术实力,通过工程化手段,提高标注平台的精准度和效率。为了产出更高质高效生产AI数据,云测数据在自建数据标注基地和数据场景实验室的基础上,持续对技术软硬件设施进行投入。同时建立了一整套的标准化流程、方法论和人员机制,来保证数据服务团队的专业能力,以确保输出“高质精准”的数据。
目前,云测数据拥有丰富的AI数据采集能力和精准高质的数据标注能力,具备完整的语音、图像、文本、视频的全领域数据覆盖能力,能为需求方提供专业的高质量AI数据,为需求方提供包含智能驾驶、智慧城市、智能家居、智慧金融、新零售、教育等各领域的数据采集、数据标注服务,可实现需求方构建完整AI生态的数据需求。
“新基建”背景下,高质量数据助推AI升级
2019年以来,国家层面高度重视新型基础设施建设,不断加快并完善 5G 基建、特高壓、城际高速铁路和城市轨道交通、新能源汽车充电桩、大数据中心、人工智能、工业互联网等领域的建设布局。 “新基建”不同于“铁公基”,是结合新一轮科技创新和产业变革的契机,面向国家战略转型升级提出的网络型基础设施建设,可全面促进信息技术的市场化应用,推动数字产业形成和发展,催生新产业、新业态、新模式,最终形成数字产业链和产业集群。“新基建”对传统产业进行全方位、全角度、全链条的基础改造,有利于推动产业结构优化升级,实现对经济发展的放大、叠加、倍增效果。
从传统基建到“新基建”,这一变迁反映出我国经济动力的重大转变。作为后疫情时代的最大确定性,新基建的重要方向——人工智能技术将紧密拥抱产业,推动各行各业发展迈入新征程。而高质量的AI数据之于人工智能的意义,就在于可以最大程度上提升AI产业落地的效率和稳定性,进而反向推动新基建的落地。
以人工智能+家居为例。在AI技术的加持下,家居已经迈入智能时代,达到了技术重塑、产品重塑、场景重塑与体验重塑的新高度。加上疫情推动“宅”经济发展的情况,智能家居已步入上升快车道。作为新基建的基础建设者,云测数据一直致力于推动人工智能的健康、平稳、高速的发展。云测数据总经理贾宇航也多次提到“要助力AI企业建设数据核心壁垒”。
就现阶段而言,随着人工智能和传统行业的融合不断加深,AI数据的量级以及复杂程度也将会大幅提升。云测数据作为AI数据行业的头部企业,依托于高质量AI数据交付、高效作业效率、数据隐私安全把控和技术平台实力等优势,将持续为智能安防、智能驾驶、智慧金融、智慧城市、新零售、文娱等众多AI落地领域的提供AI数据服务,持续发挥“基建”作用,为人工智能在行业落地的发展与稳定提供坚实支撑。
在高质量AI数据的助力下,人工智能技术对真实场景世界的理解将更进一步。同时,5G、IoT和VR/ AR技术的发展推动万物互联的实现,若与人工智能技术相结合,会创造出更多元的应用场景,服务于人类的生活。未来,具备底层技术创新和落地能力的企业将更受市场的重视和青睐。