基于计算机视觉的智能化建造技术研究与应用
2021-03-31房霆宸杨佳林贺洪煜
房霆宸杨佳林贺洪煜
1. 上海建工集团股份有限公司 上海 200080;2. 同济大学土木工程学院 上海 200092;3. 上海超高层建筑智能建造工程技术研究中心 上海 200080
改革开放以来,随着我国社会科技的快速发展与进步,人工智能、机器智能等智能化技术逐步进入人们的日常工作和生活,并在各行各业中逐步得到推广应用。作为人工智能、机器智能领域的重要内容,计算机视觉技术也越来越引起大家的重视。
计算机视觉是指采用计算机或电子设备终端,通过数字化的方法取代人眼,对目标对象进行识别、测量等,使之成为更适合人观察和设备检测的影像形式[1]。目前,计算机视觉是人工智能最重要与最活跃的研究领域,其核心内容主要包含图像识别、视频识别两大研究方向。机器视觉能力已经在大量单项视觉任务中超过人类视觉精度水平[2-3]。
近年来,计算机视觉在我国社会发展的各个领域中都得到了广泛的应用,给相关行业的发展也带来很多新的发展机遇和惊喜,如何在建筑工程领域中研究、应用和发展计算机视觉技术已成为业内研究和关注的热点。
1 计算机视觉应用进展
目前,在建筑工程领域中,计算机视觉技术的应用主要集中在通过摄像头或图像采集的相关装置,动态采集现状人、机、物的影像,针对建筑本体以及建筑本体以外的人员、机械、物料、环境风险要素进行监控。计算机视觉的应用对于提高建筑工程的项目管理和施工质量具有很好的辅助作用。
如何通过借鉴计算机视觉在公共安全、智慧医疗、公共交通以及工业、农业、服务业等相关领域的应用,进一步深入推广计算机视觉技术,已成为建筑领域从业人员亟待思考和解决的问题。
在公共安全领域中,计算机视觉主要应用在动态人脸识别和图像识别方面,服务于地铁机场、行政部门、公安部门和公共管理部门[4-6]。在安防领域,计算机技术能够自动识别出可疑人物和异常行为,并及时反馈给相关安全管理部门进行安全处置。通过借鉴计算机视觉在公共安全领域的应用,通过对施工现场作业人员生理、心理状态进行采集,有利于判断施工人员的安全状态,加强人员管理。
在公共交通领域中,计算机视觉主要应用在车辆检测与感知、公共交通路口感知、重要路段感知、停车场感知、车辆身份识别与对比、无人驾驶和汽车辅助驾驶6个方面。
计算机视觉在公共交通领域的广泛应用大大提升智能交通系统的感知精度与维度,让智能交通系统更加智慧。通过借鉴计算机视觉在公共交通领域的应用,对施工现场作业机械、设备的状态进行采集,有利于加强施工现场大型机械设备以及运输交通工具的管理。
在医疗领域中,计算机视觉技术主要应用在病变检测、病理图像分割、病理图像配准、病理图像建模与仿真等场景中,通过计算机视觉技术可实现多学科理论交叉融合,提升现代临床医疗水平[7]。通过借鉴计算机视觉在医疗领域的应用,可以对混凝土结构裂缝、钢结构焊缝进行无损影像检测,将大幅提高检测效率。
在工业、农业、服务业等领域中,计算机视觉同样有着广泛的应用:在工业领域中主要应用于工业产品外观、缺陷、质量等要素的检测,在农业领域中主要应用于农产品品质检测、作物识别与分级、病虫害的探测与防治等方面,在服务业领域中主要应用于智慧教育和智慧社区等方面。
通过借鉴计算机视觉在工业、农业领域的应用,对预制构件的加工及检测、木结构的无损检测等都具有很强的借鉴意义。计算机视觉在服务业领域的应用,对项目管理、现场物流管理等具有很好的指导作用,有利于加强对施工现场的项目管理。
2 计算机视觉研究与应用存在的问题
目前,关于计算机视觉在建筑工程领域的研究与应用,主要存在检测结果受光照影响大、先验知识难以演化算法、样本数据难以深度学习等问题。关于检测结果受光照影响大的问题,不同的工程对象需要在不同的施工环境中进行作业,在施工过程中的采光要求各异,而采用计算机视觉检测时,对检测产品的光源设备和产品识别率有严苛的要求,因此在施工现场环境中如何控制光照均匀性是目前一大关键问题。
关于先验知识难以演化算法问题,基于数据的方法是计算机视觉在建筑工程领域应用的关键,但由于建筑工程是一个多学科、多工种交叉的复杂领域,场景应用也复杂,故在实际操作过程中要取得广泛的样本数据较为困难,需要通过采用先验知识的方法并对样本进行训练,以提高模型识别准确性,增大预测准确率。但现阶段,基于先验知识演化和具体施工场景应用,融入机器学习和深度学习等算法是目前需要解决的关键问题之一。关于样本数据难以深度学习的问题,如施工工序作业时,在线采集和样本摆拍的离线采集是常用的样本图像数据获取方法,但该方法也存在两点缺陷:样本类别按合格率分布,缺陷品与合格品样本分布均衡性差;施工现场光照环境导致样本产品图像质量参差不齐,会干扰训练的效果。样本数据量小、不平衡已成为目前难以支撑深度学习的关键问题。
3 结语
计算机视觉技术在建筑工程领域的应用与发展趋势主要体现在多元复合监测数据融合、多场景时空效应视觉感知、跨学科多专业融合、基于大数据和智能算法的自动识别处理4个方面。
1)多元复合监测数据融合。目前,计算机视觉的输入方式主要是在可见光波长范围内捕捉到图像信息。在建筑工程领域应用集成融合的多种类型传感设备信息的计算机视觉算法,将是未来计算机视觉技术的主要研究方向。今后,以热成像、结构光成像等技术为代表的计算成像方法可有效提升建筑工程领域应用计算机视觉输入数据的维度和广度,多元复合监测数据融合将成为发展趋势,数据的融合也将使得建筑工程应用场景的感知更为精准。
2)多场景时空效应视觉感知。在建筑工程领域中应用计算机视觉技术时,往往会产生多种时间感知任务或场景应用同时进行的现象。比如在基于计算机视觉的智能巡检机器人应用场景中,物体识别、路径规划以及行为预测等任务通常需要同时完成。在目标任务中导入数据,基于多场景时空效应视觉感知理念,如何高效、准确地完成多个视觉任务,是未来计算机视觉发展的重要趋势之一。
3)跨学科多专业融合。建筑工程是一个涉及多种学科交叉融合的领域,故多学科交叉融合对于计算机视觉技术在建筑工程领域中的应用和发展具有重要作用。比如进一步引入生物视觉、智能感知、声控技术、注意力机制等新理念、新技术与计算机视觉进行融合,将极大地提升计算机视觉在建筑工程领域的研究和应用水平,以及解决工程问题的能力。以多学科交叉融合为基础的计算机视觉技术研究将成为必然趋势。
4)基于大数据和智能算法的自动识别处理。基于统计学习的大数据和模式识别算法是当今主要的计算机视觉研究手段,训练数据是其本质特征。在建筑工程领域中应用计算机视觉成功的关键是建立不同应用场景的大数据库,基于深度学习理念实现计算机视觉应用时,能够在海量的大数据中自动提取高质量、有效的特征,并通过建立的大数据库自动对比分析,融合人工智能算力算法,驱动系统主动分析识别处理,可以大幅提升计算机视觉的识别能力和解决实际工程问题的效率。