基于球衣和号码的球员身份识别
2014-05-08肖仁锋
肖仁锋
(济南职业学院 计算机系,山东 济南 250103)
基于图像处理的球员身份识别是当前的研究热点之一。文献[1]介绍了发现和识别球员号码的方法。作者利用HSV颜色空间来分离球队的球衣,然后分离号码并识别。文献[2]首先通过图像分割方法提取球员球衣上的号码区域,利用内部轮廓检测对号码定位,然后对提取出的号码采用基于概率统计的贝叶斯分类器进行识别,取得了较好的效果。
笔者研究了利用视觉特征来确定比赛中球员身份的可能性。首先利用MAP检测方法分割球衣区域,然后利用OCR方法识别号码。系统的输入为比赛照片和球队球衣的先验知识,输出为带有球员名字的原输入照片。
1 球衣识别
在需要识别球员的比赛中,比赛的双方球队有四种可能出现的球衣颜色(每队有主场和客场两种球衣)。根据初步判断,在篮球球衣中球衣颜色为单色,没有条纹或者广告,因此尝试找出能够确定照片中球衣的RGB颜色范围。一种简单的算法是遍历每个像素,并且判断该像素的RGB值是否落入相应的取值范围。如果RGB颜色值中的所有三个值都在区间范围之外,则该像素的RGB值被设为0,来表示该像素不属于球衣。但是由于拍摄角度以及光照等问题,该方法成功率太低不能保证球衣识别效率。
针对这一问题,本文提出MAP(Maximum a posteriori probability)检测器方法。首先,对每种球衣,提供不同光照、不同视角下的照片,手工标出照片中球衣的范围,利用照片和手工标记的范围来训练MAP检测器。然后运用训练出的MAP检测器来进行球衣检测。图1为检测效果(球衣部分为白色,其他部分为黑色)。
图1 球衣检测结果
由于观众及复杂背景中颜色相似性等原因,MAP算法还有一定的误检率。为了进一步提高检测效率,在MAP检测结果基础上利用区域的性质来进行进一步判断。通过篮球常识可知,每一个球队只允许五名球员在球场上,利用这个逻辑,查找最大的5个区域,然后消除其他部分,即可消除背景中观众人群等带来的误检。
当球场上拍到的球员少于5个时,算法通过一些附加的处理来去除额外的区域。在比赛录像中,可以确定球衣在整个图像中的大致的比例范围。因此可以首先去除那些在整个图像中占区域小于某一百分比的区域,比如2%。此外球衣号码的高宽比也有一定的比例(算法中设定高宽比大于1)。通过这一限定可以去除球队标志等容易错误判断的区域。
2 号码识别
在获得球衣范围之后,该范围中只有球衣和号码以及球队标志(球队标志可用高宽比去除)。此时将该区域进行二值化即可将数字提取出来,然后通过球衣上的数字来识别球员(如图2)。目前常用的方法为模版匹配法。即为每位球员(号码)建立一个模板。利用模板来对号码区域进行卷积。取匹配最大值为识别结果。但由于号码的角度,轻微的变形及球衣折叠等问题导致模版匹配法效率不高。
本文采用OCR方法来检测号码[3]。OCR算法分析每一个字符并且计算该字符与模板之间的相互关系,选取最大值为匹配结果。在球员号码识别中,并不需要OCR识别所有的号码,仅仅需要区分五个可能的号码。这样可以避免一些字符的混淆。同时,对两个数字组成的号码,采用两个平行的OCR来检测球衣的号码。以湖人队为例,湖人的五个先发球员的号码“7”,“15”,“16”,“17”和“24”。因此球员号码的第一个字母可能是1或者2。第二个号码可能是4,5,6或者7。基于这样的先验知识,运行两个并行的OCR,针对第一个数字建立一个OCR(仅仅识别1和2),然后另一个OCR识别第二个数字(4,5,6,7),最后取两个OCR的结果组合来完成最终的号码的估计。
在获得球衣号码的识别结果之后,如果算法得到一个不能匹配的号码,那么用一些针对球队的特定的逻辑分析来矫正识别结果。例如球队中仅仅有一位球员有单数字的球衣号码。则可确定任意单数字的球衣号码都归属于该球员。另外的四个球衣号码是24,15,16和17,也可仅仅通过第二个数字来识别号码。
得到每个球衣的号码之后,通过算法在球员号码的下方输出该球员的名字,结果如图3。
图2 球衣区域
图3 球员识别结果
3 结论
本文主要研究利用照片来检测和识别NBA比赛中球员的可能性。尽管将目标缩小到一个球队,但这不影响研究结果。最后的实验结果证明了算法的有效性。
[1] M Saric,H Dujmic,V Papic,N Rozic.Player number localization and recognition in soccer video using HSV color space and internal contours[J].World Academy of Science,Engineering and Technology,2008,43.
[2] 徐晓煜,黄欢,杨小娜,等.比赛视频中球员号码的定位与识别[J].郑州轻工业学院学报(自然科学版),2012,27(6):82-85.
[3] 王改芬.用C#识别图像中的文字[J].计算机时代,2011(7):50-51.