除了球霸麦霸,还有“绿坝”
2009-10-30旺旺
旺 旺
我只听说过堵不如疏,从没听说过,有哪款软件可以成功过滤非法、暴力、色情等信息,而不会影响用户的正常使用。“绿坝”就是这样一个有趣而简单粗糙的软件,且看本刊记者的试用报告。
在中国,什么软件会让政府每年掏出四千七百万元购买,并且免费给你用?
OUT了吧,这就是传说中的“绿坝——花季护航”。从2009年7月1日起,所有在国内销售的品牌电脑都需要预装该软件,多个政府部门要求各地中小学务必安装该软件,连家电下乡中标的电脑也要安装。毫无疑问,“绿坝”将成为有史以来普及速度最快的正版软件。
网友感激绿坝集齐了成人网站
我下载测试的是绿坝护航家庭版3.17。你不能选择安装路径,当安装完成后,所有的程序和文件,会分布在windows、system32、drivrs等文件目录下,大约有110个文件。
此时打开任务管理器,可以在进程里看到XDaemon.exe、XNet2.exe、和gn.exe三个新增程序,据网友们的测试,这三个程序用于相互保护,防止被删掉和结束进程。与此类似,绿坝并不能通过控制面板进行删除,而只能通过密码验证后在系统设置里进行删除,用心颇深啊。
之所以将程序及文件放在多个文件夹内,也是基于同样的考虑。因为绿坝的基本工作原理是这样的,当你操作计算机时,你的所作所为都会被收集起来,然后发送至一系列数据库进行过滤,其中有良好URL(网址)数据库,不良URL数据库和关键字数据库,如果没有通过,屏幕上就会出现“此信息不良!将被过滤”的谈话框,然后关闭你正在操作的程序。
所有不良URL都被绿坝写入不同的dat文件,让你不能轻易找到和修改。遗憾的是,绿坝刚刚公布,就有网民将这些数据库破解并公之于众,根据公布的结果,不良URL数据库被分为vgamfil.dat(暴力游戏类)、gnfil.dat (枪支类)、imgfil.dat(图片类)、adwapp.dat(成人色情类严格)、adwfil.dat(成人色情类)、lgwfil.dat (同性恋类)和 iawfil.dat(非法类)等等。
讽刺的是,两个色情类列表拥有4000多个各类黄色网站,不少网民竟然因此很感谢绿坝,说有史以来还没有哪位好心人收集过这么齐的成人网站,现在都给绿坝整理好了。唉,这两个开发商也太不争气了,软件诞生还不到一天,数据库就被人破解了。
如果说不良URL是第一道防线,那么关键字库则是第二道防线。据发现,绿坝拥有HncEng.exe、HncEngPS.dll、SentenceObj.dll三个文字过滤引擎,这些引擎根据语句处理算法来判断内容是否被禁,当然这个算法是在其编制的黑名单条目基础上运行的,这个黑名单(HNCLIB/FalunWord.lib)也被网络高手所破解,里面包含着各类敏感词汇,以及猥亵类词语,甚至连水乳交融这类成语也不放过。想必小学生写作文用不到这么高级的词汇吧。
不过,这些关键词单独出现并不会引起绿坝警觉,只有输入多个以后,应用程序才会被关闭,在测试中我发现,绿坝目前检测的重点是浏览器,向IE、Chrome和Firefox输入多个违禁词,都会被绿坝自动关闭。此外,在记事本和word上输入多个违禁词,也会发生一样的效果。而向MSN和QQ输入,则没有任何效果,这说明绿坝控制范围还是有限。
说到我们最关心的防护色情内容方面,绿坝效果一般。当你输入什么“一夜情交友网站”、“一夜情交友论坛”时,电脑一点反应也没有。而当非法网站及破解程序一出现,就直接会被绿坝Kill掉。而网上公布的破解字库也表明,色情类词语只占关键字库的15%,剩下的几乎全是政治、暴力等词语。如果情形属真,那么对一个主要防护色情信息的监护软件来说,这样做未免有点本末倒置。
机器猫通过,加菲猫留下
当然,除了文字过滤,绿坝还拥有图片过滤技术。据密歇根大学计算机科学及工程学院三位研究者的测试,绿坝图片过滤程序中的代码库和配置文件,都来源于一个称为OpenCV的开源图像识别软件。
简单说,OpenCV就是通过图片颜色来甄别色情图片。这个技术首先从待检图像队列中获取图像数据,先归一化图像尺寸,然后分离肤色区域和非肤色区域,在对肤色区域关系进行分析后去除干扰,最后提取区域特征送入分类器,而分类器将按照编好的计算法则进行判断。
举个例子,一个穿着比基尼的美女躺在沙发上的图片,进入检测后会被转换成灰色图像,然后消除非肤色部分,此时,整个图片只剩下袒露的大腿、小腹、手臂和脸部等区域,然后程序会计算这些区域最大面积是多少,从一块区域重心到另一块区域重心的距离是多少等等。所以身体裸露部位多,被当成色情图片的可能性也就越大。而当图像被定为可疑图片后会被送入人脸检测器,若人脸不是主要部分便确定为色情图像。
但这套算法的主要问题是,色情图像的识别严重依赖于肤色和肤色形状;而最后使用人脸检测加权判定的办法,也缺乏可靠性的验证。在面临大块黄色区域时,绿坝会特别敏感,而如果是黑色或红色肤色的裸体图像,程序识别的成功率就很低了。所以,才会出现相近姿势的蓝白色机器猫和红白色Kitty猫能够顺利过关,而部分黄色加菲猫的图片则被过滤的现象。
我在测试中也常常碰到,绿坝因为分不清人物的大头照和艺术照,部分婴儿的裸体照、微笑的猫等图片而误杀的情况。当一个网页有五张图片被判定为色情图片后,该网站会被自动放入黑名单,你下一次再访问时,绿坝就会启动防护程序直接将浏览器关掉。
而一旦发生误杀,或者该屏蔽的网站没屏蔽,那该怎么办呢?绿坝早在安装协议中苍白地表达过不负责任的态度了。所以,你在写文档或制作PPT时,如果涉及重要商务活动,最好先删除绿坝,以避免因为误判而不能保存或发不出去而造成的经济损失。
有趣的是,绿坝由于没有视频过滤技术,所以其无法过滤网页视频中的不良信息。在测试过程中,我尝试了四五个“激情聊天室”,毫无例外全部成功登录,而没有引起绿坝警觉。同样,成人影片也不在隔离之列。
给黑客留后门?
绿坝的问题还不止于此。从它诞生的第一天起,各路研究人员以及技术达人都对其安全性表示担忧。密歇根大学对绿坝研究的重点就是安全性。据其报告说,绿坝存在着两个较大的安全隐患:一个是网页过滤缺陷,一个是黑名单升级缺陷。
说得直接点,计算机程序都是通过内存来执行,所有命令都会保存在内存的某个区域中,执行时按顺序进行。这个保存有命令的区域就叫缓冲区,当一个超长的数据进入到缓冲区时,超出部分就会被转到其他缓冲区,此时,这个缓冲区存放的数据、指令或者其他程序的输出内容,都可能被这个超出部分所覆盖或者破坏掉。
按照密歇根大学的报告,绿坝在运行和升级过程中,就会弄出这些超长数据,导致缓冲区出现漏洞。该报告在6月12日推出当天,国内病毒软件厂商江民和奇虎360均公开表示绿坝确实存在着报告所说的漏洞。有安全专家还说,黑客能利用这些漏洞制作木马病毒当用户访问黑客精心制作的恶意网页时,电脑将自动开启木马病毒,从而面临网游、网银账户失窃、个人隐私被盗等多重风险。
正如绿坝开发公司的某高层已坦言,其安全性确实比较薄弱,“我们开发的时候,主要考虑的是过滤的功能,对于安全性考虑不多,这确实是绿坝需要提高的地方,今后的版本会有改进。”