APP下载

基于IOS平台的移动搜课宝系统设计

2018-07-13异,赵

软件 2018年6期
关键词:网页学习者模块

刘 异,赵 辉

(1. 南昌铁路局干部学校,信息教研室,江苏 南昌 330002;2. 中南大学 信息与网络中心,湖南 长沙 410083)

0 引言

全球WWW网站总数量庞大,为全球数以几十亿计的网民提供各种服务。截至2016年底,我国基于互联网的电子商务市场总额已经突破 300000亿人民币。2017年我国手机网民规模达7.39亿,网民使用手机上网比例逐年攀升。互联网技术在我国的迅速发展,使人们更多依赖互联网来获取信息。

目前在人们的日常生活中,搜索引擎占互联网应用的地位举足轻重。《全球互联网统计信息跟踪报告》中指出,“搜索引擎网站是目前所有网站类型中发展最快的网站”。另据该报告显示,今后中国搜索引擎将呈现若干新的发展趋势,垂直搜索获得迅速发展,成为重要的发展方向。垂直搜索引擎在细分行业及专业领域的全面应用与深入挖掘,通过进一步整合信息内容,带来大量的用户流量与广告机会。

1 国内外技术现状

当今社会,视频信息占互联网多媒体信息很大比例,视频搜索用户规模的增长速度远远高于传统搜索用户规模的增长速度,预计未来三年将会保持年均 100%以上的增长率。虽然 Google、YouTube和优酷等纷纷推出了各自的视频搜索服务,但大多基于固定的 PC机关键词查询模式。这种查询视频的方式代价大而且返回的结果存在歧义。例如,用户提交“苹果”关键词时,系统可能返回多个与“苹果”相关的搜索结果,如iMac电脑、iPad平板、iPhone手机及水果等。而面向生活类的垂直搜索引擎(如搜房网,www.fang.com)和面向商业领域的垂直搜索引擎(如ebay,www.ebay.com)等,已成为未来互联网搜索领域研究的新热点。

用户在使用关键词搜索传统视频信息时,查询视频帧是对帧图像进行编号和注释,一般使用描述性的文字或数字给帧图像加上注释,再用搜索引擎检索匹配相应的注释,这就是基于注释的查询。[1]这种查询的方法虽然简单,但经常不能精确检索到海量视频信息。这是因为用人工方式对海量视频数据进行标注,工作量极大并且效率很低,视频内容片段仅靠文字标签简单地表达意思会以偏概全。同时,受各体差异性影响,不同的用户使用不同的描述标注信息,基于内容的查询于是应运而生。用户无需对视频片段进行人工标注,只需通过提取底层视觉或听觉等特征进行相似性检索。

随着移动 4G互联网的迅猛发展和网购课程规模的不断扩大,越来越多的商家把课程“搬到”互联网上,课程以虚拟电子文件的形式存在更有利于授课者向学习者随时随地传播知识,省去了学习者去实体学校学习来回路上耽误的时间,也公平照顾了学习者家离学校距离远近不一的问题;随着各大酒店、咖啡屋、快餐店、商场、公交车等免费Wi-Fi服务设施的提供,这些学习场所不仅环境优雅还免费提供高雅舒缓的音乐,使越来越多的学习者转变了去传统学校学习的观念,逐渐接受了这种新潮的学习方式,而移动搜课宝能让学习者在新型学习场所更便捷地搜索到课程资源,每天学习一小节课程,给学习者的大脑快速充电补充知识能量,特别是那些上班族和家庭主妇在每天忙碌之后,还想继续学习可是抽不出时间来,而课程培训机构大多都在难找的写字楼上,写字楼昂贵的租金增加了培训机构的经济负担,培训资讯的最新传播力度不给力,不易于学习者及时了解到相关课程,开课时间往往因为错过最佳的学习机会只能再次等待。移动搜课宝平台让培训资讯更便捷地发布到互联网平台上,学习者可以同时选择网络学习和实体学习,学习者的受益面是广泛的,不同行业不同年龄的社会人群均可以加入到学习者的行列中来。

当今社会处于知识大爆炸时代,知识改变命运,知识缔造传奇,学习是终身性质的,人们的大脑如果不学习时间久了就会生锈,这很直观地说明了学习的重要性。互联网凝聚了全球整个地球村的海量多媒体课程资源,网络视频课程让学习者在家里也能接受跟学校一样的教育,不久的将来“家庭学校”一定会像“家庭办公”一样普及。随着不同的劳动力在社会化分工程度的不断细分,人们已不满足从通用搜索引擎(如 Google、Baidu等)获得结果,而是产生了面向企业需求的垂直搜索网站,本平台主要研究的是面向课程视频资源的搜索,创新之处在于使用拍照搜索课程。现代社会的不断发展使人们的移动性日益增强,无论是小孩还是老人人手至少一部手机,可见手机在当今社会的普及率有多高,随着人们对信息需求量的不断增长,人们可以轻松通过搜索引擎查询到所需信息,上网搜一下,你就知道。为了提供给人们更优质的服务,关键是找到适合移动手机环境下的搜索技术。4G的普及和5G的出现,使手机、PDA等移动终端通信设备传输数据带宽、传输质量得以进一步提高,能满足高速带宽应用的需求。

作为垂直搜索的主要应用之一,近年来,移动商务搜索引擎得以迅速发展。人们已不满足通过查看课程的文字和图片信息了解到所要购买的课程。课程视频试看已逐渐成为人们全方位了解课程的重要途径。某些网上商城营销课程时也会推出课程试看。因此,基于移动手机的课程视频检索将成为可能。这种移动搜索技术基于IOS平台,通过PDA、移动手机登录移动通信终端环境,以微信、微博、QQ、手机浏览器等方式接入移动通信,来获取信息。[2]移动搜课宝平台不仅可以方便同城以及异地的学习者快速找到附近感兴趣的课程教学点,还可以自己录制课程视频发布到网上课程商城平台,经管理员审核通过后课程发布者就可以售卖该网络课程。用户可以上传课程缩略图参加搜课平台的优秀课程评比比赛,用户通过注册搜课平台软件账号就可以对喜欢的用户进行投票或者直接使用自己的IP地址进行匿名投票。移动搜课宝平台的注册商户可以随时发布培训课程开课信息、课程视频试看以及介绍实体培训机构学习环境的宣传片以供学习者查阅、购买课程。

在线投票系统包括前台用户界面和后台数据库管理系统。用户进入前台用户界面(留言板、投票、新闻中心)进行选择项目,判断选择选项是单选模式还是多选模式,查看投票权限是否限制用户IP地址,不限制可以直接投票;若限制用户IP地址,系统先检测用户IP地址,使用用户通行证进行第一次投票,检测系统允许投票时间,时间不允许,弹出已投过票的对话框,时间允许,可以再次进行投票,例如投票时间间隔为1天,那么今天投过票以后就不能继续投了,只能明天登录继续投票支持,这样就避免了同一IP地址用户刷票的嫌疑,也不至于使系统访问流量过大而引发系统崩溃。

前台投票用户界面和后台投票数据库管理流程图如图1所示。经过系统统一身份认证以后,客户直接提交课程信息,管理员则管理投票课程,进行更新、管理系统配置、管理选项操作,管理系统配置具有编辑、删除功能,管理选项具有删除、更新、

添加功能。其中,删除子选项用于系统管理员审核是否有投票权,若没有投票权,则管理员删除投票课程。投票课程有截止日期,如果是过期的投票,则系统管理员一律视为作废投票无效。

图1 前台投票用户界面和后台投票数据库管理流程图Fig.1 The flow chart of the front voting user interface and the background voting database management

用户可以通过五种搜索方式搜索课程:关键词搜索、图片搜索、视频搜索、拍照搜索、录像搜索。课程的图像搜索引擎框架图如图2所示。学习者用户可以通过从其他教育资源网站上下载示例课程视频(如:VeryCD网站上有很多课程视频附带Simple示例视频),如果原课程视频的存储容量很大,学习者没有那么多的时间等待下载完成,或者学习者想搜索相关类似的自己满意的视频而不是费眼神、费精力地等待一个个很大的课程文件打包下载完成后一个个地点击播放再一个个地删除或者保留视频文件,移动搜课宝避免了学习者成为下载狂而不把时间和精力放在学习上的普遍问题。学习者只需要下载一个大小不超过几十MB的示例课程视频(使用IE8.0以上浏览器下载特别方便)或者上传任何自己满意的课程短视频至移动搜课宝进行在线课程搜索,搜到自己满意的课程便可加入购物车随时付款,商家收到付款后随时提供课程视频下载链接。这种网购模式给学习者挑选课程带来便捷的同时也会产生一些新的问题:1.如何在茫茫课程中直观了解到自己中意的课程并快速购买自己满意的课程;2.对于不同商家的同一种课程如何进行比较,这些是移动搜课宝的研究重点。随着 4G智能手机的普及,移动 4G网络最大的优势是网速快、更灵活方便,4G通信系统的速度达到10Mb/s~ 20Mb/s,最高上限是100Mb/s,4G网络终端具有更好的兼容性,能无缝对接不同的系统来回自由切换,具有全球通信漫游、开放接口、能和多个网络系统联接等特点,4G通信方便了人们的日常生活,人们可以随时随地

互相通信,实现异地同步双向上传或下载资料、图片、视频等网络数据,人们可以充分利用手机的照相功能和录像功能,结合视频搜索,随时随地购买课程。移动搜课宝通过对课程视频关键帧的自动识别,可以在海量课程视频数据中快速、准确地寻找到学习者感兴趣的课程。

2 移动搜课宝功能性系统需求分析

网上搜课怎样找到自己心中理想的课程呢?有的用户知道自己要的课程名称但是不知道课程内容。而有的用户已经了解想要的课程内容,却不知道课程名称。这就需要搜索引擎提供两种方式的搜索,一种是基于文本的搜索,另一种是基于视频内容片段的搜索。[3]基于文本的搜索是通过提交关键词进行搜索,它是利用文本描述的方式描述课程的信息,如课程的名称、录制日期、课程所在地及文件的大小等,该方式适合第一类用户的搜索需求。而基于内容的检索是对视频片段中的视觉及声音特征等进行分析和检索的技术,适合第二类用户的搜索方式。

通过运用GPRS技术,在课程搜索的同时用数学公式将网络在线课程所在的地址和用户的距离进行计算,以帮助用户定位课程,节约时间。

由于移动网络带宽以及手机内存和速度的限制,如何在移动环境下使搜索更加快捷,同时使用户获得良好的应用体验成为技术的关键。首先,根据图像的自身信息,通过在客户端进行视频序列特征的提取,并将视频序列特征信息上传到服务器端与视频特征数据库中特征信息进行相似性比较。最后将相似度大小、课程所在地及用户所在地等多种信息进行综合分析和排序,输出查询结果。这一方法避免了上传视频的大量流量损耗,节约了资源,而且提供的给予位置的搜索服务能大大提高用户的体验度。

3 移动搜课宝设计

3.1 结构设计

本系统主要实现以下功能:用户可选择不同的搜索方式进行课程搜索。如果选择基于文本的搜索,则输入关键词后,系统根据用户提交的关键词进行匹配。若用户选择基于内容的搜索方式,则当用户上传该视频或者图片后,客户端对上传的课程视频或图片进行特征提取并上传到服务器,与服务器中已提取特征的课程视频进行相似匹配,根据其相似度、课程及买家所在地的位置信息综合度量排序后返回客户端。本移动搜课宝系统的总体框架结构如图3所示。

图3 系统总体架构图Fig.3 Overall architecture diagram of the system

1. 查询模块。查询模块接收用户需要查询的课程视频和关键词,将查询请求传给检索模块进行操作。

2. 描述模块。描述模块将用户的查询要求转化为对视频内容较抽象的内容表达和描述,即通过视频分析,以一种计算机可以方便表达的数据结构建立对视频内容的描述。这个模块是建立课程视频数据库和实现课程视频检索的基础。

3. 检索匹配模块。检索是指对用户提交的查询条件与数据库中的视频对象进行相似匹配,返回结果对象。该模块首先对接收到的用户查询请求进行分析,对于文本查询直接进行搜索关键词与视频描述的匹配;对于提交的视频,则通过提取视觉特征,并与服务器端特征库中的视频特征进行相似匹配,查找出符合条件的视频集。最后向用户返回匹配结果并显示。除此之外,还需匹配课程所在地与买家所在地的空间位置,综合上述三者匹配结果进行综合排序。

4. 提取模块。提取模块包含客户端和服务器端。服务器端用于提取数据库中课程视频的特征信息,客户端用于提取客户提交的视频片段的特征信息。这样能有效减少网络数据传输及服务器开销。

3.2 功能设计

本系统主要包括数据采集、数据检索、数据显示和推送服务等功能,具体功能模块结构如图4所示。

图4 系统具体功能模块结构图Fig.4 The structure diagram of the specific function module of the system

本系统为用户提供了一个通过手机快速查找网络课程的平台。系统开发环境采用Mac OS X,开发工具采用 Xcode。系统架构采用 C/S结构,视频数据采集使用Microsoft SQL Server2005数据库。[4]本系统支持avi、wmv、3gp等视频格式的检索。

下面从数据采集、检索、显示、推送及后台管理五个模块详细介绍该移动搜课宝检索系统的实现。

(1)数据采集模块

通过对采集的网页分析,进行正则表达式匹配,解析出Deep Web中网页中课程视频的实际URL,有效地实现课程视频的自动批量下载。

信息采集方式包括人工采集和自动采集,即可以人工手动设定网址或者网页自动分析url地址。本系统数据采集模块实现采用网页机器人。网页机器人是以Web为基础的程序集合,它通过请求网站站点上的HTML网页响应后下载程序集,网页机器人依次遍历指定范围内的Web空间,不停地采集各个Web站点的子网页加入到HTML网页索引数据库。网页机器人工作时会搜索到新网页上的所有链接,为了优化网页机器人搜索操作,首先我们需要为网页机器人构建一个原始网页集,以这个原始网页集为起点,逐步搜索到全部链接,方便收集到整个范围内的Web空间网页。

(2)数据检索模块

无限查询子系统是垂直视频搜索引擎最重要的模块之一,它采用Web界面。如图5所示,用户端通过手机或 PDA等无线输入设备进行基于关键词或视频片段的无线检索。在搜索服务器进行基于混合(语义和内容)索引的查询。将查询得到的视频片段返回应用服务器,并对其结果进行基于语义的视频聚类,提高查询结果的精度。最终返回用户端。

图5 无线检索子系统框架Fig. 5 Wireless retrieval subsystem framework

本系统中视频特征数据通过文本检索关键帧的特征信息,这些关键帧的特征数据均以字符串的形式存储在数据库中,使用分隔符将每个关键帧的特征字符串分隔开来。在进行搜索时,只需读取数据库中的特征表,并通过字符串操作解析出来即可完成一系列比较操作。其他数据包括视频的路径名、视频的来源及类别等,与视频路径等信息一起存放在数据库中。

数据检索模块由查询接口和相似性匹配两个子模块组成。查询接口模块负责用户以什么样的方式输入,通常输入方式有很多种,如提交关键词、直接提交视频片段或者给定一张图片等。本系统采用例子视频查询作为用户需求的输入方式。用户可向系统提交一段待查询的实例视频。同时,在手机端对实例视频提取关键帧,并得到对应的特征向量,然后系统将示例视频与服务器端的视频特征库中的视频特征向量进行相似度匹配,得到查询结果。[5]

主界面分为四个部分,自上到下分别为搜索栏、Logo栏、广告与推送栏、快捷菜单栏。搜索栏共有三个组件:关键词输入框、录像(选择视频)搜索按钮、关键词搜索按钮。Logo栏为软件的Logo与标语。广告与推送栏则由预留广告和系统自动计算出的推送课程组成。快捷菜单栏内有快捷登录与退出按钮。

(3)数据显示模块

将视频数据库中的每个视频与Simple视频的相似度值进行相似性计算并匹配,然后把结果反馈给用户。[6]搜索结果使用两种显示方式:一种是缩略图,另一种是列表。搜索结果共分为三个部分,分别为快捷搜索栏、结果列表以及菜单栏。除了结果列表,其他与上面相同,列表项内容按照以下部分显示:左边为课程图片,右边自上而下分别为课程名称、播放课程视频、课程价格、关注订阅、课程评价、课程推荐指数及课程所在地与用户当前所在地距离。同时,该系统还可以定位课程所在的位置。这样可以方便买家进行实体学校培训。

(4)数据推送模块

视频信息个性化推送子系统如图6所示,首先由用户通过移动网络制定订阅规则及用户喜好,并存放到订阅库中。在这之前,系统将会对用户的身份进行识别。然后推送服务器根据这些制定的信息对收集视频信息的系统进行分析判断,并将符合条件的信息条目通过订阅工具推送给客户或者通过邮件系统发送Email通知客户。[7]

图6 课程信息个性化推送子系统框架Fig. 6 The framework of personalized push subsystem for curriculum information

系统个性化推送界面已经集成在主界面中。此部分的数据均为系统自动计算出的结果,系统根据当前用户的喜好推送相关课程。

(5)后台管理模块

本系统使用Web系统作为系统的管理模块,实现了随时随地无缝维护操作。[8]后台管理界面如图8所示。它分为顶部导航栏、侧边导航栏及管理面板三部分。顶部导航栏吸附了最常用的操作,可快速地实现对搜索引擎的设置管理,以及相关帮助的查询。左侧导航栏详细罗列出了所有支持的系统管理操作,通过点击这些链接即可完成整个系统的详细设置维护功能。管理面板实现了详细的子项管理功能。通过该Web在线管理系统,搜索引擎能够便捷地完成一系列的维护管理操作。

4 结语

本文主要阐述了基于IOS平台的移动搜课宝系统设计。该系统提供给用户多模态的课程视频搜索服务,并且能实现个性化课程信息制定与推送,满足用户多种需求。用户通过视频描述本身能更好地诠释课程内容,知道并了解学习者更想要哪种视频课程的需求,填补了目前国内外真正的基于内容理解的系统不多的现状。

猜你喜欢

网页学习者模块
28通道收发处理模块设计
“选修3—3”模块的复习备考
你是哪种类型的学习者
基于CSS的网页导航栏的设计
基于URL和网页类型的网页信息采集研究
汉语学习自主学习者特征初探
网页制作在英语教学中的应用
10个必知的网页设计术语
论远程学习者的归属感及其培养
集成水空中冷器的进气模块