APP下载

基于dedecms的校园体育新闻网的建设

2018-07-18李晓丽

智富时代 2018年5期
关键词:数据采集

李晓丽

【摘 要】随着全民体育运动的普及,人们对体育的关注度空前高涨,但是当前大多数校园网站对于体育信息的报告不及时,而且体育信息匮乏的现象也非常普遍。本文基于对dedecms开源网站的介绍,从网站的三级架构模式到主要功能模块的分析,从网站模版的选择到体育资讯数据的采集,并加入校園赛事和选手风采栏目,完成了一个垂直类的体育校园新闻网站的开发。基于dedecms的开源性,网站在开发和以后的维护过程具有其它开发方式不可比拟的优越性,开发周期短,维护成本低且便捷。

【关键词】dedecms;数据采集;垂直网站;体育资讯

当今社会,在全民健身热潮的涌动下,体育运动越来越普及,互联网作为当今最主流的传播媒体,其宣传作用不容小觑。但是当前校园网的新闻平台基本都是综合性质的,或者发布的实时新闻比较滞后,dedecms作为开源的cms管理系统,在开发便捷性、维护简易性、采集信息同步性方便有很大的优势。本文从网站整体架构、功能分析、数据采集、模版选择、网站发布等主要方面出发,介绍了基于dedecms的校园新闻体育网的建设。网站成功上线运营后,在校学生可以实时浏览学校最近的体育动态、校园体育先锋的英姿以及经老师精心筛选采集的体育资讯,既解决了一般网站建设周期长和维护成本高的问题,又极大提高了学生信息获取的及时性。

一、基于dedecms的校园体育新闻网的整体架构

dedecms作为开源的PHP网站系统,具有易用、完善、开发简单、模版丰富等主要功能,广泛应用于中小型企业、政府机关、教育机构、媒体机构、行业网站、淘宝客网站等,本文中的校园体育新闻网以dedecms为基础,采用三层架构模式,将界面层、业务逻辑层、数据访问层进行分离。其中界面层主要完成网站的静态页面,dedecms采用伪静态,首页、栏目页以及文章详情页面都是动态生成,每次更新系统都在相应的目录下生成静态html文件,文件相当于缓存到本地,大大加快了访问速度;业务逻辑层是dedecms的核心程序,主要包含函数库、数据库的相关操作、各个内容模型的管理,新增模块管理,用户通过前台浏览相应的文章或者进行留言和评价操作时,都会触发相应的业务逻辑层函数;dedecms采用的是mysql数据库,管理员可以通过phpmyadmin进行数据库的页面化管理,同时dedecms也提供数据库的备份和恢复功能,在网站的迁移和恢复方面具有很大的优势。

二、主要功能模块分析

校园体育新闻网主要分类前台和后台两大模块,前台展示给用户,主要包括以下功能:

①网站首页-集中展示主推的校园体育资讯、选手风采以及实时采集的体育赛事和资讯;

②校园赛事-精选校园经典赛事,以文章、图片或者视频的形式展示,登录的学生会员可以对相应的赛事进行点评或者留言;校园赛事预报,对支持的班级或者队员进行投票等;

③选手风采-展示各个班级优秀的体育选手,并定期进行选手专访,网站定期在此栏目下发布选手专访文章;

④体育资讯-实时更新精彩体育资讯,动态发布学生感兴趣的资讯信息;

⑤体育赛事-展示汇编精彩体育赛事,根据分类和时间汇集不同的体育赛事;

⑥评价留言-网站的游客不可以进行评价、留言以及投票,会员可以对相应的资讯、赛事、选手进行评价,后台审核通过后可以在前台页面展示。

后台模块:

①栏目管理-包括栏目的添加、修改和删除,通过栏目管理动态控制导航中栏目的显示;

②文章管理-包括文章的发布、审核、更新、修改、删除、恢复等;

③图库管理-包括图片的上传、审核、修改、水印设置、删除、大小调整等;

④采集管理-包括采集节点设置、采集文章导入、配置信息导入等;

⑤模块管理-本网站后台主要对评价模块、留言模块、投票模块的信息进行审核管理;

⑥系统管理-主要包含网站基本参数的设置、系统静态文件的生成、数据库备份与恢复、系统安全设置等。

三、实时体育新闻采集与文章发布

Dedecms后台提供文章采集的功能,通过指定目标网页的链接,以及标签的开始结束位置,来采集相应的文章,采集主要流程如下:

校园体育新闻网主要采集新浪、搜狐、腾讯、网易门户网站的体育频道下最新发布的文章,以新浪体育频道为例,采集中国男篮子栏目下的热门推荐文章,主要步骤为:

1、增加新节点及设置节点名称:需要采集的是文章,因此内容模型选择普通文章;节点名称可以自定义,最好和采集文章相关,如新浪体育-中国男篮;

2、设置目标页面编码:为了防止采集的文章出现乱码,需设置目标页面编码,可以通过查看目标页面的源代码来确定其编码,一般为utf-8或者gb2312,在源代码中的meta标签charset属性中定义,新浪的页面编码为utf-8;

3、设置引用网址:引用网址为需要采集的文章列表页面中某个文章的详情页面;

4、设置列表网站获取规则:列表网站的获取规则包含三个,批量获取、手工指定和RSS中获取;如果需要采集的数据量非常大,推荐采用批量获取;

5、设置文章网址匹配规则:匹配规则设置的目的是来获取列表文章的所有链接,通过查找包含文章网址区域的开始html标签和区域结束的html标签,系统自动进行相应范围内的网站抓取,如果相应范围内有需要筛选的标签,可以使用正则表达式进行再次筛选;通过页面文章列表位置的文字,到源代码中先查找到大致的区块,然后在对标签的唯一性进行检验,最后找出开始和结束的标签,分别为

[内容]

7、设置文章内容匹配规則及过滤规则:通过指定开始和结束标签,筛选出文章正文的内容,既要保证不含多余的内容,又要确保文章全部包含;通过过滤规则的设置,避免采集到多余的就js代码、框架元素、或者非成对的标签等;

所有设置完成后保存并开始测试,可以查看文章的正文的采集效果,通过观察采集的内容进行细微的调整,对某些词语或者标签进行简单的替换;

8、文章采集并导入相应分类:采集规则设置完成后即可进行文章采集,采集的速度与网速以及设置的标签相关,采集完成后查看已下载,可以看到采集到的相应文章;通过数据导入,可以将相应采集节点采集到的文章导入到指定的栏目下,导入的过程中可以进行每批导入条数的设置,至此文章采集并导入完成。网站前台页面开发时,可以通过指定分类id来获取最新采集的文章。

四、模版选择与安装

基于dedecms进行网站开发,所有的模版文件都存放在网站根目录的templets文件夹中,默认情况下,网站使用的是default模版,开发者既可以重新开发模板也可以使用dedecms现成的模板。结合校园体育新闻网的需求以及开发周期,采用从网上下载合适布局及风格的模板,并通过PS或者FW软件进行主要图片和logo的处理。第三方模版的安装步骤为:

1、检验模版文件夹的合理性:dedecms的模版文件要符合一定的命名规则,网上下载的模板要符合规则才能正常调用,如所有的图片文件存于images文件夹中,css文件存于style文件中,首页模版文件为index.htm,文章详情页面的模版文件为article_article.htm等;

2、模版文件夹的导入:将下载好的模版重命名为sport放入网站根目录的templets文件夹中;

3、后台参数修改:进入网站后台,在系统基本参数中修改模板默认风格为sport,更新主页html并修改主页模版。

4、主要模块代码修改:网上下载的模版对于文章或者图片的获取有一定的局限性,需要通过dedecms标签来进行相应的调整,并通过对后台的数据相对应,来获取合适的数据。例如首页的图片轮播模块,网上下载的模板中用的是flash轮播,flash对于浏览器具有局限性,本文通过调用第三方的轮播代码,并通过dedecms的文章列表标签来获取具有轮播和推荐属性的文章显示到首页,代码如下:

{dede:arclist row='6' flag='f,a'}

[field:title/]

{/dede:arclist}

五、网站发布与上线运营

Dedecms需要在php环境下运行,本网站使用phpstudy集成环境,其中服务器为apache,数据库为mysql,环境配置成功后,将源网站复制到www根目录下,运行dedecms安装程序,安装完成后进入网站后台进行数据库的恢复,数据恢复完成后再次检查网站的模版及属性设置是否正确,全部就绪后基于dedecms的校园体育新闻网开发完成,管理员通过后台发布相应栏目的文章和图片以及采集及时的体育资讯信息,学生就可以通过访问网站获取所需信息。

六、结束语

本文从基本的需求分析出发,通过对校园体育新闻网功能模块的设计,基于dedecms开源框架,实现了网站前台文章、图片等的浏览和评价以及后台文章、栏目、采集等主要功能。管理员定期发布校园相关的体育资讯以及赛事,并利用设置好的采集节点来采集主流门户网站的体育资讯,动态更新网站展示内容,使得学生对体育新闻的获取更便捷和及时,对校园体育的发展以及校园体育信息的传播具有一定的促进作用。

【参考文献】

[1]刘娜.基于织梦DedeCMS建设企业门户网站的分析[J].信息通信,2016(2).

[2]龚利,史杨.基于DEDECMS内容管理系统的课程网站系统实现[J].电脑知识与技术,2014(23):5406-5410.

[3]陈彩.基于DedeCMS的视频点播模块实现与比较[J].电脑编程技巧与维护,2014(12):106.

[4]欧阳玉峰,王珂琦.基于DedeCMS技术的高校网站建设安全问题[J].黑龙江科技信息,2013(19):151.

[5]庞贞禄,邬德飞.基于DedeCMS的高校图书馆网站建设[J].中国传媒科技,2012(12):163-165.

[6]孙萍.基于内容管理的远程教学网站的设计与实现[J].电子测试,2014(22):120-121.

[7]刘超.基于DedeDMS的乌海能源公司网站建设[J].中国科技博览,2015(24):62-62.

[8]陈晓丹.基于DedeCMS的校园门户网站建竣[J].教育,2015(10):167-168.

[9]李洪心,王东.电子商务网站建设[M].电子工业出版社,2015.01.

[10]李爱萍,崔冬华,李东生.软件工程[M].人民邮电出版社,2014.03.

[11]丁士锋.网页制作与网站建设实战大全[M].清华大学出版社,2013.07.

猜你喜欢

数据采集
Web网络大数据分类系统的设计与改进
基于大型嵌入式系统的污水检测系统设计
基于开源系统的综合业务数据采集系统的开发研究