回溯试探组卷算法及网络问卷质量保证研究
2015-04-29范晶晶冯英伟周丽莉
范晶晶 冯英伟 周丽莉
(河北建筑工程学院,河北 张家口075000)
0 引 言
网络问卷是借助信息网络来进行问卷调查,问卷发起者把问卷通过网站或电子邮件的形式呈现或发送给被调查者,被调查者通过网络实现电子问卷调查.分为两种:一种是把网络问卷直接在网站中呈现,被调查者直接在网页上作答问卷,提交后问卷发起者即可在网站中看到作答的问卷.一种是通过电子邮件实现问卷的发送和回复,调查者把问卷以邮件的形式发送到被调查者电子邮箱里,被调查者下载并作答问卷,同样以电子邮件的形式把作答后的问卷回复给调查者[1].但问卷的生成算法及问卷质量无法保障成为其不能普及的重要原因.本文通过自动组卷算法及问卷质量保障措施有效的提高了问卷的客观性及准确性.
1 回溯试探组卷算法
算法核心思想是从森林中选择一颗树,如果该子树中有解则返回解,如果无解则搜索另外子树,直到搜索到问题的解,搜素过程采用深度优先遍历算法.搜索可分为有约束条件的搜索和无约束条件的搜索,分别称为盲目搜索和启发式搜索.本系统采用启发式搜索.
算法求解步骤如下:
1、确定解森林.
2、选择一条解空间树.
3、从根节点出发,按照深度优先算法搜索解,搜索到解后返回.否则,对该树递归调用深度优先算法,遍历搜索该树的每一个节点,搜索到解返回,搜索不到则逐级返回到根,直到遍历完成,返回该树无解.
4、确定下一颗树,调用第三步进行求解.
5、遍历所有树,仍无解返回无解[2].回溯算法流程图1如下.
图1 回溯试探算法流程图
2 自动生成问卷设计
系统采用启发式搜索算法生成问卷,有关算法的性质上文已经进行了阐述说明,这里不再累述.下面重点介绍,生成问卷所采用的启发式搜索约束条件,包括:题型约束、题量约束、分值约束、难度约束等.采用启发式搜索组卷算步骤如下:
1、确定题量约束.
2、确定分值约束.
3、确定题型约束.
4、设定每个题目分值约束条件.
5、根据随机数生成器从数据库表抽取试题.
6、预览问卷,满意则返回,不满意返回到第1步重新执行.启发搜索算法流程图如图2所示.
3 问卷统计设计
本系统采用定量分析的方法对问卷进行统计.
问卷定量分析的一般步骤如下:
1、问卷数量化.
2、设计统计数学模型.
3、根据数学模型通过数学的方法进行定量的分析.
本系统的问卷主要使用简单的分析方法,分析结果经常采用百分比、平均数、频率、次序等进行表征.1、封闭问题的分析.
所谓封闭问题,是指问题的答案已经全部给出,被调查者只能从给出答案中选择其中的一项.
2、多个变量问题的分析:多个变量问题的分析采用交叉分析的方法.
3、开放问题的定量分析
所谓开放性问题,是指出卷者没有给出问卷的确切答案,而由被调查者自己回答.
4、数量回答定量分析
该类问卷反馈结果是数字,这类问卷,我们采用数据的区间处理,同时使用平均值、中位值、出现频率及标准偏差等统计量进行分析.
统计中经常用到的统计参数包括:平均值、中位值pm、出现频率V、标准偏差SD,每个参数量的含义如下:
平均值:数学平均值,数值总和与个数的商.定义式如式1所示.
图2 启发搜索生成试卷流程
其中:p表示每个样本取值,n为样本总数.
中位值:即排序后位于中间位置的数,如果有奇数个数,即取中间位置的数,若是偶数个数取中间两个数的平均值.
出现频率:本系统中以其占总数的百分比表示.所占百分比由式3-2所示.
其中:p为每个样本值,pi为空间中某一个样本值,1≤i≤n.
标准偏差:离散的数据与平局值之间差值的平均值,是方差的算术平方根,描述离散数据的聚集程度的数学量,该值越大,数据越分散,离散样本的聚集程度越低.定义式如式3-3所示.
4 结 论
本文通过回溯试探算法进行网络问卷自动生成,并对问卷统计特性进行了分析,通过此分析可对网络问卷的普及奠定一定基础.
[1]方佳明,邵培基.一种评估网络调查适用度的方法[J].清华大学学报(自然科学版).2006(S1)
[2]方佳明,邵培基,粟婕,张谦,田禹.基于网络的问卷调查回复率影响因素实证研究[J].管理评论.2006(10)
[3]秦学礼,邓松如.Web应用技术体系结构和研究方向[J].计算机时代.2006(05)
[4]徐浪,向蓉美.目前中国网络调查的局限性和适用范围[J].统计与信息论坛.2006(01)
[5]曾鸿.从我国网民特征看网络调查方案设计[J].经济问题探索.2006(01)
[6]李锐,宋铁英.国内网络调查研究分析[J].情报科学.2005(06)