信息熵理论下创新创业实践过程问题分析研究
2018-03-10张鹏
张鹏
摘 要 意图分析大学生创新创业团队问题症结,基于信息熵理论中对于事件不确定性概率的探讨,提出将该理论与大学生创新创业过程遇到的问题情况联系起来,形成讨论大学生创新创业团队进程优化的深入思考。通过大学生创新创业实践中遇到问题的6种情况中信息量和信息熵的分析,得出横向分析下实际情境标准差中从高到低依次是:资料被首发>准备不足>技术认知>意志下降>资料丢失>心理趋向,“资料被首发”问题的意见相异程度最大,对于“心理趋向”情况意见较为认同,原因是团队的前期准备意见分歧和心理问题的普遍性;理论情境标准差中从高到低依次是:技术认知>准备不足>资料丢失>意志下降>资料被首发>心理趋向,在相对稳定的分析环境中,理性分析下“技术认知”问题分歧最大,“心理趋向”依旧具有较高的认同感,表现在相对局限范围内大学生团队对于“技术应用”的选择迷茫和应用困惑。在国家“万众创新”背景下,希冀以计测信息量和信息熵的手段来权衡并发现“国创”团队的问题出现的原因,并能够提供即时性的解决问题导向。
关键词 创新创业实践;信息量;信息熵;问题分析
中图分类号 G642文献标识码 A文章编号 1005-4634(2018)06-0097-06
0 引言
2017年7月,国务院印发《关于强化实施创新驱动发展战略进一步推进大众创业万众创新深入发展的意见》,其中重点强调“完善人才流动激励机制”解决方针,意图说明在实现创新战略兴国过程中人的作用依旧处于关键地位。全国“互联网+”大学生创新创业大赛截至2018年已经成功举办了4届,在鼓励创新创业活动的同时,推动了就业1。但大学生在进行创新创业项目过程中会遭遇项目实施的困窘和挑战,发现并解决此类“挑战”对于有效开展团队建设具有关键意义。大学生创新创业团队所需要解决的问题主要分为6种情况,这6种情况反映的是“大创”项目中普遍遭遇的问题,统计出现每一种情况的信息量和信息熵是统筹规划“大创”项目实施进展的有效举措,便于从大数据方向上把握国家级、省级至院校级大学生创新创业团队项目进展,较宏观地提升“大创”项目质量和项目进程。
1 “大创”项目学生遇到6种情况信息量确定方法
“大创”项目中学生遭遇“困窘”主要包括6种情况2。(1)心理趋向:基于项目成员个人及成员之间的心理波动状况。(2)资料丢失:合作关系和个人收集两种情境下项目资源遗失情况。(3)意志下降:团队成员之间及与导师的合作意向下降,多以对项目失去兴趣为主。(4)准备不足:项目筹备之初、项目实施进程以及项目收尾时均未处理好项目的规程和要求,导致项目某阶段的成果不充分、不明显。(5)技术认知:对项目中出现的关键性问题解决对策或某项专业技能不熟练,进而导致项目出现中间环节卡顿情况。(6)资料被首发:项目内部资料、新技术、新手段、新思路被其他团队首发,项目新鲜度及创新性下降。进而探讨“大创”团队遇到的6种情况携带的“信息量”衡量方法,采用Shannon的信息论理论——消除人们对于事物了解的不确定性。Shannon提出可以用信息熵(信息熵是用来衡量一个随机情况变量出现的期望值,变量信息熵越大,出现的各种情况和内容就越多,需要的表达方式和内容也越多)来衡量单次情况反馈过程遭遇问题的复杂程度的度量3,4,即:
事件未发生时,每个状态出现的概率相等,H′(Xi)表示用以消除这个事物的不确定性所需要的信息量(从N个等级相同可能事件中选出一个事件所需要的信息度量或含量)。当已知事件Xi已发生,则表示Xi事件所含有或所提供的信息量5,即:
2 30组“国创”项目实践过程问题分析
为说明本研究内容的实践意图并结合所处教学团队偏重于设计类教学的基础工作,笔者抽取2017年、2018年在广东省大学范围内成功申报并立项的30组国家级大学生创新创业训练计划团队(设计类,平均每组组员5人为研究样本),并对其项目负责人及主要成员进行问卷调查,得到大学生创新创业实践反馈过程中遭遇6种情况的概率值,并对其“信息量(单位:比特)”和“信息熵(单位:比特)”进行统计分析(见图1)。
利用信息熵理论进行具体计算,过程如表1所示。
1) 针对6种情况发放调查问卷,以30组“国创”(设计类)项目负责人作为主要调查人,每一组大学生创新创业实践团队的负责人进行2轮问卷调查,第1轮(如序号1)根据程度在[0,1取概率值,即程度型打分,贴合实际表达;第2轮(如序号1′)在[0,1上慎重取值,保证6种情况的概率之和为1,即范围型打分,贴合理论表达。
2) 计算信息量。以“心理趋向”情况第1组“国创”在第1轮程度型打分为例,其概率值为0.300,则按照信息量公式可得:
3) 计算信息熵。信息熵反映该组整体信息量的复杂程度,以第2组“国创”在第2轮范围型打分为例,则按照信息熵公式可得:
4) “0”号代表极端理想情况,即发生每一种情况的概率相等(均为1/6),非实际大学生团队,仅作为衡量水准数据应用;信息熵数值并非该组该轮下6项信息量数值平均值,应严格按照公式计算得出。
通过比较,30组“国创”团队6种情况发生的相等概率(1/6)下的信息量均为2.585,以此值作为参考平均值,观察各个“国创”团队6种情况的信息量和信息熵变化波动,判断其团队隐含因素问题容量和事件处理复杂程度。(1)横向分析各团队,贴合真实想法的程度型打分情境下,团队信息熵超过“3”的有第1、8、16、18、29组,说明其团队中遭遇各情况的普遍概率更高,团队数据和团队建设更趋向于复杂,其中概率值达到0.500的包括“准备不足”情况下的第1、8、29组和“技术认知”情况下的第8组,说明在团队建设趋于复杂情境下这两种情况更需要引起重视,而第8组两种情况均超过0.500,需要学校及导师更多的帮助和协调;贴合理论表达的范围型打分情境下,团队信息熵最高的5个团队有第6、8、9、14、15组,说明在相对稳定的条件下,团队出现遭遇情况更加均衡的情境下,该5组团队解决问题的方面和手段需要更谨慎,原则上需要对该5组团队建设保持高度的自醒和控制,尽量提前做好团队问题防范,该5组团队每一种情况发生概率均未超过0.250,相較于其他团队出现高概率情况(0.300)而言更趋于均衡,亦说明该5组团队出现情况更均衡,问题较其他团队多,而其他团队的建设情况则说明某一情况高概率,其他情况保持较低概率,问题处理更加清晰明朗并易“对症下药”。(2)纵向分析各团队,对30组“国创”团队遭遇6种情况在实际情境和理论情境下信息量和信息熵标准差进行计算分析(表2)。
针对表2进一步分析可得,6种遭遇下对30组“国创”团队信息量的标准差差异分析,纵向分析下,实际情境标准差相较理论情境标准差高的情况有心理趋向、意志下降、准备不足、资料被首发,说明此4种情况偏向于大学生真实的心理想法,这4种情况出现平均频次和信息量波动幅度更大,表示团队对于这4种情况的处理能力相对较差;而理论情境标准差相较而言高的情况有资料丢失和技术认知,说明此2种情况在大学生视角下分歧较大,针对这2种情况的对策和方法措施意见不一致,需要关注这2种情况在更大数据范围内的团队建设问题。
另一角度,横向分析下实际情境标准差中,从高到低依次是:资料被首发>准备不足>技术认知>意志下降>资料丢失>心理趋向,不难看出,“国创”团队对于“资料被首发”情况意见分歧最大,而对于“心理趋向”情况意见较为认同,出现此顺序排列的主要原因有:(1)顺序前两种情况皆与团队前期准备有关,分歧在于团队对是否需要完善的前期运作各持己见,显然部分团队并未真正意识到前期准备的重要性,针对项目涉及的国内外概况、论文、专利、著名学者科研动态等内容并未做统计分析处理;(2)“资料丢失”具有较一致的意见,说明此情况出现具有偶然性,人为影响不大;(3)“心理趋向”标准差最低,即波动程度最低,表明此情况的普遍存在和普遍认同,是长期需要引起关注和防范引导的“长线工程”。理论情境标准差中,从高到低依次是:技术认知>准备不足>资料丢失>意志下降>资料被首发>心理趋向,在相對稳定的分析环境中,理性分析对于“技术认知”呈现意见分歧较大的情况。但对于心理认知的出现频次,大学生团队的态度普遍良好,对此的理解分析对策是:(1)当权衡概率总值为“1”的时候,6种情况的概率分配使学生负责人变得谨慎,因此,理论情境数据更具有说服力和严谨性,其匡正了学生匹配概率值时过多的个人情感以致趋向考虑团队的真实情形;(2)“技术认知”是顺次最高的选项,对此的分析是相当一部分“国创”团队对于其真正掌握的技术并不熟悉,亦无法权衡是自我学习还是追随导师的步伐,使其对自身团队的技术理解不够从而产生困惑,此项波动情况最为剧烈,也是表明在刨除个人情感趋于站在团队角度考虑问题时,“技术”方面依旧是大学生在方方面面赖以生存的重要关键技能,强化“国创”团队的技术本领需要占据绝对主要地位;(3)“资料被首发”和“心理趋向”两种情况的偏低波动走向表达了“国创”团队具有对团队资料和自身修养的信心,是值得肯定并长期建设的方面。
综上所述,实际情境偏向于大学生个人真实想法和认知,而理论情境侧重于团队建设考虑,亦反映实际情境中“资料被首发”是表现大学生个人想法依旧占据主导,不愿查询资料的普遍情形;理论情境中“技术认知”的高波动下“技术”作用的地位不容撼动,需要引导学生高度重视并实现自我深入学习;“准备不足”在两种情境下排名均较靠前,也是传递准备工作是形成并完善最终团队成果的优良品质,是团队形成成果的“润滑剂”;“意志下降”排名稳定且靠后,透露出大学生参加“大创”乃至“国创”的积极性和热情度较高;“心理趋向”则被团队普遍认同,时刻警惕问题出现并需要彼此长期相互协调沟通,防止内部出现“罅隙”。最后,两种情境下对于信息熵的离散程度前者明显高于后者,符合大学生认知广泛、接受新鲜事物能力强、个人价值观突出的特点,因此,关注大学生本体情况时应以实际情境的数据统计分析为主,进行团队建设和验收团队进展时则应以理论情境依据为宜。
3 结束语
基于信息熵理论中对于事件不确定性概论的探讨,提出将该理论与大学生创新创业过程联系起来,形成讨论大学生创新创业团队进程优化的深入思考,这种“联动”本质上也可以归纳为团队创新精神的一种外象表达。在对教育模式的发展、大学生创新创业团队建设以及大学生创新创业过程中的优良取材方法、取材方式、遭遇意外情况和挫折的分析中,发现分析其每一种遭遇意外情况是一种行而有效的解决问题对策,它可以单独作为一种创新方法、手段、思维,亦可以形成一套独具特色的教育体系,并在团队建设过程中搜集挫折和问题的信息量和分析信息熵的表达结果,进而协助更为广泛、受众群体范围更大的大学生创新创业活动,优化完善创新创业教育体系,为开放教育环境下输送更多投身“万众创新”的青年创新人才。
参考文献
[1] 董卓宁,孟宪博.新时代高校创新创业教育范式探析J.自然辩证法研究,2018,34(3):125-128.
[2] 宋傅天.大学生参与“双创”的现状、问题与建议J.宏观经济管理,2018(1):67-71.
[3] 张恒,冯德俊,朱军,等.遥感影像信息量与空间分辨率的关系研究J.应用光学,2014,35(3):409-413.
[4] 李国佳,杨喜亮.基于知网义原信息量的词语相似度计算方法J.软件导刊,2015,14(6):142-144.
[5] 李文清,孙新,张常有,等.一种本体概念的语义相似度计算方法J.自动化学报,2012,38(2):229-235.