APP下载

面向用户生成内容的创意思维知识服务研究

2021-02-22李晓英唐冬琳

计算机工程与应用 2021年4期
关键词:网络图胎心关联

李晓英,唐冬琳

湖北工业大学 工业设计学院,武汉 430068

伴随着物联网与数据分析技术的快速发展与应用,传统的设计领域产生了巨大的变化[1]。“以用户为中心”的产品设计理念越来越重要,深入洞察用户需求是产品概念设计前期的关键环节[2]。传统的用户调研方法中获取用于产品设计的数据通常是一项耗时且昂贵的工作。目前用户在线数据逐渐成为设计人员获取用户对产品和服务的体验的重要信息来源[3-4]。现阶段通过集合数据挖掘和文本分析技术来解决用户需求的获取、识别、分析及表达,其研究内容主要包含三方面:一是从用户使用产品过程中采集后台数据并进行分类处理,分析用户需求特征与规律,提供虚拟产品界面的迭代设计策略[2,5];二是从用户购买服务过程中挖掘相关商品信息[6]、用户在线评论[7-10]与售后服务数据[11],分析消费者对产品功能与外观的偏好,提供实体产品的改良设计策略;三是从用户信息交流平台中爬取相关主题的文本数据加以识别分析与可视化表达,获取用户的关注与偏好信息,把握用户需求的主流趋势[12]。这些研究多聚焦于产品功能层面的用户分类需求或宏观层面的消费者群体需求趋势,较少涉及行为与情感层面的用户信息研究与创意思维关联应用。杨焕[13]针对移动应用界面设计,借助在线文本建立用户体验与故事情景法的用户需求洞察路径;Ahmed 等[14]借助大量的概念设计文本集(如Open IDEO在线协作创意社区概念文本数据等),在创意设计过程中引入网络可视化技术与方法,实现有效信息的快速捕捉与设计灵感的组合创造。上述研究为如何从用户在线文本中获取产品设计创意提供了方法与技术支持。为了进一步完善和提高用户研究效率和创意知识获取水平,在相关研究的基础上,本文提出面向用户生成内容的创意思维知识服务研究。运用文本分析与可视化技术,从冗杂的用户在线文本中挖掘有用的信息,将其转化为可视化图表并建立创意思维映射,辅助设计人员在智能产品设计前期快速洞察用户有效信息并启发创意灵感。

1 创意思维知识服务研究模型

随着社交媒体生活普遍化,越来越多的用户在互联网平台发表他们对某一事物的关注、情绪与偏好等方面的个人原创信息,即用户生成内容(User-Generated Content,UGC)。UGC 通常呈现非结构化的文本格式,具有广泛性、自发性、互动性、意识性等特征[15],有助于产品概念设计的创意思维开发。以UGC中的文本数据为研究对象,构建面向UGC 的创意思维知识服务研究模型,如图1所示。该模型从设计模糊定位的UGC域到清晰认知的可视化域,再到设计洞察的创意知识域,构成创意思维知识服务的信息金字塔。

UGC域基于唐纳德·A·诺曼的设计层次理论[16],将UGC 信息特征划分为用户的生理与认知特征、行为习惯特征与表达情感特征,引出对应词组要素的分类,从而保证快速获取并识别用户需求的有效信息。用户的生理与认知特征分别对应生理数值词(Physiology,P)与认知特征词(Cognition,C),用户的行为习惯特征对应常用动作词(Behavior,B),用户的表达情感特征对应情感变化词(Emotion,E),用户群体对象对应角色称呼词(User,U)。可视化域借助词频分析、情感分析与网络分析等文本分析与可视化技术,输出关键词词频类目表和一系列关键词网络图,实现有效信息的关联分析与可视化表达,展示出用户关注焦点信息、语境内容关联信息、用户情感体验度量与关联要素分区指引。创意知识域基于唐纳德·A·诺曼提出的三个设计层次,对应形成创意知识获取的物理功能层面、交互行为层面与情感反馈层面。创意知识获取的三个层面有助于从可视化信息中深入用户的认知、行为与情感方面的用户研究,展开联想转移、活动情景与用户故事等角度的创意构想。研究模型中UGC域是UGC分析的输入端口,体现于创意思维知识服务过程中的用户数据特征提取与有效信息分类;可视化域是UGC分析的输出端口,其中输出图表和创意知识域的创意知识获取层面构成创意思维映射。

2 UGC分析与创意思维映射

UGC分析是将文本分析与可视化技术引入创意思维的信息处理关键部分;创意思维映射是可视化图表与创意知识获取层面的映射分析过程。

2.1 UGC分析技术与流程

在现有词库基础上通过反复测试与更新,拓展中文分词库、停用词库,构建UGC有效要素分类词库与情感分析词库作为分析基础材料。本文选用八爪鱼采集器和R 语言作为分析工具,建立UGC 文本分析与可视化技术流程,如图2 所示。该流程主要分为UGC 采集、文档预处理、信息提取与可视化三个环节。其中,信息提取与可视化是UGC 分析流程中的关键环节,主要通过词频分析、情感分析与网络分析,实现UGC的关键词要素分类提取、语境内容关联数据处理与关键词网络可视化。

2.1.1 词频分析

词频的高低反映出用户对该词的关注程度,借助高频词表明用户关注的聚焦信息。依据高频词临界值估算方法[17],提取目标语料库中有效高频词。在实践分析基础上,由于常用动作词出现的频次相对较低,选用二八定律提取常用动作高频词。

定义1H_value为高频词临界值,M为目标语料库中全部有用词个数,如式(1)所示:

图1 面向UGC的创意思维知识服务研究模型

图2 UGC文本分析与可视化技术流程

定义2BH_value为高频词临界值,BM为目标语料库中常用动作词个数,如式(2)所示:

同时将情感变化词预先提取,全部作用于后续情感分析中的情感极值标记环节。在通过UGC情感分析词库与有效要素分类词库进行词类标注等文档预处理后,利用式(1)与式(2)布尔运算提取各类别的关键词。进而设定词组的简称代表对应集合,即:角色称呼词组集合U、生理数值词组集合P、认知特征词组集合C、常用行为词组集合B、情感变化词组集合E。将U、P、C、B输出为关键词词频类目表,从而获得用户群体对象、生理特征、认知特征与行为特征信息,进行宏观定位并初步把握用户文本中的设计要素。

2.1.2 情感分析

情感分析是指发现人们对事物情感倾向或情绪动态等相关研究[18]。结合设计思维的用户情感体验要素,量化处理文本语境中的情感关联倾向,分析关键词要素之间的用户情感关联级别。首先,根据“主+谓+宾+情状副词”的句子主干成分对关键词重新排序,识别并排列关键词所在句子中的语境内容顺序。主语与宾语表示人或物,与U/P/C(用户、生理、认知)对应;谓语说明动作或操作,与B(行为)对应;“情状副词”表达情绪状况或观点态度,与E(情感)对应。然后,基于情感分析词库分类标记并计算每一条有效句子的情感极值,实现文本语境情感关联的数据化过程[19]。其中,情感极值评分规定如下:情感分析词库包括程度副词、正面情感词与负面情感词,正面情感词记为+0.1、+0.3、+0.5,负面情感词记为-0.1、-0.3、-0.5;若出现程度副词的评分结果乘以2,未出现情感变化词的评分结果为0,带有否定词则评分结果取反;若最终评分结果中绝对值大于0.6,则对应赋值为+0.7(或-0.7)。

在情感分析过程中,通过将关键词进行句子主干标准化,并对句子中情感变化词进行量化标注,从而实现用户聚焦关联信息的正负情感级别度量,又为创意构想中行为交互与用户故事提供切实有效的用户文本语境。

2.1.3 网络分析

网络分析已成为复杂系统关联可视化的关键方法,使复杂关系可以通过简单的网络图描述实现。本文从微观角度深入研究用户文本中关键词语境内容与情感之间的关联,快速锁定相关利益者的关系网络和用户的生理、认知、行为及情感特征之间的关联网络。在网络分析中,将词频分析的不同类目关键词作为节点属性,将情感分析的句子主干成分顺序和情感极值作为连线属性,输出一系列关键词网络图。在关键词网络图中节点标签显示关键词信息,节点颜色说明关键词的类别,节点大小代表关键词的频次;连线表示共现词组所在句子的语境关联,连线颜色说明关键词所在语境的情感倾向,连线粗细代表其相连关键词之间的共现频次(Cooccurrence Frequency,Co_Freq);节点周围的连线数量称为节点度(Degree,Deg)。共现次数传达关键词之间的密切度,节点度衡量某一关键词的辐射度[20]。

依据设计方向进一步选定某一高频关键词作为中心节点,对其相邻节点的网络属性作出两项定量分析,得到用户情感体验度量与关联要素分区指引。其一,将相邻节点以情感极值与Co_Freq 属性分布构成用户情感体验度量网络图,直观地呈现关键词要素的正负情感关联级别与密切度强弱级别(见第3.2.2节)。用户情感体验度量网络图可以捕捉用户正负面情感关联的核心信息,作用于挖掘用户情感表达上的创意设计概念。其二,将相邻节点以Co_Freq 与Deg 属性分布构成关联要素分区指引网络图[21]。通过线性回归分析与高频临界值估算法变量处理,形成相邻节点密切度与辐射度级别的四个象限区域(见第3.2.2节)。关联要素分区指引网络图中四个象限展示出关联信息中的核心区域(Q1)与次要区域(Q3)。Q1中节点处于强密切度与强辐射度区域,作为设计主题下用户研究信息中的核心关联范畴,主要作用于交互行为情景与用户故事框架的构建;Q3中节点处于弱密切度与弱辐射度区域,作为用户故事的补充参考信息。同时该网络图中强弱辐射度反映出与中心节点相邻的关键词在语料库的饱和状态[22],强辐射度区域(Q1与Q2)与弱辐射度区域(Q3与Q4)说明突显网络图节点设置的线索区域。Q1 与Q2 中节点相对处于强密切度,说明该关键词处于不饱和状态,作为指引查看该词的突显相邻网络图,获得更多用户语境的有效关联信息;Q3 与Q4 中相邻节点的辐射度低,说明该关键词处于过饱和状态,作为指引查看该词的突显最短路径网络图,完善用户故事或活动情境的强关联信息细节。为了分析过程有序且高效,对网络分析的可视化输出作出如下设置:频次参数筛选设置,查看中心网络图;类目项筛选设置,查看U/P/C/B 词网络图;指定节点筛选设置,查看突显相邻网络图或突显最短路径网络图。

2.2 创意思维映射分析过程

UGC可视化输出图表中蕴含着大量的用户有效信息,任何一项可视化图表都会产生一个或多个不同设计层面的创意点,因而建立面向UGC 可视化输出图表的创意思维映射,如图3所示。关键词词频类目表呈现用户群体对象、生理特征、认知特征、行为特征等聚焦信息。关键词网络图展示用户聚焦关注的语境内容与情感关联等信息,保证创意思维过程中用户故事的客观性与有效性。采用人物(who)、时间(when)、地点(where)、关联事物(what)、关联行为(what)与关联情感倾向(how)(简称5w1h)的故事框架下[23],通过组合、对比、相似、因果等联想思维方法,将关键词网络图的关键词要素演变为创意概念产生过程中的用户故事。创意思维映射分析过程从物理功能层面、行为交互层面与情感反馈层面有效地洞察关键词网络图,全面地识别并分析创意知识获取途径。

2.2.1 物理功能层面

物理功能层面通常与行为交互层面、情感反馈层面互为交融,在本文研究中,用户行为习惯与表达情感的关联信息主要分布于P(生理)与C(认知)。关键词词频类目表可以反映用户生理和认知特征的聚焦信息及规律;关键词网络图的P与C分布、节点大小、连线粗细等属性,可以体现用户聚焦事物中关联信息的关注程度与情感倾向。通过突显网络图中语境关联信息可以构建并完善故事细节,进而模糊定义产品概念的功能。

2.2.2 行为交互层面

行为交互层面侧重分析用户的常用动作习惯与其关联信息,该信息主要体现于B(行为)。关键网络图中的B分布、节点大小、连线粗细等属性,传达常用动作习惯之间的关联强度与情感倾向,可从中获取用户行为习惯。按照“常用动作词——交互形式——活动场景——情感体验”的行为交互联想线索,通过量化分析网络图中获取核心动作词并主导联想产品交互方式与活动场景,为产品交互模式提供对应活动情景与用户情感体验分析。在用户研究分析基础上,借助突显相邻网络图获取核心动作词的语境内容关联信息,从用户行为关联信息出发进行5w1h 用户故事联想;借助突显最短路径网络图获取对应关键词要素下的强关联信息,补充创意思维过程中的用户故事细节。

图3 面向UGC可视化输出图表的创意思维映射

2.2.3 情感反馈层面

情感反馈层面主要与用户的情感、观点和态度有关,该层面信息分布于关键网络图中E(情感)。根据关键词网络图中的情感关联,通过提取主体对象的正负面情感强关联信息,作为产品人性化设计概念的切入点;借助关键词网络图的情感关联多重性,采用联想转移方式使参与对象转移主体对象的负面情感关联信息,或者利用正面情感关联信息替代负面情感关联信息,改善或疏导负面情绪。根据用户情感体验度量网络图获取正负面不同级别的用户情感关联要素,其中用户正负面情感关联的核心信息,作用于设计要素中的兴奋点与痛点参考信息。根据突显相邻网络图与突显最短路径网络图中语境情感关联信息可以补充并丰富故事情感,使产品设计概念融入用户的情感体验之中。

3 案例实践应用

以“孕期健康,关爱胎儿”产品设计为实践主题,依据2019 年国内综合母婴平台用户体验满意度调查,选定排名前三的“妈妈网”“宝宝树”“育儿网”作为UGC采集数据源[24]。为了保证采集信息的实用性与设计思维的开放性,在前期预定设计检索词与数据采集分析基础上,本次研究以“胎心”作为检索词,采集内容包括正文、发表时间及查阅人数。经时间限定(2017.1—2019.9)与查阅数(>100)过滤原始数据获得1.2 万多项UGC 有效数据。进一步经清洗与文档预处理获得有效UGC语料库,其中包括5 687个有用词,32 680条有效句子。通过UGC 分析获得可视化图表,依次按照U、P、C、B 类目与情感倾向查看图表信息。为了验证创意思维的映射分析过程,后期将胎心话题进一步具体到胎心健康监测方向。

3.1 词频分析输出

从关键词词频类目表可以看出孕妇讨论胎儿胎心话题的聚焦内容,如表1所示。U对应用户群体对象,该信息表明在研究主题下胎心的主体对象为“胎儿”与“准妈妈”;家庭关系中相关角色主要涉及“准爸爸”与“奶奶”等家人,社会关系中相关角色主要包括“医生”“姐妹们”“护士”;“女孩”与“男孩”说明“胎心”与胎儿性别可能存在一定的关联性。进一步分析P并图形化,图4中变化折线表明胎儿与胎心话题的重点关注时间有“孕早期6~8周”“末次月经”“孕晚期”。C与B将在后续网络图中分析。

3.2 网络分析输出

3.2.1 中心网络图

结合词频分析输出的关键词词频类目表,进一步进行网络分析,结果如图5 所示。以图5(a)中心网络图I的热点区域中可以看出“胎心”与“怀孕”“B 超”“医院”“胎动”“胎心监护”等词存在着密切的关联性。由于图5(a)中节点分布相对密集,不易辨别连线的情感关联信息,进一步通过频次参数筛选设置输出中心网络图II,如图5(b)所示。“胎心”与“胎儿”“准妈妈”的强关联性表明研究对象“胎心”具有双重主体性;“胎儿”与“医生”“准爸爸”“姐妹们”的关联强度,表明孕期活动中的重要参与对象,并可以推测出孕妇主要的活动场景为家、医院和互联网平台。正负情感倾向分别通过橙色系与蓝色系连线表示。“胎心”周围的蓝色系连线居多,表明“胎心”带给孕妇产生较多紧张与担忧;反之,“胎儿”周围的橙色系连线居多,表明“胎儿”给予孕妇收获较多喜悦。“胎儿”与“准妈妈”“医生”有着橙色与蓝色两种重叠连线,说明在不同情景下可能产生不同情绪。“胎儿”与“准爸爸”之间为橙色连线,说明其语境中存在较多正面情感体验因素;“胎儿”与“姐妹们”之间为蓝色连线,说明其语境中存在较多负面情感体验因素;这些说明准爸爸与姐妹们在孕妇生活中扮演着负面情感转移角色,使孕妇缓解忧郁,增强幸福安全感。

表1 “胎心”检索词下关键词词频类目表(部分)

图4 孕期健康主题下生理数值词组(P)词频图

3.2.2 量化分析网络图

通过中心网络图对“胎心”与“胎儿”进行了情感关联对比分析,获得“胎心”是孕期健康主题下聚焦问题的核心关联词。进而以与“胎心”相关的高频特征动词“胎心监护”作为量化分析网络图的中心节点。在“胎心监护”中心节点下的用户情感体验度量网络图如图6 所示,得出用户正面情感关联与负面情感关联的核心信息,分别作用于胎心健康监测方向下的兴奋点参考信息与痛点参考信息,具体内容如表2所示。通过正面情感核心关联信息中“家用”“听”“求神祈愿”等关键词,确定产品相关概念功能,满足孕妇群体认知、行为与情感需求;借助负面情感核心关联信息中“缺氧”“产检”“生病”等关键词,联想孕妇生活中出现问题的活动情景,作为改善用户体验的概念切入点。在“胎心监护”中心节点下的关联要素分区指引网络图如图7所示,借助核心区域中“听”作为联想示例。从主体对象中联想不同的交互形式,如胎儿发出的声音、孕妇发出的声音、对胎儿有益的声音以及孕妇希望传达的声音,结合在医院、家、户外等不同活动场景中分析不同“听”的交互情景下的孕妇情感体验,从而得出胎心健康监测下产品概念中以“听”为交互形式主导方向。如图8所示。

图5 “胎心”检索词下中心网络示例图

图6 “胎心监护”中心节点下用户情感体验度量网络示例图

3.2.3 突显网络图

进一步以图7中Q1与Q2中“听”为例,通过指定节点筛选设置,输出突显相邻网络示例图,如图9(a)所示。在图 7 的 Q3 与 Q4 中选定“仪器”“家用”“耦合剂”等关键词,通过指定节点筛选设置,输出突显最短路径网络图示例图,如图9(b)所示。借助突显网络图中的关键词要素,展开联想胎心健康监测方向下的孕妇故事,从文本语境中深入挖掘孕妇的聚焦信息与关注问题。将图9 中U/B/P/C 关联信息转化为5w1h 故事元素信息。在前期的分析基础上得出用户故事中人物(U)、时间(P)、地点信息,进一步组合关联事物(S/P)、行为(B)与情感(E)组合胎心监护下的孕妇故事。从不同的活动场景和孕期阶段展开,关联着不同的人物、事物及情感,通过组合、对比、因果、整合等方法将关键词要素信息演变成创意概念中的孕妇相关故事。用户故事是为了具体化呈现孕妇在胎心监护过程中的需求和问题,进而归纳得出不同创意知识获取层面的设计概念,如物理功能层面有胎心定位、报告解说、数据传达等,行为交互层面有双向互动、多渠道交流、健康反馈等,情感反馈层面有爱美需求、社交活动、心理寄托等,如图10所示。

表2 用户正负面情感关联信息分析表

图7 “胎心监护”中心节点下关联要素分区指引网络示例图

图8 行为交互联想线索示例图

图9 “胎心监护”中心节点下突显网络示例图

图10 5w1h用户故事信息示例表

通过案例验证了UGC 分析与可视化流程的可行性,说明了面向UGC 的创意思维映射分析过程。在本次实践中,创意知识获取分为用户研究与创意构想,如表3。用户研究包括关键群体对象(a)、用户行为习惯(b)、用户聚焦信息(c)与用户情感倾向(d),创意构想包括常用行为活动(e)、用户故事情景(f)与用户故事细节(g)。其中(a)、(b)项由UGC采集阶段的检索词决定输出,(c)、(g)项由自定义量化分析网络图的中心节点决定输出后续可视化图表。根据个人认知角度不同,设计人员通过设计主题下模糊定位关键词可以发现更多相关信息并获取更多创意概念。

表3 胎心健康监测下创意知识汇总示例表

4 总结

本文基于文本分析与可视化技术应用,针对UGC中的文本数据,构建了面向UGC 的创意思维知识服务研究模型。以用户为中心的设计理念构建了UGC分析流程;建立了可视化输出图表与物理功能层面、交互行为层面、情感反馈层面的创意思维映射;最后结合实践案例验证了模型的有效性。由于文本分析技术对相似与相关概念难以进行智能化分类,需要人工进行识别与不断测试完善;同时创意知识获取过程是思维发散与不断演变的过程,需要循序渐进地积累与优化。后续研究将深入拓展设计方法与可视化图表转化过程,并搭建设计团队合作的创意集成平台。

猜你喜欢

网络图胎心关联
胎心监护仪的多发故障解析与日常维护
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
基于联合聚类分析的单通道腹部心电信号的胎心率提取
网络图计算机算法显示与控制算法理论研究
“一带一路”递进,关联民生更紧
网络图在汽修业中应用
奇趣搭配
智趣
胎心监护:胎儿健康早知道
胎心监护,聆听宝宝的心声