论影响人感知召回与正确率的因素
2021-02-25潘昊张志伟王铁霖
潘昊 张志伟 王铁霖
摘 要:随着计算机技术的快速发展,CPU计算能力在突破瓶颈之后,随之而来的是海量数据导致的算法准确率降低的难题。本文在机器学习的帮助下,通过验证手语表达数据集,借助主成分分析模型(PCA)验证测试集的准确率,进而尝试优化人感知的召回以及准确率。
关键词:机器学习;感知;召回率
一、引言
人类的大脑是世界上最精密的组织,它的构造比现存的任何一台计算机的构造都复杂的多。因此,在探索人脑内如感觉、直觉等相关问题时,以现有的工具手段无法对大脑进行量化的测试。我们的工作可以作为数学和人工智能领域合作的一个模型,通过利用数学专业知识和机器学习高效计算的各自优势,可以取得较为很好的效果。
我们可以把大脑中假设存在的“感觉”系统看做一个模型,这个模型是由我们从生活中各个领域的经验与经历训练而得出:在日常生活中,将一个人生活中遇到的问题抽象化为函数的输入与输出。有效以及无效的输入可以被脑海记录,并影响人做出下一次判断
所谓“直觉”,不过是脑中有若干记忆碎片与五感接受到的信息,综合在一起,跳过逻辑层次,直接反射到思维之中,其准确程度,取决于一个人的经验常识和判断能力。本文提出了一个使用机器学习的过程,以发现数学对象之间的潜在模式和关系,通过归因技术理解它们,并尝试优化准确率以及召回率。
二、系统方案设计
在学生时代,学生在遇到没见过或者拿不准的题目时,通常会做出判断,此时的判断的依据一般由自己的感觉而的来“我感觉这题选择C”,这是一个分类问题。而形成这个感觉的过程,以及影响人做出选择判断的因素在各种方面都存在,难以对因素进行量化统计。本文将所出现的可能因素抽象化为一个领域的问题,进而形象的表达出外界事物对人的感知的可能影响因素。通过一个领域内的具体问题,进而转化为计算人对外界事务判断的正确率。
在人工智能范围内,特别是机器学习领域,提供了一组可以有效检测数据模式的技术,并在科学学科中日益显示出实用性。在数学领域,人工智能已经被证明是一种很有价值的工具,它可以发现现有猜想的反例、加速计算、生成符号解以及检测数学对象中结构的存在。
手语并非是现代才出现,古代就有手语的存在,并非专为聋人所有,古人靠手势来传达沟通意见,而后才慢慢产生语言。古人以打猎耕种为主,社会上需要遵循的规则也少,因此聋哑人较能适应生活,但文化发达后社会进步,抽象的符号也多,为了适应社会生活,只好藉手语来表达沟通情意了。手语是人体表达语言的一种方式,手语的不同形状代表的不同的意思。本文试通过对手语问题的研究算法,浅谈人整体的“感觉”准确率的影响因素。
本文的算法内核中使用多输出估计器来完成图像。我们的目标是根据手语数字的上半部分来预测它的下半部分。例如,我们将用第一部分训练我们的模型,它将预测第二部分,如图1所示,描述了一个通用的方法,通过这个方法,本文可以使用机器学习的模型来抽象人对事物感知的一种方式,进而验证图形存在的正确与否。
三、算法实现
(一)数据加载
首先,我们需要先加载手语数字数据集,我们数据的形状是(2062,64,64),其中2062是图像的数量,有64x64像素。本文将使用从0到9的所有图像。
x_load = np.load('../input /x.npy')
y_load = np.load('../input/ y.npy')
img_size = 64
其次,我们需要设置训练集以及测测试集的数量。我们用本地的所有数据作为训练集,接着选择10个图像作为测试集。
(二)模型应用
主成分分析是一种最流行的降维技术,PCA是一种统计分析、简化数据集的方法。它利用正交变换来对一系列可能相关的变量的观测值进行线性变换,从而投影为一系列线性不相关变量的值,这些不相关变量称为主成分。
主成分分析使用高方差,这意味着它喜欢多样性。例如,比较上面的两个图像,色框外没有多样性方差;另一面,在红色框架中有多样性,第一步是去相关:旋转数据样本与轴线移动数据样本,所以他们有意味着零没有信息丢失,并且应用已学到的转换方式。
n_components = estimator = decomposition.PCA(n_components=n_components, svd_solver='randomized', whiten=True)
estimator.fit(X)
for i, comp in enumerate(images):
plt.imshow(comp.reshape((64, 64)),interpolation='nearest',vmin=-vmax, vmax=vmax)
plt.savefig('graph.png')
plt.show()
四、小結
本文分析了主成分分析类型,分析了感知实现的感知流程。最后针对手语数据集产生设计模型的感知修改和感知表达提出实现方法。作为人体表达感知的方式之一,优化处理了人体表达的准确率。
参考文献:
[1] 汲梦宇.三维场景的多视点感知算法研究?[D]. 中国科学技术大学. 2017
[2] 刘巍巍, 周来水, 庄海军, 等.分布式同步协同 CAD /CAM系统的Web模型及实现[J]. 南京航空航天大学学报, 2004, 36 (5): 539-543
[3] 刘晓平, 石慧, 毛峥强. 基于信息可视化的协同感知模型 [J]. 通信学报, 2006, 27(11): 24-29
[4] 徐茂峰. 雅可比矩阵引导的无翻转体映射生成算法研究?[D]. 中国科学技术大学. 2021