APP下载

基于招聘数据的出版人才画像构建与应用

2023-11-28任娟

出版与印刷 2023年5期

任娟

摘要:构建出版人才画像,以把握出版人才需求趋势,推动出版人才队伍建设。文章以前程无忧招聘数据集为样本,利用“用户画像”思想,按照数据化一标签化一可视化三个过程,构建多维度的出版人才画像模型。使用Python、Jieba等工具提取各维度的标签,结合LDA主题模型和可视化工具生成出版人才画像。研究发现,出版人才需求呈现泛文化行业趋势、民营企业成为出版人才需求主体、运营/营销/销售类岗位更多吸纳本科和专科人才、不同编辑类岗位对人才的专业知识需求差异化明显、强调职业技能和数字素养等新特征。基于出版人才画像,文章对我国出版人才培养可能存在的问题展开讨论,并提出出版人才培养创新的对策建议。

关键词:人才画像;出版人才;招聘数据;LDA主题模型

D01:10.19619/j.issn,1007-1938.2023.00.060

作者单位:1)上海出版印刷高等专科学校;2)上海出版传媒研究院

基金项目:教育部人文社会科学研究青年基金项目“基于在线评论情感分析的图书销量预测研究”(编号 19YJCZH130)。

人才是出版事业的第一资源。国家新闻出版署2021年12月28日印发的《出版业 “十四五”时期发展规划》指出,“加强出版人才队伍建设。加强创新型、应用型、复合型人才培养,重点打造出版理论人才、优秀骨干编辑、优秀校对人才、数字出版人才、印刷发行业务能手、版权运营专家、出版国际贸易人才等,建设新时代出版人才矩阵”。 中共中央宣传部2022年4月18日印发的 《关于推动出版深度融合发展的实施意见》 指出,“建强出版融合发展人才队伍,夯实人才培养基础,强化高层次人才培养激励,发挥企业人才建设主体作用”。出版人才既包括出版学科专业培养的人才,也包括出版产业和出版事业所需要的各类人才,还包括在其他行业从事出版专业相关工作的各类人才。

当前,出版人才培养面临多重挑战。一是人才供需呈现结构性矛盾。在人才存量上,出版行业因薪金报酬、管理机制、降本增效等限制,人才短缺与人才流失现象并存;在人才增量上,兼具政治素质和职业素养、兼通传统出版与新兴技术、熟悉出版业务又善于运营管理的复合型人才匮乏。二是部分岗位面临被人工智能技术替代的风险。以ChatGPT 为代表的人工智能技术正在加速出版人才的替代进程,替代顺序呈现出程式化工作替代风险高、非程式化工作替代风险低的特征。 三是出版新业态与新模式对出版人才提出新要求。数字技术与实体经济融合发展,不断催生出新组织、新业态、新模式,出版行业需要更多复合型人才来满足产业转型升级和深度融合发展的需求。

网络招聘信息是人才市场的风向标,网络招聘平台是人才交流的主渠道,人才画像是供需对接的新工具。网络招聘信息文本能及时、精确地反映真实的出版人才需求,可为人才供需匹配、政策研究、决策咨询等提供可检索、可获得的数据基础和数据记录。因此,本文拟利用“用户画像”思想,按照数据化一标签化一可视化三个过程,构建多维度的出版人才画像模型。通过采集网络招聘数据,提取各维度的标签,使用可视化工具,生成出版人才画像,挖掘出版人才需求特征,以期把握出版人才需求趋势,推动出版人才队伍建设,为出版强国建设提供人才支撑。

一、研究综述

文本挖掘、数据挖掘等技术的发展促使 “用户画像”概念逐渐形成,为人才需求特征挖掘提供了新途径。[1]56用户画像旨在以用户为中心,从多源数据中抽取用户不同维度的信息,生成一系列标签,以刻画用户的特征。[2]雍志娟[3]从知识、技能和业绩三个维度,构建了基于专业领域知识服务体系的人才画像模型。高扬等[4]以智能制造领域为例,从基本属性、研究兴趣、学术影响力三个维度,构建杰出人才画像。李勇等[1]58从基本资历、专业知识、工具技能和能力素质四個维度,构建了人工智能人才画像模型。何春雨等[5]提出了面向科技出版的人才画像构建框架,包括标签体系建立、基础数据库搭建、人才画像呈现三个环节,并抓取中国智库网的专家库数据开展了实证研究。但目前基于网络招聘数据运用“用户画像”概念构建出版人才画像的相关研究较少。

网络招聘信息分析方法主要涉及词频分析和主题分析。王晓光等[6]利用人工标注的关

键词,从岗位类型、技能要求、知识要求等方面,分析了数字出版人才需求结构。刘蒙之等[7]采用词频统计分析方法,从学历、职业技能、语言能力、职业素养、性格品德等方面,分析了编辑出版人才需求能力结构。刘大卫等网采用词频分析方法,从最低学历、外语水平、计算机水平、个人品质等方面,分析了传统出版人才转型为媒体数字化出版人才的可能性。陈明红等[9]提出了人才需求分析框架,包括数据采集、数据处理、主题提取、数据分析与可视化呈现,采用LDA (Latent Dirichlet Allocation,潜在狄利克雷分布)主题模型进行主题聚类,利用TF-IDF和Tex- tRank提取技能关键词。岳铁骐等[10]利用LDA 主题模型、Word2Vec模型和依存句法分析等构建了人才需求分析的主题本体。目前基于招聘数据探讨劳动力市场中对出版人才的需求特征的研究较少,尤其是从全产业链视角出发构建出版人才画像的研究较少。

二、研究设计与研究方法

本文借助“用户画像”思想,以人才需求为研究对象,以网络招聘平台人才需求为画像目标,以人才的基本属性和具体属性为模型维度,以资历、知识、技能等为模型要素,以定量分析和定性分析为研究方法,以标签化人才模型为表现形式,构建数据化、标签化、可视化的人才画像模型。人才画像构建流程包含以下三个具体步骤。

步骤一:数据采集与预处理。本研究选择前程无忧网站作为数据源,借助Python等工具,获取包含职位名称、学历、工作经验等结构化数据,采集包含岗位职责、任职要求等招聘文本,加载自定义词典、停用词表等进行文本分词,形成人才画像数据集。

步骤二:人才画像模型构建。将人才画

像构建维度区分为基本属性和具体属性,构建二维标签化人才画像模型。其中,基本属性是对人才的基本要求,包含学历、工作经验、工作地点等;具体属性是对任职资格标准的要求,包含知识、技能等。

步骤三:人才需求特征挖掘。一方面,采用数据挖掘方法,通过启信宝、企查查等数据库收集行业、企业等数据集,对人才画像数据集的结构化数据进行名称规范、数据关联、属性扩展等,构建岗位需求数据库。 另一方面,采用文本挖掘方法,通过关键词提取、关键词归并、扩展词语相似性,构建岗位需求词典。本文主要采用TF-IDF (term frequency-inverse document frequency,词频— 逆文档频率)模型提取招聘文本高频词,同时考虑语义信息识别和同义词归并,采用 LDA主题模型归并关键词。LDA主题模型是一种基于无监督式学习的动态文本主题识别模型,用于挖掘文本内在的主题分布。

1.出版人才画像框架构建

基于招聘数据的出版人才画像框架包括模型构建和模型应用等环节。(见图1)

2.数据采集与预处理

采用网络调研方法,选取前程无忧网站上与出版人才需求相关的招聘信息为调查对象。通过编写Python脚本程序,以“出版'为关键词于2022年11月13日采集2022年9 月13日至2022年11月13日的招聘数据,后又于2023年7月23日以“编辑or发行or 校对or排版or数字出版”为关键词扩展检索 2023年5月25日至2023年7月23日的招聘数据,均选择“上海”为工作地点进行全文检索,得到与出版相关的招聘信息12 064条,通过网页解析和信息提取,借助Python第三方库Pandas对数据进行去空、去重,并通过人工筛选,最终得到前程无忧招聘网站上与

出版人才需求相关的有效招聘信息826条,共来自335家招聘单位。

本文将数据采集字段“工作地点”限定为 “上海”,一是考虑到上海是全国出版人才聚集的主要城市之一,所选样本具有一定的代表性。二是随着上海文化消费升级和优势资源的聚集,上海的出版业通过与其他行业的不断联通、融合,逐渐形成了新的产业链和产业集群,上海对出版人才的新需求特征可以为其他城市的出版业发展提供参考。

三、研究结果

1.出版人才就职的行业分布广泛,人才需求的泛文化行业趋势显现

结合企查查数据库收录的员工人数、企业规模类别、行业分类等数据,对335家招聘单位发布的826条招聘信息进行匹配。依据 《国民经济行业分类》(GB/T4754—2017) 门类—大类—中类—小类的分类法对招聘单位所属行业归类。以上海辞书出版社为例,该招聘单位所属的行业分类依次为:文化、体育和娱乐业(门类)—新闻和出版业(大类)— 出版业(中类)—图书出版(小类)。

为详细考察出版业的岗位分布情况,将

出版业细分至小类,其他行业以大类或中类为主。对涵盖的招聘信息数少于5条的行业合并为“其他”。(见图2) 335家招聘单位的行业分布情况如下:商务服务业(70家,20.90%)、科学研究和技术服务业(41家,12.24%)、专业技术服务业(29家,8.66%)、批发业(27家,8.06%)、软件和信息技术服务业(25家,7.46%)、广告业(24家,7.16%)、图书批发零售(14家,4.18%)、文化艺术业(13家,3.88%)、图书出版

(12 家,3.58%)以及其他(80 家,23.88%)。 通过对招聘企业注册行业的结构分析发现,出版人才需求不仅体现在传统出版的生产、销售等产业链中,超过一半的出版人才需求还分散于非传统出版行业,如商务服务业、科学研究和技术服务业、专业技术服务业、软件和信息技術服务业、广告业。

参照出版研究学者对出版人才岗位类别的划分,[11]本文依据前程无忧网站提供的岗位名称、职位类别、岗位职责等信息,对招聘岗位类别进行人工判定,划分为编辑类、设计类、产品类、技术类、运营/营销/销售类五类。在826条招聘信息中,编辑类岗位信息531条,占比64.29%;设计类岗位信息 41条,占比4.96%;产品类岗位信息13条,

占比1.57%;技术类岗位信息21条,占比 2.54%;运营/营销/销售类岗位信息220条,占比26.64%。其中,在出版业(中类)的 160条招聘信息中,编辑类岗位信息88条,占比55.00%;设计类岗位信息1条,占比 0.62%;产品类岗位信息6条,占比3.75%; 技术类岗位信息6条,占比3.75%;运营/营销/销售类岗位信息59条,占比36.88%。

从上海地区出版相关岗位的人才需求来看,一方面,虽然编辑类和营销类人才仍然是上海出版业发展的主力军,但随着出版产业的多元化发展,越来越多的出版机构涉足其他文化行业,开展研学、文创、智库建设等关联性业务,增加了对翻译、讲师、课题研究人员等其他类型人才的需求。另一方面,泛文化行业乃至传统服务业对出版相关人才需求明显。近年来,由于数字技术创新迭代加速并不断融入经济社会发展各领域全过程,数字经济和实体经济不断融合。 随着第一、第二产业商业模式的不断升级,衍生出的新媒体业务对全媒体运营人才产生了大量需求。

此外,对在上海地区招聘出版相关岗位的用人单位所属行业的结构分析发现,出版市场主体呈现多元化特征,涵盖出版社、民营图书公司、文化传播公司、专业服务机构等,出版人才的就业范围广泛,除了在文化相关行业大有作为,在其他知识密集型产业等服务业领域中也发挥着重要作用。

2.中小微民营企业成为出版人才需求主体,运营类人才成为主要需求类型

尽管出版业中吸纳人才的主体是出版社 (集团)、期刊(学报)社等,但民营企业及新媒体公司作为“大出版”产业的一部分,靠自身政策的灵活性持续发展,已经成为出

版市场的重要力量。其中,新媒體技术公司正在成为内容产业的重要组成部分,面向出版业吸纳成熟的内容生产加工人员。在本次调查中,招聘出版相关岗位的除事业单位 (6家)和非营利组织(7家)外,各类企业共322家,其规模和性质的情况统计如下。

(1)企业规模。企查查数据库依据国家统计局颁布的《统计上大中小微型企业划分办法(2017)》对企业规模进行了具体标注。 该办法按照行业门类、大类、中类和组合类别,依据从业人员、营业收入、资产总额等指标或替代指标,将我国的企业划分为大型、中型、小型、微型四种类型。以归属于文化、体育和娱乐业门类的企业为例,从业人员数≥ 300属于大型企业;300 >从业人员数≥100属于中型企业;100 >从业人员数≥10属于小型企业;从业人员数<10属于微型企业。

从企业规模上看,在322家招聘企业中,小型和微型企业占比最大,共246家,占比为76.40%;中型企业共64家,占比19.87%; 大型企业共12家,占比为3.73%,其中3家属于出版业,分别是上海新华传媒股份有限公司、读客文化股份有限公司和阅文集团。 可以看出,中小微企业是吸纳出版人才就业的重要主体。

(2)企业性质。从企业性质看,民营企业占比最大,其次为国有企业。(见图3) 在322家招聘企业中,属于民营企业的有 220家,主要由文化创意公司、互联网科技公司组成。属于国有企业的有47家,主要由出版社组成。依据招聘企业性质分析,可以看出出版人才需求与招聘企业的发展阶段紧密相关。随着文化产业的规模化、数字化、体系化发展,未来文化产业领域的高新技术企业、“专精特新企业”等创新型企业数量将不断增加,面向出版人才的需求数量和需求内

涵将呈现更多新特点。另外,招聘单位中有 66家通过高新技术企业认定,其中90%以上属于专业技术服务业,且有36家高新技术企业同时被认定为“专精特新企业”或“瞪羚企业”。“专精特新企业”指的是专业化程度高,在精细化、特色化和创新能力上表现优秀的中小企业。“瞪羚企业”指的是以科技创新或商业模式创新为支撑进入高成长期的中小企业。本文的研究样本中文化产业领域仅有1 家“专精特新”企业——上海朗鹰教育科技股份有限公司。这在某种程度上也折射出国内大多数文化创意公司的发展困境:由于规模体量较小,仍采用较为传统的内容生产方式,对内容生产体系投入不足,对前沿技术运用不足。在“十四五”期间大力发展融合创新的数字经济、实施文化数字化战略的背景下,亟须通过“政产学研”各方协同合作,推动更多从事数字出版、数字创意、数字娱乐、网络视听等重点数字文化产业领域的中小企业突破数字化转型中的关键短板,培育更多文化产业领域的“专精特新”企业。

此外,随着新媒体和数字出版的快速发展,新媒体岗位接收毕业生的数量超过了部分传统出版岗位。招聘单位的“无明确要求” 岗位多为面向大中专应届毕业生的美编、校

对、印制、排版等非核心岗位。不少出版机构取消了此类岗位设置,大多数相关业务需求通过社会化外包实现。随着AI的迅速发展,未来这类岗位被人工智能替代的风险也较大。 随着出版机构、文化企业以及传统行业企业倾向于通过建立全媒体传播矩阵进行品牌建设,运营/营销/销售类的人才需求也明显增加,与编辑类人才共同成为出版业可持续发展的主力军。

3.运营/营销/销售类岗位更多吸纳本科和专科人才,编辑类岗位呈现细分趋势

本文将招聘单位机构类别划分为“重点出版单位”和“文化企业及其他出版单位”两大类。其中,“重点出版单位”是指属于上海新闻出版局官网公布的期刊单位和被图书出版机构名录列入的出版单位,[12]且这些单位均能在前程无忧网站上被查询到。通过数据匹配发现,上海新闻出版局官网上公布的632 种上海期刊的主办单位和38家图书出版机构中,共有16家在前程无忧网站上发布招聘信息,其中,期刊主办单位7家,图书出版机构9家。

招聘单位对学历的要求分为中等学历、大专、本科、硕士研究生、博士研究生等不同层次。五类出版人才招聘岗位对应的学历层次需求分布如表1所示。依据岗位一学历匹配分析,出版人才岗位需求中编辑类岗位占比最大,学历要求以本科和硕士为主;其次是运营/营销/销售类岗位,学历要求以本科和专科为主。运营/营销/销售类岗位的出版人才需求仅次于编辑类岗位,这与传统出版机构和新兴出版机构都重视营销和运营有关。 重点出版单位的学历层次需求以本科、硕士为主。值得注意的是,按照经验判断,上海期刊中学术期刊占比不小,大多要求编辑具

有博士学位,但由于本研究样本来源的局限性,表1呈现的学历层次需求分布存在一定偏差,这是未来研究需改进的地方。文化企业及其他出版单位的学历层次需求则以本科、专科为主,需要更多应用型、技能型人才。 此外,随着出版业数字化转型持续向纵深发展,上海的出版机构在出版融合进程中,对网络运维等常见工程师岗位和自然语言处理工程师等AI技术岗位的人才需求凸显。

领英(Linkedln)《2021年中国新兴职业趋势报告》显示,领英平台内发布的与内容营销相关的岗位中,内容制作人、编辑、主播等均为热门职位。伴随着直播经济、“耳朵经济”市场规模的稳步扩大,新媒体出版机构对一线采编设计人才、市场营销人才、生产复制人才等应用型、技能型人才需求缺口仍然较大。结合对岗位职责和任职要求的内容分析,产品类、设计类、技术类岗位需求往往与数字阅读产品和服务、数字产品用户界面设计和用户体验设计、数字产品和数字内容解决方案的开发等由出版融合发展催生的新业务相关。

整体上看,编辑类岗位对学历的要求高

于其他岗位,但就编辑类岗位细分而言,学历要求差异明显。重点出版单位从顶层设计上对专业复合型人才需求较大,其编辑类岗位体现了明显的高学历(硕士及以上)需求和专业学科背景需求。“新媒体编辑”岗位的需求则不同于传统编辑岗位,其学历要求以本科、大专为主,在岗位的具体要求上,对新媒体(如微信公众号、微博、直播平台等) 应用的技能要求较高。

表2是编辑类岗位的学历层次需求分布。 可以看出,同为编辑类岗位,细分类别和方向的不同对学历要求的差异也较大。由于前程无忧网站上招聘企业对编辑的岗位要求描述较为庞杂和零散,为了便于区分,本文首

先剔除了那些明显指向影视广告、影视动画、影视编导等相关专业的岗位,如“视频编辑”; 并依据相关文献,结合实际对“编辑”类岗位进行归并,统一划分为“版权编辑”“策划编辑”“美术编辑”“期刊编辑”“数字编辑”“图书编辑”和“新媒体编辑”。分析结果显示,对“新媒体编辑”的需求数量最多,占编辑类岗位的61.77%;其次是“图书编辑”,占编辑类岗位的17.51%。要求硕士学位的岗位数最多的依次为“图书编辑”“新媒体编辑” “期刊编辑”和“策划编辑”。随着出版“走出去”战略的深入实施以及出版高质量发展的需要,与“版权编辑”对应的翻译人才、版权人才需求也在增加。广义编辑范畴内的“新媒体编辑” “策划编辑”“美术编辑”,学历门槛与具体的工作要求密切相关。以“新媒体编辑”为例,同为“新媒体编辑”,大众媒体平台编辑如公众号运营、短视频直播等学历门槛较低,学历要求专科及以上即可;而专业媒体平台编辑的工作与专业领域的学术推广、面向受众的知识服务有关,学历要求本科或硕士及以上。这类高学历人才需求在健康传播、医学科普领域体现得尤为明显,这也是在本文的研究样本中有一部分“新媒体编辑”岗位的学历要求“硕士及以上”的原因。

此外,随着“数字编辑”被纳入修订后的新版《中华人民共和国职业分类大典》的职业体系,国家层面也正在研究数字编辑岗位的岗位职责、技能要求等系列行业标准,引

导数字编辑专业职业技能人才培养。相应地,“数字编辑”岗位也开始出现在招聘信息中,如上海辞书出版社发布的“数字编辑”岗位,其岗位职责主要涉及《辞海》网络版、聚典数据开放平台等数字产品的审读、数字化选题的策划、数字产品的设计与优化等工作。 随着出版机构对品牌运营和多元化战略的日益重视,传统的“美术编辑”岗位及功能正在向“视觉设计师”岗位演变,如华东理工大学出版社发布的“视觉设计师”岗位,其岗位职责不局限于图书设计,而是扩展到电商营销端产品侧、活动侧的设计以及短视频拍摄等。 这些编辑类岗位名称的变化折射出上海出版机构在时代变迁下的人才需求新特征。

4.不同編辑类岗位对人才的专业知识需求差异化明显

编辑类岗位往往同时面向多个学科专业招聘,为了凸显学科专业类别之间的差异,本文将招聘文本中涉及的近40个学科专业归为4大类:编辑出版类、理工生医类、语言文字类和人文社科类(不含编辑出版、语言文字)。表3对531个编辑类岗位的任职要求中关于学科专业要求的描述文本进行细粒度标注和名称规范化,将编辑类岗位归并为版权编辑、策划编辑、美术编辑、期刊编辑、数字编辑、图书编辑、新媒体编辑7个类别,涉及上述的4个学科大类。其中,编辑出版类专业人才需求占比最小,语言文字类专业

人才需求相对较高。

7类编辑岗位的招聘要求中学科专业为 “专业不限”的占23.75%,整体存在“宽口径” 趋势。新媒体编辑和图书编辑这两类岗位需求的学科专业跨度较大,涉及的学科专业往往与所从事的具体工作较为相关。版权编辑类岗位的工作主要涉及图书的版权引进和版权输出,与国外出版方、出版代理机构打交道较多,对英语基础要求较高。并且,随着越来越多的图书版权输出到小语种国家,出版机构对德语、法语、西班牙语等小语种版权编辑的需求不断增加。策划编辑类岗位对选题能力、沟通能力、用户思维、市场意识要求较高。图书编辑类岗位对书稿加工、编校能力、文字功底要求较高。期刊编辑类岗位要求具备与刊物刊载内容相关学科领域的专业知识,能够对稿件进行学术把关、组稿、审稿和编辑加工,对专业背景和学术水平有一定要求。美术编辑类岗位负责排版及整体美工设计等工作,对美术功底和审美能力要求较高,学科专业需求以艺术学等人文社科类为主。对新媒体编辑类岗位需求的激增与媒介数字化发展紧密相关,该岗位需要根据平台的特点和用户需求,进行内容创作、内容运营、数据分析和用户互动,对数字创新能力、数字平台运营思维等要求较高。

5.特别重视职业技能和数字素养,雇主普遍关注软技能

为了解本次调查样本中对出版人才技能的总体需求情况,本文选择以531个编辑岗位的“任职要求”文本作为文本集,对招聘信息中的“任职要求”文本进行语义分析,提取有关技能需求的特征词,并采用LDA主题模型对大量技能特征词进行分类,总结对出版人才的技能需求类别。

首先,对有关技能的关键词进行提取。 采用TF-IDF模型对“任职要求”的文本信息进行关键词提取,并对Top50的关键词排序。 (见表4)从表中可以看出,招聘单位十分注重“经验”“沟通”“热爱” “团队”“责任心” “抗压”“扎实”等专业素养和职业精神,同时也重视“文字功底” “策划”“设计” “表达能力” “软件”“文案”“新媒体”等职业技能和数字素养,在软技能上普遍关注人才的沟通能力和问题解决能力。对出版人才技能的需求呈现注重专业素养和职业精神,以及特别重视职业技能和数字素养的特点。

其次,对编辑类岗位的技能需求类别进行划分。本文依据pyLDAvis生成的图表来确定最佳主题数(见图4),将pyLDAvis生成的没有重叠圆的图表对应的最大K值作为确

定最佳主题数的判定标准。通过LDA模型的运行迭代优化,比较不同的pyLDAvis图表,发现当分类主题数K达到4时,图表上没有重叠圆;K达到5时,图表上有两个圆重叠; 当K超过5时,图表上有两个以上的圆重叠。 因此,本文确定最佳主题数为4。

采用pyLDAvis对各类主题进行可视化分析,图4 (a)的气泡分布表示不同主题及其关系。气泡的大小及编号表示主题出现的频率,编号数字越小,频率越大。气泡之间的位置远近表达了主题之间的接近性。若气泡有重叠,则说明这两个主题的特征词共现。 图4 (b)是主题(主题1)内前30个跟该主题相关度较高的特征词,可用于探索概括该主题的特征。图中条块表示对应的词在文本集中出现的词频,灰色部分表示对应的词在该主题中估计的词频。在一词多义、否定词搭配等情况下可能会出现黑色部分较多的情况。图中标注的“26% of tokens”表示主题1 在文本集中的权重为26.00%,反映其在编辑岗位“任职要求”文本集中的热度与关注度。

主题1包含“热爱”“责任心” “耐心”“细心”和“抗压”等词,倾向于对职业精神的要求;主题2包含“沟通”“团队” “策划”“设计” “表达能力”和“短视频”等词,倾向于对专业基础技能的要求;主题3包含“学习”“合作” “扎实”“研究生”“分析”“信息”“资格”和 “计算机”等词,倾向于对专业拓展技能的要求;主题4包含“本科”“文字功底”“英语” “内容”“创意” “撰写”和“语言”等词,倾向于对知识素养的要求。因此,对编辑类人才技能的需求可以解读为4个主题,分别是职业精神、专业基础技能、专业拓展技能和知识素养。由531个编辑类岗位“任职要求”文本构成的文本集中,主题1占比为26.00%,主题2占比为25.20%,主题3占比为24.50%,主题4占比为24.30%。从主题权重分布上看,4个主题的重要性基本相当,相对而言,职业精神对编辑岗位最重要。

四、结语

依据以上实证研究结果,并结合上海出

版人才培养的现状,对我国出版人才培养可能存在的问题展开讨论。

第一,出版人才培养定位局限于传统出版,对泛文化行业的人才需求回应不够。但传统出版机构对出版人才的就业容纳能力有限,泛文化行业对出版人才的需求则相对旺盛。人才供给方面,高校的出版人才培养体系尚未能与时俱进,教育链、人才链与产业链的匹配度不高。高校培养的本科、专科学历的编辑出版类人才已较难直接进入传统出版机构的核心岗位。同时,由于缺乏相应专业技能,导致应届毕业生难以快速适应内容产业和创意产业中全媒体运营、互联网音视频内容创作等新兴职业。尽管一些高校近年来开设了与新兴出版人才相对应的“网络与新媒体”等专业,缩减了 “编辑出版”等一些供需错位的专业规模,但整体而言,高校出版人才的培养在专业优化和调整布局上亟待提升。

第二,出版人才培养缺乏开放的制度设计,尚未形成多元参与的人才培养模式。面对出版行业涌现的新兴职业,由于高校缺乏针对性的专业且教学内容比较传统,导致初入职场的出版人才需要依靠自学或企业内部培训等方式掌握业务知识,仍未脱离“野蛮生长”和“传帮带”的学习方式。雖然部分高校的出版类专业已经开设了与市场需求衔接的相关课程,如一些高职院校通过专业共建等方式开设全媒体运营等相关课程,但存在教授内容无法与时俱进的痛点。此外,大多数新媒体出版机构从业者的职业发展路径模糊,出版领域人才互动交流不畅导致隐性知识难以显性化,职业技能和领域知识的扩散不畅通,开放式的适应市场需求的普及化、体系化的技能学习平台缺乏。政府、用人单位、高校、培训机构协力进行的出版人才培养制度设计缺乏,尚未形成多元参与的人才培养模式。

第三,出版在职人员培训内容针对性不强,无法对专业工作提供持续支持。目前,与新媒体相关的出版人才培训存在职业教育渠道整体偏少、职业针对性较弱、培训课程内容相对单一、教育课程和服务不够体系化和标准化等问题,缺乏更加标准、系统、重视职业变现的职业教育与终身服务。以出版专业职业资格考试、职称评定、继续教育培训为一体的,系统化的适应数字编辑等新职业发展的技能教育培训体系亟须完善,新兴出版人才职业资格、职称、职业技能等级认定等渠道亟须畅通。

第四,出版人才培养的研究联盟尚未建立,对出版人才需求缺乏及时跟踪与分析。高素质应用型出版人才的短缺与传统型出版人才的供应过剩形成就业结构性矛盾,亟须多方协同解决,持续开展出版产业经济研究和新业态新模式下出版从业人员的调查,根据市场需求做好战略咨询和长远规划,提升教育链、人才链与产业链的匹配度,做好出版业高质量发展的支撑工作。2022年中宣部指导全国5所重点高校新设出版学院、出版研究院,加快了创新型、研究型、应用型出版人才的培养。但面向市场需求规模更庞大的一线就业群体,顺应新就业形态的、以技能见长的职业院校出版人才培养研究联盟尚未建立。

五、结论与建议

结合出版人才画像,对出版人才培养创新提出以下对策建议。一是彰显职业教育特性,完善出版人才培养体系。适应出版行业数字化、平台化、智能化发展趋势,将职业教育理念融入出版专业教育的改革发展,丰富出版人才培养类型,为出版融合发展提供大批高质量的应用型人才。二是顺应出版行业转型发展趋势,优化人才培养目标定位。

出版人才的培养目标定位要回应数字经济的全产业链发展、出版的“跨圈链接”、中小微企业数智化转型的需求;应注重出版人才专业素养和职业精神的培养,加强职业技能,提升数字素养。三是深化产教对接融合,改革出版人才培养模式。联合重点出版产业链企业共建产业学院,以高质量的产教融合优化专业人才培养模式,实现专业与产业、课程标准与职业标准、教学过程与工作过程、课程考试与证书考核等方面的深度融合。四是践行终身教育理念,建好在职人员培训平台。开展出版专业技术人员的终身教育研究,完善出版专业技术人员职业资格考试制度。 引入“培训包”建设理念,推动出版业模块化在职培训体系的内涵建设发展。

参考文献

[1]李勇,陈晓婷,黄格.基于招聘数据的人工智能人才画像与培养对策[J].重庆高教研究,2021,9(5):55-68.

[2]王世奇,刘智锋,王继民.学者画像研究综述[J],图书情报工作,2022,66(20):73-81.

[3]雍志娟.基于专业领域知识服务体系的人才画像描绘及应用[J].科技与出版,2018(5):41-43.

[4]高扬,池雪花,章成志,等.杰出人才精准画像构建研究——以智能制造领域为例[J].图书馆论坛,2019,39(6):90-97.

[5]何春雨,刘灿.面向科技出版的人才画像构建与应用[J].中国出版,2021(20):40-44.

[6]王晓光,王俊芳.基于招聘信息的我国数字出版人才需求研究[J].出版发行研究,2016(10):45-49.

[7]劉蒙之,刘战伟.融合出版背景下编辑出版人才市场需求分析与培养改革思考——基于2017年就业季 120条编辑出版类招聘信息文本的词频考察[J].出版科学,2017,25(5):9-14.

[8]刘大卫,吴相仪,张婷婷.转型背景下传统与新媒体出版人才胜任素质差异及转换可能性分析[J].科技与出版,2018(3):116-121.

[9]陈明红,张倩琳,韩静.信息管理与信息系统专业人才招聘需求分析及培养启示[J].图书馆学研究,2021(20):9-20.

[10]岳铁骐,傅友斐,徐健.基于招聘广告的岗位人才需求分析框架构建与实证研究[J].数据分析与知识发现,2022,6(增刊 1):151-166.

[11]徐丽芳,罗婷,李静涵.出版融合发展人才需求结构与协同培养路径[J].科技与出版,2022(9):12-21.

[12]上海新闻出版上海版权[EB/OL],[2023-08-01]. http s://cbj.sh.go v.cn/html/zi^kxx.shtml.

Construction and Application of the Publishing Talent Portrait Based on Recruitment Data

REN Juan1)2)

Abstract:By building the publishing talent portrait,this article aims to grasp the trend of demand for publishing talents and promote the construction of publishing talent teams.The paper takes the 51job recruitment dataset as a sample,utilizes the "user profile" concept,and constructs a multi-dimensional publishing talent profile model through three processes:digitization,labeling,and visualization.It uses tools such as Python and Jieba to extract labels from various dimensions,and combines the LDA topic model and visualization tools to generate the publishing talent portrait.This research finds that the demand for publishing talents shows a trend in the pan cultural industry,private enterprises become the main parts for absoring employment of publishing talents,operation/marketing/sales positions attract more undergraduate and junior college students,the professional knowledge requirements of publishing talents are significantly different for different editorial positions,and new characteristics such as vocational skills and digital literacy are emphasized.Based on the publishing talent portrait,the article discusses the possible problems in the cultivation of publishing talents in China and proposes innovative strategies and suggestions for the cultivation of publishing talents.

Keywords:talent portrait;publishing talent;recruitment data;LDA topic model

Author Affiliation:1) Shanghai Publishing and Printing College;2) Shanghai Research Institute of Publishing and Media