人工智能技术驱动出版业新格局:国际出版市场的机遇与挑战
2024-07-15张晴
摘 要:人工智能以其高效内容生成与编辑、个性化推荐等优势,显著提升了出版物的生产效率。然而,技术革新也给版权保护、内容质量和隐私安全等方面带来挑战。人工智能技术应被视为辅助手段而非最终目的。出版行业要会用、善用、尽用新型工具,从而释放更深层次的创造力与表达力。
关键词:人工智能 个性化 版权 隐私 数据安全
科技创新是驱动各行各业实现高质量发展的核心引擎。它通过提升生产效率、削减生产成本、推动产品迭代升级与服务模式创新等方式,显著增强了行业的整体竞争力。在出版领域,科技创新催生了强大的行业新动力,通过数字出版技术、大数据分析、版权运营模式的创新和跨媒介融合的深入推进,为行业带来空前的发展契机,促进了出版效率和出版物质量的大幅提升以及与其他产业的深度融合。这些变革为出版产业的转型升级注入了新的活力,显示出新质生产力在推动出版业高质量发展中扮演的关键角色。
在国际出版市场,多年来各国出版商不断尝试各种新兴模式以打破传统出版方式的禁锢,适应市场的变化和满足读者的多样化需求。21世纪初,电子书兴起。随着电子终端的普及,电子书与传统出版形成竞合关系。自2010年起,有声书也逐渐受到市场欢迎,成为新兴出版的重要支柱。随着数字技术进一步发展,AR/VR技术、区块链以及元宇宙等前沿概念层出不穷,出版商们纷纷涉足其中,试图抢占先机。近年来,人工智能领域的核心技术——大型语言模型不断涌现,这些模型以其强大的语言处理和生成能力,为出版业的发展注入了新的活力。通过高效率的内容生成与编辑方式,结合个性化的内容推荐手段,大型语言模型不仅大幅提高了出版物的生产效率,更在专业性、准确性和可靠性方面展现出显著的赋能效果。
一、人工智能技术的法规支持
随着人工智能这一技术的迅猛发展,全球范围内对其合规性、有序性的关注也日益增强。近年来,人工智能是全球范围内最热门话题之一,并且在许多领域都有广泛的应用。然而,人工智能的发展也带来了一些问题,如数据隐私、算法透明度、人工智能决策的公正性等。为此,相关法案的出台成为一种必然趋势。为解决上述问题并确保人工智能的健康发展,一些国家和地区陆续出台相关的法规和政策。
目前,国际上关于人工智能的相关规范性文件主要有三个,分别是欧盟的《人工智能法案》(Artificial Intelligence Act)、联合国的《人工智能伦理问题建议书》(Recommendation on the Ethics of Artificial Intelligence)和我国的《全球人工智能治理倡议》。其中,《人工智能法案》作为全球首部综合性监管法案,旨在对人工智能技术进行全面监管,并为其发展营造更加优越的环境。该法案根据人工智能系统的潜在风险进行了细致分类,并针对高风险领域制定了更为严格的监管措施。[1]《人工智能伦理问题建议书》则为各国在人工智能技术的研发和应用方面提供了统一的伦理框架:强调保护隐私、促进公平公正,并要求企业在使用人工智能技术时必须确保用户个人隐私得到充分保护。[2]而我国提出的《全球人工智能治理倡议》则倡导全球合作,推动可持续发展,建立风险评估体系,分类管理风险,并呼吁建立共识基础的全球人工智能治理架构和规范。[3]尽管法案并未专门针对出版行业制定具体条款,但它为出版业等相关行业在合规的前提下探索和应用人工智能技术提供了明确的指导。
除上述具有代表性的法案外,还有许多国家和地区也在积极探索并制定适合自身国情的人工智能法规和政策。2023年10月,美国总统拜登签署《关于安全、可靠、可信地开发和使用人工智能的行政命令》(Executive Order on the Safe,Secure,and f6a1702f2456647616069cda1cd1478dTrustworthy Development and Use of Artificial Intelligence),这项行政命令体现了美国政府在推动人工智能技术发展的同时,对确保其安全性、可靠性和可信度的高度重视。除此之外,日本、巴西、加拿大、印度等国家也在着手制订有关人工智能的监管规则和发展战略。
二、人工智能技术助力出版业
出版业一直是紧跟数字技术革新的行业。随着数字技术的不断发展和普及,出版行业积极寻力、借力,不断探索、应用新技术,以适应市场的变化和满足读者的需求。而人工智能以其创新性、高效性、引领性和融合性等特点,符合出版行业对新技术的要求。随着人工智能技术的不断融入,内容创作、编辑、发行及营销等环节正在经历革命性的变化。据Digiday媒体公司调研数据显示,截至2023年初已有半数的出版商开始尝试应用生成式人工智能技术,并且预计将有更多出版商紧随其后。[4]
(一)增强内容创作,改进编辑流程
近年来,人工智能驱动的自然语言处理(Natural Language Processing,简称NLP)算法在出版业内容创作方面发挥了显著作用,引领行业深刻变革。这些算法不仅影响文字撰写方式,也极大提升了内容生成速度。传统上,撰写文章需要耗费人类作者大量时间和精力,而NLP算法则能在短短几秒内生成数千字内容,从而大幅提高内容生成效率,使出版商能更迅速地为受众提供信息。
以施普林格·自然为例,该企业成为首家授权作者将GPT模型集成到综合工作流程中的出版商。2023年初,施普林格·自然汇聚了众多作者、编辑和专家,共同完成了《GPT在财务、合规和审计中的应用》(Einsatzm glichkeiten von GPT in Finance)德文图书,并顺利出版。该书从构思到出版的整个过程仅用了不到五个月时间,相较于传统出版流程,效率显著提高。[5]
人工智能技术也正深刻改变着传统编辑流程,使得编辑和校对效率得到了显著提升。该技术不仅能够执行细致的语法检查,还能评估文稿是否符合特定的写作风格和要求,从而大幅提升了出版物的整体品质和专业水准。
以康泰纳仕的Genius平台为例,该平台作为一个专为创作者设计的全方位内容管理和分发平台,提供了强大的内容管理功能,简化多种格式内容的上传和编辑流程,还通过与多渠道的合作,实现了内容的广泛推送。同样,企鹅兰登书屋也致力于深入挖掘人工智能在出版领域的应用潜力。借助新技术,企鹅兰登书屋精准地优化电子书的定价策略,并对纸质图书的首印数量作出更为明确的判断。这不仅有效地降低了库存积压的风险,还进一步提升了编辑、发行流程的整体运营效率。[6]同时,出版商在有声书方面也开始广泛应用人工智能技术。数字出版商Findaway Voices与苹果公司合作进行机器学习,而Bookwire则与谷歌图书合作推出人工智能有声读物。
(二)甄别潜在用户,推荐个性化内容
在出版行业中,人工智能技术的应用已经深入甄别潜在用户和推荐个性化内容的层面。该技术通过分析用户行为和兴趣偏好等数据,构建精细的用户画像,进而精准地预测和满足用户的个性化需求,为用户提供量身定制的内容。当读者接触到与其兴趣相匹配的内容时,读者的参与度和内容消费量会显著提升。此种优势往往体现在有线上浏览功能的企业平台上。
在内容推荐方面,《纽约时报》的推荐系统能够根据读者的阅读历史和偏好,智能地推送个性化文章。为实现更精准推荐,其旗下研究团队还构建了学习模型,采用“多标签分类”方法对文章进行精细化主题划分。[7]同时,麦格劳-希尔通过其个性化学习平台ALEKS(Assessment and Learning in Knowledge Spaces),成功地将人工智能应用于教育资源中。该平台能够根据学生的知识水平、学习需求和进度,提供定制化的学习内容和实时反馈,从而确保每位学生都能获得符合其个人特点的教育资源。[8]赫斯特杂志则利用人工智能技术深入探究读者参与度并精准预测广告效果。他们通过运用谷歌云自然语言API对大量文章进行排序、标注和分类,有效地根据内容类别预测广告表现。[9]企鹅兰登书屋在北美推出综合分析工具CAT(Comprehensive Analytics Tool),CAT不仅可以分析市场数据,还能深入挖掘读者的阅读兴趣和偏好。同时,威科的重要业务板块医疗卫生业务涵盖了向全球提供的临床诊断工具UpToDate、临床用药数据库Medi-Span与Lexicomp等产品。上述产品已经广泛开展人工智能、自然语言处理以及预测性分析等技术的深入应用。
(三)先行市场调研,预判行业形势
近年来,人工智能技术的崛起为出版商提供了全新的视角,能够更加高效和精准地进行市场调研和行业形势预判。通过利用人工智能的数据处理和分析能力,出版商可迅速整合并解读多渠道的海量数据,进而基于这些数据做出明智的决策,指导其在收购、内容战略以及发行渠道等方面的选择。
人工智能在市场调研中的优势主要体现在其强大的数据处理能力和精准的趋势识别能力上。相较于传统的市场调研方法,人工智能从多元化的数据源中挖掘出有价值的信息,如社交媒体、销售记录和读者评论等。人工智能通过识别、挖掘新兴趋势和受众偏好,精准地指出市场的热点和趋势。
除了趋势识别,人工智能还在出版商的收购环节中发挥着重要作用。借助人工智能算法,出版商可以根据多种因素预测图书或内容的潜在市场表现,从而提高收购项目的评估效率,降低风险。以企鹅兰登书屋为例,该公司在德国推出“灯塔”(Lighthouse)应用程序就是利用人工智能技术进行市场调研和趋势预判的典型案例。通过这款应用,企鹅兰登书屋能够获取关于市场趋势、热销图书类别、读者阅读习惯等方面的核心信息。这些数据为企鹅兰登书屋提供了重要的决策支持,使其能够更准确地把握市场动态,并及时调整出版策略以满足读者需求。哈珀·柯林斯则是另一个成功利用人工智能进行预测分析的公司。该公司利用人工智能技术来预测分析行业趋势走向,并据此定制营销活动。该策略不仅增强了哈珀·柯林斯根据读者需求提供合适图书的能力,同时也改进了其营销预算的分配方式,从而确保资源能够被精准地投放到最具潜力和效果的营销活动之中。[10]
(四)智能翻译助力,精准触达全球读者
随着全球化步伐的加快,出版商们一直以来不断积极拓展其国际影响力,努力使自家内容触达世界各地的读者。在此背景下,人工智能技术驱动的翻译工具应运而生。在这些工具高效翻译能力支撑下,能将各类图书和资料迅速转化为多种语言,缩短出版物的全球推广周期。当然,人工审核环节仍不可或缺,语言的细微差别、习语运用以及文化背景等关键因素需要特别注意,以确保翻译内容既贴近本地文化,又能引起目标受众的共鸣。欧盟在这方面的实践便是一个生动例证。面对27个成员国、24种官方语言的复杂环境,欧盟面临着语言多样性的挑战。为确保各项重要文件和政策能够及时、准确地传达至所有成员国,欧盟采用了先进的人工智能翻译解决方案。这些方案不仅有效弥合了语言鸿沟,还促进了信息的即时传递与深入理解。由此可见,人工智能在处理复杂多语言内容方面展现出了显著的实力,同时也为欧盟内部的顺畅沟通与高效决策提供了有力支撑。
(五)识别残障用户,提供无障碍访问
数字时代技术的进步正逐步消除信息获取障碍,人工智能技术以其独特优势引领信息无障碍变革,让所有人包括残障人士都能平等、便捷地访问内容。具体而言,文本转语音(Text To Speech,简称TTS)系统作为人工智能技术的典型应用之一,利用先进的自然语言处理算法,将书面文本高效转换为清晰的语音输出。对于视力受损或存在阅读障碍的人群而言,文本转语音技术无疑为其创造了独立阅读和学习的可能。此外,人工智能驱动的盲文转换器也为依赖盲文阅读的残障人士带来便利。屏幕阅读器则是另一项对视力受损者至关重要的辅助工具。这类由人工智能驱动的应用程序能够解读数字内容并提供实时的听觉反馈,帮助用户独立浏览网站、文档和各类应用。
在实际应用方面,亚马逊的线上平台就嵌入了文本转语音功能,为视力受损读者提供了访问庞大电子书库的便利。同时,其数字阅读终端Kindle则提供了包括文字大小、字体和背景颜色等在内的多项可定制选项,以满足不同视觉需求的读者,展现了人工智能在创建以可访问性和用户多样性为核心数字环境方面的巨大潜力。
三、人工智能技术面临的挑战
虽然,人工智能技术在出版业的应用大大提高了出版流程的效率,但同时也伴随着一系列挑战。其中,版权保护问题尤为突出,人工智能技术可能会被滥用于非法复制和传播受版权保护的作品上,从而损害作者和出版商的合法权益。此外,图书内容质量也面临考验,自动化生成的内容有时难以保证其品质和深度。同时,隐私和数据安全亦不容忽视,读者在使用人工智能个性化推荐等服务时,个人信息可能被收集并用于不透明的数据分析,从而引发隐私泄露的风险。
(一)版权保护问题凸显
随着人工智能生成内容量的激增,版权保护问题也随之凸显。首先,作者对其作品被用于训练AI模型表示了强烈的担忧。OpenAI公司开发的ChatGPT模型,因使用多名著名作家的作品进行训练而卷入了多起版权侵权诉讼。[11]截至目前,OpenAI已屡次因涉嫌侵权莫娜-阿瓦德(Mona Awad)、保罗-特伦布莱(Paul Tremblay)以及莎拉-西尔弗曼(Sarah Silverman)等享誉文坛的作家的版权而遭到起诉。同时,作家协会(Author’s Guild)也对OpenAI提起了指控,称其未经授权利用作家作品训练人工智能模型的行为触犯了版权法。《纽约时报》也公开表示将起诉OpenAI和微软,指控其人工智能系统用《纽约时报》的内容进行的训练已构成版权侵权。《洛杉矶时报》(Los Angeles Times)刊登了一篇由超过9000名作者联名签署的公开信,信中表达了作者们对人工智能公司在未经授权的情况下使用其作品来训练人工智能模型的强烈反对,要求相关企业尊重他们的创作成果和权益。[12]种种诉讼案件也表明了人工智能技术在版权应用方面的问题亟待解决。
(二)图书质量令人生忧
随着人工智能技术的迅猛发展,无论是传统出版渠道还是自助出版平台,图书市场涌现出大量借助人工智能生成的作品。尽管数量激增,但质量却参差不齐,引发业界对内容质量的广泛担忧。Oii.人工智能公司表示,大量涌现的人工智能生成图书所带来的风险不容忽视:大量低质量作品涌现,使得读者难以辨别佳作和人工智能生成的劣质内容。丽贝卡·雅罗斯(Rebecca Yarros)的奇幻小说《第四翼》(Fourth Wing)借助BookTok平台的宣传推广,自2023年5月问世后全球销量突破200万册,名声大噪。但仅几个月,续集《铁火焰》(Iron Flame)便于2023年11月匆忙上市。按传统出版流程,从策划、出版到印制、发行以及销售这一系列流程,读者往往需要至少等一年才能迎来新作。然而,读者发现《铁火焰》中错别字、段落颠倒、地图及文字遗漏等问题层出不穷。为此,业界猜测皮亚克斯出版公司(Piatkus)为抢占市场先机,结合该书的上市周期,采用了人工智能撰写手段。[13]为应对不断涌现的自助出版作品,防止人工智能作品的泛滥,亚马逊对KDP自助出版平台的作者实施了一项新政策,限制作者每天最多只能在亚马逊平台上以自助出版方式发布3种图书。巴诺书店(Barnes & Noble)则明确表示不会出售人工智能生成的图书,并强调对顾客的告知义务。在这一背景下,检测人工智能使用情况的新行业应运而生,例如Optic、CopyLeaks和GPTZero等。但这些人工智能检测手段是否能跟上人工智能技术本身迭代的速度也是提升出版内容质量所面临的一大难题。
(三)隐私和数据安全存在隐患
个性化推荐性能已成为人工智能提升用户体验的核心竞争力,人工智能技术通过深度分析用户的行为、偏好等多元数据,为用户推荐更为精准的内容。然而,这种对用户数据的广泛收集与利用,在日益重视个人隐私的当下,也难免存在隐私和数据泄露的风险。同样,出版行业利用人工智能技术过程中也存在相关的案例。例如,某在线阅读平台在未经用户明确同意的情况下,收集并分析用户的阅读习惯和偏好,用于优化其推荐算法,这种行为就违反了数据保护原则。另外,如相关企业因数据安全防护措施不到位,导致用户数据被黑客窃取,进而造成严重的隐私泄露事件。
为应对上述隐私和数据安全问题,欧盟《通用数据保护条例》(General Data Protection Regulation,简称GDPR)、加拿大《个人信息保护与电子文件法》(Personal Information Protection and Electronic Documents Act,简称PIPEDA)和美国《加州加利福尼亚消费者隐私法》(California Consumer Privacy Act,简称CCPA)等数据保护法规相继出台,对包括出版行业在内的相关企业在用户数据收集、使用和保护方面提出了明确要求。这些法规强调,企业在利用用户数据前必须获得用户的明确同意,并确保数据使用的透明度和用户的知情权。
四、结语
在数字技术日新月异不断迭代中,人工智能技术正发挥着举足轻重的作用。其显著优势对出版物在内容创作、编辑流程优化以及市场分析等多个层面有着显著的影响,也为出版业带来了前所未有的发展契机。然而,凡事都有正反面,机遇往往也与挑战并存,版权保护、质量把控以及隐私和数据安全等问题逐步凸显。技术发展并非目的,而是辅助人类实现更多创造能力的手段。正如德国哲学家海德格尔所言:“技术是时代的座驾,然而能够驾驭技术从而影响时代进程的,永远是具有主体意识的人。”作为文化的创造和传播者,出版从业人员在接受新兴技术的同时,也要会用、善用、尽用新型工具,从而释放更深层次的创造力与表达力。
(作者单位系中国新闻出版研究院)