AI时代的教育出版研究
2023-10-27杨凡
【摘要】生成式AI与教育出版领域的融合发展已经是必然趋势,两者互为支撑、协同并进。生成式AI虽然为教育出版在AI时代的深融创新提供了诸多机遇,但也带来技术本体危害、行业发展危机等问题。教育出版机构应通过新兴技术的驱动与赋能,探索融合运用生成式AI的发展路径:革新理念,立足时代趋势推进技术融合新实践;明确标准,建立科学规范强化行业融合实效;联合共赢,通过跨界协作打造出版融合新生态,加速实现教育信息化甚至是智慧教育目标。
【关 键 词】生成式AI;教育出版;融合;智慧教育
【作者信息】杨凡,人民教育出版社。
【中图分类号】G230.7【文献标识码】A【DOI】10.16491/j.cnki.cn45-1216/g2.2023.16.005
近年来,AI技术发展迅速,并在《新一代人工智能发展规划》《新一代人工智能治理原则——发展负责任的人工智能》《促进新一代人工智能产业发展三年行动计划(2018—2020年)》等相关政策下向社会多个行业领域渗透,甚至成为产业变革和行业转型升级的核心力量。在出版领域,基于AI技术赋能的智能出版或智慧出版已经是行业发展的重要方向之一,包括但不限于大数据选题规划、机器内容生产、智能编审校对以及个性化智能服务等。其中,以江苏凤凰出版传媒股份有限公司、中国科技出版传媒股份有限公司、浙江出版传媒股份有限公司、中信出版集团等为代表的业界机构已先后开启“AI+教育+出版”的发展创新之旅,旨在利用AI技术的核心优势重塑出版业态,为自身乃至行业的深融创新提供源源不断的动能。
生成式AI与教育出版领域的融合发展已經是必然趋势,两者互为支撑、协同并进。一方面,生成式AI的应用为解决传统教育出版领域的技术短板提供了更多可能,成为AI时代行业转型升级与高质量发展的重要动力;另一方面,教育出版为生成式AI的创新应用提供了更多场景空间,是技术造福社会的直观体现。当然,生成式AI虽然为教育出版在AI时代的深融创新提供诸多机遇,但也带来挑战。正因如此,在精准把握机遇的同时科学规避挑战,无疑是教育出版融合生成式AI的首要问题。
一、教育出版融合生成式AI的机遇
1.国家重要政策引领
国家重要政策的出台,为AI时代教育出版融合运用生成式AI提供了引领与支持。早在2018年4月,教育部印发《教育信息化2.0行动计划》,要求以人工智能等新兴技术为基础,依托各类智能设备及网络,积极开展智慧教育创新研究和示范,推动新技术支持下教育的模式变革和生态重构。教育出版横跨教育和出版两大行业,只有顺应政策引领,加快对生成式AI的融合应用,以此赋能自身创新发展,才能为教育信息化和智慧化建设贡献力量。随后,教育部针对教育信息化和“互联网+”教育陆续发布多个重要文件。2021年12月,国家新闻出版署印发《出版业“十四五”时期发展规划》,要求突出科技创新在实现深度融合发展中的重要作用,大力推动5G、大数据、云计算、人工智能、区块链、物联网、虚拟现实和增强现实等技术在出版领域的应用。在此背景下,作为行业重要组成部分的教育出版,自然要顺应趋势,加快对生成式AI的融合运用。2023年7月,国家网信办联合国家发展改革委、教育部、科技部、工业和信息化部、公安部以及广电总局联合发布《生成式人工智能服务管理暂行办法》,并明确自2023年8月15日起施行,这不仅对教育出版融合利用生成式AI提供了引领和支持,也对行业规范技术应用场景和用户安全保护起到积极有效的作用。
2.教育产品迭代驱动
教育产品的迭代驱动,是教育出版融合生成式AI的重要动力。近年来,“互联网+教育”、在线教育等发展趋势日益鲜明。相对于传统教材和教辅产品,人们更倾向于数字教材教辅产品或在线教育平台。在此背景下,教育出版进入发展新阶段,以AI技术为发展核心的着力点逐渐确立,旨在打造出更具迭代性、场景化、智能化的教育产品,加速自身的转型升级。目前,无论是培生集团等国外出版商,还是人民教育出版社等国内教育出版机构,都在加速布局智能教材。人民教育出版社于2016年率先开启二代数字教材开发之旅,又于2018年发布第三代教材。该教材主要利用互联网、AI、数字媒体、大数据等技术,创造性实现人机交互目标,为信息化教育和个性化学习提供有效解决方案。从这个角度看,从纸质教材教辅产品到数字教材教辅产品,再到智能教材教辅产品的迭代升级,是教育出版的核心发展规律,而以AI为代表的新兴技术,则是实现教育出版产品迭代升级目标的重要驱动力。
3.用户市场需求刺激
庞大的用户市场需求,为教育出版融合生成式AI提供了利好机遇。近几年,我国图书零售市场较为低迷,2022年累计码洋871亿元,同比减少11.8%,低于2018年同期水平。然而,教辅类码洋比重则不降反升,占到全年的16.63%,达到140亿元。另有数据预测,2023年在线教辅市场规模将超千亿元大关。其中,数字教材、智能教辅等教育出版产品备受用户市场青睐,这也导致大量在线教育企业纷纷入局,与传统教育出版机构形成了激烈竞争态势。相关数据显示,仅2020年,我国新增在线教育企业9.4万家,新增占比达到16%。在此背景下,传统教育出版机构要想加快布局教育出版赛道,必然要基于庞大的用户市场需求,利用新兴技术打造契合度高、服务成效好的数字教育产品甚至智能教育产品,这对教育出版融合AI等新兴技术起到了促进作用。
如人民教育出版社联手中教云推出数字化教辅产品——智能教辅APP,该产品以社内专业优质资源为主体,以AI学习场景为依托,目前市场规模已达百万量级。不仅如此,目前已有多家教育出版机构先后与科大讯飞、华为、方正电子等企业携手开发百余种数字教材或智能教辅产品。随着AI时代的到来,生成式AI有望成为教育出版乃至在线教育、智能教育领域的下一个技术风口,其强大的性能优势和潜在用户需求,必然会助力教育出版“再上一层楼”,加速实现智慧教育出版目标。
二、教育出版融合生成式AI面临的挑战
1.技术本体危害
当前,生成式AI还处于优化完善阶段,其与教育出版的融合极可能因为技术本体的不确定性而产生诸多现实问题。
其一,生成式AI的专业性和创造力仍有限,引入教育出版领域很可能生成并传播错误甚至有害的“知识”,这与教育出版的专业性背离。作为一个预训练语言模型系统,生成式AI可能因为算法和语库的偏差导致错误或缺乏事实来源内容的大肆传播,甚至由此产生有害信息,从而对教育出版导向和教育目標追求产生负面影响。
其二,目前可供中文语境下使用的生成式AI水平有待提升,缺乏预训练大规模语言模型,极易导致教育出版在技术融合过程中出现不可控风险,如用户隐私泄露等。
2.行业发展危机
教育出版融合生成式AI可能造成行业发展危机。
一是融合技术的成本和要求较高,且短期内无法预见成效收益,这对行业机构是一项风险投资。生成式AI与各行各业融合发展的前提是高昂的人力、物力、财力成本。国盛证券曾估算,ChatGPT-3训练的成本约140万美元,而对于一些更大的LLM模型,其训练成本介于200万美元至1200万美元之间。此外,生成式AI的通用模型构建、数据收集与分析、算法设计与运行等方面都离不开专业人才资源的支持。从这个角度来看,教育出版融合生成式AI首先需要投入大量资金和培养专业人才,这对普通出版机构尤其是中小型出版社无疑是一个现实挑战。
二是教育出版融合生成式AI技术,需要广泛爬取海量数据用于构建行业专业训练模型。它们虽能自动生成有价值的内容,却也可能引发内容侵权危机,危及行业健康生态。例如,通过生成式AI获取的内容数据来源复杂且体量庞大,可能在教育出版过程中造成版权侵权等知识产权问题。此外,生成式AI介入教育出版全流程,可能造成大幅变动,与现有运行和管理机制产生矛盾。
三、教育出版融合生成式AI的优势
教育、出版及技术本就是深度互嵌的关系。尤其在高质量发展的新阶段,加快教育出版与AI等新兴技术的深度融合与创新发展,已然是出版业乃至所有内容行业重要的转型之路。在以生成式AI为代表的时代浪潮下,教育出版既要抓住新一轮发展机遇,也要采取合理策略有效规避危机挑战。其中,厘清自身特殊优势,构建一条技术融合可行路径无疑是首要任务。
1.专业资源优势
如果说技术是教育出版的短板,那么专业资源则是教育出版的主要优势。目前已知的是,倘若缺乏大规模数据资源的饲喂和训练,再好的强化算法技术也无法催生ChatGPT、Midjourney、DALL-E2等生成式AI。换句话说,海量数据资源是生成式AI应用于各行业的前提、基础和底座。从这个角度看,教育出版机构积累至今的专业内容资源,无疑成为其融合生成式AI的核心优势。教育出版机构若对自身发展史上的每一本书、每一位作者、每一位用户进行数据化处理,从而获得体量丰富的内容数据、用户数据、交互数据,并以此作为融合生成式AI的基础,加速构建出版大规模语言预训练模型。不仅如此,现阶段的教育出版业在数字化发展过程中已经有了一定基础,如人民教育出版社的“数字资源管理平台”、陕西人民教育出版社的“教育出版数字资源库与电子书包”、北京交通大学出版社的“M+Book移动学习平台”等各种专业内容数据库和知识服务平台等,能为生成式AI的技术落地实践提供支撑。
随着出版深度融合进程加速,教育出版机构的跨界合作趋势日益明显,通过数据交换、技术互补等手段可不断扩充教育出版垂直领域的数据规模,为生成式AI的落地应用和教育出版领域的专业预训练语言大模型建设提供便利,同时以“多方共赢”机制降低自身投资风险,为教育出版乃至整个出版业的生态体系建设保驾护航。
2.既有经验优势
目前,教育出版乃至整个出版业对AI技术的融合应用不断涌现,这为其自身加速融合生成式AI提供了经验。例如,人民教育出版社目前已初步结合AI技术打造第三代数字教材;湖南教育出版社依托人工智能、大数据等先进技术开发了综合素质评价、智能测评云等产品;山东教育出版社正在建设的“分成自适应和教学测评云平台”,也是通过大数据、AI等技术赋能,以期为教育市场提供精准、个性、多元的智能产品及服务。上述案例表明,现阶段的教育出版机构在AI技术的实践应用方面已经积累了一定经验,这对生成式AI在教育出版领域的融合应用起到参考作用。
自ChatGPT出现后,国内外出版机构开启生成式AI的融合创新之旅。除Snowfox Books和浙江文艺出版社外,中信出版集团也于2023年4月对外宣布,将以建立智慧阅读新生态为目标,积极探索出版新模式,并设立“平行出版实验室”,启动“AIGC数智化出版项目”,加速生成式AI在出版全流程的应用。可见,出版机构创新利用或着眼布局生成式AI赛道,对教育出版领域的技术引进和深融创新具有引领示范作用。
四、教育出版融合生成式AI的可行路径
1.革新理念,立足时代趋势推进技术融合新实践
随着生成式AI的快速渗透和大规模普及,过去人与机器二元对立的替代思维正逐渐转变为人机协同的共生思维,各行各业逐渐迈入人机协同的AI时代。参考以往互联网、智能手机诞生和发展的过程,未来短时间内集中诞生更多生成式AI应用将是毋庸置疑的。正因如此,教育出版不能忽视或逃避新技术的发展前景,只有从理念层面彻底接受这种颠覆性技术带来的更多可能,才能以理论指导实践,成功实现自身转型升级和高质量发展。
一方面,国家相关部门及行业组织应革新思维,厘清生成式AI作为未来行业发展基座的作用,并在此基础上鼓励教育出版机构主动拥抱新技术,不断探索和优化实践应用场景,在新的时代发展趋势下重塑行业技术生态格局。具体来看,国家新闻出版署、教育部等部门应充分把握AI时代发展趋势,贯彻落实《生成式人工智能服务管理暂行办法》,明确鼓励教育出版机构创新融合生成式AI,必要时提供资金、技术等支持,帮助出版机构更好落实政策要求。
另一方面,教育出版机构从业人员要树立人机协同新思维。针对行业垂直领域的场景业务需求和内容生产工作加大技术培训力度,帮助他们充分认知生成式AI的功能作用和风险挑战,使他们在具体岗位上既能合理利用新技术,又能自主摆脱技术依赖,防止技术沉沦导致的内容偏失、价值观异化和创新思考力消解等问题,在技术赋能的基础上持续为用户提供积极健康、向上向善的优质内容。
此外,学校等教育机构也要注重对用户思维的重塑与优化。例如,学校在引进生成式AI教育出版产品及服务的同时,要加大对教师、学生等用户主体的科学引导,让他们既掌握智慧教育与学习产品的使用技能,又能不断规范和提升自身的数字素养水平,在保障教育公平的同时,防止教育异化现象。
2.明确标准,建立科学规范强化行业融合实效
生成式AI不仅能改变教育出版活动中师生之间、校企之间的关系,催生更多元、个性、自主的行业发展模式,还能加速非专业内容的大范围快速传播,甚至导致版权纠纷等行业问题。因此,在教育出版融合运用生成式AI的过程中,我们必须始终坚持以人为本、科技向善的发展原则,高度重视生成式AI可能导致的伦理风险挑战,从法律和技术等层面建立科学规范,提升行业融合发展实效。
一是国家立法机关和行业监管组织应在已有法律法规的基础上进一步细化完善,以更有区分度的监管措施和技术规范为教育出版乃至整个出版业融合运用生成式AI提供标准指引,强化行业发展实效。立法机关可在《生成式人工智能服务管理暂行办法》的基础上进一步实现对生成式AI技术风险全面类型化和场景化的区分。如基于场景把监管做得更精细化,针对不同技术路线、应用模式和责任主体,在不同场景中分别设置对应的法律义务。国家新闻出版署等行业主管部门也可参考欧盟等国家和地区的人工智能法案,结合我国出版业实际制定鼓励作用和监管效果兼具的行业技术规范或应用标准,为教育出版领域融合生成式AI可能产生的内容风险和现实挑战提供有效遵循。
二是以技术规制技术,强化行业融合实效和技术应用规范。清华大学人工智能研究院视觉智能研究中心主任邓志东教授指出,通过模型优化训练的方式防止再次生成侵权内容虽在技术上难以实现,但利用价值对齐的算法采取内容过滤等措施或可实现。具体来看,教育出版机构和技术研发机构应针对生成式AI的融合应用环节采取有效手段。在内容抓取环节,打造更高级、更敏感的语言模型,并对内容数据进行技术标注,从源头上杜绝侵权问题的发生;在内容输出环节,利用更先进的技术矩阵强化监管,及时发现问题并解决问题,从而在避免技术滥用的同时,尽可能提升行业融合发展实效。
3.联合共赢,通过跨界协作打造出版融合新生态
基于生成式AI的应用前景,构建通用大模型和建立行業专属数据训练库已成为必然趋势。目前,国内部分行业领域和先进企业已经初步形成涵盖理论方法和软硬件技术的体系化研发能力,这对解决长期困扰传统教育出版业的技术短板以及加速教育出版与生成式AI的融合创新无疑具有促进作用。在此背景下,以“联合共赢”为核心目标,推动教育出版与高新技术企业或行业先进企业的跨界协作,已然成为教育出版融合运用生成式AI的重要路径,旨在通过优势互补和强强联合,打造出版融合新生态。
一是教育出版机构可通过与高新技术企业的跨界合作,达到融合运用生成式AI的初衷,加速构建行业发展新生态。目前,科大讯飞已于2023年5月首次推出讯飞星火认知大模型,随后又升级发布V1.5和V2.0版本,实现了开放式回答的突破,进一步优化了多轮对话和教学能力。在此背景下,教育出版机构可与科大讯飞建立战略合作关系,通过其先进的技术、设备和自身的专业资源优势互补,实现融合发展目标。百度于2023年3月正式上线生成式AI技术应用——文心一言,目前合作伙伴已达650多家,其中不乏人民交通出版社等传统出版机构,这也为教育出版融合运用生成式AI提供了有益参考。据不完全统计,截至2023年8月,百度的文心一言、抖音的云雀、百川大模型、清华的智谱华章、中科院的紫东太初等生成式AI大模型均已通过审批,可向全社会全面开放,这无疑为教育出版领域的技术融合和跨界协作提供了更多的路径选择。
二是教育出版机构可通过与在线教育企业的携手合作,共建行业发展新生态。2023年上半年,好未来、网易有道、新东方、作业帮、世纪天鸿等一众在线教育公司相继接入或自主进行技术研发,在生成式AI赛道表现喜人,如好未来于2月在其学习机产品上线AI讲题机器人小π,网易有道于5月发布子曰大模型等。在线教育企业在生成式AI技术赛道的突破性进展,为双方的融合发展提供了更多可能。基于此,加强与在线教育企业或教育科技公司的深度合作,同样是教育出版机构融合运用生成式AI共同探索智慧教育多元场景和个性服务,重构行业发展新生态的科学路径。
|参考文献|
[1]王涵,江静怡,叶阳. 数字教育出版与人工智能融合发展研究[J]. 出版广角,2022(16):71-75.
[2]代杨,裴永刚. 我国教育出版智能化知识服务转型探析[J]. 出版广角,2020(14):9-11.