从因特网到ChatGPT的核心是开源

2023-05-29王炎

世界文化 2023年4期

关键词：时代

王炎

关于ChatGPT

最近媒体炒作起ChatGPT来，有人说这个AI平台将改变人类的未来，有的甚至声称将带来毁灭，恰似前一段炒作“元宇宙”。新技术的推出，会一次次给媒体带来新热点。

从数字技术发展的整个历史来看，数据规模固然非常重要，但已与机械技术时代非常不同。数据、材料、高精技术、头脑卓越的科学精英，这些虽然仍是核心硬件，但“开源”与“共享”的互动模式，才是推进数字技术迭代更新的真正力量。向全社会开放数据与技术，让不同阶层、性别、职业和不同教育背景的用户参与使用，让世界上不同民族、文化、价值观和专业的头脑献计献策，每一次用户访问都是开放平台的一次调试和升级，头脑、数据与设备互动起来，人工智能技术才能不断提高。从20世纪中期互联网发明开始，新的科技逻辑便逐渐渗透到人类生活的方方面面，并最终塑造了21世纪的时代精神：只有开放社会，科技才能进步。

发明互联网

近读美国学者阿贝特所著《发明因特网》，感触颇多。从互联网到ChatGPT的技术逻辑，其实一以贯之的都是开源与共享。

因特网起源于20世纪50年代“冷战”寒彻的美国。美国国防部担心苏联先发制人，以第一轮核打击摧毁美国的通讯网，使白宫无法下达核反击的命令，从而输掉一场核战争——情形恰似库布里克的电影《奇爱博士》（1964），于是成立“美国高级研究计划署”，拨巨款研发抵御核打击的通讯技术。

美国科学家保罗·巴兰提出一个“封包交换”的设想，即设计搭建多重中继通讯线路，以替代从信息中心辐射各地的阶梯式通讯网。他的设想是，让每一个地方的通讯交换节点，均能自主判断通过哪条线路传输信号。这样即使中枢或某条线路被摧毁，通讯网分布在不同地方的智能节点仍能自主运行，从而保证命令的上传下达。这个想法太超前了，颠覆了金字塔式的传统通讯逻辑。但是要求中继节点智能运转，则须由电脑控制，并将模拟信号转化成数字信号，以避免多重连接带来的信号衰减。当年计算机体积大、运算慢、成本高，处理数字信号的能力不够强。最终项目招标的结果是，通讯改造被老牌的AT&T电话公司夺下。AT&T仍保留从控制中枢逐级下达的旧方案，把钱花在深挖洞、加固地下核掩体、提高保护级别、优化线路材质上，而巴兰的设想则被束之高阁。

但几年后，英国科学家读到巴兰的论文，意识到这项技术可别用他途。英国人的兴趣不在军事，而在远程用户如何分享实验室里的大型计算机。当时还没有个人终端电脑，用户要租用科学机构的大型电脑。普通用户需用电话线连接计算机服务器，从自己的终端发来运算指令，付费让大型计算机提供运算服务。商用电话线既昂贵又繁忙，用户发指令时经常遇到占线或发出后阻塞、遗失的情况。同时，用户操作时常会出现间隙，使计算机空闲下来，其运算能力发挥得不够充分。巴兰的封包理论这下派上用场了，可将远程用户的指令切割成小块，按数字信号单位“千字节”，把一条命令分成几个小信息包——即“封包”。这样，由联网的计算机终端充当智能节点，根据线路的忙闲，节点自主选择不同线路分拨小信息包到目的地，然后再组装起来，还原为初始信息，这就是所谓“封包交换”。它不仅解决了线路繁忙问题，还可让多个用户端同时操作，利用封包原理“分时”共享计算机服务器。

军事技术服务于商用，巴兰的初衷是想搭建多重连接的通讯网，提高抗核打击能力，结果却给未来的互联网埋下种子。后来，美国国防部大力资助“阿帕网”，科学家们也秉承兼容开放的理念，让所有民间用户根据自己的需要，时时修改、更新界面上的传输程序。结果，各国的学者、工程师、通讯公司、军事机构、民间企业，甚至大学研究生，经过几十年的切磋、互动，群策群力，从各自的需求出发，以迥然不同的智慧与远见，让网络技术步步升级，一点点搭建起因特网。后来，网络百科和各种网络平台也都承继了这种开放态度。

其实，至今也说不清到底是谁发明了因特网，因为其间没有像牛顿、爱迪生、爱因斯坦或居里夫人式的超级英雄，能一人独慧让万世受益，成为关键性的决定人物。我们也很难确定到底是哪一年實现的全球联网，又是谁最先预见到互联网有改变人类历史的前景。许许多多的“小人物”在日常工作中不经意间与千里之外的陌生人合作，一点点勾勒出覆盖全球的计算机网络。这不是传统单向度的供求关系——少数原创者发明技术供给多数使用者的金字塔模式，而是多向度的互动关系——“用户生成”的平等模式。

中国与国外网络的连接，也是国际合作的结果。1987年，德国电脑技术专家向中国提供西门子电脑，德国学者帮助中科院攻破了一个个硬件和软件难关，才向世界成功发出了第一封电子邮件。之后，他们又帮中国申请“CN”域名，与世界上其他普通用户一样，签署TCP/ IP“传输控制协议”，中国的计算机才连上全球网络，因特网的覆盖面也越来越广。1989年，英国科学家蒂姆·伯纳斯·李创建了“万维网”，以超文本链接开拓出一片广阔的虚拟信息空间，全球用户可随意浏览世界各地的网页，地球变成了一个村庄。

20世纪末，人类告别了机械复制时代，电脑将世界连成一体。从事后来看，我们所谓的全球化，不仅意味着经济与文化一体化，其更坚实的物质基础是数字技术。我们能否据此推断，互联网技术衍生出了与之相应的知识与文化形态？或追问：既然在数字技术史上呈现出去中心化、多元性、多样性、流动性、用户主导以及数据共享的民主化趋势，那么这是否也预示着“知识民主化”时代的到来？

重新估价“博学”的含义

“老师，您讲的内容维基百科上都有。”拿手机的学生淡淡的一句，教授顿觉无地自容。失落的教授变颜正色：“论文不许引用网络资源，网上的信息都是垃圾，没有正经学问。”到了期末，学生照样用搜索引擎搜学术论文的电子版，根据上面的出版信息和页码，注释自己的论文，谁也看不出援引的是纸质出版物还是电子资源。的确，网络资源良莠不齐，可是信息量极大，关键看你会不会搜，实际上并无网上、网下之优劣。

这是学校最普遍的现象，不劳笔墨饶舌。但问题并不在于写论文该如何查文献，或者争论线上、线下哪种知识可靠；问题也不在于纸媒与电子媒体孰优孰劣，此乃器物、枝节之争，未触及深层的历史性断裂。我们或许应该问：互联网出现后如何面对硕大无朋的电子记忆？在电子记忆时代，“学习”是否与以前的含义不同？甚至要思考：网络知识时代，什么才算“真有学问”？

我们耳熟能详的是文明的延续有赖于文化传承，传承是知识薪火相传。一代又一代人上学、读书、进图书馆、欣赏艺术、传播资讯、写作或做科学实验，无一不需要记忆力与创造力。所以，考试不允许带电子设备，学生要凭大脑记忆与思辨力回答试题；评估学术机构时也要考察图书馆规模，衡量精神遗产的藏量；考评高等教育与科研机构等级时，要统计学术成果发表数量，量化科学文化的贡献。但如今，电子记忆渗透到生活的各个方面，学术成果和文献都已电子化，维基百科、百度百科上无所不包，大家都在网上搜索学术资源，那么我们是否仍然需要百科全书式的学者？换言之，数字时代一定要固守机械时代的评价标准吗？

网络新知识型

早在1935年，人文气质十足的瓦尔特·本雅明被电影这门充斥技术“铜臭”的艺术所震惊，写下《机械复制时代的艺术品》一文。他追溯一场在19世纪关于绘画与摄影艺术孰高孰低的争论。那时人们认为摄影不算艺术，推及电影也不会有深度。但到1920年代末，电影进入有声时代后，电影叙事日臻成熟，到1930年代便步入了黄金时代。站在历史的转折点上，本雅明发现前一个世纪的争论不得要领，摄影算不算艺术是个伪问题；真命题应该是，摄影出现后，整个艺术史不可逆转地拐入新轨道，世界迎来了机械复制時代。而那场论争不过表征了历史转折的时代焦虑而已。

受本雅明的启发，我们或许也该重新设置一下问题：与其争论线上、线下哪种知识更可靠，不如探讨一下，互联网出现之后，整个人类的知识结构是否随之发生变化？接着还可以问：既然互联网“供给”与“索取”知识的方式不同以往任何一个时代，那么传统的知识论是否还有效？近100年前，本雅明揭示出机械复制时代的新艺术形式与新知识型，那么，经历了数字革命后，他以媒介技术为切入点分析艺术的独到角度，似可启发我们寻觅知识转型的隐幽线索。或许我们可以追问：数字技术也能像机械复制技术那样重塑一个时代的知识论吗？本雅明说，照相技术让艺术的神韵消失了。那么，经历了模拟（复制）转数字的革命之后，文化形态又会发生怎样的转变？

从机械复制时代到数字网络时代

技术与文化本属两种性质不同的领域，彼此如何相互影响？新媒体艺术理论家列夫·曼诺维奇所著《新媒体的语言》一书系统阐述了电脑媒介对文化的塑造过程。我们这个时代所有的文化基础都将被电脑化，因特网成为全球化最实在、最显著的标志。这是一场最深刻的媒介革命，从文化生产、发行到市场流通，一切均由电脑做媒介。无论是获取或操纵文化数据，还是存储文化素材，也不管你采用文本、图片、视频、音频等何种格式，都必须先将资料转成数据，电脑才能够读取，我们也才能够使用。将文化的所有形态转译成二进制数字，是人类文化的未来宿命。

模拟转数字，是这场革命最深刻的断裂。回到本雅明的复制（或模拟）时代，电影是连续拍摄多个静态的照片，储存在长长的化学胶卷上，声音存入磁性声道。放映时，放映机用与拍摄相同的速率，连续读取胶卷上的一个个画面，再用强光投射到大银幕上。肉眼被高速运转的画面所欺骗，误以为银幕上的幻象是连续运动的，这是模拟方式再现的世界。到了数字时代，数字镜头将对象物反射的光线投射到感光器件上，光线被转化成电荷，再由“模数转换器”处理成二进制数字，存储在记忆芯片上。这是“数字化”过程。我们每天接触的各种文本格式、图像、视频、音频、网页、通讯信号，都统统由一堆二进制数码构成。

本雅明虽然不可能预见电影的数字宿命，但他所做的复制时代与前复制时代的艺术形式之间的比较，却发人深省。他说绘画以线条勾勒对象世界，是整体性地把握现实；而电影却把绵延的时间分割成一帧帧彼此独立的画幅，然后剪辑拼接，演员因此失去对情节的整体把握，剪辑师将其表演支离破碎地编织到银幕重构的世界里。而曼诺维奇则认为，复制技术正呼应了工业革命促生的生产模式：福特的第一条生产流水线（1913）便是大工业时代的经典范式——零部件标准化，生产过程被分割成一个个不断重复的简单劳动岗位，每一工位前后串联起来，便形成流水线。工人无需理解全过程，只须天天重复同一工种，便速成熟练工人。流水线上的工人随时可被替代，正像卓别林的电影《摩登时代》一样。

到了数字时代，世界进入后工业社会，数字媒体同样也呼应了后工业的逻辑。曼诺维奇的观点是，后工业生产的逻辑是所谓“按单定制 ”与“按进度配送”。网络经济以信息、传媒为先导，网络电商投巨资收集用户信息和消费行为习惯，有针对性地推送广告，精准投送产品。

从1950年代、1960年代的信息服务经济，向1970代的后工业转型，至1990年代的网络经济，文化便一直随经济形态的变化而一次次转向，这不正符合马克思的“经济基础决定上层建筑”吗？如果所有文化典籍、教育内容和传播信息都被电脑化并上传网络，那么将来谈文明的属地性与语境化还能成立吗？

曼诺维奇认为，数字媒介包含文化与技术两个层面：文化是指百科知识、故事情节、写作视角、模仿与宣泄、悲剧与喜剧等；技术是指电脑程序与“封包”、分类与进程、计算机语言与数据结构等。如果你使用不同的操作程序，电脑呈现数据的方式也会不同，文化也因此随之而变。由此可见，文化不仅是抽象的精神活动，更是由“电脑本体论”“知识论”“语用学”三者共同塑造的观念。人机融合才会实现技术与文化的实质形态，衍生出“电子文化形式”。电脑技术的演进不可避免地会影响文化史的嬗变。

应该说，曼诺维奇是从人文学理论中汲取了灵感，然后在电脑学里寻找技术论证，他称这种方法为“数码唯物主义”，以之考察数字时代的文化、社会与组织结构。既然证明技术与文化是一体两面，科技塑造文化形态，而数字技术的核心要件是开源与共享，那么，知识与文化将必然走上民主化与大众化的道路。

知识民主化

本雅明《机械复制时代的艺术品》说，机械复制技术出现之前，艺术品的价值源于原作的本真性、在场性和作者的权威性，艺术尚有“神韵”，仍对应着传统社会的伦理、仪式、特权与专属权。而照相术出现之后，原作与副本相去无几，收藏艺术品的独特空间随巡展与市场流通而消解，仪式功能难乎为继了，人们不再仰慕艺术而注重消费艺术。随着艺术神韵的消失，大众社会与政治现代主义不期而至。1930年代新闻电影里闪现马路报童的身影，报刊也推出“读者来信”栏目，让贩夫走卒以铅印的白纸黑字发表感想。自此，只有少数精英作者的话语特权，被广大普通读者渐渐削平，机械复制重构了人们的时间观与空间观，此为本雅明在1930年代的观察。

20世纪末因特网莅临，世界从此改变了。原来《不列颠百科全书》是百科知识的权威来源，如今学生上网查“维基百科”了。“不列颠百科”曾延请功成名就的大学者，皓首穷经，诲人不倦，给世界奉献了权威、普遍的知识。而维基的编者队伍里竟有送披萨的小哥，不管你有啥知识背景都可参与编写词条，维基编委只要求大家遵守编辑规则：即每个词条必有援引、每句话必有出处。无论大学者还是送餐小哥，每人的编辑权重又都很有限，词条越热门，参与的人越多，内容就越丰富、越可靠。个体的贡献被数量稀释了。相反，越生僻的词条，参与编辑的人则越少，个别编辑的倾向性便会凸显出来，词条内容也会相对单薄，可靠性随之下降。这是一个什么逻辑？难道数量多寡能决定知识的含金量吗？

中国有句老话：三个臭皮匠，顶个诸葛亮。但大家已不再认同这种观点了，而说一百个臭皮匠，也仍是臭皮匠。诸葛亮是杰出人才，怎能用人数来凑呢？的确，如果所有人在同一个层面上，每个人的思考角度、问题意识、知识背景都差不多，那么臭皮匠再多也顶不上一个诸葛亮。但维基百科或百度百科并非臭皮匠的数量相加。随着时间的推移，参与编辑百科的人数越来越多，使用范圍越来越广，词条不断更新，可信任度便逐渐提高，成为今天不可或缺的知识源。臭皮匠修成了新时代的诸葛亮，原因何在？从机械时代过渡到数字知识时代，知识的目的已不再仅仅服务于生产。原来知识是第一生产力，如今知识则以创造社会主体为己任。在知识时代，每个人首先是一个知识源，这并非指其受教育程度或社会地位的高低，而是凸显每个人经验的独特以及对他人的启迪。我们在网上相遇，平凡小人物的日常琐事一样启发无数人思考；即使一技一能，也可以帮他人改善境遇。我们每个人都是独特的、神秘的、不可替代的。在这个时代，知识的个人性与经验的独特性，超越了以往对普遍性的追求。

如仍固守传统的偏见，不承认所有人都有智慧，便是否认他人的存在，也是知识时代愚昧、歧视、敌意、仇恨与暴力的根源。“抖音”风靡国内外，这款青年人自娱自乐的短视频平台，由网民自己拍摄身边的场景，或用视频剪辑、特效软件编辑各类信息上传，让点击量决定哪款视频火爆。没有谁像制作影视戏剧那样，为创作优秀“抖音”作品而刻意研究节目的美学与规律。“抖音”属于无名之辈的本色创作，文艺理论对之失语，也找不到放之四海而皆准的普遍规律，成败靠网络的民主机制。

网络集体智慧

在这个全新的知识、文化民主化时代，网民直接参与知识建构，彼此互动，信息资源全球配置，个人以分子化的结构形成网络社会。新事物变化之快、复杂性与多样性之丰富，让人很难把握甚至无法理解。除了学习与适应这无序、莫测的世界之外，别无它途。因此，法国学者皮埃尔·列维的《集体智慧：赛博空间里的人类新世界》一书引入“集体或共享智慧”这个概念，描述这种跨地域、跨空间、跨贸易的网络知识空间。网络知识空间靠运算、重技术，计算机运算将人的思维“外化”，即将人的反思力、记忆力与联想力转译成“链接”“打开网页”“选择界面”，将个人思想转化成大规模生成的公共思维，私人想法就加入了共享智慧。

根据列维的观点，网络百科首要是获取技术、机构或概念工具，然后才是收集、过滤大量信息，运算后整合出可导航、可检索的信息，以链接的方式呈现多样的智慧与想象，搭建有思维纵深的信息平台。网民以虚拟身份在平台上彼此辨识，相互激发思考，各自贡献思维的路径，深挖思维的潜力，形成“集体智慧”或“大脑超链接”，解决传统知识表达不出、解决不了的问题。比如，维基百科汇聚了大批背景不同的志愿者，大家匿名编撰、修订、补充、审核、更新词条。重要的不是收集关于事实的客观知识，也不局限于汇集角度不同的想法，核心是要改变我们与知识的关系，联系世界各地千差万别的人，革新伦理、美学、技术与社会组织方式，重建全球化社会。这与利用网络技术操纵猎巫（如“人肉搜索”）和网暴南辕北辙。

2012年3月，不列颠百科全书公司宣布停印已有244年历史的纸版《不列颠百科全书》，从此发行电子版，从线下走到线上。看似一条纸媒转电媒的消息，含义却远比这层深远得多，这标志着一个时代知识型的结束。网络百科不再沿袭纸质百科的文本与图片形式，而集文本、图像、视频、音频等格式为一体，配以人机互动拟像、互动地图、虚拟现实等跨媒介多模态，覆盖几乎所有的符号系统。网络用户的人机互动，替代了精英教育的知识单向街，学习未必要找已特权化的教育机构，而上网共享普遍分配的知识。列维相信，专家智慧凝结的百科全书终结之时，也是大众智慧荟萃的网络知识空间出现之日；高度复杂的“网络智能”，将人性投射到无垠的赛博空间里，开源人工智能开发的 ChatGPT，也是沿因特网的技术逻辑向前推进，使得人类的思想探索具有了空前的潜力与变数。

开放是通向未来之路

列维认为，“网络新人文”打通了个人与群体两类不同知识的分野，超越了笛卡尔的“我思”——即以个体为中心的认知模式，而进入“我们思”的多元认知时代。

今人之明智在于自知局限与渺小，学会与他人合作共赢，与不曾谋面的陌生人共享知识、共创智慧，以期有所建树。在民主的赛博空间里开源与互动，将汇集起来的智慧无差别地播散到虚拟世界的每个角落。人人付出，个个收获，知识栖居在人性之中。

其实，这几十年来科技上的突破，很少是一人或几人完成，科学家大多是将研究思路先发表在期刊或开源网站上，新想法可能启发世界另一角落正思考相关问题的人；这个人又把读到的数据与自己的研究结合，做出成果后再公开发表，如此又启发下一个人——如多米诺骨牌，一项技术从最初设想到完善应用，一般有无数科学家的参与。所以，OpenAI（美国人工智能研究公司）注重邀请世界上所有用户使用ChatGPT平台，每次使用都是一次更新和建设，人工智能走到多远，要靠大量的用户使用和参与。

开源与共享在概念上不难理解，实施起来却不容易。列维说电脑技术的产生与西方科学、哲学传统息息相连，电脑运算的逻辑深植于当代西方知识论与美学之中。古希腊、古罗马的古典哲学是从超验世界里寻找普遍性，而因特网是将散落在不同时空里的真实经验联系起来；所以，网络智慧不是因循柏拉图的古典脚步，一心要攀登知识的制高点去寻觅“真理”，而是屈尊于芸芸大众的“意见”，在众生喧哗、芜杂多义的个别思考里，披沙沥金，萃取真知灼见。中国传统知识论有着强烈的精英化色彩，如今受到了数字技术的全面挑战。与其担忧因特网或人工智能将毁灭我们的生活，不如以开放、自信、包容的姿态掌控好这把“双刃剑”，让它趋利避害，更好地服务于人类生活。