从因特网到ChatGPT的核心是开源
2023-05-29王炎
王炎
关于ChatGPT
最近媒体炒作起ChatGPT来,有人说这个AI平台将改变人类的未来,有的甚至声称将带来毁灭,恰似前一段炒作“元宇宙”。新技术的推出,会一次次给媒体带来新热点。
从数字技术发展的整个历史来看,数据规模固然非常重要,但已与机械技术时代非常不同。数据、材料、高精技术、头脑卓越的科学精英,这些虽然仍是核心硬件,但“开源”与“共享”的互动模式,才是推进数字技术迭代更新的真正力量。向全社会开放数据与技术,让不同阶层、性别、职业和不同教育背景的用户参与使用,让世界上不同民族、文化、价值观和专业的头脑献计献策,每一次用户访问都是开放平台的一次调试和升级,头脑、数据与设备互动起来,人工智能技术才能不断提高。从20世纪中期互联网发明开始,新的科技逻辑便逐渐渗透到人类生活的方方面面,并最终塑造了21世纪的时代精神:只有开放社会,科技才能进步。
发明互联网
近读美国学者阿贝特所著《发明因特网》,感触颇多。从互联网到ChatGPT的技术逻辑,其实一以贯之的都是开源与共享。
因特网起源于20世纪50年代“冷战”寒彻的美国。美国国防部担心苏联先发制人,以第一轮核打击摧毁美国的通讯网,使白宫无法下达核反击的命令,从而输掉一场核战争——情形恰似库布里克的电影《奇爱博士》(1964),于是成立“美国高级研究计划署”,拨巨款研发抵御核打击的通讯技术。
美国科学家保罗·巴兰提出一个“封包交换”的设想,即设计搭建多重中继通讯线路,以替代从信息中心辐射各地的阶梯式通讯网。他的设想是,让每一个地方的通讯交换节点,均能自主判断通过哪条线路传输信号。这样即使中枢或某条线路被摧毁,通讯网分布在不同地方的智能节点仍能自主运行,从而保证命令的上传下达。这个想法太超前了,颠覆了金字塔式的传统通讯逻辑。但是要求中继节点智能运转,则须由电脑控制,并将模拟信号转化成数字信号,以避免多重连接带来的信号衰减。当年计算机体积大、运算慢、成本高,处理数字信号的能力不够强。最终项目招标的结果是,通讯改造被老牌的AT&T电话公司夺下。AT&T仍保留从控制中枢逐级下达的旧方案,把钱花在深挖洞、加固地下核掩体、提高保护级别、优化线路材质上,而巴兰的设想则被束之高阁。
但几年后,英国科学家读到巴兰的论文,意识到这项技术可别用他途。英国人的兴趣不在军事,而在远程用户如何分享实验室里的大型计算机。当时还没有个人终端电脑,用户要租用科学机构的大型电脑。普通用户需用电话线连接计算机服务器,从自己的终端发来运算指令,付费让大型计算机提供运算服务。商用电话线既昂贵又繁忙,用户发指令时经常遇到占线或发出后阻塞、遗失的情况。同时,用户操作时常会出现间隙,使计算机空闲下来,其运算能力发挥得不够充分。巴兰的封包理论这下派上用场了,可将远程用户的指令切割成小块,按数字信号单位“千字节”,把一条命令分成几个小信息包——即“封包”。这样,由联网的计算机终端充当智能节点,根据线路的忙闲,节点自主选择不同线路分拨小信息包到目的地,然后再组装起来,还原为初始信息,这就是所谓“封包交换”。它不仅解决了线路繁忙问题,还可让多个用户端同时操作,利用封包原理“分时”共享计算机服务器。
军事技术服务于商用,巴兰的初衷是想搭建多重连接的通讯网,提高抗核打击能力,结果却给未来的互联网埋下种子。后来,美国国防部大力资助“阿帕网”,科学家们也秉承兼容开放的理念,让所有民间用户根据自己的需要,时时修改、更新界面上的传输程序。结果,各国的学者、工程师、通讯公司、军事机构、民间企业,甚至大学研究生,经过几十年的切磋、互动,群策群力,从各自的需求出发,以迥然不同的智慧与远见,让网络技术步步升级,一点点搭建起因特网。后来,网络百科和各种网络平台也都承继了这种开放态度。
其实,至今也说不清到底是谁发明了因特网,因为其间没有像牛顿、爱迪生、爱因斯坦或居里夫人式的超级英雄,能一人独慧让万世受益,成为关键性的决定人物。我们也很难确定到底是哪一年實现的全球联网,又是谁最先预见到互联网有改变人类历史的前景。许许多多的“小人物”在日常工作中不经意间与千里之外的陌生人合作,一点点勾勒出覆盖全球的计算机网络。这不是传统单向度的供求关系——少数原创者发明技术供给多数使用者的金字塔模式,而是多向度的互动关系——“用户生成”的平等模式。
中国与国外网络的连接,也是国际合作的结果。1987年,德国电脑技术专家向中国提供西门子电脑,德国学者帮助中科院攻破了一个个硬件和软件难关,才向世界成功发出了第一封电子邮件。之后,他们又帮中国申请“CN”域名,与世界上其他普通用户一样,签署TCP/ IP“传输控制协议”,中国的计算机才连上全球网络,因特网的覆盖面也越来越广。1989年,英国科学家蒂姆·伯纳斯·李创建了“万维网”,以超文本链接开拓出一片广阔的虚拟信息空间,全球用户可随意浏览世界各地的网页,地球变成了一个村庄。
20世纪末,人类告别了机械复制时代,电脑将世界连成一体。从事后来看,我们所谓的全球化,不仅意味着经济与文化一体化,其更坚实的物质基础是数字技术。我们能否据此推断,互联网技术衍生出了与之相应的知识与文化形态?或追问:既然在数字技术史上呈现出去中心化、多元性、多样性、流动性、用户主导以及数据共享的民主化趋势,那么这是否也预示着“知识民主化”时代的到来?
重新估价“博学”的含义
“老师,您讲的内容维基百科上都有。”拿手机的学生淡淡的一句,教授顿觉无地自容。失落的教授变颜正色:“论文不许引用网络资源,网上的信息都是垃圾,没有正经学问。”到了期末,学生照样用搜索引擎搜学术论文的电子版,根据上面的出版信息和页码,注释自己的论文,谁也看不出援引的是纸质出版物还是电子资源。的确,网络资源良莠不齐,可是信息量极大,关键看你会不会搜,实际上并无网上、网下之优劣。
这是学校最普遍的现象,不劳笔墨饶舌。但问题并不在于写论文该如何查文献,或者争论线上、线下哪种知识可靠;问题也不在于纸媒与电子媒体孰优孰劣,此乃器物、枝节之争,未触及深层的历史性断裂。我们或许应该问:互联网出现后如何面对硕大无朋的电子记忆?在电子记忆时代,“学习”是否与以前的含义不同?甚至要思考:网络知识时代,什么才算“真有学问”?
我们耳熟能详的是文明的延续有赖于文化传承,传承是知识薪火相传。一代又一代人上学、读书、进图书馆、欣赏艺术、传播资讯、写作或做科学实验,无一不需要记忆力与创造力。所以,考试不允许带电子设备,学生要凭大脑记忆与思辨力回答试题;评估学术机构时也要考察图书馆规模,衡量精神遗产的藏量;考评高等教育与科研机构等级时,要统计学术成果发表数量,量化科学文化的贡献。但如今,电子记忆渗透到生活的各个方面,学术成果和文献都已电子化,维基百科、百度百科上无所不包,大家都在网上搜索学术资源,那么我们是否仍然需要百科全书式的学者?换言之,数字时代一定要固守机械时代的评价标准吗?
网络新知识型
早在1935年,人文气质十足的瓦尔特·本雅明被电影这门充斥技术“铜臭”的艺术所震惊,写下《机械复制时代的艺术品》一文。他追溯一场在19世纪关于绘画与摄影艺术孰高孰低的争论。那时人们认为摄影不算艺术,推及电影也不会有深度。但到1920年代末,电影进入有声时代后,电影叙事日臻成熟,到1930年代便步入了黄金时代。站在历史的转折点上,本雅明发现前一个世纪的争论不得要领,摄影算不算艺术是个伪问题;真命题应该是,摄影出现后,整个艺术史不可逆转地拐入新轨道,世界迎来了机械复制時代。而那场论争不过表征了历史转折的时代焦虑而已。
受本雅明的启发,我们或许也该重新设置一下问题:与其争论线上、线下哪种知识更可靠,不如探讨一下,互联网出现之后,整个人类的知识结构是否随之发生变化?接着还可以问:既然互联网“供给”与“索取”知识的方式不同以往任何一个时代,那么传统的知识论是否还有效?近100年前,本雅明揭示出机械复制时代的新艺术形式与新知识型,那么,经历了数字革命后,他以媒介技术为切入点分析艺术的独到角度,似可启发我们寻觅知识转型的隐幽线索。或许我们可以追问:数字技术也能像机械复制技术那样重塑一个时代的知识论吗?本雅明说,照相技术让艺术的神韵消失了。那么,经历了模拟(复制)转数字的革命之后,文化形态又会发生怎样的转变?
从机械复制时代到数字网络时代
技术与文化本属两种性质不同的领域,彼此如何相互影响?新媒体艺术理论家列夫·曼诺维奇所著《新媒体的语言》一书系统阐述了电脑媒介对文化的塑造过程。我们这个时代所有的文化基础都将被电脑化,因特网成为全球化最实在、最显著的标志。这是一场最深刻的媒介革命,从文化生产、发行到市场流通,一切均由电脑做媒介。无论是获取或操纵文化数据,还是存储文化素材,也不管你采用文本、图片、视频、音频等何种格式,都必须先将资料转成数据,电脑才能够读取,我们也才能够使用。将文化的所有形态转译成二进制数字,是人类文化的未来宿命。
模拟转数字,是这场革命最深刻的断裂。回到本雅明的复制(或模拟)时代,电影是连续拍摄多个静态的照片,储存在长长的化学胶卷上,声音存入磁性声道。放映时,放映机用与拍摄相同的速率,连续读取胶卷上的一个个画面,再用强光投射到大银幕上。肉眼被高速运转的画面所欺骗,误以为银幕上的幻象是连续运动的,这是模拟方式再现的世界。到了数字时代,数字镜头将对象物反射的光线投射到感光器件上,光线被转化成电荷,再由“模数转换器”处理成二进制数字,存储在记忆芯片上。这是“数字化”过程。我们每天接触的各种文本格式、图像、视频、音频、网页、通讯信号,都统统由一堆二进制数码构成。
本雅明虽然不可能预见电影的数字宿命,但他所做的复制时代与前复制时代的艺术形式之间的比较,却发人深省。他说绘画以线条勾勒对象世界,是整体性地把握现实;而电影却把绵延的时间分割成一帧帧彼此独立的画幅,然后剪辑拼接,演员因此失去对情节的整体把握,剪辑师将其表演支离破碎地编织到银幕重构的世界里。而曼诺维奇则认为,复制技术正呼应了工业革命促生的生产模式:福特的第一条生产流水线(1913)便是大工业时代的经典范式——零部件标准化,生产过程被分割成一个个不断重复的简单劳动岗位,每一工位前后串联起来,便形成流水线。工人无需理解全过程,只须天天重复同一工种,便速成熟练工人。流水线上的工人随时可被替代,正像卓别林的电影《摩登时代》一样。
到了数字时代,世界进入后工业社会,数字媒体同样也呼应了后工业的逻辑。曼诺维奇的观点是,后工业生产的逻辑是所谓“按单定制 ”与“按进度配送”。网络经济以信息、传媒为先导,网络电商投巨资收集用户信息和消费行为习惯,有针对性地推送广告,精准投送产品。
从1950年代、1960年代的信息服务经济,向1970代的后工业转型,至1990年代的网络经济,文化便一直随经济形态的变化而一次次转向,这不正符合马克思的“经济基础决定上层建筑”吗?如果所有文化典籍、教育内容和传播信息都被电脑化并上传网络,那么将来谈文明的属地性与语境化还能成立吗?
曼诺维奇认为,数字媒介包含文化与技术两个层面:文化是指百科知识、故事情节、写作视角、模仿与宣泄、悲剧与喜剧等;技术是指电脑程序与“封包”、分类与进程、计算机语言与数据结构等。如果你使用不同的操作程序,电脑呈现数据的方式也会不同,文化也因此随之而变。由此可见,文化不仅是抽象的精神活动,更是由“电脑本体论”“知识论”“语用学”三者共同塑造的观念。人机融合才会实现技术与文化的实质形态,衍生出“电子文化形式”。电脑技术的演进不可避免地会影响文化史的嬗变。
应该说,曼诺维奇是从人文学理论中汲取了灵感,然后在电脑学里寻找技术论证,他称这种方法为“数码唯物主义”,以之考察数字时代的文化、社会与组织结构。既然证明技术与文化是一体两面,科技塑造文化形态,而数字技术的核心要件是开源与共享,那么,知识与文化将必然走上民主化与大众化的道路。
知识民主化
本雅明《机械复制时代的艺术品》说,机械复制技术出现之前,艺术品的价值源于原作的本真性、在场性和作者的权威性,艺术尚有“神韵”,仍对应着传统社会的伦理、仪式、特权与专属权。而照相术出现之后,原作与副本相去无几,收藏艺术品的独特空间随巡展与市场流通而消解,仪式功能难乎为继了,人们不再仰慕艺术而注重消费艺术。随着艺术神韵的消失,大众社会与政治现代主义不期而至。1930年代新闻电影里闪现马路报童的身影,报刊也推出“读者来信”栏目,让贩夫走卒以铅印的白纸黑字发表感想。自此,只有少数精英作者的话语特权,被广大普通读者渐渐削平,机械复制重构了人们的时间观与空间观,此为本雅明在1930年代的观察。
20世纪末因特网莅临,世界从此改变了。原来《不列颠百科全书》是百科知识的权威来源,如今学生上网查“维基百科”了。“不列颠百科”曾延请功成名就的大学者,皓首穷经,诲人不倦,给世界奉献了权威、普遍的知识。而维基的编者队伍里竟有送披萨的小哥,不管你有啥知识背景都可参与编写词条,维基编委只要求大家遵守编辑规则:即每个词条必有援引、每句话必有出处。无论大学者还是送餐小哥,每人的编辑权重又都很有限,词条越热门,参与的人越多,内容就越丰富、越可靠。个体的贡献被数量稀释了。相反,越生僻的词条,参与编辑的人则越少,个别编辑的倾向性便会凸显出来,词条内容也会相对单薄,可靠性随之下降。这是一个什么逻辑?难道数量多寡能决定知识的含金量吗?
中国有句老话:三个臭皮匠,顶个诸葛亮。但大家已不再认同这种观点了,而说一百个臭皮匠,也仍是臭皮匠。诸葛亮是杰出人才,怎能用人数来凑呢?的确,如果所有人在同一个层面上,每个人的思考角度、问题意识、知识背景都差不多,那么臭皮匠再多也顶不上一个诸葛亮。但维基百科或百度百科并非臭皮匠的数量相加。随着时间的推移,参与编辑百科的人数越来越多,使用范圍越来越广,词条不断更新,可信任度便逐渐提高,成为今天不可或缺的知识源。臭皮匠修成了新时代的诸葛亮,原因何在?从机械时代过渡到数字知识时代,知识的目的已不再仅仅服务于生产。原来知识是第一生产力,如今知识则以创造社会主体为己任。在知识时代,每个人首先是一个知识源,这并非指其受教育程度或社会地位的高低,而是凸显每个人经验的独特以及对他人的启迪。我们在网上相遇,平凡小人物的日常琐事一样启发无数人思考;即使一技一能,也可以帮他人改善境遇。我们每个人都是独特的、神秘的、不可替代的。在这个时代,知识的个人性与经验的独特性,超越了以往对普遍性的追求。
如仍固守传统的偏见,不承认所有人都有智慧,便是否认他人的存在,也是知识时代愚昧、歧视、敌意、仇恨与暴力的根源。“抖音”风靡国内外,这款青年人自娱自乐的短视频平台,由网民自己拍摄身边的场景,或用视频剪辑、特效软件编辑各类信息上传,让点击量决定哪款视频火爆。没有谁像制作影视戏剧那样,为创作优秀“抖音”作品而刻意研究节目的美学与规律。“抖音”属于无名之辈的本色创作,文艺理论对之失语,也找不到放之四海而皆准的普遍规律,成败靠网络的民主机制。
网络集体智慧
在这个全新的知识、文化民主化时代,网民直接参与知识建构,彼此互动,信息资源全球配置,个人以分子化的结构形成网络社会。新事物变化之快、复杂性与多样性之丰富,让人很难把握甚至无法理解。除了学习与适应这无序、莫测的世界之外,别无它途。因此,法国学者皮埃尔·列维的《集体智慧:赛博空间里的人类新世界》一书引入“集体或共享智慧”这个概念,描述这种跨地域、跨空间、跨贸易的网络知识空间。网络知识空间靠运算、重技术,计算机运算将人的思维“外化”,即将人的反思力、记忆力与联想力转译成“链接”“打开网页”“选择界面”,将个人思想转化成大规模生成的公共思维,私人想法就加入了共享智慧。
根据列维的观点,网络百科首要是获取技术、机构或概念工具,然后才是收集、过滤大量信息,运算后整合出可导航、可检索的信息,以链接的方式呈现多样的智慧与想象,搭建有思维纵深的信息平台。网民以虚拟身份在平台上彼此辨识,相互激发思考,各自贡献思维的路径,深挖思维的潜力,形成“集体智慧”或“大脑超链接”,解决传统知识表达不出、解决不了的问题。比如,维基百科汇聚了大批背景不同的志愿者,大家匿名编撰、修订、补充、审核、更新词条。重要的不是收集关于事实的客观知识,也不局限于汇集角度不同的想法,核心是要改变我们与知识的关系,联系世界各地千差万别的人,革新伦理、美学、技术与社会组织方式,重建全球化社会。这与利用网络技术操纵猎巫(如“人肉搜索”)和网暴南辕北辙。
2012年3月,不列颠百科全书公司宣布停印已有244年历史的纸版《不列颠百科全书》,从此发行电子版,从线下走到线上。看似一条纸媒转电媒的消息,含义却远比这层深远得多,这标志着一个时代知识型的结束。网络百科不再沿袭纸质百科的文本与图片形式,而集文本、图像、视频、音频等格式为一体,配以人机互动拟像、互动地图、虚拟现实等跨媒介多模态,覆盖几乎所有的符号系统。网络用户的人机互动,替代了精英教育的知识单向街,学习未必要找已特权化的教育机构,而上网共享普遍分配的知识。列维相信,专家智慧凝结的百科全书终结之时,也是大众智慧荟萃的网络知识空间出现之日;高度复杂的“网络智能”,将人性投射到无垠的赛博空间里,开源人工智能开发的 ChatGPT,也是沿因特网的技术逻辑向前推进,使得人类的思想探索具有了空前的潜力与变数。
开放是通向未来之路
列维认为,“网络新人文”打通了个人与群体两类不同知识的分野,超越了笛卡尔的“我思”——即以个体为中心的认知模式,而进入“我们思”的多元认知时代。
今人之明智在于自知局限与渺小,学会与他人合作共赢,与不曾谋面的陌生人共享知识、共创智慧,以期有所建树。在民主的赛博空间里开源与互动,将汇集起来的智慧无差别地播散到虚拟世界的每个角落。人人付出,个个收获,知识栖居在人性之中。
其实,这几十年来科技上的突破,很少是一人或几人完成,科学家大多是将研究思路先发表在期刊或开源网站上,新想法可能启发世界另一角落正思考相关问题的人;这个人又把读到的数据与自己的研究结合,做出成果后再公开发表,如此又启发下一个人——如多米诺骨牌,一项技术从最初设想到完善应用,一般有无数科学家的参与。所以,OpenAI(美国人工智能研究公司)注重邀请世界上所有用户使用ChatGPT平台,每次使用都是一次更新和建设,人工智能走到多远,要靠大量的用户使用和参与。
开源与共享在概念上不难理解,实施起来却不容易。列维说电脑技术的产生与西方科学、哲学传统息息相连,电脑运算的逻辑深植于当代西方知识论与美学之中。古希腊、古罗马的古典哲学是从超验世界里寻找普遍性,而因特网是将散落在不同时空里的真实经验联系起来;所以,网络智慧不是因循柏拉图的古典脚步,一心要攀登知识的制高点去寻觅“真理”,而是屈尊于芸芸大众的“意见”,在众生喧哗、芜杂多义的个别思考里,披沙沥金,萃取真知灼见。中国传统知识论有着强烈的精英化色彩,如今受到了数字技术的全面挑战。与其担忧因特网或人工智能将毁灭我们的生活,不如以开放、自信、包容的姿态掌控好这把“双刃剑”,让它趋利避害,更好地服务于人类生活。