大型文献数字化项目理论框架的构建❋
2012-08-15
(中山大学资讯管理学院 广东广州 510006)
大型文献数字化项目的理论框架至今未能得到明晰界定,直接影响了大型文献数字化项目的建设和数字资源的共建共享。构建大型文献数字化项目的理论框架,首先应该界定大型文献数字化项目的概念,在此基础上,对大型文献数字化项目的性质、类型、意义进行梳理与总结,并且对相关术语进行辨析,从而为大型文献数字化项目的建设奠定理论基础。
1 大型文献数字化项目的概念
1.1 现有概念的分析
国内外学者对于“大型文献数字化项目”概念的界定,大体可分为“过程”、“技术”、“资源”、“内容组织”4个维度。
1.1.1 过程说
很多学者都认为大型文献数字化项目是一种生产过程:Karen Coyle认为大型数字化项目就是以工业化生产模式对资料进行数字转换,在这一过程中人工干预被降到最低〔1〕。Paul Conway认为大型文献数字化项目是一种超大规模的转换过程,这种以“生产为导向”的数字化需要严格的生产流程规划和适合的外包服务商〔2〕。David R Meincke认为数字化过程应该是以生产为导向,即需要具备高度自动化,而且必须以海量资源为基础,具备高速度〔3〕。从中可以总结出,作为一种生产过程,大型文献数字化项目强调的是高度自动化的工业化生产模式,能够实现海量资源的数字化,并且具备较高的生产效率。
1.1.2 技术说
技术因素是大型文献数字化项目概念的核心。Karen Coyle认为大型文献数字化项目利用光学字符识别(Optical Character Recognition,OCR)技术对扫描图片进行识别从而形成可检索文档而不必再进行修改〔4〕。John A.Kunze认为“所谓大型数字化,就是在世界主要的图书馆对报纸、图书、视频等文献进行大规模的扫描”〔5〕。潘德利提出“古籍数字化就是采用计算机技术对古籍文献进行加工与处理,制成古籍文献书目数据库和古籍全文数据库,用以揭示古籍文献中蕴涵的极其丰富的信息资源,为古籍开发利用奠定良好的基础”〔6〕。李国新强调“数字化古籍必须对古籍原典做出具有计算机浏览、检索、利用特点的深度开发。古籍数字化应具备4个基本特征,即实现文本字符的数字化,具有基于超链接设计的浏览阅读环境,具有强大的检索功能,具有研究支持功能”〔7〕。刘琳、吴洪认为“所谓古籍数字化,就是将古代典籍中以文字符号记录的信息输入计算机,从而实现了整理、存储、传输、检索等手段的计算机化”〔8〕。毛建军指出“古籍数字化就是从利用和保护古籍的角度出发,采用计算机技术,将常见的语言文字或图形符号转化为能被计算机识别的数字符号,从而制成古籍文献书目数据库和古籍全文数据库,用以揭示古籍文献信息资源的一项系统工作”〔9〕。从中可以总结出,大型文献数字化项目所需要的关键技术有转换技术如扫描、拍照、光学字符识别技术、信息组织和检索技术以及数字资源长期保存技术等。
1.1.3 资源说
文献资源是大型文献数字化项目的客体,也是概念界定的主要对象。Karen Coyle认为大型文献数字化项目是将整个图书馆馆藏不加选择地转换。大型文献数字化项目的目标不是创造馆藏而是全部数字化,即数字化所有印刷型文献〔10〕。Paul Conway认为大型文献数字化就是数字化成果的不断积累,也可以称之为对海量资源的数字化〔11〕。David R Meincke针对图片资源提出大型文献数字化项目需具备一定的数量,而且相对于一些小型的选择性数字化项目而言,数字化应该是不加区别〔12〕。宋琳琳等结合大型文献数字化项目开展情况的调研,认为“资源选择是大型文献数字化项目的必要组成部分”〔13〕。综上而言,大型文献数字化项目的资源首先必须以海量资源为基础,其次是否需要对资源进行选择,成为分歧的焦点。
1.1.4 内容组织说
徐清通过对古籍数字化概念的分析总结了研究趋势,认为“与以往的研究侧重于从存储介质改变的角度、从技术层面来认知所不同的是,近年来的研究者更侧重于从对古籍资源深度开发的角度来解释,赋予了古籍数字化更鲜明的学术特性和文化色彩”〔14〕。Paul Conway认为大型文献数字化项目需要对重要的资源进行组织以支持未来使用〔15〕。David R Meincke认为数字化的数量和高速度必须以保证高质量元数据为前提〔16〕。李明杰认为“从本质上讲,古籍数字化不是一个单纯的技术问题,而是一个文化问题和学术问题。古籍数字化是以保存与普及传统文化为基本目的的,以知识发现的功能服务学术研究为最高目标的,在对传统纸质古籍进行校勘整理的基础上,利用计算机技术将其转换成可读、可检索及实现了语义关联和知识重组的数字化信息的过程”〔17〕。陈力认为“古籍数字化工作应该是数字图书馆建设的重要组成部分,古籍的特殊性应在统一标准规范的框架下进行细化,采用开放式的、分层次的、结构化的数据库来组织和揭示资源,要特别注意在古籍与古籍之间、古籍与现代普通图书之间建立起有机的联系,以为读者提供一个完整的知识体系”〔18〕。综上所述,大型文献数字化项目应该加强对资源内容的组织,建立高质量的元数据、增强其与其它资源的整合。
1.2 本文对于大型文献数字化项目的概念界定
综合上述学者对于大型文献数字化项目的概念界定,本文首先从语词切分的角度,将其划分为“大型”、“文献”、“数字化”、“项目”4个维度,并分别解释,然后再对其特点进行总结归纳,从而定义大型文献数字化项目的概念。
1.2.1 大型
《现代汉语词典》对“大型”解释为“形状大或规模大”〔19〕。在本文中,“大型”作为修饰词,可以从以下几个方面体现:
(1)数量多
很多大型文献数字化项目以数量多而著称。Google Book Search于2010年8月发表声明“经过严密的统计,全球的图书共有129,864,880 册”〔20〕。Google Book Search 通过和出版商及图书馆的合作协议,预计数字化图书数量将达到3000万册;目前已和G5图书馆合作达成数字化1500万册图书的合作协议。“美国记忆”(American Memory)已拥有数字化资源总量接近900万册〔21〕;截至2011年10月,美国加州大学图书馆已完成3,143,711册,1,037,424,630 页资源的数字化,其中公共领域的资源达475,200 册〔22〕。
(2)速度快
除了数字化资源总量超过百万册,其年均数字化速度也十分可观,IMLS发布的《美国博物馆与图书馆技术与数字化环境扫描》(Status of Technology and Digitization in the Nation's Museums and Libraries)指出,图书馆、博物馆和档案馆均开展了数字化工作,而且数字化的规模日益扩大,分别有16.5%的博物馆、12.2%的大型公共图书馆、19.3%的大学图书馆和12%的档案馆年均数字化的数量超过25,000页〔23〕。所以,本文所指的海量资源即参照上述项目,限定为在建大型文献数字化的生产能力接近2万页,已建成的大型数字化项目的数字化总量应该接近一百万册。
(3)规模大
这主要是指大型文献数字化项目的参与机构众多。大型文献数字化项目肩负着保护文化遗产的重要使命,单凭一个机构很难实现,所以需要相关机构合作完成。合作建设大型文献数字化项目已成为一种趋势;以Google Book Search为例,其合作的对象主要是出版社、图书馆和作者,其官方网站显示,100多个国家或地区的10,000多个出版商和作者参与了该项目;截至2011年10月,与其签订合作协议的图书馆共有28个,其中包括7个美国以外的图书馆:牛津大学(英国)、马德里康普鲁腾塞大学(西班牙)、加泰罗尼亚国立图书馆(西班牙)、洛桑大学图书馆(瑞士)、根特大学(比利时)和庆应义塾大学(日本)〔24〕。为了实现科罗拉多州历史、文化、政府和工业等相关领域资源的保存,科罗拉多州的图书馆、博物馆、档案馆和历史机构合作开展科罗拉多数字化项目(Colorado Digitization Project),不仅有利于文化遗产的保存,同时也支持教育和科研的发展〔25〕。所以,参与机构的数量及多样化也是限定大型文献数字化项目的一个必要条件。
(4)影响力大
这主要体现为使用量大和获得充足的经费支持。欧洲数字图书馆开馆当天,由于用户访问量超过网站设计最高容量500万人次/小时,最高时段达到设计容量的3倍,导致网站多次瘫痪,于2008年11月22日宣布暂时关闭一段时间,1个月后才重新开放〔26〕。2004年以来,JISC已经获得用于数字化项目的经费高达2400万英镑,“美国记忆”自建设以来也获得了超过7500万美元的资助〔27〕。
综上所述,本文将“大型”限定为数字化资源数量大,总量接近一百万册,年均生产量接近两万页;原则上由多个机构合作建设,获得充足的经费支持且数字化成果使用率高。
1.2.2 文献
根据《文献情报术语国际标准(草案)》(ISO/DIS5127),文献是指在存贮、检索、利用或者传递记录信息的过程中,可作为一种单元处理的,在载体内、载体上或者依附载体而存贮有信息或数据的载体。根据中国国家标准《文献著录总则》(GB/T 3792.1-2009),文献是指记录有知识的一切载体〔28〕。本文在认可上述定义的同时,对大型文献数字化项目的文献类型进行如下限定:其载体以印刷型资源为主,主要涵盖图书、期刊、报纸等印刷型文档和地图、手稿、活动图像、乐谱、唱片、照片、海报及视频资源等。
1.2.3 数字化
目前学术界对于数字化的界定主要呈现广义和狭义两个层面。从广义上来讲,数字化经常作为一个历史概念出现,相对于“前电脑”时代而言,用来描述一种现代化、全球化的基于网络的社会形态。从狭义上讲,数字化就是指从印刷型信息资源向数字资源的转换过程,比如数字化一本图书,或是数字化图书馆馆藏。其常被用于图书馆或是其它机构开展的数字化项目中,其目的是为了增加检索或是方便保存。《图书情报学在线词典》(Online Dictionary for Library and Information Science)认为:“数字化是将数据转换成数字格式,并用于计算机处理的过程。在信息系统中,数字化经常用来表示通过扫描设备,实现从印刷型文档或是图片到二进制信号的转换,以便实现计算机处理和显示。在电信领域,数字化通常用来形容从持续的模拟信号向脉冲数字信号的转换。”〔29〕《新编图书馆学情报学辞典》将数字化定义为“将数据转换成数字的过程。在信息系统中,数字通常指将印刷文本或图像(相片、插图和地图等)转换为数字信号,采用某种扫描设备,使结果可以显示在屏幕上”〔30〕。很多知名信息组织机构也认可该定义,澳大利亚国家图书馆将“数字化”定义为“一种从图书馆馆藏中创建原有馆藏数字化替代品的过程”〔31〕。NISO和IMLS对于数字化的定义是“为获得数字资源而进行的转换、创建和维护资源的过程,以便于资源可以通过电脑浏览”〔32〕。在本文中,笔者将“数字化”界定为相关机构开展的将传统的非数字型资源通过扫描、拍照等技术转换成计算机可以读取、识别和利用的数字资源的过程。
1.2.4 项目
项目是为创造独特的产品、服务或成果而进行的临时性工作。项目的“临时性”是指项目有明确的起点终点,但是项目所创造的产品、服务或成果一般不具有临时性。项目的“独特性”是因为其建设过程中的不确定性。项目可以创造以下内容:一种产品,既可以是其它产品的组成部分,也可以本身就是终端产品;一种能力,用来提供某种服务;一种成果,例如结果或文件〔33〕。本文对“项目”限定为以创建数字信息资源,提供数字信息服务为目的的临时性工作,该工作需要以生产、加工为导向,实现一定程度的自动化,并且具备较高的生产效率。
综合上文分别对“大型”、“文献”、“数字化”、“项目”的分析,本文将“大型文献数字化项目”的概念定义为:大型机构或是多个机构合作开展,以创建数字信息资源、提供数字信息服务为目的,通过扫描、拍照等转换技术,将传统的非数字型资源转换成计算机可以读取和识别的数字资源的工作。同时需要具备以下特征:一是数字化资源数量大,总量接近一百万册,年均生产量接近两万页;二是需要以生产、加工为导向,实现一定程度的自动化,并且具备较高的生产效率;三是获得充足的经费支持且数字化成果使用率高。
2 大型文献数字化项目相关术语辨析
2.1 大型文献数字化项目信息资源与原生数字资源
UNESCO颁布的《保存数字遗产宪章》(Charter on the Preservation of the Digital Heritage)将“原生数字资源(Digital Original)”定义为除了数字形式外、别无其它形式的数字资源〔34〕。数字保存联盟(Digital Preservation Coalition,DPC)认为原生数字资源一般认为其必须仅以数字版本的形式存在,如果说该资源是由实体文献数字化处理而来,那就不属于原生数字资源〔35〕。而大型文献数字化项目的信息资源是指通过数字化加工而产生的原始文献的数字化替代品或数字化复本(Digital Copy/Digital Double),比如一本图书经过数字化后,既可以以图片的形式出现,也可以经过文字识别后以数字文档的形式出现。此类信息资源与原生数字资源相比最大的特点就是存在一个与之相对应的原始文献。所以,本文将大型文献数字化项目的信息资源限定为非原生数字资源,即实体信息资源通过数字化转换而生成数字格式、能够满足人类需求的数字资源。
2.2 数字化与资源保存
资源保存就是确保资源在一定环境中的可用,数字化是实现资源保存的一种方式,但这并不意味着数字化就是数字资源保存。资源保存关注的是资源的稳定化处理,而数字化是一种格式转换方式,格式转换是一种可以接受的资源保存方法。ARL的保存委员会认可了数字化作为数字保存的可选模式之一,鼓励大力推广〔36〕。数字化所生成的原始资源的数字化替代品,常存在稳定性、可靠性、永久性等无法保证的问题;但是数字化在数字保存方面的作用不可小觑,通过对易损、濒危和使用价值大的资源的数字化,不仅可以有效降低对原件的使用,保护信息资源;同时也可以增加信息资源的利用率。所以,要达到资源保存的目的,需要数字化生成的格式足够稳定,甚至稳定性超过原始资源;另外,还要建立一系列标准,规范数字化工作,对一些重要的生产记录通过元数据进行长期保存。
3 大型文献数字化项目的性质
基于上文对“大型文献数字化项目”概念的界定,我们可以将大型文献数字化项目的基本性质定位为:大型文献数字化项目是对具有重要史料价值和使用价值的文献进行再现和加工,属于信息资源建设的范畴,是信息资源加工和组织的一部分,而不仅仅是文献载体的转换。大型文献数字化项目的最终结果是将数字化后的文献资源通过组织加工并保存,进而制成书目数据库、全文数据库、信息门户或数字图书馆等,实现信息资源的共建共享,从而达到利用和保护文献资源的目的。大型文献数字化项目不仅涉及信息组织的知识和技能,诸如古籍方面的版本、目录、校勘,以及分类法、主题法、本体、主题图、关联数据等;而且还涵盖当代最新的信息技术,如扫描转换技术、文字识别技术、长期保存技术、网络通信技术、语义网等;需要从项目管理的角度进行规划与建设。
4 大型文献数字化项目的类型
根据大型文献数字化项目的建设目的和功能,可以将大型文献数字化项目划分为基于保存、基于发现、基于传递、基于阅读、基于研究和基于机器处理6种类型。
4.1 基于保存的大型文献数字化项目
基于保存的大型文献数字化项目是为了实现信息资源的长期保存。通过减少用户对原件直接利用从而保护那些载体不稳定、价值高、利用率高或是需要修复的文献。此类项目有以下特点:一是项目建设过程必须基于信息资源的长期保存,要有长远眼光,能预见未来发展的需要。二是项目的关键环节是数字资源格式的选择。在格式选择过程中,要尽可能涵盖所有细节,以便未来的资源重现。理想的格式应该基于开源软件或是通用标准,而且项目建设过程中,用于长期保存和提供给用户检索的格式应该不同,用于长期保存的格式强调对资源毫无遗漏的全面重现如TIFF格式,而将其用于检索则会造成传输和显示负担;提供用户检索使用宜采用JPEG等其它格式。JSTOR在数字化过程中首先将期刊的每页扫描生成600 dpi的黑白TIFF图像用于保存,然后再对这些图片进行OCR识别进而生成PDF格式的数字文本,提供给用户检索使用〔37〕。
4.2 基于发现的大型文献数字化项目
基于发现的大型文献数字化项目的主要功能是用于检索,提高原始文献的利用率,如能满足本馆主要读者需求的文献、转换为数字拷贝会受到读者广泛使用的文献、具有重要历史或知识内容的国家珍善本、相对而言不太为人了解的馆藏文献、数字化后可能成为新的馆藏的文献、数字化后能实现原始文献信息增值的文献、数字化后有利于克服传统文献利用障碍的文献等〔38〕。此类型项目倾向于大规模的自动化生产,首先通过扫描生成相似文档,然后利用OCR进行识别;OCR通常将一本书或一篇文章分解成最基本的文本,然后经过简单的文本加工组织,创建索引目录或是展示片段内容。此类项目最显著的特征就是其目的并不是为了方便读者阅读和文献资源的长期保持,仅仅是为了方便检索而建立。Google Book Search就是最典型的代表。
4.3 基于传递的大型文献数字化项目
基于传递的大型文献数字化项目主要是从用户的角度出发,针对网络环境下用户不经常进图书馆查找资料,而更倾向于通过网络传递获取资源的新方式而建设的。数字文档是一种理想的资源传递载体,而且可以针对用户特定的需求而开展,这种按需数字化的方式可以有效降低数字化复本的重复率。为了使用户通过网络查找报纸信息,美国数字报纸项目(National Digital Newspaper Program,NDNP)将美国1880-1910年间的报纸全文进行了数字化,方便公众阅读;并且还提供1690年以来所有的报纸目录和基本信息〔39〕。
4.4 基于阅读的大型文献数字化项目
目前用户阅读的很多数字资源都是原生数字资源,大型文献数字化项目正在将印刷型资源进行数字化以便提供阅读,而且这种发展趋势越演越烈。古登堡计划最初是为了方便英文经典著作的阅读,国内的汉王电纸书也是此领域的成功案例。要实现最终阅读目的,需要设备、标准和市场几方面协同发展。首先,实现基于阅读的数字化设备应该具备以下特征:除了有良好的界面和字体,还必须能提供纸质图书的很多特征,如页码、书签、目录导航,还要提供各种标记;同时,提供字典链接,注释和标注,应该实现格式兼容。其次还应该建立数字图书的开放标准,并减少电子书利润限制。
4.5 基于研究的大型文献数字化项目
基于研究的大型文献数字化项目主要包含以下方面:一是对一些参考工具书数字化,将其变成数据库,从而方便参考工具书的利用和展示。二是对一些方便研究的连续文本,如研究指南、操作手册等进行数字化,此类项目需要一定的持续性,通过数量累积提供研究参考。三是实现数字化内容的全文检索,这需要在OCR的基础上对数字资源进行深度挖掘,因为仅凭阅读和简单导航无法有效提高科研效率,通过这种方式既可以获取全文,又能方便准确高效地找到所需要的资源,这也是通过大型文献数字化项目实现信息增值的主要体现。南京农业大学建立的民国农业文献数据库将相关文献资料以及研究论文都进行了数字化,并且建立了知识元数据库,利用数据挖掘技术从相关数据源中抽取各种实词如人名、地名、书名等,理清此间关系,使用XML进行置标,从而建立语义词典,辅助科学研究〔40〕。
4.6 基于机器处理的大型文献数字化项目
很多数据文档并不是给用户阅读的,但是可以方便用户检索,比如人口普查数据、调查统计数据、还有用于气候和生态学研究的地图数据和卫星数据。这些数据文件可以一定的文件格式,尤其是便于数据库导入的格式保存,通过数字化技术将其转换成二进制语言,再利用一些应用程序进行处理从而生成新数据;对于这些数据的数字化也是大型文献数字化项目的一个重要内容。
5 大型文献数字化项目的意义
大型文献数字化项目可以降低原件丢失与损坏的风险、补偿原件的作用、使馆藏机构更有效率地管理资源并提供服务、满足用户对资源的多种需求、提高原始资源的利用率、支持新型研究并扩大研究对象,方便有偿服务的开展。具体体现为以下3个方面。
5.1 促进文献资源的发现
非数字型文献资源受限于载体,用户对其发现获取取决于信息组织成果的丰富及深入,对其获取使用则局限于该文献的复本数量。而对于那些濒危的历史文献,其利用价值也会显著降低。通过大型文献数字化项目获取原始文献的数字拷贝,可以扩大受众面,丰富用户的选择范围;通过全文检索可以丰富数字资源的发现途径,提升特殊馆藏的使用率,使馆藏机构更有效率地管理资源并提供服务。
5.2 加强文化遗产的保护与利用
具有珍贵史料价值、濒危的历史文献是大型文献数字化项目的首要加工对象。这些原始文献的数字替代品可以有效降低原始文献丢失和损坏的风险,延长文化遗产的生命周期,而且可以满足用户对珍贵文献的使用需求,将文化遗产的价值发扬光大。
5.3 推动新型服务的开展
通过建设数字资源并对其进行深入组织,大型文献数字化项目可以提供并完善知识服务,提供电子书借阅服务,满足用户在科研、教学、学习等方面的需求。由于拥有共同的目标,大型文献数字化项目可以广泛发动社会各方力量参与建设,首先可以实现文化遗产保护机构之间的合作,扩大信息资源的拥有量,为信息服务奠定基础;其次可以实现与商业机构的合作,借助其经费和技术支持,开发数字出版、学术搜索、电子书服务等新业务。
综上所述,大型文献数字化项目的内涵、性质、类型、意义等是大型文献数字化项目理论框架的基本元素,对上述元素进行界定和归纳,可以明确大型文献数字化项目的研究对象,促进其在理论研究与实践操作中的发展。
1.Karen Coyle.Mass Digitization of Books.The Journal of Academic Librarianship,2006,32(6):641 -645
2.Paul Conway.Tec(h)tonics:Reimagining Preservation.College &Research Library News,2008,11(69).〔2011 -10 -06〕.http://www.ala.org/ala/mgrps/divs/acrl/publications/crlnews/2008/nov/techtonics.cfm
3.David R Meincke.Towards an Evaluation of Mass Digitized Photograph Collections.University of North Carolina at Chapel Hill,2010
4.Karen Coyle.Mass Digitization of Books.The Journal of Academic Librarianship,2006,32(6):641 -645
5.John Kunze.Where Preservation Meets Mass Digitization.〔2011 -10-26〕.http://lauc.ucmercedlibrary.info/lauc_mass_dig.ppt
6.潘德利.中国古籍数字化进程和展望.图书情报工作,2002(7):117-120
7.李国新.中国古籍资源数字化的进展与任务.大学图书馆学报2002(1):21 -26,41
8.刘琳,吴洪泽.古籍整理学.成都:四川大学出版社,2003:335
9.毛建军.古籍数字化的概念与内涵.图书馆理论与实践,2007(4):82-84
10.Karen Coyle.Mass Digitization of Books.The journal of Academic Librarianship,2006,32(6):641 -645
11.Paul Conway.Tec(h)tonics:Reimagining Preservation.College &Research Library News,2008,11(69).〔2011 -10 -16〕http://www.ala.org/ala/mgrps/divs/acrl/publications/crlnews/2008/nov/techtonics.cfm
12.David R Meincke.Towards an Evaluation of Mass Digitized Photograph Collections.University of North Carolina at Chapel Hill,2010
13.宋琳琳,黄如花.大型数字化项目的概念限定与术语辨析.图书情报工作,2009(11):23-28
14.徐清.2001-2005年我国中文古籍数字化研究综述.图书情报工作,2006(8):139-143
15.Paul Conway.Tec(h)tonics:Reimagining Preservation.College &Research Library News,2008,11(69).〔2011 -10 -06〕http://www.ala.org/ala/mgrps/divs/acrl/publications/crlnews/2008/nov/techtonics.cfm
16.David R Meincke.Towards an Evaluation of Mass Digitized Photograph Collections.Chapel Hill:University of North Carolina,2010
17.李明杰.中文古籍数字化基本理论问题刍议.图书馆论坛,2005(5):97-100
18.陈力.中文古籍数字化方法之检讨.国家图书馆学刊,2005(5):11-16
19.中国社会科学院.现代汉语词典.北京:商务印书馆,2007:579
20.Google.全球图书总量统计.〔2011 -10 -15〕.http://booksearch.blogspot.com/2010/08/books-of-world-stand-up-and-be-counted.html
21.American Memory.Resource Statistic .〔2011 -09 -18〕.http://memory.loc.gov/ammem/about/about.html
22.CDL Resource Statistic.〔2011 -10 -15〕.http://www.cdlib.org/services/collections/massdig/
23.IMLS.Status of Technology and Digitization in the Nation's Museums and Libraries .〔2011 -10 -13〕.http://www.imls.gov/resources/Tech-Dig05/Technology%2BDigitization.pdf
24.Google Book Search.Cooporation Libraries.〔2011 -10 -15〕.http://www.google.com/googlebooks/history.html
25.Colorado Digitization Project.Cooporation Institutions .〔2011 -10 -11〕.http://www.bcr.org/dps/cdp/archive/projects/backyard/index.html
26.杨骏.欧洲数字图书馆的尴尬事.〔2011-10-11〕.http://paper.people.com.cn/rmrbhwb/html/2008 -11/29/content_148355.htm
27.American Memory.Supporting the National Digital Library Program.〔2011 -10 -15〕.http://memory.loc.gov/ammem/about/sponsors.html
28.中华人民共和国国家质量监督检验检疫总局,中国国家标准管理委员会.文献著录总则.北京:中国标准出版社,2010:59
29.Joan M.Reitz.Online Dictionary for Library and Information Science.〔2011 -10 -15〕.http://lu.com/odlis/odlis_d.cfm
30.丘东江.新编图书馆学情报学辞典.北京:科学技术文献出版社,2006:289
31.NISO.Digitisation.〔2011 -10 -10〕.http://www.nla.gov.au/policy/digitisation.html
32.NISO Framework Working Group.A Framework of Guidance for Building Good Digital Collections .〔2011 -09 -21〕.http://www.niso.org/publications/rp/framework3.pdf
33.(美)项目管理协会.项目管理知识体系指南.王勇,张斌译.北京:电子工业出版社,2009:6
34.UNESCO.Charter on the Preservation of the Digital Heritage .〔2011-09 - 21〕.http://portal.unesco.org/ci/en/files/13367/106761360511 Charter_ch.pdf/Charter_ch.pdf
35.Digital Preservation Coalition.Introduction - Definitions and Concepts.〔2011 -09 -19〕.http://www.dpconline.org/advice/preservationhandbook/introduction/definitions-and-concepts
36.ARL.ARL Endorses Digitization as an Acceptable Preservation Reformatting Option .〔2011 -09 -27〕.http://www.arl.org/news/pr/digitization.shtml
37.JSTOR.Digitization Standards& Processes.〔2011 -10 -10〕.http://about.jstor.org/content- collections/journals - archive - collections/digitization-standards-processes
38.刘家真.馆藏文献数字化的原则与方法.中国图书馆学报,2001(5):42-45
39.NEH.National Digital Newspaper Program.〔2011 - 10 - 10〕.http://www.neh.gov/projects/ndnp.html
40.王雅戈.民国农业文献数字化整理及信息组织研究.南京:南京农业大学,2007:90