计算机中信息的表示
2010-02-17李见伟
李见伟
山东省莱芜职业技术学院 山东莱芜 271100
计算机中信息的表示
李见伟
山东省莱芜职业技术学院 山东莱芜 271100
计算机内存储的信息包括数值数据和非数值数据两类,非数值数据主要包括文字、图片、声音等;在计算机中,各种信息都是以二进制编码的形式存在的,即都是以0和1组成的二进制代码表示的。本文讨论了各种非数值数据的表示形式。
二进制;编码;信息
一、字符编码
字符的编码采用国际通用的ASCII码(American Standard Code for Information Interchange,美国信息交换标准代码),ASCII码用一个字节编码,可表示256(28)个不同字符。当用户从键盘敲入A时存储到计算机内部的是A 的ASCII:01000001,这个转换工作由输入设备完成,键盘、鼠标是最常用的输入设备。
二、汉字编码
1.汉字交换码
由于汉字数量多,用一个字节的128种状态不能全部表示出来,因此在1980年我国颁布的《信息交换用汉字编码字符集—基本集》,即国家标准GB2312-80方案中规定用两个字节的16位二进制表示1个汉字,每个字节都只使用低7位(与ASCII码相同),即有128×128=16384种状态。
2.汉字机内码
国标码GB2312不能直接在计算机中使用,因为它没有考虑与基本的信息交换代码ASCII码的冲突。比如:“大”的国标码是3473H,与字符组合“4S”的ASCII相同。为了能区分汉字与ASCII码,在计算机内部表示汉字时把交换码(国标码)两个字节最高位改为1,称为“机内码”。这样:汉字“大”在计算机内部存储的是它的机内码:1011010011110011。
3.汉字字形码
所谓汉字字形码实际上就是用来将汉字显示到屏幕上或打印到纸上所需要的图形数据。记录汉字字形通常有两种方法:点阵法和矢量法,分别对应两种字形编码:点阵码和矢量码。
4.汉字输入码
为方便汉字的输入而制定的汉字编码,称为汉字输入码。根据编码规则,汉字输入码可分为:
按汉字的排列顺序形成的编码(流水码):如区位码;
按汉字的读音形成的编码(音码):如全拼、简拼、双拼等;
按汉字的字形形成的编码(形码):如五笔字型、郑码等;
按汉字的音、形结合形成的编码(音形码):如自然码。
汉字各种编码之间的关系:
国标码=区位码+2020H
机内码=国标码+8080H
三、声音的编码
音频信号是连续的模拟信号,而电脑处理的只能是数字信号,因此,电脑要对音频信号进行处理,首先必须进行模/数(A/D)的转换。实现这个步骤使用的设备是模/数转换器(A/D),它以每秒上万次的速率对声波进行采样,每一次采样都记录下了原始模拟声波在某一时刻的状态,称之为样本。将一串的样本连接起来,就可以描述一段声波了,其中信号幅度方向的采样精度称为采样位数,时间方向的采样精度为采样频率。
采样频率是指录音设备在1秒钟内对声音信号的采样次数,采样频率越高声音的还原就越真实越自然,单位为HZ(赫兹)。现在大多数声卡的采样频率都以达到44.1kHZ或48kHZ,即达到所谓的CD音质水平。
采样位数可以理解为声卡处理声音的解析度。这个数值越大,解析度就越高,录制和回放的声音就越真实。如果把声音从最高到最低分为65536个级别,需要用16位进行编码。如今市面上主流产品采样位数都是16位的,16位声卡能把声音信号分为216(65536)个精度单位进行处理。
WAV格式文件所占容量=(采样频率×采样位数×声道)×时间/8
注:公式中时间的单位是秒,算出的结果单位是字节。
四、图像的编码
在计算机上看到的图形都是由成千上万的图形点或像素组成的。每个像素都有不同的颜色,这产生了图像。先讲两个概念:分辨率和颜色质量。分辨率是指组成图像每行每列的像素数。颜色质量是指在某个分辨率下,每一个像素点可以有多少种色彩来描述,它的单位是位,如果将所有的颜色分为256(28)种,需要用8位对颜色进行编码,现在的计算机都支持24位或32位的颜色质量,24位的颜色质量可将所有的颜色分为1600多万种。
一幅不经压缩的图像数据量的计算公式:
图像数据量=图像水平分辨率×图像垂直分辨率×颜色质量/8
Representation of information in the computer
Li Jianwei
Laiwu vocational and technical college, Laiwu,271100,China
The information is stored inside the computer, including numerical data and non-numeric data types, non-numeric data include text, images, sounds, etc. In the computer, various information is encoded in binary form, that are based on 0 and 1 composition expressed in binary code.This article discusses the various nonnumerical data representation.
binary;coding;information
book=29,ebook=332
2009-10-10
李见伟,讲师。