三百零八节卡片标准（2 / 2）

则需要高区和数字区同时打孔。通常顶端还会印制该列的取值作为参考，具体方案请大家翻到资料附录2。”

穿孔卡片的每一列都能够存储1个英文字母，其方案为：12-1A11-1J0-1/12-2B11-2K0-2S12-3C11-3L0-3T12-4D11-4M0-4U12-5E11-5N0-5V12-6F11-6O0-612-7G11-7P0-7X12-8H11-8Q0-8Y12-9I11-9R0-9Z

“三行区上打孔，搭配1-9数字行打孔，共有3x9=27中方案，除去0-1位置表示特殊符号‘斜线’，刚好能表示26个字母。有意思的是，之所以用0-1表示斜线，则是因为整个方案中，就只有这个编码两个孔的距离最近，技术实现难度较大。此外，其他的特殊符号则可以用每列穿3个孔的若干方案解决。霍勒里思代码里仅用了8号孔作为搭配的孔，但这同时也揭示了，3孔编码在技术上是可能的。”

“之所以提到3孔编码，是考虑到中文编码的问题。”

这时会场出现了不少窃窃私语的声音。中文的编码是元老院应用穿孔卡的一大问题。当年穿孔卡计算机没有在国内自行生产，用途也不广泛，实际并无标准的中文编码方法。

穿孔卡比起元老们熟知的数据存储载体，容量实在小得可怜，每张18.7x8.3的卡片只能存80个字符，还只是英文字母。如果要是政府或者商务的业务处理也就罢了，大不了多用标准编号，比如几年前司凯德和洪璜楠力推的国家标准代码体系，终于有了用武之地。

仅就眼下人口普查的需求来说，性别、籍贯、出生地、出生时间、现居所、文化水平、家庭成分等问题其实都可以很容易地通过编码解决，过去18位身份证上面仅用了6位就表示了全国每个人的出生地。原因很简单，命中每一个编码的人都很多，编制编码表是合适的。学过数据库的人画个ER图就很容易发现本来就应该这么做。但是唯有一个字段，就是姓名，永远也绕不过中文编码的问题。人口普查表各字段的具体设计工作可以丢给民生省的人，可是这中文编码必须现在解决。

“其实中文编码问题不难解决，问题是占用空间太大。”

“1980年颁布的《信息交换用汉字编码字符集》，通称GB2312编码，不仅仅规定了汉字在计算机上的表示方法，其实也定义了一套使用4位十进制数字表示汉字的方法，就是区位码。区位码收录了一级汉字3755个，二级汉字3008个，符号682个，基本满足当前需求。所以最简单的中文编码方法就是每4列编码一个汉字，大家以前高考的时候都涂过自己的姓名，当时用的就是区位码。”

“目前邮电部在全岛的电报系统已经基本铺设完成，电报员也培训了好几批。我看是不是直接用我们的标准中文电码更方便？人手也可以通用。”这时一直没怎么发言的绍宗开口了。

“区位码在每级汉字内部排序是按照拼音顺序，不怎么用培训吧。反而是标准电码是按部首排序的，实际上比掌握区位码难得多。”

“标准电码从19世纪末就有雏形，直接从清朝那时就编制了，是现阶段汉字编码的自然之选。”

“说话容易还是写字容易？标准电码从字形入手那是因为开始用电报的都是读书人阶层。我们的国民普及教育从拼音入手实际已经颠覆了过去的体系，普通人当然是用区位码更方便。”

“美国护照当年用的可一直是标准电码。”

－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－

下次更新：第七卷：大陆－两广攻略篇第35节

－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－

临高启明实体书珍藏版第一卷正在预售中，有意者就关注临高启明>>临高启明书迷根据地

吹牛者的消息版；

介绍梳理重要人物、事件信息；

展示临高社区风采，优秀同人和资料作品巡展；

不定期组织元老们线上或线下的聚会；

Inaord，SenatusPopulusqueMagnus

三百零八节 卡片标准（2 / 2）

三百零八节卡片标准（2 / 2）