天才一秒记住【热天中文网】地址:https://www.rtzw.net
。
每一个汉字都是多义的,对于语义歧义的处理是中文语音自动处理、机器翻译、自然语言理解等方面计算机人工智能技术发展的关键。
汉字代码体系由汉字输入码、汉字机内码、汉字字形码和汉字国标交换码等构成。
汉字代码中的汉字输入码是用于在计算机键盘上输入汉字的编码方法所产生的代码;汉字机内码是计算机内部处理汉字时使用的代码,类似于给每个汉字的一个序号;汉字字形码是汉字字形的数字化表示法所产生的代码;汉字国标交换码是我国制定的汉字信息交换标准中为每个汉字所规定的代码。
计算机处理汉字的过程实际上就是一个对汉字代码进行转换的过程,即汉字信息处理流程。
汉字代码转换的具体过程是,人在键盘上敲人汉字的输入码,由计算机将其转换为汉字机内码供计算机处理,在处理的过程中和结束后,将机内码转换为字形码以便在显示器上显示或者在打印机上打印;在不同的汉字信息系统,例如大陆与台湾或日本等使用的汉字系统之间的信息交换过程中使用汉字交换码作为通信转换的工具。
(3)汉字输入技术
汉字输入技术类型包括键盘输入技术、自动输入技术两大类。
键盘输入技术指以键盘为工具,使用各种编码方法输入汉字的技术。
自动输入技术包括以汉字的图形扫描自动识别和汉语语音的自动识别等方法输入汉字的技术。
汉字键盘输入编码方案的类型大体上可分为拼音码、拼形码、音形码、流水码等,它们属于以汉字的不同属性为主要取码特征的编码方法。
用户对编码的评价和选择包括两个层面的考虑:技术指标和人文标准。
技术指标主要是平均码长、重码率、输入速度、学习成本、易用性等;人文标准则反映了职业、文化、年龄、地域、习惯等多方面的因素。
汉字键盘输入编码方案已经经历了一个蓬勃发展的过程,目前其发展趋势的主要特征是:
——规范化:形码的规范化已经有了一定的基础,国家语言文字工作委员会与新闻出版署联合发布的汉字部件规范、汉语通用字笔顺规范,已在1998年5月1日付诸实行,最有影响的一批形码如五笔、郑码等均依据规范进行了调整。
——词语化:无论是拼音码还是拼形码,都出现了以词语而不是单字为主要处理对象的趋势,这样的好处是加快输入速度,同时使计算机的智能功能有了更多的发挥空间。
——智能化:音码的智能化,主要建立在拼音的连续序列输入方式上,人可以自如地输入不论单字还是词的拼音序列,由计算机根据智能理解自动分词、自动挑选同音字词自记忆所用搭配。
形码的智能化主要体现在字词的上下文自动关联的处理上。
它们共同的目的是使人的干预趋于最少,而使计算机承担更多的选择性任务,从而加快输入速度,使人一机之间建立某种沟通,就如同人与人之间随着时间的推移而建立某种理解和默契一样。
——辅助功能多样化:提供动态的联想、近义、反义词汇及资料、素材等帮助录入甚至构思和写作的辅助、支持功能。
(4)文字处理软件的主要功能
文字处理软件的主要功能包括:
——基本编辑功能。
完成大部分文字编辑工作。
——验证工具。
通过提供基本字典和用户字典、词库等工具,实现诸如拼写、语法、文档格式等多种检查功能。
——函件合并。
对文字与表格文档之间的数据读取、拼接等功能。
——版面编排。
包括多栏目设计、图表图形输入编辑、模板与样式的预览、缩放剪辑等功能。
——样式设计。
自动样式和用户自己编辑样式的功能。
——字体/打印机支持。
丰富的字体显示及打印能力。
——输入输出口。
支持输入/出各种不同格式文本的能力,包括不同程序的文本文件和不同媒体文件。
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!