简论实现计算机藏文快速输入关键理由

更新时间:2024-04-11 作者:用户投稿原创标记本站原创
【摘要】本文对藏文的相关文法开展了相对比较深入和详细的分析,并且充分的利用了藏文的字符在文法方面所存在的排斥性,虽然通用的计算机键盘键位是十分有限的,但是可以通过合理的安排来使得基本藏文字符能够得到良好的排列和组合,并且还对藏文字符中的字频进行了充分的统计,在此基础上结合计算机键盘布局的相关理论,此外还考虑到了藏文字母在发音方面同英文字母也存在着一定的相似性,对藏文输入法的键位布局进行了重新的调整和修改。这样就在很大的程度上实现了在不适用冗余键的前提之下进行计算机藏文的快速输入。
【关键词】计算机键盘布局 藏文快速输入 理由分析 解决策略
在对藏文信息处理方式开展研究的过程中,藏文输入法的研究是其中一个十分重要的组成部分,同时也是藏文信息处理方式研究的基础和前提,此外对藏文输入法进行研究还可以在一定的程度上推动我国藏文信息处理技术的进步和发展,同时还可以推动我国少数民族地区经济以及社会的进步。藏文属于一种拼音文字,有着十分悠久的发展历史,它属于辅音文字型,其中包括了三个组成部分,分别是辅音字母以及标点符号和元音符号。藏文的音节是将一个辅音字母作为基础和核心的,其他的辅音字母都是在这个核心辅音字母的基础之上进行前后的附加以及上下的叠加,这样就可以形成一个系统的字表结构。此外,藏文不但具有横向的拼写性,同时还具有纵向的拼写性,在藏文之中还存在着数量很大的藏文转写字。

一、当前在藏文输入法中存在的不足

当前基于windows系统的藏文输入法一共有三种比较常见的开发模式,其中第一种就是在应用的层面上进行直接的开发。第二种模式就是对已经拥有的英汉文windows进行挂接。最后一种模式就是建立起关键字布局的文件,然后将键码映射成相应的藏文字符。微软向用户所提供的输入法采取的是关键字布局模式,其他的一些藏文输入法都是基于应用层面开发以及挂接基础之上的。在对藏文编码标准进行应用时,微软向用户提供的是藏文Unicode的这样一种编码,但是其他的一些藏文输入法中都还没有采取统一的藏文国家编码标准,这样就会对藏文信息的交流和共享造成一定的障碍。在输入藏文的效率方面,当前我国还缺乏对藏文相关文法的细致和比较深入的研究,这就使得大部分的藏文输入法都难以真正地实现盲打输入。上述的情况也就是说在键盘的布局之中,如果一个相同的键位同时对应多个不同的藏文字符,那么用户必须要通过数字键来进行自己需要字符的选择。此外,虽然一些个别的藏文输入法可以在某种程度上实现盲打,但是在这个盲打的过程中也大量的使用了冗余键,这就将藏文输入的效率大大的降低了。

二、实现计算机藏文快速输入的方式

(一)藏文键位布局

在对计算机藏文键盘的键位布局进行设计和制定时,首先相关的设计人员应该对藏文字符的字频进行统计,对计算机键盘的相关布局理论进行研究,对藏文文法进行分析,对藏文字母在发音方面同英文字母的相似性进行研究,只有在此基础之上才能够使得藏文的键位布局更加的合理和科学。
(1)藏文字符字频统计。从藏文文法的方面进行分析,在十个后加字之中包括了全部的前加字以及再后加字,同时这些字符也可以用作基字,因此这十个字母在整个三十个字母中肯定有着很高的使用频率。此外,每一个藏文字之间都必须利用音节分隔符来对其加以分隔,因此这些音节分隔符也一定有着较高的使用频率。
(2)计算机键盘布局的相关理论。美国华盛顿大学的德沃拉克博士利用高速摄影的方式来对英文机械打字机进行打字的快慢以及造成打字出错的理由进行了细致和全面的分析,并且由此得出了一套同英文键盘布局相关的一系列理论。这一指数可以为藏文键位布局提供必要的依据和研究方向。
表1 英文键盘击键方便指数分析(次/分钟)
(3)藏文文法。在对藏文键盘的键位布局进行设计时,如果能够为三十个辅音字母、三个上加字、十个数码、四个下加字、四个元音符号以及音节分隔符、长元音符号等都安排在下挡键位,并且这些键位是独立的,那么每一个键码的序列一定都对应一个单一的藏文字符,这样就可以真正的实现无重码的藏文快速输入。但是在通用的键盘中,只可以安排47个下挡键的键位,但是需要54个键位,那么这就使得有七个下挡键位需要对应两个藏文的字符。这就使得藏文的输入过程中不会产生不必要的二义性。通过对上述几个方面的充分考虑和分析,设计了计算机藏文快速输入的键盘键位布局,如图1所示:


图1
应该注意的是,藏文的文法对于藏文的转写字并不十分适用,因此就难以按照藏文的文法来进行藏文转写字键盘键位布局的相关设计。针对上述的理由,在对字频统计数据以及击键方便指数进行了充分考虑的基础之上,设计出了藏文转写字的键位布局,如图2所示:

图2
(4)输入法的实现。要想真正的实现计算机藏文的快速输入,一个十分规范和有效的策略就是对windows自身所提供的输入法管理器,也就是IMM进行编程,还要对输入法的编辑器也就是IME进行编程,这是因为输入法的管理器和编辑器都是windows进行多语言支持的核心组件。


图3

图4 输入法框架

(二)藏文字符编码

在windows的系统内部采用的是Unicode编码,也就是全部的字符都是双字节的字符,此外Unicode同ISO/IEC是对应的,因此可以对A扩充集中的VCC进行直接的处理。对于B扩充集中的字符则需要利用UTF16来进行转换。具体的算法如下:
三、结语
综上所述,本文通过对相关文献的研究方式进行分析,对藏文的文法以及在构字方面的特点进行研究,设计出了无重码的藏文键盘键位的布局,并且在藏文国家编码标准的基础上进行了阳光藏文输入法的开发,使得计算机能够真正的实现藏文的快速输入。这一藏文的快速输入方式目前已经在我国的西藏自治区得到了大力的推广和应用。设计的无重码藏文快速输入法可以解决不适用冗余键实现快速输入的理由,使得使用者不但可以实现盲打输入,还可以运用文法检测的功能,也就是说,如果用户输入的藏文符合藏文文法的相关规则,那么就可以正常的进行录入,如果不符合相关的文法规则,那么就会提示输入的文法有错误,这样就可以极大地提升藏文输入的效率和质量。
参考文献:
[1]TRASHI N,SHU L Z,NUO Q,et al.A Tibetan mobile phone based on CDMA system.Communication Systems and Networks,IASTED Asia[CSN2007] ,2007.
[2]Lin Sen,Dong Yuan,Wang Shengyuan,et al.A Tibetaninput method based on syllable word for mobile phone. ICESS2005,Second International Conference on EmbeddedSoftware and System ,2005.
[3]卢亚军,马少平,张敏,罗广.基于大型藏文语料库的藏文字符、部件、音节、词汇频度与通用度统计及其应用研究[J].西北民族大学学报(自然科学版),2003,(02).
[4]尼玛扎西,拥错,次仁罗布.一种基于《信息交换用藏文编码字符集》国际、国家标准的藏文Windows平台的实现方案[J].西藏大学学报(汉文版),2001,(01).
[5]于,喇秉军,何向真.Web环境下藏文信息处理技术[J].西北民族大学学报(自然科学版),2005,(01).

点赞:11337 浏览:45528