[发明专利]中英通双向汉字输入法无效
申请号: | 200510034080.3 | 申请日: | 2005-04-14 |
公开(公告)号: | CN1687877A | 公开(公告)日: | 2005-10-26 |
发明(设计)人: | 刘伊翰 | 申请(专利权)人: | 刘伊翰 |
主分类号: | G06F3/023 | 分类号: | G06F3/023 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510405广东省广州市白云区白云大*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 中英通双向汉字输入法是一种计算机键盘汉字输入法,通过英汉字词对照表与传统汉字输入法编码(拼音、五笔字型、活字码等等)的有机结合,实现了汉字输入过程中的英汉、汉英双向翻译提示的功能,大大方便了用户在输入汉字的过程中学习和运用英语词汇,也为英语人士学习和输入汉字提供了有效的工具。可使用英语词语作为汉语字词的输入编码,输入6763个国标一二级汉字、55000条汉语词语,并在输入法编码提示栏(选字栏)上显示相应汉语字词的传统输入法编码;也可使用传统的汉字输入法编码,输入6763个国标一二级汉字、55000条汉语词语,并在输入法编码提示栏(选字栏)上显示相应汉语字词的对应英语词语。 | ||
搜索关键词: | 中英通 双向 汉字输入法 | ||
【主权项】:
1.一种汉字电脑键盘输入法编码方法和编码方案,它包括:①一种使输入法具有中英双向翻译提示功能的编码规则(以下简称“中英通编码规则”)、②一种对中文单字的实用进行性评估的方法、③一种对中文词组的实用性进行评估方法、④一种对英文字词的实用性进行评估的方法、⑤一种对输入法编码按其字词的实用性进行排序和筛选的方法、⑥一种拼音输入法编码的简化规则、⑦一套英汉词语对照表和一套汉英词语对照表、⑧一套“拼音中英通输入法”码表、⑨一套“五笔字型中英通输入法”码表、⑩一套“活字码中英通输入法”码表,其特征在于:1)在权利要求1中①的“中英通编码规则”,是根据本发明首创的“语言标签教学法”原理而创造的,所谓“语言标签教学法”,就是给每一个汉语字词“贴”上英文词语的标签,让用户在使用每一个汉语字词时都能同时看到相应的英语词汇,这样就能为用户创造一个英汉双语并存的词语使用和思维环境,令用户在日常的语言思维中能够频繁地、与自己的思路密切相关地接触到大量实用的英文词语,从而潜移默化地学习和掌握大量实用英文词语。“语言标签教学法”在实物世界里是匪夷所思的,但在电脑的软件世界里却是切实可行的。只要在我们惯用的拼音、活字码(专利申请号:200410027961.8,以下同)、五笔字型等传统的汉字输入法的码表中,在每个字词的输入编码后追加相应的英文词语(英文词语与原来的汉字输入编码之间用两个半角减号“--”分隔),在使用该输入法时,就可以通过我们习以为常的“编码提示”功能,在编码提示栏(选字栏)的相应汉语字词后面显示出其对应的英语词语的完整拼写内容。与“汉英码”相对应的反向编码方式是“英汉码”,“英汉码”就是通过键入英文词语编码,向电脑输入相应的中文词语,同时显示该中文词语的传统的汉字输入法编码,其原理是直接用英文词语作为其对应中文词语的输入编码,再在每一个英语字词编码后面,用一个半角等号“=”分隔后追加相应的传统的汉字输入法编码(例如拼音、活字码、五笔字型等编码),这样就可以用直接键入英文词语来输入中文词语并可在编码提示栏(选字栏)上显示相应中文词语的汉字输入法编码(例如拼音、活字码、五笔字型等编码)。2)在权利要求1中①的“中英通编码规则”中,输入法码表的主体部份由每个字词的编码行组成,每个编码行由连续的两大部份组成:第一部份为“汉语字词”,紧接每行的最左侧排列;第二部份是与第一部份相对应的“键盘符号编码”,紧接第一部份的右侧排列。“汉语字词”就是需要用输入法输入的各个中文单字或字串;“键盘符号编码”是指按特定的规则编制的用以指引输入法系统输入相应汉语字词的键盘符号或键盘符号串。输入法码表主体部份每行的格式为:3)在权利要求1中①的“中英通编码规则”中,输入法码表的主体部份每行“键盘符号编码”由连续紧邻的“传统的汉字输入法编码”和“英语字词编码”两部份组成:“传统的汉字输入法编码”是指按“拼音输入法”、“五笔字型输入法”、“活字码输入法”的编码规则编制的键盘符号编码(以下同);“英语字词编码”是与所输入的汉语字词含义相对应的英语字词编码。“传统的汉字输入法编码”和“英语字词编码”在每行“键盘符号编码”中的先后顺序根据编码的目的不同而异,可有两种排列方式:(1)英译中编码方式:需要键入英语词语而输入汉字并在编码提示栏(选字栏)上显示“传统的汉字输入法编码”的,“英语字词编码”在“键盘符号编码”中居左侧位置,“传统的汉字输入法编码”在“键盘符号编码”中居右侧位置。英译中编码方式每行格式:(2)中译英编码方式:需要键入“传统的汉字输入法编码”而输入汉字并在编码提示栏(选字栏)上显示相应英语词语的,“传统的汉字输入法编码”在“键盘符号编码”中居左侧位置,“英语字词编码”在“键盘符号编码”中居右侧位置。中译英编码方式每行格式:4)在权利要求1中①的“中英通编码规则”中,输入法码表的主体部份每行“键盘符号编码”中的分隔符号规定为:(1)“传统的汉字输入法编码”和“英语字词编码”的分隔符号:在中译英编码中,“传统的汉字输入法编码”和“英语字词编码”之间用两个半角减号“--”分隔;在英译中编码中,“英语字词编码”和“传统的汉字输入法编码”之间用壹个半角等号“=”分隔;(2)有些“英语字词编码”不是英语单词,而是英语短语,对短语构成的“英语字词编码”、使用“/”代替英文短语中的空格,例如:“按兵不动”的“英语字词编码”为“take/no/action”其活字码编码为“abbd”,因此,“按兵不动”一词的“活字码”中译英输入编码为:“按兵不动abbd--take/no/action”;“按兵不动”一词的“活字码”英译中输入编码为:“按兵不动take/no/action=abbd”(3)在中译英编码方式中,允许二个或多个不同的“英语字词编码”同时存在于一个汉语字词的编码之中(一词多义),每段不同的“英语字词编码”之间用一个半角分号“;”分隔:例如:“产”一字的“拼音中英通输入法”中译英编码为:“产chan--produce;property;lay”5)在权利要求1中①的“中英通编码规则”中,按照“英译中编码方式”编成的编码,单独安装到输入法软件中,就实现了“输入英文打出中文及显示传统的汉字输入法编码”的英汉学习和输入汉字的效果;按照“中译英编码方式”编成的编码,单独安装到输入法软件中,就实现了“输入传统的汉字输入法编码打出中文及显示英文输入编码”的汉英学习和输入汉字的效果;按照“英译中编码方式”编成的编码和按照“中译英编码方式”编成的编码,同时收集到一个输入法码表中,就实现了“输入英文打出中文并显示传统的汉字输入法编码;输入传统的汉字输入法编码打出中文并显示英文输入编码”的双向学习和汉字输入效果。6)在权利要求1中①的“中英通编码规则”中,单字的编码优先于词组的编码(当单字编码和词组编码相同时,单字编码排在较前的编码行);中译英编码优先于英译中编码(当中译英编码中的传统的汉字输入法编码部份,与其他字词的英译中编码中的英语编码部份相同时,中译英编码排在较前的编码行)。7)在权利要求1中①的“中英通编码规则”中,根据该规则编制的码表可使用WINDOWS98、WIN2000、WINXP自带的“输入法生成器”程序(IMEGEN.EXE)编译和安装到相应的操作系统中。8)在权利要求1中“②一种对中文单字的实用进行性评估的方法”,是对6763个国标一二级单字进行使用价值评估,通过电脑数据库编程技术,根据各单字在55000个实用词组中的出现次数,作为其使用价值的评分,在词组中出现率较高的单字的使用价值相应较高。9)在权利要求1中“③一种对中文词组的实用进行性评估的方法”,是对55000个实用词组进行使用价值评估,根据汉字的一般组词规律,由高频单字组成的词组比由高频单字组成的词组的使用价值更高,因此,本发明创造了一条简易公式:各词组的实用价值评分=所含单字的使用价值评分的几何平均值,通过电脑数据库编程技术,把各词组所含单字的使用价值数据代入此公式,即可计算各词组的实用价值评分。10)在权利要求1中“④一种对英文字词的实用性进行评估的方法”,根据每个英语字词被各种教材和词典收录的情况,统计其各自的使用分值,分值越高则实用价值越高。其中各词库的计分标准如“表1”:表1:中英通输入法的英语词汇来源和词条使用价值评分表
根据上表,越是初级的教材所收录的词汇的实用度越高,同一个英语单词如被多个词库收录,则其使用价值是相应各词库“使用价值积分”的总和,例如某个词被《初中英语》(第一册)词汇库收录,则它的实用价值评分为8,若这个词同时又被《新概念英语》(第一册)词汇库收录,则它的实用价值评分为8+5=13,依此类推,被较多教材广泛收录的词汇的使用价值评分会相对较高,由此所得的各词条的实用价值评分作为英语词汇编码取舍和排序的重要参考指标。11)在权利要求1中“⑤一种对输入法编码按其字词的实用性进行排序和筛选的方法”,是指:(1)利用电脑数据库技术,以“中文字词”作为第一关键字,以“英语字词”的实用价值(由高到低的降序)作为第二关键字,将编码数据进行索引排序。排序后把中文字词相同的不同英语字词按照其实用度高低的先后顺序编予“E序号”(从1开始的连续正整数)。(2)利用电脑数据库技术,以“英语字词”作为第一关键字,以“中文字词”的实用价值(由高到低的降序)作为第二关键字,将编码数据进行索引排序。排序后把英语字词相同的不同中文字词按照其实用度高低的先后顺序编予“C序号”(从1开始的连续正整数)。(3)删除所有“E序号”大于3或者“C序号”大于1的中文单字数据记录,这样剩下的每个中文单字最多可保留三个最实用的英语字词表达方式;可以表达汉语单字的英语字词都有至少有一个最实用的记录被保留,而其他非首选的汉语单字编码方式则被删除,这样在保持英语字词编码丰富性的同时又大大减少了重复的汉语单字编码数据,大大提高了单字编码的简洁性和实用性。(4)删除所有“E序号”大于1并且“C序号”大于1的中文词组数据记录,这样剩下的每个中文词组至少留一个最优的英语字词编码表达方式,可以表达汉语单字的英语字词编码都有至少保留一个最实用的记录,而非最实用的编码方式则被删除,这样在保持英语字词编码丰富性的同时又大大减少了重复的汉语词组编码数据,大大提高了词组编码的简洁性和实用性。(5)英语字词重码字词的排序:把英语字词编码相同的不同中文字词编码按“C序号”升序排序,以提高编码的实用性,由此形成一套英汉词语对照表,用于“英译中输入”编码。(6)经过上一步骤“(5)”处理后的数据表,是一个汉语字词对一个英语单词的数据表,把该编码数据按“E序号”升序排序,然后把多个中文词语相同的数据记录合并为一个汉语字词对应多个英语字词的形式,形成一套汉英词语对照表,用于“中译英输入”编码。12)权利要求1中“⑥一种拼音输入法编码的简化规则”是指:(1)汉字单字、二字词使用全拼编码;(2)由三个或三以个汉字组成的多字词,使用每个汉字的全拼首字母串成的拼音缩写作为拼音。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于刘伊翰,未经刘伊翰许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200510034080.3/,转载请声明来源钻瓜专利网。
- 上一篇:有机金属络合物及包括它的有机发光二极管和显示器
- 下一篇:碟形组件