原始码表格式说明
原始码表是多多生成输入法的主要依据文件,该文件必须是扩展名为txt的文本文件。多多支持文本的编码格式为UNICODE、ASIIC或UTF8。
的 de 一 yi 是 shi 了 le 不 bu 在 zai 人 ren 有 you 国 guo 他 ta 我 wo 这 zhe 中 zhong 大 da 个 ge 和 he ...
多多的原始码表格式,可以简单的看成两列,左列为词条,右列为编码,两列之间使用“Tab字符”分割。简单的做法是,您可以从微软Excel中复制两列,然后粘贴到文本文件中形成多多码表。但是,为了准确地实现更加丰富的功能,建议您仔细阅读以下内容。
-
文件中应每行定义一个编码和词条(可以是任意的文字组合,该词条也称为候选字词),对于同码词条,请分开多行定义。
-
每行使用“字词”+“Tab”符号+“编码”的格式保存(不包含引号)。
-
“Tab”是普通键盘上的Tab按键产生的字符;
-
微软Excel表格复制到记事本文件中的列间隔字符与此Tab字符相同;
-
候选字词中可使用“\t”表示Tab字符(引号内,不包含引号)表示;
-
候选字词中可使用“\r”表示换行符(引号内,不包含引号)表示;
-
候选字词中可使用"\s"表示英文空格(引号内,不包含引号)表示;
-
候选字词中如果包含“\”字符,应使用“\\”(引号内,不包含引号)表示;
-
编码中可添加“#1”、“#2”、“#3”、“#a”标识,分别表示该条定义为“分类1词条”、“分类2词条”、“次显码表”、“固顶词条”;
“#1”、“#2”仅用于码表分类,暂无任何特殊处理
-
编码中可使用全角字符指定该编码仅用于小键盘输入法;
-
编码中如果需要单个“#”作为编码,应使用“##”(引号内,不包含引号)表示;
-
-
如果您需要使用小键盘中的字符按键作为编码键,请使用全角字符定义编码,否则多多自动将半角字符识别为主键盘上的按键。如:
-
可使用“#3”(引号内,不包含引号)后缀置于编码末尾,指示该行字词为次显字词。所有的次显字词归类为次显码表,平时状态下,次显码表不被显示在候选列表中,当用户按下“码表切换”键时,显示次显码表,隐藏主码表候选。当用户再次按下“码表切换”键时还原为平时状态。
关于“次显码表”更为详细的描述,请参见 多多次显码表。
-
可使用“#a”(引号内,不包含引号)后缀置于编码末尾,指示该行字词为固顶字词。所有的固顶字词均不参与调频操作,即使用户开启了“自动调频”选项。
如上示例,yi 一 总是排列在输入编码“yi”的对应候选列表第一位,用户开启“自动调频”时,只调整“以 yi”、“已 yi”两个候选。
请参见 多多词频调整策略
请参见 多多候选列表排序

