跳转到内容

英文维基 | 中文维基 | 日文维基 | 草榴社区

维基百科:字词转换/修复请求

维基百科,自由的百科全书
字词转换
主页 讨论
轉換請求
错误修复请求
地区词候选
轉換介紹
字詞轉換處理 讨论
  繁简处理 讨论
  地区词处理 讨论
  公共轉換組 讨论
帮助文档
繁简与地区词处理 讨论
  转换原理 讨论
  手工轉換 讨论
  高级语法 讨论
  用字模式选择说明
相關模板
NoteTA 全文字詞轉換
CGroup 公共轉換組列表
Lan 界面文字轉換
地区用词 地區詞模板
地区用词2 進階地區詞模板
各地中文名 地區用詞資訊框
查看 - 讨论 - 编辑 - 变动

本页面为维基百科:字词转换下属子页面,用于处理各维基计划全域转换和中文维基百科本地全局转换中的所有繁简地区词错误转换修复的请求。

返回字词转换主页 提交错误转换修复新请求

轉換与修复原理

[编辑]

由於简体中文、繁体中文之间存在一对多现象,即以單一简化字或繁体字來对应多個繁體字或简化字[1][2],因此必須有額外的数据來補足原先丟失的信息。例如,繁體中的“髮”或“發”,在简体下都是“发”。在程序裡,我們有一個默认的對應,比如說“發”。那麼一般情況下要從簡體轉換成繁體時,程序遇到“发”就會先將其轉換成“發”。那麼什麼時候對應成“髮”呢?這就要看詞庫而定。比如詞庫中有“头发=>頭髮”的關係,這樣“头发”就會被轉換成“頭髮”。如果沒有這一關聯,那“头发”就會被錯誤地轉換成“頭發”。

那詞庫是如何创建的呢?我們先有每個字的默认對應,比如“发”轉換成“發”。然後我們在一個現有的繁體詞庫中尋找包含繁體“發”的词,再轉換成简体。這樣得到一個從简体到繁體的詞彙對應關係。所以,我們先要確定一個多對應字的默认對應關係。同样,修復過度轉換也是由上述的方法來處理。

外部連結

[编辑]

错误转换修复请求

[编辑]