|
---|
以灰色標註者尚未正式啟用 |
一般 | |
---|
條目與內容 | |
---|
頁面處理 | |
---|
用户行為 | |
---|
其他 | |
---|
|
本页面为维基百科:字词转换下属子页面,用于处理各维基计划全域转换和中文维基百科本地全局转换中的所有繁简与地区词错误转换修复的请求。
由於简体中文、繁体中文之间存在一对多现象,即以單一简化字或繁体字來对应多個繁體字或简化字[1][2],因此必須有額外的数据來補足原先丟失的信息。例如,繁體中的“髮”或“發”,在简体下都是“发”。在程序裡,我們有一個默认的對應,比如說“發”。那麼一般情況下要從簡體轉換成繁體時,程序遇到“发”就會先將其轉換成“發”。那麼什麼時候對應成“髮”呢?這就要看詞庫而定。比如詞庫中有“头发=>頭髮”的關係,這樣“头发”就會被轉換成“頭髮”。如果沒有這一關聯,那“头发”就會被錯誤地轉換成“頭發”。
那詞庫是如何创建的呢?我們先有每個字的默认對應,比如“发”轉換成“發”。然後我們在一個現有的繁體詞庫中尋找包含繁體“發”的词,再轉換成简体。這樣得到一個從简体到繁體的詞彙對應關係。所以,我們先要確定一個多對應字的默认對應關係。同样,修復過度轉換也是由上述的方法來處理。
|
- 字词转换不是纠正错别字的工具。如果你发现了错别字,请在原文中直接修正。
- 提报前请使用搜索工具(Google搜索[區分繁體簡體]、本站内置的搜索)尋找维基百科裡的字詞轉換錯誤,只影响一两篇条目的罕见错误请直接在条目中手动转换进行修复。另外地区词过度转换可能是公共转换组的副作用,此时也请直接手动修复。
|