跳至內容

英文维基 | 中文维基 | 日文维基 | 草榴社区

維基百科:關於改革字體、地區詞轉換功能的調查

維基百科,自由的百科全書
字詞轉換
主頁 討論
轉換請求
錯誤修復請求
地區詞候選
轉換介紹
字詞轉換處理 討論
  繁簡處理 討論
  地區詞處理 討論
  公共轉換組 討論
幫助文件
繁簡與地區詞處理 討論
  轉換原理 討論
  手動轉換 討論
  進階語法 討論
  用字模式選擇說明
相關模板
NoteTA 全文字詞轉換
CGroup 公共轉換組列表
Lan 介面文字轉換
地區用詞 地區詞模板
地區用詞2 進階地區詞模板
各地中文名 地區用詞資訊框
檢視 - 討論 - 編輯 - 變動

最新更改

[編輯]
  • 共識的第一條按照意見修改了一下
  • 共識的第二條按照意見修改了一下
  • 比較詳細的技術策略出爐了

動態監視

[編輯]
Wikipedia:繁簡處理
最後版本 Srr第一步:改寫Wikipedia:繁簡處理修改
Wikipedia:繁簡體轉換請求
最後版本 Srr第一步:改寫Wikipedia:繁簡處理修改

背景

[編輯]

中文維基的Wikipedia:繁簡處理問題是歷史問題,出自繁簡兩個版本的合併過程。在這個過程中,制定了繁簡轉換表使得繁簡字體轉換實現了相當的自動化,深受歡迎。然而,一些地區詞造成的同義詞分歧(打印机、印表機)仍然沒有得到解決,因此中文維基採用了一個值得質疑的策略,就是用繁簡轉換器的詞替換功能來同時實現繁、簡體版之間的同義詞替換。不料,繁體的常規使用者還至少分港台用戶兩種,內部依然存在同義詞分歧,於是使用繁簡體轉換器的超載詞替換功能,發展出除簡體(zh-cn,其實是中國大陸簡體)及繁體(zh-hant)外的三個字詞轉換表:台灣正體(zh-tw)、香港繁體(zh-hk)、新加坡簡體(zh-sg)。

2006年11月左右,港澳繁體(zh-hk)標籤在依投票結果新增在頁頂,而台灣正體(zh-tw)標籤則代替了原來的繁體(zh-tw)標籤,但這繁體版事實上在未登入下被預設為使用zh-tw,因此只是名字上的變更。故此,實際上對於繁體版的註冊用戶港澳繁體版和台灣正體早已在參數設置中設有。不久,馬新簡體也被提出要求顯示在頁頂標籤中,自此在頁頂多了大陸簡體以外的簡體選擇。目前,中文維基百科一共有六種版本,除上述五種版本,還有源文件作為不轉換(zh)的第六種版本,而繁體(zh-hant)一直還在頁頂標籤中隱藏着。

問題

[編輯]

雖然港澳繁體版建立之前有過一次投票,那次投票的局限性和操作方式意味着許多製造出來的問題沒有討論也沒有解決。爭論得最激烈的問題不外乎於中文維基是否應該有多種版本。雖然Wikipedia:繁簡處理裡承認

共識:我們的最終目標是:取消過去的繁簡分立體系,每個條目只保留一個版本,並通過電腦程式自動轉換繁簡體。

但隨着用戶要求替換的詞和詞組越來越多、地域針對性越來越強,合併的進程已不存在,「一個版本」的概念也已經模糊,目前只能說每個條目有一個「不轉換」的原始檔案。另一方面,不同的地區確實有一些特殊的習慣用詞或官方譯詞,在維基百科上同時出現時容易產生有關權威問題的政治糾紛。除此之外還有更微妙的眾多問題,詳見:123

分析

[編輯]

簡體和繁體的轉換是純字體轉換,僅僅涉及技術問題。區域詞替換則是內容創造和修改的問題。兩者的混淆使上述問題複雜化,不透明化,討論摸不到核心,後果是初衷和結局牛頭不對馬嘴。字體轉換和區域詞替換顯然是垂直的,因此即使只為了方便管理也有必要在概念上、技術上、屆面上把兩者區分開來。詳見這裏

進一步分析

[編輯]

繁簡體轉換問題切割開以後,剩下來的區域詞分歧可以總結出以下幾種類型,大多和外來語有關,但不全是:

  • 非專有名詞
    • 偏好分歧
指幾種詞各區域通用也比較一目了然,僅在使用頻率上有別
例:公共汽車詞組激光
    • 詞義分歧
指字面意思不同或有混淆可能的詞語,經常是術語和意譯的外語詞
例:散列表交流道
  • 專有名詞
    • 音譯分歧
指音值相似、只是音譯規則不同造成了用字分歧
例:馬力歐伯克利米高·喬丹
    • 權威分歧
指當事人或組織在各地區使用的正式命名不同(名稱、商標),或各地區政府的官方命名不同(地名、人名)。
例:通用電氣公司老撾布什

上述分類有少量重疊。

共識

[編輯]

經過數次討論,得出以下的觀點,希望能成為階段性的共識:

  • 設立繁簡體「公版」,也就是恢復沒有地區詞替換的源文件繁簡體版。

理由:源文件作為中文維基的標準版,需要有方式呈現出無顯着地區特徵的繁簡字體資料。

  • 審查全版本替換表的內容,逐漸脫離對該表的依賴。

理由:全版本替換的技術不成熟,漏洞百出,影響面廣,各種改動牽涉太多,所以無法有效維護。同時,由於編輯規則不同於文章(管理員必須介入),常規的「維基過程」失效。是否要保留一小部分的全版本替換詞應該商討一下,但這個表應該慎用,裏面的每個詞都應該商討有沒有必要全版本轉換(即為什麼不能用標籤達到同樣的效果)。

  • 規範內文地區詞替換標籤的使用原則。

理由:內文替換標籤(noteA等)是文章內容的一部分,所以必須接受「維基過程」,包括出現爭議時通過討論來解決(這裏的爭議包括某篇文章是否用替換標籤,在哪裏用,用什麼詞,等等)。制定一些原則可以使這個過程更客觀、透明。

閱覽Wikipedia:繁簡分歧詞表是討論這些問題的良好起點。

  • 制定地區名存亡的標準。

理由:與其給每一個要求的地區一塊新版面,或禁止添加新版面,不如用客觀標準來決定增加或撤銷一個地區名。

實踐

[編輯]

以下是一個界面的建議。簡/繁是兩個連接,類似以前的簡/繁轉換連接,通過純字體轉換表把當前顯示的頁面用全簡體或全繁體呈現。工具欄里可以選擇地區詞的替換。

「技術上的問題沒想像得那麼難,都可以用現有的技術和表完成(某些表需要整理);只要誰授我權,我絕對樂意去實現。舉個例子,依照上圖,如果用戶選擇簡體,但用台灣區域詞替換,自動轉變的步驟應該如下:(1)把源文件(也就是「不轉換」版的內文)用簡轉繁純字體轉換轉成全繁體(包括內文的所有標籤,都一併轉換),被特殊escape的段落不轉換;(2)從源文里抽取(zh;zh-cn;zh-tw;...)標籤,把zh的詞選替換成zh-tw的詞選,被特殊escape的段落不替換;(3)把第2步的結果用繁轉簡純字體轉換成全簡體。TTTT 07:06 2007年2月2日 (UTC) 」

「目前的轉換我問過mountain,有實現繁簡與地區分開的基礎,但這類改動要小心從事。—自由主義者 ☎ 2007年2月2日10:37 (UTC+8 2月2日18:37) 」

意見

[編輯]

請表示同意或不同意,並歡迎寫下你的意見,或在下面補充其他信息。

(+)贊成改革,我認為情況真的很糟糕,港澳繁體、馬新簡體、台灣正體............再遲一點可能要「台灣本省正體」和「台灣外省正體」,或者「馬」、「新」又是要「宣告獨立」,亂作一團。當然,無可否認的是,地區用字的歧義,有時真的會嚴重影響理解。但是,分得太細緻,只會增加編輯的困難,而且不必要地搞「地區詞」,不利知識傳播。我認為世界上沒十分十美,建議:

  • 應該設「使用內文地區詞替換標籤的常規」,要包括以下數點:
  1. 編者應盡可能使用所有中文社區都能理解的詞彙,盡量避免過份地區化的用語,而有關詞彙可在內文列出參考,但不應該使用「替換標籤」。
  2. 如果原文的詞彙會使某地區的讀者產生「明顯的理解困難」,就可使用「替換標籤」,同時簡略解釋原因。換言之,要是原文詞彙能夠被理解的,即使用字不夠「地區化」,都不需使用「替換標籤」。
  3. 如果同一條目有多組字彙是各地相通的話,則應以條目創建者的字彙為優先使用。
  4. 如出現一些情況,非關理解問題,例如哪一個字彙比較權威、比較政治正確之類,應該透過討論解決,不應以替換功能解決。
  5. 假若有需要使用「內文地區詞替換標籤」,而「地區用詞」本身亦出現爭議時(例如「地區詞彙」亦多個版本的時候),應以討論解決,選取比較常用那的一個。
  • 我相信華文區之間,字彙完全不相通情況並非多數,很多更可以避免,所以我認為只需保留一個「地區用字」標籤就夠,毋須再細分,如果技術可行的話,這個「地區用字」標簽只需在條目裏出現 A 標簽時顯示。只要 A 標籤能識別瀏覽器的設定,要做到地區用字替換並非難事。我認為這是平衡各方意見的做法。Srr 21:44 2007年2月3日 (UTC)Srr 18:25 2007年2月5日 (UTC)

(+)贊成——附和以上意見。守夜者 19:05 2007年2月6日 (UTC)

部份(+)贊成:僅反對「規範內文地區詞替換標籤的使用規則。」,應改為「有爭議時必須經過討論」。現在的維基規則中,沒有規定增加或刪除內容前都需要經過討論,而是經過一輪回退後,應該在討論頁進行討論以尋求共識。因此我認為應改為「有爭議時必須經過討論」。--Jnlin討論) 01:14 2007年2月5日 (UTC)

(+)支持,我覺得地區用詞必定要和字體分開,不然就是只留繁簡體,只使用地區不同用字標籤。但是我覺得替換標籤總是不能不要,臺灣人看到「閃存盤」或香港人看到「計程車」畢竟還是會覺得怪怪的。我是建議較大分歧的地區用句使用用詞替換標籤,而一些地區性不同用字例如里.裡.裏盡量避免輸入,我建議是使用分岐比較小的裡。而且還要定常用字彙清單,總不能讓「天后宮」變成「天後宮」這一類糗事發生。--陋室(亭中茶話) 09:32 2007年2月27日 (UTC)

(-)反對Jnlin之意見。規範內文地區詞替換標籤的常規,不代表毋需經過討論,反而能有所遵從,討論起上來更加有據,如果照Jnlin所講,那麼我們連wp:nc都可以不要了,凡事都在討論頁爭論一番就可以。
我不贊成在中文維基使用地區用字,如果真的想要100%的地道用字,我認為應另立維基。但我要指出在Wikipedia:互助客棧/方針中一個錯誤的論述,就是「英文沒地域中心」(Stewart),英文一樣有地域中心,最起碼有 ArE 跟 BrE 之分,文法不同,用字的拼法也不同,甚至是用另一個字,例如 「mail/post」、「aluminum/aluminium」、「subway/underground」等,但英文維基並沒有所謂「內文地區詞替換標籤」,大家互相包容,沒有人吵著說這是「搞大英語區整合」。當然, ArE 跟 BrE 交流比較多,所以就算寫 aluminum 英國人也會明白,只是習慣上略有不同。我亦十分明白,中文區有一些譯名、用字是全然不同,而且互不通用,的確會產生閱讀的困難,所以內文地區詞替換有實際需要。但我要強調一點,我指的「實際需要」是「當特定地區讀者有理解困難」的時候。
而我認為「使用內文地區詞替換標籤的常規」可先處理(如切實執行,我可參與編寫),因為就算經過Zhconversion.php轉換,但似乎仍然可以透noteA這種「下層」標籤替代。長遠來說,我認為應全面消取Zhconversion.php中所有無關字體的轉換,有需要的話應改用「內文地區詞替換標籤」,這樣可以釐清「繁簡」、「地區用字」的從屬聯係,而且比較有彈性,因為有時「地區用字」根本都沒有統一標準,不少時候都是各說各的,例如馬力歐。加上我要指出,地區詞之間並非mutually exclusive,大家可以交流而互通,如果將地區用字編入Zhconversion.php,當社會文化有所轉變的時候,就難以因時制宜。
致TTTT兄:我認為這樣的分類,有互相重疊的地方,並不能清界定替換規則,所以我認為以「是否各地通用」作為原則,準則例如Google地區搜尋的結果或者主流媒體的用法等。介面設計方面,我認為TTTT提議的和現時的設計,都可以。Srr 08:48 2007年2月5日 (UTC)
那個分類本身不是為了界定替換規則的劃分,純屬分析,看怎麼把幾種情況最大限度拆開。當然你說了用它作為起點也不是不可以,具體說可以建一個分析頁面,有分歧詞就先討論屬於哪種類型,然後填進去,再按照那種類型的規則行事。TTTT 09:22 2007年2月5日 (UTC)
Srr, 問題在:很多時每一種用字(好 來 塢/ 荷 里 活 , 激 光 /雷 射。。。) 都是「地區用字」,分別只在流通量與流通地。---Hillgentleman | 15:08 2007年2月5日 (UTC)
Hillgentleman, 問題只是你用了地域中心的心態,看那個原本通用的字不順眼,覺得「不對等」而已。但我們寫條目最重要是被所有中文的使用者理解,而不是將文章地域化。我贊成一些根本互不相通的譯名使用替代,例如「宏」和「巨集」。就以你提這兩個做例,我身為香港人,也明白好來塢(這個譯名應是普通話的音譯,香港懂普通話的人不少啊),香港迪士尼也有一間好來塢酒店。而激光和雷射,我想在香港,使用率是不相伯仲。所以我認為兩者都毋須用地區替代,在內文列出就夠了。當然,用不用這功能,就是可以利用常規去討論,維基過程一樣存在,總好過一概而論,為地域化而地域化。Srr 15:43 2007年2月5日 (UTC)
  • 請定義「地域中心心態」。----Hillgentleman | 16:00 2007年2月5日 (UTC)
毋須定義,只是一般的說話,我並不在說維基的「地域中心」方針,這不是我說話的重點。Srr 16:06 2007年2月5日 (UTC)


Srr, 請解釋何謂「地域中心心態」。---Hillgentleman | 16:11 2007年2月5日 (UTC)

Hillgentleman,閣下又不妨解釋一下為何要我解釋一下。請注意,我並非在說wikipedia:避免地域中心,「地域中心心態」不是重點,如果你覺得被冒犯,對不起,但建議你還是回歸正題好吧。Srr 16:23 2007年2月5日 (UTC)
  • Srr, 凡辯論均須開宗明義。已見多人提及「地域中心」;然而大家理解此詞未必同。---Hillgentleman | 16:37 2007年2月5日 (UTC)
如果我要參與你這場詭辯的話,我會說:「請你解釋為何辯論均須開宗明義,並定義何為『開宗明義』。」然後一直詭辯下去。第一、我已經一再說明,我的說話中,「地域中心心態」不是重點,就算將上文「用了地域中心的心態,」完全刪去,也不影響大意。「地域中心」是中文字,你不會不理解吧?我只是用一般人的準標來說,就是以地域的立場思考,總覺得中文維基一定要有地域之分,而不能共同,就是這樣,講不上定不定義,至於維基如何定義「地域中心」,請你問其他人。這是我最後一次回應所謂定義問題,再請你回歸正題。我怕跟你討論是我的一個錯誤。Srr 16:52 2007年2月5日 (UTC)
  • Srr, 有人以為立轉換功能屬地域中心行為,有人認為反對轉換功能屬地域中心心態。若無一確切定義,雙方不能溝通。--Hillgentleman | 16:58 2007年2月5日 (UTC)
Hillgentleman,請見下TTTT 21:10 2007年2月5日 (UTC)。
Srr誤會我的意思了。當然可以對整體適用範圍做限制,但不應該要求加上地區轉換前必須在該條目討論頁討論。--Jnlin討論) 17:20 2007年2月5日 (UTC)
不以為然,為何「不應該要求加上地區轉換前必須在該條目討論頁討論」?最起碼需要解釋原因,提供一些基本証據,處理方法根命名的爭議沒分別。地區詞替換是一個與原文有明顯衝突的改動,正如分拆條目前都需要有所討論,解釋原因。Srr 17:34 2007年2月5日 (UTC)
我覺得你們倆並不存在規範標籤用法這一問題上的分歧,只是對修改維基頁面應該先討論還是後討論有不同的理解。我的理解是,小修改可以先編輯,大修改(篇幅大、影響大、改標題等等)最好先討論。其實用意就是有理由相信會引起大爭議的還是先討論,不然之後還是會出問題的,但儘量不妨礙大家的修改權,不然就有損開放性了。所以你們都有對的地方。TTTT 20:04 2007年2月5日 (UTC)
補充:例如現在的NPOV政策,若你覺得一個條目POV,則可以貼{{POV}},或是直接把你認為POV的文字改正。我認為轉換也是一樣:若你覺得需要轉換(而且也符合整體適用的範圍)那麼就自行加上,不需在討論頁討論;若你覺得不需要轉換也可以拿掉標籤,若有其他人不同意可以回退,這時就需要在討論頁討論。--Jnlin討論) 17:28 2007年2月5日 (UTC)
掛上POV模板是需要解釋原因的。要除下也是應該在共識之後,正如果我處理油魚的分拆,我不會隨便將標籤拿掉,先商議方案再行動。Srr 17:34 2007年2月5日 (UTC)POV模板清楚寫明:「掛上此模板的編輯者需在討論頁說明本文中立性有爭議的原因。」Srr 17:50 2007年2月5日 (UTC)
  • Srr, NPOV就要求多重觀點。若原文本身為地區用語,再加入另一地用語將更充實。--Hillgentleman | 17:39 2007年2月5日 (UTC)
  • 我不知道你說的「NPOV論點」是指何處,如果你是指User:Jnlin提出的例子,那明顯誤解。他提出的意思是指加入替換時毋須先討論。如果你是指「不用替代功能就是違反NPOV」,這就是一個錯誤。第一、地區用字可透「重定向」連結,各地字眼,甚至沒有地域爭議的不同字眼都可以包容。第二、不用替換功能不代表不能列出地區用字,不同的用語一樣能夠反映,沒有所謂充實不充實的情況。Srr 17:50 2007年2月5日 (UTC)
我來處理POV條目的方式是,若我願意(有能力)改為NPOV,則我會馬上動手(方針「勇敢更新頁面」)並解釋原因;若我沒有能力,我才會掛模板。所以也許我們兩個人解決問題的方式不同,你習慣先討論,而我習慣做了再說。只要每個人都善意假定(這也是方針),那麼我的方法就不會有問題。所以我認為,我們只要抓大方向,真正有問題的轉換一定會有維基人提出並改善,而不需要逐條目去討論,這樣太花時間。--Jnlin討論) 17:58 2007年2月5日 (UTC)
或許這樣說,不一定要討論七日,投票表決,最起提供一些簡單原因,我相信這不算花時間吧?但是,如果連「地區用字」都有爭議,就應該先討論,後修改。我上面的提議依照你建議略略修改了。Srr 18:10 2007年2月5日 (UTC)
接受,但TTTT原本的提議也應該修改。另外,提供原因的地方不只討論頁,在編輯歷史中也可以。--Jnlin討論) 18:15 2007年2月5日 (UTC)
多謝,但你指「TTTT原本的提議」是甚麼?Srr 18:26 2007年2月5日 (UTC)
他指的是第三條。我覺得之前的「規則」一詞可能是問題之本,我改了一下。TTTT 20:14 2007年2月5日 (UTC)

我來回應一下Hillgentleman提出的幾點看法(「有人認為設轉換功能是地域中心,有人認為不設是地域中心」,「對等」)。

  • 第一件事,轉換功能本身設不設都無所謂地域中心或其他任何問題,只是技術,我不反對技術,主要看怎麼用。
  • 我覺得有必要明確「地域中心」的含義。我們來熟讀Wikipedia:避免地域中心里的頭一段,最後一句是「看起來好像是客觀的文字實際可能已經包含了主觀的意念,而這正是與維基的中立觀點政策相違。」可見,地域中心的問題從根本上講是POV(觀點、立足點)問題的特殊化,「中立觀點」原則也始終指導着這條原則,而不是什麼詞語對等的原則(事實上維基百科並沒有這樣的「對等」原則)。說得詳細一點,避免地域中心就是避免偏向某一個地區的觀點(對比NPOV避免偏向某一個群體),包含避免透過地域色彩的文字(描述、用詞等等)暴露特定結論或偏向特定地域看事情的立足點
  • 用詞涉及POV的例子很多也很容易理解,比如「打胎/殺胎/人工流產」。但用詞(特別是標題)怎麼才算涉及地域中心問題?舉例,「尖閣島/釣魚島」。必須選一項時有一定的規則和tiebreaker。除了中文維基的FAQ,還有英語維基里的先例和那裏討論留下來的FAQ,畢竟英語維基早就遇到類似問題了。什麼用詞不涉及地域中心?「打印機/印表機」(但不等於不涉及任何問題,見最後一點)。怎麼判斷每一個詞?很簡單,自審,「用詞是否影響文章的結論?」如果不影響,就不存在POV,當然更不存在地域中心問題。
  • 再論自動轉換能不能解決真正的地域中心問題?答案是不可能的。(英語維基怎麼沒想到給中國來的IP都顯示「釣魚島」,給日本來的IP都顯示「尖閣島」?)非但解決不了地域中心問題,還會製造更多,因為轉換的潛台詞就是推崇地域化不是嗎?打個比方,香港版把「香港」轉換成「本港」,大陸版把「中國」轉換成「我國」,看上去很順眼嘛,區域用詞互相「尊重」不是嗎!?再舒服不過了!而這些恰恰就是Wikipedia:避免地域中心里告誡不要用的例子!進一步,誰來防止「大陸」轉換成「中國」,「台灣」轉換成「中國台北」,甚至「陳水扁祖籍台南」轉換成「陳水扁祖籍福建」或「陳水扁祖籍非洲」?怎麼處理?現在不是問題以後就不是問題嗎?現有的貢獻者比較開明不這麼做,明日的新貢獻者不知道標籤的由來只想着製造「本土」版就不會這麼做嗎?難道界面不需要清理一下,標籤的用途不需要規範一下嗎?所以才提議,所有的轉換必須等同於修改內容,並接受「維基過程」,嚴防新技術的隱性功能被用來迴避一系列維基原則。
  • 有人說,99%的詞都和避免地域中心無關聯,轉換又只會製造地域中心的問題,何必規範它,索性不轉換了。但我覺得還是要保留它來服務表意文字的比較特殊的現象,就是在個別頁面上存在閱讀理解上的困難,特別是術語。雖然沒那麼嚴重,但我覺得還是合理的疑義。原則上我同意在這種情況用轉換。其他情況的轉換我的意見是,反對濫用(POV,frivolous,全版本轉換,大段轉換,或不經約束的轉換),理由很簡單,第一:濫用違反維基所有的規則;第二:濫用等於各築籬笆牆,並促成版面「所有權」歸地域「專家」的變相多版面趨勢。非濫用又非混淆(比如官方命名差別,習慣用詞差別等等)我雖然個人強烈認為沒有必要,但原則上不贊成也不反對。TTTT 21:00 2007年2月5日 (UTC)
我認為各方的論點,基本上都已經反映,起碼取得了一些妥協,相信是付諸實行的時候。如果再不做出一個起點來,人走茶涼,想改革就難了。我建議發起投票,先定下「繁簡轉換」和「地域慣用詞彙」的方針。

以下是我建議的工作程序:

  1. 重寫Wikipedia:繁簡處理,並提升為正式方針。重新界定「繁簡轉換是字體上的轉換,除了一些轉換後會出現錯誤的詞彙,例如「打鬥」會正確變成「打鬥」外,並不會包含各地域慣用的詞彙替代」,「有關各地域慣用的詞彙替代,應參考Wikipedia:地域慣用詞彙的處理」。
  2. 增設Wikipedia:地域慣用詞彙處理,並投票成為正式方針。主旨:「每個條目使用的字詞,應盡可能被所有中文使用者所理解,而並非以地域分成多過版本。但隨着各地的使用增加,維基發現不同地域,存在一些特殊的慣用和翻譯詞彙,故中文維基設置替代地域詞彙的功能,如果原有條目的詞彙會使某地區的讀者產生明顯的理解困難,便可使用替換功能。換言之,只要原有條目的詞彙能被各地所理解,即使字詞並非地域最慣用的,都不應使用替換功能。」(細則在上方已經達成一些小共識)
只要上兩個方針定下來,隨後的工作就有了根本,易做得多了。
  1. 重新按照TTTT兄的設計,配置介面,並定立「地區標籤」的存亡標準。
  2. 修改Zhconversion.php,變成純字體轉換。
  3. 工程大致完成。

如果我建議得一些認同的話,我就可以開始編撰,之後發起投票表決。Srr 15:50 2007年2月6日 (UTC)

那就請你協助編擬一下。最近我有點忙:原本我想把這篇留在這裏供更多人討論一段時間的,但還是沒太多人來發表意見(特別是原來要分地區的創始者們,似乎不感興趣還是不常上網?),也許成為投票項目後會有更多人來,你就推進吧。TTTT 09:56 2007年2月7日 (UTC)
基本上每一個事項都沒有必要用到投票才能解決問題吧?主要對於修改ZhConversion.php,收集有關的詞彙是花費得最久時間的。在我的轉換系統草稿中有一個草擬中的新轉換方案,待收集足夠的詞彙時,便能透過Bugzilla提出有關中文字詞轉換系統的建議。還有,這個變更不是只只會影響維基百科計劃,而定對MediaWiki軟件作出修改,亦即是會影響到所有中文維基媒體的計劃,同時這個變更亦可以為其它需要語言轉換系統的wiki打下一個基礎,如粵語維基和吳語維基等。--Shinjiman 16:33 2007年2月6日 (UTC)
頭兩項我怕不投票,事後爭議會更大,所以建議定為正式方針。至於Zhconversion.php修改,我明白是最花時間的,我也沒有這些技術能力,所以只能建議放到最後。Srr 16:44 2007年2月6日 (UTC)

其實我一直看不懂,何謂「簡繁公板」。--WiDE 17:00 2007年2月6日 (UTC)

即是「沒有使用地域慣用詞彙替代功能的原版條目」,以供簡繁轉換。Srr 17:09 2007年2月6日 (UTC)
簡單來說是「只轉換簡繁字體,不轉換用詞」的二個頁面。中文的同義詞問題以規則解決,我與Ksyrie都設想了一些規則,當然還需要完善。--真實事求是() 10:23 2007年2月7日 (UTC)


「簡繁公板」也就是指,取消系統自動轉換同義詞的意思嗎?--WiDE 03:12 2007年2月10日 (UTC)



(:)回應Srr,你大概看了我這句吧?!「或許華文本身便是一「種族中心」,中文本身就是「地域中心」,一些維基人應該去找英語、世界語這些「沒地域中心」的地方。」不好意思,這句是我的氣語,我有點控制不到情緒。因有提過「華文」一詞有華人的語文的意思,「中文」一詞就是只限中國的語文,我所指的「沒地域中心」看見我加了括號嗎?!事實是反語。
我的主張是的確地區用詞轉換是以地域為主的,但地域中心應該也有分好壞,過份的地域中心我也不支持,故此我們之前在繁簡轉換也出現過爭議,但地區用詞是一種較省時的做法去處理經常出現的不同地區用詞。倒過來,與其每次手工轉換為什麼不自動轉換?!還是你支持不轉換?Stewart~惡龍 10:27 2007年2月7日 (UTC)
我倒想問你,為何一定要設純地區用詞頁面?--真實事求是() 10:34 2007年2月7日 (UTC)
看了源碼以後我更確信大多轉換是不必要的,舉個例子,我看到了「方便面」、「速食面」、「泡面」、「即食面」、「快速面」之間的轉換和「冷盘」、「冷菜」、「凉菜」之間的轉換。動詞、名詞之間的混淆不說,(我晚上泡麵吃=我晚上快速面吃?!),誰告訴我這有任何必要,誰看不懂任何一組請舉手。TTTT 13:20 2007年2月7日 (UTC)
惡龍兄:對不起,我的確注意不到這是「反語」,我的理解是:你認為這些不認同轉換的人,是「枉費大家的努力」,是「不切合各地的個別需要」,叫那些人「滾到」(當然有所誇張)英文、世界語這些沒有「地域中心」的維基。我想指出只是:中英文這些應用人口多語言,自然有一些用字分歧,但只有中文維基這樣愈分愈細,愈分愈複雜。(但我亦早說過,中文情況比較有一點特別)我強烈認為,這是中文維基,不是香港維基、星馬維基、大陸維基、台灣維基,我本身反對這些轉換功能,如果維基是我一個人話,我會同意「真實事求事兄」的處理,但有一些維基人指出了一些詞彙差異,的確會明顯影響閱,所以我提出保留這功能,但應該多加規範,沒有需要的話都不使用,僅此而已。
至於將地區用字抽出Zhconversion.php,相信是事在必行,因為如果Zhconversion.php不純正的話,會影響其他mediawiki。Srr 11:23 2007年2月7日 (UTC)
確實有些詞彙會影響閱讀,你的設想是什麼?
我認為這些詞彙數目不會太多,而且也不會造成太大困難,以散列表為例,點擊入條目問題就解決了,沒有必要為此保留地區用詞分頁,保留了地區用詞分頁難保以後的維基人不會濫用,且地區分頁越來越多的問題沒有獲得解決,因為其他地區的人也可以此理由要求設立地區用詞分頁。我認為不過只是同義詞的問題,沒有這麼嚴重,看不懂的問題被誇大了,看懂看不懂主要在於條目內容寫得好不好,不在於同義詞。--真實事求是() 10:17 2007年2月8日 (UTC)
若無需「純地區用詞」,那沒有必要設地區用詞頁面,用簡繁公版即可。簡繁體的轉換也需要詞語轉換功能,我沒有反詞語轉換功能,我只是認為無需設「純地區用詞頁面」而已。--真實事求是() 11:19 2007年2月7日 (UTC)
    • 正如Hillgentleman所說的,真實事求事已長久參與討論,應該知道意圖取消地區用詞轉換機制會遭大多數維基人反對的,這次就以限制地區用詞轉換的數量來達成其目標,甚至多次意圖誤導眾人同異詞數量不多,以說服眾人扼殺他看不順眼的地區用詞轉換機制。可是我們都知道,正因為各地區的不同用詞有礙讀者,強迫讀者接受異地用詞也易起地域中心的爭議,因此在會有zh-tw, zh-hk, zh-sg的出現。意圖取消或限制這行之有效的機制,並強迫讀者接受個別人士定出來的統一用詞,對維基來說不單是一個倒退,更是一種紺制讀者思想的行為,絕對不可得逞。不管怎麼說,地區用詞轉換機制已成定局,然而有人卻總是空口說白話,也不找找以前的討論來看,強指他人已經默認他個人的建議,簡單來說就是偏要找地區用詞轉換機制的麻煩。
      無論如何,地區用詞轉換機制必須存在,也不可以試圖以部分人的主觀意見來挑選哪個用詞應否轉換。繁簡公板是一個很好建議,我非常贊成,但不能因為設立了繁簡公板便取消或限制地區用詞轉換機制。縱觀今後維基的發展,地區用詞轉換機制與繁簡公板並存是事在必行的。 --kknews 14:15 2007年2月9日 (UTC)
  • 同意 kknews 的說法,贊成地區用詞轉換機制與繁簡公板並存。--Jnlin討論) 14:49 2007年2月9日 (UTC)
我很不欣賞kknews的態度,要批評人首先要看清楚他人的論點,我說的是「中文的同義詞本來就多,多幾個地區用詞算得了什麼!」,我只是質疑地區用詞有異的數量有多少,對閱讀造成的困難真的如某些人所說是個嚴重的問題嗎?如果真的是個嚴重的問題這就奇怪了,要知道對我而言,地區用詞完全不成問題,其他人說會面臨小問題我能接受,但說是面臨嚴重的問題,非要設立純地區用詞分頁不可,這就令我迷糊了,是我的IQ太高,還是某些人的IQ太低,到現在我還是搞不清楚,相信kknews能夠為我解答。--真實事求是() 14:51 2007年2月11日 (UTC)

既然無人反對,就繼續推行計劃

[編輯]

維基的精神是鼓勵以討論解決事情的,而投票是討論不出共識時不得已的做法,這點在wikipedia:投票中有說明,現在既然反對者不發表意見,我看等同於默认了,各種計劃就繼續推行吧,觸到癢處他們自會發表意見的,無需顧慮此事。--真實事求是() 15:22 2007年2月8日 (UTC)

  • 真實事求是,你多次重覆同一觀點。已有多人反對。--Hillgentleman | | 2007年02月09日( 五 ), 02:02:03.
我不了解多次重覆同一觀點有何錯誤?既然有需要重複,那就重複,而且在這裏我沒有說過同樣的話,那是在另外的討論頁說的,這樣也算重複?我這裏是回應上面TTTT的談話,他要設投票,我認為不必,是以說明。請給出那一條維基規則列明不可重複觀點?若沒有相關規則我倒要質疑你為何干涉我的言論自由?
討論中反對是需要理由的,不是象投票般一句沒頭沒腦的(-)反對就能了事,而且既然反對就在此討論,若無理可說那問題就在討論中解決了。TTTT已經集合整理出各種支持簡繁公版的觀點,以便閱讀。我覺得支持純地區用詞分頁者也應該這樣做,難道要人到處尋找翻出之前的論點嗎?你們不是很照顧讀者的嗎?--真實事求是() 10:03 2007年2月9日 (UTC)

User:真實事求是不要在討論的中間插入全新的章節。另外上面所列的辦法裏,地區標籤的退場機制不見完備、地區標籤刪除後會對用詞轉換標籤(如{{noteA}})造成什麼影響等,都應該詳細說明。另外,地區用詞必然會存在,關於地區標籤和簡正/繁體標籤的共識中也多次論及,只要沒有完善的解決辦法,就不應該貿然行動。--RalfX) 04:14 2007年2月9日 (UTC)

這不是全新,完全無關的章節,而是看到上面TTTT認為需要設投票而做出的解釋,另開章節也是為了避免與其他的討論混雜在一起,弄亂了焦點,也請列明到底那一條維基規則有說不可列全新章節?如果沒有我質疑你干涉我的言論自由。既然有反對意見,為何不在此討論,我懷疑你們要以不理不睬的態度讓事情不了了之,這是非常惡劣的。--真實事求是() 10:03 2007年2月9日 (UTC)
我十分理解你意見和擔心,但焦急都無補於事,逕自行事,事後只會被扯後腿,況且系統方面未有定案,更莫說測試,急也不在一時。至於會否不了了之,就要大家努力為討論「保溫」!Srr 18:23 2007年2月9日 (UTC)
確實急不來,現在看來事情已上軌道,以後的討論可能會往細節發展,我現實工作繁忙,難以進行詳細的討論,以後將專心我的工作,較少上來這裏。--真實事求是() 14:51 2007年2月11日 (UTC)
既然為了避免與其他討論混在一起,即應該在底下加上新的留言。您在他人討論中插入章節的行為和目的互相矛盾。--RalfX) 03:14 2007年2月10日 (UTC)
我在意見區底下加上章節,而沒有插入,另開章節更不容易混淆,行為和目的沒有互相矛盾。我的原意真的只是不想把好好的討論搞混,弄亂焦點而已。--真實事求是() 14:51 2007年2月11日 (UTC)

現在的共識應該是TTTT兄提出的四點吧。就我的認知中,這個共識並不刪除地區標籤,只是跟繁簡體轉換分開。現在要討論的應該是地區標籤的增加與移除規則,以及規定使用何時可以在條目內文中使用用詞轉換標籤(如{{noteA}})。使用用詞轉換標籤的大原則Srr兄已經列出。--Jnlin討論) 14:44 2007年2月9日 (UTC)

不消除地區分頁無法解決將來地區標籤越來越多的問題,而且簡繁公版加上地區用詞分頁管理會有困難,我也認為中文同義詞的問題根本就是很小很小的問題,我的還是認為應該完全取消地區分頁,我可以算是激進派,這立場是很堅定的,難以改變,我會尊重大家的選擇,但若以後有機會也會繼續發表不滿。--真實事求是() 14:51 2007年2月11日 (UTC)
推倒重來無助於百科的發展,任何問題都需要時間的幫忙來消弭。你認為同義詞是小問題,但我認為現在是大問題,不過也許過了10年就會變成小問題了。等到10年後,也許就不需要地區標籤,但我認為現在還是需要的。--Jnlin討論) 17:28 2007年2月11日 (UTC)

近中遠程的規劃未妥使得民心不安,現在下方的第一步已經有人反對了。--RalfX) 03:13 2007年2月10日 (UTC)

當仔細討論,我現實生活繁忙,難以在此進行詳細的討論,既然事情已上軌道,我長久以來的討論算是有了進展,以後將專心我的工作,較少上來這裏。--真實事求是() 14:51 2007年2月11日 (UTC)

第一步:改寫Wikipedia:繁簡處理

[編輯]

似乎在這裏的朋友都認同「簡繁處理」應與「地區慣用詞彙替換」分開處理,那就應該先改寫Wikipedia:繁簡處理。因為現時的方針是將「地區詞彙替換」納入「繁簡處理」,而Wikipedia:繁簡體轉換請求仍不停處理「地區詞彙替換」的請求,所以應先重寫繁簡處理,暫停接受有關「地區詞自動替換」的請求,以免「一錯再錯」,直至系統問題得到解決和使用規則有共識為止。

建議在Wikipedia:繁簡處理中,加入一節「新的共識」:

——舊有共識將地區詞的分歧,納入簡繁轉換系統處理,但其後發現這樣的做法產生不少問題:
  1. 地區詞與繁/簡體並無必然關係,正如「香港繁體區」的人一樣能以繁體書寫「大陸簡體區」常用的詞彙。
  2. 維基百科的簡繁轉換系統,與其他維基姊妹計劃共用,如果簡繁轉換系統包含地區詞彙替換,可能會使其他維基的轉換不準確,例如維基文庫
  3. 自動轉換過程會出現一些「失誤」,例如簡體的「數位人士」,轉換成繁體的時候會變成「數碼人士」,要透過其他技術解決,造成編輯上的困難。
基於以上各項理由,「繁簡轉換」應只是字體上的轉換,除了一些轉換後出錯的詞彙外,都不應有地區詞的替代(例如簡體的「打斗」會正確轉換成繁體的「打鬥」)。而地區詞的替代,如有必要的話,應額外建立機制解決,另訂方針規範。由於修改系統需時,而且未有定案,故現時自動的繁簡轉換仍然包括部份地區詞的替代,但將會逐步修正。

這一個改動,短期內只會影響Wikipedia:繁簡體轉換請求,其他較具爭議的功能(例如「馬星簡體」標籤)暫不受影響,小弟建議,如果在 2月16日前沒有反對意見,小弟將會根據上述內容改寫Wikipedia:繁簡處理,將以往的「共識」列為「舊有共識」,並在Wikipedia:繁簡體轉換請求中列明,暫不接受「地區詞自動替換」的請求。Srr 17:46 2007年2月9日 (UTC)

  • (+)支持--Jnlin討論) 17:48 2007年2月9日 (UTC)
  • (-)反對。即使現在的系統不完美,但給閱讀者的方便遠大於困擾,也看不到迫切性,不應該貿然修改,Wikipedia:繁簡處理作為系統的說明部分,也該暫時不要碰。如果要修改系統,我建議應該有人先如下面的意見所述,建立一個實驗性的MediaWiki系統,模擬新轉換環境下的中文維基,給所有維基人看看效果是否滿意後,再投票決定採用與否,不被採用就改到採用為止。橫豎維基的內容是開放的,大可以拷貝一份來測試,絕對不該一開始就去修改中文維基的軟件(及相關說明)。我看過不少系統因為未經實驗,就進行安裝新硬件、新版本、加入新功能等工程,結果發生從性能下降到系統掛掉的事故。我可不想看到中文維基發生這樣的危機。--Computor 22:56 2007年2月9日 (UTC)
你反對的和User:Srr上面提出的好像不是一回事啊,人家提出的是方針,沒有改系統的步驟。到目前為止還沒人提出影響維基用戶的具體步驟。我在下面申請的頁面都是維基百科不用的頁面,源碼一天兩天也改不了。TTTT 23:24 2007年2月9日 (UTC)
Wikipedia:繁簡處理好像不是方針喔。它不在Category:維基百科方針與指引的任何子分類裏面。我認為它是描述繁簡轉換如何運作的說明文件,只有當繁簡轉換系統修改了才應該作相應改動。--Computor 00:52 2007年2月10日 (UTC)
我原本想將「繁簡轉換」一併推動成為正式方針,只是基於為了更易獲得共識,毋需事事投票,才沒有這樣做。而且我必須指出,你上文的觀點極之誤導,Wikipedia:繁簡處理是描述系統發展方向,而非技術的說明,技術說明請到Help:中文維基百科的繁簡處理,無論怎樣,現時系統的發展方向,的確出現不少的邏輯問題,我認為這是事在必行,但並非要即時進行,技術上如何修改都未有定案,「結果發生從性能下降到系統掛掉的事故」的結論實在有點荒謬。我因應閣下的憂慮,略略再修改一下內容。我得見這裏各位大體同意這個修改,如果閣下仍要維持「反對」的話,我在此請建議閣下發起投票。Srr 06:40 2007年2月10日 (UTC)
要不然先寫個子頁面或是臨時頁面,等到系統修改後再移動過去?--Jnlin討論) 06:12 2007年2月10日 (UTC)
這就是我的意思!同意。--Computor 13:54 2007年2月10日 (UTC)
並不可行,我建議改寫有兩個目的:一、先停止地區詞自動轉換的請求,以免其他人的努力再白費。二、訂定共識,為大家日後的工作提供依據。這不應該是所謂「臨時共識」,否則以上兩點都會變得無憑無據。更重要的是,現時我不會將「繁簡處理」申請提昇為「正式方針」,你的憂慮根本不存在。Srr 14:55 2007年2月10日 (UTC)
(:)回應(一)不應該停止地區詞自動轉換的請求。新系統投入運作遙遙無期,在此其間,可能又有地區名字相異的事物出現(例如桌球一詞在香港指士碌架,在台灣指乒乓球),為了確保不同地區的讀者能正確了解這些事物,應該暫時保留繁簡轉換中的地區詞自動轉換,直到新系統正常運作。何況現在的轉換標簽還是有地區名在裏面(例如港澳、馬新),令使用者有合理期望系統會替他們轉換地區用詞。如果要關閉Wikipedia:繁簡體轉換請求,應該先把那些標簽改名(雖然這是另外一個爭議劇烈的提案,本人不會提出),免得讀者誤會。(二)既然不是方針,不會馬上影響維基的運作,可以試試修改,但請註明閣下加上的是關於將來的計劃,尚未實行,以免讀者和現在的情況混淆。--Computor 17:02 2007年2月10日 (UTC)
(:)回應我不認同Computor提出的幾點理由,覺得他的一些概念有嚴重的混淆。這使我更確信繁簡轉換一定要和詞替換區分開來,不然如同Computor這樣概念混淆的用戶存在更多就使詞替換方針永遠不能獨立地討論和完善。Srr提出的正是關於詞替換的方針,不涉及任何系統問題。Srr提出的對「繁簡轉換」頁面的修改其實根本不是繁簡轉換的問題,而是詞替換的方針問題,只是目前,兩者的討論都並存在那個頁面上。在方針層面上,如果逐漸脫離全站替換是成立的新方針,那停止表裏添加地區詞是非常合理的做法。如果那個「桌球」的例子有必要替換,可以用標籤。這取決於這個共識到底有沒有。Computor不用擔心系統何時投入運作,因為並不會影響到替換方針的改動。技術的增和減都為了服務方針,不是解決方針的場所,因此提出的系統修改方案可以實現各種意見,包括詞替換方針不改的意見;但技術上留有這樣的餘地絕不等於替換方針應該不改,恰恰相反,它減少了改的阻力。
(最後,建議你在任何頁面上看到「桌球」時,不要無腦地加替換詞,而依含義把它改成「乒乓球」或「桌球」,然後祝賀你自己為中文維基百科解決了一些問題。如果想闡述「桌球」的多種意思,建議你參與中文維基詞典的編輯。)TTTT 19:15 2007年2月10日 (UTC)
當局者迷,可能我真的混淆了。既然看到支持的人日多,我也沒有扭轉共識的可能。無論如何,這個決定是否明智,要待日後的實踐檢驗。--Computor 20:50 2007年2月10日 (UTC)
  • (+)支持:「繁簡處理」有必要和「地區詞彙替換」分開運作。--RalfX) 03:21 2007年2月10日 (UTC)
  • (+)支持:我認為分開是比較妥當的,我想大多數人之間的語言應該是可以溝通的。我想重點方向應是在於岐義的解決方法,若考量到轉換詞彙的量一大,想必對伺服器與閱讀都是種負擔。但是名稱的不同是否可以考慮盡量用Templates或重定向頁面來處理會比較妥當呢?當然如果地區詞彙真的很多,而有另外新增的需要時,我也同意如此做。Syn 12:49 2007年2月10日 (UTC)
  • (+)支持。改寫轉換程式是遲早要做的事。Z先生沒時間回來維基看看,只能靠我們自己接手。--百楽兎 15:45 2007年2月10日 (UTC)
  • (+)支持,幾天沒來,發覺現在的討論方向漸上軌道了,除了真實事求是兄的方案持對立狀態外(但他好像支持手工轉換?)。設立及發展繁簡公板不是一件容易的事,希望大家能堅持及協助,這可能是中文維基百科的一大里程碑,希望日後能得益中文維基其他計劃,以致整個wiki技術。目前對於技術方面可能還有疑問,但發展方向已比此前一致得多。Stewart~惡龍 19:00 2007年2月10日 (UTC)
  • (+)支持,英語中的地區詞比中文多得多了,也沒見要設立各種版本.還是希望中文維基越簡單越好.--Ksyrie 18:22 2007年2月11日 (UTC)

英語中的地區詞比中文多得多了,也沒見要設立各種版本.還是希望中文維基越簡單越好.--Ksyrie 18:22 2007年2月11日 (UTC)

  • (+)支持,我早就提議「繁簡處理」有必要和「地區詞彙替換」分開運作。在粵語,吳語文言之外另設立各種地區語言標籤的作法和陳水扁的「正名」異曲同工,純屬庸人自擾。--民國九十六年 18:30 2007年2月12日 (UTC)
  • (+)支持「繁簡處理」和「地區詞彙替換」分開運作這一點,但是我反對貿然將新系統投入實行或是立刻廢除舊系統,應該有一段適用的期間。--あるがままでいい(talk) 11:25 2007年2月13日 (UTC)

多謝支持,已就共識修改Wikipedia:繁簡處理Wikipedia:繁簡體轉換請求Srr 05:46 2007年2月16日 (UTC)

  • (+)支持,繁簡和地區辭分開了,接下來就是要鼓勵大家少用地域中心的詞了!我希望大家都能寫「桌球」,不要出現乒乓球和台球什麼的。--陋室(亭中茶話) 09:32 2007年2月27日 (UTC)

疑問

[編輯]
  • 對不起,我可否請問一下,為何經驗比較豐富,相當活躍的維基管理員或行政員(如書生兄或大山兄或WING兄),對此議題都沒有任何發言?我想知道,他們的態度是如何?我此疑問沒有任何動機,我認為較捻熟維基事務的他們態度或意見,對此有很大助益,也可讓這工作少走好幾趟冤枉路。另外,我有個不情之請,從TTTT熟悉維基事務的口吻,我擅自推斷(如有冒犯請多多包涵)他應是資深維基人,我想,如果他是某位資深維基人的馬甲,能否示出其他人或許較熟悉的其他帳號?--winertai 01:45 2007年2月11日 (UTC)

可能來晚了,但請讓我為共識一節給些意見。首先是繁簡公版,個人沒甚麼意見,反正是技術上做得到,而且有人想用。但想澄清,繁簡公版並不是「無地區特徵的資料」。因為世界上總有一些字是完全沒有任何人都看得懂的用詞的,即是說,無論用哪個詞,都總是有些人看不懂,即是總會有地區特徵,只是可能是多數地區的特徵而已。於是結論就是,「繁簡公版」只能建立出較少地區特徵的資料,要完全脫離地區特徵,是不可能的。希望共識一段可以改寫成符合這事實。

另外是地區名存亡的標準,我覺得現時技術支援的四個已經足夠,因為只有這四個地區能夠有組織性地確認用詞的標準,個人覺得不會有第五個地區吧。有些維基人說港澳用詞及新馬用詞會惹來其他地區的華裔人要求有自己的地區用詞版本,但實際上他們的用詞只會是複製自這四個地區,應該未有自行造詞的能力吧。-- Cosferia討論) 05:19 2007年2月11日 (UTC)

無所謂來晚了,討論的大門是永遠敞開的。我把「無地區特徵」改了一下。TTTT 07:32 2007年2月11日 (UTC)
  • 對不起,我只是一般用戶。據我理解(有錯請指出),「地區用詞」出現的一部份問題是軟件錯誤地轉換將一些詞,例如簡體的「數位人士」,轉換成繁體的時候會變成「數碼人士」,是軟件夠不夠聰明的問題?!如是否把「繁簡轉換」和「地區用詞」分開,類似問題可以得到改善嗎?作為一用戶,改了之後,須按兩次才得以前的可以一按即轉的結果。
  • 二:繁轉簡在技術上沒有大問題,只是簡轉繁需用字庫幫助作轉換,「繁簡轉換」和「地區用詞」分開可減抵字庫增大的機會,這是否問題的重心?軟件不夠聰明才是問題的重心?!
  • 三:小小意見:市面的「繁簡轉換」軟件亦標榜包括地區用詞換轉的功能,看來是大方響,本人用過,結果不如理想,如果能改善地區用詞換轉的難題,真是中文之福,令大眾以一種言語溝通而地區小眾得到照顧。 --218.102.187.242 01:54 2007年2月16日 (UTC)
    • —、這裏是中文維基,照顧的對象是所中文使用者,而不是特定某幾個地區的小眾維基,如果閣下有興趣的話,不妨下載一套維基,自己架站,你要多「小眾」就有多「小眾」。
    • 二、軟件永遠都不會夠聰明,現時並不存在完美轉換的技術。
    • 三、閣下還是跟進一下上方和以往的討論比較好。Srr 05:59 2007年2月16日 (UTC)

見此罵戰頁詭辯甚多,特轉文一段:
「老師,究竟什麼叫詭辯呢?」
老師稍稍考慮了一下,然後說:「有兩個人到我這裏來做客,一個人很乾淨,另一個很髒。我請這兩個人洗澡,你們想想,他們兩人中誰會洗呢?」
「那還用說,當然是那個髒人。」學生脫口而出。
「不對,是乾淨人,因為他養成了洗澡的習慣;髒人卻認為沒什麼好洗的。再想想看,是誰洗澡了呢?」
「乾淨人」。兩個青年改口說。
「不對,是髒人,因為他需要洗澡。」然後再次問道:「如此看來,我的客人中誰洗澡了呢?」
「髒人!」學生喊着重複了第一次的回答。
「又錯了,當然是兩個人都洗了,乾淨人有洗澡習慣,而髒人需要洗澡。怎麼樣,到底誰洗澡了呢?」
「那看來就是兩人都洗了。」青年人猶豫不決地回答。
「不對,兩人誰都沒洗,因為髒人沒有洗澡的習慣,乾淨人不需要洗澡。」
「有道理,但是我們究竟該怎樣理解呢?」學生不滿地說,「您講的每次都不一樣,而又總是對的!」
「正是如此。你們看,這就是詭辯。」66.150.99.144 17:18 2007年2月18日 (UTC)

其實簡繁問題早就造成我的問題了,之前編寫數碼寶貝就搞了半天,在臺鐵車站列表就直接取消簡繁轉換,不知道有沒有標籤可以只取消動態轉換但仍保留靜態轉換...--蒼空 翔 有事點我 20:41 2007年2月25日 (UTC)

有時候還會需要臨時取消手動轉換,而各種轉換的取消常要長達一個表格...--蒼空 翔 有事點我 20:44 2007年2月25日 (UTC)

有沒有辦法指定一個詞是某種語系,其他的讓系統自動翻譯,不然有時會出現混亂,有的詞在不轉換/簡體/繁體會不一樣...--蒼空 翔 有事點我 17:09 2007年3月5日 (UTC)

關於手動/自動轉換功能的共識

[編輯]

總體發展方向已經定下,接着是規範地區詞轉換功能。但我認有數點先要得到共識,之後再訂下使用細則:

—、新系統是否保留全局自動轉換?下方的技術討論可供參考。 二、內文手動轉換標籤有三種(全頁的{A|...}, 標題的{T|...}, 和單獨轉的{...}),不過noteA、noteT會改變的條目命名,這是否屬於「命名常規」的管理範圍?應如何處理?Srr 08:37 2007年2月23日 (UTC)

我認為還是要保留全局自動轉換,但可以逐步改為單篇文章轉換,亦即慢慢改為「有這個功能而不使用」。noteA不會改變條目命名,只有noteT會。目前的命名常規規定先到先得,其他重定向,或許可以加入「最通用命名」方針,但要注意「如何評估最通用」,不能以「人口多」之類的方針。--Jnlin討論) 08:41 2007年2月23日 (UTC)
贊同不是人口多的方針,而是以歧義少的方針。TTTT 22:47 2007年2月23日 (UTC)
地區詞的轉換部份,建議完全取消,這樣才能避免條目說明中的引文、文獻中的地區詞連帶被轉換的現象。至於較難理解的地區詞,如兩岸醫學用語等,則依Wikipedia:避免地域中心原則,於首次出現加上其他地方之等義用語。(條目名稱可進一步討論)譯名則效法英文版Wikipedia,於初次出現時加上原文名稱,以便於資料查找及他地人理解。RekishiEJ 08:30 2007年4月19日 (UTC)

標籤名稱參考

  • 轉換標籤名稱:
MediaWiki:Variantname-zh-cn
大陆简体 最後編輯:Fdcn,摘要未說明任何原因
MediaWiki:Variantname-zh-tw
台灣正體 Kevinhksouth據台灣維基人意見所選,香港投票原無此項
台灣正體 最後編輯:Ran,恢復了Shizhao去除的台灣字樣
MediaWiki:Variantname-zh-hk
港澳繁體 最後編輯:Kevinhksouth,香港標籤投票主持人
MediaWiki:Variantname-zh-sg
马新简体 最後編輯:Sl,據馬新標籤論爭投票
懂中文字的話,應該明白「未有定案」是甚麼意思吧?Srr 19:48 2007年2月18日 (UTC)
上面並未指明定案,只是隨時監督條目操作,與有無定案無關。--- 量子公民talk 21:08 2007年2月18日 (UTC)
是因為「已確定」那個詞嗎?已刪除。--- 量子公民talk 21:28 2007年2月18日 (UTC)

為了如此簡單的問題竟然作了這麼複雜持久的討論,簡直是不可思議。 以下就是解決方案:

  1. 完全關閉詞彙轉換功能。
  2. 任何情況下,一個字如果對應多個相對體字,這個字不轉換。
  3. 外文專有名詞直接寫作外文或英文,或在譯名後寫出外文或英文。
  4. 在有分歧的名稱後面說明別名,或採用更易於理解的名稱。
  5. 改進轉換功能,使能夠對繁簡體字混合的文章進行統一轉換。

Efeb 2007年4月21日 (六) 07:52 (UTC)[回覆]

技術討論

[編輯]

參考資料

[編輯]

TTTT 09:15 2007年2月8日 (UTC)

在Subversion上的

請提議者先看看在Subversion上的源碼,有關的轉換方式是在MediaWiki軟件裏本身做的,對標籤的修改可以找管理員協助;但對轉換方式,則須由用戶修改源碼,再由『遞交者』(Committer)應用已經修改好的源碼,放上Subversion中,才能應用變更。在CVS時代中,懂漢語的『遞交者』只有User:Zhengzhu一人。而到了Subversion時代,並沒有任何一位懂漢語的『遞交者』,包括Zhengzhu,這需要將請求放上Bugzilla中,在Bugzilla中的其它開發人員或『遞交者』亦未能熟悉漢語,可能會遲遲未能套用修改。--Shinjiman 01:52 2007年2月4日 (UTC)

    • 我不太懂程式語言,但我想問:程序上,「馬星/大陸」、「港澳/台灣」是否歸為繁簡兩類?再要仔細轉換就要依靠「內文替換標籤」?如果是的話,好像不一定要涉及MediaWiki軟件源碼修改,最起碼Zhconversion.php不用改。Srr 07:27 2007年2月4日 (UTC)
依我的看法中,現時的Zhconversion.php檔案裏,zh-cn的轉換文字包括了【簡化字】以及【中國大陸字詞】的轉換;zh-tw的轉換文字包括了【傳統字】以及【台灣字詞】的轉換;zh-hk的轉換文字包括了【香港字詞】的轉換;zh-sg的轉換文字包括了【新加坡字詞】的轉換。另外在LanguageZh.php的內容中,zh-hk是直接繼承了zh-tw轉換表再上zh-hk轉換表的內容;而zh-sg是直接繼承了zh-cn轉換表再上zh-sg轉換表的內容。因為zh-cn以及zh-tw的部份包括了傳統字與簡化字的轉換,故此要解決這個問題,則需要修改zhtable生成出來的Zhconversion.php以及在LanguageZh.php中的轉換從屬關係。--Shinjiman 11:52 2007年2月4日 (UTC)
請大家在討論對繁簡轉換作進一步的技術改進的時候,請不要只顧及wikipedia社群,也要同時照顧到其他的wikimedia姊妹計劃。例如wikisource因為是原始文獻的收集,所以根本不需要地區用詞的轉換功能,而只要求用字的轉換,這樣才能保證文獻的原貌。另外,wiktionary和wikiquote可能也存在類似的情況。 --百無一用是書生 () 03:22 2007年2月7日 (UTC)

詳細闡述目前的轉換技術

[編輯]

我看了一下mediawiki的源碼。user:shizhao說的這點我昨天也意識到了,確實mediawiki里放替詞表不合適,特別是經常需要更改的數據本就不該放在源碼里!具體說一下,

  • includes/zhtable/* 里沒什麼數據,(源碼里的轉換大多靠引進Unihan等公共數據庫,所以基本上是靜態的)。
  • includes/zhtable/MAKEFILE 生成includes/ZhConversion.php,裏面就定義四個轉換表變量,其中$zh2CN列前半是繁轉簡字詞,後半是台灣(繁)=>大陸(簡)翻譯詞,$zh2TW列前半是簡轉繁字詞,後半是大陸(簡)=>台灣(繁)翻譯詞。$zh2SG則是大陸、台灣、香港=>新加坡譯詞的合併,$zh2HK是大陸、台灣、新加坡=>香港譯詞的合併。
  • languages/LanguageConverter.php 定義轉換基類。
  • languages/classes/LanguageZh.php 延伸轉換LanguageConverter類,其中引進 includes/ZhConversion.php的四個轉換表變量,zh_cn版、zh_tw版分別用$zh2CN和$zh2TW轉換,zh_sg版用$zh2CN和$zh2SG的合併,zh_hk版用$zh2TW和$zh2HK的合併。

由此可見,這裏面混亂得不得了,特別是zh_sg和zh_hk的做法過於劣等(比如已經陸譯台了為什麼還有陸譯新的替換對等等),怪不得之前兩種variant招牌掛着卻不投入使用。

  • 全站轉換的數據來自上述源文件里的靜態表和 MediaWiki:Conversiontable/* 里的動態表的結合。這是所謂的「自動轉換」。
  • 除此,還有搜索、標題連接、外語連接、版塊等等的轉換都用了這個表。
  • 源文件里也有標籤轉換的跡象。支持三種標籤(全頁的{A|...}, 標題的{T|...}, 和單獨轉的{...})。這是所謂的「手動轉換」。

我看這些重疊表的使用都可以廢除了。下面寫一點並非完全成熟的技術策略TTTT 02:11 2007年2月9日 (UTC)

  • 仍須保留地區用詞整體轉換表;若未完善則須試完善之:共識中有:應建地區用詞進退機制。--Hillgentleman | | 2007年02月09日( 五 ), 03:02:56.

我認為zh-hk不應直接繼承zh-tw轉換表,而應獨自建立新表,原因是香港跟台灣的用字很多都不相同。

  • 例:香港用「衞」、「裏」、「卧」、「兑」、「昷」、「着/著」分開使用,台灣則用「衛」「裡」「臥」、「兌」、「囚+皿」、「著」代替「着」。拔萃仔 06:39 2007年2月11日 (UTC)

技術策略

[編輯]
  • 編制全新的簡轉繁和繁轉簡轉換表(靜態的兩個表,動態的兩個表)。
    • 制表的最高指導方針是:「服務現代漢語」和「轉字不譯詞」,因此,
    • 一對一的字無疑義,直接置入靜態表。
      • 各地區為同一概念造的不同的新字如果表音相同可以視作異體。
    • 一簡對多繁的字多為假借字。漢語假借僅兩種可能:
      • 借形,比如假借古罕用字(形)的「寧」、「廣」,則現代漢語裏實屬一對一,直接置入靜態表。
      • 借音,比如「斗」、「谷」、「干」、「表」、「面」,都一律放在動態表裏。
    • 一簡對多繁也可能是異體字
      • 把只有一種正規體的異體字作為一對一放入簡轉繁靜態表裏;凡是繁轉簡一對一的純異體,則放入繁轉簡的靜態表裏,其他的放在動態表裏。
    • 一繁對多簡的字(比如「乾」,「堃」)同理留給動態表。
      • 這裏面包括允許用於人名的異體字。
    • 簡繁和繁簡兩張動態表裏置放所有的一對多轉換,可以採取一定的自動化手段協助完成制表,如下:
      • (註:以下所指的「左邊」和「右邊」指表的「兩邊」,即「左邊」的字串轉換成「右邊」的字串。)
      • 列出所有的一對多的字對,以最常用單字順序排列:如:「斗=>鬥,斗」,「乾=>干,乾」,「堃=>堃,坤」。箭頭右面可以用array,如果技術上不能實現則最終只保留第一個轉換字。
        • 「最常用」並不等同於不轉換的字,比如「斗=>鬥」,「干=>乾」是最常用。但「堃=>堃」最常用因為「堃」作為人名遠比作為「坤」的異體常見,大多可以用作人名的繁轉簡異體字都如此。
      • 為了區分義,表裏左邊的每個字都列出包含該字的最短包含詞,並列出轉換
        • 如果詞和對應詞都一頭或兩頭裁字(最短裁到兩個字),結果仍是漢語詞並已經在表裏存在一對一對應,則該詞不是「最短包含詞」。
        • 如果一詞對多詞,以最常用順序排列。如果技術上只能取一個,則最終只保留右邊的第一個詞。
        • 注意不譯原則,即使一個詞在某地區有另一種意思或從來不用,也不譯。
      • 校對1:列出表裏所有出現非吞沒式重疊的左邊詞對(簡轉繁的話則如:「頭髮」、「發表」、「表面」、「麵條」),並拼湊。
        • 如果拼湊出來的也是詞並且會形成表裏未出現過的最短詞對,就必然是漏掉的詞對,也加入轉換詞對。重複至沒有新詞加入。
      • 校對2: 列出右邊非第一項的字串中僅在該對里出現的字串。這些是仍存在歧義的字詞對
        • 檢查是否漏掉了可以消除歧義的更長詞對。如有,加入,重複。
      • 到了這步,仍存歧義的字詞對都是難以自動轉換的,沒人工智能不可能分辨。
        • 比如異體單字(如人名里的異體)和語法差別詞(一些繁體裏動詞/名詞寫法有別的詞)
  • 以上是理想的制表方式。但為了方便,應該先利用現成的表數據作為起點,這並不是很難,手動都可以完成,但輸出的表可能有重疊或其他問題,可以慢慢清理。
  • 有了這些表,簡繁轉換就可以以最長吻合字串的做法來完成。步驟如下:先在文本里搜索轉換表右邊的詞,所有搜索到的詞都已經是目標字體的了;繼續在文本里搜索轉換表左邊的詞,有吻合就轉換成右邊的詞。如果右邊有多項字串,則取第一項字串(就是最常用的字串)。
  • 碰到轉換不好的文章,首先動用不顯示的分隔字串(目前有{})做詞分隔,而不是把周圍的幾個字一起加到動態轉換表裏去(除非形成的確實是表裏漏掉的,而不是一個特殊的片斷)。
  • 至於地區詞的互譯,建議用標籤實現。如果必要整站轉換(看不出這個必要,但如果一個標籤出現很多或為了連接和搜索等),則應另設表(而且索性來個全對應表,而不是四個地區排列組合出6個對應),然後先上替換表,再上繁簡轉換表。現階段可以沿用抽掉繁簡轉換部分的替換表,但應該審視並逐漸剔除不符合原則的替換(原則待討論,見「共識」段落)。
  • 增設zh-hans和zh-hant兩種variant,分別為標準版簡體和標準版繁體。保留zh。
  • 其餘variant的處理方式也根據需要修改源碼。

同時請參考中文維基最初建立繁簡體兼容體系時的Wikipedia:繁簡處理/技術方案

最後隨便說一句長遠一點的話,其實啊,如果中文維基字典做得好,就是最好的轉換表源了。 TTTT 13:09 2007年2月7日 (UTC)

靜態表做繁->簡漢字的一對一無歧義轉換,動態表做一簡->多繁的漢字轉換,需要日常維護。詞語的轉換最好在各個條目用noteA標籤解決,不要設全局轉換表。--Alexcn 05:21 2007年2月9日 (UTC)
非常恰當的總結。TTTT 05:29 2007年2月9日 (UTC)

下一步

[編輯]

完成以上的計劃需要修改源碼,比較麻煩。但是大部分仍然可以不修改源碼完成,性能會差一點,作為嘗試則不成問題。因此:我準備先興建兩個動態轉換表,分別為zh-s和zh-t服務。其中一部分將來可以移至靜態表。最終這兩個名字按照國際標準應該叫作zh-hans和zh-hant,zh-tw應該改為zh-hant-tw,以此類推。zh-hant轉換的動態表頁面似乎已經存在,不知道是什麼緣故。 我已經向管理員申請了,請給予支持。TTTT 05:27 2007年2月9日 (UTC)

我覺得閣下應該是要下載一套MediaWiki軟件,再進行修改;修改後將它放給開發員處理。只是在維基百科中授權,亦不會對MW軟件的修改有任何的幫助。--Shinjiman 11:53 2007年2月9日 (UTC)
確實應該先架站試驗一下,等社區達成共識,充分測試之後再上線修改。--Alexcn 13:15 2007年2月9日 (UTC)
我申請的兩個頁面是為了讓所有人都過目一下上面所謂的繁簡轉換包括哪些詞、不包括哪些詞,畢竟有一些邊緣案例,也可以借維基用戶的力量完善一下這些一旦改系統就要用的表。我自己建個站根本不解決這些問題。我不認為這有什麼不恰當,或與另架測試站有什麼關聯,兩者大可以並行進展。我要求的頁面根本不被使用,既不影響目前維基百科的運作,又可以為下一步的修改做準備。請各位管理員重新考慮我的提議。TTTT 23:34 2007年2月9日 (UTC)
個人不建議在中文維基百科上做技術嘗試,畢竟這樣風險太大(一方面網站瀏覽量很大,一方面資料庫也很龐大)。如果您需要中文維基百科上的條目在自己架設的網站做驗證,可以,這裏提供中文維基百科的XML資料表(雖然非常大,上GB,別被壓縮過的大小騙了),可以架設在測試網站上做驗證。--笨笨的小B | 20巷 12:13 2007年2月10日 (UTC)
至於書寫轉換表的部份,您大可以在您的User頁面下做個子頁面(像User:笨笨的小B/Current new),然後在這個頁面告訴大家有這個東西。因為在MediaWiki名字空間上的項目可以影響系統介面,比較容易發生衝突的問題,因此不建議在MediaWiki名字空間書寫。--笨笨的小B | 20巷 12:15 2007年2月10日 (UTC)
同意以上諸位的說法。另外,全局轉換表不宜一下子全部拿掉,必須慢慢來。--Jnlin討論) 14:45 2007年2月9日 (UTC)
我不是很支持zh-tw改成zh-hant-tw,因為zh-(tw, cn, hk, sg)是RFC 1766規定的標準,參見W3C HTML 4.01規格書。另外找到了一個可供參考的連結,Wikipedia talk:繁簡處理/檔案6。--笨笨的小B | 20巷 11:57 2007年2月10日 (UTC)
其RFC 1766以及它的後繼者RFC 3066已經不再使用了。現在有關的RFC正式標準應為RFC 4646。--Shinjiman 03:21 2007年2月11日 (UTC)
看了RFC 4646,zh-(TW, CN, HK, SG)還是標準用法,字體tag是optional。字體tag的好處應該是容許zh-HANS-TW, zh-HANT-CN這類用法。其實也和之前討論的方向很像,也就是字體(書寫系統)與地區分開處理。或許漢語拼音也可以歸類於zh-LATN呢(漢語,使用拉丁字母)。--Fauzty 12:52 2007年2月17日 (UTC)
(與主題討論無關)若用那種標示,漢語拼音應為zh-LATN-CN,另有zh-LATN-TW通用拼音(雖然台北市是用漢語...)--蒼空 翔 有事點我 21:59 2007年2月25日 (UTC)

好像有一段時間沒討論了?!

[編輯]

請問上述的討論是否已有定案?是否有結論?Stewart~惡龍 11:48 2007年3月7日 (UTC)

不是大家都在忙,就是像我一樣沒話可插...惡龍來插個話,我給你一條大魚XD...--陋室(亭中茶話) 11:51 2007年3月7日 (UTC)
我看了一下發現應該是取得共識了,但是似乎對於具體該怎麼着手去做似乎還沒有人去做,我們是不是要成立一個簡繁地區改革小組,並有維基社區授權他去處理這個事情呢?要不然由於設計的人和事務太多,可能實行起來有很大阻力.--Ksyrie 12:03 2007年3月7日 (UTC)
贊成你的意見,維基人是自願的,這樣繁複的工作要一二個人去完成不合情理,而且在改革的過程中可能有新的想法或問題產生,有討論的必要,確實需要成立小組。由於我現實工作繁忙,加上對這些技術不太了解,不會參加這小組。--真實事求是() 11:17 2007年3月8日 (UTC)
對於這種的改動是要修改MediaWiki軟件本身的,此外,要作修改前,必須先要收集好要作轉換的詞彙。然後才能執行。基於這種的修改是與管理員權限是無關的,故此有管理員權限的用戶亦都無能為力。這需要一些懂修改php的人士幫忙,以解決這種的問題。這問題不只是維基百科本身的問題,是所有使用MediaWiki軟件的網站都有這個問題,所以這次的修改亦需要小心地去進行。--Shinjiman 12:21 2007年3月7日 (UTC)
不知道有沒有行政員帶頭,不然是沒人能動程序的...另外我的兩個問題有沒有解...--蒼空 翔 有事點我 15:30 2007年3月7日 (UTC)
由懂得處理這些事,以及有興趣的維基人推動此事,不一定非行政員不可,不要忘記主導維基是大家的共識,行政員管理員只是義工而已。我提議由Ksyrie和Shinjiman推動成立小組吧,Shinjiman研究這事很久了。--真實事求是() 11:17 2007年3月8日 (UTC)
不過,要有行政員才能完成修改吧...--蒼空 翔 有事點我 15:32 2007年3月8日 (UTC)
不是要行政員呀,真正需要的是懂php的人士,以及能夠在MediaWiki SVN有寫入權限的『遞交者』。--Shinjiman 16:48 2007年3月8日 (UTC)
整理我的問題:1是能否取消語詞轉換,但保留單字轉換;2是能否將一個詞語指定語系,讓系統不會亂翻--蒼空 翔 有事點我 15:33 2007年3月7日 (UTC)

剛才發現一個問題,在廣東話裏「架次」可以作車輛的量詞,但在台灣只用於航空器...--蒼空 翔 有事點我 19:49 2007年3月7日 (UTC)

已經有粵語維基,廣東話的用詞不適合在這裏用。--真實事求是() 11:17 2007年3月8日 (UTC)
啟德隧道有看到此一用法--蒼空 翔 有事點我 15:32 2007年3月8日 (UTC)
對於這種的做法,應該無需要在預設轉換表中轉換。--Shinjiman 16:48 2007年3月8日 (UTC)

其實大家已經取得共識,問題在技術方面而已,似乎TTTT在研究中,請問進展如何?--真實事求是() 11:17 2007年3月8日 (UTC)

我只會寫basic程式,不會寫php,不過可能可以提供一點小意見--蒼空 翔 有事點我 15:32 2007年3月8日 (UTC)

嗯,最大的困難我想一定是技術方面。我對MediaWiki這麼大型的程式,可能需要幾個月的時間全職研究才能搞懂,而很不好意思的是,我沒有那麼多空閒時間。所以希望有志願者能幫忙研究修改程式。--Jnlin討論) 08:08 2007年3月16日 (UTC)

忽然發現,在各個section的標題作詞語轉換時,自動產生的目錄卻不會跟着改變,這點也可能需要修正。--Jnlin討論) 08:27 2007年3月16日 (UTC)

問題多,技術複雜,一、兩個人弄不來,Ksyrie成立小組的提議非常適宜。由部分人開始推動吧,我提議先設小組專門頁面,任何人有興趣都可以加入小組,提供意見或分擔大家的工作,更重要的是必須有懂行的人來「領導」大家,否則還要花時間去學習熟悉各方方面面,也會走很多冤枉路,Shinjiman研究簡繁的事情很久了,是很好的人選,不知有興趣否?--真實事求是() 15:30 2007年3月16日 (UTC)

Names.php更新

[編輯]

現在顯示語言標籤的名稱已經更新了(rev:21200, rev:21201),zh-cn會將會由【中文(簡體)】改成【中文(中國)】,現時顯示成〖中文(中國大陸)〗;zh-hk會將會由【中文(繁體)】改成【中文(香港)】,現時顯示成〖中文(香港)〗;zh-sg會將會由【中文(簡體)】改成【中文(新加坡)】,現時顯示成〖中文(新加坡)〗;zh-tw會將會由【中文(繁體)】改成【中文(台灣)】,現時顯示成〖中文(臺灣)〗。此外,zh-hans以及zh-hant亦將會增加,zh-hans會顯示成〖中文(簡體)〗,zh-hant會顯示成〖中文(繁體)〗;這對將會做的中文用字轉換系統的重組有所幫助。--Shinjiman 15:41 2007年4月12日 (UTC)

為什麼「【中文(簡體)】改成【中文(中國)】」?這和目前的「大陸,香港,台灣。。。」矛盾。—Isnow 18:27 2007年4月12日 (UTC)
zh-cn ← Chinese (China)、zh-Hans ← Chinese (Simplified),將兩者區分出來,避免混淆;而這裏的改動並不是更改頁頂的標籤,而是更改在跨語言連結、以及在參數設置中的顯示名稱。請參閱RFC 4646所引用的IANA language subtag registry。--Shinjiman 18:46 2007年4月12日 (UTC)
  • IANA language subtag registry中提到的「zh-Hans-CN」為「PRC Mainland Chinese in simplified script」對應的也是「中國大陸」
  • 為避免分歧,需要「頁頂的標籤」,「跨語言連結」、「參數設置中的顯示名稱」都使用「中國大陸」(或簡稱「大陸」)而不是「中國」
Isnow 20:58 2007年4月12日 (UTC)
那使用【中文(中國大陸)】可以嗎?--Shinjiman 21:28 2007年4月12日 (UTC)
已經重開Bugzilla:8599,並已經在rev:21205修正了。--Shinjiman 21:43 2007年4月12日 (UTC)
謝謝!—Isnow 22:26 2007年4月12日 (UTC)

繁簡字詞跟地區用詞即將正式分拆

[編輯]

很久都沒有討論過這個問題了,我已經在rev:28045中正式修改了源碼,讓繁簡字詞跟地區用詞正式分拆。到更新後的MediaWiki:Conversiontable/zh-hant以及MediaWiki:Conversiontable/zh-hans都會正式成為MW轉換系統的正式一部份。而無需要以現時在zh-hk/zh-tw中包含着zh-hant轉換表來處理這個問題。同時在語體中文系維基網站會由5種字體變換增加到7種,所增加的是『簡體(zh-hans)』跟『繁體(zh-hant)』。到更新後,需要在MediaWiki:Monobook.js中修改相應的項目。

在更新源碼的同時,有關的轉換字詞可能會出現轉換問題,到時請在此匯報一下,再查看有什麼的解決方法。

到現時為止的『中文(澳門)/zh-mo』以及『中文(馬來西亞)/zh-my』會否增加到MW的轉換系統中,歡迎大家繼續討論這個問題。 --Shinjiman 2007年12月2日 (日) 09:32 (UTC)[回覆]

終於有進展了,辛苦了。—Fauzty 2007年12月3日 (一) 07:33 (UTC)[回覆]

太好了,終於有簡繁公版了,辛苦了。現在簡繁系統已很混亂,似乎不適合再增加地區用詞分頁,應先解決現有問題。另外,建議建立專頁,介紹簡繁系統的各種技術,以免再度失傳,相信這是一個龐大,耗時費日的工程,或可以成立小組的方式進行。

現在這系統,能夠容納多個地區用詞頁面而不混亂嗎?--真實事求是() 2007年12月3日 (一) 14:00 (UTC)[回覆]

以前的轉換方法是這樣的:
變化 轉換字詞組
zh (無變換中文) -
zh-CN (中國大陸) CN
zh-HK (香港) TW + HK
zh-SG (新加坡) CN + SG
zh-TW (台灣) TW
現在的轉換方法基本上是這樣的:
變化 轉換字詞組
zh (無變換中文) -
zh-Hans (簡體) Hans
zh-Hant (繁體) Hant
zh-CN (中國大陸) Hans + CN
zh-HK (香港) Hant + HK
zh-SG (新加坡) Hans + SG
zh-TW (台灣) Hant + TW

這樣的更改可以先將繁簡/地區用字分拆清楚,避免了香港轉換表使用台灣轉換表的問題(很多的台港字詞有歧義);跟新加坡轉換表使用中國大陸轉換表的問題(很多的中新字詞有歧義)。--Shinjiman 2007年12月3日 (一) 14:28 (UTC)[回覆]

閣下所指的是頁頂標籤?因為這設定是應用於全網的,如果可以的話,那就需要在信息檔中再修改一下。--Shinjiman 2007年12月4日 (二) 23:38 (UTC)[回覆]
己經啪上到rev:28174了。 --Shinjiman 2007年12月5日 (三) 02:45 (UTC)[回覆]

這次的分拆尚無法達成像zh-Hans-TW, zh-Hant-CN之類的功能,可惜了點。雖然目前的分拆已經滿足社群大部分的需要,像這種特殊的需求大概不多,但是有此種功能的話,對於想學習繁體/簡體字的朋友們是很好的。—Fauzty (留言) 2007年12月5日 (三) 14:11 (UTC)[回覆]

雖然這樣作可以再細分一些,但如果要這樣分,那變換就需要十多種了。如果不保留原先的zh-CN/zh-TW/zh-HK/zh-SG等變換,那跟以前的用法就不能相容了。--Shinjiman 2007年12月5日 (三) 14:25 (UTC)[回覆]
zh-CN/zh-TW/zh-HK/zh-SG還是有保留的必要性。我這個意見,只是未來如果要擴充功能時可以參考看看。—Fauzty (留言) 2007年12月5日 (三) 14:47 (UTC)[回覆]