用戶討論:FRDian/Wordcount.js
外觀
Unicode Non-BMP 判別
[編輯]@FRDian: 由於 JavaScript UTF-16 強當 UCS-2 的缺陷,一些字例如「𨋢」(U+282E2)會顯示成 2CJK(Surrogate Pair 兩半), 4 bytes(UTF-8 報告倒是對了)。--Arthur2e5 更改·工具 2016年5月7日 (六) 21:39 (UTC)
- 呃,那我再@Liangent:一下吧。--Altoria2e5 更改·工具 2016年5月10日 (二) 11:41 (UTC)
- 我把小工具的版本改成了[1]提供的regex,看起來舉例的文字沒有問題了。這個衍生版本我就不管了。Liangent(留言) 2016年5月10日 (二) 21:55 (UTC)
- @Arthur200000:完成。#ForeverLove — 凡人丶 你一定要好好的 中文字數統計工具 2016年5月11日 (三) 02:49 (UTC)
- @FRDian: 似乎 char count text.length 這邊還是需要類似地修一下。
text.replace(/[\uD800-\uDBFF][\uDC00-\uDFFF]/g, '_').length
就行。--Altoria2e5 更改·工具 2016年5月11日 (三) 04:44 (UTC) - @Liangent:慢着,現在這幾個版本我開始搞不清了……什麼時候誰寫個幫助頁吧(汗)--Altoria2e5 更改·工具 2016年5月11日 (三) 04:52 (UTC) 啊看到MediaWiki_talk:Gadget-Wordcount.js了。
- @Arthur200000:,我...沒太明白...#ForeverLove — 凡人丶 你一定要好好的 中文字數統計工具 2016年5月11日 (三) 14:31 (UTC)
- @FRDian: 似乎 char count text.length 這邊還是需要類似地修一下。