用户讨论:FRDian/Wordcount.js
外观
Unicode Non-BMP 判别
[编辑]@FRDian: 由于 JavaScript UTF-16 强当 UCS-2 的缺陷,一些字例如“𨋢”(U+282E2)会显示成 2CJK(Surrogate Pair 两半), 4 bytes(UTF-8 报告倒是对了)。--Arthur2e5 更改·工具 2016年5月7日 (六) 21:39 (UTC)
- 呃,那我再@Liangent:一下吧。--Altoria2e5 更改·工具 2016年5月10日 (二) 11:41 (UTC)
- 我把小工具的版本改成了[1]提供的regex,看起来举例的文字没有问题了。这个衍生版本我就不管了。Liangent(留言) 2016年5月10日 (二) 21:55 (UTC)
- @Arthur200000:完成。#ForeverLove — 凡人丶 你一定要好好的 中文字数统计工具 2016年5月11日 (三) 02:49 (UTC)
- @FRDian: 似乎 char count text.length 这边还是需要类似地修一下。
text.replace(/[\uD800-\uDBFF][\uDC00-\uDFFF]/g, '_').length
就行。--Altoria2e5 更改·工具 2016年5月11日 (三) 04:44 (UTC) - @Liangent:慢着,现在这几个版本我开始搞不清了……什么时候谁写个帮助页吧(汗)--Altoria2e5 更改·工具 2016年5月11日 (三) 04:52 (UTC) 啊看到MediaWiki_talk:Gadget-Wordcount.js了。
- @Arthur200000:,我...没太明白...#ForeverLove — 凡人丶 你一定要好好的 中文字数统计工具 2016年5月11日 (三) 14:31 (UTC)
- @FRDian: 似乎 char count text.length 这边还是需要类似地修一下。