跳转到内容

英文维基 | 中文维基 | 日文维基 | 草榴社区

User talk:FRDian/Wordcount.js

页面内容不支持其他语言。
维基百科,自由的百科全书

Unicode Non-BMP 判别

[编辑]

@FRDian 由于 JavaScript UTF-16 强当 UCS-2 的缺陷,一些字例如“𨋢”(U+282E2)会显示成 2CJK(Surrogate Pair 两半), 4 bytes(UTF-8 报告倒是对了)。--Arthur2e5 更改·工具 2016年5月7日 (六) 21:39 (UTC)[回复]

呃,那我再@Liangent一下吧。--Altoria2e5 更改·工具 2016年5月10日 (二) 11:41 (UTC)[回复]
我把小工具的版本改成了[1]提供的regex,看起来举例的文字没有问题了。这个衍生版本我就不管了。Liangent留言 2016年5月10日 (二) 21:55 (UTC)[回复]
@Arthur200000完成。#ForeverLove凡人丶 你一定要好好的 中文字数统计工具 2016年5月11日 (三) 02:49 (UTC)[回复]
@FRDian 似乎 char count text.length 这边还是需要类似地修一下。text.replace(/[\uD800-\uDBFF][\uDC00-\uDFFF]/g, '_').length 就行。--Altoria2e5 更改·工具 2016年5月11日 (三) 04:44 (UTC)[回复]
@Liangent慢着,现在这几个版本我开始搞不清了……什么时候谁写个帮助页吧(汗)--Altoria2e5 更改·工具 2016年5月11日 (三) 04:52 (UTC) 啊看到MediaWiki_talk:Gadget-Wordcount.js了。[回复]
@Arthur200000,我...没太明白...#ForeverLove凡人丶 你一定要好好的 中文字数统计工具 2016年5月11日 (三) 14:31 (UTC)[回复]