检验中文的正则表达式

Preface

最近在表单中文检验的时候, 碰到了一个问题,比较诡异。用户名中带有字,检查不是中文。做下记录。


最初正则是这样写的:

1
/^([\\u4E00-\\u9FA5]|·)*$/

但是某个用户名字中带有字, 被认为不是中文。

使用以下的正则即可:

1
/^([\\u4e00-\\u9fa5\\u4dae\\uE863]|·)*$/

\u4dae\uE863 分别匹配的是 䶮; 因为后面的两个字会因为有些编码器的版本问题而无法匹配到.


参考链接

匹配全部中文的正则表达式

关注我的微信公众号[李一二],即时看更多的文章