사전플러스 정규화

한자는 js 정규식과 일치하며, 일반적으로 사용되는 정규식은 [\u4e00-\u9fa5] 이지만 이 범위는 완전하지 않습니다. 예:/[\ u4e00-\ u9fa5]/. 테스트 ("?") )//시험 옆? 을 눌러 false 를 반환합니다.

유니코드 버전 인코딩에 따르면 한자를 정확하게 판단하려면 다음이 포함되어야 합니다.

범위 의미

2e80-2fcjk 근근 보충 2F00-2FDF 강희 사전 근근

3000-303f 한중일 기호 및 문장 부호 3 1C0-3 1EF CJK 획

3200-32FF 폐쇄 한중일 문자는 3300-33ff 한중일 월과 호환됩니다.

3400-4DBF CJK 통합 표의기호 확장 A 4DC0-4DFF 는 64 점괘기호를 거치기 쉽다

4e 00-9bf CJK 통합 상형 문자 F900-FAFF CJK 호환 상형 문자

FE30-FE4F CJK 호환 형식 FF00-FFEF 전각 ASCII, 전각 구두점

따라서 한자와 일치하는 올바른 정규 표현식은 다음과 같습니다.

Var rcjk =/[\ u2e80-\ u2eff \ u2f00-\ u2fdf \ u3000-\ u303f \ u31c0-- U4dbf \ u4dc0-\ u4dff \ u4e00-\ u9bf \ uf900-\ ufaff \ ufe30-\ u