JAVA中判断char是否是中文的几种方法

标签: java char 中文 | 发表时间:2012-06-19 17:13 | 作者:
出处:http://www.iteye.com

1、方法一

 

char c = 'a';
if((c >= 0x4e00)&&(c <= 0x9fbb)) {
	System.out.println("是中文");
}

上面的方法很简单,但只能判断是否是中文,但不能判断是否是中文标点。

下面的方法很全面,中文字符标点都可以判断

  2、方法二

private static final boolean isChinese(char c) { 
	Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
	if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS
		    || ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS
		    || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A
		    || ub == Character.UnicodeBlock.GENERAL_PUNCTUATION
		    || ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION
		    || ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS) {
		return true;
	}
	return false;
}
 

 



已有 0 人发表留言,猛击->> 这里<<-参与讨论


ITeye推荐



相关 [java char 中文] 推荐:

JAVA中判断char是否是中文的几种方法

- - ITeye博客
System.out.println("是中文"); }. 上面的方法很简单,但只能判断是否是中文,但不能判断是否是中文标点. 下面的方法很全面,中文字符标点都可以判断. 已有 0 人发表留言,猛击->> 这里<<-参与讨论. —软件人才免语言低担保 赴美带薪读研.

MySQL数据库中char与varchar性能分析

- - 数据库 - ITeye博客
在数据库中,字符型的数据是最多的,可以占到整个数据库的80%以上. 为此正确处理字符型的数据,对于提高数据库的性能有很大的作用. 在字符型数据中,用的最多的就是Char与Varchar两种类型. 前面的是固定长度,而后面的是可变长度. 现在我们需要考虑的是,在什么情况下使用Char字符型数据,什么情况下采用Varchar字符型数据.

Jcseg java中文分词器

- - 企业架构 - ITeye博客
Jcseg[dʒɛ'​ke'sɛ]完整版本(源码, 词库, 帮助文档, 词库管理工具, jar文件)下载:  http://sourceforge.net/projects/jcseg . jcseg是使用Java开发的一个开源中文分词器,使用流行的mmseg算法实现,并且提供了最高版本的lucene, solr, elasticsearch(New)的分词接口..

java中文分词组件-word分词

- - 研发管理 - ITeye博客
关键字:java中文分词组件-word分词. word分词器主页 :https://github.com/ysc/word. word分词是一个Java实现的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义. 能准确识别英文、数字,以及日期、时间等数量词,能识别人名、地名、组织机构名等未登录词.

Java 6 JVM参数选项大全(中文版)

- LightingMan - 淘宝JAVA中间件团队博客
本文是基于最新的SUN官方文档Java SE 6 Hotspot VM Options 编写的译文. 主要介绍JVM中的非稳态选项及其使用说明. 为了让读者明白每个选项的含义,作者在原文基础上补充了大量的资料. 希望这份文档,对正在研究JVM参数的朋友有帮助. 另外,考虑到本文档是初稿,如有描述错误,敬请指正.

深入分析 Java 中的中文编码问题

- Alex - IBM developerWorks 中国 : 文档库
编码问题一直困扰着开发人员,尤其在 Java 中更加明显,因为 Java 是跨平台语言,不同平台之间编码之间的切换较多. 本文将向你详细介绍 Java 中编码问题出现的根本原因,你将了解到:Java 中经常遇到的几种编码格式的区别;Java 中经常需要编码的场景;出现中文问题的原因分析;在开发 Java web 程序时可能会存在编码的几个地方,一个 HTTP 请求怎么控制编码格式.

Java进程在Unix平台上中文乱码问题

- - BlogJava_首页
用Log4j记录的日志中,中文也是. ,这个问题很让人心烦,当然以我的运气,这种问题是一定会遇到的,现在记录一下解决方法.     因为每一个应用都会启动一个Java进程,启动方法就是 java $OPTS com.xxx.xxx.xxx.     其中变量$OPTS就是我们要设置的JVM的启动参数.

locale错误导致Java中文乱码错误的总结

- - Java - 编程语言 - ITeye博客
线上执行MapReduce任务计算时,经过排查发现了某些服务器计算的数据出现中文乱码问题,但是服务器的配置是完全一致的. 由于我们使用的key可能包含中文,中文乱码问题体现在每次合并map记录的时候计算数据的随机性,每次执行的结果都不一样(由于Map任务执分配的随机性). (注:此文章大部分都参考了同事查找到的问题解决方法.

jcseg-1.9.2 发布 - Java开源轻量级中文分词器+里程碑版本

- - 开源中国社区最新新闻
jcseg是使用java开发的一款轻量级的开源中文分词器, 并且提供了最新版本的lucene和solr分词接口.. jcseg-1.9.2更新内容:. 配置文件中词库多目录加载, 多个目录使用';'隔开..     例如:在jcseg.properties中设置lexicon.path=/java/jcseg/lex1;/java/jcseg/lex2.

浅谈中文文本自动纠错在影视剧搜索中应用与Java实现

- - 博客园_首页
  这周由于项目需要对搜索框中输入的错误影片名进行校正处理,以提升搜索命中率和用户体验,研究了一下中文文本自动纠错(专业点讲是校对,proofread),并初步实现了该功能,特此记录.   中文输入错误的校对与更正是指在输入不常见或者错误文字时系统提示文字有误,最简单的例子就是在word里打字时会有红色下划线提示.