Personal Wiki‎ > ‎Web Log‎ > ‎

编码问题在继续研究

posted Jul 30, 2009, 12:47 AM by Iridium Cao   [ updated Oct 7, 2009, 12:08 PM ]
对字符串的编码, 已经写了一个有问题的小程序:
http://code.google.com/p/cyiridiumsitewikineed/source/browse/trunk/charcode/org/iridium/charcode/util/CharParser.java

这个问题, 逐渐明晰了写, 研究整理还在继续. 下面需要知道的就是:

1. 汉字编码的具体规则: GB2312, GBK, Unicode(UTF-n), BIG5 等.
2. BOM的定义和使用.

在知晓以上两个问题后, 如何识别文本文件的编码就比较容易了.
Comments