保存文本文件的时候,可以选择的编码有ANSI、Unicode、Unicode big endian、UTF-8四种。
不同的编码,保存在文件中的0、1代码是不同的,我们新建一文本文件,输入“A程B序C”,分别以上面四种编码形式保存为4个文件ANSI.txt、Unicode.txt、Ubig.txt和UTF8.txt,并使用cmd中的debug程序查看文件内容如下:
1、ANSI.txt
2、Unicode.txt
3、Ubig.txt
4、UTF8.txt
我们发现,“A程B序C”保存在文件中的0、1代码分别为:
41 B3 CC 42 D0 F2 43
FF FE 41 00 0B 7A 42 00 8F 5E 43 00
“FF FE”文件编码标识
FE FF 00 41 7A 0B 00 42 5E 8F 00 43
“FE FF”文件编码标识
EF BB BF 41 E7 A8 8B 42 E5 BA 8F 43
“EF BB BF”文件编码标识
一、ANSI编码:
ANSI是默认的编码方式。对于英文字符是ASCII编码,对于简体中文字符是GB2312编码(只针对Windows简体中文版,如果是繁体中文版会采用Big5码)。
二、Uincode编码:
Unicode编码指的是UCS-2编码方式,即直接用两个字节存入字符的Unicode码。这个选项用的little endian格式。
三、Unicode big endian编码:
“endian”一词来源于英国作家斯威夫特的《格列佛游记》。在该书中,小人国里爆发了内战,战争起因是人们争论,吃鸡蛋时究竟是从大头(Big-Endian)敲开还是从小头(Little-Endian)敲开。为了这件事情,前后爆发了六次战争,一个皇帝送了命,另一个皇帝丢了王位。
因此,第一个字节在前,就是”大头方式“(Big endian),第二个字节在前就是”小头方式“(Little
endian)。小人国为水煮蛋该从大的一端(Big-End)剥开还是小的一端(Little-End)剥开而争论,争论的双方分别被称为Big-endians和Little-endians。
对比Unicode编码,可发现,Unicode big endian编码只是字符的两个字节的存放顺序不同而已。
四、UFT-8编码:
UTF-8是UNICODE的一种变长字符编码又称万国码,由Ken
Thompson于1992年创建。现在已经标准化为RFC 3629。UTF-8用1到6个字节编码UNICODE字符。用在网页上可以同一页面显示中文简体繁体及其它语言(如日文,韩文)。
【结束语】
这几种编码当然都有它的编码规则,不过,对于我们使用者来说,只需要知道不同的编码,保存在文件中的0、1代码是不同的,使用不同的编码规则浏览文件,很显然会出现乱码。
这就需要我们在编写文件的时候,养成一个良好的习惯,特别声明一下我们使用的编码,例如,在网页文件中使用META内容元素声明我们的编码:
<metahttp-equiv="Content-Type"content="text/html;charset=utf-8"/>
参考网址:
http://baike.baidu.com/view/40801.htm
http://baike.baidu.com/view/1485693.htm
http://baike.baidu.com/view/742823.htm
http://blog.sina.com.cn/s/blog_6d71f75301016xm0.html
分享到:
相关推荐
php 字符编码转换类,支持ANSI、Unicode、Unicode big endian、UTF-8、UTF-8+Bom 互相转换。
(包括ANSI、UNICODE、UNICODE big endian、UTF-8)格式的文本文件 */ //核心算法:CStdioFileEx继承自CStdioFile, 覆盖CStdioFile的 BOOL ReadString(CString& rString)方法, // 根据不同文件编码特征,寻找文件...
文本字符串编码在 Text、ANSI、Unicode、Unicode Big Endian、UTF-8、 UTF-7 之间的互相转换,转换结果使用十六进制表示。
ANSI --> Unicode ANSI --> Unicode big endian...UTF-8 --> Unicode big endian ansi转别的,不检验BOM,一律作为ansi编码进行转换 unicode转别的,首先检验BOM,不合格不转换 utf8转别的,首先检验BOM,不合格不转换
VC ANSI环境下按行读取ANSI、UNICODE 、UNICODE big endian、UTF-8四种文本文件.docx
读取ANSI 明码文件 读取Unicode 明码文件 读取Unicode big endian 明码文件 读取UTF-8 明码文件 读取UTF8 Bom 明码文件 读取UTF16-LE 明码文件 读取UTF16-BE 明码文件 到多字节字符串 扩展类CFilePlainCode
Txt文件编码批量转换器用于批量转换txt文本文档的编码格式。通常,我们电脑里的txt文件都是ASNI编码,当放到手机或MP3里时,打开看到的往往...目前,它支持ASNI、UTF-8、Unicode和Unicode big endian等编码的相互转换。
文本文件编码转换:ANSI、Unicode、UTF-8三种存储编码相互转换。 Unicode作为源文件同时支持Big endian,作为目标文件不支持Big endian。 UTF-8不支持无BOM的文件。 希望能对新手有帮助,也大家多提宝贵意见。
批量转换txt的编码。 支持ANSI Unicode Unicode big endian UTF-8 免费
文本字符串编码在 Text、ANSI、Unicode、Unicode Big Endian、UTF-8、 UTF-7 之间的互相转换,转换结果使用十六进制表示。 ******* STR ***************** * 运行环境 * 本软件在 Windows 98、Windows 2000...
十六进制表示文本字符串编码之间转换结果。文本字符串编码在 Text、ANSI、Unicode、Unicode Big Endian、UTF-8、UTF-7 之间的互相转换,转换结果使用十六进制表示
不仅包括各种纯文本文件、源程序文件、网页文件、rtf文件,而且包括多种office文件、数据库文件和可执行文件,还包括各种ANSI、UNICODE、UNICODE BIG ENDIAN、UTF-8格式文件。对各种文件格式自动识别。支
文本字符串编码在Text、ANSI、Unicode、Unicode Big Endian、UTF-8、 UTF-7 之间的互相转换,转换结果使用十六进制表示
目前最好用的编码查询工具,可以在 Text、ANSI、Unicode、Unicode Big Endian、UTF-8、 UTF-7 之间的互相转换,转换结果使用十六进制表示。 输入汉字可查询相应的十六进制码 输入十六进制码也可以反查汉字
ANSI转 UTF8 ANSI转 Unicode 文本替换 替换规则 old=new (用txt维护替换规则,一行维护一个记录) 打包 fr2x-fr3converter.zip 工具,转换*.frf 到 *.fr3 适合delphi程序 ansi版升级到 unicode版 特点:批量检索工程...
LoveString是一款方便实用的16进制转字符串工具。 该软件可以让字符串编码在Text、ANSI、Unicode、 Unicode Big Endian、UTF-8等之间转换,转换后将以十六进制显示出来。
2013年新年过后,作者重写了 VCF Encoding 的源代码,使其全面支持 VCard 2.1、3.0 标准,解决了 Unicode、UTF-8、UTF-7、ANSI、Big-endian Unicode 编码问题,支持对嵌入图片和声音资源的解析,支持对 VCF 名片的...
将一个目录的所有指定后缀的文本文件批量转换到指定目录下。 支持ANSI(含GBK,GB2312,ASCII),Unicode,Unicode big endian,UTF-8编码互转,自动判断源文本文件的编码方式。