php检测中文编码,php识别中文

PHP:判断字符串编码是GB2312还是UTF

当应用程序访问数据时,在入口和出口处都会有字符集编码的转换。对于中文数据,数据库字符编码的设置应当保证数据的完整性。

在php中可以通过iconv函数将将字符串转为utf8编码,其语法是“iconv(要转化的格式,‘转化后的格式’,‘转化的数据’);”。

PHP不支持多字节编码,所有字符都被认为是单字节。也就是说“中”字在GBK编码中是两个字节,PHP就把它当作2个字符来处理;在UTF-8中是三个字节,就当作3个字符来处理。

enStr = ‘Hello,China!’;echo strlen($enStr); // 输出:12 而中文则不然,做中文网站一般会选择两种编码:gbk/gb2312或是utf-8。utf-8能兼容更多的字符,所以受到很多站长的喜爱。

中文不一定是gb2312也可能是utf8或者其他编码。\\r\\n如果要判断字符串的编码类型目前而言并没有很好的办法,有一个chardet 的包可以用来判断字符串编码你可以找找。

未经允许不得转载:便宜VPS网 » php检测中文编码,php识别中文