php语言 百分网手机站

PHP如何获取中文字符串长度

时间:2020-09-23 13:58:13 php语言 我要投稿

PHP如何获取中文字符串长度

  PHP对中文字符串的处理一直困扰于刚刚接触php开发的新手程序员。下面就有小编分享PHP如何获取中文字符串长度的方式,欢迎大家学习!

  PHP自带的函数如strlen()、mb_strlen()都是通过计算字符串所占字节数来统计字符串长度的,一个英文字符占1字节。例:

  $enStr = ‘Hello,China!’;

  echo strlen($enStr); // 输出:12

  而中文则不然,做中文网站一般会选择两种编码:gbk/gb2312或是utf-8。utf-8能兼容更多的字符,所以受到很多站长的喜爱。gbk与utf-8对中文的编码不同,导致中文在gbk与utf-8编码下所占字节也有差异。

  gbk编码下每个中文字符所占字节为2,例:

  $zhStr = ‘您好,中国!’;

  echo strlen($zhStr); // 输出:12

  utf-8编码下每个中文字符所占字节为3,例:

  $zhStr = ‘您好,中国!’;

  echo strlen($zhStr); // 输出:18

  那么如何计算这组中文字符串的`长度呢?有人可能会说gbk下获取中文字符串长度除以2,utf-8编码下除以3不就行了吗?但是您要考虑字符串并不老实,99%的情况会以中英混合的情况出现。

  这是WordPress中的一段代码,主要思想就是先用正则将字符串分解为个体单元,然后再计算单元的个数即字符串的长度,代码如下(只能处理utf-8编码下的字符串):

  $zhStr = ‘您好,中国!’;

  $str = ‘Hello,中国!’;

  // 计算中文字符串长度

  function utf8_strlen($string = null) {

  // 将字符串分解为单元

  preg_match_all(“/./us”, $string, $match);

  // 返回单元个数

  return count($match[0]);

  }

  echo utf8_strlen($zhStr); // 输出:6

  echo utf8_strlen($str); // 输出:9

  mb_strlen()方法有同样的效果


【PHP如何获取中文字符串长度】相关文章:

获取php数组长度函数的方法08-17

PHP如何获取系统信息08-30

如何利用PHP语言获取连接信息10-18

php截取指定长度中文字符的技巧11-02

php如何解决中文乱码问题08-26

PHP的字符串函数08-25

PHP获取星期的方法08-16

php的字符串常用函数09-21

php字符串分割的详解06-08