php substr中文截取乱码解决办法

php中使用substr函数进行中文字符串截取时,有可能会产生乱码,因为中文的两种常用编码格式中:UTF-8编码,每个汉字占3字节,而GB2312编码中,每个汉字占2字节,英文占1字节,这就导致很多时候substr()硬生生地将一个中文字符“锯”成两半,造成断开的字符会把其后的..拉过来一起做一个字,所以出现了php substr中文乱码。

解决方法一:使用mb_substr函数。

mb_substr (PHP 4 >= 4.0.6, PHP 5, PHP 7) — 获取部分字符串

  string mb_substr ( string $str , int $start [, int $length = NULL [, string $encoding = mb_internal_encoding() ]] )

根据字符数执行一个多字节安全的 substr() 操作。 位置是从 str 的开始位置进行计数。 第一个字符的位置是 0。第二个字符的位置是 1,以此类推。

解决方法二:编写自定义函数。

  function sub_str($str, $length = , $append = true)  {    $str = trim($str);    $strlength = strlen($str);    if ($length == || $length >= $strlength)    {      return $str; //截取长度等于或大于等于本字符串的长度,返回字符串本身    }    elseif ($length < ) //如果截取长度为负数    {      $length = $strlength + $length;//那么截取长度就等于字符串长度减去截取长度      if ($length < )      {        $length = $strlength;//如果截取长度的绝对值大于字符串本身长度,则截取长度取字符串本身的长度      }    }    if (function_exists('mb_substr'))    {      $newstr = mb_substr($str, , $length, EC_CHARSET);    }    elseif (function_exists('iconv_substr'))    {      $newstr = iconv_substr($str, , $length, EC_CHARSET);    }    else    {      //$newstr = trim_right(substr($str, , $length));      $newstr = substr($str, , $length);    }    if ($append && $str != $newstr)    {      $newstr .= '...';    }    return $newstr;  }

未经允许不得转载:吾爱主机之家 » php substr中文截取乱码解决办法