千家信息网

php怎么截取utf8或gbk编码的中英文字符串

发表于:2024-09-23 作者:千家信息网编辑
千家信息网最后更新 2024年09月23日,这篇文章主要介绍"php怎么截取utf8或gbk编码的中英文字符串",在日常操作中,相信很多人在php怎么截取utf8或gbk编码的中英文字符串问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作
千家信息网最后更新 2024年09月23日php怎么截取utf8或gbk编码的中英文字符串

这篇文章主要介绍"php怎么截取utf8或gbk编码的中英文字符串",在日常操作中,相信很多人在php怎么截取utf8或gbk编码的中英文字符串问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答"php怎么截取utf8或gbk编码的中英文字符串"的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

微博的发言有字数限制,其计数方式是,中文算2个,英文算1个,全角字符算2个,半角字符算1个。
php中自带strlen是返回的字节数,对于utf8编码的中文返回时3个,不满足需求。
mb_strlen 可以根据字符集计算长度,比如utf8的中文计数为1,但这不符合微博字数限制需求,中文必须计算为2才可以。
google了下,找到一个discuz中截取各种编码字符的类,改造了下,已经测试通过.其中参数$charset 只支持gbk与utf-8。

复制代码 代码如下:

$a = "s@@你好";var_dump(strlen_weibo($a,'utf-8'));

结果输出为8,其中字母s计数为1,全角@计数为2,半角@计数为1,两个中文计数为4。源码如下:

复制代码 代码如下:

function strlen_weibo($string, $charset='utf-8'){    $n = $count = 0;    $length = strlen($string);    if (strtolower($charset) == 'utf-8')    {        while ($n < $length)        {            $currentByte = ord($string[$n]);            if ($currentByte == 9 ||                $currentByte == 10 ||                (32 <= $currentByte && $currentByte <= 126))            {                $n++;                $count++;            } elseif (194 <= $currentByte && $currentByte <= 223)            {                $n += 2;                $count += 2;            } elseif (224 <= $currentByte && $currentByte <= 239)            {                $n += 3;                $count += 2;            } elseif (240 <= $currentByte && $currentByte <= 247)            {                $n += 4;                $count += 2;            } elseif (248 <= $currentByte && $currentByte <= 251)            {                $n += 5;                $count += 2;            } elseif ($currentByte == 252 || $currentByte == 253)            {                $n += 6;                $count += 2;            } else            {                $n++;                $count++;            }            if ($count >= $length)            {                break;            }        }        return $count;    } else    {        for ($i = 0; $i < $length; $i++)        {            if (ord($string[$i]) > 127)            {                $i++;                $count++;            }            $count++;        }        return $count;    }}

到此,关于"php怎么截取utf8或gbk编码的中英文字符串"的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注网站,小编会继续努力为大家带来更多实用的文章!

0