在 PHP 中,處理多字節字符(如 UTF-8 編碼的字符)時,可以使用以下字符串函數:
mb_strlen
:此函數用于獲取字符串的長度,支持多字節字符。參數為字符串和編碼類型(默認為 “UTF-8”)。$str = "你好,世界!";
$length = mb_strlen($str, "UTF-8");
echo $length; // 輸出 6
mb_substr
:此函數用于截取字符串,支持多字節字符。參數為字符串、起始位置和截取長度,以及編碼類型(默認為 “UTF-8”)。$str = "你好,世界!";
$substring = mb_substr($str, 0, 3, "UTF-8");
echo $substring; // 輸出 你好
mb_strtolower
:此函數用于將字符串轉換為小寫,支持多字節字符。參數為字符串和編碼類型(默認為 “UTF-8”)。$str = "你好,世界!";
$lowercase = mb_strtolower($str, "UTF-8");
echo $lowercase; // 輸出 你好,世界!
mb_strtoupper
:此函數用于將字符串轉換為大寫,支持多字節字符。參數為字符串和編碼類型(默認為 “UTF-8”)。$str = "你好,世界!";
$uppercase = mb_strtoupper($str, "UTF-8");
echo $uppercase; // 輸出 你好,世界!
mb_split
:此函數用于根據指定的分隔符拆分字符串,支持多字節字符。參數為分隔符、字符串和編碼類型(默認為 “UTF-8”)。$str = "你好,世界!";
$parts = mb_split(",", $str, "UTF-8");
print_r($parts); // 輸出 Array ( [0] => 你好 [1] => 世界! )
在使用這些函數時,請確保 PHP 安裝包含了多字節字符串支持的擴展(mbstring
)。可以通過 php.ini
文件啟用或禁用該擴展。要啟用 mbstring
擴展,請取消以下行的注釋(或添加該行,如果不存在):
extension=mbstring