PHP生成UTF-8編碼的CSV文件用Excel打開(kāi)亂碼的解決辦法
原因:是由于輸出的CSV文件中沒(méi)有BOM。
什么是BOM?
在UCS 編碼中有一個(gè)叫做”ZERO WIDTH NO-BREAK SPACE”的字符,它的編碼是FEFF。而FFFE在UCS中是不存在的字符,所以不應(yīng)該出現(xiàn)在實(shí)際傳輸中。UCS規(guī)范建議我們?cè)趥鬏斪止?jié)流前,先傳輸字符”ZERO WIDTH NO-BREAK SPACE”。這樣如果接收者收到FEFF,就表明這個(gè)字節(jié)流是Big-Endian的;如果收到FFFE,就表明這個(gè)字節(jié)流是Little- Endian的。因此字符”ZERO WIDTH NO-BREAK SPACE”又被稱作BOM。
UTF-8不需要BOM來(lái)表明字節(jié)順序,但可以用BOM來(lái)表明編碼方式。字符”ZERO WIDTH NO-BREAK SPACE”的UTF-8編碼是EF BB BF。所以如果接收者收到以EF BB BF開(kāi)頭的字節(jié)流,就知道這是UTF-8編碼了。
Windows就是使用BOM來(lái)標(biāo)記文本文件的編碼方式的。
如何在PHP中輸出BOM?
在所有內(nèi)容輸出之前
print(chr(0xEF).chr(0xBB).chr(0xBF));
示例代碼:
<?php function writeCsvToFile($file,array $data){$fp = fopen($file, ’w’);//Windows下使用BOM來(lái)標(biāo)記文本文件的編碼方式fwrite($fp,chr(0xEF).chr(0xBB).chr(0xBF));foreach ($data as $line) { fputcsv($fp, $line);}fclose($fp); }
相關(guān)文章: