本文轉(zhuǎn)載自M先生《EXCEL2003、2007、2010打開CSV文件出現(xiàn)亂碼的解決方法》
EXCEL打開CSV文件出現(xiàn)亂碼的解決方法:有時(shí)候當(dāng)你用辦公軟件EXCEL打開CSV文件會(huì)出現(xiàn)以下的情況,歸根結(jié)底呢就是編碼的問題。
【故障現(xiàn)象描述】從網(wǎng)頁上導(dǎo)出數(shù)據(jù)文件存儲(chǔ)為CSV格式的文件,使用記事本打開文字顯示沒有問題,使用EXCEL打開出現(xiàn)亂碼的情況。
【故障原因分析】 此種情況一般是導(dǎo)出的文件編碼的問題。在簡(jiǎn)體中文環(huán)境下,EXCEL打開的CSV文件默認(rèn)是ANSI編碼,如果CSV文件的編碼方式為utf-8、Unicode等編碼可能就會(huì)出現(xiàn)文件亂碼的情況。 【解決方法】
開始菜單-Microsoft office- Microsoft office工具- Microsoft office 2003語言設(shè)置,將Microsoft office應(yīng)用程序默認(rèn)方式的語言設(shè)為"中文(簡(jiǎn)體)",這也是office 2003的默認(rèn)設(shè)置。
【編碼方式講解】 (1)ANSI編碼 不同的國(guó)家和地區(qū)制定了不同的標(biāo)準(zhǔn),由此產(chǎn)生了 GB2312, BIG5, JIS 等各自的編碼標(biāo)準(zhǔn)。這些使用 2 個(gè)字節(jié)來代表一個(gè)字符的各種漢字延伸編碼方式,稱為 ANSI 編碼。在簡(jiǎn)體中文系統(tǒng)下,ANSI 編碼代表 GB2312 編碼,在日文操作系統(tǒng)下,ANSI 編碼代表 JIS 編碼。 不同 ANSI 編碼之間互不兼容,當(dāng)信息在國(guó)際間交流時(shí),無法將屬于兩種語言的文字,存儲(chǔ)在同一段 ANSI 編碼的文本中。 當(dāng)然對(duì)于ANSI編碼而言,0x00~0x7F之間的字符,依舊是1個(gè)字節(jié)代表1個(gè)字符。這一點(diǎn)是ASNI編碼與Unicode編碼之間最大也最明顯的區(qū)別。例如上面演示的文件中英文字母和數(shù)字并沒有出現(xiàn)亂碼的情況。 (2)Unicode編碼 Unicode(統(tǒng)一碼、萬國(guó)碼、單一碼)是一種在計(jì)算機(jī)上使用的字符編碼。它為每種語言中的每個(gè)字符設(shè)定了統(tǒng)一并且唯一的二進(jìn)制編碼,以滿足跨語言、跨平臺(tái)進(jìn)行文本轉(zhuǎn)換、處理的要求。1990年開始研發(fā),1994年正式公布。隨著計(jì)算機(jī)工作能力的增強(qiáng),Unicode也在面世以來的十多年里得到普及。 Unicode是國(guó)際組織制定的可以容納世界上所有文字和符號(hào)的字符編碼方案。Unicode用數(shù)字0-0x10FFFF來映射這些字符,最多可以容納1114112個(gè)字符,或者說有1114112個(gè)碼位。碼位就是可以分配給字符的數(shù)字。UTF-8、UTF-16、UTF-32都是將數(shù)字轉(zhuǎn)換到程序數(shù)據(jù)的編碼方案。 (3)UTF-8編碼 UTF-8是UNICODE的一種變長(zhǎng)字符編碼又稱萬國(guó)碼,由Ken Thompson于1992年創(chuàng)建?,F(xiàn)在已經(jīng)標(biāo)準(zhǔn)化為RFC 3629。UTF-8用1到6個(gè)字節(jié)編碼UNICODE字符。用在網(wǎng)頁上可以同一頁面顯示中文簡(jiǎn)體繁體及其它語言(如日文,韓文)。
前邊來自網(wǎng)絡(luò)上的,下邊才是最好的方法: Excel打開csv文件亂碼問題 有時(shí)從網(wǎng)上導(dǎo)出的CSV文件, 用Excel打開,中文會(huì)是亂碼。 CSV文件亂碼問題主要是文件編碼引起的。 所以要解決Excel打開亂碼的情況, 就要從改文件開始, 下面是解決方法:
另外在EXCEL2007和EXCEL2010中比較好用的方法 新建文檔(或者打開EXCEL)
數(shù)據(jù)-來自文本-選擇相應(yīng)的文檔,在"文本導(dǎo)入向?qū)?中"文件原始格式"里調(diào)節(jié)編碼。一般打開后它會(huì)自動(dòng)選擇編碼,不行你就自己在文件原始格式里面去選擇編碼。下一步自己調(diào)節(jié)就好了。
|
|