說說Python程序的執(zhí)行過程

無名小卒917 2014-09-15

展開全文

說說Python程序的執(zhí)行過程

1. Python是一門解釋型語言？

我初學(xué)Python時(shí)，聽到的關(guān)于Python的第一句話就是，Python是一門解釋性語言，我就這樣一直相信下去，直到發(fā)現(xiàn)了*.pyc文件的存在。如果是解釋型語言，那么生成的*.pyc文件是什么呢？c應(yīng)該是compiled的縮寫才對(duì)?。?/p>

為了防止其他學(xué)習(xí)Python的人也被這句話誤解，那么我們就在文中來澄清下這個(gè)問題，并且把一些基礎(chǔ)概念給理清。

2. 解釋型語言和編譯型語言

計(jì)算機(jī)是不能夠識(shí)別高級(jí)語言的，所以當(dāng)我們運(yùn)行一個(gè)高級(jí)語言程序的時(shí)候，就需要一個(gè)“翻譯機(jī)”來從事把高級(jí)語言轉(zhuǎn)變成計(jì)算機(jī)能讀懂的機(jī)器語言的過程。這個(gè)過程分成兩類，第一種是編譯，第二種是解釋。

編譯型語言在程序執(zhí)行之前，先會(huì)通過編譯器對(duì)程序執(zhí)行一個(gè)編譯的過程，把程序轉(zhuǎn)變成機(jī)器語言。運(yùn)行時(shí)就不需要翻譯，而直接執(zhí)行就可以了。最典型的例子就是C語言。

解釋型語言就沒有這個(gè)編譯的過程，而是在程序運(yùn)行的時(shí)候，通過解釋器對(duì)程序逐行作出解釋，然后直接運(yùn)行，最典型的例子是Ruby。

通過以上的例子，我們可以來總結(jié)一下解釋型語言和編譯型語言的優(yōu)缺點(diǎn)，因?yàn)榫幾g型語言在程序運(yùn)行之前就已經(jīng)對(duì)程序做出了“翻譯”，所以在運(yùn)行時(shí)就少掉了“翻譯”的過程，所以效率比較高。但是我們也不能一概而論，一些解釋型語言也可以通過解釋器的優(yōu)化來在對(duì)程序做出翻譯時(shí)對(duì)整個(gè)程序做出優(yōu)化，從而在效率上超過編譯型語言。

此外，隨著Java等基于虛擬機(jī)的語言的興起，我們又不能把語言純粹地分成解釋型和編譯型這兩種。

用Java來舉例，Java首先是通過編譯器編譯成字節(jié)碼文件，然后在運(yùn)行時(shí)通過解釋器給解釋成機(jī)器文件。所以我們說Java是一種先編譯后解釋的語言。

再換成C#，C#首先是通過編譯器將C#文件編譯成IL文件，然后在通過CLR將IL文件編譯成機(jī)器文件。所以我們說C#是一門純編譯語言，但是C#是一門需要二次編譯的語言。同理也可等效運(yùn)用到基于.NET平臺(tái)上的其他語言。

3. Python到底是什么

其實(shí)Python和Java/C#一樣，也是一門基于虛擬機(jī)的語言，我們先來從表面上簡(jiǎn)單地了解一下Python程序的運(yùn)行過程吧。

當(dāng)我們?cè)诿钚兄休斎雙ython hello.py時(shí)，其實(shí)是激活了Python的“解釋器”，告訴“解釋器”：你要開始工作了?？墒窃凇敖忉尅敝?，其實(shí)執(zhí)行的第一項(xiàng)工作和Java一樣，是編譯。

熟悉Java的同學(xué)可以想一下我們?cè)诿钚兄腥绾螆?zhí)行一個(gè)Java的程序：

javac hello.java

java hello

只是我們?cè)谟肊clipse之類的IDE時(shí)，將這兩部給融合成了一部而已。其實(shí)Python也一樣，當(dāng)我們執(zhí)行python hello.py時(shí)，他也一樣執(zhí)行了這么一個(gè)過程，所以我們應(yīng)該這樣來描述Python，Python是一門先編譯后解釋的語言。

4. 簡(jiǎn)述Python的運(yùn)行過程

在說這個(gè)問題之前，我們先來說兩個(gè)概念，PyCodeObject和pyc文件。

我們?cè)谟脖P上看到的pyc自然不必多說，而其實(shí)PyCodeObject則是Python編譯器真正編譯成的結(jié)果。我們先簡(jiǎn)單知道就可以了，繼續(xù)向下看。

當(dāng)python程序運(yùn)行時(shí)，編譯的結(jié)果則是保存在位于內(nèi)存中的PyCodeObject中，當(dāng)Python程序運(yùn)行結(jié)束時(shí)，Python解釋器則將PyCodeObject寫回到pyc文件中。

當(dāng)python程序第二次運(yùn)行時(shí)，首先程序會(huì)在硬盤中尋找pyc文件，如果找到，則直接載入，否則就重復(fù)上面的過程。

所以我們應(yīng)該這樣來定位PyCodeObject和pyc文件，我們說pyc文件其實(shí)是PyCodeObject的一種持久化保存方式。

5. 運(yùn)行一段Python程序

我們來寫一段程序?qū)嶋H運(yùn)行一下：

程序本身毫無意義。我們繼續(xù)看：

然而我們?cè)诔绦蛑胁]有看到pyc文件，仍然是test.py孤零零地呆在那！

那么我們換一種寫法，我們把print_str方法換到另外的一個(gè)python模塊中：

然后運(yùn)行程序：

這個(gè)時(shí)候pyc文件出現(xiàn)了，其實(shí)認(rèn)真思考一下不難得到原因，我們考慮一下實(shí)際的業(yè)務(wù)情況。

6. pyc的目的是重用

回想本文的第二段在解釋編譯型語言和解釋型語言的優(yōu)缺點(diǎn)時(shí)，我說編譯型語言的優(yōu)點(diǎn)在于，我們可以在程序運(yùn)行時(shí)不用解釋，而直接利用已經(jīng)“翻譯”過的文件。也就是說，我們之所以要把py文件編譯成pyc文件，最大的優(yōu)點(diǎn)在于我們?cè)谶\(yùn)行程序時(shí)，不需要重新對(duì)該模塊進(jìn)行重新的解釋。

所以，我們需要編譯成pyc文件的應(yīng)該是那些可以重用的模塊，這于我們?cè)谠O(shè)計(jì)軟件類時(shí)是一樣的目的。所以Python的解釋器認(rèn)為：只有import進(jìn)來的模塊，才是需要被重用的模塊。

這個(gè)時(shí)候也許有人會(huì)說，不對(duì)??！你的這個(gè)問題沒有被解釋通啊，我的test.py不是也需要運(yùn)行么，雖然不是一個(gè)模塊，但是以后我每次運(yùn)行也可以節(jié)省時(shí)間??！

OK，我們從實(shí)際情況出發(fā)，思考下我們?cè)谑裁磿r(shí)候才可能運(yùn)行python xxx.py文件：

A. 執(zhí)行測(cè)試時(shí)。

B. 開啟一個(gè)Web進(jìn)程時(shí)。

C. 執(zhí)行一個(gè)程序腳本。

我們逐個(gè)來說，第一種情況我們就不用多說了，這個(gè)時(shí)候哪怕所有的文件都沒有pyc文件都是無所謂的。

第二種情況，我們?cè)囅胍粋€(gè)webpy的程序把，我們通常這樣執(zhí)行：

抑或者：

然后這個(gè)程序就類似于一個(gè)守護(hù)進(jìn)程一樣一直監(jiān)視著8181/9002端口，而一旦中斷，只可能是程序被殺死，或者其他的意外情況，那么你需要恢復(fù)要做的是把整個(gè)的Web服務(wù)重啟。那么既然一直監(jiān)視著，把PyCodeObject一直放在內(nèi)存中就足夠了，完全沒必要持久化到硬盤上。

最后一個(gè)情況，執(zhí)行一個(gè)程序腳本，一個(gè)程序的主入口其實(shí)很類似于Web程序中的Controller，也就是說，他負(fù)責(zé)的應(yīng)該是Model之間的調(diào)度，而不包含任何的主邏輯在內(nèi)，如我在http://www.cnblogs.com/kym/archive/2010/07/19/1780407.html中所提到，Controller應(yīng)該就是一個(gè)Facade，無任何的細(xì)節(jié)邏輯，只是把參數(shù)轉(zhuǎn)來轉(zhuǎn)去而已，那么如果做算法的同學(xué)可以知道，在一段算法腳本中，最容易改變的就是算法的各個(gè)參數(shù)，那么這個(gè)時(shí)候給持久化成pyc文件就未免有些畫蛇添足了。

所以我們可以這樣理解Python解釋器的意圖，Python解釋器只把我們可能重用到的模塊持久化成pyc文件。

7. pyc的過期時(shí)間

說完了pyc文件，可能有人會(huì)想到，每次Python的解釋器都把模塊給持久化成了pyc文件，那么當(dāng)我的模塊發(fā)生了改變的時(shí)候，是不是都要手動(dòng)地把以前的pyc文件remove掉呢？

當(dāng)然Python的設(shè)計(jì)者是不會(huì)犯這么白癡的錯(cuò)誤的。而這個(gè)過程其實(shí)就取決于PyCodeObject是如何寫入pyc文件中的。

我們來看一下import過程的源碼吧：

這段代碼比較長(zhǎng)，我們只來看我標(biāo)注了的代碼，其實(shí)他在寫入pyc文件的時(shí)候，寫了一個(gè)Long型變量，變量的內(nèi)容則是文件的最近修改日期，同理，我們?cè)倏聪螺d入pyc的代碼：

不用仔細(xì)看代碼，我們可以很清楚地看到原理，其實(shí)每次在載入之前都會(huì)先檢查一下py文件和pyc文件保存的最后修改日期，如果不一致則重新生成一份pyc文件。

8. 寫在最后的

其實(shí)了解Python程序的執(zhí)行過程對(duì)于大部分程序員，包括Python程序員來說意義都是不大的，那么真正有意義的是，我們可以從Python的解釋器的做法上學(xué)到什么，我認(rèn)為有這樣的幾點(diǎn)：

A. 其實(shí)Python是否保存成pyc文件和我們?cè)谠O(shè)計(jì)緩存系統(tǒng)時(shí)是一樣的，我們可以仔細(xì)想想，到底什么是值得扔在緩存里的，什么是不值得扔在緩存里的。

B. 在跑一個(gè)耗時(shí)的Python腳本時(shí)，我們?nèi)绾文軌蛏晕赫ヒ恍┏绦虻倪\(yùn)行時(shí)間，就是將模塊從主模塊分開。（雖然往往這都不是瓶頸）

C. 在設(shè)計(jì)一個(gè)軟件系統(tǒng)時(shí)，重用和非重用的東西是不是也應(yīng)該分開來對(duì)待，這是軟件設(shè)計(jì)原則的重要部分。

D. 在設(shè)計(jì)緩存系統(tǒng)（或者其他系統(tǒng)）時(shí)，我們?nèi)绾蝸肀苊獬绦虻倪^期，其實(shí)Python的解釋器也為我們提供了一個(gè)特別常見而且有效的解決方案。

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自：無名小卒917 > 《Python》

舉報(bào)/認(rèn)領(lǐng)