深入淺出Java線程池：源碼篇

頭號碼甲 2021-12-14

展開全文

前言

在上一篇文章深入淺出Java線程池：理論篇中，已經(jīng)介紹了什么是線程池以及基本的使用。（本來寫作的思路是使用篇，但經(jīng)網(wǎng)友建議后，感覺改為理論篇會(huì)更加合適）。本文則深入線程池的源碼，主要是介紹ThreadPoolExecutor內(nèi)部的源碼是如何實(shí)現(xiàn)的，對ThreadPoolExecutor有一個(gè)更加清晰的認(rèn)識。

ThreadPoolExecutor的源碼相對而言比較好理解，沒有特別難以讀懂的地方。相信沒有閱讀源碼習(xí)慣的讀者，跟著本文，也可以很輕松地讀懂ThreadPoolExecutor的核心源碼邏輯。

本文源碼jdk版本為8，該類版本為jdk1.5，也就是在1.5之后，ThreadPoolExecutor的源碼沒有做修改。

線程池家族

Java中的線程池繼承結(jié)構(gòu)如下圖：(類圖中只寫了部分方法且省略參數(shù))

頂層接口Executor表示一個(gè)執(zhí)行器，他只有一個(gè)接口：execute() ，表示可以執(zhí)行任務(wù)
ExecutorService在Executor的基礎(chǔ)上拓展了更多的執(zhí)行方法，如submit() shutdown() 等等,表示一個(gè)任務(wù)執(zhí)行服務(wù)。
AbstarctExecutorService是一個(gè)抽象類，他實(shí)現(xiàn)了ExecutorService的部分核心方法，如submit等
ThreadPoolExecutor是最核心的類，也就是線程池，他繼承了抽象類AbstarctExecutorService
此外還有ScheduledExecutorService接口，他表示一個(gè)可以按照指定時(shí)間或周期執(zhí)行的執(zhí)行器服務(wù)，內(nèi)部定義了如schedule() 等方法來執(zhí)行任務(wù)
ScheduledThreadPoolExecutor實(shí)現(xiàn)了ScheduledExecutorService接口，同時(shí)繼承于ThreadPoolExecutor，內(nèi)部的線程池相關(guān)邏輯使用自ThreadPoolExecutor，在此基礎(chǔ)上拓展了延遲、周期執(zhí)行等功能特性

ScheduledThreadPoolExecutor相對來說用的是比較少。延時(shí)任務(wù)在我們Android中有更加熟悉的方案：Handler；而周期任務(wù)則用的非常少?，F(xiàn)在android的后臺限制非常嚴(yán)格，基本上一退出應(yīng)用，應(yīng)用進(jìn)程很容易被系統(tǒng)干掉。當(dāng)然ScheduledThreadPoolExecutor也不是完全沒有用處，例如桌面小部件需要設(shè)置定時(shí)刷新，那么他就可以派上用場了。

因此，我們本文的源碼，主要針對ThreadPoolExecutor。在閱讀源碼之前，我們先來看一下ThreadPoolExecutor內(nèi)部的結(jié)構(gòu)以及關(guān)鍵角色。

內(nèi)部結(jié)構(gòu)

閱讀源碼前，我們先把ThreadPoolExecutor整個(gè)源碼結(jié)構(gòu)講解一下，形成一個(gè)整體概念，再閱讀源碼就不會(huì)迷失在源碼中了。先來看一下ThreadPoolExecutor的內(nèi)部結(jié)構(gòu)：

yGOUkq.md.png

ThreadPoolExecutor內(nèi)部有三個(gè)關(guān)鍵的角色：阻塞隊(duì)列、線程、以及RejectExecutionHandler（這里寫個(gè)中文名純粹因?yàn)椴恢涝趺捶g這個(gè)名字），他們的作用在理論篇有詳細(xì)介紹，這里不再贅述。
在ThreadPoolExecutor中，一個(gè)線程對應(yīng)一個(gè)worker對象，工人，非常形象。每個(gè)worker內(nèi)部有一個(gè)獨(dú)立的線程，他會(huì)不斷去阻塞隊(duì)列獲取任務(wù)來執(zhí)行，也就是調(diào)用阻塞隊(duì)列的 poll 或者 take 方法，他們區(qū)別后面會(huì)講。如果隊(duì)列沒有任務(wù)了，那么就會(huì)阻塞在這里。
workQueue，就是阻塞隊(duì)列，當(dāng)核心線程已滿之后，任務(wù)就會(huì)被放置在這里等待被工人worker領(lǐng)取執(zhí)行
RejectExecutionHandler本身是一個(gè)接口，ThreadPoolExecutor內(nèi)部有這樣的一個(gè)接口對象，當(dāng)任務(wù)無法被執(zhí)行會(huì)調(diào)用這個(gè)對象的方法。ThreadPoolExecutor提供了該接口的4種實(shí)現(xiàn)方案，我們可以直接拿來用，或者自己繼承接口，實(shí)現(xiàn)自定義邏輯。在構(gòu)造線程池的時(shí)候可以傳入RejectExecutionHandler對象。
整個(gè)ThreadPoolExecutor中最核心的方法就是execute，他會(huì)根據(jù)具體的情況來選擇不同的執(zhí)行方案或者拒絕執(zhí)行。

這樣，我們就清楚ThreadPoolExecutor的內(nèi)部結(jié)構(gòu)了，然后，我們開始 Read the fucking code 吧。

源碼分析

內(nèi)部關(guān)鍵屬性

ThreadPoolExecutor內(nèi)部有很多的變量，他們包含的信息非常重要，先來了解一下。

ThreadPoolExecutor的狀態(tài)和線程數(shù)整合在同一個(gè)int變量中，類似于view測量中MeasureSpec。他的高三位表示線程池的狀態(tài)，低29位表示線程池中線程的數(shù)量,如下：

// AtomicInteger對象可以利用CAS實(shí)現(xiàn)線程安全的修改，其中包含了線程池狀態(tài)和線程數(shù)量信息
private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0));
// COUNT_BITS=29,（對于int長度為32來說）表示線程數(shù)量的字節(jié)位數(shù)
private static final int COUNT_BITS = Integer.SIZE - 3;
// 狀態(tài)掩碼，高三位是1，低29位全是0，可以通過 ctl&COUNT_MASK 運(yùn)算來獲取線程池狀態(tài)
private static final int COUNT_MASK = (1 << COUNT_BITS) - 1;

線程池的狀態(tài)一共有5個(gè)：

運(yùn)行running：線程池創(chuàng)建之后即是運(yùn)行狀態(tài)
關(guān)閉shutdown：調(diào)用shutdown方法之后線程池處于shutdown狀態(tài)，該狀態(tài)會(huì)停止接收任何任務(wù)，阻塞隊(duì)列中的任務(wù)執(zhí)行完成之后會(huì)自動(dòng)終止線程池
停止stop：調(diào)用shutdownNow方法之后線程池處于stop狀態(tài)。和shutdown的區(qū)別是這個(gè)狀態(tài)下的線程池不會(huì)去執(zhí)行隊(duì)列中剩下的任務(wù)
整理tidying：在線程池stop之后，進(jìn)入tidying狀態(tài)，然后執(zhí)行 terminated() 方法，再進(jìn)入terminated狀態(tài)
終止terminated：線程池中沒有任何線程在執(zhí)行任務(wù)，線程池完全終止。

在源碼中這幾個(gè)狀態(tài)分別對應(yīng)：

// runState is stored in the high-order bits
private static final int RUNNING    = -1 << COUNT_BITS;
private static final int SHUTDOWN   =  0 << COUNT_BITS;
private static final int STOP       =  1 << COUNT_BITS;
private static final int TIDYING    =  2 << COUNT_BITS;
private static final int TERMINATED =  3 << COUNT_BITS;

上面的位操作不夠直觀，轉(zhuǎn)化后如下：

private static final int RUNNING    = 111 00000 00000000 00000000 00000000;
private static final int SHUTDOWN   = 000 00000 00000000 00000000 00000000; 
private static final int STOP       = 001 00000 00000000 00000000 00000000;
private static final int TIDYING    = 010 00000 00000000 00000000 00000000;
private static final int TERMINATED = 011 00000 00000000 00000000 00000000;

可以看到除了running是負(fù)數(shù)，其他的狀態(tài)都是正數(shù)，且狀態(tài)越靠后，數(shù)值越大。因此我們可以通過判斷 ctl&COUNT_MASK > SHUTDOWN 來判斷狀態(tài)是否處于 stop、tidying、terminated之一。后續(xù)源碼中會(huì)有很多的這樣的判斷，舉其中的一個(gè)方法：

// 這里來判斷線程池的狀態(tài)
if(runStateAtLeast(ctl,SHUTDOWN)) {
    ...
}
// 這里執(zhí)行邏輯，直接判斷兩個(gè)數(shù)的大小
private static boolean runStateAtLeast(int c, int s) {
    return c >= s;
}

ps：這里怎么沒有使用掩碼COUNT_MASK ？因?yàn)闋顟B(tài)是處于高位，低位的數(shù)值不影響高位的大小判斷。當(dāng)然如果要判斷相等，就還是需要使用掩碼COUNT_MASK的。

接下來是ThreadPoolExecutor內(nèi)部的三個(gè)關(guān)鍵角色對象：

// 阻塞隊(duì)列
private final BlockingQueue<Runnable> workQueue;
// 存儲(chǔ)worker的hashSet,worker被創(chuàng)建之后會(huì)被存儲(chǔ)到這里
private final HashSet<Worker> workers = new HashSet<>();
// RejectedExecutionHandler默認(rèn)的實(shí)現(xiàn)是AbortPolicy
private volatile RejectedExecutionHandler handler;
private static final RejectedExecutionHandler defaultHandler =
        new AbortPolicy();

內(nèi)部使用的鎖對象：

// 這里是兩個(gè)鎖。ThreadPoolExecutor內(nèi)部并沒有使用Synchronize關(guān)鍵字來保持同步
// 而是使用Lock；和Synchronize的區(qū)別就是他是應(yīng)用層的鎖，而synchronize是jvm層的鎖
private final ReentrantLock mainLock = new ReentrantLock();
private final Condition termination = mainLock.newCondition();

最后是內(nèi)部一些參數(shù)的配置，前面都介紹過，把源碼貼出來再回顧一下：

// 線程池歷史達(dá)到的最大線程數(shù)
private int largestPoolSize;
// 線程池完成的任務(wù)數(shù)。
// 該數(shù)并不是實(shí)時(shí)更新的，在獲取線程池完成的任務(wù)數(shù)時(shí)，需要去統(tǒng)計(jì)每個(gè)worker完成的任務(wù)并累加起來
// 當(dāng)一個(gè)worker被銷毀之后，他的任務(wù)數(shù)就會(huì)被累加到這個(gè)數(shù)據(jù)中
private long completedTaskCount;
// 線程工廠，用于創(chuàng)建線程
private volatile ThreadFactory threadFactory;
// 空閑線程存儲(chǔ)的時(shí)間
private volatile long keepAliveTime;
// 是否允許核心線程被回收
private volatile boolean allowCoreThreadTimeOut;
// 核心線程數(shù)限額
private volatile int corePoolSize;
// 線程總數(shù)限額
private volatile int maximumPoolSize;

不是吧sir？源碼還沒看到魂呢，整出來這么無聊的變量？
咳咳，別急嘛，源碼解析馬上來。這些變量會(huì)貫穿整個(gè)源碼過程始終，先對他們有個(gè)印象，后續(xù)閱讀源碼就會(huì)輕松暢通很多。

關(guān)鍵方法：execute()

這個(gè)方法的主要任務(wù)就是根據(jù)線程池的當(dāng)前狀態(tài)，選擇任務(wù)的執(zhí)行策略。該方法的核心邏輯思路是：

在線程數(shù)沒有達(dá)到核心線程數(shù)時(shí)，會(huì)創(chuàng)建一個(gè)核心線程來執(zhí)行任務(wù)

public void execute(Runnable command) {
    // 不能傳入空任務(wù)
    if (command == null)
        throw new NullPointerException();

    // 獲取ctl變量，就是上面我們講的將狀態(tài)和線程數(shù)合在一起的一個(gè)變量
    int c = ctl.get();
    // 判斷核心線程數(shù)是否超過限額，否則創(chuàng)建一個(gè)核心線程來執(zhí)行任務(wù)
    if (workerCountOf(c) < corePoolSize) {
        // addWorker方法是創(chuàng)建一個(gè)worker，也就是創(chuàng)建一個(gè)線程，參數(shù)true表示這是一個(gè)核心線程
        // 如果添加成功則直接返回
        // 否則意味著中間有其他的worker被添加了，導(dǎo)致超出核心線程數(shù);或者線程池被關(guān)閉了等其他情況
        // 需要進(jìn)入下一步繼續(xù)判斷
        if (addWorker(command, true))
            return;
        c = ctl.get();
    }
    ...
}

當(dāng)線程數(shù)達(dá)到核心線程數(shù)時(shí)，新任務(wù)會(huì)被放入到等待隊(duì)列中等待被執(zhí)行
當(dāng)?shù)却?duì)列已經(jīng)滿了之后，如果線程數(shù)沒有到達(dá)總的線程數(shù)上限，那么會(huì)創(chuàng)建一個(gè)非核心線程來執(zhí)行任務(wù)

當(dāng)線程數(shù)已經(jīng)到達(dá)總的線程數(shù)限制時(shí)，新的任務(wù)會(huì)被拒絕策略者處理，線程池?zé)o法執(zhí)行該任務(wù)。

public void execute(Runnable command) {
    ...
    // 如果線程池還在運(yùn)行,則嘗試添加任務(wù)到隊(duì)列中
    if (isRunning(c) && workQueue.offer(command)) {
        int recheck = ctl.get();
        // 再次檢查如果線程池被關(guān)閉了，那么把任務(wù)移出隊(duì)列
        // 如果移除成功則拒絕本次任務(wù)
        // 這里主要是判斷在插入隊(duì)列的過程中，線程池有沒有被關(guān)閉了
        if (! isRunning(recheck) && remove(command))
            reject(command);
        // 否則再次檢查線程數(shù)是否為0，如果是，則創(chuàng)建一個(gè)沒有任務(wù)的非主線程worker
        // 這里對應(yīng)核心線程為0的情況，指定任務(wù)為null，worker會(huì)去隊(duì)列拿任務(wù)來執(zhí)行
        // 這里表示線程池至少有一個(gè)線程來執(zhí)行隊(duì)列中的任務(wù)
        else if (workerCountOf(recheck) == 0)
            addWorker(null, false);
    }
    // 如果上面添加到隊(duì)列中失敗，則嘗試創(chuàng)建一個(gè)非核心線程來執(zhí)行任務(wù)
    // 如果創(chuàng)建失敗，則拒絕任務(wù)
    else if (!addWorker(command, false))
        reject(command);
}

源碼中還設(shè)計(jì)到兩個(gè)關(guān)鍵方法：addWorker創(chuàng)建一個(gè)新的worker，也就是創(chuàng)建一個(gè)線程；reject拒絕一個(gè)任務(wù)。后者比較簡單我們先看一下。

拒絕任務(wù)：reject()

// 拒絕任務(wù)，調(diào)用rejectedExecutionHandler來處理
final void reject(Runnable command) {
    handler.rejectedExecution(command, this);
}

默認(rèn)的實(shí)現(xiàn)類有4個(gè)，我們依次來看一下：

AbortPolicy是默認(rèn)實(shí)現(xiàn)，會(huì)拋出一個(gè)RejectedExecutionException異常：

public static class AbortPolicy implements RejectedExecutionHandler {
    public void rejectedExecution(Runnable r, ThreadPoolExecutor e) {
        throw new RejectedExecutionException("Task " + r.toString() +
                                             " rejected from " +
                                             e.toString());
    }
}

DiscardPolicy最簡單，就是：什么都不做，直接拋棄任務(wù)。（這是非常渣男不負(fù)責(zé)任的行為，咱們不能學(xué)他，所以也不要用它 [此處狗頭] ）
```
public static class DiscardPolicy implements RejectedExecutionHandler {
    public void rejectedExecution(Runnable r, ThreadPoolExecutor e) {
    }
}
```

DiscardOldestPolicy會(huì)刪除隊(duì)列頭的一個(gè)任務(wù)，然后再次執(zhí)行自己（擠掉原位，自己上位，綠茶行為？）

public static class DiscardOldestPolicy implements RejectedExecutionHandler {
    public void rejectedExecution(Runnable r, ThreadPoolExecutor e) {
        if (!e.isShutdown()) {
            e.getQueue().poll();
            e.execute(r);
        }
    }
}

CallerRunsPolicy最猛，他干脆在自己的線程執(zhí)行run方法，不依靠線程池了，自己動(dòng)手豐衣足食。

public static class CallerRunsPolicy implements RejectedExecutionHandler {
    public void rejectedExecution(Runnable r, ThreadPoolExecutor e) {
        if (!e.isShutdown()) {
            r.run();
        }
    }
}

上面4個(gè)ThreadPoolExecutor已經(jīng)幫我們實(shí)現(xiàn)了，他的靜態(tài)內(nèi)部類，在創(chuàng)建ThreadPoolExecutor的時(shí)候我們可以直接拿來用。也可以自己繼承接口實(shí)現(xiàn)自己的邏輯。具體選擇哪個(gè)需要根據(jù)實(shí)際的業(yè)務(wù)需求來決定。

那么接下來看創(chuàng)建worker的方法。

創(chuàng)建worker：addWorker()

方法的目的很簡單：創(chuàng)建一個(gè)worker。前面我們講到，worker內(nèi)部創(chuàng)建了一個(gè)線程，每一個(gè)worker則代表了一個(gè)線程，非常類似android中的looper。looper的loop()方法會(huì)不斷地去MessageQueue獲取message，而Worker的run()方法會(huì)不斷地去阻塞隊(duì)列獲取任務(wù)，這個(gè)我們后面講。

addWorker() 方法的邏輯整體上分為兩個(gè)部分：

檢查線程狀態(tài)和線程數(shù)是否滿足條件：

// 第一個(gè)參數(shù)是創(chuàng)建的線程首次要執(zhí)行的任務(wù)，可以是null，則表示初始化一個(gè)線程
// 第二參數(shù)表示是否是一個(gè)核心線程
private boolean addWorker(Runnable firstTask, boolean core) {
    retry:
    for (int c = ctl.get();;) {
        // 還記不記得我們前面講到線程池的狀態(tài)控制？
        // runStateAtLeast(c, SHUTDOWN)表示狀態(tài)至少為shutdown，后面類同
        // 如果線程池處于stop及以上，不會(huì)再創(chuàng)建worker
        // 如果線程池狀態(tài)在shutdown時(shí)，如果隊(duì)列不為空或者任務(wù)!=null，則還會(huì)創(chuàng)建worker
        if (runStateAtLeast(c, SHUTDOWN)
            && (runStateAtLeast(c, STOP)
                || firstTask != null
                || workQueue.isEmpty()))
            // 其他情況返回false，表示拒絕創(chuàng)建worker
            return false;
        
		// 這里采用CAS輪詢，也就是循環(huán)鎖的策略來讓線程總數(shù)+1
        for (;;) {
            // 檢查是否超出線程數(shù)限制
            // 這里根據(jù)core參數(shù)判斷是核心線程還是非核心線程
            if (workerCountOf(c)
                >= ((core ? corePoolSize : maximumPoolSize) & COUNT_MASK))
                return false;
            // 利用CAS讓ctl變量自增，表示worker+1
            // 如果CAS失敗，則表示發(fā)生了競爭，則再來一次
            if (compareAndIncrementWorkerCount(c))
                // 成功則跳出最外層循環(huán)
                break retry;
            // 如果這個(gè)期間ctl被改變了，則獲取ctl，再嘗試一次
            c = ctl.get();  
            // 如果線程池被shutdown了，那么重復(fù)最外層的循環(huán)，重新判斷狀態(tài)是否可以創(chuàng)建worker
            if (runStateAtLeast(c, SHUTDOWN))
                // 繼續(xù)最外層循環(huán)
                continue retry;
        }
    }
    
    // 創(chuàng)建worker邏輯
    ...
}

不知道讀者對于源碼中的retry: 有沒有疑惑，畢竟平時(shí)很少用到。他的作用是標(biāo)記一個(gè)循環(huán)，這樣我們在內(nèi)層的循環(huán)就可以跳轉(zhuǎn)到任意一個(gè)外層的循環(huán)。這里的retry只是一個(gè)名字，改成 repeat: 甚至 a: 都是可以的。他的本質(zhì)就是：一個(gè)循環(huán)的標(biāo)記 。

創(chuàng)建worker對象，并調(diào)用其內(nèi)部線程的start()方法來啟動(dòng)線程：

private boolean addWorker(Runnable firstTask, boolean core) {
	...
    boolean workerStarted = false;
    boolean workerAdded = false;
    Worker w = null;
    try {
        // 創(chuàng)建一個(gè)新的worker
        // 創(chuàng)建的過程中內(nèi)部會(huì)創(chuàng)建一個(gè)線程
        w = new Worker(firstTask);
        final Thread t = w.thread;
        if (t != null) {
            // 獲得全局鎖并加鎖
            final ReentrantLock mainLock = this.mainLock;
            mainLock.lock();
            try {
                // 獲取鎖之后，需要再次檢查狀態(tài)
                int c = ctl.get();
				// 只有運(yùn)行狀態(tài)或者shutDown&&task==null才會(huì)被執(zhí)行
                if (isRunning(c) ||
                    (runStateLessThan(c, STOP) && firstTask == null)) {
                    // 如果這個(gè)線程不是剛創(chuàng)建的，則拋出異常
                    if (t.getState() != Thread.State.NEW)
                        throw new IllegalThreadStateException(); 
                    // 添加到workerSet中
                    workers.add(w);
                    workerAdded = true;
                    int s = workers.size();
                    // 跟蹤線程池到達(dá)的最多線程數(shù)量
                    if (s > largestPoolSize)
                        largestPoolSize = s;
                }
            } finally {
                // 釋放鎖
                mainLock.unlock();
            }
            // 如果添加成功，啟動(dòng)線程
            if (workerAdded) {
                t.start();
                workerStarted = true;
            }
        }
    } finally {
        // 如果線程沒有啟動(dòng)，表示添加worker失敗，可能在添加的過程中線程池被關(guān)閉了
        if (! workerStarted)
            // 把worker從workerSet中移除
            addWorkerFailed(w);
    }
    return workerStarted;
}

經(jīng)過前面兩步，如果沒有出現(xiàn)異常，則創(chuàng)建worker成功。最后還涉及到一個(gè)方法： addWorkerFailed(w) ，他的內(nèi)容比較簡答，順便提一下吧：

// 添加worker失敗
private void addWorkerFailed(Worker w) {
    final ReentrantLock mainLock = this.mainLock;
    // 加鎖
    mainLock.lock();
    try {
        if (w != null)
            workers.remove(w);
        // 這里會(huì)讓線程總數(shù)-1
        decrementWorkerCount();
        // 嘗試設(shè)置線程池的狀態(tài)為terminad
        // 因?yàn)樘砑邮∮锌赡苁蔷€程池在添加worker的過程中被shutdown
        // 那么這個(gè)時(shí)候如果沒有任務(wù)正在執(zhí)行就需要設(shè)置狀態(tài)為terminad
        // 這個(gè)方法后面會(huì)詳細(xì)講
        tryTerminate();
    } finally {
        mainLock.unlock();
    }
}

那么到這里，execute()方法中的一些調(diào)用方法就分析完了。阻塞隊(duì)列相關(guān)的方法不屬于本文的范疇，就不展開了。那么還有一個(gè)問題：worker是如何工作的呢？worker內(nèi)部有一個(gè)線程，當(dāng)線程啟動(dòng)時(shí)，初始化線程的runnable對象的run方法會(huì)被調(diào)用，那么這個(gè)runnable對象是什么？我直接來看worker。

打工人：Worker

首先我們看到他的構(gòu)造方法：

Worker(Runnable firstTask) {
    setState(-1); // inhibit interrupts until runWorker
    this.firstTask = firstTask;
    this.thread = getThreadFactory().newThread(this);
}

源碼很簡單，把傳進(jìn)來的任務(wù)設(shè)置給內(nèi)部變量firstTask，然后把自己傳給線程工廠去創(chuàng)建一個(gè)線程。所以線程啟動(dòng)時(shí)，Worker本身的run方法會(huì)被調(diào)用，那么我們看到Worker的 run()方法。

public void run() {
    runWorker(this);
}

Worker是ThreadPoolExecutor的內(nèi)部類，這里直接調(diào)用到了ThreadPoolExecutor的方法： runWorker()來開始執(zhí)行。那么接下來，我們就看到這個(gè)方法。

啟動(dòng)worker：runWorker()

這個(gè)方法是worker執(zhí)行的方法，在線程被銷毀前他會(huì)一直執(zhí)行，類似于Handler的looper，不斷去隊(duì)列獲取消息來執(zhí)行：

final void runWorker(Worker w) {
    Thread wt = Thread.currentThread();
    // 獲取worker初始化時(shí)設(shè)置的任務(wù)，可以為null。如果為null則表示僅僅創(chuàng)建線程
    Runnable task = w.firstTask;
    w.firstTask = null;
    w.unlock(); 
    // 這個(gè)參數(shù)的作用后面解釋，需要結(jié)合其他的源碼
    boolean completedAbruptly = true;
    try {
        // 如果自身的task不為null，那么會(huì)執(zhí)行自身的task
        // 否則調(diào)用getTask去隊(duì)列獲取一個(gè)task來執(zhí)行
        // 這個(gè)getTask最終會(huì)去調(diào)用隊(duì)列的方法來獲取任務(wù)
        // 而隊(duì)列如果為空他的獲取方法會(huì)進(jìn)行阻塞，這里也就阻塞了,后面深入講
        while (task != null || (task = getTask()) != null) {
            try{
            // 執(zhí)行任務(wù)
            ...
            } finally {
                // 任務(wù)執(zhí)行完成，把task設(shè)置為null
                task = null;
                // 任務(wù)總數(shù)+1
                w.completedTasks++;
                // 釋放鎖
                w.unlock();
            }
        }
    	// 這里設(shè)置為false，先記住他
        completedAbruptly = false;
    } finally {
    	// 如果worker退出，那么需要執(zhí)行后續(xù)的善后工作
        processWorkerExit(w, completedAbruptly);
    }
}

可以看到這個(gè)方法的整體框架還是比較簡單的，核心就在于 while (task != null || (task = getTask()) != null) 這個(gè)循環(huán)中，如果 getTask() 返回null，則表示線程該結(jié)束了，這和Handler機(jī)制也是一樣的。

上面的源碼省略了具體執(zhí)行任務(wù)的邏輯，他的邏輯也是很簡單：判斷狀態(tài)+運(yùn)行任務(wù)。我們來看一下：

final void runWorker(Worker w) {
    ...;
    try {
        while (task != null || (task = getTask()) != null) {
            w.lock();
            // 如果線程池已經(jīng)設(shè)置為stop狀態(tài)，那么保證線程是interrupted標(biāo)志
            // 如果線程池沒有在stop狀態(tài)，那么保證線程不是interrupted標(biāo)志
            if ((runStateAtLeast(ctl.get(), STOP) ||
                 (Thread.interrupted() &&
                  runStateAtLeast(ctl.get(), STOP))) &&
                !wt.isInterrupted())
                wt.interrupt();
            try {
                // 回調(diào)方法，這個(gè)方法是一個(gè)空實(shí)現(xiàn)
                beforeExecute(wt, task);
                try {
                    // 運(yùn)行任務(wù)
                    task.run();
                    // 回調(diào)方法，也是一個(gè)空實(shí)現(xiàn)
                    afterExecute(task, null);
                } catch (Throwable ex) {
                    afterExecute(task, ex);
                    throw ex;
                }
            }
            ...
        }
    	completedAbruptly = false;
    } finally {
        processWorkerExit(w, completedAbruptly);
    }
}

在獲取到一個(gè)任務(wù)后，就會(huì)去執(zhí)行該任務(wù)的run方法，然后再回去繼續(xù)獲取新的任務(wù)。

我們會(huì)發(fā)現(xiàn)其中有很多的空實(shí)現(xiàn)方法，他是給子類去實(shí)現(xiàn)的，有點(diǎn)類似于Activity的生命周期，子類需要重寫這些方法，在具體的情況做一些工作。當(dāng)然，一般的使用是不需要去重寫這些方法。接下來需要來看看 getTask() 是如何獲取任務(wù)的。

獲取任務(wù)：getTask()

這個(gè)方法的內(nèi)容可以分為兩個(gè)部分：判斷當(dāng)前線程池的狀態(tài)+阻塞地從隊(duì)列中獲取一個(gè)任務(wù)。

第一部分是判斷當(dāng)前線程池的狀況，如果處于關(guān)閉狀態(tài)那么直接返回null來讓worker結(jié)束，否則需要判斷當(dāng)前線程是否超時(shí)或者超出最大限制的線程數(shù)：

private Runnable getTask() {
    boolean timedOut = false; 
    // 內(nèi)部使用了CAS，這里需要有一個(gè)循環(huán)來不斷嘗試
    for (;;) {
        int c = ctl.get();
        // 如果處于shutdown狀態(tài)而且隊(duì)列為空，或者處于stop狀態(tài)，返回null
        // 這和前面我們討論到不同的線程池的狀態(tài)的不同行為一致
        if (runStateAtLeast(c, SHUTDOWN)
            && (runStateAtLeast(c, STOP) || workQueue.isEmpty())) {
            // 這里表示讓線程總數(shù)-1，記住他，后面會(huì)繼續(xù)聊到
            decrementWorkerCount();
            return null;
        }
        
        // 獲取目前的線程總數(shù)
        int wc = workerCountOf(c);
        // 判斷該線程在空閑情況是否可以被銷毀：允許核心線程為null或者當(dāng)前線程超出核心線程數(shù)
        // 可以看到這里并沒有去區(qū)分具體的線程是核心還是非核心，只有線程數(shù)量處于核心范圍還是非核心范圍
        boolean timed = allowCoreThreadTimeOut || wc > corePoolSize;
        // 超出最大線程數(shù)或者已經(jīng)超時(shí)；
        // 這里可能是用戶通過 setMaximumPoolSize 改動(dòng)了數(shù)據(jù)才會(huì)導(dǎo)致這里超出最大線程數(shù)
        // 同時(shí)還必須保證當(dāng)前線程數(shù)量大于1或者隊(duì)列已經(jīng)沒有任務(wù)了
        // 這樣就確保了當(dāng)有任務(wù)存在時(shí)，一定至少有一個(gè)線程在執(zhí)行任務(wù)
        if ((wc > maximumPoolSize || (timed && timedOut))
            && (wc > 1 || workQueue.isEmpty())) {
            // 使用CAS嘗試讓當(dāng)前線程總數(shù)-1，失敗則從來一次上面的邏輯
            if (compareAndDecrementWorkerCount(c))
                return null;
            continue;
        }
        
        // 獲取任務(wù)邏輯
        ...
    }
}

第二部分是獲取一個(gè)任務(wù)并執(zhí)行。獲取任務(wù)使用的是阻塞隊(duì)列的方法，如果隊(duì)列中沒有任務(wù)，則會(huì)被阻塞：

private Runnable getTask() {
    boolean timedOut = false; 
    // 內(nèi)部使用了CAS，這里需要有一個(gè)循環(huán)來不斷嘗試
    for (;;) {
        // 判斷線程池狀態(tài)邏輯
        ...
        try {
            // 獲取一個(gè)任務(wù)
            // poll方法等待具體時(shí)間之后如果沒有獲取到對象，會(huì)返回null
            // take方法會(huì)一直等到獲取新對象，除非被interrupt
            Runnable r = timed ?
                workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS) :
                workQueue.take();
            if (r != null)
                return r;
            // r==null,說明超時(shí)了，重新循環(huán)
            timedOut = true;
        } catch (InterruptedException retry) {
            // 被interrupt，說明可能線程池被關(guān)閉了，重新判斷情況
            timedOut = false;
        }
    }
}

這里需要重點(diǎn)關(guān)注的是阻塞隊(duì)列的 poll() 和 take() 方法，他們都會(huì)去隊(duì)列中獲取一個(gè)任務(wù)；但是，poll() 方法會(huì)阻塞指定時(shí)間后返回，而 take() 則是無限期阻塞。這里對應(yīng)的就是有存活時(shí)間的線程和不會(huì)被銷毀的核心線程。

同時(shí)注意 timedOut = true 是在這一部分被賦值的，當(dāng)賦值為true之后需要再執(zhí)行一次循環(huán)，在上面的判斷中就會(huì)被攔截下來并返回false，這在第一部分邏輯介紹了。而如果線程在等待的時(shí)候被 interrupt 了，說明線程池被關(guān)閉了，此時(shí)也會(huì)重走一次上面判斷狀態(tài)的邏輯。

到這里關(guān)于執(zhí)行的邏輯就講得差不多了，下面聊一聊線程池關(guān)閉以及worker結(jié)束的相關(guān)邏輯。

worker退出工作：processWorkerExit

前面已經(jīng)介紹 runWorker() 了方法，這個(gè)方法的主要任務(wù)就是讓worker動(dòng)起來，不斷去隊(duì)列獲取任務(wù)。而當(dāng)獲取任務(wù)的時(shí)候返回了null，則表示該worker可以結(jié)束了，最后會(huì)調(diào)用 processWorkerExit() 方法，如下：

final void runWorker(Worker w) {
    ...
    try {
       ...
    } finally {
    	// 如果worker退出，那么需要執(zhí)行后續(xù)的善后工作
        processWorkerExit(w, completedAbruptly);
    }
}

processWorkerExit() 會(huì)完成worker退出的善后工作。具體的內(nèi)容是：

把完成的任務(wù)數(shù)合并到總的任務(wù)數(shù),移除worker，嘗試設(shè)置線程池的狀態(tài)為terminated：

private void processWorkerExit(Worker w, boolean completedAbruptly) {
    // 如果不是經(jīng)過getTask方法返回null正常退出的，那么需要讓線程總數(shù)-1
    // 這個(gè)參數(shù)前面一直讓你們注意一下不知道你們還記不記得
    // 如果是在正常情況下退出，那么在getTask() 方法中就會(huì)執(zhí)行decrementWorkerCount()了
    // 而如果出現(xiàn)一些特殊的情況突然結(jié)束了，并不是通過在getTask返回null結(jié)束
    // Abruptly就是突然的意思，那么completedAbruptly就為true,正常情況下在runWorker方法中會(huì)被設(shè)置為false
    // 那什么叫突然結(jié)束？用戶的任務(wù)拋出了異常，這個(gè)時(shí)候線程就突然結(jié)束了，沒有經(jīng)過getTask方法
    // 這里就需要讓線程總數(shù)-1
    if (completedAbruptly) 
        decrementWorkerCount();

    // 獲取鎖，并累加完成的任務(wù)總數(shù)，從set中移除worker
    final ReentrantLock mainLock = this.mainLock;
    mainLock.lock();
    try {
        completedTaskCount += w.completedTasks;
        workers.remove(w);
    } finally {
        mainLock.unlock();
    }

    // 嘗試設(shè)置線程池的狀態(tài)為terminated
    // 這個(gè)方法前面我們addWorker失敗的時(shí)候提到過，后面再展開
    tryTerminate();
	...
}

移除worker之后，如果線程池還沒有被stop，那么最后必須保證隊(duì)列任務(wù)至少有一個(gè)線程在執(zhí)行隊(duì)列中的任務(wù)：

private void processWorkerExit(Worker w, boolean completedAbruptly) {
    ...
	int c = ctl.get();
    // stop及以上的狀態(tài)不需要執(zhí)行剩下的任務(wù)
    if (runStateLessThan(c, STOP)) {
        // 如果線程是突然終止的，那肯定需要重新創(chuàng)建一個(gè)
        // 否則進(jìn)行判斷是否要保留一個(gè)線程
        if (!completedAbruptly) {
            int min = allowCoreThreadTimeOut ? 0 : corePoolSize;
            if (min == 0 && ! workQueue.isEmpty())
                min = 1;
            if (workerCountOf(c) >= min)
                return; 
        }
        // 如果此時(shí)線程數(shù)<=核心線程數(shù)，或者當(dāng)核心線程可被銷毀時(shí)，線程數(shù)==0且隊(duì)列不為空
        // 那么需要?jiǎng)?chuàng)建一個(gè)線程來執(zhí)行任務(wù)
        addWorker(null, false);
    }
}

代碼雖然看起來很多，但是具體的邏輯內(nèi)容還是比較簡單的。前面一直提到一個(gè)方法 tryTerminate() 但一直沒有展開解釋，下面來介紹一下。

嘗試終止線程池：tryTerminate()

這個(gè)方法出現(xiàn)在任何可能讓線程池進(jìn)入終止?fàn)顟B(tài)的地方。如添加worker失敗時(shí)，那么這個(gè)時(shí)候可能線程池已經(jīng)處于stop狀態(tài)，且已經(jīng)沒有任何正在執(zhí)行的worker了，那么此時(shí)可以進(jìn)入terminated狀態(tài)；再如worker被銷毀的時(shí)候，可能這是最后一個(gè)被銷毀的worker，那么此時(shí)線程池需要進(jìn)入terminated狀態(tài)。

根據(jù)這個(gè)方法的使用情況其實(shí)就已經(jīng)差不多可以推斷出這個(gè)方法的內(nèi)容：判斷當(dāng)前線程池的狀態(tài)，如果符合條件則設(shè)置線程池的狀態(tài)為terminated 。如果此時(shí)不能轉(zhuǎn)換為terminated狀態(tài)，則什么也不做，直接返回。

首先判斷當(dāng)前線程池狀態(tài)是否符合轉(zhuǎn)化為terminated。如果處于運(yùn)行狀態(tài)或者tidying以上狀態(tài)，則肯定不需要進(jìn)行狀態(tài)轉(zhuǎn)換。因?yàn)閞unning需要先進(jìn)入stop狀態(tài)，而tidying其實(shí)已經(jīng)是準(zhǔn)備進(jìn)入terminated狀態(tài)了。如果處于shutdown狀態(tài)且隊(duì)列不為空，那么需要執(zhí)行完隊(duì)列中的任務(wù)，所以也不適合狀態(tài)轉(zhuǎn)換：

final void tryTerminate() {
    for (;;) {
        int c = ctl.get();
        // 如果處于運(yùn)行狀態(tài)或者tidying以上狀態(tài)時(shí)，直接返回，不需要修改狀態(tài)
        // 如果處于stop以下狀態(tài)且隊(duì)列不為空，那么需要等隊(duì)列中的任務(wù)執(zhí)行完成，直接返回
        if (isRunning(c) ||
            runStateAtLeast(c, TIDYING) ||
            (runStateLessThan(c, STOP) && ! workQueue.isEmpty()))
            return;
        // 到這里說明線程池肯定處于stop狀態(tài)
        // 線程的數(shù)量不等于0，嘗試中斷一個(gè)空閑的worker線程
        // 這里他只中斷workerSet中的其中一個(gè)，當(dāng)其中的一個(gè)線程停止時(shí)，會(huì)再次調(diào)用tryTerminate
        // 然后又會(huì)再去中斷workerSet中的一個(gè)worker，不斷循環(huán)下去直到剩下最后一個(gè)，workercount==0
        // 這就是 鏈?zhǔn)椒磻?yīng) 。
        if (workerCountOf(c) != 0) { 
            interruptIdleWorkers(ONLY_ONE);
            return;
        }
		
        // 設(shè)置狀態(tài)為terminated邏輯
        ...
    }
}

經(jīng)過上面的判斷，能到第二部分邏輯，線程池肯定是具備進(jìn)入terminated狀態(tài)的條件了。剩下的代碼就是把線程池的狀態(tài)設(shè)置為terminated：

final void tryTerminate() {
    for (;;) {
        // 上一部分邏輯
        ...
        // 首先獲取全局鎖
        final ReentrantLock mainLock = this.mainLock;
        mainLock.lock();
        try {
            // 嘗試把線程池的狀態(tài)從stop修改為tidying
            // 如果修改失敗，說明狀態(tài)已經(jīng)被修改了，那么外層循環(huán)再跑一個(gè)
            if (ctl.compareAndSet(c, ctlOf(TIDYING, 0))) {
                try {
                    // 這個(gè)方法是一個(gè)空實(shí)現(xiàn)，需要子類繼承重寫
                    terminated();
                } finally {
                    // 最后再設(shè)置狀態(tài)為terminated
                    ctl.set(ctlOf(TERMINATED, 0));
                    // 喚醒所有等待終止鎖的線程
                    termination.signalAll();
                }
                return;
            }
        } finally {
            // 釋放鎖
            mainLock.unlock();
        }
        // CAS修改線程池的狀態(tài)失敗，重新進(jìn)行判斷
    }
}

當(dāng)線程池被標(biāo)記為terminated狀態(tài)時(shí)，那么這個(gè)線程池就徹底地終止了。

好了到這里，恭喜你，關(guān)于ThreadPoolExecutor的源碼解析理解得差不多了。接下來剩下幾個(gè)常用的api方法：submit() 、 shutdown()/shutdownNow() 順便看一下吧，他們的邏輯也是都非常簡單。

關(guān)閉線程池：shutdown/shutdownNow

關(guān)閉線程池有兩個(gè)方法：

shutdown：設(shè)置線程池的狀態(tài)為shutdown，同時(shí)嘗試中斷所有空閑線程，但是會(huì)等待隊(duì)列中的任務(wù)執(zhí)行結(jié)束再終止線程池。
shutdownNow：設(shè)置線程池的狀態(tài)為stop，同時(shí)嘗試中斷所有空閑線程，不會(huì)等待隊(duì)列中的任務(wù)完成，正在執(zhí)行中的線程執(zhí)行結(jié)束，線程池馬上進(jìn)入terminated狀態(tài)。

我們各自來看一下：

// 關(guān)閉后隊(duì)列中的任務(wù)依舊會(huì)被執(zhí)行，但是不會(huì)再添加新的任務(wù)
public void shutdown() {
    final ReentrantLock mainLock = this.mainLock;
    mainLock.lock();
    try {
        checkShutdownAccess();
        // 設(shè)置狀態(tài)為shutdown
        advanceRunState(SHUTDOWN);
        // 嘗試中斷所有空閑的worker
        interruptIdleWorkers();
        // 回調(diào)方法，這個(gè)方法是個(gè)空方法，ScheduledThreadPoolExecutor中重寫了該方法
        onShutdown(); 
    } finally {
        mainLock.unlock();
    }
    // 嘗試設(shè)置線程池狀態(tài)為terminated
    tryTerminate();
}

再看一下另一個(gè)方法shutdownNow：

// 關(guān)閉后隊(duì)列中剩余的任務(wù)不會(huì)被執(zhí)行
// 會(huì)把剩下的任務(wù)返回交給開發(fā)者去處理
public List<Runnable> shutdownNow() {
    List<Runnable> tasks;
    final ReentrantLock mainLock = this.mainLock;
    mainLock.lock();
    try {
        // 檢查是否可以關(guān)閉線程
        checkShutdownAccess();
        // 設(shè)置狀態(tài)為stop
        advanceRunState(STOP);
        // 嘗試中斷所有線程
        interruptWorkers();
        // 返回隊(duì)列中剩下的任務(wù)
        tasks = drainQueue();
    } finally {
        mainLock.unlock();
    }
    tryTerminate();
    return tasks;
}

最后再來看一下和 execute()不同的提交任務(wù)方法：submit。

提交任務(wù)：submit()

submit方法并不是ThreadPoolExecutor實(shí)現(xiàn)的，而是AbstractExecutorService，如下：

// runnable沒有返回值，創(chuàng)建FutureTask的返回參數(shù)傳入null
public Future<?> submit(Runnable task) {
    if (task == null) throw new NullPointerException();
    RunnableFuture<Void> ftask = newTaskFor(task, null);
    execute(ftask);
    return ftask;
}
// 有參數(shù)返回值的runnable
// 最終也是構(gòu)造一個(gè)callable來執(zhí)行，把返回值設(shè)置為result
public <T> Future<T> submit(Runnable task, T result) {
    if (task == null) throw new NullPointerException();
    RunnableFuture<T> ftask = newTaskFor(task, result);
    execute(ftask);
    return ftask;
}
// callable本身就擁有返回值
public <T> Future<T> submit(Callable<T> task) {
    if (task == null) throw new NullPointerException();
    RunnableFuture<T> ftask = newTaskFor(task);
    execute(ftask);
    return ftask;
}

他們的邏輯都幾乎一樣：調(diào)用newTaskFor方法來構(gòu)造一個(gè)Future對象并返回。我們看到newTaskFor方法：

// 創(chuàng)建一個(gè)FutureTask來返回
protected <T> RunnableFuture<T> newTaskFor(Runnable runnable, T value) {
    return new FutureTask<T>(runnable, value);
}
protected <T> RunnableFuture<T> newTaskFor(Callable<T> callable) {
    return new FutureTask<T>(callable);
}

可以看到這個(gè)方法很簡單：構(gòu)造一個(gè)FutureTask并返回，F(xiàn)utureTask也是Future接口目前唯一的實(shí)現(xiàn)類。

更加具體關(guān)于Future的內(nèi)容就不展開了，有興趣的讀者可以去了解一下。

最后

好了到這里，關(guān)于ThreadPoolExecutor的源碼分析內(nèi)容就講完了。最后讓我們再回顧一下吧：

yGOUkq.md.png

ThreadPoolExecutor的整個(gè)執(zhí)行流程從execute方法開始，他會(huì)根據(jù)具體的情況，采用合適的執(zhí)行方案
線程被封裝在worker對象中，worker對象通過runWorker方法，會(huì)一直不斷地調(diào)用getTask方法來調(diào)用隊(duì)列的poll或take方法獲取任務(wù)
當(dāng)需要退出一個(gè)worker時(shí)，只要getTask方法返回null即可退出
當(dāng)線程池關(guān)閉時(shí)，會(huì)根據(jù)不同的關(guān)閉方法，等待所有的線程執(zhí)行完成，然后關(guān)閉線程池。

線程池整體的模型和handler是十分類似的：一個(gè)生產(chǎn)者-消費(fèi)者模型。但和Handler不同的是，ThreadPoolExecutor不支持延時(shí)任務(wù)，這點(diǎn)在ScheduledThreadPoolExecutor得到了實(shí)現(xiàn)；Handler的線程安全采用synchronize關(guān)鍵字，而ThreadPoolExecutor采用的是Lock和一些利用CAS實(shí)現(xiàn)線程安全的整型變量；Handler無法拒絕任務(wù)，線程池可以；Handler拋出異常會(huì)直接程序崩潰，而線程池不會(huì)等等。

了解了線程池的內(nèi)部源碼，對于他更加了解后，那么可以根據(jù)具體的問題，做出更加合適的解決方案。ThreadPoolExecutor還有一些源碼沒有講到，以及ScheduledThreadPoolExecutor、阻塞隊(duì)列的源碼，有興趣讀者可以自行去深入了解一下，拓展關(guān)于線程池的一切。

全文到此，假期肝文不容易啊，如果文章對你有幫助，求一個(gè)大拇指，贊一下再走唄。

參考文獻(xiàn)

《Java并發(fā)編程的藝術(shù)》：并發(fā)編程必讀，作者對一些原理講的很透徹
《Java核心技術(shù)卷》：這系列的書主要是講解框架的使用，不會(huì)深入原理，適合入門
javaGuide：javaGuide，對java知識總結(jié)得很不錯(cuò)的一個(gè)博客
Java并發(fā)編程：線程池的使用：博客園上一位很優(yōu)秀的博主，文章寫得通俗易懂且不失深度

全文到此，原創(chuàng)不易，覺得有幫助可以點(diǎn)贊收藏評論轉(zhuǎn)發(fā)。
筆者才疏學(xué)淺，有任何想法歡迎評論區(qū)交流指正。
如需轉(zhuǎn)載請?jiān)u論區(qū)或私信交流。

另外歡迎光臨筆者的個(gè)人博客：傳送門

本站是提供個(gè)人知識管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自：頭號碼甲 > 《待分類》

舉報(bào)/認(rèn)領(lǐng)