17 Executor组件：Tomcat如何扩展Java线程池？

在开发中我们经常会碰到“池”的概念，比如数据库连接池、内存池、线程池、常量池等。为什么需要“池”呢？程序运行的本质，就是通过使用系统资源（CPU、内存、网络、磁盘等）来完成信息的处理，比如在JVM中创建一个对象实例需要消耗CPU和内存资源，如果你的程序需要频繁创建大量的对象，并且这些对象的存活时间短，就意味着需要进行频繁销毁，那么很有可能这部分代码会成为性能的瓶颈。

而“池”就是用来解决这个问题的，简单来说，对象池就是把用过的对象保存起来，等下一次需要这种对象的时候，直接从对象池中拿出来重复使用，避免频繁地创建和销毁。在Java中万物皆对象，线程也是一个对象，Java线程是对操作系统线程的封装，创建Java线程也需要消耗系统资源，因此就有了线程池。JDK中提供了线程池的默认实现，我们也可以通过扩展Java原生线程池来实现自己的线程池。

同样，为了提高处理能力和并发度，Web容器一般会把处理请求的工作放到线程池里来执行，Tomcat扩展了原生的Java线程池，来满足Web容器高并发的需求，下面我们就来学习一下Java线程池的原理，以及Tomcat是如何扩展Java线程池的。

Java线程池

简单的说，Java线程池里内部维护一个线程数组和一个任务队列，当任务处理不过来的时，就把任务放到队列里慢慢处理。

ThreadPoolExecutor

我们先来看看Java线程池核心类ThreadPoolExecutor的构造函数，你需要知道ThreadPoolExecutor是如何使用这些参数的，这是理解Java线程工作原理的关键。

public ThreadPoolExecutor(int corePoolSize,
int maximumPoolSize,
long keepAliveTime,
TimeUnit unit,
BlockingQueue<Runnable> workQueue,
ThreadFactory threadFactory,
RejectedExecutionHandler handler)

每次提交任务时，如果线程数还没达到核心线程数corePoolSize，线程池就创建新线程来执行。当线程数达到corePoolSize后，新增的任务就放到工作队列workQueue里，而线程池中的线程则努力地从workQueue里拉活来干，也就是调用poll方法来获取任务。

如果任务很多，并且workQueue是个有界队列，队列可能会满，此时线程池就会紧急创建新的临时线程来救场，如果总的线程数达到了最大线程数maximumPoolSize，则不能再创建新的临时线程了，转而执行拒绝策略handler，比如抛出异常或者由调用者线程来执行任务等。

如果高峰过去了，线程池比较闲了怎么办？临时线程使用poll（keepAliveTime, unit）方法从工作队列中拉活干，请注意poll方法设置了超时时间，如果超时了仍然两手空空没拉到活，表明它太闲了，这个线程会被销毁回收。

那还有一个参数threadFactory是用来做什么的呢？通过它你可以扩展原生的线程工厂，比如给创建出来的线程取个有意义的名字。

FixedThreadPool/CachedThreadPool

Java提供了一些默认的线程池实现，比如FixedThreadPool和CachedThreadPool，它们的本质就是给ThreadPoolExecutor设置了不同的参数，是定制版的ThreadPoolExecutor。

public static ExecutorService newFixedThreadPool(int nThreads) {
return new ThreadPoolExecutor(nThreads, nThreads,
0L, TimeUnit.MILLISECONDS,
new LinkedBlockingQueue<Runnable>());
}

public static ExecutorService newCachedThreadPool() {
return new ThreadPoolExecutor(0, Integer.MAX_VALUE,
60L, TimeUnit.SECONDS,
new SynchronousQueue<Runnable>());
}

从上面的代码你可以看到：

FixedThreadPool有固定长度（nThreads）的线程数组，忙不过来时会把任务放到无限长的队列里，这是因为LinkedBlockingQueue默认是一个无界队列。
CachedThreadPool的maximumPoolSize参数值是Integer.MAX_VALUE ，因此它对线程个数不做限制，忙不过来时无限创建临时线程，闲下来时再回收。它的任务队列是SynchronousQueue，表明队列长度为0。

Tomcat线程池

跟FixedThreadPool/CachedThreadPool一样，Tomcat的线程池也是一个定制版的ThreadPoolExecutor。

定制版的ThreadPoolExecutor

通过比较FixedThreadPool和CachedThreadPool，我们发现它们传给ThreadPoolExecutor的参数有两个关键点：

是否限制线程个数。
是否限制队列长度。

对于Tomcat来说，这两个资源都需要限制，也就是说要对高并发进行控制，否则CPU和内存有资源耗尽的风险。因此Tomcat传入的参数是这样的：

//定制版的任务队列
taskqueue = new TaskQueue(maxQueueSize);

//定制版的线程工厂
TaskThreadFactory tf = new TaskThreadFactory(namePrefix,daemon,getThreadPriority());

//定制版的线程池
executor = new ThreadPoolExecutor(getMinSpareThreads(), getMaxThreads(), maxIdleTime, TimeUnit.MILLISECONDS,taskqueue, tf);

你可以看到其中的两个关键点：

Tomcat有自己的定制版任务队列和线程工厂，并且可以限制任务队列的长度，它的最大长度是maxQueueSize。
Tomcat对线程数也有限制，设置了核心线程数（minSpareThreads）和最大线程池数（maxThreads）。

除了资源限制以外，Tomcat线程池还定制自己的任务处理流程。我们知道Java原生线程池的任务处理逻辑比较简单：

前corePoolSize个任务时，来一个任务就创建一个新线程。
后面再来任务，就把任务添加到任务队列里让所有的线程去抢，如果队列满了就创建临时线程。
如果总线程数达到maximumPoolSize，执行拒绝策略。

Tomcat线程池扩展了原生的ThreadPoolExecutor，通过重写execute方法实现了自己的任务处理逻辑：

前corePoolSize个任务时，来一个任务就创建一个新线程。
再来任务的话，就把任务添加到任务队列里让所有的线程去抢，如果队列满了就创建临时线程。
如果总线程数达到maximumPoolSize，则继续尝试把任务添加到任务队列中去。
如果缓冲队列也满了，插入失败，执行拒绝策略。

观察Tomcat线程池和Java原生线程池的区别，其实就是在第3步，Tomcat在线程总数达到最大数时，不是立即执行拒绝策略，而是再尝试向任务队列添加任务，添加失败后再执行拒绝策略。那具体如何实现呢，其实很简单，我们来看一下Tomcat线程池的execute方法的核心代码。

public class ThreadPoolExecutor extends java.util.concurrent.ThreadPoolExecutor {

...

public void execute(Runnable command, long timeout, TimeUnit unit) {
submittedCount.incrementAndGet();
try {
//调用Java原生线程池的execute去执行任务
super.execute(command);
} catch (RejectedExecutionException rx) {
//如果总线程数达到maximumPoolSize，Java原生线程池执行拒绝策略
if (super.getQueue() instanceof TaskQueue) {
final TaskQueue queue = (TaskQueue)super.getQueue();
try {
//继续尝试把任务放到任务队列中去
if (!queue.force(command, timeout, unit)) {
submittedCount.decrementAndGet();
//如果缓冲队列也满了，插入失败，执行拒绝策略。
throw new RejectedExecutionException("...");
}
}
}
}
}

从这个方法你可以看到，Tomcat线程池的execute方法会调用Java原生线程池的execute去执行任务，如果总线程数达到maximumPoolSize，Java原生线程池的execute方法会抛出RejectedExecutionException异常，但是这个异常会被Tomcat线程池的execute方法捕获到，并继续尝试把这个任务放到任务队列中去；如果任务队列也满了，再执行拒绝策略。

定制版的任务队列

细心的你有没有发现，在Tomcat线程池的execute方法最开始有这么一行：

submittedCount.incrementAndGet();

这行代码的意思把submittedCount这个原子变量加一，并且在任务执行失败，抛出拒绝异常时，将这个原子变量减一：

submittedCount.decrementAndGet();

其实Tomcat线程池是用这个变量submittedCount来维护已经提交到了线程池，但是还没有执行完的任务个数。Tomcat为什么要维护这个变量呢？这跟Tomcat的定制版的任务队列有关。Tomcat的任务队列TaskQueue扩展了Java中的LinkedBlockingQueue，我们知道LinkedBlockingQueue默认情况下长度是没有限制的，除非给它一个capacity。因此Tomcat给了它一个capacity，TaskQueue的构造函数中有个整型的参数capacity，TaskQueue将capacity传给父类LinkedBlockingQueue的构造函数。

public class TaskQueue extends LinkedBlockingQueue<Runnable> {

public TaskQueue(int capacity) {
super(capacity);
}
...
}

这个capacity参数是通过Tomcat的maxQueueSize参数来设置的，但问题是默认情况下maxQueueSize的值是Integer.MAX_VALUE，等于没有限制，这样就带来一个问题：当前线程数达到核心线程数之后，再来任务的话线程池会把任务添加到任务队列，并且总是会成功，这样永远不会有机会创建新线程了。

为了解决这个问题，TaskQueue重写了LinkedBlockingQueue的offer方法，在合适的时机返回false，返回false表示任务添加失败，这时线程池会创建新的线程。那什么是合适的时机呢？请看下面offer方法的核心源码：

public class TaskQueue extends LinkedBlockingQueue<Runnable> {

...
@Override
//线程池调用任务队列的方法时，当前线程数肯定已经大于核心线程数了
public boolean offer(Runnable o) {

//如果线程数已经到了最大值，不能创建新线程了，只能把任务添加到任务队列。
if (parent.getPoolSize() == parent.getMaximumPoolSize())
return super.offer(o);

//执行到这里，表明当前线程数大于核心线程数，并且小于最大线程数。
//表明是可以创建新线程的，那到底要不要创建呢？分两种情况：

//1. 如果已提交的任务数小于当前线程数，表示还有空闲线程，无需创建新线程
if (parent.getSubmittedCount()<=(parent.getPoolSize()))
return super.offer(o);

//2. 如果已提交的任务数大于当前线程数，线程不够用了，返回false去创建新线程
if (parent.getPoolSize()<parent.getMaximumPoolSize())
return false;

//默认情况下总是把任务添加到任务队列
return super.offer(o);
}

}

从上面的代码我们看到，只有当前线程数大于核心线程数、小于最大线程数，并且已提交的任务个数大于当前线程数时，也就是说线程不够用了，但是线程数又没达到极限，才会去创建新的线程。这就是为什么Tomcat需要维护已提交任务数这个变量，它的目的就是在任务队列的长度无限制的情况下，让线程池有机会创建新的线程。

当然默认情况下Tomcat的任务队列是没有限制的，你可以通过设置maxQueueSize参数来限制任务队列的长度。

本期精华

池化的目的是为了避免频繁地创建和销毁对象，减少对系统资源的消耗。Java提供了默认的线程池实现，我们也可以扩展Java原生的线程池来实现定制自己的线程池，Tomcat就是这么做的。Tomcat扩展了Java线程池的核心类ThreadPoolExecutor，并重写了它的execute方法，定制了自己的任务处理流程。同时Tomcat还实现了定制版的任务队列，重写了offer方法，使得在任务队列长度无限制的情况下，线程池仍然有机会创建新的线程。

课后思考

请你再仔细看看Tomcat的定制版任务队列TaskQueue的offer方法，它多次调用了getPoolSize方法，但是这个方法是有锁的，锁会引起线程上下文切换而损耗性能，请问这段代码可以如何优化呢？

不知道今天的内容你消化得如何？如果还有疑问，请大胆的在留言区提问，也欢迎你把你的课后思考和心得记录下来，与我和其他同学一起讨论。如果你觉得今天有所收获，欢迎你把它分享给你的朋友。

精选留言（15）

永光 👍（31） 💬（8）
观察 Tomcat 线程池和 Java 原生线程池的区别，其实就是在第 3 步，Tomcat 在线程总数达到最大数时，不是立即执行拒绝策略，而是再尝试向任务队列添加任务，添加失败后再执行拒绝策略。问题：感觉这两种方式都一样呀，前corePoolSize都是直接创建线程来处理。后续都是先放在队列里面，满了在创建临时线程来处理。 Tomcat线程池，在达到max时再次检测，并尝试插入队列有什么意义呢？我理解再次检测队列也是满的呀？ 2、
2019-06-18

世纪猛男 👍（9） 💬（7）
关于今日的思考题 getPoolSize. 用Volatile去修饰一个变量不可行，因为变更过程，会基于之前的pool size，无法做到原子操作。用atomic 也不合适并发量高的时候会导致大量的更新失败，持续消耗CPU。所以还不如加锁来的痛快。请教老师的想法
2019-06-18

吃饭饭 👍（7） 💬（5）
老师，TaskQueue 重写了 offer 方法的关键是什么？是 TaskQueue(int capacity) ，只是把无界变有界了吗？每台看明白 offer 具体的改变是什么
2019-07-17

迎风劲草 👍（7） 💬（1）
老师，核心线程如果超过keeplive时间，是否也会回收？还有如果我的队列中还有等待执行的runable,这时候kill 进程，时候需要等到所有runable被执行要，进程才结束吗？
2019-06-18

13963865700 👍（4） 💬（2）
老师，您好，请问： 1.Tomcat在默认队列长度无限制的情况下，是不是不会触发拒绝策略，即使线程数达到maxQueueSize也一直把任务放队列中？ 2.这种情况会不会拖垮Tomcat，发生内存溢出？
2019-06-26

-W.LI- 👍（4） 💬（1）
李老师好。我有个问题，原生队列是在队列满时新建线程处理。然后当线程达到最大线程数的时候，不就是队列已满，线程也开满了么。Tomcat补获异常后再往队列里放一次，只是为了做后的努力争取不丢任务么?
2019-06-20

Standly 👍（4） 💬（3）
感觉直接读workers.size()就可以了么，因为创建线程和销毁线程的方法都加锁了，而且是同一把锁，不懂为啥getPoolSize()方法还要额外加锁？
2019-06-18

HARDMAN 👍（3） 💬（1）
请教老师，如果线程池已满，任务队列也满了，那么tomcat会拒绝后面的请求，这时如何进一步增强tomcat的处理能力，让它能同时处理更多请求呢？
2019-07-06

Geek_8eedf1 👍（1） 💬（1）
看明白了😂，老师，学习 Java 线程池有哪些需要注意的点呢？
2019-06-18

yang 👍（0） 💬（1）
结合老师的讲解去看，印象会更深刻，脉络和细节点也会变得清晰，给老师点赞!
2019-08-13

陆离 👍（0） 💬（1）
corePoolSize的有什么设置的策略吗？需要和CPU个数联系起来吗？
2019-06-18

微思 👍（19） 💬（0）
给李老师点赞👍解析得非常到位！
2019-06-19

℡ㄨ和尚ふ 👍（10） 💬（5）
我的理解是：比如核心线程数为4，总线程数为10个。通过execute方法提交个4个任务，消耗了4个核心线程，所以此时的getPoolSise得到的就是4个线程数。当第5个任务调教到线程池中时，因为已经创建了4个核心的线程，此时会尝试放入队列taskQueue中条件1：parent.getPoolSize() == parent.getMaximumPoolSize() -》 4 == 10不成立条件2：parent.getSubmittedCount()<=(parent.getPoolSize()) -》 5 <= 4 不成立条件3：parent.getPoolSize()<parent.getMaximumPoolSize() -》 4 < 10 成立可以理解为此时线程池中只有4个线程，但是任务有5个，如果四个线程统统阻塞在自己的任务上的话，第5个任务是迟迟得不到执行的，也就是说5个任务超出了4个线程的处理能力，而且此时没有超出最大线程数限制，所以这里可以理解为任务队列的容量为0，创建一个新的线程进行处理。此时当前线程数有了5个。当第6个任务进来的时候，如果前5个线程都阻塞在自己的任务上的话，之后的分析过程和前面类似。但是假设5个线程中有一个任务已经执行完毕了，那么此时线程池中的未完成任务数为5，线程数也为5，就表示有一个线程是空闲的，那么 5 <= 5 满足条件2，就将当前第5个任务加入到任务队列当中，由空闲线程从任务队列中取出进行执行。我的理解是taskQueue队列的容量是动态变化的，取决于当前线程池中的空闲的线程数。但是当已创建线程数已经等于最大限制线程数的时候，任务队列就退化成了无界队列，这样来讲的话，默认情况下感觉拒绝策略是没有机会执行的（可以通过设置 maxQueueSize 参数来限制任务队列的长度，这样就可以执行拒绝策略了），不知道理解的对不对
2021-10-16

吴大山 👍（8） 💬（4）
Tomcat 线程池扩展了原生的 ThreadPoolExecutor，通过重写 execute 方法实现了自己的任务处理逻辑： 1. xxx 2. 再来任务的话，就把任务添加到任务队列里让所有的线程去抢，如果队列满了就创建临时线程。 3. xxx 4. xxx 我细看了一下第二步代码：方法定位：org.apache.tomcat.util.threads.TaskQueue#offer 逻辑定位：if (parent.getPoolSize()<parent.getMaximumPoolSize()) return false; 这么看逻辑好像是：再来任务的话，如果线程数少于maximumPoolSize时，都会优先使用线程，而不会入队
2019-10-14

沐 👍（4） 💬（3）
平时开发的Web系统通常都有大量的 IO 操作，比方说查询数据库、查询缓存等等。任务在执行 IO 操作的时候 CPU就空闲了下来，这时如果增加执行任务的线程数而不是把任务暂存在队列中，就可以在单位时间内执行更多的任务，大大提高了任务执行的吞吐量。 Tomcat 使用的线程池就不是 JDK 原生的线程池，而是做了一些改造，当线程数超过 coreThreadCount 之后会优先创建线程，直到线程数到达 maxThreadCount，这样就比较适合于 Web 系统大量 IO 操作的场景了 --摘自《高并发系统40问》
2021-11-01