22 热点问题答疑(2):内核如何阻塞与唤醒进程?
在专栏的第三个模块,我们学习了Tomcat连接器组件的设计,其中最重要的是各种I/O模型及其实现。而I/O模型跟操作系统密切相关,要彻底理解这些原理,我们首先需要弄清楚什么是进程和线程,什么是虚拟内存和物理内存,什么是用户空间和内核空间,线程的阻塞到底意味着什么,内核又是如何唤醒用户线程的等等这些问题。可以说掌握这些底层的知识,对于你学习Tomcat和Jetty的原理,乃至其他各种后端架构都至关重要,这些知识可以说是后端开发的“基石”。
在专栏的留言中我也发现很多同学反馈对这些底层的概念很模糊,那今天作为模块的答疑篇,我就来跟你聊聊这些问题。
进程和线程
我们先从Linux的进程谈起,操作系统要运行一个可执行程序,首先要将程序文件加载到内存,然后CPU去读取和执行程序指令,而一个进程就是“一次程序的运行过程”,内核会给每一个进程创建一个名为task_struct
的数据结构,而内核也是一段程序,系统启动时就被加载到内存中了。
进程在运行过程中要访问内存,而物理内存是有限的,比如16GB,那怎么把有限的内存分给不同的进程使用呢?跟CPU的分时共享一样,内存也是共享的,Linux给每个进程虚拟出一块很大的地址空间,比如32位机器上进程的虚拟内存地址空间是4GB,从0x00000000到0xFFFFFFFF。但这4GB并不是真实的物理内存,而是进程访问到了某个虚拟地址,如果这个地址还没有对应的物理内存页,就会产生缺页中断,分配物理内存,MMU(内存管理单元)会将虚拟地址与物理内存页的映射关系保存在页表中,再次访问这个虚拟地址,就能找到相应的物理内存页。每个进程的这4GB虚拟地址空间分布如下图所示:
进程的虚拟地址空间总体分为用户空间和内核空间,低地址上的3GB属于用户空间,高地址的1GB是内核空间,这是基于安全上的考虑,用户程序只能访问用户空间,内核程序可以访问整个进程空间,并且只有内核可以直接访问各种硬件资源,比如磁盘和网卡。那用户程序需要访问这些硬件资源该怎么办呢?答案是通过系统调用,系统调用可以理解为内核实现的函数,比如应用程序要通过网卡接收数据,会调用Socket的read函数:
CPU在执行系统调用的过程中会从用户态切换到内核态,CPU在用户态下执行用户程序,使用的是用户空间的栈,访问用户空间的内存;当CPU切换到内核态后,执行内核代码,使用的是内核空间上的栈。
从上面这张图我们看到,用户空间从低到高依次是代码区、数据区、堆、共享库与mmap内存映射区、栈、环境变量。其中堆向高地址增长,栈向低地址增长。
请注意用户空间上还有一个共享库和mmap映射区,Linux提供了内存映射函数mmap, 它可将文件内容映射到这个内存区域,用户通过读写这段内存,从而实现对文件的读取和修改,无需通过read/write系统调用来读写文件,省去了用户空间和内核空间之间的数据拷贝,Java的MappedByteBuffer就是通过它来实现的;用户程序用到的系统共享库也是通过mmap映射到了这个区域。
我在开始提到的task_struct
结构体本身是分配在内核空间,它的vm_struct
成员变量保存了各内存区域的起始和终止地址,此外task_struct
中还保存了进程的其他信息,比如进程号、打开的文件、创建的Socket以及CPU运行上下文等。
在Linux中,线程是一个轻量级的进程,轻量级说的是线程只是一个CPU调度单元,因此线程有自己的task_struct
结构体和运行栈区,但是线程的其他资源都是跟父进程共用的,比如虚拟地址空间、打开的文件和Socket等。
阻塞与唤醒
我们知道当用户线程发起一个阻塞式的read调用,数据未就绪时,线程就会阻塞,那阻塞具体是如何实现的呢?
Linux内核将线程当作一个进程进行CPU调度,内核维护了一个可运行的进程队列,所有处于TASK_RUNNING
状态的进程都会被放入运行队列中,本质是用双向链表将task_struct
链接起来,排队使用CPU时间片,时间片用完重新调度CPU。所谓调度就是在可运行进程列表中选择一个进程,再从CPU列表中选择一个可用的CPU,将进程的上下文恢复到这个CPU的寄存器中,然后执行进程上下文指定的下一条指令。
而阻塞的本质就是将进程的task_struct
移出运行队列,添加到等待队列,并且将进程的状态的置为TASK_UNINTERRUPTIBLE
或者TASK_INTERRUPTIBLE
,重新触发一次CPU调度让出CPU。
那线程怎么唤醒呢?线程在加入到等待队列的同时向内核注册了一个回调函数,告诉内核我在等待这个Socket上的数据,如果数据到了就唤醒我。这样当网卡接收到数据时,产生硬件中断,内核再通过调用回调函数唤醒进程。唤醒的过程就是将进程的task_struct
从等待队列移到运行队列,并且将task_struct
的状态置为TASK_RUNNING
,这样进程就有机会重新获得CPU时间片。
这个过程中,内核还会将数据从内核空间拷贝到用户空间的堆上。
当read系统调用返回时,CPU又从内核态切换到用户态,继续执行read调用的下一行代码,并且能从用户空间上的Buffer读到数据了。
小结
今天我们谈到了一次Socket read系统调用的过程:首先CPU在用户态执行应用程序的代码,访问进程虚拟地址空间的用户空间;read系统调用时CPU从用户态切换到内核态,执行内核代码,内核检测到Socket上的数据未就绪时,将进程的task_struct
结构体从运行队列中移到等待队列,并触发一次CPU调度,这时进程会让出CPU;当网卡数据到达时,内核将数据从内核空间拷贝到用户空间的Buffer,接着将进程的task_struct
结构体重新移到运行队列,这样进程就有机会重新获得CPU时间片,系统调用返回,CPU又从内核态切换到用户态,访问用户空间的数据。
不知道今天的内容你消化得如何?如果还有疑问,请大胆的在留言区提问,与我和其他同学一起讨论。如果你觉得今天有所收获,欢迎你把它分享给你的朋友。
- 帽子丨影 👍(42) 💬(1)
老师好,既然用户态运行时也会占用cpu,内核态又可以访问整个虚拟空间,为什么不让cpu一直处在内核态呢,这样就没有切换带来损耗了
2019-09-24 - 一塌糊涂 👍(32) 💬(3)
老师问个问题,用户态切换到内核态,使用的是虚拟空间内核地址?这时用户线程会挂起执行内核线程吗?这是两个线程吗?
2019-07-11 - Geek_0quh3e 👍(15) 💬(1)
虚拟内存是一个联系的地址空间,该地址空间由不一定连续的物理内存组成。 这样理解对吗?
2019-07-01 - Liam 👍(15) 💬(1)
如果是通过mmap读数据,流程是怎样的呢? 1 如果没有数据,是否会阻塞? 2 不需要拷贝数据?意思是用户进程可以直接读mmap,不需要拷贝到堆吗?
2019-06-29 - nightmare 👍(12) 💬(1)
老师今天讲了线程和进程,进程和线程都是统一在内核空间建立task_truct,根据代码是否有系统调用在用户态和内核态来做上下文切换,然后还讲了read的系统调用过程以及进程的虚拟内存和物理内存的机制,有一点没明白,是每个进程都会有一个虚拟内核空间吗?然后进程的虚拟内核空间映射到系统管理的内核空间上?
2019-06-30 - 妥协 👍(10) 💬(1)
之前有讲到过,jvm用到的内存空间,在本文中介绍的进程的地址空间划分中,是属于那一部分?
2019-07-01 - 长脖子树 👍(9) 💬(1)
看了作者的文章又去看了 copy-on-write 和 MappedByteBuffer 了解又加深了一层 哈哈
2019-08-16 - 飞翔 👍(8) 💬(2)
用户态和用户空间是啥关系?
2019-06-29 - 迎风劲草 👍(7) 💬(1)
老师,task_struct 具体是什么结构,都存储了什么?
2019-07-01 - brianway 👍(6) 💬(1)
“线程有自己的task_struct结构体和运行栈区,但是线程的其他资源都是跟父进程共用”,这句话怎么理解。线程的task_struct结构体和运行栈区在图中哪个部分? 是从进程的内核空间里面分配出来的,还是用户空间里分配出来的?具体哪个部分的内存?
2019-07-05 - 梁中华 👍(5) 💬(1)
文中混合使用“可运行队列”和“运行队列”,这两者应该是同一个队列吧。另外关于线程唤醒部分我有一个理解,老师看看对否:当前线程因IO等待而进入"阻塞状态(Blocked)",同时进入线程进入等待队列。让IO操作ready后,内核唤醒等待中的线程,线程状态变成"可运行状态(Runnable)",同时该线程进入可运行队列,等待CPU调度后进入运行状态(Running)。
2019-07-10 - -W.LI- 👍(4) 💬(1)
感谢老师,万分感谢。上次有个问题我不明白,老师还帮我查阅源码确认了。李老师,还有http那个老师是最最负责的真的万分感谢。 向老师,我要把计算机组成原理和操作系统自己看一遍看不懂就看两遍。
2019-06-29 - xiaolin777 👍(3) 💬(1)
老师,您说的task_struct是指进程控制块吗?(刚才还没打完就点了保存,以为是保存草稿,没想到直接提交了,后台能删除吗)
2019-08-13 - 学无涯 👍(3) 💬(1)
1、文中开始说:“task_struct中保存了打开的文件、创建的socket以及CPU运行的上下文"。后面又说"线程有自己的task_struct“。那最后说的“和父进程共用的资源:创建的socket。打开的文件等”这些是怎么共享呀,socket和打开的文件都是在task_struct中保存的,线程有自己独立的task_struct,还需要共享吗? 2、task_struct为什么不用数组呀,数组不是更节省空间吗,而且随机访问这个特性也支持CPU随机调度(猜的,从多线程的不确定性感觉应该是随机调度),是考虑到这个数组有可能很大和频繁扩容的问题才采用双向链表吗? 以上问题,请老师指点一下!
2019-08-12 - 蚂蚁内推+v 👍(3) 💬(1)
唤醒时,内核调用的回调函数是指硬件中断程序么
2019-07-06