2023-06-11  阅读(9)
原文作者:奇小葩 原文地址:https://blog.csdn.net/u012489236/category_10946851.html

在操作系统中引入进程的目的,是为了使多个程序能并发执行,以提高资源的利用率和系统的吞吐量,那么在操作系统中再引入线程,则是为了减少程序在并发执行时所付出的时空开销,使OS具有更好的并发行。本小节主要是学习以下内容

  • 什么是线程,为什么要引入线程
  • 与进程相比,线程有哪些特点
  • 用户线程
  • 内核线程

1. 线程的引入

我们以软件生活中,常见的应用为例,我们要编写一个MP4的播放软件,其核心功能模块有以下三个:

202306111303048811.png

  • 磁盘文件中读取MP4数据
  • 对视频数据进行解码
  • 把解码后的视频数据进行播放

对于目前采用进程的方法,我们可以采取两种方案

方案一:单进程的实现方式

202306111303069062.png

方案存在的问题:

  • 播放的视频是否能够连贯
  • 各个函数之间不是并发执行,影响资源的使用效率

方案二:多进程的实现:

202306111303110373.png

202306111303117994.png

存在的问题

  • 进程之间如何通信,如何共享数据
  • 系统开销比较大,创建进程、进程结束、进程切换

对于这三个进程,都是为了完成该软件的某一部分功能,但是功能与功能之间必须并发的执行,当切换进程,需要保存/恢复进程运行环境,还需要切换内存的地址空间,更新块表等开销,所以在进程内部增加了一类实体,这个实体就是线程(Thread),满足以下特性

  • 实体之间可以并发执行
  • 实体之间共享相同的地址空间

我们在回过头去看刚才的例子,其处理过程如下图所示

202306111303141775.png

  • 一个进程可以包含多个线程,不同的线程之间可以执行不同的代码序列,例如,我们的读取视频数据,解码,播放分别为3个线程
  • 引入线程后,线程是CPU调度的基本单位,也就是说现在CPU为各个线程服务
  • 虽然引入了进程,但是进程依然是资源分配的基本单位,从属于统一进程的各个线程共享进程的资源

所以针对以下问题,就需要引入线程的概念

  • 创建进程的开销较大,包括数据、代码、堆、栈等
  • 进程的隔离性过强,进程间交互,可以通过进程间通信IPC,但是开销较大
  • 进程内部无法支持并行

2. 线程的概念

从上面可以看出,线程是进程的一部分,描述指令流执行状态,它是进程中的指令执行流的最小单元,是CPU调度的基本单位。

  • 进程的资源分配 :进程是由一组相关资源构成,包括地址空间(代码段、数据段)、打开的文件等各种资源
  • 线程的处理机调度角色: 线程描述在进程资源环境中的指令流执行状态

202306111303164266.png

从上图可以看出,所以 线程 = 进程 - 共享资源

线程的优点

  • 一个进程可以同时存在多个线程
  • 各个线程之间可以并发执行
  • 各个线程之间可共享地址空间和文件等资源

线程的缺点:

  • 一个线程崩溃,会导致其所属进程的所有线程崩溃

    | 进程|线程| | :-----: | :-----: | | 进程是资源分配单位 | 线程是CPU调度单位 | | 进程拥有一个完整的资源平台 | 线程只独占指令执行流执行的必要资源,如寄存器和栈 | | 进程具有就绪、等待和运行三种基本状态和状态间的转换关系 | 线程具有就绪、等待和运行三种基本状态和状态间的转换关系 |

线程能减小并发执行时间和空间开销

  • 线程创建时间比进程短
  • 线程的终止时间比进程短
  • 同一进程内线程的切换时间比进程短
  • 由于同一进程的各线程间共享内存和文件资源,可不通过内核进行直接通信

3. 线程的三种实现方式

3.1 用户线程

用户线程是完全建立在用户空间的线程库,用户线程的创建、调度、同步和销毁全又库函数在用户空间完成,不需要内核的帮助。因此这种线程是极其低消耗和高效的。

由于早期的操作系统(如早期的unix)只支持进程,不支持线程,但是的线程是由线程库实现的,我们还是以我们上面的播放软件为例

202306111303174557.png

从代码的角度,线程其实就是一段代码逻辑,上述三段代码逻辑可以看成三个“线程”。while循环就是一个最弱智的“线程库”,线程库完成了对于线程管理工作。很多 编程语言都提供了强大的线程库,可以实现线程的创建,调度,销毁等功能。对于用户线程我们需要解释以下问题

  • 线程的管理工作是由谁来完成
  • 线程切换是否需要CPU来完成,由用户态转换到内核态
  • 操作系统是否能意识到用户线程的存在
  • 这种线程的实现方式有什么优点和缺点

首先我们来看看用户线程的概念

用户线程是由应用程序通过线程库实现的,所有的线程管理工作都是由应用程序负责,包括线程的切换工作,也就是说

  • 用户线程中,线程的切换可以在用户态下即可完成,无需操作系统干预
  • 在用户看来,是有多个线程,但是在操作系统内核看来,意识不到线程的存在,所以用户线程,是从用户视角看到的线程

下面我们来看看用户线程的特征

  • 不依赖于操作系统的内核,内核不了解用户线程的存在,可用于不支持线程的多进程操作系统
  • 在用户空间实现的线程机制,每个进程有私有的线程控制块TBC,并且由线程库维护
  • 同一进程内的用户线程切换速度快,无需用户态/内核态切换,线程管理系统的开销小,效率比较高
  • 允许每个进程拥有自己的线程调度算法

用户线程的不足:

  • 线程发起系统调用而阻塞时,则整个进程等待,并发度并不高,多个线程不可在多核处理器上并行运行
  • 不支持基于线程的处理机抢占,除非当前运行线程主动放弃,它所在进程的其他线程无法抢占CPU
  • 只能按进程分配CPU时间片,多个线程进程,每个线程的时间片较少

3.2 内核线程

由内核通过系统调用实现的线程机制,由内核完成线程的创建、终止和管理

202306111303217168.png

  • 内核级线程的管理工作由操作系统内核完成
  • 线程调度、切换等工作都有内核负责,因此内核级线程的切换必须要在内核下才能完成
  • 操作系统会为每个内核级线程建立相应的TCB(Thread Control Block,线程控制块),通过TCB对线程进行管理,内核级线程就是从操作系统内核视角看到的线程
优点 缺点
当一个线程被阻塞,其他的线程还可以继续执行,并发能力强,多线程可以在多核处理器上并发执行 一个用户进程会占用多个内核级线程,线程切换由操作系统内核完成,需要切换到内核态,因此管理的成本高,开销大

3.3 轻量级进程

它是内核支持的用户线程,一个进程可有一个或多个轻量级进程,每个轻量级进程由一个单独的内核线程来支持(Solaris和Linux)

4. 多线程模型

在支持内核级线程的系统上,根据用户级线程和内核级线程的映射关系,可以化为为以下几种多线程模型

一对一模型:

一个用户级线程映射到一个内核级线程,每个用户进程有与用户线程同数据的内核线程

202306111303230249.png

优点 缺点
当一个线程被阻塞后,别的线程还可以继续执行,并发能力强,多线程可以在多核处理器上并发执行 一个用户进程占用多个内核级线程,线程切换由操作系统内核完成,需要切换到内核态,因此管理的称根本较高,开销较大

多对一模型

多个用户级线程映射到一个内核级线程,且一个进程只被分配一个内核级线程

2023061113032460410.png

优点 缺点
用户级线程的切换在用户空间即可完成,不需要切换到内核态,线程的管理开销小,效率高 当一个用户级线程被阻塞,整个进程都会被阻塞,并发度不高,多个线程不可在多核处理机上并行运行

多对多模型:

n个用户级线程映射到m个内核级线程(n >= m),每个用户进程对应m个内核级线程,这种方式克服了多对一模型并发度不高的缺点(一个阻塞全体阻塞),又克服了一对一模型中一个用户进程占用太多内核级线程,开销太大的缺点

2023061113032669311.png

  • 用户级线程是“代码逻辑”的载体
  • 内核级线程是“运行机会“的载体

内核级线程中可以运行任意一个有映射关系的用户级线程代码,只有两个内核级线程中正在运行的代码逻辑都呗阻塞了,这个进程才会被阻塞

5. 总结

本章分析了为什么需要线程,其主要包括,同时也介绍了线程的基本概念和分类

  • 创建进程的开销较大: 包括了数据、代码、堆、栈等
  • 进程的隔离性过强: 进程间的交互,可以通过进程间通信,但是开销过大
  • 进程内部无法支持并行:

Java 面试宝典是大明哥全力打造的 Java 精品面试题,它是一份靠谱、强大、详细、经典的 Java 后端面试宝典。它不仅仅只是一道道面试题,而是一套完整的 Java 知识体系,一套你 Java 知识点的扫盲贴。

它的内容包括:

  • 大厂真题:Java 面试宝典里面的题目都是最近几年的高频的大厂面试真题。
  • 原创内容:Java 面试宝典内容全部都是大明哥原创,内容全面且通俗易懂,回答部分可以直接作为面试回答内容。
  • 持续更新:一次购买,永久有效。大明哥会持续更新 3+ 年,累计更新 1000+,宝典会不断迭代更新,保证最新、最全面。
  • 覆盖全面:本宝典累计更新 1000+,从 Java 入门到 Java 架构的高频面试题,实现 360° 全覆盖。
  • 不止面试:内容包含面试题解析、内容详解、知识扩展,它不仅仅只是一份面试题,更是一套完整的 Java 知识体系。
  • 宝典详情:https://www.yuque.com/chenssy/sike-java/xvlo920axlp7sf4k
  • 宝典总览:https://www.yuque.com/chenssy/sike-java/yogsehzntzgp4ly1
  • 宝典进展:https://www.yuque.com/chenssy/sike-java/en9ned7loo47z5aw

目前 Java 面试宝典累计更新 400+ 道,总字数 42w+。大明哥还在持续更新中,下图是大明哥在 2024-12 月份的更新情况:

想了解详情的小伙伴,扫描下面二维码加大明哥微信【daming091】咨询

同时,大明哥也整理一套目前市面最常见的热点面试题。微信搜[大明哥聊 Java]或扫描下方二维码关注大明哥的原创公众号[大明哥聊 Java] ,回复【面试题】 即可免费领取。

阅读全文