操作系统第五章:IO设备

操作系统:第五章

这是最后一章了,这和计算机组成原理比较相似。

IO设备基本概念

操作系统作为系统资源的管理者,也需要对外部设备进行管理。

“I/O”就是“输入/输出”(Input/,Output)
I/O设备就是可以将数据输入到计算机,或者可以接收计算机输出数据的外部设备,属于计算机中的硬件部件。

UNIX系统将外部设备抽象为一种特殊的文件,用户可以使用与文件操作相同的方式对外部设备进行操作。

按使用特性分类可以分为

  • 人机交互类外部设备
  • 存储设备
  • 网络通信设备

按传输速率分类

  • 低速设备
  • 中速设备
  • 高速设备

按信息交换单位

  • 块设备
  • 字符设备

IO控制器

I/O设备的机械部件主要用来执行具体I/O操作。
如我们看得见摸得着的鼠标/键盘的按钮;显示器的LED屏;移动硬盘的磁臂、磁盘盘面。
I/O设备的电子部件通常是一块插入主板扩充槽的印刷电路板。

但是CPU无法直接控制I/O设备的机械部件,因此I/O设备还要有一个电子部件作为CPU和I/O设备机械部件之间的“中介”,用于实现CPU对设备的控制,安装在主板上。
这个电子部件就是I/O控制器,又称设备控制器。CPU可控制I/O控制器,又由I/O控制器来控制设备的机械件。

IO控制器的功能是

  • 接收和识别CPU发出的命令
    • 如CPU发来的read/write命令,lI/O控制器中会有相应的控制寄存器来存放命令和参数。
  • 向CPU报告设备状态并中断
    • IO控制器中会有相应的状态控制器,用于记录IO设备的当前状态。
  • 数据交换
    • IO控制器中会设置相应的数据寄存器。输出时,数据寄存器用于暂存CU发来的数据,之后再由控制器传送设备。输入时,数据寄存器用于暂存设备发来的数据,之后CPU从数据寄存器中取走数据
  • 地址识别
    • 类似于内存的地址,为了区分设备控制器中的各个寄存器,也需要给各个寄存器设置一个特定的“地址”。I/O控制器通过CPU提供的“地址”来判断CPU要读/写的是哪个寄存器

image-20260404211133406

IO控制器的组成部分是:

  • 控制器与设备的接口
    • 控制器与设备的接口用于实现控制器与设备之间的通信
  • IO逻辑
    • I/O逻辑负责接收和识别CPU的各种命令(如地址译码),并负责对设备发出命令。
  • CPU与控制器接口
    • 用于实现CPU与控制器之间的通信。CPU通过控制线发出命令:通过地址线指明要操作的设备:通过数据线来取出(输入)数据,或放入(输出)数据

值得注意的小细节:

①一个I/O控制器可能会对应多个设备:
②数据寄存器、控制寄存器、状态寄存器可能有多个(如:每个控制/状态寄存器对应一个具体的设备),且这些寄存器都要有相应的地址,才能方便CPU操作。有的计算机会让这些寄存器占用内存地址的一部分,称为内存映像I/O:另一些计算机则采用I/O专用地址,即寄存器独立编址。

内存映像和寄存器独立编制

image-20260404211600976

IO控制方式

这里和计算机组成原理可能比较像

我们需要注意5点:

  • 完成一次读写的流程
  • CPU干预的频率
  • 数据传送的单位
  • 数据的流向
  • 主要优点和缺点

程序直接控制方式

轮询:CPU发出读命令后不断读取状态寄存器,如果状态为已就绪,就将数据寄存器的内容转移到CPU寄存器,再从CPU寄存器转存到内存当中。

image-20260405103505338

这种方式称为“轮询”。

image-20260405103804492

CPU干预频率:极度频繁。

IO操作开始之前、完成之后需要CPU介入,并且在等待IO完成的过程中CPU需要不断地轮询检查。

数据传送的单位:每次读/写一个字

数据流向:

读操作(数据输入):IO设备→CPU→内存
写操作(数据输出):内存→CPU→IO设备
每个字的读/写都需要CPU的帮助。

主要缺点和主要优点
优点:实现简单。在读/写指令之后,加上实现循环检查的一系列指令即可(因此才称为“程序直接控制方式”)
缺点:CPU和I/O设备只能串行工作,CPU需要一直轮询检查,长期处于“忙等”状态,CPU利用率低。

中断驱动方式

引入中断机制。由于I/O设备速度很慢,因此在CPU发出读/写命令后,可将等待I/O的进程阻塞,先切换到别的进程执行。当I/O完成后,控制器会向CPU发出一个中断信号,CPU检测到中断信号后,会保存当前进程的运行环境信息,转去执行中断处理程序处理该中断。处理中断的过程中,CPU从I/O控制器读一个字的数据传送到cPU寄存器,再写入主存。接着,CPU恢复等待I/O的进程(或其他进程)的运行环境,然后继续执行。

image-20260405105059859

①CPU会在每个指令周期的末尾检查中断:
②中断处理过程中需要保存、恢复进程的运行环境,这个过程是需要一定时间开销的。可见,如果中断发生的频率太高,也会降低系统性能。

CPU干预频率:较低

每次Io操作开始之前、完成之后需要CPU介入。
等待I/O完成的过程中CPU可以切换到别的进程执行。

数据传输单位:每次一个字

数据流向:

读操作(数据输入):I/O设备→CPU→内存
写操作(数据输出):内存→CPU→I/O设备

优点:与“程序直接控制方式”相比,在“中断驱动方式”中,I/O控制器会通过中断信号主动报告I/O己完成,CU不再需要不停地轮询。 CPU和I/O设备可并行工作,CPU利用率得到明显提升。

缺点:每个字在I/O设备与内存之间的传输,都需要经过CPU。而频繁的中断处理会消耗较多的CPU时间。

DMA方式

与“中断驱动方式”相比,DMA方式(Direct Memory Access,直接存储器存取。主要用于块设备的
I/O控制)有这样几个改进:
①数据的传送单位是“块”。不再是一个字、一个字的传送:
②数据的流向是从设备直接放入内存,或者从内存直接到设备。不再需要CPU作为“中间商”。
③仅在传送一个或多个数据块的开始和结束时,才需要CPU干预。

image-20260405105805164

CPU给IO模块发出读命令,随后做其他事。DMA控制器会根据CPU命令参数来完成读写工作,完成后向CPU发送中断信号,CPU再来处理这个中断。

image-20260405110012696

DMA控制器

image-20260405115957112

DR(Data Register,数据寄存器):暂存从设备到内存,或从内存到设备的数据。
MAR(Memory Address Register,内存地址寄存器):在输入时,MAR表示数据应放到内存中的什么位置;输出时MAR表示要输出的数据放在内存中的什么位置。
DC(Data Counter,.数据计数器):表示剩余要读/写的字节数/块数。
CR(Command Register,.命令/状态寄存器):用于存放CPU发来的lI/O命令,或设备的状态信息。

CPU干预频率:极低,仅在传传输一个或者多个数据库的开始和结束时,才需要CPU介入。

数据传送的单位每次读/写一个或多个块(注意:每次读写的只能是连续的多个块,且这些块读入内存后在内存中也必须是连续的)

4.数据的流向(不再需要经过CPU)
读操作(数据输入):IO设备→内存
写操作(数据输出):内存→Io设备

5.主要缺点和主要优点
优点:数据传输以“块”为单位,CPU介入频率进一步降低。数据的传输不再需要先经过CPU再写入内存,数据传输效率进一步增加。CPU和IO设备的并行性得到提升。
缺点:CPU每发出一条I/O指令,只能读/写一个或多个连续的数据块。

如果要读/写多个离散存储的数据块,戍者要将数据分别写到不同的内存区域时,CPU要分别发出多条IO指令,进行多次中断处理才能完成。

通道控制方式

通道:一种硬件,可以理解为是“性能更低的CPU”。通道可以识别并执行一系列通道指令。

通道相对于DMA控制器更智能,但是对于CPU,可以执行的指令很单一,而且通道程序是放在主机内存中的,也就是说通道和CPU一起共享内存。

image-20260405120712341

CPU的干预频率极低,通道会根据CPU的指示执行相应的通道程序,只有完成一组数据块的读/写后才需要发出中断信号,请求CPU干预。

数据传输单位:每次读写一组数据块

数据的流向:

读操作(数据输入):I/O设备→内存
写操作(数据输出):内存→I/O设备

缺点:实现复杂,需要专门的通道硬件支持
优点:CPU、通道、I/O设备可并行工作,资源利用率很高。

image-20260405121430993

IO软件层次结构

image-20260405121808394

每一层会利用其下层提供的服务,实现某些功能,并屏蔽实现的具体细节,向高层提供服务(“封装思想”)

我们来具体看一下每个层的实例。

用户层软件

image-20260405122112110

设备独立性软件

设备独立性软件,又称设备无关性软件。与设备的硬件特性无关的功能几乎都在这一层实现。

  • 向上层提供统一的调用接口(R/W)
  • 设备的保护(访问控制等)
  • 差错处理
  • 设备的分配与回收(设备是临界资源)
  • 数据缓冲区管理(可以通过缓冲技术屏蔽设备之间数据交换单位大小和传输速度的差异)
  • 建立逻辑设备名物理设备名的映射关系;根据设备类型选择调用相应的驱动程序

详细解释一下逻辑设备名和物理设备名

image-20260405122955932

逻辑设备名是给用户看的,比如打印机1,打印机2等

物理设备名 就如物理地址,是给操作系统看的。所以建立二者的映射关系是必要的。

操作系统系统可以采用两种方式管理逻辑设备表(LUT):
第一种方式,整个系统只设置一张LUT,这就意味着所有用户不能使用相同的逻辑设备名,因此这种方式只适用于单用户操作系统。
第二种方式,为每个用户设置一张LUT,各个用户使用的逻辑设备名可以重复,适用于多用户操作系统。系统会在用户登录时为其建立一个用户管理进程,而LUT就存放在用户管理进程的PCB中。适用于多用户系统。

不同厂家的外设的内部电子结构是不同的,所以需要不同的驱动程序。这个驱动程序是由厂家编写的,且一般以独立进程的方式存在。

中断处理程序

当I/O任务完成时,I/O控制器会发送一个中断信号,系统会根
据中断信号类型找到相应的中断处理程序并执行。

中断处理程序的处理流程如下:

image-20260405124353300

所以中断处理程序也需要直接和硬件接触。

总结

image-20260405124453075

输入输出应用程序接口

不同的设备具有不同的特性,不能用统一的系统调用接口来完成所有类型设备的IO需求,所以操作系统必须向上层提供多种IO应用程序接口。

image-20260405132827087

字符设备和块设备我们已经足够熟悉了,重点是网络设备。

网络设备的通信是通过socket协议进行的。

image-20260405132941635

阻塞IO和非阻塞IO

阻塞I/O:应用程序发出I/O系统调,进程需转为阻塞态等待。
eg:字符设备接口一一从键盘读一个字符get
非阻塞I/O:应用程序发出I/O系统调用,系统调用可迅速返回,进程无需阻塞等待。
eg:块设备接口一一往磁盘写数据write

设备驱动程序接口

若各公司开发的设备驱动程序接口不统一,则操作系统很难调用设备驱动程序。

image-20260405133607725

所以需要统一标准的设备驱动程序接口。

image-20260405133640923

厂商必须根据操作系统规定的接口来编写驱动程序。

假脱机技术

image-20260405143114406

脱机技术是早期计算机系统中使用的一种I/O操作方式。它的核心思想是让输入/输出操作在脱离主机(CPU)控制的情况下,由专门的卫星机或外围机独立完成。

“假脱机技术”,又称“SPOOLing技术”是用软件的方式模拟脱机技术。

SPOOLing系统组成如下:

image-20260405143316346

在磁盘上开辟出两个存储区域一一“输入井”和“输出井”

“输入井”模拟脱机输入时的磁带,用于收容/0设备输入的数据

输出井”模拟脱机输出时的磁带,用于收容用户进程输出的数据

输入进程模拟脱机输入时的外围控制机

输出进程模拟脱机输出时的外围控制机

要实现SPOOLing技术,就需要多个进程支持。

在输入进程的控制下,“输入缓冲区”用于暂存从输入设备输入的数据,之后再转存到输入井中

在输出进程的控制下,“输出缓冲区”用于暂存从输出井送来的数据,之后再传送到输出设备上。

看一个共享打印机的应用。

独占式设备一只允许各个进程串行使用的设备。一段时间内只能满足一个进程的请求。

共享设备一一允许多个进程“同时”使用的设备(宏观上同时使用,微观上可能是交替使
用)。可以同时满足多个进程的使用请求。

打印机是独占式设备,但是可以用SPOOLing技术改造成共享设备。

image-20260405144605901

当多个用户进程提出输出打印的请求时,系统会答应它们的请求,但是并不是真正把打印机分配给他们而是由假脱机管理进程为每个进程做两件事:

  • 在磁盘输出井中为进程申请一个空闲缓冲区(也就是说,这个缓冲区是在磁盘上的),并将要打印的数据送入其中:
  • 为用户进程申请一张空白的打印请求表,并将用户的打印请求填入表中(其实就是用来说明用户的打印数据存放位置等信息的),再将该表挂到假脱机文件队列上。

当打印机空闲时,输出进程会从文件队列的队头取出一张打印请求表,并根据表中的要求将要打印的据从输出井传送到输出缓冲区,再输出到打印机进行打印。用这种方式可依次处理完全部的打印任务

虽然系统中只有一个台打印机,但每个进程提出打印请求时,系统都会为在输出井中为其分配一个存储区(相当于分配了一个逻辑设备),使每个用户进程都觉得自己在独占一台打印机,从而实现对打印机的共享。

SPOOLing技术可以把一台物理设备虚拟成逻辑上的多台设备,可将独占式设备改造成共享设备。

未采取假脱机技术,用户进程发现打印机处于忙碌,只能进入阻塞态等待,这会导致时间的浪费。但是引入假脱机技术,用户进程就能够将需要打印的文件交付给输出缓冲区后继续去执行其他的事情。

这就是打印机和打印店的区别,后者有店员来接收并处理进程提交的打印请求。

假脱机技术通过引入磁盘队列作为中间层,实现了用户进程与慢速物理设备的“时间解耦”。用户进程只与高速的磁盘交换数据,从而从对慢速设备的等待中彻底脱离出来,极大地提高了进程的响应速度和整个系统的吞吐率。

设备的分配与回收

设备分配时考虑的因素

  • 设备固有属性
    • 独占设备,共享设备和虚拟设备
  • 设备分配算法
    • 先来先服务等算法
  • 设备分配中的安全性
    • 安全分配方式

安全分配方式:为进程分配一个设备后就将进程阻塞,本次I/O完成后才将进程唤醒。(eg:考虑进程请求打印机打印输出的例子)

一个时段内每个进程只能使用一个设备
优点:破坏了“请求和保持”条件,不会死锁
缺点:对于一个进程来说,CPU和I/O设备只能串行工作。

    • 不安全分配方式

不安全分配方式:进程发出I/O请求后,系统为其分配I/O设备,进程可继续执行,之后还可以发出新的I/O请求。只有某个I/O请求得不到满足时才将进程阻塞。

一个进程可以同时使用多个设备
优点:进程的计算任务和I/O任务可以并行处理,使进程迅速推进。
缺点:有可能发生死锁(死锁避免、死锁的检测和解除)。

静态分配:进程运行前为其分配全部所需资源,运行结束后归还资源。

动态分配方式:进程运行过程中动态申请设备资源

设备分配管理的数据结构

image-20260405151051178

一个通道可控制多个控制器,每个控制器可控制多个设备。

设备控制表(DCT):系统为每个设备配置一张DCT,用于记录设备情况。

image-20260405151700409

注:“进程管理”章节中曾经提到过“系统会根据阻塞原因不同,将进程PCB挂到不同的阻塞队列中”

控制器控制表(COCT):每个设备控制器都会对应一张COCT。操作系统根据COCT的信息对控制器进行操作和管理。

image-20260405152040878

通道控制表(CHCT):每个通道都会对应一张CHCT,根据CHCT对通道进行操作和管理。

image-20260405152223765

系统设备表(SDT):记录了系统中全部设备的情况,每个设备对应一个表目。

image-20260405152325200

设备分配的步骤

  • 根据进程请求的物理设备名查找SDT(注:物理设备名是进程请求分配设备时提供的参数)
  • 根据SDT找到DCT,若设备忙碌则将进程PCB挂到设备等待队列中,不忙碌则将设备分配给进程。
  • 根据DCT找到COCT,若控制器忙碌则将进程PCB挂到控制器等待队列中,不忙碌则将控制器分配
    给进程。
  • 根据COcT找到CHCT,若通道忙碌则将进程PCB挂到通道等待队列中,不忙碌则将通道分配给进程。

缺点很明显:
①用户编程时必须使用“物理设备名”,底层细节对用户不透明,不方便编程
②若换了一个物理设备,则程序无法运行
③若进程请求的物理设备正在忙碌,则即使系统中还有同类型的设备,进程也必须阻塞等待。

改进方法:建立逻辑设备名与物理设备名的映射机制,用户编程时只需提供逻辑设备名。

改进后的步骤如下:

  • 根据进程请求的逻辑设备名查找SDT(注:用户编程时提供的逻辑设备名其实就是“设备类型”)
  • 查找SDT,找到用户进程指定类型的、并且空闲的设备,将其分配给该进程。操作系统在逻辑设
    备表(LUT)中新增一个表项。
  • 根据DCT找到COCT,若控制器忙碌则将进程PCB挂到控制器等待队列中,不忙碌则将控制器分配
    给进程。
  • 根据COCT找到CHCT,若通道忙碌则将进程PCB挂到通道等待队列中,不忙碌则将通道分配给进程。

缓冲区管理

缓冲区是一个存储区域,可以由专门的硬件寄存器组成,也可利用内存作为缓冲区。

使用硬件作为缓冲区的成本较高,容量也较小,一般仅用在对速度要求非常高的场合(如存储器管理中所用的联想寄存器,由于对页表的访问频率极高,因此使用速度很快的联想寄存器来存放页表项的副本)

一般情况下,更多的是利用内存作为缓冲区,“设备独立性软件”的缓冲区管理就是要组织管理好这些缓冲区。

image-20260405153855113

使用缓冲区能够解决高速设备和低速设备之间的矛盾。

单缓冲

假设某用户进程请求某种块设备读入若干块的数据。若采用单缓冲的策略,操作系统会在主存中为其分配一个缓冲区(若题目中没有特别说明,一个缓冲区的大小就是一个块)。

注意:当缓冲区数据非空时,不能往缓冲区充入数据,只能从缓冲区把数据传出;当缓冲区为空时,可以往缓冲区充入数据,但必须把缓冲区充满以后,才能从缓冲区把数据传出。

image-20260406121605608

第二种情况:

image-20260406121934068

双缓冲

假设某用户进程请求某种块设备读入若干块的数据。若采用双缓冲的策略,操作系统会在主存中为其分配两个缓冲区(若题目中没有特别说明,一个缓冲区的大小就是一个块)
双缓冲题目中,假设初始状态为:工作区空,其中一个缓冲区满,另一个缓冲区空
假设T>C+M

image-20260406122347313

第二种情况:

image-20260406122641637

采用双缓冲策略,处理一个数据块的平均耗时为Max(T,C+M)。

使用单/双缓冲在通信时的区别

image-20260406122907422

显然,若两个相互通信的机器只设置单缓冲区,在任一时刻只能实现数据的单向传输。

image-20260406123000752

若两个相互通信的机器设置双缓冲区,则同一时刻可以实现双向的数据传输。

循环缓冲区

将多个大小相等的缓冲区连接成一个循环队列。

注:以下图示中,橙色表示己充满数据的缓冲区,绿色表示空缓冲区。

image-20260406123127321

缓冲池

缓冲池由系统中共用的缓冲区组成。这些缓冲区按使用状况可以分为:空缓冲队列、装满输入数据的缓冲队列(输入队列)、装满输出数据的缓冲队列(输出队列)。

另外,根据一个缓冲区在实际运算中扮演的功能不同,又设置了四种工作缓冲区:用于收容输入数据的工作缓冲区(hin)、用于提取输入数据的工作缓冲区(sin)、用于收容输出数据的工作缓冲区(hout)、用于提取输出数据的工作缓冲区(sout)

image-20260406123254670

image-20260406123312856

分情况使用方法大概如下:

  • 输入进程请求输入数据,取下一块空缓冲区,放入hin充满之后挂到输入队列的队尾。
  • 计算进程想要取得一块输入数据,取下一个输入队列缓冲区放入sin,被取空后放回到空缓冲队列的队尾。
  • 计算进程需要将准备好的数据充入缓冲区,取下一个空缓冲区放入hout,充满后挂到输出队列的队尾
  • 输出进程请求输出数据时,取下一块缓冲区放在sout,输出完毕后为空,挂回到空缓冲队列的队尾。

磁盘

又名机械硬盘,在计算机组成原理中已经有写到这一小节的大部分内容。

在此对重复的部分仅仅贴出PPT,而对计算机组成原理未涉及的部分将展开讲解。

image-20260406124731760

image-20260406124753957

磁盘的物理地址

image-20260406125055356

所以我们可用(柱面号,盘面号,扇区号)来定位任意一个“磁盘块”。在“文件的物理结构”小节中,我们经常提到文件数据存放在外存中的几号块,这个块号就可以转换成(柱面号,盘面号,扇区号)的地址形式。

可根据该地址读取一个“块”
①根据“柱面号”移动磁臂,让磁头指向指定柱面;
②激活指定盘面对应的磁头;
③磁盘旋转的过程中,指定的扇区会从
磁头下面划过,这样就完成了对指定扇
区的读/写。

磁盘的分类

根据磁头可否移动可分为两种磁盘:

  • 活动头磁盘
  • 固定头磁盘

根据盘片是否可以更换可以分为:

  • 可换盘磁盘
  • 固定盘磁盘

磁盘调度算法

这一章和处理机调度是比较像的

磁盘的存取时间在计算机组成原理中已提到。

由于机械硬盘的磁头移动会带来额外的等待时间,所以需要调度算法来减少平均寻道时间。

先到先服务(FCFS)

根据进程请求访问磁盘的先后顺序进行调度。

假设磁头的初始位置是100号磁道,有多个进程先后陆续地请求访问55、58、39、18、90、160、 150、38、184号磁道

按照FCFS的规则,按照请求到达的顺序,磁头需要依次移动到55、58、39、18、90、160、150、 38、184号磁道

image-20260406130931799

磁头总共移动了45+3+19+21+72+70+10+112+146=498个磁道
响应一个请求平均需要移动498/9=55.3个磁道(平均寻找长度)

优点:公平;如果请求访问的磁道比较集中的话,算法性能还算过的去
缺点:如果有大量进程竞争使用磁盘,请求访问的磁道很分散,则FCFS在性能上很差,寻道时间长。趋近于随机调度算法,因为寻道请求是随机提交的。

最短寻找时间优先(SSTF)

SSTF算法会优先处理的磁道是与当前磁头最近的磁道。可以保证每次的寻道时间最短,但是并不能保证总的寻道时间最短。(其实就是贪心算法的思想,只是选择眼前最优,但是总体未必最优)
假设磁头的初始位置是100号磁道,有多个进程先后陆续地请求访问55、58、39、18、90、160、150、38、184号磁道。

image-20260406131221373

磁头总共移动了(100-18)+(184-18)=248个磁道
响应一个请求平均需要移动248/9=27.5个磁道(平均寻找长度)
优点:性能较好,平均寻道时间短
缺点:可能产生“饥饿”现象

产生饥饿的原因在于:磁头在一个小区域内来回来去地移动。

扫描算法(SCAN)

SSTF算法会产生饥饿的原因在于:磁头有可能在一个小区域内来回来去地移动。为了防止这个问题,可以规定,只有磁头移动到最外侧磁道的时候才能往内移动,移动到最内侧磁道的时候才能往外移动。这就是扫描算法(SCAN)的思想。由于磁头移动的方式很像电梯,因此也叫电梯算法。
假设某磁盘的磁道为0~200号,磁头的初始位置是100号磁道,且此时磁头正在往磁道号增大的方向移动,有多个进程先后陆续地请求访问55、58、39、18、90、160、150、38、184号磁道。

image-20260406131559593
磁头总共移动了(200-100)+(200-18)=282个磁道
响应一个请求平均需要移动282/9=31.3个磁道(平均寻找长度)
优点:性能较好,平均寻道时间较短,不会产生饥饿现象
缺点:

  • 只有到达最边上的磁道时才能改变磁头移动方向,事实上,处理了184号的访问请求之后就不需要再往右移动磁头了。
  • SCAN算法对于各个位置磁道的响应频率不平均(如:假设此时磁头正在往右移动,且刚处理过 90号磁道,那么下次处理90号磁道的请求就需要等磁头移动很长一段距离;而响应了184号磁道的请求之后,很快又可以再次响应184号磁道的请求了)

LOOK调度算法

扫描算法(SCAN)中,只有到达最边上的磁道时才能改变磁头移动方向,事实上,处理了184号磁道的访问请求之后就不需要再往右移动磁头了。LOOK调度算法就是为了解决这个问题,如果在磁头移动方向上已经没有别的请求,就可以立即改变磁头移动方向。(边移动边观察,因此叫LOOK)

假设某磁盘的磁道为0~200号,磁头的初始位置是100号磁道,且此时磁头正在往磁道号增大的方向移动,有多个进程先后陆续地请求访问55、58、39、18、90、160、150、38、184号磁道

image-20260406132019078

磁头总共移动了(184-100)+(184-18)=250个磁道
响应一个请求平均需要移动250/9=27.5个磁道(平均寻找长度)
优点:比起SCAN算法来,不需要每次都移动到最外侧或最内侧才改变磁头方向,使寻道时间进一步缩短

循环扫描算法(C-SCAN)

SCAN算法对于各个位置磁道的响应频率不平均,而C-SCAN算法就是为了解决这个问题。规定只有磁头朝某个特定方向移动时才处理磁道访问请求,而返回时直接快速移动至起始端而不处理任何请求
假设某磁盘的磁道为0~200号,磁头的初始位置是100号磁道,且此时磁头正在往磁道号增大的方向移动,有多个进程先后陆续地请求访问55、58、39、18、90、160、150、38、184号磁道。

image-20260406132315314

磁头总共移动了(200-100)+(200-0)+(90-0)=390个磁道

响应一个请求平均需要移动390/9=43.3个磁道(平均寻找长度)

优点:比起SCAN来,对于各个位置磁道的响应频率很平均。

缺点:只有到达最边上的磁道时才能改变磁头移动方向,事实上,处理了184号磁道的访问请求之后就不需要再往右移动磁头了;并且,磁头返回时其实只需要返回到18号磁道即可,不需要返回到最边缘的磁道。另外,比起SCAN算法来,平均寻道时间更长。

C-LOOK调度算法

C-SCAN算法的主要缺点是只有到达最边上的磁道时才能改变磁头移动方向,并且磁头返回时不一定需要返回到最边缘的磁道上。C-LOOK算法就是为了解决这个问题。如果磁头移动的方向上己经没有磁道访问请求了,就可以立即让磁头返回,并且磁头只需要返回到有磁道访问请求的位置即可。

假设某磁盘的磁道为0~200号,磁头的初始位置是100号磁道,且此时磁头正在往磁道号增大的方向移动,有多个进程先后陆续地请求访问55、58、39、18、90、160、150、38、184号磁道

image-20260406132558192

磁头总共移动了(184-100)+(184-18)+(90-18)=322个磁道
响应一个请求平均需要移动322/9=35.8个磁道(平均寻找长度)
优点:比起C-SCAN算法来,不需要每次都移动到最外侧或最内侧才改变磁头方向,使寻道时间进一步缩短。

减少磁盘延迟时间的办法

延迟时间:将目标扇区转到磁头下面所花的时间。

image-20260406133239663

磁头读入一个扇区数据后需要一小段时间处理,遗憾的是,这段处理时间通常没有一个单一、全球统一的专有名词,但在磁盘技术和性能分析的语境中,它最常被描述为 控制器处理时间命令开销,下称命令开销。

这命令开销的阻隔造成了读取完某一扇区后的真空期,意味着连续读取都需要等待磁盘转一圈,这会使得延迟时间特别长。

交替编号

若采用交替编号的策略,即让逻辑上相邻的扇区在物理上有一定的间隔,可以使读取连续的逻辑扇区所需要的延迟时间更小。

image-20260406133531462

读取2号扇区后,因为相隔的6号扇区的存在,磁头能够在挂到3号扇区之前就做好读取数据的准备。

磁盘地址结构的设计

磁盘的物理地址是(柱面号,盘面号,扇区号),为什么不是(盘面号,柱面号,扇区号)?

若物理地址结构是(盘面号,柱面号,扇区号),且需要连续读取物理地址(00,000,000)~(00,001,111)的扇区:

(00,000,000)~(00,000,111)转两圈可读完

之后再读取物理地址相邻的区域,即
(00,001,000)~(00,001,111),需要启动磁头臂,将磁头移动到下一个磁道。


若物理地址结构是(柱面号,盘面号,扇区号),且需要连续读取物理地址(000,00,000)~(000,01,111)的扇区:

(000,00,000)~(000,00,111)由盘面0的磁头读入数据

之后再读取物理地址相邻的区域,即
(000,01,000)~(000,01,111),由于柱面号/磁道号相同,只是盘面号不同,因此不需要移动磁头臂。只需要激活相邻盘面的磁头即可

所以,使用(柱面号,盘面号,扇区号)的地址结构能够有效减少磁头移动消耗的时间。

错位命名

更准确的命名是柱面偏移磁道偏移

在多盘片硬盘中,将不同盘面上同一柱面的各个磁道的起始扇区位置,在圆周方向上故意错开一定角度的技术。

image-20260406135451876

读取完第一个盘面后想读取第二个盘面,会因为命令开销的存在而不得不等待再转一圈才能读取。

通过这种方式:

image-20260406140412950

磁盘管理

三部分:

  • 磁盘初始化
  • 引导块
  • 坏块的管理

磁盘初始化

磁盘初始化:

  • Step1:进行低级格式化(物理格式化),将磁盘的各个磁道划分为扇区。一个扇区通常可分为头、数据区域(如512B大小)、尾三个部分组成。管理扇区所需要的各种数据结构一般
    存放在头、尾两个部分,包括扇区校验码(奇偶校验、CC循环冗余校验码等,校验码用于校验扇区中的数据是否发生错误)
  • Step2:将磁盘分区,每个分区由若干柱面组成(即分为我们熟悉的C盘、D盘、E盘)
  • Step3:进行逻辑格式化,创建文件系统。包括创建文件系统的根目录、初始化存储空间管理所用的数据结构(如位示图、空闲分区表)

image-20260406141513786

引导块

计算机开机时需要进行一系列初始化的工作,这些初始化工作是通过执行初始化程序(自举程序)完成的。

在电路元件中,ROM又名“只读存储器”,出厂写入且不可更改,集成在主板上。

初始化程序程序(自举程序)如果放在ROM中,万一需要更新自举程序、将会很不方便,因为 ROM中的数据无法更改。

所以,将完整的自举程序放在磁盘的启动块(即引导块/启动分区)上,启动块位于磁盘的固定位置。

ROM中只存放很小的“自举装入程序”。开机时计算机先运行“自举装入程序”,通过执行该程序就可找到引导块,并将完整的“自举程序”读入内存,完成初始化。

拥有启动分区的磁盘称为启动磁盘或系统磁盘(C:盘)

坏块的管理

坏块是存储设备中因物理损伤或老化而无法正常读写数据的微小区域。这属于硬件故障,操作系统是无法修复的。应该将坏块标记出来,以免错误地使用到它。

对于简单的磁盘,可以在逻辑格式化时(建立文件系统时)对整个磁盘进行坏块检查,标明哪些扇区是坏扇区,比如:在FAT表上标明。(在这种方式中,坏块对操作系统不透明)

对于复杂的磁盘,磁盘控制器(磁盘设备内部的一个硬件部件)会维护一个坏块链表。

在磁盘出厂前进行低级格式化(物理格式化)时就将坏块链进行初始化会保留一些“备用扇区”,用于替换坏块。这种方案称为扇区备用。且这种处理方式中,坏块对操作系统透明。

固态硬盘SSD

固态硬盘SSD基于闪存技术Flash Memory,属于电可擦除ROM,即EEPROM。

image-20260406143351851

组成

image-20260406144803280

  • 闪存翻译层
    • 负责翻译逻辑块号,找到对应页(Page)
  • 存储介质:
    • 多个闪存芯片(Flash Chip)(黑色的就是)
    • 每个芯片包含多个块(block)
    • 每个块包含多个页(page)

读写

  • 以页(page)为单位读/写,相当于磁盘的”扇区”

注意,逻辑地址的一个块等同于磁盘的一个块,等于固态硬盘的一个页而不是块。

SSD的读写是以页为单位的。

  • 以块(block)为单位”擦除”,擦干净的块,其中的每页都可以写一次,读无限次

如果需要对某块内的某一页进行擦除,就需要把块内待擦除页之外所有页转移到其他块中,并修改闪存翻译层中的地址,再将原块擦除。

  • 支持随机访问,系统给定一个逻辑地址,闪存翻译层可通过电路迅速定位到对应的物理地址
  • 读快、写慢。要写的页如果有数据,则不能写入,需要将块内其他页全部复制到一个新的(擦除过的)块中,再写入新的页

特点

  • SSD读写速度快,随机访问性能高,用电路控制访问位置;机械硬盘通过移动磁臂旋转磁盘控制访问位置,有寻道时间和旋转延迟
  • SSD安静无噪音、耐摔抗震、能耗低、但是造价更贵
  • SSD的一个”块”被擦除次数过多(重复写同一个块)可能会坏掉,而机械硬盘的扇区不会因为写的次数太多而坏掉

磨损均衡技术

因为SSD的一个”块”被擦除次数过多容易报废,所以需要将将“擦除”平均分布在各个块上,以提升使用寿命。

这被称为磨损均衡,两种:

  • 动态磨损均衡:写入数据时,自动选择较新的闪存块。
  • 静态磨损均衡:就算没有数据写入,SSD也会检测并自动进行数据分配,让老的闪存块承担无须写数据的存储任务,同时让新的闪存块腾出空间,承担平常的写操作。

这里就是终点了,谢谢你读到这里。为了你,也为了我。