Linux核心原理:系统初始化

一、x86架构

(1)计算机的工作模式

  • 计算机最核心的就是CPU(Central Processing Unit,中央处理器),所有设备都围绕他展开
  • CPU 和其他设备连接,要靠一种叫作总线(Bus)的东西
  • 内存将CPU复杂的计算任务中间结果暂时存储下来
  • CPU分为三个部分:运算单元、数据单元和控制单元
    • 运算单元:只管算,例如做加法、做位移等等
    • 数据单元:包括 CPU 内部的缓存和寄存器组,空间很小,但是速度飞快,可以暂时存放数据和运算结果。
    • 控制单元:一个统一的指挥中心,它可以获得下一条指令,然后执行这条指令

  • CPU 的控制单元里面,有一个指令指针寄存器,它里面存放的是下一条指令在内存中的地址。制单元会不停地将代码段的指令拿进来,先放入指令寄存器。
  • CPU总线主要有两类数据
    • 地址数据:内存中数据的位置,称为地址总线(Address Bus),它决定地址访问的广度,位数越多访问速度越快内存管理地址也越广。
    • 真正的数据:数据总线(Data Bus),决定数据处理的位数,位数越多访问速度越快。

(2)x86 开放, 统一, 兼容
8086 CPU组件图:

  • 数据单元:包含 8个(AX、BX、CX、DX、SP、BP、SI、DI) 16位通用寄存器, AX、BX、CX、DX可分为 2个 8位使用(如上图所示H就是High高位,L就是Low低位)。主要用于计算过程中暂存数据。

  • 控制单元:包含 IP(指令指针寄存器) 以及 4个段寄存器 CS DS SS ES

    • CS:代码段寄存器,通过它可以找到代码在内存中的位置
    • DS:数据段寄存器,通过它可以找到数据在内存中的位置
    • SS:栈寄存器,它是特殊的数据结构,秉承先进先出原则(push入栈,pop出栈)
  • 段的具体位置:偏移量

    • CS和DS都会存放一个段的起始地址,
    • 代码段的偏移量在IP寄存器里,数据段的偏移量会在通用寄存器里面
    • CS和DS都是16位,数据偏移量存放在通用寄存器中段地址<<4 + 偏移量 得到地址

(3)32 位处理器

  • 通用寄存器 从 8个 16位拓展为 8个 32位, 保留 16位和 8位使用方式
  • IP 从 16位扩展为 32位, 保持兼容
  • 段寄存器仍为 16位, 由段描述符(表格, 缓存到 CPU 中)存储段的起始地址, 由段寄存器选择其中一项
  • 32位处理器新的段寄存器都改成 32 位的,CS、SS、DS、ES 仍然是 16 位的,但是不再是段的起始地址放在内存的某个地方。这个地方是一个表格,表格中的一项一项是段描述符。段寄存器里面保存的是在这个表格中的哪一项,称为选择子。
  • 32位系统架构下分为两张模式:
    • 实模式:当系统刚刚启动的时候,CPU 是处于实模式的
    • 保护模式:当需要更多内存的时候,遵循一定的规则通过一系列的操作然后切换到保护模式(16位为实模式, 32位为保护模式)

二、从BIOS到bootloader

(1)BIOS引导期
ROM(Read Only Memory只读存储器),RAM(Random Access Memory随机存取存储器)

  • 实模式只有 1MB,每个段最多64K,内存寻址空间(X86)

  • 电脑加电 重置 CS 为 0xFFFF , IP 为 0x0000, 故第一条指令指向0xFFFF0,ROM开始初始化工作代码,BIOS进行初始工作

  • 0xF0000-0xFFFFF 映射到 BIOS 程序(存储在ROM中), BIOS 做以下三件事:

    • 检查硬件
    • 提供基本输入(中断)输出(显存映射)服务
    • 加载 MBR(boot.img) 到内存(0x7c00)

(2)bootloader时期
Grub2,全称 Grand Unified Bootloader Version 2 系统启动工具。可通过配置grub2-mkconfig -o /boot/grub2/gtub.cfg文件来配置启动项

  • MRB: 启动盘第一个扇区(512B, 由 Grub2 写入 boot.img 镜像)
    • boot.img 加载 Grub2 的 core.img 镜像
    • core.img 包括 diskroot.img, lzma_decompress.img, kernel.img 以及其他模块
    • boot.img 先加载运行 diskroot.img, 再由 diskroot.img 加载 core.img 的其他内容
    • diskroot.img 解压运行 lzma_compress.img, 由lzma_compress.img 切换到保护模式

(3)从实模式切换到保护模式

  • 切换到保护模式需要做以下三件事:

    • 启用分段, 辅助进程管理,实现不同进程的切换
    • 启动分页, 辅助内存管理,实现内存块的等分大小块
    • 打开其他地址线
  • lzma_compress.img 解压运行 grub 内核 kernel.img, kernel.img 做以下四件事:

    • 解析 grub.conf 文件(kernel.img 对应的代码是 startup.S 以及一堆 c 文件,在 startup.S 中会调用 grub_main,这是 grub kernel 的主函数。在这个函数里面,grub_load_config() 开始解析,我们上面写的那个 grub.conf 文件里的配置信息。
    • 选择操作系统(如果正常启动,grub_main 最后会调用 grub_command_execute (“normal”, 0, 0),最终会调用grub_normal_execute() 函数。在这个函数里面,grub_show_menu() 会显示出让你选择的那操作系统的列表)
    • 例如选择 linux16, 会先读取内核头部数据进行检查, 检查通过后加载完整系统内核
    • 启动系统内核

小结系统启动流程:
BIOS ---> 引导扇区boot.img ---> diskboot.img ---> lzma_decompress.img ---> kernel.img选择一个操作系统 ---> 启动内核

相关链接:grub2 配置centos7,ubuntu 一 虚拟机安装centos7,ubuntu配置grub2启动

三、内核初始化

(1) 内核初始化, 运行 start_kernel() 函数(位于 init/main.c), 初始化做三件事

  • 创建样板进程, 及各个模块初始化
  • 创建管理/创建用户态进程的进程
  • 创建管理/创建内核态进程的进程

(2)创建样板进程,及各个模块初始化

  • 创建第一个进程, 0号进程. set_task_stack_end_magic(&init_task) and struct task_struct init_task = INIT_TASK(init_task)
  • 初始化中断, trap_init(). 系统调用也是通过发送中断进行, 由 set_system_intr_gate() 完成.
  • 初始化内存管理模块, mm_init()
  • 初始化进程调度模块, sched_init()
  • 初始化基于内存的文件系统 rootfs, vfs_caches_init()
  • VFS(虚拟文件系统)将各种文件系统抽象成统一接口
  • 调用 rest_init() 完成其他初始化工作

(3)创建管理/创建用户态进程的进程, 1号进程

  • rest_init() 通过 kernel_thread(kernel_init,...) 创建 1号进程(工作在用户态).
  • 权限管理
    • x86 提供 4个 Ring 分层权限
    • 操作系统利用: Ring0-内核态(访问核心资源); Ring3-用户态(普通程序)
    • 用户态调用系统调用: 用户态-系统调用-保存寄存器-内核态执行系统调用-恢复寄存器-返回

(4)内核态到用户态

  • 新进程执行 kernel_init 函数, 先运行 ramdisk 的 /init 程序(位于内存中)
  • 首先加载 ELF (Executable and Linkable Format 可执行与可链接格式)
  • 设置用于保存用户态寄存器的结构体
  • 返回进入用户态
  • /init 加载存储设备的驱动
  • ramdisk 上的 /init 会启动文件系统上的 init

(5)创建管理/创建内核态进程的进程, 2号进程

  • rest_init() 通过 kernel_thread(kthreadd,...) 创建 2号进程(工作在内核态).
  • kthreadd 负责所有内核态线程的调度和管理

四、系统调用

glibc 将系统调用封装成更友好的接口
这里解析 glibc 函数如何调用到内核的 open

(1)用户进程调用 open 函数

  • glibc 的 syscal.list 列出 glibc 函数对应的系统调用
  • glibc 的脚本 make_syscall.sh 根据 syscal.list 生成对应的宏定义(函数映射到系统调用)
  • glibc 的 syscal-template.S 使用这些宏, 定义了系统调用的调用方式(也是通过宏)
  • 其中会调用 DO_CALL (也是一个宏), 32位与 64位实现不同

(2)32位系统调用过程

  • 32位 DO_CALL (位于 i386 目录下 sysdep.h)
  • 将调用参数放入寄存器中, 由系统调用名得到系统调用号, 放入 eax
  • 执行 ENTER_KERNEL(一个宏), 对应 int $0x80 触发软中断, 进入内核
  • 调用软中断处理函数 entry_INT80_32(内核启动时, 由 trap_init() 配置)
  • entry_INT80_32 将用户态寄存器存入 pt_regs 中(保存现场以及系统调用参数), 调用 do_syscall_32_iraq_on
  • do_syscall_32_iraq_on 从 pt_regs 中取系统调用号(eax), 从系统调用表得到对应实现函数, 取 pt_regs 中存储的参数, 调用系统调用
  • entry_INT80_32 调用 INTERRUPT_RUTURN(一个宏)对应 iret 指令, 系统调用结果存在 pt_regs 的 eax 位置, 根据 pt_regs 恢复用户态进程

(3)64位系统调用

  • 64位 DO_CALL (位于 x86_64 目录下 sysdep.h)
  • 通过系统调用名得到系统调用号, 存入 rax; 不同中断, 执行 syscall 指令
  • MSR(特殊模块寄存器), 辅助完成某些功能(包括系统调用)
  • trap_init() 会调用 cpu_init->syscall_init 设置该寄存器
  • syscall 从 MSR 寄存器中拿出函数地址进行调用, 即调用 entry_SYSCALL_64
  • entry_SYSCALL_64 先保存用户态寄存器到 pt_regs 中
  • 调用 entry_SYSCALL64_slow_pat->do_syscall_64
  • do_syscall_64 从 rax 取系统调用号, 从系统调用表得到对应实现函数, 取sys_call_table中存储的参数调用系统调用
  • 返回执行 USERGS_SYSRET64(一个宏), 对应执行 swapgs 和 sysretq 指令; 系统调用结果存在 pt_regs 的 ax 位置, 根据 pt_regs 恢复用户态进程

(4)系统调用表 sys_call_table

  • 32位 定义在 arch/x86/entry/syscalls/syscall_32.tbl
  • 64位 定义在 arch/x86/entry/syscalls/syscall_64.tbl
  • syscall_*.tbl 内容包括: 系统调用号, 系统调用名, 内核实现函数名(以 sys 开头)
  • 内核实现函数的声明: include/linux/syscall.h
  • 内核实现函数的实现: 某个 .c 文件, 例如 sys_open 的实现在 fs/open.c
    • .c 文件中, 以宏的方式替代函数名, 用多层宏构建函数头
  • 编译过程中, 通过 syscall*.tbl 生成 unistd*.h 文件
    • unistd_*.h 包含系统调用与实现函数的对应关系
  • syscall*.h include 了 unistd*.h 头文件, 并定义了系统调用表(数组)
|| 版权声明
作者:废权
链接:https://blog.yjscloud.com/archives/114
声明:如无特别声明本文即为原创文章仅代表个人观点,版权归《废权的博客》所有,欢迎转载,转载请保留原文链接。
THE END
分享
二维码
Linux核心原理:系统初始化
一、x86架构 (1)计算机的工作模式 计算机最核心的就是CPU(Central Processing Unit,中央处理器),所有设备都围绕他展开 CPU 和其他设备连接,要靠一种叫……
<<上一篇
下一篇>>
文章目录
关闭
目 录