返回

xv6 启动代码分析

发布时间:2023-09-06 21:17:48 186

当 risc-v 计算机上电时,它自身初始化,并运行一个引导加载器(存储在 ROM 中)。引导加载器装载 xv6 的内核到内存的 ​​0x8000000​​ 开始的存储空间中。然后在 machine mode 下, CPU 从 kernel/entry.s 的 ​​_entry​​​ 处开始执行指令。xv6 启动时页设备是禁用的,所以虚拟内存地址直接映射到物理内存地址。不从 ​​0x0​​​ 开始是因为 ​​0​​​ ~ ​​0x80000000​​ 之间包含 IO 设备。

下面是 kernel/entry.S 的源码清单

# qemu -kernel loads the kernel at 0x80000000
# and causes each CPU to jump there.
# kernel.ld causes the following code to
# be placed at 0x80000000.
.section .text
_entry:
# set up a stack for C.
# stack0 is declared in start.c,
# with a 4096-byte stack per CPU.
# sp = stack0 + (hartid * 4096)
la sp, stack0
li a0, 1024*4
csrr a1, mhartid
addi a1, a1, 1
mul a0, a0, a1
add sp, sp, a0
# jump to start() in start.c
call start
spin:
j spin

xv6 的启动代码在 kernel/entry.S 中,其中声明了一个外部符号:​​stack0​​​ ,把它作为每个 CPU 上的栈的起始地址,然后按照计算公式 ​​sp = stack0 + (hartid * 4096)​​​ ,算出每个 CPU 对应的栈起始地址。首先指令 ​​la sp, stack0​​​ 把 ​​stack0​​​ 的地址读到 sp 寄存器中,指令 ​​li a0, 1024*4​​​ 把 4096 这个立即数读到 a0 寄存器中,指令 ​​csrr a1, mhartid​​​ 把当前 CPU 的 ID 读到 a1 寄存器中,接下来的三条指令按照 ​​sp = stack0 + (hartid * 4096)​​​ 计算公式算出栈地址并且放到 sp 寄存器中,跳转指令 ​​call start​​ 跳到 start.c 中的 start 函数中执行,如果 start 函数返回(一般不会出现)那么进入死循环。

下面是 kernel/start.c 的源码清单

#include "types.h"
#include "param.h"
#include "memlayout.h"
#include "riscv.h"
#include "defs.h"

void main();
void timerinit();

// entry.S needs one stack per CPU.
__attribute__ ((aligned (16))) char stack0[4096 * NCPU];

// a scratch area per CPU for machine-mode timer interrupts.
uint64 timer_scratch[NCPU][5];

// assembly code in kernelvec.S for machine-mode timer interrupt.
extern void timervec();

// entry.S jumps here in machine mode on stack0.
void
start()
{
// set M Previous Privilege mode to Supervisor, for mret.
unsigned long x = r_mstatus();
x &= ~MSTATUS_MPP_MASK;
x |= MSTATUS_MPP_S;
w_mstatus(x);

// set M Exception Program Counter to main, for mret.
// requires gcc -mcmodel=medany
w_mepc((uint64)main);

// disable paging for now.
w_satp(0);

// delegate all interrupts and exceptions to supervisor mode.
w_medeleg(0xffff);
w_mideleg(0xffff);
w_sie(r_sie() | SIE_SEIE | SIE_STIE | SIE_SSIE);

// ask for clock interrupts.
timerinit();

// keep each CPU's hartid in its tp register, for cpuid().
int id = r_mhartid();
w_tp(id);

// switch to supervisor mode and jump to main().
asm volatile("mret");
}

// set up to receive timer interrupts in machine mode,
// which arrive at timervec in kernelvec.S,
// which turns them into software interrupts for
// devintr() in trap.c.
void
timerinit()
{
// each CPU has a separate source of timer interrupts.
int id = r_mhartid();

// ask the CLINT for a timer interrupt.
int interval = 1000000; // cycles; about 1/10th second in qemu.
*(uint64*)CLINT_MTIMECMP(id) = *(uint64*)CLINT_MTIME + interval;

// prepare information in scratch[] for timervec.
// scratch[0..2] : space for timervec to save registers.
// scratch[3] : address of CLINT MTIMECMP register.
// scratch[4] : desired interval (in cycles) between timer interrupts.
uint64 *scratch = &timer_scratch[id][0];
scratch[3] = CLINT_MTIMECMP(id);
scratch[4] = interval;
w_mscratch((uint64)scratch);

// set the machine-mode trap handler.
w_mtvec((uint64)timervec);

// enable machine-mode interrupts.
w_mstatus(r_mstatus() | MSTATUS_MIE);

// enable machine-mode timer interrupts.
w_mie(r_mie() | MIE_MTIE);
}

下面的这行语句定义了 entry.S 中的 stack0 ,它要求 16bit 对齐。

// entry.S needs one stack per CPU.
__attribute__ ((aligned (16))) char stack0[4096 * NCPU];

下面一行定义了共享变量,即每个 CPU 的暂存区用于 machine-mode 定时器中断,它是和 timer 驱动之间传递数据用的。

// a scratch area per CPU for machine-mode timer interrupts.
uint64 timer_scratch[NCPU][5];

下一行声明了 timer 中断处理函数,在接下来的 timer 初始化函数中被用到。

// assembly code in kernelvec.S for machine-mode timer interrupt.
extern void timervec();

接下来是 start 函数,也就是 entry.S 跳转到此处执行。在 start 函数中,下面几行代码使 CPU 进入 supervisor mode 。

// set M Previous Privilege mode to Supervisor, for mret.
unsigned long x = r_mstatus();
x &= ~MSTATUS_MPP_MASK;
x |= MSTATUS_MPP_S;
w_mstatus(x);

接下来的一行代码设置了汇编指令 mret 后 PC 指针跳转的函数,也就是 main 函数。

// set M Exception Program Counter to main, for mret.
// requires gcc -mcmodel=medany
w_mepc((uint64)main);

再接下来,这行代码暂时关闭了分页功能,即直接使用物理地址。

// disable paging for now.
w_satp(0);

接下来的几行代码,将所有中断异常处理设定在给 supervisor mode 下。

// delegate all interrupts and exceptions to supervisor mode.
w_medeleg(0xffff);
w_mideleg(0xffff);
w_sie(r_sie() | SIE_SEIE | SIE_STIE | SIE_SSIE);

接下来的一行代码是请求时钟中断,也就是 clock 的初始化,其具体实现在后面。

// ask for clock interrupts.
timerinit();

接下来的两行代码是将 CPU 的 ID 值保存在寄存器 tp 中。

// keep each CPU's hartid in its tp register, for cpuid().
int id = r_mhartid();
w_tp(id);

最后切换到 supervisor mode 调用返回指令 mret ,并跳转到 ​​main()​​ 函数处执行。

// switch to supervisor mode and jump to main().
asm volatile("mret");

接下来就是 clock 时钟驱动的初始化函数,首先读出 CPU 的 ID 。

// each CPU has a separate source of timer interrupts.
int id = r_mhartid();

再下来的几行是设置中断时间间隔,这里设置的是 0.1 秒。

// ask the CLINT for a timer interrupt.
int interval = 1000000; // cycles; about 1/10th second in qemu.
*(uint64*)CLINT_MTIMECMP(id) = *(uint64*)CLINT_MTIME + interval;

然后是利用刚才在文件开头声明的 timer_scratch 变量,把刚才的 CPU 的 ID 和设置的中断间隔设置到 scratch 寄存器中,以供 clock 驱动使用。

// prepare information in scratch[] for timervec.
// scratch[0..2] : space for timervec to save registers.
// scratch[3] : address of CLINT MTIMECMP register.
// scratch[4] : desired interval (in cycles) between timer interrupts.
uint64 *scratch = &timer_scratch[id][0];
scratch[3] = CLINT_MTIMECMP(id);
scratch[4] = interval;
w_mscratch((uint64)scratch);

最后几行是设置中断处理函数,打开中断。

// set the machine-mode trap handler.
w_mtvec((uint64)timervec);

// enable machine-mode interrupts.
w_mstatus(r_mstatus() | MSTATUS_MIE);

// enable machine-mode timer interrupts.
w_mie(r_mie() | MIE_MTIE);

下面是 kernel/main.c 的源码清单

#include "types.h"
#include "param.h"
#include "memlayout.h"
#include "riscv.h"
#include "defs.h"

volatile static int started = 0;

// start() jumps here in supervisor mode on all CPUs.
void
main()
{
if(cpuid() == 0){
consoleinit();
printfinit();
printf("\n");
printf("xv6 kernel is booting\n");
printf("\n");
kinit(); // physical page allocator
kvminit(); // create kernel page table
kvminithart(); // turn on paging
procinit(); // process table
trapinit(); // trap vectors
trapinithart(); // install kernel trap vector
plicinit(); // set up interrupt controller
plicinithart(); // ask PLIC for device interrupts
binit(); // buffer cache
iinit(); // inode cache
fileinit(); // file table
virtio_disk_init(); // emulated hard disk
userinit(); // first user process
__sync_synchronize();
started = 1;
} else {
while(started == 0)
;
__sync_synchronize();
printf("hart %d starting\n", cpuid());
kvminithart(); // turn on paging
trapinithart(); // install kernel trap vector
plicinithart(); // ask PLIC for device interrupts
}

scheduler();
}

在执行完 start 函数后,开始执行 main 函数。首先,判断当前的 CPU 的 ID 是否为主 CPU 。

如果是主 CPU ,则执行一系列的初始化操作,包括:

  • ​consoleinit();​​ 的控制台初始化;
  • ​printfinit();​​ 的打印模块初始化;
  • ​kinit();​​​ 和 ​​kvminit();​​ 的创建内核页表;
  • ​kvminithart();​​ 的打开分页机制;
  • ​procinit();​​ 的创建进程表;
  • ​trapinit();​​​ 和 ​​trapinithart();​​ 和 ​​plicinit();​​ 的设置系统中断向量和系统中断初始化;
  • ​plicinithart();​​ 的设备中断初始化;
  • ​binit();​​​ 和 ​​iinit();​​ 的磁盘缓冲和磁盘节点的初始化;
  • ​fileinit();​​ 的文件系统的初始化;
  • ​virtio_disk_init();​​ 的磁盘初始化;
  • ​userinit();​​ 创建第一个用户进程,第一个进程执行一个小程序 user/initcode.S ,该程序通过调用 ​​exec​​ 系统调用重新进入内核;
  • ​__sync_synchronize();​​ 是 gcc 提供的原子操作,保证内存访问的操作都是原子操作;
  • ​started = 1;​​ 是设置初始化完成的标志。

如果不是主 CPU ,首先循环等待主 CPU 初始化完成,当主 CPU 初始化完成,则初始化完成标志 started 为 1 ,跳出循环。然后同样是 ​​__sync_synchronize();​​​ gcc 提供的原子操作,保证内存访问的操作都是原子操作。​​kvminithart();​​​ 打开分页功能, ​​trapinithart();​​​ 和 ​​plicinithart();​​ 设置系统和设备的中断初始化。

参考文献:

[1] Russ Cox, Frans Kaashoek, Robert Morris, xv6: A simple, Unix-like teaching operating system, 2020.




特别声明:以上内容(图片及文字)均为互联网收集或者用户上传发布,本站仅提供信息存储服务!如有侵权或有涉及法律问题请联系我们。
举报
评论区(0)
按点赞数排序
用户头像
精选文章
thumb 中国研究员首次曝光美国国安局顶级后门—“方程式组织”
thumb 俄乌线上战争,网络攻击弥漫着数字硝烟
thumb 从网络安全角度了解俄罗斯入侵乌克兰的相关事件时间线
下一篇
Go 语言系列28:互斥锁与读写锁 2023-09-06 17:56:54