当 risc-v 计算机上电时,它自身初始化,并运行一个引导加载器(存储在 ROM 中)。引导加载器装载 xv6 的内核到内存的 0x8000000
开始的存储空间中。然后在 machine mode 下, CPU 从 kernel/entry.s 的 _entry
处开始执行指令。xv6 启动时页设备是禁用的,所以虚拟内存地址直接映射到物理内存地址。不从 0x0
开始是因为 0
~ 0x80000000
之间包含 IO 设备。
下面是 kernel/entry.S 的源码清单
# qemu -kernel loads the kernel at 0x80000000
# and causes each CPU to jump there.
# kernel.ld causes the following code to
# be placed at 0x80000000.
.section .text
_entry:
# set up a stack for C.
# stack0 is declared in start.c,
# with a 4096-byte stack per CPU.
# sp = stack0 + (hartid * 4096)
la sp, stack0
li a0, 1024*4
csrr a1, mhartid
addi a1, a1, 1
mul a0, a0, a1
add sp, sp, a0
# jump to start() in start.c
call start
spin:
j spin
xv6 的启动代码在 kernel/entry.S 中,其中声明了一个外部符号:stack0
,把它作为每个 CPU 上的栈的起始地址,然后按照计算公式 sp = stack0 + (hartid * 4096)
,算出每个 CPU 对应的栈起始地址。首先指令 la sp, stack0
把 stack0
的地址读到 sp 寄存器中,指令 li a0, 1024*4
把 4096 这个立即数读到 a0 寄存器中,指令 csrr a1, mhartid
把当前 CPU 的 ID 读到 a1 寄存器中,接下来的三条指令按照 sp = stack0 + (hartid * 4096)
计算公式算出栈地址并且放到 sp 寄存器中,跳转指令 call start
跳到 start.c 中的 start 函数中执行,如果 start 函数返回(一般不会出现)那么进入死循环。
下面是 kernel/start.c 的源码清单
#include "types.h"
#include "param.h"
#include "memlayout.h"
#include "riscv.h"
#include "defs.h"
void main();
void timerinit();
// entry.S needs one stack per CPU.
__attribute__ ((aligned (16))) char stack0[4096 * NCPU];
// a scratch area per CPU for machine-mode timer interrupts.
uint64 timer_scratch[NCPU][5];
// assembly code in kernelvec.S for machine-mode timer interrupt.
extern void timervec();
// entry.S jumps here in machine mode on stack0.
void
start()
{
// set M Previous Privilege mode to Supervisor, for mret.
unsigned long x = r_mstatus();
x &= ~MSTATUS_MPP_MASK;
x |= MSTATUS_MPP_S;
w_mstatus(x);
// set M Exception Program Counter to main, for mret.
// requires gcc -mcmodel=medany
w_mepc((uint64)main);
// disable paging for now.
w_satp(0);
// delegate all interrupts and exceptions to supervisor mode.
w_medeleg(0xffff);
w_mideleg(0xffff);
w_sie(r_sie() | SIE_SEIE | SIE_STIE | SIE_SSIE);
// ask for clock interrupts.
timerinit();
// keep each CPU's hartid in its tp register, for cpuid().
int id = r_mhartid();
w_tp(id);
// switch to supervisor mode and jump to main().
asm volatile("mret");
}
// set up to receive timer interrupts in machine mode,
// which arrive at timervec in kernelvec.S,
// which turns them into software interrupts for
// devintr() in trap.c.
void
timerinit()
{
// each CPU has a separate source of timer interrupts.
int id = r_mhartid();
// ask the CLINT for a timer interrupt.
int interval = 1000000; // cycles; about 1/10th second in qemu.
*(uint64*)CLINT_MTIMECMP(id) = *(uint64*)CLINT_MTIME + interval;
// prepare information in scratch[] for timervec.
// scratch[0..2] : space for timervec to save registers.
// scratch[3] : address of CLINT MTIMECMP register.
// scratch[4] : desired interval (in cycles) between timer interrupts.
uint64 *scratch = &timer_scratch[id][0];
scratch[3] = CLINT_MTIMECMP(id);
scratch[4] = interval;
w_mscratch((uint64)scratch);
// set the machine-mode trap handler.
w_mtvec((uint64)timervec);
// enable machine-mode interrupts.
w_mstatus(r_mstatus() | MSTATUS_MIE);
// enable machine-mode timer interrupts.
w_mie(r_mie() | MIE_MTIE);
}
下面的这行语句定义了 entry.S 中的 stack0 ,它要求 16bit 对齐。
// entry.S needs one stack per CPU.
__attribute__ ((aligned (16))) char stack0[4096 * NCPU];
下面一行定义了共享变量,即每个 CPU 的暂存区用于 machine-mode 定时器中断,它是和 timer 驱动之间传递数据用的。
// a scratch area per CPU for machine-mode timer interrupts.
uint64 timer_scratch[NCPU][5];
下一行声明了 timer 中断处理函数,在接下来的 timer 初始化函数中被用到。
// assembly code in kernelvec.S for machine-mode timer interrupt.
extern void timervec();
接下来是 start 函数,也就是 entry.S 跳转到此处执行。在 start 函数中,下面几行代码使 CPU 进入 supervisor mode 。
// set M Previous Privilege mode to Supervisor, for mret.
unsigned long x = r_mstatus();
x &= ~MSTATUS_MPP_MASK;
x |= MSTATUS_MPP_S;
w_mstatus(x);
接下来的一行代码设置了汇编指令 mret 后 PC 指针跳转的函数,也就是 main 函数。
// set M Exception Program Counter to main, for mret.
// requires gcc -mcmodel=medany
w_mepc((uint64)main);
再接下来,这行代码暂时关闭了分页功能,即直接使用物理地址。
// disable paging for now.
w_satp(0);
接下来的几行代码,将所有中断异常处理设定在给 supervisor mode 下。
// delegate all interrupts and exceptions to supervisor mode.
w_medeleg(0xffff);
w_mideleg(0xffff);
w_sie(r_sie() | SIE_SEIE | SIE_STIE | SIE_SSIE);
接下来的一行代码是请求时钟中断,也就是 clock 的初始化,其具体实现在后面。
// ask for clock interrupts.
timerinit();
接下来的两行代码是将 CPU 的 ID 值保存在寄存器 tp 中。
// keep each CPU's hartid in its tp register, for cpuid().
int id = r_mhartid();
w_tp(id);
最后切换到 supervisor mode 调用返回指令 mret ,并跳转到 main()
函数处执行。
// switch to supervisor mode and jump to main().
asm volatile("mret");
接下来就是 clock 时钟驱动的初始化函数,首先读出 CPU 的 ID 。
// each CPU has a separate source of timer interrupts.
int id = r_mhartid();
再下来的几行是设置中断时间间隔,这里设置的是 0.1 秒。
// ask the CLINT for a timer interrupt.
int interval = 1000000; // cycles; about 1/10th second in qemu.
*(uint64*)CLINT_MTIMECMP(id) = *(uint64*)CLINT_MTIME + interval;
然后是利用刚才在文件开头声明的 timer_scratch 变量,把刚才的 CPU 的 ID 和设置的中断间隔设置到 scratch 寄存器中,以供 clock 驱动使用。
// prepare information in scratch[] for timervec.
// scratch[0..2] : space for timervec to save registers.
// scratch[3] : address of CLINT MTIMECMP register.
// scratch[4] : desired interval (in cycles) between timer interrupts.
uint64 *scratch = &timer_scratch[id][0];
scratch[3] = CLINT_MTIMECMP(id);
scratch[4] = interval;
w_mscratch((uint64)scratch);
最后几行是设置中断处理函数,打开中断。
// set the machine-mode trap handler.
w_mtvec((uint64)timervec);
// enable machine-mode interrupts.
w_mstatus(r_mstatus() | MSTATUS_MIE);
// enable machine-mode timer interrupts.
w_mie(r_mie() | MIE_MTIE);
下面是 kernel/main.c 的源码清单
#include "types.h"
#include "param.h"
#include "memlayout.h"
#include "riscv.h"
#include "defs.h"
volatile static int started = 0;
// start() jumps here in supervisor mode on all CPUs.
void
main()
{
if(cpuid() == 0){
consoleinit();
printfinit();
printf("\n");
printf("xv6 kernel is booting\n");
printf("\n");
kinit(); // physical page allocator
kvminit(); // create kernel page table
kvminithart(); // turn on paging
procinit(); // process table
trapinit(); // trap vectors
trapinithart(); // install kernel trap vector
plicinit(); // set up interrupt controller
plicinithart(); // ask PLIC for device interrupts
binit(); // buffer cache
iinit(); // inode cache
fileinit(); // file table
virtio_disk_init(); // emulated hard disk
userinit(); // first user process
__sync_synchronize();
started = 1;
} else {
while(started == 0)
;
__sync_synchronize();
printf("hart %d starting\n", cpuid());
kvminithart(); // turn on paging
trapinithart(); // install kernel trap vector
plicinithart(); // ask PLIC for device interrupts
}
scheduler();
}
在执行完 start 函数后,开始执行 main 函数。首先,判断当前的 CPU 的 ID 是否为主 CPU 。
如果是主 CPU ,则执行一系列的初始化操作,包括:
-
consoleinit();
的控制台初始化; -
printfinit();
的打印模块初始化; -
kinit();
和 kvminit();
的创建内核页表; -
kvminithart();
的打开分页机制; -
procinit();
的创建进程表; -
trapinit();
和 trapinithart();
和 plicinit();
的设置系统中断向量和系统中断初始化; -
plicinithart();
的设备中断初始化; -
binit();
和 iinit();
的磁盘缓冲和磁盘节点的初始化; -
fileinit();
的文件系统的初始化; -
virtio_disk_init();
的磁盘初始化; -
userinit();
创建第一个用户进程,第一个进程执行一个小程序 user/initcode.S ,该程序通过调用 exec
系统调用重新进入内核; -
__sync_synchronize();
是 gcc 提供的原子操作,保证内存访问的操作都是原子操作; -
started = 1;
是设置初始化完成的标志。
如果不是主 CPU ,首先循环等待主 CPU 初始化完成,当主 CPU 初始化完成,则初始化完成标志 started 为 1 ,跳出循环。然后同样是 __sync_synchronize();
gcc 提供的原子操作,保证内存访问的操作都是原子操作。kvminithart();
打开分页功能, trapinithart();
和 plicinithart();
设置系统和设备的中断初始化。
参考文献:
[1] Russ Cox, Frans Kaashoek, Robert Morris, xv6: A simple, Unix-like teaching operating system, 2020.