Bootloader编写简明教程

zjchabblbq
2 ℃
2020-05-18

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

第一部分：基本功能流程CPU上电后会从IO空间的某地址取第一条指令。但此时：PLL没有启动，CPU工作频率为外部输入晶振频率，非常低；CPU工作模式、中断设置等不确定；存储空间的各个BANK（包括内存）都没有驱动，内存不能使用。在这种情况下必须在第一条指令处做一些初始化工作，这段初始化程序与操作系统独立分开，称之为bootloader。实际上，很少有必要自己写一个Bootloader，因为U-Boot已经强大到能够满足各种需要。但是强大必然复杂，一个初学者想要分析U-Boot的源代码，还是有些难度的。出于学习的目的，我写了这个史上最简单的启动加载器，它只包含最基本的功能，却囊括了一个嵌入式Bootloader应该有的核心和精华。我把这个启动加载器命名为S-Boot，是SimpleBootloader的缩写，亦可进一步简称为SB。使用的实验环境为OK2440开发板，板上处理器为S3C2440A，有64M内存，Nand存储器为K9F1208，64M。网口芯片为CS8900A。我们要实现的功能是：从串口下载Linux内核映像到RAM；从网口下载Linux内核映像到RAM；从RAM启动内核挂载NFS根文件系统。1.第一阶段的汇编代码：start.S一个嵌入式Bootloader最初始部分的代码几乎必须是用汇编语言写成的，因为开发板刚上电后没有准备好C程序运行环境，比如堆栈指针SP没有指到正确的位置。汇编代码应该完成最原始的硬件设备初始化，并准备好C运行环境，这样后面的功能就可以用C语言来写了。对我们的S-Boot来说，上电后的起始运行代码是start/start.S。.text.global_start_start:bReset;0x00:发生复位异常时从地址零处开始运行bHandleUndef;0x04:未定义指令中止模式的向量地址bHandleSWI;0x08:管理模式的向量地址，通过SWI指令进入此模式bHandlePrefetchAbort;0x0C:指令预取终止导致的异常的向量地址bHandleDataAbort;0x10:数据访问终止导致的异常的向量地址bHandleNotUsed;0x14:保留bHandleIRQ;0x18:中断模式的向量地址bHandleFIQ;0x1C:快中断模式的向量地址这里，汇编指示符.text表明以下内容属于代码段，.global_start指明_start是全局可访问的符号。按照ARM920T的规定，从地址0x00到0x1C放置异常向量表，向量表每个条目占四个字节，正好可以放置一条跳转指令，跳转到相应异常的服务程序中去。在S-Boot中没有使用中断，所以除Reset异常外，其它异常的服务程序都可简单地写个死循环。Reset异常是系统上电后自动触发的，所以我们的代码都写在Reset的服务程序里面。实际上，异常向量表不一定非要位于地址0x00处，CP15协处理器中的c1寄存器的第13位用来控制异常向量表的起始地址。该位为0时，异常向量表位于低地址0x00处；该位为1时，异常向量表位于高地址0xFFFF0000处。我们没有必要改变这个位的值，使用默认的低地址就行了。Reset:mrsr0,cpsr;setcputoSVC32modebicr0,r0,#0x1Forrr0,r0,#0xD3msrcpsr,r0;cpsr=11x10011,IRQ/FIQdisabled代码最初始的任务是设置CPU工作在SVC32模式，关闭所有中断，禁用看门狗。实际上，即使不设置工作模式，CPU在复位之后将自动工作在管理模式。在整个S-Boot运行期间，我们没有使用中断，也没有改变CPU工作模式，它将一直工作在SVC32模式。MMU、ICache、DCache的打开和关闭都是由CP15协处理器的c1寄存器控制的。实际上在复位之后这三者都是自动关闭的，所以省略了关闭它们的代码。S3C2440A的PSR寄存器（ProgramStatusReguster）中每个Bit位的含义如图1所示。Bit4~Bit0为模式位，用来设置CPU工作模式，现在只要知道M[4:0]=10011表示SVC32模式就行了。Bit5为状态位，T=0表示工作在ARM状态，T=1表示工作在Thumb状态，默认为0，不需要改变。Bit6为快速中断禁止位，F=1为禁止快速中断，F=0为使能快速中断。Bit7为中断禁止位，I=1为禁止中断，F=0为使能中断。其它Bit位暂时可以不必理会。mrs和msr是在PSR寄存器和其它寄存器间传递数据的指令。如：mrsr0,cpsr把cpsr的值传送到r0中，msrcpsr,r0把r0的值传送到cpsr中。bic是位清零（BitClear）指令，bicr0,r0,#0x1F意思是把r0的Bit[4:0]位清零（由0x1F指示），然后把结果写入r0中。orr是按位求或指令，orrr0,r0,#0xD3表示把r0的Bit7,Bit6,Bit4,Bit1,Bit0置为1，其它位保持不变。执行完上述操作后，cpsr中的I=1,F=1,T保持不变（默认为0），M[4:0]=10011，意思是禁止IRQ，禁止FIQ，工作在ARM状态，工作在SVC32模式。ldrr0,=0x53000000movr1,#0x0strr1,[r0];disablewatchdog禁用看门狗更简单，因为WTCON寄存器的地址为0x53000000，直接向该寄存器写0即可。到目前为止，CPU工作在外接晶振12MHz频率之下。使用以下代码设置PLL，提升工作频率。ldrr0,=0x4C000014@CLKDIVNregistermovr1,#0x05@FCLK:HCLK:PCLK=1:4:8strr1,[r0]mrcp15,0,r0,c1,c0,0@ifHDIVNNot0,mustasynchronousbusmodeorrr0,r0,#0xC0000000@seeS3C2440AmanualP7-9mcrp15,0,r0,c1,c0,0ldrr0,=0x4C000004@MPLLCONregisterldrr1,=0x0005C011@((9212)|(14)|(1))strr1,[r0]@FCLKis400MHz!最后的结果是，FCLK=400MHz，HCLK=100MHz，PCLK=50MHz。;SDRAMInitmovr1,#0x48000000;MEM_CTL_BASEadrlr2,mem_cfg_valaddr3,r1,#521:ldrr4,[r2],#4;读取设置值，并让r2加4strr4,[r1],#4;将此值写入寄存器，并让r1加4cmpr1,r3;判断是否设置完所有13个寄存器bne1b;若没有写成，继续设置存储控制器。ldrsp,=0x32FFF000;设置堆栈blnand_init;初始化NANDFlash;nand_read_ll函数需要3个参数：ldrr0,=0x33000000;目标地址=0x30000000，SDRAM的起始地址movr1,#0;2.源地址=0，S-Boot代码都存在NAND地址0开始处movr2,#102400;3.复制长度=102400(bytes)blnand_read;调用C函数nand_readldrlr,=halt_loop;设置返回地址ldrpc,=main;b指令和bl指令只能前后跳转32M的范围，故使用向pc赋值的方法进行跳转halt_loop:bhalt_loop这里把所有的代码从Nand拷贝到RAM中，然后跳转到main函数去执行。此后程序便在RAM中运行了。但是到目前为止，前面的程序都是在SteppingStone里运行的。所谓SteppingStone，是指在S3C2440A的内部的4KB的RAM缓存，它总是映射到地址0x00处。硬件加电后会自动将NandFlash中的前4KB的数据拷贝到SteppingStone中，然后从地址0x00处开始运行。如果代码足够小（小于4KB）的话，那只在SteppingStone中运行，加载Linux内核到内存即可。但通常代码肯定会大于4KB。所以Bootloader一般分为两部分，Stage1的代码在SteppingStone中运行，它会把Stage2的代码拷贝到RAM中，并跳转到RAM中执行；Stage2的代码在RAM中执行，它可以完成加载内核及其它任何复杂的功能。因为Stage2的起始位置不好确定，为了方便，我们把所有的代码都拷贝到RAM中了。C函数nand_read有三个参数，第一个参数为目的地起始地址，第二个参数为源起始地址，第三个参数为要复制的数据长度，以字节为单位。根据ATPCS函数调用规则，三个参数分别用寄存器r0，r1，r2来传递。我们在内存的0x33000000处存放Bootloader，复制长度根据编译生成的S-Boot.bin映像文件大小，向上取512字节的整数倍。这里先来规划一下内存空间的分配。RAM的地址范围是从0x30000000到0x34000000共64MByte。把S-Boot和Kernel放在高地址处，S-Boot从0x33000000开始，预留8MByte的空间，内核从0x33800000开始，可供使用的空间也是8MByte。因栈空间是向下生长的，我们在S-Boot下面预留4096Byte的空闲区域，然后向下为栈空间，故栈指针SP初始化为0x32FFF000。其实留不留空闲区域是无所谓的，这里只是为了把二者更明显地区分开。我们只设置SVC模式下的SP，不使用CPU的其它工作模式，所以也没必要设置其它模式下的栈指针。另外，程序中不使用动态内存分配，故而也不必分配堆空间。2.nand读操作在编译连接时，我们把上述start.S代码放在生成的二进制映像文件的最开始位置，因而也被烧写到NandFlash的最起始位置，因而会被自动拷贝到SteppingStone里运行。start.S要完成的任务之一，是把S-Boot的所有代码从NandFlash拷贝到内存中，这里需要对NAND的读操作，因此对NAND的初始化和读操作要在第一阶段写好。以开发板上使用的K9F1208为例，每个页（page）为512Byte数据和16Byte校验，每个块（Block）为32个页，即16KByte数据和512Byte校验。NandFlash只用8根线与CPU的DATA0-7连接，位宽为8位，不管是数据、地址或控制字都通过这8根线传递，如果读写数据的话每次只能传输一个字节数据。NandFlash的操作通过NFCONF、NFCMD、NFADDR、NFDATA、NFSTAT和NFECC六个寄存器来完成。在S3C2440A数据手册第218页可以看到读写NandFlash的操作时序：1.通过NFCONF寄存器配置NandFlash；2.写NandFlash命令到NFCMD寄存器；3.写NandFlash地址到NFADDR寄存器；4.在读写数据时，通过NFSTAT寄存器获得NandFlash的状态信息。应该在读操作前或写操作后检查R/nB信号（Ready/Busy信号）。初始化NANDFlash：S3C2440的NFCONF寄存器用来设置时序参数TACLS、TWRPH0、TWRPH1，设置数据位宽；还有一些只读位。TACLS、TWRPH0、TWRPH1这三个参数控制的是NandFlash信号线CLE/ALE与写控制信号nWE的时序关系。注意，寄存器值转换成实际的时钟周期值时，TACLS不需加1，而TWRPH0和TWRPH1需要加1。比如NFCONF寄存器中设置TACLS=1，TWRPH0=3，TWRPH1=0，意思是时序图中TACLS=1个HCLK时钟，TWRPH0=4个HCLK时钟，TWRPH1=1个HCLK时钟。voidnand_init(void){//时间参数设为:TACLS=0TWRPH0=3TWRPH1=0NFCONF=0x300;/*使能NANDFlash控制器,初始化ECC,禁止片选*/NFCONT=(14)|(1