ARM子程序和栈
微处理器中的栈由栈指针指向存储器中的栈顶来实现,当数据项入栈时,栈
指针向上移动,当数据项出栈时,栈指针向下移动。
实现栈时需要做出两个决定:一是当数据项进栈时是向低位地址方向向上生
长(图a和图b)还是向高位地址方向向下生长(图c和图d),另一个决定是
栈指针时指向当前位置栈顶的数据项(图a和图c)还是指向栈顶上的第一个
空白位置(图b和图d)
术语TOS表示栈顶(top of stack)指明了栈中的下一个数据项,用栈来保存子程序调用后的返回地址
下图描述了一个栈指针指向栈顶项的栈。当一个项被进栈,栈指针递减,当
一个项出栈,栈指针递增:
用栈指针SP来定义入栈和出栈操作:
注意栈指针按照4个字节递增或递减,因为存储器按照字节编址,栈的数据项长为一个字(4个字节)。
子程序调用和返回
可以通过先将返回地址入栈,然后跳转到分支目标地址处来实现子程序调用。
该操作在CISC处理器中由JSR target或BSR target指令来实现。ARM没有实现这
一操作,需通过下述指令来实现:
; 假设栈朝低地址方向生长且SP指向栈的下一个数据项 SUB r13,r13,#4 ; 栈指针先递减STR r15,[r13] ; 返回地址入栈B Target ; 跳转到目标地址… ; 在这里返回
一旦执行完子程序中的代码,就会执行子程序返回指令RTS,且PC将恢复到指令BSR Proc_A被取出来之后的那个点。RTS指令的作用是:
RTS: [PC] <- [[Sp]] ; 把栈中的返回地址复制到PC
[SP] <- [SP] + 4 ; 调整栈指针
栈将向上移动4个字节,因为每个地址都是4个字节。ARM不支持基于栈的子
程序返回机制,则代码应写为:
LDR r12,[r13],#+4 ; 取出保存的PC,栈指针后递增
SUB r15,r12,#4 ; 修正PC并将其加载到r15中以返回
注意:必须修改保存的PC,因为它指向实际返回地址之后4字节的位置(由于
ARM的整数流水线),然后将PC加载到r15,强制从子程序中返回。
尽管上面子程序调用的方法可以工作,但有一个更好的使用ARM块移动指令的机制:
STMIA sp!,{r6,lr} ; r6与链接寄存器入栈
... ; 这里是子程序代码
LDMDB sp!,{r6,pc} ; r6出栈并取出PC,返回地址出栈,送到PC以返回