学习 Risc-V 汇编, 使用 gcc -S 命令转换C语言源码成 RISC-V 汇编代码-安全小百科

学习 Risc-V 汇编, 使用 gcc -S 命令转换C语言源码成 RISC-V 汇编代码

图片[1]-学习 Risc-V 汇编, 使用 gcc -S 命令转换C语言源码成 RISC-V 汇编代码-安全小百科
当使用 riscv32-unknown-elf-gcc -S 命令时，会将 C 语言源代码转换成 RISC-V 汇编代码。
以下是一些常用的 RISC-V 汇编指令及其含义，以供参考：

add: 将两个数相加。
addi: 将一个数和一个立即数相加。
sub: 从一个数中减去另一个数。
mul: 将两个数相乘。
div: 将一个数除以另一个数。
rem: 取两个数的余数。
and: 对两个数进行按位与操作。
or: 对两个数进行按位或操作。
xor: 对两个数进行按位异或操作。
sll: 将一个数左移指定的位数。
srl: 将一个数右移指定的位数。
sra: 将一个有符号数右移指定的位数。
slt: 如果第一个数小于第二个数，则将目标寄存器设置为 1，否则设置为 0。
slti: 如果一个数小于一个立即数，则将目标寄存器设置为 1，否则设置为 0。
beq: 如果两个寄存器相等，则跳转到指定的标签。
bne: 如果两个寄存器不相等，则跳转到指定的标签。
blt: 如果第一个寄存器小于第二个寄存器，则跳转到指定的标签。
bge: 如果第一个寄存器大于等于第二个寄存器，则跳转到指定的标签。
j: 无条件跳转到指定的标签。
jal: 跳转到指定的标签，并将返回地址保存到目标寄存器中。
jr: 跳转到目标寄存器所指向的地址。
jalr: 跳转到目标寄存器所指向的地址，并将返回地址保存到指定的寄存器中。
lw: 从内存中加载一个字（32 位）到目标寄存器中。
sw: 将一个字（32 位）存储到内存中。
li: 将一个立即数加载到目标寄存器中。
mv: 将一个寄存器的值复制到另一个寄存器中。
la: 将一个标签的地址加载到目标寄存器中。
auipc: 将 PC 的高 20 位与一个立即数相加，并将结果存储到目标寄存器中。
lui: 将一个立即数的高 20 位加载到目标寄存器中。

void mystrcpy(char *s, char *t)
{
    while (*s++ = *t++)
        ;
}

这是一个简单的 C 语言函数，它的作用是将字符串 t 复制到字符串 s 中，包括字符串末尾的空字符。以下是该函数的汇编代码及其注释：

mystrcpy:
    # 函数 prologue：保存寄存器并分配栈空间
    addi    sp, sp, -16      # 为 s 和 t 分配 8 字节的空间
    sw      ra, 12(sp)       # 保存返回地址
    sw      s0, 8(sp)        # 保存 s0
    sw      s1, 4(sp)        # 保存 s1

    # 函数体
    add     s0, x0, a0       # 将 s 的地址保存到 s0 中
    add     s1, x0, a1       # 将 t 的地址保存到 s1 中
loop:
    lbu     t0, 0(s1)        # 将 t 所指向的字节读入 t0 中
    addi    s1, s1, 1        # 将 t 指针加 1，指向下一个字节
    sb      t0, 0(s0)        # 将 t0写入 s 所指向的地址中，同时将 s 指针加 1，指向下一个字节
    bnez    t0, loop         # 如果 t0 不为 0（即还没有到字符串末尾），则跳转到 loop

    # 函数 epilogue：恢复寄存器并返回
    lw      ra, 12(sp)       # 恢复返回地址
    lw      s0, 8(sp)        # 恢复 s0
    lw      s1, 4(sp)        # 恢复 s1
    addi    sp, sp, 16       # 释放栈空间
    ret                     # 返回

下面是各条指令的注释：

addi sp, sp, -16: 分配 16 字节的栈空间，用于存储返回地址、寄存器和参数。
sw ra, 12(sp): 保存返回地址。
sw s0, 8(sp): 保存寄存器 s0。
sw s1, 4(sp): 保存寄存器 s1。
add s0, x0, a0: 将 s 的地址保存到寄存器 s0 中。
add s1, x0, a1: 将 t 的地址保存到寄存器 s1 中。
loop: 标签，用于循环。
lbu t0, 0(s1): 从 t 所指向的地址读取一个字节，保存到寄存器 t0 中。
addi s1, s1, 1: 将寄存器 s1 中的地址加 1，指向下一个字节。
sb t0, 0(s0): 将寄存器 t0 中的字节写入 s 所指向的地址中，并将寄存器 s0 中的地址加 1，指向下一个字节。
bnez t0, loop: 如果寄存器 t0 中的值不为 0，则跳转到 loop 标签，继续循环。
lw ra, 12(sp): 恢复返回地址。
lw s0, 8(sp): 恢复寄存器 s0。
lw s1, 4(sp): 恢复寄存器 s1。
addi sp, sp, 16: 释放栈空间。
ret: 返回。

实际 `rvcc -S strcpy.c` 翻译汇编代码

    .text
mystrcpy:
    add    sp,sp,-32   // sp栈，实际分配内存32字节
    sw    s0,28(sp)   // 还要保存sp指针和返回地址等值
    add    s0,sp,32

    // 实际 s 和 t 参数那个先分配由编译器决定
    sw    a0,-20(s0)  // char *s  函数参数的内存地址
    sw    a1,-24(s0)  // char *t  
    nop
.L2:
    lw    a4,-24(s0)  // lw 从内存加载 t 的地址
    add    a5,a4,1     // t++
    sw    a5,-24(s0)  // sw 保存 t 到内存中

    lw    a5,-20(s0)  // lw 从内存加载 s 的地址
    add    a3,a5,1     // s++
    sw    a3,-20(s0)  // sw 保存 s 到内存中

    lbu    a4,0(a4)    // 将 t 所指向的字节读入 t0 中
    sb    a4,0(a5)    // *t = *s  将值复制
    lbu    a5,0(a5)   
    bnez    a5,.L2   // 如果等于0，继续循环 .L2
    nop

    lw    s0,28(sp)   // sp栈，回收内存
    add    sp,sp,32
    jr    ra