菜鸟笔记之PWN入门(1.1.1)汇编语言基础与堆栈入门
啥是汇编语言?有啥用?
深入了解计算机底层,我们会发现,计算机实际上只能执行一些非常基础的操作,但其速度却非常快。计算机的CPU只能执行机器码,即由一系列0和1组成的指令。不同的0和1组合会触发计算机中的不同电路,从而进行各种操作。由于这些0和1的组合很长,阅读起来不方便,因此通常以16进制形式显示。然而,即便如此,16进制的表示仍然难以理解。为了简化这一过程,汇编语言应运而生,它用更易读的符号来表示这些机器指令,从而使程序员能够更方便地编写和理解代码。
啥是寄存器?
计算机中的所有指令都是由CPU执行的。在计算机结构中,CPU和内存是分开的,而寄存器则位于CPU内部。CPU可以直接访问寄存器中的数据来执行各种指令操作。在程序执行过程中,数据通常从内存 –> 缓存(cache)–> 寄存器,只有到了寄存器中CPU才能对其进行处理。处理完成后,程序决定是否将寄存器中的数据写回内存,以更新内存中的内容。除了存储数据,寄存器还可以用于存储指令、地址、状态信息和其他控制数据。因此,寄存器在计算机中发挥着至关重要的作用,帮助提高处理速度和效率。
下图表介绍一些常用的寄存器
什么是栈?什么是堆?
先贴一张图用来理清楚堆和栈在程序中的位置
栈的简单介绍
在计算机程序运行时,系统会将可执行文件的text段
(代码段)和data段
(数据段)加载到内存中。在C语言等编程语言中,函数调用过程中需要传递参数
并创建局部变量
。如果这些数据都存储在data段
或bss段
中,会导致内存空间的浪费,并使得管理变得复杂。
为了高效管理函数的参数和局部变量,并在函数调用结束后释放相关资源
,我们使用了栈。栈是一种后进先出(LIFO)
的数据结构,它能够在函数调用时创建栈帧来存储函数的局部变量、参数、返回地址等信息。当函数调用结束时,栈帧会被自动销毁,从而释放内存,避免内存浪费。栈不仅节省内存,还确保了函数调用和返回过程的有序进行。
ESP
(栈指针)和 EBP
(基址指针)之间的空间被称为栈帧
。栈帧
是一个函数调用的栈上空间
,主要用于存储函数的局部变量
、参数
、返回地址
以及保存的寄存器状态
等信息。在每次函数调用时,都会为该函数分配一个新的栈帧,并在函数执行完成后释放这个栈帧
。栈帧的结构通常如下:
- **栈顶 (由
ESP
指针指向)**:函数调用时,栈顶包含函数的局部变量和临时数据。 - **栈底 (由
EBP
指针指向)**:栈底用于存储函数调用的参数和返回地址等。
栈帧
的设计使得函数调用和返回变得高效,并且支持递归调用等复杂的函数调用模式。
堆的简单介绍
堆是用于存放进程运行中动态分配的内存段,其大小可以在运行时根据需求调整。调用malloc
、calloc
或realloc
等函数时,会从堆上分配内存。释放内存时使用free
函数,以便回收堆内存。堆内存的管理由程序员负责,不会自动释放,需要手动管理内存的分配和释放。
浅浅总结一下:
栈
用于存放各个函数所需要使用的参数,比如:
1 |
|
在这个例子中,str
是一个局部数组,分配在栈上。
堆
则是用于存放用户的数据,并且由用户决定什么时候释放它。比如:
1 |
|
(这里例子可能举的有点复杂…但是之后遇到的堆
的题目大多也是类似这样的,所以堆的难度会比栈
大很多,知识量也多很多)
总之上面的代码就是一般堆的用法,不需要理解,只是作为展示,大致内容如下:
输入1,用户可以申请一个堆的空间
。
输入2,用户可以编辑所申请到的空间
。
输入3,用户可以删除申请到的空间
。
常用汇编指令与C语言对比
MOV
- 功能:将数据从一个位置复制到另一个位置。
- 汇编:
MOV AX, 1234h
- C语言:
AX = 0x1234;
- 说明:
MOV
是把数据从源位置复制到目标位置,类似于C语言中的赋值操作。MOV
不改变源数据,只是复制到目标位置。
ADD / SUB
- 功能:进行加法和减法运算。
- 汇编:
ADD AX, BX
(AX = AX + BX
);SUB CX, 5
(CX = CX - 5
) - C语言:
AX += BX;
(AX = AX + BX
);CX -= 5;
(CX = CX - 5
) - 说明:
ADD
和SUB
用于对寄存器或内存中的值进行加减操作,更新结果并设置标志寄存器的状态。
INC / DEC
- 功能:递增或递减操作数。
- 汇编:
INC AX
(AX = AX + 1
);DEC BX
(BX = BX - 1
) - C语言:
AX++;
(AX = AX + 1
);BX--;
(BX = BX - 1
) - 说明:
INC
和DEC
只能对寄存器或内存位置操作,不能对立即数操作。
CMP
- 功能:比较两个值,并设置标志寄存器状态。
- 汇编:
CMP AX, BX
(if (AX == BX)
) - C语言:
if (AX == BX)
(AX
和BX
比较) - 说明:
CMP
实际上是做了AX - BX
的操作然后判断是否等于0,更新状态标志。
JMP
- 功能:无条件跳转到指定的地址。
- 汇编:
JMP start
- C语言:
goto start;
- 说明:
JMP
改变程序的执行流,跳转到标记为start
的位置。
JE / JNE / JZ / JNZ
- 功能:根据条件跳转到指定地址。
- 汇编:
JE equal
(if (zero flag) goto equal;
);JNE not_equal
(if (not equal) goto not_equal;
) - C语言:
if (flag == 0) goto equal;
(JE
跳转条件为零标志);if (flag != 0) goto not_equal;
(JNE
跳转条件为非零) - 说明:这些指令依据先前比较操作的结果决定是否跳转。
CALL / RET
- 功能:调用和返回函数。
- 汇编:
CALL myFunction
(调用函数);RET
(返回函数) - C语言:
myFunction();
(调用函数);return;
(从函数返回) - 说明:
CALL
会保存当前的返回地址,并跳转到目标函数;RET
从栈中恢复返回地址并跳转回。
PUSH / POP
- 功能:压入或弹出栈数据。
- 汇编:
PUSH AX
(压入栈);POP BX
(从栈中弹出) - C语言:
stack.push(AX);
(假设有栈操作的C语言函数);BX = stack.pop();
(假设有栈操作的C语言函数) - 说明:
PUSH
和POP
操作栈,PUSH
将数据压入栈顶,POP
从栈顶弹出数据。
NOP
- 功能:空操作,不产生任何效果。
- 汇编:
NOP
- C语言:没有直接的C语言对应,可以理解为一个空的操作(或者可以理解成C语言的注释符号)。
- 说明:
NOP
通常用于占位或调试,不会改变程序状态。
LEA
- 功能:加载有效地址,将计算得到的地址赋给寄存器。
- 汇编:
LEA AX, [BX+SI]
- C语言:
AX = &array[BX + SI];
(假设array
是一个数组) - 说明:
LEA
计算一个地址并将其存入寄存器,类似于获取指针地址而不实际访问内存。
AND / OR / XOR / NOT
- 功能:按位操作。
- 汇编:
AND AX, BX
(按位与);OR AX, BX
(按位或);XOR AX, BX
(按位异或);NOT AX
(按位取反) - C语言:
AX = AX & BX;
(按位与);AX = AX | BX;
(按位或);AX = AX ^ BX;
(按位异或);AX = ~AX;
(按位取反) - 说明:这些指令用于位级操作,
AND
和OR
用于逻辑运算,XOR
用于位翻转,NOT
对每一位取反。
这里重点介绍一下PUSH
POP
这两个指令PUSH
和POP
是对栈
进行操作的指令
1 |
|
我浅浅画了一个非常抽象的栈
,但是这并不影响我们理解它。
当我们执行 POP ebx
这个指令后,那么就会让栈变成这个样子↓
1 |
|
然后来看看PUSH eax
1 |
|
为什么函数调用需要用栈
首先为什么栈
是后进先出(LIFO)
,这样的设计是因为程序的执行符合一种将复杂的大问题拆解成一个个小问题来解决的思想。
大问题的解决需要小问题的答案,而小问题得到答案之后就可以抛弃了。
比如:
1 |
|
那么这个程序的执行流程就是 main --> func1 --> func2 --> func3 --> printf
那么栈的空间就是:
1 |
|
我们得出规律,大问题函数程序总是最后消失
也就是调用者
的生命周期总是长于被调用者
这恰好符合了栈
的FILO
的特点。所以栈
一定不是被随意设计的,而是一种完美符合计算机程序设计思想的一种数据结构
参考文献:
什么是堆?什么是栈?他们之间有什么区别和联系? - tolin - 博客园 (cnblogs.com)
PWN入门(1-1-2)-bss段、data段、text段、堆(heap)和栈(stack) (yuque.com)
在x86架构中的寄存器 - 知乎 (zhihu.com)
什么是栈,为什么函数式编程语言都离不开栈?_没有栈,都是跟栈有什么关系-CSDN博客
PWN入门(1-1-1)-C函数调用过程原理及函数栈帧分析(Intel) (yuque.com)
linux - C函数调用过程原理及函数栈帧分析 - 编程之道 - SegmentFault 思否