内存映射与内存锁详解

Linux内存映射相关系统调用详解

内存映射是Linux系统中高效管理内存和文件的核心机制之一。通过将文件或设备直接映射到进程的虚拟地址空间，程序可以像访问内存一样操作数据，避免了频繁的用户态与内核态切换。本文将详细介绍与内存映射相关的系统调用，包括其功能、参数及使用细节。

1. mmap()：创建内存映射

功能：将文件或匿名内存区域映射到进程的虚拟地址空间，支持文件I/O（共享文件映射）、共享内存（共享匿名映射）、动态内存（私有匿名映射）分配等场景。

函数声明：

#include <sys/mman.h>  
void *mmap(void *addr, size_t length, int prot, int flags, int fd, off_t offset);

参数详解：
• addr：建议映射的起始地址，通常设为NULL由内核自动分配。
• length：映射区域的长度，需按页大小对齐（通常4KB）。
• prot：内存保护标志，通过位或组合以下宏：
• PROT_READ：可读。
• PROT_WRITE：可写。
• PROT_EXEC：可执行。
• PROT_NONE：不可访问。
• flags：映射类型和属性，常用宏包括：
• MAP_PRIVATE：私有映射，修改仅对当前进程可见（写时复制），不同进程使用时各自copy一份，若是私有文件映射则不会被写入磁盘。
• MAP_SHARED：直接使用，无需copy，与私有映射二选一。
• MAP_ANONYMOUS：匿名映射，不关联文件，内容初始化为零，当然默认是文件映射。
• MAP_FIXED：强制使用指定地址，可能导致现有映射被覆盖。
• fd：文件描述符，匿名映射时设为-1。
• offset：文件映射的起始偏移量，需为页大小的整数倍。

返回值：
• 成功返回映射区域的起始地址。
• 失败返回MAP_FAILED，并设置errno（如EACCES权限不足、ENOMEM内存不足）。

2. munmap()：解除内存映射

功能：删除指定虚拟地址范围内的内存映射，释放相关资源。

函数声明：

#include <sys/mman.h>  
int munmap(void *addr, size_t length);

参数说明：
• addr：映射区域的起始地址，必须与mmap()返回的地址一致。
• length：需解除映射的区域长度，无需严格对齐，但内核按页对齐处理。

返回值：
• 成功返回0。
• 失败返回-1，并设置errno（如EINVAL无效地址或长度）。

3. mprotect()：修改内存保护权限

功能：调整已映射内存区域的访问权限（如将只读区域改为可写）。

函数声明：

#include <sys/mman.h>  
int mprotect(void *addr, size_t len, int prot);

参数说明：
• addr和len：需调整的地址范围，必须对齐页大小。
• prot：与mmap()的prot参数相同，支持PROT_READ、PROT_WRITE等组合。

返回值：
• 成功返回0。
• 失败返回-1，并设置errno（如EACCES权限冲突）。

4. msync()：同步内存与文件内容

功能：将映射内存的修改同步到文件，确保数据持久化。

函数声明：

#include <sys/mman.h>  
int msync(void *addr, size_t length, int flags);

参数说明：
• addr和length：需同步的内存区域。
• flags：同步模式，可选宏：
• MS_SYNC：同步写入磁盘，调用阻塞直到完成。
• MS_ASYNC：异步写入，仅将数据排队到写入队列。
• MS_INVALIDATE：使其他进程的映射缓存失效。

返回值：
• 成功返回0。
• 失败返回-1，并设置errno（如EIO写入错误）。

5. madvise()：提供内存访问建议（高级优化）

功能：向内核提供内存访问模式的提示，以优化页面缓存和预读策略。

函数声明：

#include <sys/mman.h>  
int madvise(void *addr, size_t length, int advice);

参数说明：
• addr和length：目标内存区域。
• advice：建议类型，常用选项包括：
• MADV_NORMAL：默认策略，适度预读。
• MADV_RANDOM：随机访问，禁用预读。
• MADV_SEQUENTIAL：顺序访问，积极释放已访问页。
• MADV_DONTNEED：提示内核可释放相关物理页。

返回值：
• 成功返回0。
• 失败返回-1，并设置errno。

总结

Linux内存映射系统调用提供了灵活的内存管理能力，涵盖从映射创建（mmap）、权限控制（mprotect）、数据同步（msync）到资源释放（munmap）的全生命周期操作。合理使用这些接口可显著提升文件I/O效率，简化进程间通信，并优化内存利用率。开发者需特别注意参数的对齐要求和标志位的组合逻辑，以避免潜在错误。

Linux内存锁相关系统调用详解

内存锁定（Memory Locking）是Linux系统中用于确保关键内存页常驻物理内存的核心机制，可避免被交换到磁盘，从而提升实时性、安全性及性能稳定性。以下是与内存锁相关的系统调用详解，包含功能、参数、宏定义及返回值的完整说明。

1. mlock()：锁定指定内存区域

功能：将进程虚拟地址空间中指定范围的物理内存页锁定在物理内存中，防止被交换到交换分区。

函数声明：

#include <sys/mman.h>  
int mlock(const void *addr, size_t len);

参数说明：
• addr：需锁定的内存区域起始地址，必须按页对齐（通常4KB）。
• len：需锁定的内存区域长度，需为页大小的整数倍。

返回值：
• 成功返回0。
• 失败返回-1，并设置errno，常见错误包括：
• ENOMEM：系统内存不足或地址范围超出进程地址空间。
• EPERM：进程无权限（非特权用户需CAP_IPC_LOCK能力）。
• EINVAL：参数非法（如len=0或地址未对齐）。

2. munlock()：解除内存锁定

功能：解锁由mlock()锁定的内存区域，允许内核重新管理其换入换出。

函数声明：

#include <sys/mman.h>  
int munlock(const void *addr, size_t len);

参数说明：
• addr和len：需解锁的内存区域，必须与mlock()调用时的范围完全一致。

返回值：
• 成功返回0。
• 失败返回-1，错误码与mlock()类似。

3. mlockall()：锁定进程全部内存

功能：锁定当前或未来进程地址空间的所有内存页，常与实时性要求高的应用结合使用。

函数声明：

#include <sys/mman.h>  
int mlockall(int flags);

参数说明：
• flags：锁定模式，通过位或组合以下宏：
• MCL_CURRENT：锁定当前已分配的所有内存页。
• MCL_FUTURE：锁定未来新分配的内存页（如堆、栈增长）。
• MCL_ONFAULT（Linux特有）：仅锁定已触发缺页异常的页。

返回值：
• 成功返回0。
• 失败返回-1，错误码包括EPERM（权限不足）或ENOMEM（资源耗尽）。

4. munlockall()：解除全部内存锁定

功能：解除由mlockall()锁定的所有内存页。

函数声明：

#include <sys/mman.h>  
int munlockall(void);

返回值：
• 成功返回0。
• 失败返回-1，通常因权限问题（EPERM）。

5. mseal()：密封内存权限（新增系统调用）

功能：锁定指定内存区域的权限（如禁止修改为可执行或调整映射范围），防止攻击者利用内存漏洞篡改权限。

函数声明：

#include <linux/mseal.h>  
int mseal(void *addr, size_t len, unsigned long flags);

参数说明：
• addr和len：需密封的内存区域。
• flags：密封类型，常用宏包括：
• SEAL_PROT：禁止修改内存保护权限（如PROT_EXEC）。
• SEAL_MAP：禁止调整映射范围（如munmap或mremap）。
• SEAL_SHRINK：禁止缩小映射区域。

返回值：
• 成功返回0。
• 失败返回-1，错误码包括EACCES（权限不足）或EINVAL（参数无效）。

核心机制与限制

实现原理：
• 内存锁定通过设置VMA（虚拟内存区域）的VM_LOCKED标记实现，内核在页面回收（Page Reclaim）时跳过锁定页。
• 锁定页会被移出LRU链表，加入unevictable_list，避免被扫描回收。
资源限制：
• 用户可通过ulimit -l查看和调整锁定内存上限，默认值通常为64KB。
• 超限时mlock()返回ENOMEM。
安全性与性能：
• 特权进程（CAP_IPC_LOCK）可绕过限制，但过度锁定可能导致系统资源耗尽。
• mseal通过固化内存权限提升安全性，尤其适用于浏览器JIT编译等高风险场景。

总结

内存锁相关系统调用为关键应用提供了物理内存驻留和权限控制的底层支持。mlock/mlockall适用于实时性场景，mseal则针对新型内存攻击提供主动防御。开发者需权衡性能与资源消耗，结合ulimit和权限管理避免系统稳定性问题。

It's Geek KingYoungy

内存映射与内存锁详解