一、内存映射
内存映射,简而言之就是将用户空间的一段内存区域映射到内核空间,映射成功后,用户对这段内存区域的修改可以直接反映到内核空间,同样,内核空间对这段区域的修改也直接反映用户空间。那么对于内核空间和用户空间两者之间需要大量数据传输等操作的话效率是非常高的。
以下是一个把普遍文件映射到用户空间的内存区域的示意图:
二、mmap函数
1.基本介绍
mmap是一种内存映射文件的方法,即将一个文件或者其它对象映射到进程的地址空间,实现文件磁盘地址和进程虚拟地址空间中一段虚拟地址的一一对映关系。
实现这样的映射关系后,进程就可以采用指针的方式读写操作这一段内存,而系统会自动回写脏页面到对应的文件磁盘上,即完成了对文件的操作而不必再调用read,write等系统调用函数。相反,内核空间对这段区域的修改也直接反映用户空间,从而可以实现不同进程间的文件共享。如下图所示:
2.mmap的优势
通过系统调用mmap ,程序可以高效地访问文件数据,而无需通过传统的read
或write
系统调用进行数据的复制,具体来说为:
- 传统的
read
和write
分为两步(下面以write为例)- 第一步:用户态空间缓冲区 → 内核页缓冲区(其实就是内核文件缓冲区)
- 第二步:内核页缓冲区 → 磁盘
- 使用
mmap
- 映射阶段:内核将文件映射到进程的虚拟地址空间,但物理内存尚未分配(这是延迟申请,当真正访问阶段需要的时候才缺页中断分配)
- 修改数据:进程直接修改映射的内存(相当于直接修改内核的页缓存),无需调用 write,也无用户态到内核态的数据拷贝
注意:当内核页缓存修改好了,我们就认为改好了,我们不关心内核缓冲区到磁盘的刷新这一过程(复杂)
三、mmap接口介绍
当我们建立好映射以后,就可以直接对“开辟”的空间进行操作(虚拟地址)
我们对虚拟地址的操作,都是直接修改映射的内存。
1. mmap建立映射
头文件:<sys/mman.h>
函数原型
void *mmap(void *addr, size_t length, int prot, int flags,int fd, off_t offset);
参数说明
addr
:建议的映射起始地址(通常设为NULL
,由内核自动选择)length
:映射区域的长度(必须是页大小(4 KB)
的整数倍,如4096
字节)prot
:映射区的内存保护模式选项(用|
链接)PROT_READ
:映射区可读PROT_WRITE
:映射区可写PROT_EXEC
:映射区可执行- 注意:映射权限必须
<=
文件打开权限
flags
:映射类型(如MAP_SHARED
或MAP_PRIVATE
)MAP_PRIVATE
:创建⼀个私有映射。对映射区域的修改不会反映到底层文件中。(即:修改仅对当前进程有效(写时复制,类似fork
)MAP_SHARED
:创建⼀个共享映射。对映射区域的修改会反映到底层文件中(即:修改会同步到文件,其他进程可见)MAP_ANONYMOUS
:指定要创建⼀个匿名内存映射
fd
:文件描述符(匿名映射时设为 -1)offset
:文件偏移量(开始映射的位置相较于0位置处的偏移)(必须是页大小的整数倍)
返回值
- 成功:返回映射区的起始地址(虚拟地址)
- 失败:返回
(void*) -1
或者MAP_FAILED
(等效的)
注意
- 映射的要是一个已经打开的文件!
- 文件大小为
0
的文件无法映射,需要先调整文件大小ftruncate(fd, SIZE)
(会把文件的内容全部初始化成\0
)
- 映射的长度如果 > 文件的大小,则可能导致未定义行为
- 因为
mmap
需要读取文件元数据(如大小):所以,即使你只需要写入权限,也需要在open
文件的时候赋予读权限
2.munmap取消映射
函数原型
int munmap(void *addr, size_t length);
参数介绍
addr
:映射空间的起始地址length
:空间长度(大小)
返回值
- 成功:
0
- 错误:
-1
(错误码会被设置)
四、mmap的用法
1.写入映射
#include<iostream>
#include<cstdio>
#include<sys/mman.h>
#include<sys/types.h>
#include<sys/stat.h>
#include<fcntl.h>
#include<unistd.h>#define FILENAME "log.txt"
#define SIZE 1024int main()
{//open fileint fd = open(FILENAME, O_RDWR|O_APPEND|O_CREAT, 0666);if (fd < 0){perror("open");return 1;}// 调整file sizeftruncate(fd, SIZE);//建立映射/*void *mmap(void *addr, size_t length, int prot, int flags,int fd, off_t offset);*/char* mmap_addr = (char*)mmap(nullptr, SIZE, PROT_WRITE, MAP_SHARED, fd, 0);if (mmap_addr == MAP_FAILED){perror("mmap");return 2;}//写入操作for (int c = 'a', i = 0; c <= 'z'; c++, i++){mmap_addr[i] = c;}//取消映射munmap(mmap_addr, SIZE);//关闭文件close(fd);std::cout << "写入映射完毕" << std::endl;return 0;
}
2.读取映射
#include<iostream>
#include<cstdio>
#include<sys/mman.h>
#include<sys/types.h>
#include<sys/stat.h>
#include<fcntl.h>
#include<unistd.h>#define FILENAME "log.txt"int main()
{//open fileint fd = open(FILENAME, O_RDONLY);if (fd < 0){perror("open");return 1;}struct stat st; // struct stat 类型的结构体用于记录文件的属性fstat(fd, &st);//建立映射char* mmap_addr = (char*)mmap(nullptr, st.st_size, PROT_READ, MAP_SHARED, fd, 0);if (mmap_addr == MAP_FAILED){perror("mmap");return 2;}//读取操作std::cout << mmap_addr << std::endl;//取消映射munmap(mmap_addr, st.st_size);//关闭文件close(fd);std::cout << "读取映射完毕" << std::endl;return 0;
}
3.简单模拟实现malloc
在malloc里,对应大块的内存通常是使用mmap
来分配的,而对应小块的内存,是用brk
来分配的。
这里要再介绍一个flags
选项:MAP_ANONYMOUS
MAP_ANONYMOUS
:指定要创建⼀个匿名内存映射。- 当使使用
MAP_ANONYMOUS
标志时,mmap
会分配⼀段不与任何⽂件相关联的内存区域(即这段内存没有⽂件作为其后端存储)。 - 这种类型的映射通常用于需要分配私有内存的场景,例如进程内部的内存分配
下面用mmap
简单模拟实现一下malloc
:
#include<iostream>
#include<cstdio>
#include<sys/mman.h>
#include<sys/types.h>
#include<sys/stat.h>
#include<fcntl.h>
#include<unistd.h>#define SIZE 1024void* MyMalloc(int size)
{//建立映射(匿名映射)--- 可读可写void* mmap_addr = mmap(nullptr, size, PROT_WRITE|PROT_READ, MAP_SHARED|MAP_ANONYMOUS, -1, 0);if (mmap_addr == MAP_FAILED){perror("mmap");exit(EXIT_FAILURE);}return mmap_addr;
}void* MyFree(void* mmap_addr, int size)
{if(munmap(mmap_addr, size) == -1){perror("munmap");exit(EXIT_FAILURE);}
}int main()
{char* ptr = (char*)MyMalloc(SIZE);//写入for (int c = 'a', i = 0; c <= 'z'; c++, i++){ptr[i] = c;}//读取std::cout << "写入后的addr content: " << ptr << std::endl;MyFree(ptr, SIZE);return 0;
}
4.makefile
.PHONY:all
all:write read malloc
write:mmap_write.ccg++ -o $@ $^ -std=c++11
read:mmap_read.ccg++ -o $@ $^ -std=c++11
malloc:mmap_malloc.ccg++ -o $@ $^ -std=c++11.PHONY:clean
clean:rm -f write read malloc