Linux中的/proc文件系统详解(C/C++代码实现)
创始人
2024-03-08 19:19:44
0

Linux /proc这个特殊的目录包含有关Linux系统的所有详细信息,包括其内核、进程和配置参数。通过研究/proc目录,可以了解Linux命令的工作原理,甚至可以执行一些管理任务。

走进Linux的/proc目录

今天,我们将查看/proc目录并熟悉它。/proc目录存在于所有Linux系统上,无论其风格或体系结构如何。

/proc中的文件不是真正的文件,它们充当内核数据结构和进程信息的接口。由于它们不是真正的文件,文件大小等属性不适用于它们。


最有趣的部分是,/proc文件系统中几乎所有文件的大小都是0字节。让许多用户困惑的是,尽管它们的大小为0,但在查看时仍然包含数据。这怎么可能?

Linux能够处理许多不同类型的文件系统,因为它被称为VFS(虚拟文件系统)。/proc文件系统也由内核使用VFS访问。因此,当用户试图访问/proc文件系统中的文件时,proc文件系统会借助内核中的信息创建该文件的内容。这就是为什么在列出/proc目录时,大多数目录的大小显示为0字节,但在访问时会动态填充。

让我们实际检查并理解它。Linux中有一个名为file的命令。

file [ -bcnsvzL ] [ -f 命名文件 ] [ -m 幻数文件 ] file …


linux中的“file”命令用于通过检查文件的内容来确定文件的类型。如果文件为空,它将给出“文件为空”的输出。让我们尝试使用file命令检查任何/proc文件的文件类型。


输出表明文件为空。但是,让我们尝试使用vi、cat或更少的编辑器访问该文件。


因此,当您访问内容时,当前值将从内核填充。这就是为什么您可以从/proc中的文件获得系统的最新和准确状态的原因。

我们之前看到proc手册页将proc定义为“进程信息伪文件系统”。这是因为它包含所有当前正在运行的进程的详细信息。让我们看看/proc的目录列表


可以在上面显示的目录列表中看到,里面有很多编号的目录。这些目录用相应的PID编号。当进程开始和停止时,它们会动态地出现和消失。以各自PID命名的每个目录都包含进程当前状态的详细信息,我们随便进入一个PID看看里面的信息。

让我们看看/proc中PID目录的内容。下图显示了PID目录的内容。

Linux中 /proc/[pid] 目录各文件简析

在 /proc 目录里, 每个正在运行的进程都有一个以该进程 ID 命名的子目录, 其下包括如下的目录和伪文件

  • auxv

包含传递给进程的 ELF 解释器信息,格式是每一项都是一个 unsigned long长度的 ID 加上一个 unsigned long 长度的值。

  • cmdline

该文件保存了进程的完整命令行. 如果该进程已经 被交换出内存, 或者该进程已经僵死, 那么就没有 任何东西在该文件里,这时候对该文件的读操作将返回零 个字符. 该文件以空字符 null 而不是换行符作为结 束标志.

  • comm

comm 包含进程的命令名。

cwd

一个符号连接, 指向进程当前的工作目录. 例如, 要找出进程 20 的 cwd, 你可以:cd /proc/20/cwd;
/bin/pwd

environ

该文件保存进程的环境变量, 各项之间以空字符分隔, 结尾也可能是一个空字符. 因此, 如果要输出进程 1 的环境变量, 你应该: (cat /proc/1/environ; echo) | tr “;\000”; “;\n”;

exe

也是一个符号连接, 指向被执行的二进制代码

fd

进程所打开的每个文件都有一个符号连接在该子目 录里, 以文件描述符命名, 这个名字实际上是指向 真正的文件的符号连接,(和 exe记录一样). 例如, 0 是标准输入, 1是标准输出, 2 是标准错误, 等等

maps

该文件包含当前的映象内存区及他们的访问许可.

格式如下:address           perms offset   dev   inode00000000-0002f000 r-x-- 00000400 03:03 14010002f000-00032000 rwx-p 0002f400 03:03 140100032000-0005b000 rwx-p 00000000 00:00 060000000-60098000 rwx-p 00000400 03:03 21560098000-600c7000 rwx-p 00000000 00:00 0bfffa000-c0000000 rwx-p 00000000 00:00 0address 是进程所占据的地址空间, perms 是权限集:r = readw = writex = executes = sharedp = private (copy on write)offset 是文件或者别的什么的偏移量, dev 是设备号(主设 备号:从设备号), 而 inode 则是设备的节点号. 0 表明没有 节点与内存相对应, 就象 bss 的情形.

mem

该文件并不是 mem (1:1) 设备, 尽管它们有相同的设备号. /dev/mem 设备是做任何地址转换之前的物理内存, 而这里的 mem 文件是访问它的进程的内存.目前这个 mem 还不能 mmap(2) (内存映射)出去,而且可能一直要等到内核中增加了一个通用的mmap(2) 以后才能实现. (也许在你读本手册页时这一切已经发生了)

mmap

mmap(2) 做的 maps 映射目录,是和 exe, fd/* 等类似的符号连接. 请注意 maps 包含了比
/proc/*/mmap 更多的信息, 所以应该废弃 mmap.

root

依靠系统调用 chroot(2), unix 和 linux 可以让 每个进程有各自的文件系统根目录. 由 chroot(2) 系统调用设置. 根指向文件系统的根,性质就象 exe, fd/* 等一样.

stat

进程状态信息, 被命令 ps(1) 使用.


通过访问/proc中的文件来获取信息

cpuinfo

保存了CPU 以及体系架构依赖条目的列表. 对于不同的系 统架构有不同的列表, 共有的两项是 cpu 和 BogoMIPS, cpu 可能是当前在用的 CPU, 而 BogoMIPS 则是内核初始化时计算出的一个系统常数.

devices

主设备号及设备组的列表, 文本格式. MAKEDEV 脚本使用 该文件来维持内核的一致性.

dma

一个列表, 指出正在使用的ISA DMA (直接内存访问)通道.

filesystems

以文本格式列出了被编译进内核的文件系统. 当没有给 mount(1) 指明哪个文件系统的时候, mount(1) 就依靠该文件遍历不同的文件系统.

interrupts

该文件以 ASCII 格式记录了(至少是在 i386 体系上的)每次 IRQ 的中断数目.

ioports

该文件列出了当前在用的已注册 I/O 端口范围.

kcore

该伪文件以 core 文件格式给出了系统的物理内存映象, 再 利用未卸载的内核 (/usr/src/linux/tools/zSystem), 我 们就可以用 GDB 查探当前内核的任意数据结构.

kmsg

可以用该文件取代系统调用 syslog(2) 来记录内核信息. 但是读该文件需要超级用户权限, 并且一次只能有一个进 程可以读该文件,因而如果一个使用了 syslog(2)系统调用功能来记录内核信息的系统日志进程正在运行的话,别的进程就不能再去读该伪文件了.该文件的内容可以用 dmesg(8) 来察看.

ksyms

该文件保存了内核输出的符号定义, modules(X) 使用该文件 动态地连接和捆绑可装载的模块.

loadavg

平均负载数给出了在过去的 1, 5, 15 分钟里在运行队列里 的任务数, 与 uptime(1) 等命令的结果相同.

locks

这个文件显示当前文件锁.

malloc

只有在编译时定义了 CONFIGDEBUGMALLOC 才会有该文件.

meminfo

free(1) 利用该文件来给出系统总的空闲内存和已用内存 (包括物理内存和交换内存), 以及内核所使用的共享内存 和缓冲区.该文件与 free(1) 格式相同, 但是以字节为单位而不是 KB.

modules

列出了系统已载入的模块, 文本格式.

self

当某进程访问 /proc 目录时, 该目录就指向 /proc 下以该进 程 ID 命名的目录.

stat

内核及系统的统计数据.

uptime

该文件包含两个数: 系统正常运行时间和总的空闲时间, 都以秒为单位.

version

指明了当前正在运行的内核版本

获取当前进程的名称 C/C++代码实现
proc.h

...
struct proc {pid_t pid;pid_t ppid;pid_t tracer;unsigned long *auxvals;size_t nauxvals;char state;char *path;char *name;struct environ *environ;size_t nenviron;char **cmdline;size_t ncmdline;pid_t *threads;size_t nthreads;
};struct module {void *base;size_t size;void *end;char *path;char *name;
};struct page {void *base;size_t size;unsigned long offset;void *end;int prot;int flags;
};int proc_enumpids(int(*callback)(pid_t pid, void *arg), void *arg);
int proc_checkpid(pid_t pid);
pid_t proc_getppid(pid_t pid);
pid_t proc_gettracer(pid_t pid);
int proc_enumauxvals(pid_t pid, int(*callback)(unsigned long type,unsigned long val, void *arg), void *arg);
unsigned long proc_getauxval(pid_t pid, unsigned long type);
uid_t proc_getuid(pid_t pid);
uid_t proc_geteuid(pid_t pid);
gid_t proc_getgid(pid_t pid);
gid_t proc_getegid(pid_t pid);
char proc_getstate(pid_t pid);
unsigned long proc_getplatform(pid_t pid);
size_t proc_getpath(pid_t pid, char **ppathbuf, size_t maxlen);
size_t proc_getname(pid_t pid, char **pnamebuf, size_t maxlen);
int proc_enumenviron(pid_t pid,int(*callback)(char *name, char *value, void *arg),void *arg);
int proc_enumcmdline(pid_t pid, int(*callback)(char *cmdarg, void *arg),void *arg);
size_t proc_getcmdline(pid_t pid, char **pcmdlinebuf, size_t maxlen);
int proc_enumthreads(pid_t pid, int(*callback)(pid_t tid, void *arg),void *arg);
unsigned long proc_getentry(pid_t pid);
ssize_t proc_vmread(pid_t pid, off_t src, void *dst, size_t size);
ssize_t proc_vmwrite(pid_t pid, off_t dst, void *src, size_t size);
int proc_openproc(pid_t pid, struct proc *pproc);
void proc_closeproc(struct proc *pproc);

proc.c

...
int proc_openproc(pid_t pid, struct proc *pproc)
{int ret = -1;char *status_filebuf;char status_path[64] = { 0 };snprintf(status_path, sizeof(status_path) - 1, "/proc/%d/status", pid);status_filebuf = get_filebuf(status_path);if (!status_filebuf)goto EXIT;pproc->pid = pid;pproc->ppid = _proc_getppid(status_filebuf);if (pproc->ppid == (pid_t)-1)goto ERR_PPID;pproc->tracer = _proc_gettracer(status_filebuf);if (pproc->tracer == (pid_t)-1)goto ERR_TRACER;pproc->auxvals = (unsigned long *)NULL;pproc->nauxvals = 0;proc_enumauxvals(pproc->pid, _proc_openproc_callback_auxv,(void *)pproc);if (!pproc->auxvals || !pproc->nauxvals)goto ERR_AUXVALS;pproc->state = _proc_getstate(status_filebuf);if (pproc->state == 0)goto ERR_STATE;if (!proc_getpath(pproc->pid, &pproc->path, 0))goto ERR_PATH;if (!_proc_getname(status_filebuf, &pproc->name, 0))goto ERR_NAME;pproc->environ = (struct environ *)NULL;pproc->nenviron = 0;if (proc_enumenviron(pproc->pid, _proc_openproc_callback_env, (void *)pproc))goto ERR_ENVIRON;pproc->cmdline = (char **)NULL;pproc->ncmdline = 0;if (proc_enumcmdline(pproc->pid, _proc_openproc_callback_cmd, (void *)pproc))goto ERR_CMDLINE;pproc->threads = (pid_t *)NULL;pproc->nthreads = 0;if (proc_enumthreads(pproc->pid, _proc_openproc_callback_tid, (void *)pproc))goto ERR_THREADS;ret = 0;goto EXIT; /* skip errors */ERR_THREADS:{size_t i;for (i = 0; i < pproc->ncmdline; ++i)free(pproc->cmdline[i]);free(pproc->cmdline);}
ERR_CMDLINE:{size_t i;for (i = 0; i < pproc->nenviron; ++i) {free(pproc->environ[i].name);free(pproc->environ[i].value);}free(pproc->environ);}
ERR_ENVIRON:free(pproc->name);
ERR_NAME:free(pproc->path);
ERR_PATH:
ERR_STATE:free(pproc->auxvals);
ERR_AUXVALS:
ERR_TRACER:
ERR_PPID:free(status_filebuf);
EXIT:return ret;
}
...

main.c

int main(int argc, char **argv)
{
...pid = getpid();if (proc_openproc(pid, &proc)) {printf("[!] Unable to open process\n");return -1;}printf("[*] PID: %d\n", proc.pid);printf("[*] PPID: %d\n", proc.ppid);printf("[*] Tracer: %d\n", proc.tracer);printf("[*] UID: %d\n", (uid_t)proc.auxvals[AT_UID]);printf("[*] EUID: %d\n", (uid_t)proc.auxvals[AT_EUID]);printf("[*] GID: %d\n", (gid_t)proc.auxvals[AT_GID]);printf("[*] EGID: %d\n", (gid_t)proc.auxvals[AT_EGID]);printf("[*] Entry: %p\n", (void *)proc.auxvals[AT_ENTRY]);printf("[*] State: %c\n", proc.state);printf("[*] Path: %s\n", proc.path);printf("[*] Name: %s\n", proc.name);printf("[*] Environment Variables: \n");{size_t i;for (i = 0; i < proc.nenviron; ++i) {printf("\t%s=%s\n", proc.environ[i].name,proc.environ[i].value);}}printf("[*] Command Line: ");{size_t i;for (i = 0; i < proc.ncmdline; ++i) {printf("%s ", proc.cmdline[i]);}}printf("\n");printf("[*] Threads: { ");{size_t i;for (i = 0; i < proc.nthreads; ++i) {printf("%d ", proc.threads[i]);}}printf("}\n");printf("===================\n");proc_closeproc(&proc);printf("Press ENTER to exit...");getchar();return 0;
}

编译运行

在这里插入图片描述proc获取当前进程的名称,其中包含有关进程的宝贵信息,如命令行、绝对路径、ppid、跟踪程序pid、状态、环境变量等。

If you need the complete source code of proc, add your WeChat number (c17865354792)

总结

proc文件系统是一个伪文件系统,它只存在内存当中,而不占用外存空间。它以文件系统的方式为访问系统内核数据的操作提供接口。

系统中当前运行的每一个进程都有对应的一个目录在 proc 下,以进程的 PID 号为目录名,它们是读取进程信息的接口。

Welcome to follow WeChat official account【程序猿编码

参考:https://man7.org/linux/man-pages/man5/proc.5.html

相关内容

热门资讯

AWSECS:访问外部网络时出... 如果您在AWS ECS中部署了应用程序,并且该应用程序需要访问外部网络,但是无法正常访问,可能是因为...
AWSElasticBeans... 在Dockerfile中手动配置nginx反向代理。例如,在Dockerfile中添加以下代码:FR...
银河麒麟V10SP1高级服务器... 银河麒麟高级服务器操作系统简介: 银河麒麟高级服务器操作系统V10是针对企业级关键业务...
北信源内网安全管理卸载 北信源内网安全管理是一款网络安全管理软件,主要用于保护内网安全。在日常使用过程中,卸载该软件是一种常...
AWR报告解读 WORKLOAD REPOSITORY PDB report (PDB snapshots) AW...
AWS管理控制台菜单和权限 要在AWS管理控制台中创建菜单和权限,您可以使用AWS Identity and Access Ma...
​ToDesk 远程工具安装及... 目录 前言 ToDesk 优势 ToDesk 下载安装 ToDesk 功能展示 文件传输 设备链接 ...
群晖外网访问终极解决方法:IP... 写在前面的话 受够了群晖的quickconnet的小水管了,急需一个新的解决方法&#x...
不能访问光猫的的管理页面 光猫是现代家庭宽带网络的重要组成部分,它可以提供高速稳定的网络连接。但是,有时候我们会遇到不能访问光...
Azure构建流程(Power... 这可能是由于配置错误导致的问题。请检查构建流程任务中的“发布构建制品”步骤,确保正确配置了“Arti...