探究Linux进程的PID文件：从概念到实现 (linux 进程 pid文件)

在linux系统中，每个运行中的进程都有一个唯一的PID（进程标识符）。PID是一个非负整数，标识了进程在系统中的唯一性。而在许多情况下，我们需要找到一个正在运行的进程的PID，以便控制它的行为。为了方便起见，Linux系统使用一个PID文件来存储进程的PID。本文将从概念和实现两方面来探究Linux进程的PID文件。

一、PID的概念

PID是进程的唯一标识符。在Linux系统中，每个进程都有一个PID，由内核分配。PID是一个非负整数，且它必须是唯一的。同时，在Linux中，PID是动态分配的，即当一个进程终止时，该进程的PID就被释放，可以分配给新的进程使用。

在Linux中，每个进程都有一个父进程。当一个进程被创建时，它就成为了父进程的子进程，并且这个子进程的PID会被赋值为下一个可用PID。该子进程可以通过它的PID来和其他进程进行通信，向内核请求系统资源，或者处理其他的操作。

二、PID文件的概念

在Linux中，一个进程的PID是动态分配的，因此要查询一个进程的PID需要通过一些手段来获取。其中一种比较简单且常用的方式就是使用PID文件。PID文件是一个文本文件，其中存储着进程的PID信息。这种方法非常方便，因为大多数Linux系统都支持创建、读取和使用PID文件。

PID文件一般放置在进程所在目录的var/run（或/run）子目录下，以进程名或进程标识符作为文件名。PID文件的内容通常只有一行，该行简单地包含的是一个整数，即进程的PID。其他的进程可以读取该文件来获得该进程的PID，从而进行必要的操作。

三、PID文件的生成和处理

PID文件的生成和处理可以通过以下步骤来实现：

1. 进程启动时，将进程的PID写入文件

当进程启动时，它可以通过调用系统调用getpid()来获得自己的PID。然后，它可以将PID写入一个指定的文件。在Unix系统中，可以使用open()和write()函数来创建和写入文件。在Linux系统中，也可以使用write()函数来简化此过程。一个常见的操作方法是在进程的初始化代码中添加保存PID的代码：

int pid_file_fd = open(“/var/run/my_daemon.pid”, O_CREAT|O_RDWR, 0644);

if (pid_file_fd

syslog(LOG_ERR, “Fled to open PID file: %s”, strerror(errno));

exit(1);

}

dprintf(pid_file_fd, “%d\n”, getpid());

close(pid_file_fd);

2. 进程执行过程中，必要时读取PID文件

在某些情况下，其他的进程需要知道正在运行的进程的PID，以便对该进程进行控制或与其进行通信。此时，可以通过读取PID文件来获得该进程的PID。在Unix系统中，可以使用open()和read()函数来打开和读取文件。在Linux系统中，也可以使用fgets()函数来简化此过程。一个常见的操作方法是在启动其他进程之前先读取PID文件：

int pid_file_fd = open(“/var/run/my_daemon.pid”, O_RDON, 0);

if (pid_file_fd

syslog(LOG_ERR, “Fled to open PID file: %s”, strerror(errno));

exit(1);

}

char pid_str[16] = {‘\0’};

if (fgets(pid_str, 16, pid_file_fd) == NULL) {

syslog(LOG_ERR, “Fled to read PID file: %s”, strerror(errno));

close(pid_file_fd);

exit(1);

}

pid_t pid = atoi(pid_str);

close(pid_file_fd);

3. 进程终止时，删除PID文件

当进程终止时，它应该删除保存其PID的文件，以便其他的进程不会错误地读取该文件。在Unix系统中，可以使用unlink()函数来删除文件。在Linux系统中，也可以使用remove()函数来简化此过程：

if (unlink(“/var/run/my_daemon.pid”)

syslog(LOG_ERR, “Fled to delete PID file: %s”, strerror(errno));

}

关于PID文件的实现，需要注意的是，PID文件中的PID信息必须是进程实际的PID，而不是任意的数字。否则，其他的进程将无法通过文件中的PID正确地控制该进程，从而导致系统出现不可预测的错误。

结语

本文从PID的概念入手，讲解了Linux系统中的PID文件的实现方法。PID文件不仅可以更方便地管理进程，而且还可以降低误操作的风险。对于Linux系统的开发者和运维人员来说，了解PID文件的相关知识是非常必要的。

相关问题拓展阅读：

linux 下，进程号pid与文件描述符有什么区别？
linux下的PID,PIDD是什么？他们之间的关系以及应用是什么？
linux除了popen外，获取其它进程PID的方法有哪些？

linux 下，进程号pid与文件描述符有什么区别？

进程号是标识一个进程，文件描述符是标识一个文件句柄，两者都是整数

差不多

linux下的PID,PIDD是什么？他们之间的关系以及应用是什么？

不知道你是不是学习编程的，如果不是就没必要看芦型改了。

1.PID是进程标识号，它是一个进程的唯一性标识。PPID是该进程父进程的进程标识号。

2.fork和exec和pid完全就是2件事情不能混租罩为一谈。fork是一个linux库函数。他是用来创建一个新的进程。至于exec是一个系陪判列函数，C标准库函数，用来改变进程上下文的。2者结合使用可以创建一个新的进程。

3.如果创建新的进程，一般是用fork，他会返回这个被创建进程的PID，你可以通过PID找到这个进程。

在 Linux 底下执行一个指令时，系统会给予这个动作一个 ID，我们称为 PID，而根据启用这个指令的使用者与相关的指令功能，而给予这个特定好洞 PID 一组权限，该指令可以进行的行为则与这个 PID 的权限有关。

linux进程简介

Linux是一个多任岁州务的操作系统，也就是说，在同一个时间内，可以有多个进程同时执行。如果读者对计算机硬件体系有一定了解的话，会知道我们大家常用的单CPU计算机实际上在一个时间片断内只能执行一条指令，那么Linux是如何实现多进程同时执行的呢？原来Linux使用了一种称为”进程调度（process scheng）”的手段，首先，为每个进程指派一定的运行时间，这个时间通常很短，短到以毫秒为单位，然后依照某种规则，从众多进程中挑选一个投入运行，其他的进程暂时等待，当正在运行的那个进程时间耗尽，或执行完毕退出，或因某种原因暂停，Linux就会重新进行调度，挑选下一个进程投入运行。因为每个进程占用的时间片都很短，在我们使用者的角度来看，就好像多个进程同时运行一样了。

在Linux中，每个进程在创建时都会被分配一个数据结构，称为进程控制块（Process Control Block，简称PCB）。PCB中包含了很多重要的信息，供系统调度和进程本身执行使用，其中最重要的莫过于进程ID（process ID）了，进程ID也被称作进程标识符，是一个非负的整数，在Linux操作系统中唯一地标志一个进程，在我们最常使用的I386架构（即PC使用的架构）上，一个非负的整数的变化范围是，这也是我们所有可能取到的进程ID。其实从进程ID的名字就可以看出，它就是进程的身份证号码，友雀枯每个人的身份证号码都不会相同，每个进程的进程ID也不会相同。

一个或多个进程可以合起来构成一个进程组（process group），一个或多个进程组可以合起来构成一个会话（session）。这样我们就有了对进程进行批量操作的能力，比如通过向某个进程组发送信号来实现向该组中的每个进程发送信号。

最后，让我们通过ps命令亲眼看一看自己的系统中目前有多少进程在运行：

$ps -aux（以下是在我的计算机上的运行结果，你的结果很可能与这不同。）

USERPID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND

root.1 0.?S May15 0:04 init

root.0 0.?SW May15 0:00

root.0 0.?SWN May15 0:00

root.0 0.?SW May15 0:00

root.0 0.?SW /* 提供类型pid_t的定义 */

#include /* 提供函数的定义 */

pid_t getpid(void);

getpid的作用很简单，就是返回当前进程的进程ID，请大家看以下的例子：

/* getpid_test.c */

#include

main()

{

printf(“The current process ID is %d

“,getpid());

}

细心的读者可能注意到了，这个程序的定义里并没有包含头文件sys/types.h，这是因为我们在程序中没有用到pid_t类型，pid_t类型即为进程ID的类型。事实上，在i386架构上（就是我们一般PC计算机的架构），pid_t类型是和int类型完全兼容的，我们可以用处理整形数的方法去处理pid_t类型的数据，比如，用”%d”把它打印出来。

编译并运行程序getpid_test.c：

$gcc getpid_test.c -o getpid_test

$./getpid_test

The current process ID is 1980

（你自己的运行结果很可能与这个数字不一样，这是很正常的。）

再运行一遍：

$./getpid_test

The current process ID is 1981

正如我们所见，尽管是同一个应用程序，每一次运行的时候，所分配的进程标识符都不相同。

fork

在2.4.4版内核中，fork是第2号系统调用，其在Linux函数库中的原型是：

#include /* 提供类型pid_t的定义 */

#include /* 提供函数的定义 */

pid_t fork(void);

只看fork的名字，可能难得有几个人可以猜到它是做什么用的。fork系统调用的作用是复制一个进程。当一个进程调用它，完成后就出现两个几乎一模一样的进程，我们也由此得到了一个新进程。据说fork的名字就是来源于这个与叉子的形状颇有几分相似的工作流程。

在Linux中，创造新进程的方法只有一个，就是我们正在介绍的fork。其他一些库函数，如system()，看起来似乎它们也能创建新的进程，如果能看一下它们的源码就会明白，它们实际上也在内部调用了fork。包括我们在命令行下运行应用程序，新的进程也是由shell调用fork制造出来的。fork有一些很有意思的特征，下面就让我们通过一个小程序来对它有更多的了解。

/* fork_test.c */

#include

#inlcude

main()

{

pid_t pid;

/*此时仅有一个进程*/

pid=fork();

/*此时已经有两个进程在同时运行*/

if(pid

void exit(int status);

不像fork那么难理解，从exit的名字就能看出，这个系统调用是用来终止一个进程的。无论在程序中的什么位置，只要执行到exit系统调用，进程就会停止剩下的所有操作，清除包括PCB在内的各种数据结构，并终止本进程的运行。请看下面的程序：

/* exit_test1.c */

#include

main()

{

printf(“this process will exit!

“);

exit(0);

printf(“never be displayed!

“);

}

编译后运行：

$gcc exit_test1.c -o exit_test1

$./exit_test1

this process will exit!

我们可以看到，程序并没有打印后面的”never be displayed! “，因为在此之前，在执行到exit(0)时，进程就已经终止了。

exit系统调用带有一个整数类型的参数status，我们可以利用这个参数传递进程结束时的状态，比如说，该进程是正常结束的，还是出现某种意外而结束的，一般来说，0表示没有意外的正常结束；其他的数值表示出现了错误，进程非正常结束。我们在实际编程时，可以用wait系统调用接收子进程的返回值，从而针对不同的情况进行不同的处理。关于wait的详细情况，我们将在以后的篇幅中进行介绍。

exit和_exit

作为系统调用而言，_exit和exit是一对孪生兄弟，它们究竟相似到什么程度，我们可以从Linux的源码中找到答案：

#define __NR__exit __NR_exit /* 摘自文件include/a-i386/unistd.h第334行 */

“__NR_”是在Linux的源码中为每个系统调用加上的前缀，请注意之一个exit前有2条下划线，第二个exit前只有1条下划线。

这时随便一个懂得C语言并且头脑清醒的人都会说，_exit和exit没有任何区别，但我们还要讲一下这两者之间的区别，这种区别主要体现在它们在函数库中的定义。_exit在Linux函数库中的原型是：

#include

void _exit(int status);

和exit比较一下，exit()函数定义在stdlib.h中，而_exit()定义在unistd.h中，从名字上看，stdlib.h似乎比unistd.h高级一点，那么，它们之间到底有什么区别呢？让我们先来看流程图，通过下图，我们会对这两个系统调用的执行过程产生一个较为直观的认识。

从图中可以看出，_exit()函数的作用最为简单：直接使进程停止运行，清除其使用的内存空间，并销毁其在内核中的各种数据结构；exit()函数则在这些基础上作了一些包装，在执行退出之前加了若干道工序，也是因为这个原因，有些人认为exit已经不能算是纯粹的系统调用。

exit()函数与_exit()函数更大的区别就在于exit()函数在调用exit系统调用之前要检查文件的打开情况，把文件缓冲区中的内容写回文件，就是图中的”清理I/O缓冲”一项。

在Linux的标准函数库中，有一套称作”高级I/O”的函数，我们熟知的printf()、fopen()、fread()、fwrite()都在此列，它们也被称作”缓冲I/O（buffered I/O）”，其特征是对应每一个打开的文件，在内存中都有一片缓冲区，每次读文件时，会多读出若干条记录，这样下次读文件时就可以直接从内存的缓冲区中读取，每次写文件的时候，也仅仅是写入内存中的缓冲区，等满足了一定的条件（达到一定数量，或遇到特定字符，如换行符和文件结束符EOF），再将缓冲区中的内容一次性写入文件，这样就大大增加了文件读写的速度，但也为我们编程带来了一点点麻烦。如果有一些数据，我们认为已经写入了文件，实际上因为没有满足特定的条件，它们还只是保存在缓冲区内，这时我们用_exit()函数直接将进程关闭，缓冲区中的数据就会丢失，反之，如果想保证数据的完整性，就一定要使用exit()函数。

请看以下例程：

/* exit2.c */

#include

main()

{

printf(“output begin

“);

printf(“content in buffer”);

exit(0);

}

编译并运行：

$gcc exit2.c -o exit2

$./exit2

output begin

content in buffer

/* _exit1.c */

#include

main()

{

printf(“output begin

“);

printf(“content in buffer”);

_exit(0);

}

编译并运行：

$gcc _exit1.c -o _exit1

$./_exit1

output begin

在Linux中，标准输入和标准输出都是作为文件处理的，虽然是一类特殊的文件，但从程序员的角度来看，它们和硬盘上存储数据的普通文件并没有任何区别。与所有其他文件一样，它们在打开后也有自己的缓冲区。

请读者结合前面的叙述，思考一下为什么这两个程序会得出不同的结果。相信如果您理解了我前面所讲的内容，会很容易的得出结论。

在这篇文章中，我们对Linux的进程管理作了初步的了解，并在此基础上学习了getpid、fork、exit和_exit四个系统调用。在下一篇文章中，我们将学习与Linux进程管理相关的其他系统调用，并将作一些更深入的探讨。

前面的文章中，我们已经了解了父进程和子进程的概念，并已经掌握了系统调用exit的用法，但可能很少有人意识到，在一个进程调用了exit之后，该进程并非马上就消失掉，而是留下一个称为僵尸进程（Zombie）的数据结构。在Linux进程的5种状态中，僵尸进程是非常特殊的一种，它已经放弃了几乎所有内存空间，没有任何可执行代码，也不能被调度，仅仅在进程列表中保留一个位置，记载该进程的退出状态等信息供其他进程收集，除此之外，僵尸进程不再占有任何内存空间。从这点来看，僵尸进程虽然有一个很酷的名字，但它的影响力远远抵不上那些真正的僵尸兄弟，真正的僵尸总能令人感到恐怖，而僵尸进程却除了留下一些供人凭吊的信息，对系统毫无作用。

也许读者们还对这个新概念比较好奇，那就让我们来看一眼Linux里的僵尸进程究竟长什么样子。

当一个进程已退出，但其父进程还没有调用系统调用wait（稍后介绍）对其进行收集之前的这段时间里，它会一直保持僵尸状态，利用这个特点，我们来写一个简单的小程序：

/* zombie.c */

#include

main()

{

pid_t pid;

pid=fork();

if(pid

printf(“error occurred!n”);

else if(pid==0) /* 如果是子进程 */

exit(0);

else /* 如果是父进程 */

sleep(60); /* 休眠60秒，这段时间里，父进程什么也干不了 */

wait(NULL); /* 收集僵尸进程 */

}

sleep的作用是让进程休眠指定的秒数，在这60秒内，子进程已经退出，而父进程正忙着睡觉，不可能对它进行收集，这样，我们就能保持子进程60秒的僵尸状态。

编译这个程序：

$ cc zombie.c -o zombie

后台运行程序，以使我们能够执行下一条命令：

$ ./zombie &

1577

列一下系统内的进程：

$ ps -ax

… …

1177 pts/0 S:00 -bash

1577 pts/0 S:00 ./zombie

1578 pts/0 Z:00

1579 pts/0 R:00 ps -ax

看到中间的”Z”了吗？那就是僵尸进程的标志，它表示1578号进程现在就是一个僵尸进程。

我们已经学习了系统调用exit，它的作用是使进程退出，但也仅仅限于将一个正常的进程变成一个僵尸进程，并不能将其完全销毁。僵尸进程虽然对其他进程几乎没有什么影响，不占用CPU时间，消耗的内存也几乎可以忽略不计，但有它在那里呆着，还是让人觉得心里很不舒服。而且Linux系统中进程数目是有限制的，在一些特殊的情况下，如果存在太多的僵尸进程，也会影响到新进程的产生。那么，我们该如何来消灭这些僵尸进程呢？

先来了解一下僵尸进程的来由，我们知道，Linux和UNIX总有着剪不断理还乱的亲缘关系，僵尸进程的概念也是从UNIX上继承来的，而UNIX的先驱们设计这个东西并非是因为闲来无聊想烦烦其他的程序员。僵尸进程中保存着很多对程序员和系统管理员非常重要的信息，首先，这个进程是怎么死亡的？是正常退出呢，还是出现了错误，还是被其它进程强迫退出的？其次，这个进程占用的总系统CPU时间和总用户CPU时间分别是多少？发生页错误的数目和收到信号的数目。这些信息都被存储在僵尸进程中，试想如果没有僵尸进程，进程一退出，所有与之相关的信息都立刻归于无形，而此时程序员或系统管理员需要用到，就只好干瞪眼了。

linux除了popen外，获取其它进程PID的方法有哪些？

getpid（取得进程识别码）

探究Linux进程的PID文件：从概念到实现 (linux 进程 pid文件)

linux 下，进程号pid与文件描述符有什么区别？

linux下的PID,PIDD是什么？他们之间的关系以及应用是什么？

linux除了popen外，获取其它进程PID的方法有哪些？

相关推荐

热门文章