• 技术文章 >运维 >linux运维

    linux fd是什么

    青灯夜游青灯夜游2022-05-09 16:24:50原创119

    在linux中,fd全称“File descriptor”,中文名为“文件描述符”,它是内核为了高效管理这些已经被打开的文件所创建的一种索引;它其实是一个非负整数,用于指代被打开的文件,所有执行I/O操作的系统调用都通过文件描述符来实现。

    本教程操作环境:linux5.9.8系统、Dell G3电脑。

    在linux中,fd全称“File descriptor”,中文名为“文件描述符”。文件描述符是一个非负整数,本质上是一个索引值(这句话非常重要)。

    Linux中的文件描述符(fd)

    我们知道在Linux系统中一切皆可以看成是文件,文件又可分为:普通文件、目录文件、链接文件和设备文件。在操作这些所谓的文件的时候,我们每操作一次就找一次名字,这会耗费大量的时间和效率。所以Linux中规定每一个文件对应一个索引,这样要操作文件的时候,我们直接找到索引就可以对其进行操作了。

    文件描述符(file descriptor)就是内核为了高效管理这些已经被打开的文件所创建的索引,其是一个非负整数(通常是小整数),用于指代被打开的文件,所有执行I/O操作的系统调用都通过文件描述符来实现。同时还规定系统刚刚启动的时候,0是标准输入,1是标准输出,2是标准错误。这意味着如果此时去打开一个新的文件,它的文件描述符会是3,再打开一个文件文件描述符就是4......

    Linux内核对所有打开的文件有一个文件描述符表格,里面存储了每个文件描述符作为索引与一个打开文件相对应的关系,简单理解就是下图这样一个数组,文件描述符(索引)就是文件描述符表这个数组的下标,数组的内容就是指向一个个打开的文件的指针。

    上面只是简单理解,实际上关于文件描述符,Linux内核维护了3个数据结构

    一个 Linux 进程启动后,会在内核空间中创建一个 PCB 控制块,PCB 内部有一个文件描述符表(File descriptor table),记录着当前进程所有可用的文件描述符,也即当前进程所有打开的文件。进程级的描述符表的每一条记录了单个进程所使用的文件描述符的相关信息,进程之间相互独立,一个进程使用了文件描述符3,另一个进程也可以用3。除了进程级的文件描述符表,系统还需要维护另外两张表:打开文件表、i-node 表。这两张表存储了每个打开文件的打开文件句柄(open file handle)。一个打开文件句柄存储了与一个打开文件相关的全部信息。

    系统级的打开文件描述符表:

    文件系统的i-node表:

    文件描述符、打开的文件句柄以及i-node之间的关系如下图:

    Linux文件描述符表示意图

    这就说明:同一个进程的不同文件描述符可以指向同一个文件;不同进程可以拥有相同的文件描述符;不同进程的同一个文件描述符可以指向不同的文件(一般也是这样,除了 0、1、2 这三个特殊的文件);不同进程的不同文件描述符也可以指向同一个文件。

    Linux上打开文件举例

    比如在Linux上用 vim test.py 打开一个文件,保持打开状态,再新打开一个新的shell,输入命令pidof vim 获取vim进程的pid号,然后 ll /proc/$pid/fd 查看vim 进程所使用的文件描述符列表。

    /dev/pts是远程登陆(telnet,ssh等)后创建的控制台设备文件所在的目录。因为我是通过Xshell远程登录的,所以标准输入0,标准输出1,标准错误2的文件描述符都指向虚拟终端控制台 /dev/pts/6 。再看下面是新打开的 test.py 的文件描述符,竟然是4,说好的从3开始呢?

    这个我也困扰了好久,查了各种资料,终于在一个大佬的帮助下在一个论坛找到原因,有时候中文查不到还是要试试英文搜索啊。因为vim这种编辑器的原理是先打开源文件并拷贝,然后关闭源文件再打开自己的副本,修改完文件保存的时候直接将副本重命名覆盖源文件。所以打开源文件的时候用的文件描述符3,然后打开自己的副本是时候就该用文件描述符4了,然后关闭源文件,文件描述符3就被释放了,我们查看的时候就只剩下了4,这里它指向的是vim创建的副本文件。这里只是说个大概意思,具体深究要去深入了解一下 vim的实现原理——奥尔特星云大使,下面是当时我看到的论坛上的资料截图,链接在这:StackOverFlow。

    如果不相信可以试一试别的进程,比如 tail。

    在Linux上用 tail -f test.py 打开一个文件,保持打开状态,再新打开一个新的shell,输入命令pidof tail 获取tail进程的pid号,然后 ll /proc/$pid/fd 查看tail进程所使用的文件描述符列表,可以看到文件描述符确实是从3开始使用的。tail不是编辑器不存在修改文件的情况,所以直接文件描述符直接打开的源文件。实际上可以使用 ll /proc/$pid/fd 命令获取当前运行的任意进程的文件描述符使用情况。

    扩展知识:Linux配置系统最大打开文件描述符个数

    (1)系统级限制

    理论上系统内存有多少就可以打开多少的文件描述符,但是在实际中内核是会做相应的处理,一般最大打开文件数会是系统内存的10%(以KB来计算),称之为系统级限制。这个数字可以通过 cat /proc/sys/fs/file-max 或者 sysctl -a | grep fs.file-max 命令查看。

    更改系统级限制有临时更改和永久更改两种方式:

    (2)用户级限制

    同时为了控制每个进程消耗的文件资源,内核也会对单个进程最大打开文件数做默认限制,即用户级限制。32位系统默认值一般是1024,64位系统默认值一般是65535,可以使用 ulimit -n 命令查看。

    更改用户级限制也有临时更改和永久更改两种方式:

    相关推荐:《Linux视频教程

    以上就是linux fd是什么的详细内容,更多请关注php中文网其它相关文章!

    声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn核实处理。
    专题推荐:linux
    上一篇:dir在linux中是什么意思 下一篇:linux下复制命令是什么
    千万级数据并发解决方案

    相关文章推荐

    • linux下安装zip的命令有哪些• linux怎么关闭selinux• linux怎么查询mac地址• linux中lsb是什么意思• linux中mnt是什么目录• 怎么查看linux是否支持ipv6
    1/1

    PHP中文网