Provided by: manpages-ja_0.5.0.0.20210215+dfsg-1_all
名前
proc - プロセスの情報を含む擬似ファイルシステム
説明
proc ファイルシステムは擬似的なファイルシステムであり、 カーネル内のデータへのインター フェースとして使用される。 一般的には /proc にマウントされる。 大部分のファイルは読み出し 専用 (read-only) であるが、 いくつかのファイルは書き込み可能であり、 そのファイルに書き込 めばカーネルの内部変数を変更できる。 以下のリストでは /proc 階層以下のファイルやディレクトリの多くについて説明している。 /proc/[pid] 実行中のプロセスについてのサブディレクトリ。 サブディレクトリ名は (そのプロセスの) プロセス ID である。 各サブディレクトリは、以下の擬似ファイルとディレクトリを含む。 /proc/[number]/auxv (カーネル 2.6.0-test7 以降) 実行時にプロセスに渡された ELF インタープリター情報が格納されている。 個々のエント リーは、unsigned long 型の ID 1 個に unsigned long 型の値 1 個が続くフォーマットで ある。 最後のエントリーには 0 が 2 個入っている。 getauxval(3) も参照。 /proc/[pid]/cgroup (Linux 2.6.24 以降) このファイルは、プロセスやタスクが所属するコントロールグループを示す。 cgroup の各 階層についてエントリーが 1 つあり、 各エントリーは以下の形式のコロン区切りのフィー ルドで構成される。 5:cpuacct,cpu,cpuset:/daemons コロン区切りの各フィールドは、左から右の順で、以下の意味を持つ。 1. 階層 ID 番号 2. その階層に関連付けたサブシステムの集合 3. プロセスが所属する階層内のコントロールグループ このファイルが存在するのは、カーネルのコンフィギュレーションオプショ ン CONFIG_CGROUPS を有効にした場合だけである。 /proc/[pid]/clear_refs (Linux 2.6.22 以降) このファイルは書き込み専用ファイルで、書き込めるのはプロセスの所有者だけである。 このファイルには以下の値を書き込むことができる。 1 (Linux 2.6.22 以降) Reset the PG_Referenced and ACCESSED/YOUNG bits for all the pages associated with the process. (Before kernel 2.6.32, writing any nonzero value to this file had this effect.) 2 (Linux 2.6.32 以降) Reset the PG_Referenced and ACCESSED/YOUNG bits for all anonymous pages associated with the process. 3 (Linux 2.6.32 以降) Reset the PG_Referenced and ACCESSED/YOUNG bits for all file-mapped pages associated with the process. Clearing the PG_Referenced and ACCESSED/YOUNG bits provides a method to measure approximately how much memory a process is using. One first inspects the values in the "Referenced" fields for the VMAs shown in /proc/[pid]/smaps to get an idea of the memory footprint of the process. One then clears the PG_Referenced and ACCESSED/YOUNG bits and, after some measured time interval, once again inspects the values in the "Referenced" fields to get an idea of the change in memory footprint of the process during the measured interval. If one is interested only in inspecting the selected mapping types, then the value 2 or 3 can be used instead of 1. A further value can be written to affect a different bit: 4 (Linux 3.11 以降) Clear the soft-dirty bit for all the pages associated with the process. This is used (in conjunction with /proc/[pid]/pagemap) by the check-point restore system to discover which pages of a process have been dirtied since the file /proc/[pid]/clear_refs was written to. Writing any value to /proc/[pid]/clear_refs other than those listed above has no effect. /proc/[pid]/clear_refs ファイルが存在するのは、カーネルのコンフィギュレーションオプ ション CONFIG_PROC_PAGE_MONITOR を有効にした場合だけである。 /proc/[pid]/cmdline この読み出し専用のファイルはプロセスの完全なコマンド行を保持する。 ただし、そのプロ セスがゾンビプロセスの場合は、 このファイルは空となる。 つまり、 このファイルを読み 出しても一文字も返らない。 このファイルではコマンドライン引き数が、 ヌルバイト ('\0') で区切られた文字列として書かれており、 最後の文字列の後にヌルバイトが一つ置 かれる。 /proc/[pid]/comm (Linux 2.6.33 以降) This file exposes the process's comm value—that is, the command name associated with the process. Different threads in the same process may have different comm values, accessible via /proc/[pid]/task/[tid]/comm. A thread may modify its comm value, or that of any of other thread in the same thread group (see the discussion of CLONE_THREAD in clone(2)), by writing to the file /proc/self/task/[tid]/comm. Strings longer than TASK_COMM_LEN (16) characters are silently truncated. This file provides a superset of the prctl(2) PR_SET_NAME and PR_GET_NAME operations, and is employed by pthread_setname_np(3) when used to rename threads other than the caller. /proc/[pid]/coredump_filter (Linux 2.6.23 以降) core(5) 参照。 /proc/[pid]/cpuset (Linux 2.6.12 以降) cpuset(7) 参照。 /proc/[pid]/cwd プロセスのカレントワーキングディレクトリへのシンボリックリンク。 例えば、プロセス 20 のカレントワーキングディレクトリを見つけるためには、 次のようにすればよい。 $ cd /proc/20/cwd; /bin/pwd pwd コマンドはシェルの内部コマンドのことがよくあり、 うまく動作しないかもしれない。 bash(1) では pwd -P を使ってもよい。 マルチスレッドプロセスでは、メインスレッドがすでに終了している場合、 このシンボリッ クリンクの内容は参照できない (スレッドの終了は通常 pthread_exit(3) を呼び出しによ り行われる)。 /proc/[pid]/environ このファイルはプロセスの環境変数を含んでいる。 各エントリーはヌルバイト ('\0') で区 切られていて、 末尾にヌルバイトがあるかもしれない。 したがって、プロセス 1 の環境変 数を表示するためには 次のようにすればよい。 $ strings /proc/1/environ /proc/[pid]/exe Linux 2.2 以降では、このファイルはシンボリックリンクで、 実行可能コマンドの実際のパ ス名を格納している。 このシンボリックリンクは通常のように辿ることができる; これを オープンすると実行可能ファイルがオープンされる。 (コマンドラインで) /proc/[pid]/exe と入力すると、プロセス番号 [pid] で実行されている 実行可能ファイルをもう一つ実行す ることができる。 マルチスレッドプロセスでは、メインスレッドがすでに終了している場 合、 このシンボリックリンクの内容は参照できない (スレッドの終了は通常 pthread_exit(3) を呼び出しにより行われる)。 Linux 2.0 以前では、 /proc/[pid]/exe は実行されたバイナリへのポインターで、シンボ リックリンクのように見える。 Linux 2.0 以前では、このファイルに対して readlink(2) を実行すると、次のフォーマットの文字列が返る。 [デバイス番号]:iノード番号 たとえば、[0301]:1502 はメジャーデバイス番号 03 (IDE, MFM などのドライブ) マイナー デバイス番号 01 (最初のドライブの最初のパーティション) の デバイス上の iノード番号 1502 である。 -inum オプションをつけて find(1) を使うと、 このファイルの所在を探すことができる。 /proc/[pid]/fd/ プロセスがオープンしたファイル各々に対するエントリーを含むサブディレクトリ。 ファイ ルディスクリプターがファイル名で、 実際のファイルへのシンボリックリンクになってい る。 したがって 0 は標準入力、1 は標準出力、2 は標準エラー出力、などとなる。 パイプやソケットのファイルディスクリプターでは、 エントリーはファイル種別が inode という内容を持つシンボリックリンクとなる。 このファイルに対して readlink(2) を呼び 出すと以下の形式の文字列が返る。 type:[inode] 例えば、 socket:[2248868] は inode が 2248868 のソケットである。 ソケットの場合、 その inode を元に /proc/net/ 以下のファイルを参照し詳しい情報を得ることができる。 対応する inode がないファイルディスクリプター (例えば epoll_create(2), eventfd(2), inotify_init(2), signalfd(2), timerfd(2) により生成されたファイルディスクリプター) では、 エントリーはその内容が以下の形式のシンボリックリンクとなる。 anon_inode:<file-type> file-type は角括弧で囲まれる場合がある。 例えば、 epoll ファイルディスクリプターは、 内容が文字列 anon_inode:[eventpoll] の シンボリックリンクを持つ場合がある。 マルチスレッドプロセスでは、メインスレッドがすでに終了している場合、 このディレクト リの内容は参照できない (スレッドの終了は通常 pthread_exit(3) を呼び出しにより行わ れる)。 コマンドライン引き数としてファイル名を受け取るが、引き数が 渡されなかった場合 に標 準入力から入力を受け取らないようなプログラムや、 コマンドライン引き数とし て書き込 みファイルを受け取るが、引き数が 渡されなかった場合に標準出力に出力を 行わないよう なプログラムであっても、 /proc/[pid]/fd を使うことで標準入力や 標準出力を使用できる ようになる。 例えば、 -i を入力ファイルを指定するフラ グ、 -o を出力ファイルを指定 するフラグと仮定すると、 $ foobar -i /proc/self/fd/0 -o /proc/self/fd/1 ... を実行することにより、フィルタとして動作させることができる。 /proc/self/fd/N は、ある種の UNIX や UNIX 風のシステムにある /dev/fd/N とだいたい同 じである。 事実 Linux のたいていの MAKEDEV スクリプトは、 /dev/fd を /proc/self/fd へのシンボリックリンクにしている。 ほとんどのシステムでは、シンボリックリンク /dev/stdin, /dev/stdout, /dev/stderr が 提供されており、それぞれ /proc/self/fd 内のファイル 0, 1, 2 にリンクされている。 し たがって、上述のサンプルコマンドは次のようにも書くことができる。 $ foobar -i /dev/stdin -o /dev/stdout ... /proc/[pid]/fdinfo/ (Linux 2.6.22 以降) このサブディレクトリには、そのプロセスがオープンしているファイル毎の エントリーが 入っており、ファイルディスクリプターがファイル名となっている。 各ファイルの内容を読 み出すことで、対応するファイルディスクリプターに関する 情報を得ることができる。以下 に例を示す。 $ cat /proc/12015/fdinfo/4 pos: 1000 flags: 01002002 pos フィールドは 10 進数で、現在のファイルオフセットを示す。 flags フィールドは 8 進数で、 ファイルのアクセスモードとファイル状態フラグを示す (open(2) 参照)。 このディレクトリのファイルは、プロセスの所有者だけが読み出すことができる。 /proc/[pid]/io (kernel 2.6.20 以降) このファイルは、 プロセスの I/O 統計情報を表示する。 以下に例を挙げる。 # cat /proc/3828/io rchar: 323934931 wchar: 323929600 syscr: 632687 syscw: 632675 read_bytes: 0 write_bytes: 323932160 cancelled_write_bytes: 0 フィールドの詳細は以下の通りである。 rchar: 読み出し文字数 このタスクがきっかけでストレージから読み出されたバイト数。 この値は、単純に read(2) や同様のシステムコールからこのプロセスに渡されたバイト数の合計であ る。 この値には、 端末入出力なども含まれ、 実際に物理ディスク I/O が必要で あったか (読み出しがページキャッシュからの読み出しで十分であったか) どうかは 関係ない。 wchar: 書き込み文字数 このタスクがきっかけで行われたか行われるはずのディスクへの書き込みバイト数。 rchar と同じ注意があてはまる。 syscr: 読み出しシステムコール数 読み出し I/O 操作—read(2) や pread(29 などのシステムコール—を試みた回数。 syscw: 書き込みシステムコール数 書き込み I/O 操作—write(2) や pwrite(29 などのシステムコール—を試みた回数。 read_bytes: 読み出しバイト数 このプロセスが実際にストレージ層から取得しようとしたバイト数。 ブロックデバ イス上のファイルシステムでは正確な値となる。 write_bytes: 書き込みバイト数 このプロセスが実際にストレージ層に転送しようとしたバイト数。 cancelled_write_bytes: The big inaccuracy here is truncate. If a process writes 1MB to a file and then deletes the file, it will in fact perform no writeout. But it will have been accounted as having caused 1MB of write. In other words: this field represents the number of bytes which this process caused to not happen, by truncating pagecache. A task can cause "negative" I/O too. If this task truncates some dirty pagecache, some I/O which another task has been accounted for (in its write_bytes) will not be happening. 注意: 現在の実装では 32 ビットシステムでは少しいやらしい点がある。 プロセス B が 64 ビットカウンターの一つを更新している途中に、プロセス A がプロセス B の /proc/[pid]/io を読んだ場合、 プロセス A に更新中の結果が見えることがある。 /proc/[pid]/gid_map (Linux 3.5 以降) /proc/[pid]/uid_map の説明を参照すること。 /proc/[pid]/limits (Linux 2.6.24 以降) このファイルは、そのプロセスの各リソース制限について、 ソフトリミット、ハードリミッ ト、計測単位を表示する (getrlimit(2) 参照)。 Linux 2.6.35 以前では、 プロセスの実 UID を持つプロセスだけが、 このファイルを読み出すことができる。 Linux 2.6.36 以降で は、 システム上のすべてのユーザーがこのファイルを読み出すことができる。 /proc/[pid]/map_files/ (kernel 3.3 以降) このサブディレクトリには、 メモリーマップされたファイルに対応するエントリーが置かれ る (mmap(2) 参照)。 エントリーの名前がメモリー領域の (16 進数表現の) 開始アドレスと 終了アドレスの組で、 エントリーはマップされているファイルへのシンボリックリンクであ る。 以下に例を示す。 なお、 出力は幅が 80 文字のディスプレイに合うように折り返して 整形されている。 $ ls -l /proc/self/map_files/ lr--------. 1 root root 64 Apr 16 21:31 3252e00000-3252e20000 -> /usr/lib64/ld-2.15.so ... これらのエントリーが存在するのは MAP_FILE フラグでマッピングされたメモリー領域につ いてであるが、 Linux での無名の共有メモリー (MAP_ANON | MAP_SHARED で作成された領 域) の実装方法では、 このディレクトリに無名の共有メモリーに関するエントリーも存在す る。 以下は、 マッピング元のファイルが削除された /dev/zero ファイルでの例である。 lrw-------. 1 root root 64 Apr 16 21:33 7fc075d2f000-7fc075e6f000 -> /dev/zero (deleted) このディレクトリが存在するのは、 カーネルのコンフィギュレーションオプション CONFIG_CHECKPOINT_RESTORE が有効になっている場合だけである。 /proc/[pid]/maps 現在マッピングされているメモリー領域とそのアクセスパーミッションを含む。 メモリー マッピングについての詳しい情報は mmap(2) を参照。 ファイルのフォーマットは以下のとおり: address perms offset dev inode pathname 00400000-00452000 r-xp 00000000 08:02 173521 /usr/bin/dbus-daemon 00651000-00652000 r--p 00051000 08:02 173521 /usr/bin/dbus-daemon 00652000-00655000 rw-p 00052000 08:02 173521 /usr/bin/dbus-daemon 00e03000-00e24000 rw-p 00000000 00:00 0 [heap] 00e24000-011f7000 rw-p 00000000 00:00 0 [heap] ... 35b1800000-35b1820000 r-xp 00000000 08:02 135522 /usr/lib64/ld-2.15.so 35b1a1f000-35b1a20000 r--p 0001f000 08:02 135522 /usr/lib64/ld-2.15.so 35b1a20000-35b1a21000 rw-p 00020000 08:02 135522 /usr/lib64/ld-2.15.so 35b1a21000-35b1a22000 rw-p 00000000 00:00 0 35b1c00000-35b1dac000 r-xp 00000000 08:02 135870 /usr/lib64/libc-2.15.so 35b1dac000-35b1fac000 ---p 001ac000 08:02 135870 /usr/lib64/libc-2.15.so 35b1fac000-35b1fb0000 r--p 001ac000 08:02 135870 /usr/lib64/libc-2.15.so 35b1fb0000-35b1fb2000 rw-p 001b0000 08:02 135870 /usr/lib64/libc-2.15.so ... f2c6ff8c000-7f2c7078c000 rw-p 00000000 00:00 0 [stack:986] ... 7fffb2c0d000-7fffb2c2e000 rw-p 00000000 00:00 0 [stack] 7fffb2d48000-7fffb2d49000 r-xp 00000000 00:00 0 [vdso] address フィールドは、 そのマッピングが占めているプロセスのアドレス空間である。 perms フィールドはパーミッションのセットである。 r = read w = write x = execute s = shared p = private (copy on write) offset はファイル (などの) 中でのオフセット、 dev はデバイス (メジャーデバイス番 号:マイナーデバイス番号)、 inode はそのデバイスの i ノード番号である。 0 は、BSS (初期化されていないデータ領域) の場合のように、 このメモリー領域はどの i ノードとも 関連付けられていないことを意味する。 pathname フィールドは、 通常そのマッピングに対応するファイルである。 ELF ファイルの 場合、 ELF プログラムヘッダーの Offset フィールドを見ることで (readelf -l))、 簡単 に offset との対応付けをすることができる。 これに加え、 役に立つ擬似パス名がある。 [stack] 初期プロセスのスタック (初期プロセスはメインスレッドとも呼ばれる)。 [stack:<tid>] (Linux 3.4 以降) スレッドのスタック (<tid> はスレッド ID である)。 パス /proc/[pid]/task/[tid]/ に対応する。 [vdso] 動的にリンクされる仮想共有オブジェクト (virtual dynamically linked shared object)。 [heap] プロセスのヒープ。 pathname が空の場合、 その領域は mmap(2) を使って確保された無名マッピングである。 gdb(1), strace(1) などを使ってプロセスを実行しない限り、 この領域をプロセスのソース と対応付ける簡単な方法はない。 Linux 2.0 ではパス名を書いたフィールドがない。 /proc/[pid]/mem このファイルは、 open(2), read(2), lseek(2) を通して、プロセスのメモリーのページに アクセスするために使われる。 /proc/[pid]/mountinfo (Linux 2.6.26 以降) このファイルには、マウントポイントについての情報が入っている。 以下のような形式の行 から構成される。 36 35 98:0 /mnt1 /mnt2 rw,noatime master:1 - ext3 /dev/root rw,errors=continue (1)(2)(3) (4) (5) (6) (7) (8) (9) (10) (11) 括弧付きの数字は、以下の説明のためのものである。 (1) マウント ID: マウントの一意な識別子 (umount(2) の後は再利用されるかもしれな い)。 (2) parent ID: 親マウントの ID (マウントツリーの最上位の場合は自分自身の ID とな る)。 (3) major:minor: ファイルシステム上のファイルの st_dev の値 (stat(2) 参照)。 (4) ルート: そのファイルシステム内のマウントのルート。 (5) マウントポイント: マウントポイントのそのプロセスのルートからの相対パス。 (6) マウントオプション: 各マウントのオプション。 (7) オプションフィールド: "tag[:value]" 形式のフィールドが 0 個以上並ぶ。 (8) セパレータ: オプションフィールドの終わりを示す。 (9) ファイルシステム種別: ファイルシステムの名前。 "type[.subtype]" という形式とな る。 (10) マウント元: ファイルシステム固有の情報。ない場合は "none" となる。 (11) super options: スーパーブロック単位のオプション。 解釈する側は認識できないオプションフィールドは全て無視すべきである。 現在のとこ ろ、オプションフィールドとしては以下のようなものがある。 shared:X マウントはピアグループ (peer group) X で共有されている。 master:X マウントはピアグループ (peer group) X のスレーブである。 propagate_from:X マウントはスレーブであり、ピアグループ X (*) から mount propagation を受信する。 unbindable マウントは unbind できない。 (*) X は、プロセスの root で直近の dominant peer group である。 X がマウントの直接 のマスターである場合や、 同じ root に dominant peer group がない場合は、 "master:X" フィールドだけが存在し、 "propagate_from:X" フィールドは存在しない。 mount propagation の詳細については、 Linux カーネルソースツリー内の Documentation/filesystems/sharedsubtree.txt を参照。 /proc/[pid]/mounts (Linux 2.4.19 以降) そのプロセスのマウント名前空間に現在マウントされている 全ファイルシステムのリスト。 このファイルのフォーマットは fstab(5) に載っている。 カーネル 2.6.15 以降では、この ファイルを監視することができる (pollable)。 このファイルを読み出し用にオープンした 後で、このファイルに変更があると (つまりファイルシステムのマウントやアンマウントが あると)、 select(2) ではそのファイルディスクリプターは読み出し可能となり、 poll(2) と epoll_wait(2) ではそのファイルはエラー状態として通知される。 詳細は namespaces(7) を参照。 /proc/[pid]/mountstats (Linux 2.6.17 以降) このファイルを通じて、そのプロセスのマウント名前空間内のマウントポイントに関する 各 種情報 (統計、設定情報) を参照できる。 ファイルの各行は以下のフォーマットである。 device /dev/sda7 mounted on /home with fstype ext3 [statistics] ( 1 ) ( 2 ) (3 ) (4) 各行のフィールドは以下の通りである。 (1) マウントされているデバイス名 (対応するデバイスがない場合は "nodevice" とな る)。 (2) マウントポイントのファイルシステムツリーにおけるパス名。 (3) ファイルシステム種別。 (4) 追加の統計や設定情報。 現在のところ (Linux 2.6.26 時点では)、 このフィールドで 情報が提供されているのは NFS ファイルシステムだけである。 このファイルはプロセスの所有者だけが読み出すことができる。 詳しい情報は namespaces(7) を参照。 /proc/[pid]/ns/ (Linux 3.0 以降) このサブディレクトリには、名前空間毎に 1 エントリーが置かれる。 各エントリーは setns(2) による操作をサポートしている。 詳細な情報は namespaces(7) を参照。 /proc/[pid]/numa_maps (Linux 2.6.14 以降) numa(7) を参照。 /proc/[pid]/oom_adj (Linux 2.6.11 以降) このファイルは、メモリー不足 (OOM) の状況下でどのプロセスを殺すべきかを選択す るの に使用されるスコアを調整するのに使用される。カーネルは、プロセスの oom_score 値の ビットシフト操作に、この値を使用する。この値として有効な値 は -16 から +15 まで と、特別な意味を持つ -17 である。 -17 はそのプロセス に対する OOM-killing を完全に 無効にすることを意味する。正の値ほど、そのプロ セスが OOM-killer により殺される可能 性が高くなり、負の値ほど可能性が低くなる。 このファイルのデフォルト値は 0 である。 新しいプロセスは親プロセスの oom_adj の設定 を継承する。 このファイルを変更するためには、プロセスは特権 (CAP_SYS_RESOURCE) を 持っていなければならない。 Linux 2.6.36 以降では、 このファイルの使用は非推奨とされ、 代わりに /proc/[pid]/oom_score_adj が推奨されている。 /proc/[pid]/oom_score (Linux 2.6.11 以降) このファイルは、OOM-killer のプロセス選択用として、カーネルが このプロセス に対して 与えた現在のスコアを表示する。 高いスコアは、そのプロセスが OOM-killer により選択さ れる 可能性が高いことを意味する。 このスコアの基本は そのプロセスが使用しているメモ リー量であり、 以下の要因により加算 (+) 減算 (-) が行われる。 * そのプロセスが多くの子プロセスを fork(2) を使って作成しているか (+)。 * そのプロセスが長時間実行されて来たか、 もしくは 多くの CPU 時間を使用しているか (-)。 * そのプロセスが低い nice 値 (> 0) を持っているか (+)。 * そのプロセスが特権を持っているか (-)。 * そのプロセスが direct hardware access を行っているか (-)。 oom_score は、そのプロセスの oom_score_adj や oom_adj 設定で規定される調整にも影響 を与える。 /proc/[pid]/oom_score_adj (Linux 2.6.36 以降) This file can be used to adjust the badness heuristic used to select which process gets killed in out-of-memory conditions. The badness heuristic assigns a value to each candidate task ranging from 0 (never kill) to 1000 (always kill) to determine which process is targeted. The units are roughly a proportion along that range of allowed memory the process may allocate from, based on an estimation of its current memory and swap use. For example, if a task is using all allowed memory, its badness score will be 1000. If it is using half of its allowed memory, its score will be 500. There is an additional factor included in the badness score: root processes are given 3% extra memory over other tasks. The amount of "allowed" memory depends on the context in which the OOM-killer was called. If it is due to the memory assigned to the allocating task's cpuset being exhausted, the allowed memory represents the set of mems assigned to that cpuset (see cpuset(7)). If it is due to a mempolicy's node(s) being exhausted, the allowed memory represents the set of mempolicy nodes. If it is due to a memory limit (or swap limit) being reached, the allowed memory is that configured limit. Finally, if it is due to the entire system being out of memory, the allowed memory represents all allocatable resources. The value of oom_score_adj is added to the badness score before it is used to determine which task to kill. Acceptable values range from -1000 (OOM_SCORE_ADJ_MIN) to +1000 (OOM_SCORE_ADJ_MAX). This allows user space to control the preference for OOM-killing, ranging from always preferring a certain task or completely disabling it from OOM killing. The lowest possible value, -1000, is equivalent to disabling OOM-killing entirely for that task, since it will always report a badness score of 0. Consequently, it is very simple for user space to define the amount of memory to consider for each task. Setting a oom_score_adj value of +500, for example, is roughly equivalent to allowing the remainder of tasks sharing the same system, cpuset, mempolicy, or memory controller resources to use at least 50% more memory. A value of -500, on the other hand, would be roughly equivalent to discounting 50% of the task's allowed memory from being considered as scoring against the task. For backward compatibility with previous kernels, /proc/[pid]/oom_adj can still be used to tune the badness score. Its value is scaled linearly with oom_score_adj. Writing to /proc/[pid]/oom_score_adj or /proc/[pid]/oom_adj will change the other with its scaled value. /proc/[pid]/pagemap (Linux 2.6.25 以降) このファイルは、 プロセスの各仮想ページの物理ページフレームやスワップ領域へのマッピ ングを表示する。 各仮想ページに 64 ビットの値 1 つが対応し、 各ビットは以下のとおり である。 63 セットされている場合、 このページは RAM に存在する。 62 セットされている場合、 このページはスワップ領域に存在する。 61 (Linux 3.5 以降) このページはファイルマップされたページか共有無名ページである。 60-56 (Linux 3.11 以降) ゼロ。 55 (Linux 3.11 以降) PTE が soft-dirty である (カーネルのソースファイル Documentation/vm/soft-dirty.txt を参照)。 54-0 このページが RAM に存在する場合 (ビット 63)、 これらのビットはページフ レーム番号を示す。 このページフレーム番号は /proc/kpageflags と /proc/kpagecount のインデックスに使用できる。 このページがスワップに存 在する場合 (ビット 62)、 ビット 4-0 はスワップ種別を示し、 ビット 54-5 はスワップオフセットを示す。 Linux 3.11 より前では、 ビット 60-55 はページサイズの基数 2 の log を示すのに使われ ていた。 /proc/[pid]/pagemap を効率的に活用するには、 /proc/[pid]/maps を使ってメモリーのど の領域が実際にマップされているかを判断し、 seek でマップされていない領域をスキップ するのがよい。 /proc/[pid]/pagemap ファイルが存在するのは、カーネルのコンフィギュレーションオプ ション CONFIG_PROC_PAGE_MONITOR を有効にした場合だけである。 /proc/[pid]/personality (Linux 2.6.28 以降) This read-only file exposes the process's execution domain, as set by personality(2). The value is displayed in hexadecimal notation. /proc/[pid]/root UNIX と Linux では、 ファイルシステムのルート (/) をプロセスごとに別々にできる。 こ れはシステムコール chroot(2) によって設定する。 このファイルはプロセスのルートディ レクトリを指すシンボリックリンクで、 exe や fd/* などと同じような動作をする。 マルチスレッドプロセスでは、メインスレッドがすでに終了している場合、 このシンボリッ クリンクの内容は参照できない (スレッドの終了は通常 pthread_exit(3) を呼び出しによ り行われる)。 /proc/[pid]/smaps (Linux 2.6.14 以降) このファイルは、そのプロセスの各マッピングのメモリー消費量を表示する (pmap(1) コマ ンドは解析しやすいであろう形式で同様の情報を表示する)。 マッピングのそれぞれについ て、以下のような内容が表示される。 00400000-0048a000 r-xp 00000000 fd:03 960637 /bin/bash Size: 552 kB Rss: 460 kB Pss: 100 kB Shared_Clean: 452 kB Shared_Dirty: 0 kB Private_Clean: 8 kB Private_Dirty: 0 kB Referenced: 460 kB Anonymous: 0 kB AnonHugePages: 0 kB Swap: 0 kB KernelPageSize: 4 kB MMUPageSize: 4 kB Locked: 0 kB 最初の行には、 /proc/[pid]/maps で表示されるマッピングと同じ情報が表示される。 残り の行には、マッピングのサイズ、現在 RAM 上に存在するマッピングの量 ("Rss")、 この マッピングのこのプロセスの proportional share ("Pss")、 マッピング内の共有ページの うちクリーンなページ数とダーティページ数、 マッピング内のプライベートページのうちク リーンなページ数とダーティページ数、を示す。 "Referenced" は参照された (referenced) かアクセスされたと現在印が付いているメモリー量を示す。 "Anonymous" はどのファイルに も属していないメモリー量を示す。 "Swap" は使用中だがスワップされている無名メモリー (would-be-anonymous memory) の量を示す。 The "KernelPageSize" entry is the page size used by the kernel to back a VMA. This matches the size used by the MMU in the majority of cases. However, one counter-example occurs on PPC64 kernels whereby a kernel using 64K as a base page size may still use 4K pages for the MMU on older processors. To distinguish, this patch reports "MMUPageSize" as the page size used by the MMU. The "Locked" indicates whether the mapping is locked in memory or not. "VmFlags" field represents the kernel flags associated with the particular virtual memory area in two letter encoded manner. The codes are the following: rd - readable wr - writable ex - executable sh - shared mr - may read mw - may write me - may execute ms - may share gd - stack segment grows down pf - pure PFN range dw - disabled write to the mapped file lo - pages are locked in memory io - memory mapped I/O area sr - sequential read advise provided rr - random read advise provided dc - do not copy area on fork de - do not expand area on remapping ac - area is accountable nr - swap space is not reserved for the area ht - area uses huge tlb pages nl - non-linear mapping ar - architecture specific flag dd - do not include area into core dump sd - soft-dirty flag mm - mixed map area hg - huge page advise flag nh - no-huge page advise flag mg - mergeable advise flag /proc/[pid]/smaps ファイルが存在するのは、カーネルのコンフィギュレーションオプショ ン CONFIG_PROC_PAGE_MONITOR を有効にした場合だけである。 /proc/[pid]/stack (Linux 2.6.29 以降) This file provides a symbolic trace of the function calls in this process's kernel stack. This file is provided only if the kernel was built with the CONFIG_STACKTRACE configuration option. /proc/[pid]/stat プロセスの状態についての情報。 これは ps(1) で使われ、 カーネルのソースファイル fs/proc/array.c で定義されている。 各フィールドを順番に、 scanf(3) のフォーマット指定子付きで以下に示す。 (1) pid %d プロセス ID。 (2) comm %s 括弧でくくられた実行形式のファイル名。 実行形式がスワップアウトされている かどうかによらず、 見ることができる。 (3) state %c プロセスの状態を示す、以下のいずれか 1 文字。 R 実行中 (Running) S Sleeping in an interruptible wait D Waiting in uninterruptible disk sleep Z ゾンビ (Zombie) T (シグナルでの) 停止、または (Linux 2.6.33 より前では) トレースによる停 止 t トレースによる停止 (Tracing stop) (Linux 2.6.33 以降) W ページング中 (Linux 2.6.0 より前のみ) X 死亡 (Dead) (Linux 2.6.0 以降) x 死亡 (Dead) (Linux 2.6.33 から 3.13 までのみ) K Wakekill (Linux 2.6.33 から 3.13 までのみ) W Waking (Linux 2.6.33 から 3.13 までのみ) P Parked (Linux 3.9 から 3.13 までのみ) (4) ppid %d このプロセスの親プロセスの PID。 (5) pgrp %d プロセスのプロセスグループ ID。 (6) session %d プロセスのセッション ID。 (7) tty_nr %d プロセスの制御端末 (マイナーデバイス番号はビット 31〜20 と 7〜0 にまた がって格納され、 メジャーデバイス番号はビット 15〜8 に格納される)。 (8) tpgid %d プロセスの制御端末のフォアグランド・プロセスグループの ID。 (9) flags %u プロセスのカーネルフラグワード。 ビットの意味は、 <linux/sched.h> で定義 されている PF_* を参照すること。 詳細はカーネルのバージョンに依存する。 このフィールドのフォーマットは Linux 2.6 より前では %lu であった。 (10) minflt %lu プロセスが引き起こしたマイナーフォールト (minor fault、ディスクから メモ リーページへのロードを必要としないフォールト) の回数。 (11) cminflt %lu (そのプロセスが終了を待っている) 子プロセスが引き起こしたマイナーフォール トの回数。 (12) majflt %lu プロセスが引き起こしたメジャーフォールト (major fault、ディスクからメモ リーページへのロードを必要とするフォールト) の回数。 (13) cmajflt %lu (そのプロセスが終了を待っている) 子プロセスが引き起こしたメジャーフォール トの回数。 (14) utime %lu このプロセスがユーザーモードでスケジューリングされた時間の合計。 clock tick 単位で計測される (sysconf(_SC_CLK_TCK) で割った値が表示される)。 こ の値にはゲスト時間 guest_time (仮想 CPU の実行に消費された時間) も含まれ る。これは、ゲスト時間のフィールドを認識しないアプリケーションにおい て、ゲスト時間分を計算に入れ損ねないようにするためである。 (15) stime %lu プロセスのカーネルモードでの実行時間 (単位 jiffies)。 このプロセスがカー ネルモードでスケジューリングされた時間の合計。 clock tick 単位で計測され る (sysconf(_SC_CLK_TCK) で割った値が表示される)。 (16) cutime %ld このプロセスの子プロセスで、終了待ち (waited-for) のプロセスが、 ユーザー モードでスケジューリングされた時間の合計。 clock tick 単位で計測される (sysconf(_SC_CLK_TCK) で割った値が表示される)。 (times(2) も参照するこ と。) この値にはゲスト時間 cguest_time (仮想 CPU を実行するのに消費した時 間、下記参照) も含まれる。 (17) cstime %ld このプロセスの子プロセスで、終了待ち (waited-for) のプロセスが、カーネル モードでスケジューリングされた時間の合計。 clock tick 単位で計測される (sysconf(_SC_CLK_TCK) で割った値が表示される)。 (18) priority %ld (Linux 2.6 の場合の説明) リアルタイムスケジューリングポリシー (下記の policy ; sched_setscheduler(2) 参照) で動作しているプロセスでは、 この 値 はスケジューリング優先度を反転した値 (スケジューリング優先度を マイナスに し た値) となる。値は -2 から -100 までの範囲の数値で、 それぞれリアルタ イム優先 度の 1 から 99 に対応する。 リアルタイム以外のスケジューリングポ リシーで動作し ているプロセスでは、 この値はカーネル内で管理されている nice 値そのもの (setpriority(2)) となる。 カーネルは nice 値を 0 (高) か ら 39 (低) の範囲 の値として保持しており、 それぞれユーザーに見える nice 値の -20 から 19 に対応 する。 Linux 2.6 より前では、このプロセスに割り当てられたスケジューリング 重みを 変換した値が表示されていた。 (19) nice %ld nice 値 (setpriority(2) 参照)。 19 (最低優先) から -20 (最高優先) の範囲 の値である。 (20) num_threads %ld このプロセスのスレッド数 (Linux 2.6 以降)。 カーネル 2.6 より前では、この フィールドは削除されたフィールドの 場所埋めとして 0 にハードコードされて いた。 (21) itrealvalue %ld インターバルタイマーによって、次に SIGALRM がプロセスへ送られるまでの時間 (単位 jiffies)。 カーネル 2.6.17 以降では、このフィールドはメンテナンスさ れなくなり、 0 にハードコードされている。 (22) starttime %llu プロセスの起動時刻。システムが起動した時刻が起点である。 Linux 2.6 より前 のカーネルでは、 この値の単位は jiffies であった。 Linux 2.6 以降では、 値の単位はクロック tick である (sysconf(_SC_CLK_TCK) で割った値となる)。 このフィールドのフォーマットは Linux 2.6 より前では %lu であった。 (23) vsize %lu 仮想メモリーのサイズ。単位はバイト。 (24) rss %ld Resident Set Size。プロセスが持っている実メモリー上のページ数。 これは ちょうどテキスト、データ、スタック空間に使われているページ数である。 デマ ンドロードされていないページや スワップアウトされたページの数は含んでいな い。 (25) rsslim %lu このプロセスの rss の現在のソフトリミット (バイト単位)。 getrlimit(2) の RLIMIT_RSS の説明を参照。 (26) startcode %lu プログラムテキストが実行可能であるような領域の先頭アドレス。 (27) endcode %lu プログラムテキストが実行可能であるような領域の末尾アドレス。 (28) startstack %lu スタックの開始アドレス (すなわち、スタックの底)。 (29) kstkesp %lu 現在の ESP (スタックポインター) の値。 プロセスのカーネルスタックページに ある。 (30) kstkeip %lu 現在の EIP (インストラクションポインター) の値。 (31) signal %lu 処理待ちのシグナルのビットマップ。 10 進数で表示される。このフィールドは 廃止予定である。リアルタイムシグナルに関する情報は表示されないからであ る。代わりに /proc/[pid]/status を使うこと。 (32) blocked %lu ブロックされた (blocked) シグナルのビットマップ。 10 進数で表示される。 このフィールドは廃止予定である。 リアルタイムシグナルに関する情報は表示さ れないからである。 代わりに /proc/[pid]/status を使うこと。 (33) sigignore %lu 無視された (ignored) シグナルのビットマップ。 10 進数で表示される。 この フィールドは廃止予定である。 リアルタイムシグナルに関する情報は表示されな いからである。 代わりに /proc/[pid]/status を使うこと。 (34) sigcatch %lu 捕捉された (caught) シグナルのビットマップ。 10 進数で表示される。 この フィールドは廃止予定である。 リアルタイムシグナルに関する情報は表示されな いからである。 代わりに /proc/[pid]/status を使うこと。 (35) wchan %lu This is the "channel" in which the process is waiting. It is the address of a location in the kernel where the process is sleeping. The corresponding symbolic name can be found in /proc/[pid]/wchan. (36) nswap %lu スワップされたページ数 (メンテナンスされていない)。 (37) cnswap %lu 子プロセスの nswap の累計 (メンテナンスされていない)。 (38) exit_signal %d (Linux 2.1.22 以降) プロセスが死んだときに親プロセスに送られるシグナル。 (39) processor %d (Linux 2.2.8 以降) このプロセスを最後に実行した CPU の番号。 (40) rt_priority %u (Linux 2.5.19 以降) リアルタイムスケジューリングの優先度。 リアルタイムポリシーの元でスケ ジューリングされるプロセスでは 1 から 99 の範囲の値となり、 リアルタイム 以外のスケジューリングポリシーのプロセスでは 0 となる (sched_setscheduler(2) 参照)。 (41) policy %u (Linux 2.5.19 以降) スケジューリングポリシー (sched_setscheduler(2) 参照)。 値は、 linux/sched.h の SCHED_* 定数を使ってデコードすればよい。 このフィールドのフォーマットは Linux 2.6.22 より前は %lu であった。 (42) delayacct_blkio_ticks %llu (Linux 2.6.18 以降) (clock tick (100分の1秒) 単位での) ブロック I/O の総遅延量。 (43) guest_time %lu (Linux 2.6.24 以降) プロセスのゲスト時間 (ゲスト OS の仮想 CPU を実行するのに消費された時 間)。 clock tick 単位で計測される (sysconf(_SC_CLK_TCK) で割った値が表示 される)。 (44) cguest_time %ld (Linux 2.6.24 以降) プロセスの子プロセスのゲスト時間。 clock tick 単位で計測される (sysconf(_SC_CLK_TCK) で割った値が表示される)。 (45) start_data %lu (Linux 3.3 以降) Address above which program initialized and uninitialized (BSS) data are placed. (46) end_data %lu (Linux 3.3 以降) Address below which program initialized and uninitialized (BSS) data are placed. (47) start_brk %lu (Linux 3.3 以降) Address above which program heap can be expanded with brk(2). (48) arg_start %lu (Linux 3.5 以降) プログラムのコマンドライン引き数 (argv) が置かれる開始アドレス。 (49) arg_end %lu (Linux 3.5 以降) プログラムのコマンドライン引き数 (argv) が置かれる終了アドレス。 (50) env_start %lu (Linux 3.5 以降) プログラムの環境 (environment) が置かれる開始アドレス。 (51) env_end %lu (Linux 3.5 以降) プログラムの環境 (environment) が置かれる終了アドレス。 (52) exit_code %d (Linux 3.5 以降) waitpid(2) が報告する形式のスレッドの終了ステータス。 /proc/[pid]/statm (ページ単位で計測した) メモリー使用量についての情報を提供する。 各列は以下の通りで ある。 size プログラムサイズの総計 (/proc/[pid]/status の VmSize と同じ) resident 実メモリー上に存在するページ (/proc/[pid]/status の VmRSS と同じ) share 共有ページ (ファイルと関連付けられているページ) text テキスト (コード) lib ライブラリ (Linux 2.6 では未使用) data データ + スタック dt ダーティページ (Linux 2.6 では未使用) /proc/[pid]/status /proc/[pid]/stat と /proc/[pid]/statm にある多くの情報を、人間が解析しやすい形式で 提供する。 以下に例を示す。 $ cat /proc/$$/status Name: bash State: S (sleeping) Tgid: 3515 Pid: 3515 PPid: 3452 TracerPid: 0 Uid: 1000 1000 1000 1000 Gid: 100 100 100 100 FDSize: 256 Groups: 16 33 100 VmPeak: 9136 kB VmSize: 7896 kB VmLck: 0 kB VmHWM: 7572 kB VmRSS: 6316 kB VmData: 5224 kB VmStk: 88 kB VmExe: 572 kB VmLib: 1708 kB VmPTE: 20 kB VmSwap: 0 kB Threads: 1 SigQ: 0/3067 SigPnd: 0000000000000000 ShdPnd: 0000000000000000 SigBlk: 0000000000010000 SigIgn: 0000000000384004 SigCgt: 000000004b813efb CapInh: 0000000000000000 CapPrm: 0000000000000000 CapEff: 0000000000000000 CapBnd: ffffffffffffffff Seccomp: 0 Cpus_allowed: 00000001 Cpus_allowed_list: 0 Mems_allowed: 1 Mems_allowed_list: 0 voluntary_ctxt_switches: 150 nonvoluntary_ctxt_switches: 545 フィールドの詳細は以下の通りである。 * Name: このプロセスにより実行されたコマンド。 * State: プロセスの現在の状態。 "R (running; 実行中)", "S (sleeping; 休眠状態)", "D (disk sleep; ディスク待ちの休眠状態)", "T (stopped; 停止状態)", "T (tracing stop; トレースによる停止)", "Z (zombie; ゾンビ状態)", "X (dead; 死亡)" のいずれかであ る。 * Tgid: スレッドグループ ID (すなわち、プロセス ID)。 * Pid: スレッド ID (gettid(2) 参照)。 * PPid: 親プロセスの PID。 * TracerPid: このプロセスをトレースしているプロセスの PID (トレースされていない場合 は 0)。 * Uid, Gid: 実 UID/GID、実効 UID/GID、保存 set-UID/GID、ファイルシステム UID/GID。 * FDSize: 現在割り当てられているファイルディスクリプターのスロット数。 * Groups: 補助グループのリスト。 * VmPeak: 仮想メモリーサイズのピーク値。 * VmSize: 仮想メモリーサイズ。 * VmLck: ロックされているメモリーサイズ (mlock(3) 参照)。 * VmHWM: 実メモリー上に存在するページサイズ (resident set size) のピーク値 ("high water mark")。 * VmRSS: 実メモリー上に存在するページサイズ。 * VmData, VmStk, VmExe: データ、スタック、テキストセグメントのサイズ。 * VmLib: 共有ライブラリコードのサイズ。 * VmPTE: ページテーブルエントリーのサイズ (Linux 2.6.10 以降)。 * VmSwap: スワップアウトされた仮想メモリーサイズ (Linux 2.6.34 以降). * Threads: このスレッドが属するプロセスのスレッド数。 * SigQ: このフィールドにはスラッシュで区切られた 2 つの数字が入っている。この数字は このプロセスの実ユーザー ID 宛にキューイングされたシグナルに関するものである。一 つ目の数字は、この実ユーザー ID 宛に現在キューイングされているシグナル数であ る。二つ目の数字は、このプロセス宛にキューイングされたシグナル数に関するリソース 上限値である (getrlimit(2) の RLIMIT_SIGPENDING の説明を参照)。 * SigPnd, ShdPnd: スレッド宛およびプロセス全体宛の処理待ちシグナルの数 (pthreads(7), signal(7) 参照)。 * SigBlk, SigIgn, SigCgt: ブロックされるシグナル、無視されるシグナル、捕捉待ちのシ グナルを 示すマスク値 (signal(7))。 * CapInh, CapPrm, CapEff: 継承可能 (inheritable)、許可 (permitted)、実効 (effective) の各ケーパビリティセットで有効になっているケーパビリティのマスク値 (capabilities(7) 参照)。 * CapBnd: ケーパビリティバウンディングセット (Linux 2.6.26 以降、 capabilities(7) 参照)。 * Seccomp: Seccomp mode of the process (since Linux 3.8, see seccomp(2)). 0 means SECCOMP_MODE_DISABLED; 1 means SECCOMP_MODE_STRICT; 2 means SECCOMP_MODE_FILTER. This field is provided only if the kernel was built with the CONFIG_SECCOMP kernel configuration option enabled. * Cpus_allowed: このプロセスが実行を許可されている CPU のマスク値 (Linux 2.6.24 以 降、 cpuset(7) 参照)。 * Cpus_allowed_list: 前項と同じだが、「リスト形式」での表示 (Linux 2.6.26 以降、 cpuset(7) 参照)。 * Mems_allowed: このプロセスが使用できるメモリーノードのマスク値 (Linux 2.6.24 以 降、 cpuset(7) 参照)。 * Mems_allowed_list: 前項と同じだが、「リスト形式」での表示 (Linux 2.6.26 以降、 cpuset(7) 参照)。 * voluntary_ctxt_switches, nonvoluntary_ctxt_switches: 自発的/非自発的なコンテキス トスイッチの回数 (Linux 2.6.23 以降)。 /proc/[pid]/syscall (Linux 2.6.27 以降) This file exposes the system call number and argument registers for the system call currently being executed by the process, followed by the values of the stack pointer and program counter registers. The values of all six argument registers are exposed, although most system calls use fewer registers. If the process is blocked, but not in a system call, then the file displays -1 in place of the system call number, followed by just the values of the stack pointer and program counter. If process is not blocked, then file contains just the string "running". カーネルの設定で CONFIG_HAVE_ARCH_TRACEHOOK が有効になっている場合にのみ、このファ イルは存在する。 /proc/[pid]/task (Linux 2.6.0-test6 以降) このディレクトリには、そのプロセスのスレッド情報を含む サブディレクトリが 1 スレッ ドにつき 1 つ置かれる。 各サブディレクトリの名前はスレッドのスレッド ID ([tid]) を 示す数字である (gettid(2) を参照)。 これらの各サブディレクトリには、 /proc/[pid] ディレクトリ以下と同じ名前と内容のファイル群がある。 すべてのスレッドで共有される属 性の場合、 task/[tid] サブディレクトリ以下の各ファイルの内容は 親ディレクトリ /proc/[pid] の対応するファイルと同じになることだろう (例えば、マルチスレッドプロセ スではファイル task/[tid]/cwd はいずれも親ディレクトリ内の /proc/[pid]/cwd と同じ値 を持つことになる。なぜなら、一つのプロセスに属すすべての スレッドは作業ディレクトリ を共有するからである)。 スレッド毎に独立な属性の場合、 task/[tid] サブディレクトリ 以下の各ファイルは異なる値を持つことがある (例えば、ファイル task/[tid]/status はス レッド毎に異なる値を持つ可能性がある)。 マルチスレッドプロセスでは、メインスレッドがすでに終了している場合、 /proc/[pid]/task ディレクトリの内容は参照できない (スレッドの終了は通常 pthread_exit(3) を呼び出しにより行われる)。 /proc/[pid]/uid_map, /proc/[pid]/gid_map (Linux 3.5 以降) These files expose the mappings for user and group IDs inside the user namespace for the process pid. The description here explains the details for uid_map; gid_map is exactly the same, but each instance of "user ID" is replaced by "group ID". The uid_map file exposes the mapping of user IDs from the user namespace of the process pid to the user namespace of the process that opened uid_map (but see a qualification to this point below). In other words, processes that are in different user namespaces will potentially see different values when reading from a particular uid_map file, depending on the user ID mappings for the user namespaces of the reading processes. Each line in the file specifies a 1-to-1 mapping of a range of contiguous between two user namespaces. The specification in each line takes the form of three numbers delimited by white space. The first two numbers specify the starting user ID in each user namespace. The third number specifies the length of the mapped range. In detail, the fields are interpreted as follows: (1) The start of the range of user IDs in the user namespace of the process pid. (2) The start of the range of user IDs to which the user IDs specified by field one map. How field two is interpreted depends on whether the process that opened uid_map and the process pid are in the same user namespace, as follows: a) If the two processes are in different user namespaces: field two is the start of a range of user IDs in the user namespace of the process that opened uid_map. b) If the two processes are in the same user namespace: field two is the start of the range of user IDs in the parent user namespace of the process pid. (The "parent user namespace" is the user namespace of the process that created a user namespace via a call to unshare(2) or clone(2) with the CLONE_NEWUSER flag.) This case enables the opener of uid_map (the common case here is opening /proc/self/uid_map) to see the mapping of user IDs into the user namespace of the process that created this user namespace. (3) The length of the range of user IDs that is mapped between the two user namespaces. After the creation of a new user namespace, the uid_map file may be written to exactly once to specify the mapping of user IDs in the new user namespace. (An attempt to write more than once to the file fails with the error EPERM.) The lines written to uid_map must conform to the following rules: * The three fields must be valid numbers, and the last field must be greater than 0. * Lines are terminated by newline characters. * There is an (arbitrary) limit on the number of lines in the file. As at Linux 3.8, the limit is five lines. * The range of user IDs specified in each line cannot overlap with the ranges in any other lines. In the current implementation (Linux 3.8), this requirement is satisfied by a simplistic implementation that imposes the further requirement that the values in both field 1 and field 2 of successive lines must be in ascending numerical order. Writes that violate the above rules fail with the error EINVAL. In order for a process to write to the /proc/[pid]/uid_map (/proc/[pid]/gid_map) file, the following requirements must be met: * The process must have the CAP_SETUID (CAP_SETGID) capability in the user namespace of the process pid. * The process must have the CAP_SETUID (CAP_SETGID) capability in the parent user namespace. * The process must be in either the user namespace of the process pid or inside the parent user namespace of the process pid. For further details, see namespaces(7). /proc/[pid]/wchan (Linux 2.6.0 以降) The symbolic name corresponding to the location in the kernel where the process is sleeping. /proc/apm Advanced Power Management のバージョンとバッテリ情報。 カーネルのコンパイル時に CONFIG_APM を定義したときに存在する。 /proc/buddyinfo This file contains information which is used for diagnosing memory fragmentation issues. Each line starts with the identification of the node and the name of the zone which together identify a memory region This is then followed by the count of available chunks of a certain order in which these zones are split. The size in bytes of a certain order is given by the formual: (2^order) * PAGE_SIZE The binary buddy allocator algorithm inside the kernel will split one chunk into two chunks of a smaller order (thus with half the size) or combine two contiguous chunks into one larger chunk of a higher order (thus with double the size) to satisfy allocation requests and to counter memory fragmentation. The order matches the column number, when starting to count at zero. For example on a x86_64 system: Node 0, zone DMA 1 1 1 0 2 1 1 0 1 1 3 Node 0, zone DMA32 65 47 4 81 52 28 13 10 5 1 404 Node 0, zone Normal 216 55 189 101 84 38 37 27 5 3 587 In this example, there is one node containing three zones and there are 11 different chunk sizes. If the page size is 4 kilobytes, then the first zone called DMA (on x86 the first 16 megabyte of memory) has 1 chunk of 4 kilobytes (order 0) available and has 3 chunks of 4 megabytes (order 10) available. If the memory is heavily fragmented, the counters for higher order chunks will be zero and allocation of large contiguous areas will fail. Further information about the zones can be found in /proc/zoneinfo. /proc/bus インストールされている各バス用にサブディレクトリがある。 /proc/bus/pccard PCMCIA デバイスの情報が書かれるサブディレクトリ。 カーネルのコンパイル時に CONFIG_PCMCIA を定義したときに存在する。 /proc/[pid]/timers (Linux 3.10 以降) このプロセスの POSIX タイマーのリスト。 各タイマーは文字列 "ID:" で始まる行に表示さ れる。 例: ID: 1 signal: 60/00007fff86e452a8 notify: signal/pid.2634 ClockID: 0 ID: 0 signal: 60/00007fff86e452a8 notify: signal/pid.2634 ClockID: 1 各タイマーに表示される行の意味は次の通りである。 ID このタイマーの ID。 この ID は timer_create(2) が返すタイマー ID と同じでは ない。 siginfo_t 構造化の si_timerid フィールドで参照できるカーネル内部での ID と同じである (sigaction(2) 参照)。 signal このタイマーが通知の配送に使用するシグナル番号である。 スラッシュの後ろ は、シグナルハンドラーに渡される sigev_value.sival_ptr 値である。 シグナルで 通知されるタイマーでのみ有効である。 notify スラッシュの前の部分は、このタイマーが使用する通知の配送方法であり、「スレッ ド」「シグナル」「なし」のいずれかである。 スラッシュのすぐ後には、 SIGEV_THREAD_ID 通知を行うタイマーでは文字列の "tid" が、 もしくは他の方法で 通知するタイマーでは "pid" が表示される。 "." の後ろは、 そのタイマーがシン グルで通知を配送する場合にはシグナルの配送対象となるプロセスの PID である。 ClockID このフィールドはタイマーが時間を計測するのに使用するクロックを示す。 ほとん どのクロックでは、このフィールドは <time.h> で公開されるユーザー空間の CLOCK_* 定数のいずれかの数字である。 CLOCK_PROCESS_CPUTIME_ID タイマーで は、このフィールドに -6 が表示される。 CLOCK_THREAD_CPUTIME_ID タイマーでは -2 が表示される。 /proc/bus/pccard/drivers /proc/bus/pci いくつかのサブディレクトリがあり、 PCI バス・インストールされているデバイス・ デバ イスドライバの情報が書かれた仮想ファイルがある。 これらのファイルのうちいくつかは ASCII フォーマットではない。 /proc/bus/pci/devices PCI デバイスの情報。 lspci(8) や setpci(8) でアクセスすることができる。 /proc/cmdline ブート時に Linux カーネルに渡された引き数。 引き数の受け渡しは、たいてい lilo(8) や grub(8) といったブートマネージャを使って行われる。 /proc/config.gz (Linux 2.6 以降) このファイルでは、現在実行中のカーネルの構築時に使用された 設定オプションを参照でき る。 書式は、 (make xconfig, make config などを使って) カーネルの設定を変更した際に 生成される .config ファイルのものと同じである。 ファイルの内容は圧縮されており、 zcat(1) や zgrep(1) を使うと、表示や検索ができる。 ファイルが変更されていない限り、 /proc/config.gz の内容は次のコマンドで得られる内容と同じである。 cat /lib/modules/$(uname -r)/build/.config /proc/config.gz が提供されるのは、カーネルの設定で CONFIG_IKCONFIG_PROC が有効に なっている場合のみである。 /proc/cpuinfo このファイルは、CPU およびシステムアーキテクチャーに依存する項目を 集めたもので、リ ストの内容はサポートされているアーキテクチャー毎に異なる。 2 つだけ共通の項目があ る。 processor はプロセッサ番号で、 bogomips はカーネルの初期化時に計算されるシステ ム定数である。 SMP マシンでは各 CPU についての情報が書かれている。 lscpu(1) コマン ドはこのファイルから情報を収集する。 /proc/devices メジャーデバイス番号とデバイスグループのテキスト形式のリスト。 MAKEDEV スクリプトは このファイルを使って、 カーネルとの整合性を保つことができる。 /proc/diskstats (Linux 2.5.69 以降) このファイルには各ディスクデバイスのディスク I/O 統計情報が書かれている。 更に詳し い情報は、Linux カーネルソースファイル Documentation/iostats.txt を参照すること。 /proc/dma 登録されている ISA DMA (direct memory access) チャネルのリスト。 /proc/driver 空のサブディレクトリ。 /proc/execdomains 実行ドメインのリスト (ABI パーソナリティ)。 /proc/fb カーネルのコンパイル時に CONFIG_FB が定義されている場合、フレームバッファーの情報が 書かれる。 /proc/filesystems カーネルが対応しているファイルシステムのテキスト形式のリスト。 カーネルに組み込まれ てコンパイルされたファイルシステムと、 カーネルモジュールが現在ロードされているファ イルシステムが列挙される (filesystems(5) 参照)。 ファイルシステムに "nodev" という 印が付いている場合、 そのファイルシステムがマウントするためのブロックデバイスを 必 要としないことを意味する (例えば、 仮想ファイルシステム、ネットワークファイルシステ ムなど)。 ちなみに、マウント時にファイルシステムが指定されず、 どうやってもファイルシステムの 種類を判定できなかった際に、 このファイルを mount(8) が使用するかもしれない。 その 場合、このファイルに含まれるファイルシステムが試される (ただし、"nodev" の印がつい たものは除く)。 /proc/fs マウントされているファイルシステムに関する情報を提供するファイルが入ったサブディレ クトリが入っている。 /proc/ide このディレクトリは IDE バスをもつシステムに存在する。 各 IDE チャネルとそれに取り付 けられている各デバイスごとにディレクトリがあり、 以下のファイルが含まれている。 cache バッファーサイズ (KB) capacity セクタ数 driver ドライバのバージョン geometry 物理ジオメトリと論理ジオメトリ identify 16 進数表記 media メディアのタイプ model 製造者のモデル番号 settings ドライブの設定 smart_thresholds 16 進数表記 smart_values 16 進数表記 hdparm(8) ユーティリティは、分かりやすい形式で この情報にアクセスするための手段を 提供する。 /proc/interrupts IO デバイス毎の CPU 別の割り込み回数の記録に使われる。 Linux 2.6.24 以降、少なくと も i386 と x86_64 アーキテクチャーでは、 (デバイスと関連がない) システム内部の割り 込みについても記録される。 システム内部の割り込みには、NMI (nonmaskable interrupt), LOC (local timer interrupt) や、SMP システムでは TLB (TLB flush interrupt), RES (rescheduling interrupt), CAL (remote function call interrupt) などがある。 簡単に 読むことのできるフォーマットで、ASCII で表記されている。 /proc/iomem Linux 2.4 における I/O メモリーマップ。 /proc/ioports 現在登録され使われている I/O ポート領域のリスト。 /proc/kallsyms (Linux 2.5.71 以降) カーネルの外部シンボル定義を保持する。 modules(X) 関係のツールがローダーブルモ ジュールを動的にリンクしたり バインド (bind) するのに使われる。 Linux 2.5.47 以前で は、微妙に異なる書式の似たようなファイルが ksyms という名前であった。 /proc/kcore このファイルはシステムの物理メモリーを表現しており、 ELF コアファイル形式 (core file format) で保持されている。 この擬似ファイルと strip されていないカーネルのバイ ナリ (/usr/src/linux/vmlinux) [訳注: パッケージに依存する]) があれば、 GDB はカー ネル内の任意のデータ構造の現在の状態を調べられる。 このファイルの大きさは物理メモリー (RAM) のサイズに 4KB を加えた値である。 /proc/kmsg このファイルは syslog(2) システムコールでカーネルメッセージを読み出す代りに使え る。 プロセスがこのファイルを読むためにはスーパーユーザー権限が必要であり、 ファイ ルを読み出すのは 1 つのプロセスのみに限るべきである。 カーネルメッセージを記録する ために、 syslog(2) システムコールの機能を使う syslog プロセスが稼働している場合、 このファイルを読み出すべきではない。 このファイルの中の情報は dmesg(1) によって表示される。 /proc/kpagecount (Linux 2.6.25 以降) このファイルには、 各物理ページフレームがマッピングされた回数が 64 ビットカウンター として入っている。 インデックスはページフレーム番号である (/proc/[pid]/pagemap の議 論を参照)。 /proc/kpagecount ファイルが存在するのは、カーネルのコンフィギュレーションオプション CONFIG_PROC_PAGE_MONITOR を有効にした場合だけである。 /proc/kpageflags (Linux 2.6.25 以降) このファイルには、 各物理ページフレームに対応する 64 ビットマスクが入っている。 イ ンデックスはページフレーム番号である (/proc/[pid]/pagemap の議論を参照)。 各ビット は以下のとおりである。 0 - KPF_LOCKED 1 - KPF_ERROR 2 - KPF_REFERENCED 3 - KPF_UPTODATE 4 - KPF_DIRTY 5 - KPF_LRU 6 - KPF_ACTIVE 7 - KPF_SLAB 8 - KPF_WRITEBACK 9 - KPF_RECLAIM 10 - KPF_BUDDY 11 - KPF_MMAP (Linux 2.6.31 以降) 12 - KPF_ANON (Linux 2.6.31 以降) 13 - KPF_SWAPCACHE (Linux 2.6.31 以降) 14 - KPF_SWAPBACKED (Linux 2.6.31 以降) 15 - KPF_COMPOUND_HEAD (Linux 2.6.31 以降) 16 - KPF_COMPOUND_TAIL (Linux 2.6.31 以降) 16 - KPF_HUGE (Linux 2.6.31 以降) 18 - KPF_UNEVICTABLE (Linux 2.6.31 以降) 19 - KPF_HWPOISON (Linux 2.6.31 以降) 20 - KPF_NOPAGE (Linux 2.6.31 以降) 21 - KPF_KSM (Linux 2.6.32 以降) 22 - KPF_THP (Linux 3.4 以降) これらのビットの意味の詳しい説明は、 カーネルのソースファイル Documentation/vm/pagemap.txt を参照。 カーネル 2.6.29 より前では、 KPF_WRITEBACK, KPF_RECLAIM, KPF_BUDDY, KPF_LOCKED は正しい値を返さなかった。 /proc/kpageflags ファイルが存在するのは、カーネルのコンフィギュレーションオプション CONFIG_PROC_PAGE_MONITOR を有効にした場合だけである。 /proc/ksyms (Linux 1.1.23-2.5.47) /proc/kallsyms を参照。 /proc/loadavg このファイルの最初の 3 つのフィールドはロードアベレージの数値で、 1, 5, 15 分 あた りの実行キュー内 (state R) または ディスク I/O 待ち (state D) のジョブ数 を与える。 これは uptime(1) などのプログラムによって得られる値と同じである。 4 番目のフィール ドはスラッシュ (/) で区切られた 2 つの数値から構成される。 この数値のうち最初のもの は、現在実行可能なカーネルスケジュールエンティティ (プロセス、スレッド) の数であ る。スラッシュの後の数値は、現在システム上に 存在するカーネルスケジュールエンティ ティの数である。 5 番目のフィールドは システム上に最も最近生成されたプロセスの PID である。 /proc/locks このファイルは現在のファイルロック (flock(2) と fcntl(2)) とリース (fcntl(2)) を 表示する。 /proc/malloc (Linux 2.2 以前のみ) コンパイルのときに CONFIGDEBUGMALLOC が定義されているときのみ、このファイルは存在す る。 /proc/meminfo このファイルはシステムのメモリー使用状況の統計情報を表示する。 free(1) はこのファイ ルを使って、 そのシステムの (物理メモリーとスワップの両方の) 未使用と使用中のメモ リー量と、 カーネルが使用している共有メモリーとバッファーの使用量を表示する。 この ファイルの各行は、パラメーター名の後に、 コロン、 パラメーター値が続く。 最後に ("kB" などの) 計測単位がある場合もある。 以下のリストでは、 フィールド名と、フィー ルド値を読み込むのに必要なフォーマット指定子 (format specifier) について説明する。 特に注記がある場合を除くと、すべてのフィールドが少なくとも Linux 2.6.0 以降では存在 する。 いくつかのフィールドは、カーネルでオプションが有効になっている場合にのみ表示 される。 こうした依存関係についてはリスト内に注記がある。 MemTotal %lu 使用可能な RAM の総量 (つまり、 物理 RAM サイズからいくつかの予約ビットと カーネルのバイナリコードの分を引いた値)。 MemFree %lu LowFree+HighFree の合計値。 Buffers %lu Relatively temporary storage for raw disk blocks that shouldn't get tremendously large (20MB or so). Cached %lu ディスクから読み出したファイルのインメモリーキャッシュ (ページキャッシュ)。 SwapCached は含まれない。 SwapCached %lu 一度スワップアウトされ、その後スワップインされたが、まだスワップファイルにも 存在するメモリー。 (メモリーが残り少ない場合、 これらのページは、すでにス ワップファイルに存在するので、もう一度スワップアウトする必要がない。 これに より I/O が節約できる。) Active %lu 最近使用されたメモリーで、通常は本当に必要にならない限り回収されないメモ リー。 Inactive %lu 最近あまり使用されていないメモリー。 他の使用するために優先して回収すべきメ モリー。 Active(anon) %lu (Linux 2.6.28 以降) [後で記載する] Inactive(anon) %lu (Linux 2.6.28 以降) [後で記載する] Active(file) %lu (Linux 2.6.28 以降) [後で記載する] Inactive(file) %lu (Linux 2.6.28 以降) [後で記載する] Unevictable %lu (Linux 2.6.28 以降) (Linux 2.6.28 から 2.6.30 まででは CONFIG_UNEVICTABLE_LRU が必要であった。) [後で記載する] Mlocked %lu (Linux 2.6.28 以降) (Linux 2.6.28 から 2.6.30 まででは CONFIG_UNEVICTABLE_LRU が必要であった。) [後で記載する] HighTotal %lu (Linux 2.6.19 以降では CONFIG_HIGHMEM が必要) highmem の総量。 highmem は物 理メモリーの 860MB 付近よりも上の部分のメモリー領域全体のことである。 highmem 領域はユーザー空間プログラムとページキャッシュで使用される。 カーネ ルはこのメモリーにアクセスするのに小技を使っており、 lowmem よりもアクセスが 遅くなる。 HighFree %lu (Linux 2.6.19 以降では CONFIG_HIGHMEM が必要) 未使用の highmem 量。 LowTotal %lu (Starting with Linux 2.6.19, CONFIG_HIGHMEM is required.) Total amount of lowmem. Lowmem is memory which can be used for everything that highmem can be used for, but it is also available for the kernel's use for its own data structures. Among many other things, it is where everything from Slab is allocated. Bad things happen when you're out of lowmem. LowFree %lu (Linux 2.6.19 以降では CONFIG_HIGHMEM が必要) 未使用の lowmem 量。 MmapCopy %lu (Linux 2.6.29 以降) (CONFIG_MMU が必要) [後で記載する] SwapTotal %lu 利用可能なスワップ空間の総量。 SwapFree %lu 現在未使用のスワップ空間の量。 Dirty %lu ディスクに書き戻されるのを待っているメモリー。 Writeback %lu 現在ディスクに書き戻し中のメモリー。 AnonPages %lu (Linux 2.6.18 以降) ユーザー空間ページテーブルにマッピングされているファイルと関連付けられていな いページ。 Mapped %lu (mmap(2) で) メモリーにマッピングされているファイル。 ライブラリなど。 Shmem %lu (Linux 2.6.32 以降) [後で記載する] Slab %lu カーネル内のデータ構造体のキャッシュ。 SReclaimable %lu (Linux 2.6.19 以降) 回収可能な Slab。 キャッシュなど。 SUnreclaim %lu (Linux 2.6.19 以降) メモリー消費が激しい際でも回収できない Slab。 KernelStack %lu (Linux 2.6.32 以降) カーネルスタックに割り宛てられているメモリー量。 PageTables %lu (Linux 2.6.18 以降) Amount of memory dedicated to the lowest level of page tables. Quicklists %lu (Linux 2.6.27 以降) (CONFIG_QUICKLIST が必要) [後で記載する] NFS_Unstable %lu (Linux 2.6.18 以降) サーバに送信されたが、まだ永続的なストレージには書き込まれていない NFS ペー ジ。 Bounce %lu (Linux 2.6.18 以降) Memory used for block device "bounce buffers". WritebackTmp %lu (Linux 2.6.26 以降) FUSE で一時的なライトバックバッファーに使われているメモリー。 CommitLimit %lu (Linux 2.6.10 以降) This is the total amount of memory currently available to be allocated on the system, expressed in kilobytes. This limit is adhered to only if strict overcommit accounting is enabled (mode 2 in /proc/sys/vm/overcommit_memory). The limit is calculated according to the formula described under /proc/sys/vm/overcommit_memory. For further details, see the kernel source file Documentation/vm/overcommit-accounting. Committed_AS %lu The amount of memory presently allocated on the system. The committed memory is a sum of all of the memory which has been allocated by processes, even if it has not been "used" by them as of yet. A process which allocates 1GB of memory (using malloc(3) or similar), but touches only 300MB of that memory will show up as using only 300MB of memory even if it has the address space allocated for the entire 1GB. This 1GB is memory which has been "committed" to by the VM and can be used at any time by the allocating application. With strict overcommit enabled on the system (mode 2 in IR /proc/sys/vm/overcommit_memory ), allocations which would exceed the CommitLimit will not be permitted. This is useful if one needs to guarantee that processes will not fail due to lack of memory once that memory has been successfully allocated. VmallocTotal %lu vmalloc メモリー領域の総量。 VmallocUsed %lu 使用中の vmalloc 領域の量。 VmallocChunk %lu vmalloc 領域の未使用の連続するブロックの最大サイズ。 HardwareCorrupted %lu (Linux 2.6.32 以降) (CONFIG_MEMORY_FAILURE が必要) [後で記載する] AnonHugePages %lu (Linux 2.6.38 以降) (CONFIG_TRANSPARENT_HUGEPAGE が必要) ユーザー空間ページテーブルにマッピング されているファイルと関連付けられていないヒュージページ。 HugePages_Total %lu (CONFIG_HUGETLB_PAGE が必要) ヒュージページのプールサイズ。 HugePages_Free %lu (CONFIG_HUGETLB_PAGE が必要) プール内の割り当てられていないヒュージページ 数。 HugePages_Rsvd %lu (Linux 2.6.17 以降) (CONFIG_HUGETLB_PAGE が必要) プールから割り当てが宣言されたが、まだ割り当て が行われていないヒュージページ数。 これらの予約ヒュージページにより、 アプリ ケーションがメモリーフォールト時にヒュージページのプールからヒュージページが 割り当てられることが保証される。 HugePages_Surp %lu (Linux 2.6.24 以降) (CONFIG_HUGETLB_PAGE is required.) This is the number of huge pages in the pool above the value in /proc/sys/vm/nr_hugepages. The maximum number of surplus huge pages is controlled by /proc/sys/vm/nr_overcommit_hugepages. Hugepagesize %lu (CONFIG_HUGETLB_PAGE が必要) ヒュージページのサイズ。 /proc/modules 現在システムにロードされているモジュールのテキスト形式のリスト。 lsmod(8) も参照。 /proc/mounts カーネル 2.4.19 より前では、このファイルは現在システムにマウントされている 全ての ファイルシステムのリストであった。 Linux 2.4.19 でプロセス単位のマウント名前空間が 導入されたことに伴い、 このファイルは /proc/self/mounts へのリンクとなった。 /proc/self/mounts はそのプロセス自身のマウント名前空間のマウントポイントのリストで ある。 このファイルのフォーマットは fstab(5) に記述されている。 /proc/mtrr Memory Type Range Registers。 詳細は、Linux カーネルソースファイル Documentation/mtrr.txt を参照すること。 /proc/net さまざまなネットワークについての擬似ファイルで、 それぞれがネットワーク層の各種の状 態を与える。 これらのファイルの内容は ASCII 形式なので、 cat(1) で読み出せる。 と はいえ基本コマンドの netstat(8) はこれらのファイルの内容のよりすっきりとした表示を 提供する。 /proc/net/arp アドレス解決に使われるカーネルの ARP テーブルの ASCII 可読なダンプを保持している。 動的結合されたものと固定 (preprogrammed) の両方の APP エントリーを見ることができ る。フォーマットは以下のとおり: IP address HW type Flags HW address Mask Device 192.168.0.50 0x1 0x2 00:50:BF:25:68:F3 * eth0 192.168.0.250 0x1 0xc 00:00:00:00:00:00 * eth0 ここで IP address はマシンの IPv4 アドレス、 HW type はそのアドレスの RFC 826 で定 められているハードウェアの形式、 Flags は ARP 構造体 (/usr/include/linux/if_arp.h 内で定義されている) の内部フラグ、 HW address はその IP アドレスにマップされている データリンク層のアドレス (もしわかっていれば) である。 /proc/net/dev 擬似ファイル dev はネットワークデバイスの状態情報を含んでいる。 これは送受信したパ ケット数、エラーとコリジョン (collision) の回数、 その他の基本的な統計を与える。 こ れらは ifconfig(8) がデバイスの状態を報告するのに使われる。 フォーマットは以下のと おり: Inter-| Receive | Transmit face |bytes packets errs drop fifo frame compressed multicast|bytes packets errs drop fifo colls carrier compressed lo: 2776770 11307 0 0 0 0 0 0 2776770 11307 0 0 0 0 0 0 eth0: 1215645 2751 0 0 0 0 0 0 1782404 4324 0 0 0 427 0 0 ppp0: 1622270 5552 1 0 0 0 0 0 354130 5669 0 0 0 0 0 0 tap0: 7714 81 0 0 0 0 0 0 7714 81 0 0 0 0 0 0 /proc/net/dev_mcast /usr/src/linux/net/core/dev_mcast.c で定義されており、以下の形式である。 indx interface_name dmi_u dmi_g dmi_address 2 eth0 1 0 01005e000001 3 eth1 1 0 01005e000001 4 eth2 1 0 01005e000001 /proc/net/igmp Internet Group Management Protocol (インターネットグループ管理プロトコル)。 /usr/src/linux/net/core/igmp.c で定義されている。 /proc/net/rarp このファイルは arp と同じフォーマットで 逆アドレス解決サービス (reverse address lookup services) rarp(8) に提供するために使われる現在の逆マップデータベースの内容 を含んでいる。 RARP がカーネルコンフィグレーションに設定されていなければ、 このファ イルは存在しない。 /proc/net/raw RAW ソケットテーブルのダンプを保持している。 ほとんどの情報はデバッグ以外では 使わ れない。 "sl" の値はソケットのカーネルハッシュスロット、 "local_address" はローカル アドレスとプロトコル番号のペア [訳者追加: "rem_address" はリモートアドレスとプロト コル番号のペア]。 "st" はソケットの内部状態。 "tx_queue" と "rx_queue" はカーネルメ モリーを 消費している 送信/受信データキューのサイズ。 "tr" と "tm->when" と "rexmits" フィールドは RAW では使われていない。 "uid" フィールドはソケット生成者の 実効 UID を保持している。 /proc/net/snmp このファイルは SNMP エージェントが必要とする IP, ICMP, TCP, UDP 管理情報を ASCII データとして保持している。 /proc/net/tcp TCP ソケットテーブルのダンプを保持している。 大部分の情報はデバッグ以外には使われな い。 sl はソケットのカーネルハッシュスロットの値、 "local_address" はローカルアドレ スとポート番号のペアである。 (ソケットが接続している場合は) "rem_address" はリモー トアドレスとポート番号の対である。 "st" はソケットの内部状態である。 "tx_queue" と "rx_queue" はカーネルメモリーを消費している送信/受信データキューのサイズ。 "tr" と "tm->when" と "rexmits" フィールドはソケット状態のカーネル 内部情報を保持している が、 これらが役に立つのはデバッグのときだけである。 "uid" フィールドはソケット生成 者の実効 UID を保持している。 /proc/net/udp UDP ソケットテーブルのダンプを保持している。 大部分の情報はデバッグ以外には 使われ ない。 sl はソケットのカーネルハッシュスロットの値、 "local_address" はローカルアド レスとポート番号のペアである。 (ソケットが接続している場合は) "rem_address" はリ モートアドレスとポート番号のペアである。 "st" はソケットの 内部状態である。 "tx_queue" と "rx_queue" はカーネルメモリーを消費している 送信/受信データキューのサ イズ。 "tr" と "tm->when" と "rexmits" フィールドは UDP では使われていない。 "uid" フィールドはソケット生成者の 実効 UID を保持している。 フォーマットは以下のとおり: sl local_address rem_address st tx_queue rx_queue tr rexmits tm->when uid 1: 01642C89:0201 0C642C89:03FF 01 00000000:00000001 01:000071BA 00000000 0 1: 00000000:0801 00000000:0000 0A 00000000:00000000 00:00000000 6F000100 0 1: 00000000:0201 00000000:0000 0A 00000000:00000000 00:00000000 00000000 0 /proc/net/unix UNIX ドメインソケットのリスト。 フォーマットは以下のとおり: Num RefCount Protocol Flags Type St Path 0: 00000002 00000000 00000000 0001 03 1: 00000001 00000000 00010000 0001 01 /dev/printer ここで、Num はカーネルのテーブルスロット数、 RefCount はソケットを使用して いるユー ザー数、 Protocol はいまのところいつも 0 で、Flags はソケットの状態 を保持している カーネル内部のフラグである。 Type はいまのところいつも 1 (UNIX ドメインのデータグラ ムソケットは、現在のカーネルではサポートされていない [訳注: 2.0.34 ではサポートされ ているようだ])。 St はソケットの内部状態で、Path は(もしあれば) ソケットのパス名で ある。 /proc/net/netfilter/nfnetlink_queue このファイルは netfilter ユーザー空間キューイングが使用されている場合 netfilter ユーザー空間キューイングの情報を表示する。 各行が各キューの情報を表示する。 ユー ザー空間で購読されていないキューは表示されない。 1 4207 0 2 65535 0 0 0 1 (1) (2) (3)(4) (5) (6) (7) (8) 各行のフィールドは以下の通りである。 (1) キューの ID。 これは iptables(8) NFQUEUE ターゲットの --queue-num や --queue-balance オプションで指定された値と一致する。 詳しい情報は iptables-extensions(8) を参照。 (2) キューを購読している netlink ポート ID。 (3) 現在キューに入っていてアプリケーションが処理するのを待っているパケット数。 (4) キューのコピーモード。 値は 1 (メタデータのみ) か 2 (ペイロードデータもユー ザー空間にコピーする) のいずれかである。 (5) コピーする範囲。 つまり、 最大で何バイトのパケットペイロードをユーザー空間にコ ピーする必要があるかを示す。 (6) キューでの破棄数。 すでに多数のパケットがユーザー空間が必ず必要な受け入れ/破棄 の判定を送り返すのを待っていたため、 カーネルがドロップする必要があったパケッ ト数。 (7) キューのユーザーでのドロップ数。 netlink サブシステム内で破棄されたパケット 数。 このようなパケットの破棄が通常起こるのは、 対応するソケットバッファーが一 杯の場合、 つまり、 ユーザー空間がメッセージを十分な速度で読み出せない場合であ る。 (8) シーケンス番号。 キューに入ったすべてのパケットには 32 ビットの単調増加のシー ケンス番号が関連付けられる。 これは一番最近キューに入ったパケットの ID とな る。 最後の数字は互換性のためだけに存在し、 常に 1 である。 /proc/partitions 各パーティションのメジャー番号とマイナー番号が書かれている。 さらに、 1024 バイトブ ロック数とパーティション名も書かれている。 /proc/pci カーネルの初期化時に見つかったすべての PCI デバイスのリストと その設定。 このファイルは非推奨であり、新しい PCI 用の /proc インターフェイス (/proc/bus/pci) を使うこと。 このファイルは Linux 2.2 でオプションになった (カーネルのコンパイル時 に CONFIG_PCI_OLD_PROC をセットすると利用可能であった)。 Linux 2.4 で再びオプション なしで有効に戻った。 さらに、Linux 2.6 で非推奨となり (CONFIG_PCI_LEGACY_PROC を セットするとまだ利用可能であった)、 最終的に Linux 2.6.17 以降で完全に削除された。 /proc/profile (Linux 2.4 以降) このファイルは、 カーネルが profile=1 コマンドラインオプションで起動された場合にの み存在する。 このファイルは、 カーネルのプロファイリング情報を readprofile(1) を 使って読み込めるバイナリ形式で公開する。 このファイルに (例えば、空の文字列を) 書き 込むと、プロファイリングカウンターがリセットされる。 いくつかのアーキテクチャーで は、 サイズ sizeof(int) のバイナリ整数である「プロファイリング倍率」を書き込むとプ ロファイリングの割り込み頻度を設定できる。 /proc/scsi scsi 中間レベル擬似ファイルといくつかの SCSI 低レベルドライバの ディレクトリを含む ディレクトリ。 これらのファイルは ASCII で表現されているので cat(1) で読める。 いくつかのファイルは書き込み可能で、サブシステムの設定を変更したり、 特定の機能をオ ン/オフすることができる。 /proc/scsi/scsi カーネルが知っているすべての SCSI デバイスのリスト。 このリストは起動時に (コンソー ルで) 見られるものとほぼ同じである。 scsi は現在のところ add-single-device コマンド のみをサポートしている。 これによりルート (root) は既知のデバイスリストへ活線挿抜 (hotplugged) デバイスを加えることができる。 次のコマンドを実行すると、 echo 'scsi add-single-device 1 0 5 0' > /proc/scsi/scsi ホストアダプター scsi1 は SCSI チャネル 0 で ID 5 LUN 0 のデバイスを探す。 もしこの アドレスに既知のデバイスがあるか、 不正なアドレスであったならばエラーが返る。 /proc/scsi/[drivername] いまのところ [drivername] は NCR53c7xx, aha152x, aha1542, aha1740, aic7xxx, buslogic, eata_dma, eata_pio, fdomain, in2000, pas16, qlogic, scsi_debug, seagate, t128, u15-24f, ultrastore, wd7000 のどれかである。 少なくとも 1 つの SCSI ホストバ スアダプター (HBA) に ドライバが割り当てられていると、そのドライバに対応したディレ クトリが現れる。 それぞれのディレクトリには、 登録されたホストアダプターに対応して ファイルが作られる。 このファイルの名前は、システムの初期化の際に ホストアダプター に割り当てられた番号になる。 これらのファイルを読めばドライバとホストアダプターの設定や 統計などを見ることができ る。 これらのファイルへの書き込みはホストアダプターごとに異なる動作を引き起こす。 たとえ ば latency と nolatency コマンドを用いると、 ルート (root、スーパーユーザー) は eata_dma ドライバの隠し測定コードの オン/オフを切り替えることができる。 また lockup と unlock コマンドを用いると、ルートは scsi_debug ドライバがシミュレートする バスロックアップ (bus lockup) を 制御することができる。 /proc/self このディレクトリはプロセスに (プロセス自身の) /proc ファイルシステムへのアクセスを 参照させる。 これは /proc 内の (このプロセスの) プロセス ID が名前となっている ディ レクトリと全く同一である。 /proc/slabinfo Linux 2.6.16 以降では、 カーネル設定オプション CONFIG_SLAB が有効の場合にのみ、この ファイルは存在する。 カーネルキャッシュの情報。 /proc/slabinfo のフィールドは以下の とおり。 cache-name num-active-objs total-objs object-size num-active-slabs total-slabs num-pages-per-slab 詳細は slabinfo(5) を参照すること。 /proc/stat カーネル/システムの統計。 アーキテクチャーによって異なる。 共通エントリーには以下の ものが含まれる。 cpu 3357 0 4313 1362393 各種状態で消費された時間の合計値。 時間は USER_HZ を単位として計測される (ほ とんどのアーキテクチャーでは USER_HZ は 1/100 秒で、 正しい値は sysconf(_SC_CLK_TCK) を使って取得できる)。 user (1) ユーザーモードで消費した時間。 nice (2) 低い優先度 (nice) のユーザーモードで消費した時間。 system (3) システムモードで消費した時間。 idle (4) タスク待ち (idle task) で消費した時間。 この値は擬似ファイル /proc/uptime の 2 番目のエントリーの値を USER_HZ 倍した値になるはずで ある。 iowait (Linux 2.5.41 以降) (5) I/O の完了待ちの時間。 irq (Linux 2.6.0-test4 以降) (6) 割り込みの処理に使った時間。 softirq (Linux 2.6.0-test4 以降) (7) ソフト割り込みの処理に使った時間。 steal (Linux 2.6.11 以降) (8) 盗まれた時間 (stolen time)。仮想化環境での動作時に他のオペレー ティングシステムにより消費された時間である。 guest (Linux 2.6.24 以降) (9) Linux カーネルの制御下のゲストオペレーティングシステムの仮想 CPU の 実行に消費された時間。 guest_nice (Linux 2.6.33 以降) (10) nice が適用されたゲスト (Linux カーネルの制御下のゲストオペレー ティングシステムの仮想 CPU) の 実行に消費された時間。 page 5741 1808 システムが (ディスクから) ページイン/ページアウトしたページ数。 swap 1 0 スワップイン/スワップアウトされたページ数。 intr 1462898 この行はシステム起動時以降に処理された割り込みの回数を示す。 最初の欄は処理 された割り込み全ての合計であり、 これには番号が割り振られていないアーキテク チャー固有の割り込みも含まれる。 それ以降の欄はそれぞれ番号が割り振られた割 り込みについての合計である。 番号が割り振られていない割り込みは表示されず、 全体の合計にのみ加算される。 disk_io: (2,0):(31,30,5764,1,2) (3,0):... (メジャー番号, ディスクインデックス番号):(情報なし (noinfo), 読み込み回数, 読み込みブロック数, 書き出し回数, 書き出しブロック数) (Linux 2.4 のみ) ctxt 115315 コンテクストスイッチの延べ回数。 btime 769041601 起動時刻、紀元 (Epoch; 1970-01-01 00:00:00 +0000 (UTC)) からの秒数。 processes 86031 システム起動時からの延べフォーク (fork) 数。 procs_running 6 実行中状態のプロセス数 (Linux 2.5.45 以降)。 procs_blocked 2 I/O 完了待ちで停止 (blocked) しているプロセス数 (Linux 2.5.45 以降)。 /proc/swaps 使用中のスワップ領域。 swapon(8) も参照すること。 /proc/sys このディレクトリ (1.3.57 以降に存在) はカーネル変数に対応するいくつかの ファイルと サブディレクトリを含む。 これらの変数は読み出し可能である。 また場合によっては /proc ファイルシステムや、 (非推奨の) システムコール sysctl(2) を用いて書き換えるこ ともできる。 /proc/sys/abi (Linux 2.4.10 以降) このディレクトリにはアプリケーションのバイナリ情報が入ったファイルが置かれる。 更に 詳しい情報は、 Linux カーネルソースファイル Documentation/sysctl/abi.txt を参照する こと。 /proc/sys/debug このディレクトリは空の場合もある。 /proc/sys/dev このディレクトリにはデバイス特有の情報 (たとえば dev/cdrom/info) が含まれる。 この ディレクトリが空になっているシステムもある。 /proc/sys/fs このディレクトリには、ファイルシステムに関連するカーネル変数用の ディレクトリとサブ ディレクトリが含まれる。 /proc/sys/fs/binfmt_misc このディレクトリ以下のファイルについてのドキュメントは、 Linux カーネルソースの Documentation/binfmt_misc.txt にある。 /proc/sys/fs/dentry-state (Linux 2.2 以降) このファイルには、ディレクトリキャッシュ (dcache) の状態に関する情報が 入ってい る。ファイルには、 nr_dentry, nr_unused, age_limit (秒単位の age), want_pages (シス テムがリクエストしたページ数), ダミーの 2 つの値、 という 6 つの数字が書かれてい る。 * nr_dentry は割り当てられた dentry (dcache エントリー) の数である。 このフィールド は Linux 2.2 では使用されない。 * nr_unused は未使用の dentry 数である。 * age_limit は、メモリーが不足している場合に次に dcache entry を再要求できるように なるまでの残り時間 (秒数) である。 * want_pages は、カーネルが shrink_dcache_pages() を呼び出したが dcache がまだ縮小 されていない場合に、0 以外の値となる。 /proc/sys/fs/dir-notify-enable このファイルは fcntl(2) に記述されている dnotify インターフェースをシステム全体で 無効にしたり有効にしたりする。 このファイルに値 0 が書かれている場合はインター フェースが無効になり、 値 1 の場合は有効になる。 /proc/sys/fs/dquot-max このファイルにはキャッシュされるディスク quota エントリーの最大数が書かれている。 (2.4 系の) システムの中には、このファイルが存在しないものもある。 キャッシュされる ディスク quota エントリーの空きが非常に少なく、 とても多くのシステムユーザーが同時 に存在する場合、 この制限を上げるといいかもしれない。 /proc/sys/fs/dquot-nr このファイルには割り当てられているディスク quota のエントリー数と、 空いているディ スク quota のエントリー数が書かれている。 /proc/sys/fs/epoll (Linux 2.6.28 以降) このディレクトリには、ファイル max_user_watches がある。 これらは、 epoll インター フェースが消費するカーネルメモリー量を制限するのに使用できる。 詳細は epoll(7) を 参照。 /proc/sys/fs/file-max このファイルは、 システム全体でプロセスがオープンできるファイル数の上限を定義する (setrlimit(2) も参照; setrlimit(2) を使うと、 オープンできるファイル数のプロセス毎 の上限 RLIMIT_NOFILE を設定できる)。 ファイルハンドルを使い果たしたというエラーメッ セージ ("VFS: file-max limit <number> reached" を探すとよい) がカーネルログに大量に 出る場合は、以下のようにこの値を増加させてみるとよい。 echo 100000 > /proc/sys/fs/file-max 特権プロセス (CAP_SYS_ADMIN) は file-max 上限を上書きできる。 /proc/sys/fs/file-nr This (read-only) file contains three numbers: the number of allocated file handles (i.e., the number of files presently opened); the number of free file handles; and the maximum number of file handles (i.e., the same value as /proc/sys/fs/file-max). If the number of allocated file handles is close to the maximum, you should consider increasing the maximum. Before Linux 2.6, the kernel allocated file handles dynamically, but it didn't free them again. Instead the free file handles were kept in a list for reallocation; the "free file handles" value indicates the size of that list. A large number of free file handles indicates that there was a past peak in the usage of open file handles. Since Linux 2.6, the kernel does deallocate freed file handles, and the "free file handles" value is always zero. /proc/sys/fs/inode-max (Linux 2.2 までにのみ存在) このファイルには、メモリー内 inode の最大値が書かれている。 この値は file-max の値 の 3-4 倍にすべきである。 これは stdin, stdout, ネットワークソケットを扱うにも inode が必要なためである。 日常的に inode を使い果たしている場合は、この値を増やす 必要がある。 Linux 2.4 以降では、 inode 数の静的な上限はなくなり、 このファイルは削除された。 /proc/sys/fs/inode-nr このファイルには、 inode-state の最初の 2 つの値が書かれている。 /proc/sys/fs/inode-state このファイルには 7 つの数字が入っている。 nr_inodes, nr_free_inodes, preshrink と 4 つのダミーの値 (常に 0) である。 nr_inodes はシステムが割り当て済みの inode 数である。 nr_free_inodes は未使用の inode 数である。 preshrink は、 nr_inodes > inode-max で、 システムがさらに inode を割り当てるのでは なく inode リストを刈り取る (余分なものを回収する) 必要がある場合に、 0 以外にな る。 Linux 2.4 以降では、 このフィールドはダミーの値 (常に 0) である。 /proc/sys/fs/inotify (Linux 2.6.13 以降) このディレクトリには、ファイル max_queued_events, max_user_instances, and max_user_watches がある。これらは、 inotify インターフェースが消費するカーネルメモ リー量を制限するのに利用できる。 詳細は inotify(7) を参照。 /proc/sys/fs/lease-break-time このファイルは、ファイルを保持しているプロセスに対して カーネルがシグナルを送り、 他のプロセスがそのファイルをオープンするのを待っていることを通知してから、 そのプロ セスに対してカーネルがファイルのリース (lease, 貸し出し) (fcntl(2) を参照) を許す 猶予期間を指定する。 リースホルダ (lease holder: ファイルの貸し出しを受けているプロ セス) が 猶予期間中にリースを削除するか階級を低くしない場合、 カーネルはファイルの リースを強制的に止める。 /proc/sys/fs/leases-enable このファイルはシステム全体でのファイルリース (fcntl(2) を参照) を有効または無効に する。 ファイルに値 0 が書き込まれている場合、リースは無効である。 0 以外の場合には リースは有効である。 /proc/sys/fs/mqueue (Linux 2.6.6 以降) このディレクトリにはファイル msg_max, msgsize_max, and queues_max がある。これらは POSIX メッセージキューで使用されるリソースの 制御を行う。 詳細は mq_overview(7) を 参照。 /proc/sys/fs/nr_open (Linux 2.6.25 以降) This file imposes ceiling on the value to which the RLIMIT_NOFILE resource limit can be raised (see getrlimit(2)). This ceiling is enforced for both unprivileged and privileged process. The default value in this file is 1048576. (Before Linux 2.6.25, the ceiling for RLIMIT_NOFILE was hard-coded to the same value.) /proc/sys/fs/overflowgid と /proc/sys/fs/overflowuid これらのファイルにより、ユーザーは固定 UID と固定 GID の値を変更できる。 デフォルト は 65534 である。 Linux の UID と GID は 32 ビットであるが、 16 ビットの UID と GID しかサポートしないファイルシステムもある。 このようなファイルシステムが書き込みを許 可してマウントされた場合、 65535 を超える UID と GID は、 ディスクに書き込まれる前 にオーバーフロー値に変換される。 /proc/sys/fs/pipe-max-size (Linux 2.6.35 以降) このファイルの値により、 fcntl(2) の F_SETPIPE_SZ 操作で増やすことができるパイプ容 量の上限値が定義される。 この上限は非特権プロセスにのみ適用される。 このファイルの デフォルト値は 1,048,576 である。 このファイルに設定した値は切り上げられて、 実装側 で利用するのに都合のよい値に変更される場合がある。 切り上げられた値を確認するには、 値を設定した後でこのファイルの内容を表示すればよい。 このファイルに設定できる最小値 はシステムのページサイズである。 /proc/sys/fs/protected_hardlinks (Linux 3.6 以降) このファイルの値が 0 の場合、 ハードリンクの作成には何の制限も適用されない (すなわ ち、 Linux 3.6 より前の伝統的な動作である)。 このファイルの値が 1 の場合、以下の条 件のいずれか一つが成立する場合にのみ、 リンク先のファイルへのハードリンクが作成でき る。 * 呼び出し元が CAP_FOWNER ケーパビリティを持っている。 * そのリンクを作成中のプロセスのファイルシステム UID が、 リンク先ファイルの所有者 (UID) と一致する (credentials(7) に説明があるが、 通常、 プロセスのファイルシス テム UID はプロセスの実効 UID と同じである)。 * 以下の条件が全て成立する。 · リンク先が通常のファイルである。 · リンク先ファイルで set-user-ID 許可ビットが有効になっていない。 · リンク先ファイルで、 許可ビット set-group-ID と group-executable が同時に有 効になっていない。 · 呼び出し元は、 リンク先ファイルの読み出し、書き込み許可を持っている (ファイ ルの許可マスクで許可されているか、適切なケーパビリティを持っているかは問わな い)。 The default value in this file is 0. Setting the value to 1 prevents a longstanding class of security issues caused by hard-link-based time-of-check, time-of-use races, most commonly seen in world-writable directories such as /tmp. The common method of exploiting this flaw is to cross privilege boundaries when following a given hard link (i.e., a root process follows a hard link created by another user). Additionally, on systems without separated partitions, this stops unauthorized users from "pinning" vulnerable set-user-ID and set-group-ID files against being upgraded by the administrator, or linking to special files. /proc/sys/fs/protected_symlinks (Linux 3.6 以降) このファイルの値が 0 の場合、 以下のシンボリックリンクを辿る際に何の制限も適用され ない (すなわち、 Linux 3.6 より前の伝統的な動作である)。 このファイルの値が 1 の場 合、 以下の状況においてのみシンボリックリンクが辿られる。 * そのリンクを辿っているプロセスのファイルシステム UID が、 シンボリックリンクの所 有者 (UID) と一致する (credentials(7) に説明があるが、 通常、 プロセスのファイル システム UID はプロセスの実効 UID と同じである)。 * そのリンクが world-writable の sticky ビットがセットされたディレクトリではない。 * シンボリックリンクとその親ディレクトリが同じ所有者 (UID) である。 システムコールが上記の制約によりシンボリックリンクを辿れなかった場合は、 errno にエ ラー EACCES が設定される。 The default value in this file is 0. Setting the value to 1 avoids a longstanding class of security issues based on time-of-check, time-of-use races when accessing symbolic links. /proc/sys/fs/suid_dumpable (Linux 2.6.13 以降) このファイルの値により、set-user-ID されたバイナリや、 保護がかかった (protected) バイナリ / tainted な (汚染された; ライセンスがカーネルと適合しない) バイナリに対し て、コアダンプファイルを 生成するかどうかが決定される。 以下の 3つの値を指定するこ とができる: 0 (default) この値を指定すると、以前と同じ (Linux 2.6.13 より前の) 動作をする。 (seteuid(2), setgid(2) などを呼び出すことや、set-user-ID や set-group-ID さ れたプログラムを 実行することで) 資格情報 (credentials) が変更されているプロ セスや、 プロセスの実行バイナリの読み出し許可がないプロセスに対して、 コアダ ンプを生成しない。 1 ("debug") すべてのプロセスで、可能であればコアダンプを行う。 コアダンプファイルの所有 者は、ダンプを行うプロセスのファイルシステム UID となり、セキュリティ上の考 慮は行われない。 この値は、システムデバッグの場面だけを想定して設けられてい る。 ptrace のチェックも行われない。 2 ("suidsafe") 通常はダンプされないようなバイナリ (上記の "0" 参照) を root だけが読み出し 可能な形でダンプする。 この場合、ユーザーはそのコアダンプファイルを削除する ことはできるが、 読むことはできない。 セキュリティ上の理由から、このモードの コアダンプでは、 既存のダンプファイルや他のファイルを上書きすることはない。 このモードは、管理者が通常の環境で問題を解析しようとする際に 適している。 さらに、 Linux 3.6 以降では、 /proc/sys/kernel/core_pattern は絶対パス名かパ イプコマンドでなければならない。 core(5) に詳しい説明がある。 core_pattern がこれらのルールに合致しない場合は、 警告がカーネルログに書き込まれ、 コアダ ンプは生成されない。 このファイルはスーパブロックの値を制御する。 この値はカーネルがマウントできるファイルシステムの最大値になる。 現在、 super-max で許可されているファイルシステム数以上に マウントする必要がある場合は、この値を増加 させるだけでよい。 /proc/sys/fs/super-nr このファイルには現在マウントされているファイルシステム数が書かれている。 /proc/sys/kernel このディレクトリには、以下で説明する様々なカーネルパラメーターを 制御するためのファ イルが配置されている。 /proc/sys/kernel/acct このファイルには 3 つの値が含まれている: highwater, lowwater, frequency である。 BSD-style process accounting が有効になっている場合、 これら 3 つの値が動作を制御す る。 ログファイルのあるファイルシステムの空き領域が lowwater パーセント以下になった 場合は、ログ記録を一時停止する。 空き領域が highwater パーセント以上になった場合 に、ログ記録を再開する。 frequency はカーネルが空き領域のチェックをする頻度である (単位は秒)。 デフォルトの値は、4, 2, 30 である。 つまり、空き領域が 2% 以下になると ログ記録を一時停止し、 空き領域が 4% 以上となったときに再開する。 空き領域について の情報は 30 秒間有効である点に注意すること。 /proc/sys/kernel/cap_last_cap (Linux 3.2 以降) capabilities(7) 参照。 /proc/sys/kernel/cap-bound (Linux 2.2 to 2.6.24 以降) /proc/sys/kernel/cap-bound このファイルにはカーネルの capability bounding set (符号 付き 10 進数表現) の値が書かれている。 execve(2) 中は、このセットとプロセスに許可 されている権限の AND がとられる。 Linux 2.6.25 以降では、システム全体のケーパビリ ティバウンディングセットは なくなり、スレッド単位のバウンディングセットに置き換えら れた。 capabilities(7) を参照。 /proc/sys/kernel/core_pattern core(5) 参照。 /proc/sys/kernel/core_uses_pid core(5) 参照。 /proc/sys/kernel/ctrl-alt-del このファイルはキーボードの Ctrl-Alt-Del の扱いを制御する。 このファイルにある値が 0 の場合、 Ctrl-Alt-Del が捕捉されると init(1) プログラムに送られて、正しく再起動さ れる。 値が 0 より大きい場合、Vulcan Nerve Pinch (tm) に反応して、 Linux はダーティ バッファーを同期させることなく、すぐに再起動を行う。 注意: プログラム (dosemu など) に "raw" モードのキーボードがある場合、 ctrl-alt-del はカーネルの tty レイヤーに到 達する前に プログラムに遮断され、 プログラムに送られてどのように扱うかが決められ る。 /proc/sys/kernel/dmesg_restrict (Linux 2.6.37 以降) このファイルの値により誰がカーネル syslog の内容を参照できるかが決定される。 この ファイルの値が 0 であれば、制限はなくなる。 値が 1 であれば、 特権ユーザーだけが カーネル syslog を読み出すことができる (詳細は syslog(2) を参照)。 Linux 3.4 以降で は CAP_SYS_ADMIN ケーパビリティを持ったユーザーだけがこのファイルの値を変更できる。 /proc/sys/kernel/domainname と /proc/sys/kernel/hostname これらのファイルは、コマンド domainname(1), hostname(1) と全く同じ方法で、 マシン の NIS/YP ドメイン名とホスト名の設定に使える。 すなわち # echo 'darkstar' > /proc/sys/kernel/hostname # echo 'mydomain' > /proc/sys/kernel/domainname は、以下と同じ効果がある。 # hostname 'darkstar' # domainname 'mydomain' 注意: 典型的な darkstar.frop.org という名前には、 ホスト名 "darkstar" と DNS (Internet Domain Name Server) ドメイン名 "frop.org" が含まれているが、DNS ドメイン 名と NIS (Network Information Service) または YP (Yellow Pages) のドメイン名を混同 してはならない。 一般にこれら 2 つのドメイン名は異なる。 詳細な議論は、 hostname(1) の man ページを参照すること。 /proc/sys/kernel/hotplug このファイルはホットプラグポリシーエージェントのパスが書かれている。 このファイルの デフォルト値は /sbin/hotplug である。 /proc/sys/kernel/htab-reclaim (PowerPC のみ) このファイルを 0 以外の値に設定すると、 PowerPC htab (カーネルソース ファイル Documentation/powerpc/ppc_htab.txt 参照) を、システムがアイドルループにな るたびに切り詰める。 /proc/sys/kernel/kptr_restrict (Linux 2.6.38 以降) The value in this file determines whether kernel addresses are exposed via /proc files and other interfaces. A value of 0 in this file imposes no restrictions. If the value is 1, kernel pointers printed using the %pK format specifier will be replaced with zeros unless the user has the CAP_SYSLOG capability. If the value is 2, kernel pointers printed using the %pK format specifier will be replaced with zeros regardless of the user's capabilities. The initial default value for this file was 1, but the default was changed to 0 in Linux 2.6.39. Since Linux 3.4, only users with the CAP_SYS_ADMIN capability can change the value in this file. /proc/sys/kernel/l2cr (PowerPC のみ) このファイルには G3 プロセッサボードの L2 キャッシュを制御するフラグ が含まれる。 0 の場合、キャッシュは無効になる。 0 以外の場合は有効になる。 /proc/sys/kernel/modprobe このファイルには、カーネルモジュールローダーへのパスが含まれる。 デフォルトの値は /sbin/modprobe である。このファイルは、CONFIG_MODULES オプション (Linux 2.6.26 以前 では CONFIG_KMOD) を有効にしてカーネルが作成されている場合にのみ存在する。 このファ イルについては、Linux カーネルソースファイル Documentation/kmod.txt (カーネル 2.4 以前のみに存在) に記述されている。 /proc/sys/kernel/modules_disabled (Linux 2.6.31 以降) 他のモジュールが有効になったカーネルへのモジュールのロードが許可されるかを示すオ ン・オフ値である。 デフォルト値はオフ (0) だが、 オン (1) に設定することができる。 一度オンにすると、 モジュールをロードすることもアンロードすることもできなくなり、 この値をオフに戻すこともできない。 このファイルが存在するのは、 カーネルが CONFIG_MODULES オプションを有効にしてコンパイルされている場合だけである。 /proc/sys/kernel/msgmax (Linux 2.2 以降) このファイルは、System V メッセージキューに書き込まれる 1 つのメッセージの 最大バイ ト数を、システム全体で制限する。 /proc/sys/kernel/msgmni (Linux 2.4 以降) このファイルはメッセージキュー識別子の最大数をシステム全体で制限する。 /proc/sys/kernel/msgmnb (Linux 2.2 以降) このファイルは、 msg_qbytes の設定を初期化するシステム全体のパラメーターで ある。 msg_qbytes は以降で作成されるメッセージキューで使われる。 msg_qbytes 設定では、メッ セージキューに書き込まれる最大バイト数を指定する。 /proc/sys/kernel/ngroups_max (Linux 2.6.4 以降) このファイルは、プロセスグループのメンバー数の上限値を表示する読み出し専用のファイ ルである。 /proc/sys/kernel/ostype と /proc/sys/kernel/osrelease これらのファイルは文字列 /proc/version の各部分を与える。 /proc/sys/kernel/overflowgid と /proc/sys/kernel/overflowuid これらのファイルは /proc/sys/fs/overflowgid と /proc/sys/fs/overflowuid を複製した ものである。 /proc/sys/kernel/panic このファイルはカーネル変数 panic_timeout への読み出しと書き込みのアクセスを与える。 この値が 0 ならば、パニック時にカーネルは (無限) ループに入る。 0 でなければ、その 秒数だけ待ってから自動的に再起動する。 ソフトウェア watchdog ドライバを使っている場 合、 推奨される設定は 60 である。 /proc/sys/kernel/panic_on_oops (Linux 2.5.68 以降) このファイルは、oops や BUG が起こった場合のカーネルの動作を制御する。 ファイルに 0 が書かれている場合、システムは操作を続行しようとする。 1 が書かれている場合、システ ムは (klogd が oops 出力を記録する時間を与えるために) 数秒間遅延した後、 panic を起 こす。 /proc/sys/kernel/panic ファイルも 0 でない場合、マシンは再起動される。 /proc/sys/kernel/pid_max (Linux 2.5.34 以降) このファイルは、PID をいくつで終了にするかを指定する (すなわち、このファイルの値は 最大 PID より 1 大きい)。 この値より大きな PID 値は割り当てられない。 したがっ て、このファイルの値はプロセスやスレッドの全体数のシステム全体での上限としても機能 する。 このファイルのデフォルト値は 32768 であり、 その場合には以前のカーネルと同じ PID の範囲になる。 32ビットのプラットフォームでは、 pid_max の最大値は 32768 であ る。 64ビットのプラットフォームでは、 2^22 (PID_MAX_LIMIT, 約 4,000,000) までの任意 の値を設定できる。 /proc/sys/kernel/powersave-nap (PowerPC のみ) このファイルにはフラグが書かれている。 フラグが設定されると、Linux-PPC は 省電力の "nap" モードを使う。 設定されない場合は、"doze" モードが使われる。 /proc/sys/kernel/printk syslog(2) 参照。 /proc/sys/kernel/pty (Linux 2.6.4 以降) このディレクトリは、UNIX 98 疑似端末 (pts(4) を参照) の数に関連する 2 つのファイル を含む。 /proc/sys/kernel/pty/max このファイルは疑似端末の最大数を定義する。 /proc/sys/kernel/pty/nr この読み出し専用のファイルは、現在いくつの疑似端末が使われているかを表す。 /proc/sys/kernel/random このディレクトリは、ファイル /dev/random の操作を制御する様々なパラメーターが書かれ ている。 詳細は random(4) を参照。 /proc/sys/kernel/random/uuid (Linux 2.4 以降) この読み出し専用のファイルから読み出しを行うごとに、 ランダムに生成した 128 ビット の UUID を、 標準の UUID 形式の文字列として返す。 /proc/sys/kernel/real-root-dev このファイルは Linux カーネルソースファイル Documentation/initrd.txt に記述されてい る。 /proc/sys/kernel/reboot-cmd (Sparc のみ) このファイルは SPARC ROM/Flash ブートローダーに引き数を渡す方法を 提供しているよう に思われる。 再起動後に何をするかを指定しているのだろうか? /proc/sys/kernel/rtsig-max (2.6.7 までのカーネルにのみ存在する。 setrlimit(2) を参照すること) このファイルは システムで発行される POSIX real-time (queued) signal の 最大数を調整するのに使用さ れる。 /proc/sys/kernel/rtsig-nr (2.6.7 までのカーネルにのみ存在する) このファイルは現在キューに入っている POSIX real-time signal の数を表す。 /proc/sys/kernel/sched_rr_timeslice_ms (Linux 3.9 以降) sched_rr_get_interval(2) 参照。 /proc/sys/kernel/sched_rt_period_us (Linux 2.6.25 以降) sched(7) 参照。 /proc/sys/kernel/sched_rt_runtime_us (Linux 2.6.25 以降) sched(7) 参照。 /proc/sys/kernel/sem (Linux 2.4 以降) このファイルには System V IPC セマフォを制限する 4 つの値が書かれている。 これらの フィールドは次の順番に並んでいる: SEMMSL セマフォ集合ごとのセマフォ数の最大値。 SEMMNS システム全体での、全てのセマフォ集合におけるセマフォ数の制限。 SEMOPM semop(2) コールに指定されるオペレーション数の最大値。 SEMMNI システム全体でのセマフォ識別子の最大値。 /proc/sys/kernel/sg-big-buff このファイルは、汎用 SCSI デバイス (sg) のバッファーサイズの最大値を表す。 今はこれ を変更することはできないが、 コンパイル時に include/scsi/sg.h を編集して SG_BIG_BUFF の値を変えれば変更できる。 ただし、この値を変更する理由はないだろう。 /proc/sys/kernel/shm_rmid_forced (Linux 3.1 以降) If this file is set to 1, all System V shared memory segments will be marked for destruction as soon as the number of attached processes falls to zero; in other words, it is no longer possible to create shared memory segments that exist independently of any attached process. The effect is as though a shmctl(2) IPC_RMID is performed on all existing segments as well as all segments created in the future (until this file is reset to 0). Note that existing segments that are attached to no process will be immediately destroyed when this file is set to 1. Setting this option will also destroy segments that were created, but never attached, upon termination of the process that created the segment with shmget(2). Setting this file to 1 provides a way of ensuring that all System V shared memory segments are counted against the resource usage and resource limits (see the description of RLIMIT_AS in getrlimit(2)) of at least one process. Because setting this file to 1 produces behavior that is nonstandard and could also break existing applications, the default value in this file is 0. Only set this file to 1 if you have a good understanding of the semantics of the applications using System V shared memory on your system. /proc/sys/kernel/shmall (Linux 2.2 以降) このファイルには System V 共有メモリーの総ページ数の システム全体での制限が書かれて いる。 /proc/sys/kernel/shmmax (Linux 2.2 以降) このファイルを通じて、(System V IPC) 共有メモリーセグメントを作成するときの 最大サ イズの実行時上限 (run-time limit) を取得または設定できる。 現在は 1GB までの共有メ モリーセグメントが カーネルでサポートされている。 この値のデフォルトは SHMMAX であ る。 /proc/sys/kernel/shmmni (Linux 2.4 以降) このファイルは、システム全体で作成可能な System V 共有メモリーセグメント数を指定す る。 /proc/sys/kernel/sysrq このファイルは、SysRq キーにより起動が許可されている関数群を制御する ものである。デ フォルトでは、ファイルの内容は 1 であり、 これは起こり得る全ての SysRq リクエストが 許可されることを意味する (古いバージョンのカーネルでは、SysRq はデフォルトでは無効 になっており、 実行時に明示的に有効にする必要があったが、今はそうではない)。 この ファイルで指定可能な値は以下の通り。 0 - sysrq を完全に無効にする 1 - sysrq の全ての関数を有効にする >1 - 許可する sysrq 関数のビットマスク。内訳は以下の通り。 2 - コンソールのログレベルの制御を有効にする 4 - キーボードの制御を有効にする (SAK, unraw) 8 - プロセスなどのデバッグダンプを有効にする 16 - sync コマンドを有効にする 32 - 読み出し専用での再マウントを有効にする 64 - プロセスへのシグナル発行を有効にする (term, kill, oom-kill) 128 - リブート/電源オフを許可する 256 - 全てのリアルタイムタスクの nice 値の変更を許可する カーネル設定オプション CONFIG_MAGIC_SYSRQ が有効な場合のみ、このファイルは存在す る。 詳細は、Linux カーネルソースファイル Documentation/sysrq.txt を参照のこと。 /proc/sys/kernel/version このファイルには、以下のような文字列が書かれている: #5 Wed Feb 25 21:49:24 MET 1998 "#5" はこのソースで構築された 5 番目のカーネルであることを意味する。 その後にある日 付はカーネルが構築された時刻を表す。 /proc/sys/kernel/threads-max (Linux 2.3.11 以降) このファイルは、システム全体で作成可能なスレッド数 (タスク数) の上限を指定する。 /proc/sys/kernel/zero-paged (PowerPC のみ) このファイルはフラグを含む。 (0 以外の値で) 有効された場合、Linux-PPC はアイドル ループで pre-zero page を行うので、get_free_pages の速度が向上する可能性がある。 /proc/sys/net このディレクトリにはネットワーク関係の情報が入っている。 このディレクトリにあるファ イルのいくつかについては、 tcp(7) や ip(7) に説明がある。 /proc/sys/net/core/somaxconn このファイルは listen(2) の backlog 引き数の上限値を規定する。 詳細は listen(2) の マニュアルページを参照。 /proc/sys/proc このディレクトリは空の場合もある。 /proc/sys/sunrpc このディレクトリはネットワークファイルシステム (NFS) への Sun remote procedure call (遠隔手続き呼び出し) をサポートする。 これが存在しないシステムもある。 /proc/sys/vm このディレクトリにはメモリー管理の調整、バッファーやキャッシュ管理のための ファイル がある。 /proc/sys/vm/compact_memory (Linux 2.6.35 以降) When 1 is written to this file, all zones are compacted such that free memory is available in contiguous blocks where possible. The effect of this action can be seen by examining /proc/buddyinfo. カーネルの設定で CONFIG_COMPACTION が有効になっている場合にのみ存在する。 /proc/sys/vm/drop_caches (Linux 2.6.16 以降) このファイルに書き込みを行うと、カーネルに、 クリーンなキャッシュ、 dentry、 inode をメモリーから追い出して、 メモリーを解放させることができる。 この機能はメモリー管 理のテストや再現可能なファイルシステムのベンチマークを行うのに役立つ。 このファイル への書き込みはキャッシュの利点を失うことになるので、システム全体の性能は低下する可 能性がある。 ページキャッシュを解放するには、以下のようにする。 echo 1 > /proc/sys/vm/drop_caches dentry と inode を解放するには、以下のようにする。 echo 2 > /proc/sys/vm/drop_caches ページキャッシュ、 dentry、 inode を解放するには、以下のようにする。 echo 3 > /proc/sys/vm/drop_caches このファイルへの書き込みは非破壊的な操作で、 ダーティな (dirty) オブジェクトは 解放 されないので、 この操作を行う際は最初に sync(1) を実行しておくべきである。 /proc/sys/vm/legacy_va_layout (Linux 2.6.9 以降) 0 以外の場合、新しい 32ビットメモリーマッピング配置が無効になり、 カーネルは全ての プロセスに対して従来の (カーネル 2.4 の) 配置方法を 使用する。 /proc/sys/vm/memory_failure_early_kill (Linux 2.6.32 以降) このファイルは、カーネルが処理できない訂正不能なメモリーエラー (通常はメモリーモ ジュールでの 2 ビットエラー) がバックグラウンドでハードウェアにより検出された際 に、プロセスをどのように kill するかを制御する。 (ページの有効なコピーがディスク上 にも存在するなど) いくつかの場面では、カーネルはアプリケーションに影響を与えずに透 過的に故障を処理する。しかし、データの最新のコピーが他にはない場合には、データ破壊 が波及するのを防ぐため、カーネルはプロセスを kill する。 このファイルは以下のいずれかの値を持つ。 1: データ破壊が検出されるとすぐに、故障が検出され復元できないページ (corrupted-and-not-reloadable page) をマップしている全てのプロセスを kill す る。この機能は、(カーネル内部で割り当てられたデータやスワップのキャッシュなど) 少数のいくつかのタイプのページではサポートされていないが、大半のユーザーページ ではこの機能は働く。 0: データ破壊が検出されたページの全てのプロセスからの unmap のみを行い、そのページ にアクセスしようとしたプロセスのみを kill する。 この kill は si_code に BUS_MCEERR_AO を設定した SIGBUS シグナルを使って行われ る。プロセス側では必要であればこのシグナルを処理することができる。詳細は sigaction(2) を参照。 この機能は、高度なマシンチェック機構を持ったアーキテクチャー/プラットフォームにおい てのみ有効であり、ハードウェア機能にも依存している。 アプリケーションは prctl(2) の PR_MCE_KILL 操作を使って個別に memory_failure_early_kill の設定を上書きすることができる。 カーネルの設定で CONFIG_MEMORY_FAILURE が有効になっている場合にのみ 存在する。 /proc/sys/vm/memory_failure_recovery (Linux 2.6.32 以降) メモリー故障回復 (memory failure recovery) を有効にする (プラットフォームがサポートしている場合) 1: 回復を試みる。 0: メモリー故障時には常に panic を起こす。 カーネルの設定で CONFIG_MEMORY_FAILURE が有効になっている場合にのみ 存在する。 /proc/sys/vm/oom_dump_tasks (Linux 2.6.25 以降) カーネルが OOM-killing を実行する際に、システム全体のタスクダンプ (カーネルスレッド を除く) を生成するかを制御する。 ダンプには、タスク (スレッド、プロセス) 毎に以下の 情報が出力される: スレッド ID、実ユーザー ID、スレッドグループ ID (プロセス ID)、 仮想メモリーサイズ、Resident Set Size (実メモリー上に存在するページサイズ)、 タスク がスケジューリングされた CPU、 oom_adj スコア (/proc/[pid]/oom_adj の説明を参 照)、コマンド名。 このダンプ情報は、なぜ OOM-killer が起動されたかを知り、 その原因 となったならず者のタスクを特定するのに役に立つ。 このファイルの内容が値 0 の場合、ダンプ情報の出力は行われない。 タスクが何千もある 非常に巨大なシステムでは、 各々のタスクについてメモリー状態をダンプするのは適切でな いかもしれない。 そのようなシステムでは、ダンプ情報が必要でもないときに メモリー不 足 (OOM) の状況で性能面の不利益が起こらないようにすべきだろう。 このファイルの内容が 0 以外の場合、 OOM-killer が実際にメモリーを占有したタスクを kill する度に ダンプ情報が出力される。 デフォルト値は 0 である。 /proc/sys/vm/oom_kill_allocating_task (Linux 2.6.24 以降) このファイルは、メモリー不足 (OOM) の状況が起こった際に、 メモリー不足のきっかけと なったタスクを kill するかどうかを制御する。 このファイルが 0 に設定された場合、 OOM-killer はタスクリスト全体をスキャンし、経験 則に基づき kill するタスクを選択する。 通常は、kill した場合に多くのメモリーが解放 できる、 ならず者のメモリー占有タスクが選択される。 このファイルが 0 以外に設定された場合、 OOM-killer はメモリー不足の状況が発生する きっかけとなったタスクを 単純に kill するだけである。 これにより、たいていは重い処 理となるタスクリストのスキャンを回避できる。 /proc/sys/vm/panic_on_oom が 0 以外の場合、 /proc/sys/vm/oom_kill_allocating_task にどのような値が入っていたとしても、 /proc/sys/vm/panic_on_oom の方が優先される。 デフォルト値は 0 である。 /proc/sys/vm/overcommit_kbytes (Linux 3.14 以降) この書き込み可能なファイルは、 /proc/sys/vm/overcommit_memory が値 2 の際に、 CommitLimit を制御する /proc/sys/vm/overcommit_ratio の別の設定手段を提供するもので ある。 overcommit_ratio が割合をパーセントで指定するのに対し、 このファイルではオー バーコミットするメモリー量を絶対値 (kB 単位) で指定できる。 これにより、 メモリーサ イズが非常に大きなシステムで CommitLimit を極め細かく制御できる。 overcommit_kbytes と overcommit_ratio のいずれか一方だけが効果を持つ。 overcommit_kbytes が 0 以外の値を持つ場合、 CommitLimit を計算するのに overcommit_kbytes が使用され、 それ以外の場合 overcommit_ratio が使用される。 これ らのファイルのいずれかに値を書き込むと、 他のファイルの値は 0 に設定される。 /proc/sys/vm/overcommit_memory このファイルにはカーネル仮想メモリーのアカウントモードが書かれている。 値は以下の通 り: 0: 発見的なオーバーコミット (heuristic overcommit) (これがデフォルトである) 1: 常にオーバーコミットし、チェックしない。 2: 常にチェックし、オーバーコミットしない。 モード 0 では、 MAP_NORESERVE を設定して呼び出された mmap(2) はチェックされない。 またデフォルトのチェックはとても脆弱で、 プロセスを "OOM-kill" してしまうリスクを引 き起こす。 Linux 2.4 では 0 以外の値はモード 1 を意味する。 モード 2 (Linux 2.6 以降で利用可能) では、 割り当て可能な仮想アドレス空間 (/proc/meminfo の CommitLimit) は以下で計算される。 CommitLimit = (total_RAM - total_huge_TLB) * overcommit_ratio / 100 + total_swap 個々の説明: * total_RAM はシステム上の RAM の総量 * total_huge_TLB はヒュージページ用に確保されたメモリー総量 * overcommit_ratio は /proc/sys/vm/overcommit_ratio の値 * total_swap はスワップ空間の総量 例えば、 物理 RAM が 16GB で、 スワップが 16GB で、 ヒュージページ専用の空間がな く、 overcommit_ratio が 50 のシステムでは、 この式から CommitLimit として 24GB の 値が得られる。 Linux 3.14 以降では、 /proc/sys/vm/overcommit_kbytes の値が 0 でない場合、 CommitLimit は代わりに以下のように計算される。 CommitLimit = overcommit_kbytes + total_swap /proc/sys/vm/overcommit_ratio (Linux 2.6.0 以降) この書き込み可能なファイルは、 オーバーコミットできるメモリーの割合をパーセントで定 義する。 このファイルのデフォルト値は 50 である。 /proc/sys/vm/overcommit_memory の 説明を参照。 /proc/sys/vm/panic_on_oom (Linux 2.6.18 以降) このファイルは、メモリー不足時にカーネルパニックを 起こすか起こさないかを制御する。 このファイルに値 0 を設定すると、 カーネルの OOM-killer がならず者のプロセスを kill する。 普通は、OOM-killer がならず者のプロセスを kill することができ、 システムは何 とか動き続けることができる。 このファイルに値 1 を設定すると、 メモリー不足の状況が発生すると、カーネルは普通は パニックする。 しかしながら、プロセスが メモリーポリシー (mbind(2) の MPOL_BIND) や cpusets (cpuset(7)) を使って特定のノードへのメモリー割り当てを制限していて、 そ れらのノードでメモリー枯渇状態に至った場合は、 一つのプロセスが OOM-killer により kill されるだけかもしれない。 この場合には、カーネルパニックは発生しない。 なぜな ら、他のノードのメモリーには空きがあるかもしれず、 したがって、システム全体としては メモリー不足の状況にまだ達していないかも しれないからである。 このファイルに値 2 を設定すると、 メモリー不足の状況が発生するとカーネルは常にパ ニックを起こす。 デフォルト値は 0 である。 1 と 2 はクラスタリングのフェイルオーバー用である。 フェ イルオーバーの方針に応じてどちらかの値を選択すること。 /proc/sys/vm/swappiness このファイルの値により、カーネルがどの程度激しくメモリーページの スワップを行う か が制御される。 大きな値ほどスワップが激しくなり、小さい値ほど激しくなくなる。 デ フォルト値は 60 である。 /proc/sysrq-trigger (Linux 2.4.21 以降) このファイルに文字 character を書き込むと、 キーボードから ALT-SysRq-<character> を 入力した場合と 同じ SysRq 関数が起動される (/proc/sys/kernel/sysrq の説明を参照)。 通常、このファイルへ書き込みができるのは root だけである。詳細については、Linux カーネルソースファイルの Documentation/sysrq.txt を参照のこと。 /proc/sysvipc 疑似ファイル msg, sem, shm を含むサブディレクトリ。 これらのファイルは、現在システ ム上に存在する System V プロセス間通信 (Interprocess Communication, IPC) オブジェク ト (それぞれ: メッセージキュー、セマフォ、共有メモリー) のリストであり、 ipcs(1) で取得できる情報と同じものを提供する。 これらのファイルにはヘッダーがあり、理解しや すいように (1 行につき 1 個の IPC オブジェクトの形式で) フォーマットされている。 svipc(7) にはこれらのファイルから分かる情報の詳細な背景が書かれている。 /proc/thread-self (Linux 3.17 以降) このディレクトリは、/proc ファイルシステムにアクセスしたスレッドを参照している。 こ れは、同じスレッドのプロセススレッド ID ([tid]) の名前の /proc/self/task/[tid] ディ レクトリと同一である。 /proc/timer_list (Linux 2.6.21 以降) This read-only file exposes a list of all currently pending (high-resolution) timers, all clock-event sources, and their parameters in a human-readable form. /proc/timer_stats (Linux 2.6.21 以降) This is a debugging facility to make timer (ab)use in a Linux system visible to kernel and user-space developers. It can be used by kernel and user-space developers to verify that their code does not make undue use of timers. The goal is to avoid unnecessary wakeups, thereby optimizing power consumption. If enabled in the kernel (CONFIG_TIMER_STATS), but not used, it has almost zero runtime overhead and a relatively small data-structure overhead. Even if collection is enabled at runtime, overhead is low: all the locking is per-CPU and lookup is hashed. The /proc/timer_stats file is used both to control sampling facility and to read out the sampled information. The timer_stats functionality is inactive on bootup. A sampling period can be started using the following command: # echo 1 > /proc/timer_stats The following command stops a sampling period: # echo 0 > /proc/timer_stats The statistics can be retrieved by: $ cat /proc/timer_stats While sampling is enabled, each readout from /proc/timer_stats will see newly updated statistics. Once sampling is disabled, the sampled information is kept until a new sample period is started. This allows multiple readouts. /proc/timer_stats のサンプル出力。 $ cat /proc/timer_stats Timer Stats Version: v0.3 Sample period: 1.764 s Collection: active 255, 0 swapper/3 hrtimer_start_range_ns (tick_sched_timer) 71, 0 swapper/1 hrtimer_start_range_ns (tick_sched_timer) 58, 0 swapper/0 hrtimer_start_range_ns (tick_sched_timer) 4, 1694 gnome-shell mod_delayed_work_on (delayed_work_timer_fn) 17, 7 rcu_sched rcu_gp_kthread (process_timeout) ... 1, 4911 kworker/u16:0 mod_delayed_work_on (delayed_work_timer_fn) 1D, 2522 kworker/0:0 queue_delayed_work_on (delayed_work_timer_fn) 1029 total events, 583.333 events/sec The output columns are: * a count of the number of events, optionally (since Linux 2.6.23) followed by the letter 'D' if this is a deferrable timer; * the PID of the process that initialized the timer; * the name of the process that initialized the timer; * the function where the timer was initialized; and * (in parentheses) the callback function that is associated with the timer. /proc/tty 疑似ファイルを含むサブディレクトリ。 tty ドライバとライン設定 (line discipline) の 書かれた サブディレクトリも含まれる。 /proc/uptime このファイルは システム起動時から経過した時間 (秒) と アイドル (idle) しているプロ セスが消費した時間 (秒) の 2 つの数を含む。 /proc/version 現在稼働しているカーネルのバージョン識別子である文字列。 これには /proc/sys/ostype, /proc/sys/osrelease, /proc/sys/version の内容が含まれる。 たとえばこのように: Linux version 1.0.9 (quinlan@phaze) #1 Sat May 14 01:51:54 EDT 1994 /proc/vmstat (Linux 2.6 以降) このファイルは仮想メモリーの様々な統計情報を表示する。 /proc/zoneinfo (Linux 2.6.13 以降) このファイルはメモリーのゾーン (memory zone) に関する情報を表示する。 仮想メモリー の振舞いを分析するのに役立つ。
注意
ほとんどの文字列 (たとえば環境変数やコマンド行) は内部表現のままなので、 各フィールドはヌ ルバイト ('\0') で区切られている。だから、 od -c や tr "\000" "\n" を使えば、それらはより 読みやすくなる。 また echo `cat <file>` でもよい。 このマニュアルは不完全であり、たぶん不正確で、しばしば更新される必要がある。
関連項目
cat(1), dmesg(1), find(1), free(1), ps(1), tr(1), uptime(1), chroot(2), mmap(2), readlink(2), syslog(2), slabinfo(5), hier(7), namespaces(7), time(7), arp(8), hdparm(8), ifconfig(8), init(1), lsmod(8), lspci(8), mount(8), netstat(8), procinfo(8), route(8), sysctl(8) Linux カーネルのソースファイル: Documentation/filesystems/proc.txt Documentation/sysctl/fs.txt, Documentation/sysctl/kernel.txt, Documentation/sysctl/net.txt, and Documentation/sysctl/vm.txt.
この文書について
この man ページは Linux man-pages プロジェクトのリリース 3.79 の一部 である。プロジェクト の説明とバグ報告に関する情報は http://www.kernel.org/doc/man-pages/ に書かれている。