Provided by: manpages-ja-dev_0.5.0.0.20210215+dfsg-1_all 

名前
open, openat, creat - ファイルのオープン、作成を行う
書式
#include <sys/types.h> #include <sys/stat.h> #include <fcntl.h> int open(const char *pathname, int flags); int open(const char *pathname, int flags, mode_t mode); int creat(const char *pathname, mode_t mode); int openat(int dirfd, const char *pathname, int flags); int openat(int dirfd, const char *pathname, int flags, mode_t mode); glibc 向けの機能検査マクロの要件 (feature_test_macros(7) 参照): openat(): glibc 2.10 以降: _XOPEN_SOURCE >= 700 || _POSIX_C_SOURCE >= 200809L glibc 2.10 より前: _ATFILE_SOURCE
説明
ファイルの pathname を与えると、 open() はファイルディスクリプターを返す。 ファイルディスクリプター は、この後に続くシステムコール (read(2), write(2), lseek(2), fcntl(2) など) で使用される小さな非負の整数 である。 このシステムコールが成功した場合に返されるファイルディスクリプターは そのプロセスがその時点で オープンしていないファイルディスクリプターの うち最小の数字のものとなる。 デフォルトでは、新しいファイルディスクリプターは execve(2) を実行した後も オープンされたままとなる (つま り、 fcntl(2) に説明がある FD_CLOEXEC ファイルディスクリプターフラグは最初は無効である); 後述の O_CLOEXEC フラグ を使うとこのデフォルトを変更することができる。 ファイルオフセット (file offset) はファイルの先頭に 設定される (lseek(2) 参照)。 open() を呼び出すと、「オープンファイル記述」 (open file description) が作成される。ファイル記述とは、シ ステム全体のオープン中のファイルのテーブルのエントリーである。 このオープンファイル記述は、ファイルオフ セットとファイル状態フラグ (下記参照) が保持する。 ファイルディスクリプターはオープンファイルっ記述への参 照である。 この後で pathname が削除されたり、他のファイルを参照するように変更されたりしても、 この参照は 影響を受けない。 オープンファイル記述の詳細な説明は「注意」の節を参照。 引き数 flags には、アクセスモード O_RDONLY, O_WRONLY, O_RDWR のどれかひとつが入っていなければならない。 これらはそれぞれ読み込み専用、書き込み専用、読み書き用に ファイルをオープンすることを要求するものである。 さらに、 flags には、ファイル作成フラグ (file creation flag) とファイル状態フラグ (file status flag) を 0 個以上「ビット単位の OR (bitwise-or)」で 指定することができる。 ファイル作成フラグ は O_CLOEXEC, O_CREAT, O_DIRECTORY, O_EXCL, O_NOCTTY, O_NOFOLLOW, O_TMPFILE, O_TRUNC, O_TTY_INIT である。 ファイル状態フラグ は 以下のリストのうち上記以外の残りのものである。 二種類のフラグの違いは、ファイル状態フラグの方はその内容を 取得したり (場合によっては) 変更したりできる点にある。詳細は fcntl(2) を参照。 すべてのファイル作成フラグとファイル状態フラグを以下のリストに示す。 O_APPEND ファイルを追加 (append) モードでオープンする。 毎回の write(2) の前に lseek(2) を行ったかのよう に、ファイルポインターをファイルの最後に移動する。 NFS ファイルシステムで、 O_APPEND を使用する と、複数のプロセスがひとつのファイルに同時にデータを追加した場合、 ファイルが壊れてしまうことがあ る。 これは NFS が追加モードをサポートしていないため、 クライアントのカーネル (kernel) がそれをシ ミュレートしなければならないのだが、 競合状態を避けることはできないからである。 O_ASYNC シグナル駆動 I/O (signal-driven I/O) を有効にする: このファイルディスクリプターへの 入力または出力 が可能になった場合に、シグナルを生成する (デフォルトは SIGIO であるが、 fcntl(2) によって変更可能 である)。 この機能が使用可能なのは端末、疑似端末、ソケットのみであり、 (Linux 2.6 以降では) パイプ と FIFO に対しても使用できる。 さらに詳しい説明は fcntl(2) を参照すること。 下記の「バグ」も参 照。 O_CLOEXEC (Linux 2.6.23 以降) 新しいファイルディスクリプターに対して close-on-exec フラグを有効にする。 このフラグを指定すること で、 プログラムは FD_CLOEXEC フラグをセットするために fcntl(2) F_SETFD 操作を別途呼び出す必要がな くなる。 ある種のマルチスレッドのプログラムはこのフラグの使用は不可欠である点に注意すること。 なぜなら、個 別に FD_CLOEXEC フラグを設定する fcntl(2) F_SETFD 操作を呼び出したとしても、あるスレッドがファイル ディスクリプターを オープンするのと同時に別のスレッドが fork(2) と execve(2) を実行するという競合 条件を避けるのには十分ではないからである。 実行の順序に依存して、この競合条件の結果、 open() が返 したファイルディスクリプターが fork(2) で作成された子プロセスにより実行されるプログラムに意図せず 見えてしまう可能性がある。 (この種の競合は、 本質的に、 close-on-exec フラグをセットすべきファイル ディスクリプターを作成するどのシステムコールでも起こり得るものであり、 他のいろいろな Linux システ ムコールでこの問題に対処するために O_CLOEXEC と同等の機能が提供されている。) O_CREAT ファイルが存在しなかった場合は作成 (create) する。 ファイルの所有者 (ユーザー ID) は、プロセスの実 効ユーザー ID に設定される。 グループ所有権 (グループ ID) は、プロセスの実効グループ ID または親 ディレクトリのグループ ID に設定される (これは、ファイルシステムタイプ、マウントオプション、 親 ディレクトリのモードに依存する。 mount(8) で説明されているマウントオプション bsdgroups と sysvgroups を参照)。 mode は新しいファイルを作成する場合に使用するアクセス許可 (permission) を指定する。 flags に O_CREAT か O_TMPFILE が指定されている場合、 mode を指定しなければならない。 O_CREAT も O_TMPFILE も指定されていない場合、 mode は無視される。 有効なアクセス許可は、普段と同じようにプロセスの umask によって修正され、作成されたファイルの許可は (mode & ~umask) となる。 このモードは、新しく作 成されたファイルに対するそれ以降のアクセス にのみ適用される点に注意すること。 読み取り専用のファイ ルを作成する open() コールであっても、 読み書き可能なファイルディスクリプターを返すことがありう る。 mode のために以下のシンボル定数が提供されている : S_IRWXU 00700 ユーザー (ファイルの所有者) に読み込み、書き込み、 実行の許可がある。 S_IRUSR 00400 ユーザーに読み込みの許可がある。 S_IWUSR 00200 ユーザーに書き込みの許可がある。 S_IXUSR 00100 ユーザーに実行の許可がある。 S_IRWXG 00070 グループに読み込み、書き込み、実行の許可がある。 S_IRGRP 00040 グループに読み込みの許可がある。 S_IWGRP 00020 グループに書き込みの許可がある。 S_IXGRP 00010 グループに実行の許可がある。 S_IRWXO 00007 他人 (others) に読み込み、書き込み、実行の許可がある。 S_IROTH 00004 他人に読み込みの許可がある。 S_IWOTH 00002 他人に書き込みの許可がある。 S_IXOTH 00001 他人に実行の許可がある。 O_DIRECT (Linux 2.4.10 以降) このファイルに対する I/O のキャッシュの効果を最小化しようとする。このフラグを使うと、一般的に性能 が低下する。 しかしアプリケーションが独自にキャッシングを行っているような 特別な場合には役に立つ。 ファイルの I/O はユーザー空間バッファーに対して直接行われる。 O_DIRECT フラグ自身はデータを同期で 転送しようとはするが、 O_SYNC フラグのようにデータと必要なメタデータの転送が保証されるわけではな い。同期 I/O を保証するためには、 O_DIRECT に加えて O_SYNC を使用しなければならない。下記の「注 意」の節の議論も参照。 ブロックデバイスに対する似通った意味のインターフェースが raw(8) で説明されている (但し、このイン ターフェースは非推奨である)。 O_DIRECTORY pathname がディレクトリでなければオープンは失敗する。 このフラグは、 opendir(3) が FIFO やテープ デバイスに対してコールされた場合の サービス不能 (denial-of-service) 攻撃を避けるために カーネル 2.1.126 で追加された。 O_DSYNC ファイルに対する書き込み操作は、同期 I/O のデータ完全性完了の要件に基づいて行われる。 write(2) (や同様のコール) が返るまでに、 書き込まれたデータおよびデータを取得するのに必要なファイ ルメタデータが裏で利用されているハードウェアに転送される (つまり、write(2) の後に fdatasync(2) を 呼び出したのと同じようになる)。 下記の「注意」も参照のこと。 O_EXCL この呼び出しでファイルが作成されることを保証する。このフラグが O_CREAT と 一緒に指定され、 pathname のファイルが既に存在した場合、 open() は失敗 する。 これら二つのフラグが指定された際、シンボリックリンクは辿られない。 pathname がシンボリックリンクの 場合、 シンボリックリンクがどこを指しているかに関わらず open() は失敗する。 一般的には、 O_CREAT を指定せずに O_EXCL を使用した場合の O_EXCL の動作は規定されていない。 これに は一つ例外があり、Linux 2.6 以降では、 pathname がブロックデバイスを参照している場合、 O_CREAT な しで O_EXCL を使用することができる。 システムがそのブロックデバイスを使用中の場合 (例えば、 マウン トされているなど)、 open() はエラー EBUSY で失敗する。 NFS では、 O_EXCL は、Linux 2.6 以降で NFSv3 以降を使っている場合でのみサポートされる。 O_EXCL サ ポートが提供されていない NFS 環境では、このフラグに頼って ロック処理を実行するプログラムは競合状態 (race condition) に出会う 可能性がある。 ロックファイルを使用して不可分 (atomic) なファイルロック を実現し、 NFS が O_EXCL をサポートしているかに依存しないようにしたい場合、 移植性のある方法は、同 じファイルシステム上に他と名前の重ならない ファイル (例えばホスト名と PID を組み合わせた名前) を作 成し、 link(2) を使用してそのロックファイルへのリンクを作成することである。 link(2) コールの返り 値が 0 ならばロックに成功している。 あるいは、そのファイルに stat(2) を使用してリンク数 (link count) が 2 になっているかをチェックする。 そうなっていれば、同じくロックに成功しているということ である。 O_LARGEFILE (LFS) off_t ではサイズを表せない (だだし off64_t ではサイズを表せる)ファ イルをオープン可能にす る。この定義を有効にするためには、(どのヘッダーファイ ルをインクルードするよりも前に) _LARGEFILE64_SOURCE マクロを定義しなければ ならない。 32 ビットシステムにおいて大きなファイルにア クセスしたい場合、 (O_LARGEFILE を使うよりも) _FILE_OFFSET_BITS 機能検査マクロを 64 に セットする 方が望ましい方法である (feature_test_macros(7) を参照)。 O_NOATIME (Linux 2.6.8 以降) ファイルに対して read(2) が実行されたときに、最終アクセス時刻 (inode の st_atime) を更新しない。 このフラグはインデックス作成やバックアッププログラムで使うことを意図している。 これを使うとディス クに対する操作を大幅に減らすことができる。 このフラグは全てのファイルシステムに対して有効であるわ けではない。 その一例が NFS であり、サーバがアクセス時刻を管理している。 O_NOCTTY pathname が端末 (terminal) デバイス — tty(4) 参照 — を指している 場合に、たとえそのプロセスが制御 端末を持っていなくても、オープンしたファイル は制御端末にはならない。 O_NOFOLLOW pathname がシンボリックリンクだった場合、オープンは失敗する。 これは FreeBSD の拡張で、Linux には バージョン 2.1.126 で追加された。 このフラグが指定された場合でも pathname の前の方の要素 (最後の ディレクトリセパレータより前の部分) にあるシンボリックリンクについてはリンクが辿られる。 下記の O_PATH も参照のこと。 O_NONBLOCK または O_NDELAY 可能ならば、ファイルは非停止 (nonblocking) モードでオープンされる。 open() も、返したファイルディ スクリプターに対する以後のすべての操作も呼び出 したプロセスを待たせることはない。 FIFO (名前付きパ イプ) を扱う場合には fifo(7) も参照すること。 強制ファイルロック (mandatory file lock) やファイ ル リース (file lease) と組み合わせた場合の、 O_NONBLOCK の効果についての 議論は、 fcntl(2) を参照す ること。 O_PATH (Linux 2.6.39 以降) このフラグを指定して取得したファイルディスクリプターは、 ファイルシステムツリー内での場所を示すた め、 純粋にファイルディスクリプターレベルでの作用する操作を実行するため、 の二つの目的で使用するこ とができる。 ファイル自身はオープンされず、 他のファイル操作 (例えば read(2), write(2), fchmod(2), fchown(2), fgetxattr(2), mmap(2)) はエラー EBADF で失敗する。 取得したファイルディスクリプターに対して以下の操作を行うことが「できる」。 * close(2); fchdir(2) (Linux 3.5 以降); fstat(2) (Linux 3.6 以降) * ファイルディスクリプターの複製 (dup(2), fcntl(2) F_DUPFD など) * ファイルディスクリプターフラグの取得と設定 (fcntl(2) の F_GETFD と F_SETFD) * fcntl(2) の F_GETFL 操作を使ったオープンされたファイルの状態フラグの取得。 返されるフラグには O_PATH ビットが含まれる。 * openat(2) や他の "*at()" 系のシステムコールの dirfd 引数としてそのファイルディスクリプターを渡 す。 これには、 ファイルがディレクトリでない場合に linkat(2) に AT_EMPTY_PATH が指定された場合 (や procfs 経由で AT_SYMLINK_FOLLOW が使用された場合) を含む。 * そのファイルディスクリプターを別のプロセスに UNIX ドメインソケット経由で渡す。 (unix(7) の SCM_RIGHTS を参照) flags に O_PATH が指定された場合、 O_CLOEXEC, O_DIRECTORY, O_NOFOLLOW 以外のフラグビットは無視され る。 pathname がシンボリックリンクで O_NOFOLLOW フラグも合わせて指定された場合、 この呼び出しではシンボ リックリンクを参照するファイルディスクリプターを返す。 このファイルディスクリプターは、 空のパス名 を指定した fchownat(2), fstatat(2), linkat(2), readlinkat(2) の呼び出しで dirfd 引数として使うこと で、 そのシンボリックリンクに対して操作を行うことができる。 O_SYNC ファイルに対する書き込み操作は、同期 I/O のファイル完全性完了の要件に基づいて行われる (これに対し O_DSYNC では同期 I/O のデータ完全性完了が提供される)。 write(2) (や同様のコール) が返るまでに、 書き込まれたデータと関連するファイルメタデータが裏で利用 されているハードウェアに転送される (つまり、write(2) の後に fsync(2) を呼び出したのと同じようにな る)。 下記の「注意」も参照のこと。 O_TMPFILE (Linux 3.11 以降) 名前なしの一時ファイルを作成する。 pathname 引き数はディレクトリを指定する。 名前なしの inode がそ のディレクトリが存在するファイルシステムに作成される。 そのファイルに名前を付与しない限り、 作成さ れたファイルに書き込まれた内容は、 最後のファイルディスクリプターがクローズされる際に失われる。 O_TMPFILE は必ず O_RDWR か O_WRONLY のいずれかと一緒に使わなければならない。 O_EXCL も指定すること ができる。 O_EXCL が指定されなかった場合、 linkat(2) を使って、そのファイルシステムにこの一時ファ イルへのリンクを作成し、ファイルを永続化することができる。 以下のコードのようにすればよい。 char path[PATH_MAX]; fd = open("/path/to/dir", O_TMPFILE | O_RDWR, S_IRUSR | S_IWUSR); /* 'fd' に対するファイル I/O ... */ snprintf(path, PATH_MAX, "/proc/self/fd/%d", fd); linkat(AT_FDCWD, path, AT_FDCWD, "/path/for/file", AT_SYMLINK_FOLLOW); この場合、 open() の mode 引き数は O_CREAT と同様にファイルのアクセス許可モードの決定に使われる。 O_TMPFILE とともに O_EXCL を指定すると、 一時ファイルに対して上記の方法でファイルシステムへのリン クを行うことができなくなる (この場合の O_EXCL の意味は他の場合の O_EXCL の意味とは異なる点に注 意)。 O_TMPFILE には主に二つの用途がある。 * 改善された tmpfile(3) の機能: (1) クローズ時に自動的に削除される、 (2) パス名では決して参照でき ない、 (3) シンボリックリンク攻撃ができない、 (4) 呼び出し元が一意な名前を考える必要がない、 と いう特長を持つ競合のない一時ファイルの作成。 * 最初は見えないファイルを作成し、 それからデータを書き込んだり、適切なファイルシステム属性を持つ ように調整したり (chown(2), chmod(2), fsetxattr(2) など) した後、 準備が全て整った状態で (上述 の linkat(2) を使って) ファイルシステム内にアトミックにリンクを行う。 O_TMPFILE は、 裏で利用されるファイルシステムによるサポートが必要である。 一部の Linux ファイルシ ステムだけがこの機能をサポートしている。 最初の実装では、 ext2, ext3, ext4, UDF, Minix, shmem ファ イルシステムがサポートしていた。 XFS でのサポートが Linux 3.15 で追加された。 O_TRUNC ファイルが既に存在し、通常ファイルであり、 アクセスモードで書き込みが許可されている (つまり、 O_RDWR または O_WRONLY の) 場合、長さ 0 に切り詰め (truncate) られる。 ファイルが FIFO または端末 デバイスファイルの場合、 O_TRUNC フラグは無視される。 それ以外の場合、 O_TRUNC の効果は未定義であ る。 creat() creat() は flags に O_CREAT|O_WRONLY|O_TRUNC を指定して open() を行うのと等価である。 openat() openat() システムコールは open() と全く同様に動作するが、以下で説明する点が異なる。 pathname で指定されたパス名が相対パスの場合、このパス名はファイルディスクリプター dirfd が参照するディレ クトリに対する相対パスと解釈される (open() に相対パス名を渡した場合のように、呼び出したプロセスのカレント ワーキングディレクトリに対する相対パスではない)。 pathname で指定されたパス名が相対パスで、 dirfd が特別な値 AT_FDCWD の場合、 (open() と同様に) pathname は呼び出したプロセスのカレントワーキングディレクトリに対する相対パスと解釈される。 pathname で指定されたパス名が絶対パスの場合、 dirfd は無視される。
返り値
open(), openat(), creat() は新しいファイルディスクリプターを返す。 エラーが発生した場合は -1 を返す (その 場合は errno が適切に設定される)。
エラー
open(), openat(), creat() は以下のエラーで失敗する。 EACCES ファイルに対する要求されたアクセスが許されていないか、 pathname のディレクトリ部分の何れかのディレ クトリに検索許可がなかった。 またはファイルが存在せず、親ディレクトリへの書き込み許可がなかった。 (path_resolution(7) も参照すること。) EDQUOT O_CREAT が指定された場合で、そのファイルが存在せず、ディスクブロックか inode がそのファイルシステ ムのユーザークォータに達していた。 EEXIST pathname は既に存在し、 O_CREAT と O_EXCL が使用された。 EFAULT pathname がアクセス可能なアドレス空間の外を指している。 EFBIG EOVERFLOW 参照。 EINTR 遅いデバイス (例えば FIFO、 fifo(7) 参照) のオープンが完了するのを待って停止している間に システム コールがシグナルハンドラーにより割り込まれた。 signal(7) 参照。 EINVAL ファイルシステムが O_DIRECT フラグをサポートしていない。 詳細は注意を参照。 EINVAL flags に無効な値が入っている。 EINVAL flags に O_TMPFILE が指定されたが、 O_WRONLY も O_RDWR も指定されていなかった。 EISDIR pathname はディレクトリを参照しており、書き込み要求が含まれていた (つまり O_WRONLY または O_RDWR が設定されている)。 EISDIR pathname が存在するディレクトリを参照していて、 O_TMPFILE および O_WRONLY と O_RDWR の一方が flags に指定されていたが、 このカーネルバージョンでは O_TMPFILE 機能が提供されていない。 ELOOP pathname を解決する際に遭遇したシンボリックリンクが多過ぎる。 ELOOP pathname がシンボリックリンクで、 flags に O_NOFOLLOW が指定されたが、 O_PATH が指定されていなかっ た。 EMFILE プロセスがオープンしているファイル数がすでに最大数に達している (getrlimit(2) の RLIMIT_NOFILE の説 明を参照)。 ENAMETOOLONG pathname が長過ぎる。 ENFILE オープンされているファイルの総数がシステムの制限に達している。 ENODEV pathname がデバイススペシャルファイルを参照しており、対応するデバイスが存在しない。 (これは Linux カーネルのバグであり、この場合には ENXIO が返されるべきである) ENOENT O_CREAT が設定されておらず、かつ指定されたファイルが存在しない。 または、 pathname のディレクトリ 部分が存在しないか壊れた (dangling) シンボリックリンクである。 ENOENT pathname が存在しないディレクトリを参照していて、 O_TMPFILE および O_WRONLY と O_RDWR の一方が flags に指定されていたが、 このカーネルバージョンでは O_TMPFILE 機能が提供されていない。 ENOMEM 十分なカーネルメモリーがない。 ENOSPC pathname を作成する必要があるが、 pathname を含んでいるデバイスに新しいファイルのための空き容量が ない。 ENOTDIR pathname に含まれるディレクトリ部分のどれかが実際にはディレクトリでない。 または O_DIRECTORY が指 定されており、 pathname がディレクトリでない。 ENXIO O_NONBLOCK | O_WRONLY が設定されており、指定したファイルが FIFO で そのファイルを読み込み用でオー プンしている FIFO が存在しない。 または、ファイルがデバイススペシャルファイルで 対応するデバイスが 存在しない。 EOPNOTSUPP pathname を含んでいるファイルシステムが O_TMPFILE をサポートしていない。 EOVERFLOW pathname が参照しているのが、大き過ぎてオープンできない通常のファイルである。 通常、このエラーが発 生するは、32 ビットプラットフォーム上で -D_FILE_OFFSET_BITS=64 を指定せずにコンパイルされたアプリ ケーションが、ファイルサイズが (1<31)-1 バイトを超えるファイルを開こうとした場合である。 上記の O_LARGEFILE も参照。 これは POSIX.1-2001 で規定されているエラーである。 2.6.24 より前のカーネルで は、Linux はこの場合にエラー EFBIG を返していた。 EPERM O_NOATIME フラグが指定されたが、呼び出し元の実効ユーザー ID が ファイルの所有者と一致せず、かつ呼 び出し元に特権 (CAP_FOWNER) がない。 EPERM 操作が file seal により禁止されている。 fcntl(2) 参照。 EROFS pathname が読み込み専用のファイルシステム上のファイルを参照しており、 書き込みアクセスが要求され た。 ETXTBSY pathname が現在実行中の実行イメージを参照しており、書き込みが要求された。 EWOULDBLOCK O_NONBLOCK フラグが指定されたが、そのファイルには矛盾するリースが設定されていた (fcntl(2) 参照)。 openat() では以下のエラーも発生する。 EBADF dirfd が有効なファイルディスクリプターではない。 ENOTDIR pathname が相対パス名で、 dirfd がディレクトリ以外のファイルを参照しているファイルディスクリプター である。
バージョン
openat() はカーネル 2.6.16 で Linux に追加された。 ライブラリによるサポートはバージョン 2.4 で glibc に 追加された。
準拠
open(), creat() SVr4, 4.3BSD, POSIX.1-2001, POSIX.1-2008. openat(): POSIX.1-2008. フラグ O_DIRECT, O_NOATIME, O_PATH, O_TMPFILE は Linux 特有のものである。 これらのフラグの定義を得るため には _GNU_SOURCE を定義しなければならない。 フラグ O_CLOEXEC, O_DIRECTORY, O_NOFOLLOW は POSIX.1-2001 では規定されていないが、 POSIX.1-2008 では規定 されている。 glibc 2.12 以降では、これらの定義を得るには、 _POSIX_C_SOURCE を 200809L 以上の値で定義する か、 _XOPEN_SOURCE を 700 以上の値で定義する。 glibc 2.11 以前では、 これらの定義を得るには _GNU_SOURCE を定義する。 feature_test_macros(7) に注意書きがあるように、 _POSIX_C_SOURCE, _XOPEN_SOURCE, _GNU_SOURCE などの機能検 査マクロはどのヘッダーファイルをインクルードするより前に定義しなければならない。
注意
Linux では、 O_NONBLOCK フラグは、 open を実行したいが read または write を実行する意図は 必ずしもないこ とを意味する。 これは ioctl(2) のためのファイルディスクリプターを取得するために、 デバイスをオープンする ときによく用いられる。 O_RDONLY | O_TRUNC の影響は未定義であり、その動作は実装によって異なる。 多くのシステムではファイルは実際 に切り詰められる。 open() はスペシャルファイルをオープンすることができるが、 creat() でスペシャルファイルを作成できない点 に注意すること。 代わりに mknod(2) を使用する。 ファイルが新しく作成されると、 ファイルの st_atime, st_ctime, st_mtime フィールド (それぞれ最終アクセス時 刻、最終状態変更時刻、最終修正時刻である。 stat(2) 参照) が現在時刻に設定される。 さらに親ディレクトリの st_ctime と st_mtime も現在時刻に設定される。 それ以外の場合で、O_TRUNC フラグでファイルが修正されたとき は、 ファイルの st_ctime と st_mtime フィールドが現在時刻に設定される。 オープンファイル記述 オープンファイル記述という用語は POSIX で使用されている用語で、オープンされているファイルのシステム共通の テーブルのエントリーを参照するものである。 別の文脈では、このオブジェクトはいろいろな呼び方があり、 「 オープンファイルオブジェクト」、「ファイルハンドル」、「オープンファイルテーブルエントリー」、 カーネル開 発者の用語では struct file などと呼ばれる。 ファイルディスクリプターが (dup(2) や同様のシステムコールを使って) 複製される際に、 複製されたファイル ディスクリプターは元のファイルディスクリプターと同じオープンファイル記述を参照する。 結果として 2 つの ファイルディスクリプターはファイルオフセットとファイル状態フラグを共有する。 このような共有はプロセス間で も起こり得る。 fork(2) で作成された子プロセスは親プロセスのファイルディスクリプターの複製を継承し、これら の複製は同じオープンファイル記述を参照する。 1 つのファイルに対して open(2) を行う毎に、新しいオープンファイル記述が作成される。 したがって、 1 つの ファイル inode に対して複数のオープンファイル記述が存在することがありえる。 同期 I/O POSIX.1-2008 の「同期 I/O」の選択肢として複数種類が規定されており、 動作を制御するために open() フラグと して O_SYNC, O_DSYNC, O_RSYNC が規定されている。 この選択肢を実装がサポートしているかに関わらず、 各実装 では少なくとも通常のファイルに対して O_SYNC が利用できなければならない。 Linux は O_SYNC と O_DSYNC を実装しているが、 O_RSYNC は実装していない (少し間違っているのだが、 glibc で は O_RSYNC が O_SYNC と同じ値で定義されている)。 O_SYNC は、 同期 I/O でのファイル完全性完了を提供する。 つまり、 書き込み操作はデータとすべての関連メタ データを裏で利用されているハードウェアにフラッシュすることを意味する。 O_DSYNC は、 同期 I/O でのデータ完 全性完了を提供する。 つまり、 書き込み操作はデータを裏で利用されているハードウェアにフラッシュするが、 そ れ以降の読み出し操作が正常に完了するのに必要なメタデータの更新のみをフラッシュする。 データ完全性完了は、 ファイル完全性完了を必要としないアプリケーションで、 ディスク操作の数を減らすことができる。 2 種類の完了の違いを理解するために、 ファイルメタデータの 2 つの要素、 ファイルの最終修正時刻 (st_mtime) とファイル長、を考える。 すべての書き込み操作は最終修正時刻を更新するが、 ファイルの末尾にデータを追加す る書き込み操作のみがファイル長を変更する。 最終修正時刻は、 読み出しが正常に完了するのに必要ではないが、 ファイル長は必要である。 したがって、 O_DSYNC はファイル長のメタデータの更新がフラッシュされることだけを 保証する (これに対して O_SYNC では最終修正時刻のメタデータも常にフラッシュされる)。 Linux 2.6.33 より前では、 Linux は open() では O_SYNC フラグのみを実装していた。 しかしながら、 このフラ グが指定された場合、 ほとんどのファイルシステムで提供されていたのは実際には同期 I/O でのデータ完全性完了 と等価なものであった (つまり、 O_SYNC は実際には O_DSYNC と等価なものとして実装されていた)。 Linux 2.6.33 行こう では、 正しい O_SYNC のサポートが提供されている。 しかしながら、 バイナリレベルの後方 互換性を保証するため、 O_DSYNC は以前の O_SYNC と同じ値で定義されており、 O_SYNC は O_DSYNC フラグの値を 含む新しい (2 ビットの) フラグ値として定義されている。 これにより、 新しいヘッダーを使ってコンパイルされ たアプリケーションで、 2.6.33 より前のカーネルで少なくとも O_DSYNC の動作は同じになることが保証される。 NFS NFS を実現しているプロトコルには多くの不備があり、特に O_SYNC と O_NDELAY に影響する。 UID マッピングを使用している NFS ファイルシステムでは、 open() がファイルディスクリプターを返した場合で も read(2) が EACCES で拒否される場合がある。 これはクライアントがアクセス許可のチェックを行って open() を実行するが、読み込みや書き込みの際には サーバーで UID マッピングが行われるためである。 ファイルアクセスモード 「アクセスモード」の値 O_RDONLY, O_WRONLY, O_RDWR は、 flags に指定できる他の値と違い、個々のビットを指定 するものではなく、 これらの値は flags の下位 2 ビットを定義する。 O_RDONLY, O_WRONLY, O_RDWR はそれぞれ 0, 1, 2 に定義されている。 言い換えると、 O_RDONLY | O_WRONLY の組み合わせは論理的に間違いであり、確かに O_RDWR と同じ意味ではない。 Linux では、特別な、非標準なアクセスモードとして 3 (バイナリでは 11) が 予約されており flags に指定でき る。 このアクセスモードを指定すると、ファイルの読み出し/書き込み許可をチェックし、 読み出しにも書き込みに も使用できないディスクリプターを返す。 この非標準のアクセスモードはいくつかの Linux ドライバで、デバイス 固有の ioctl(2) 操作にのみ使用されるディスクリプターを返すために使われている。 openat() や他のディレクトリファイルディスクリプター API の基本原理 openat() やディレクトリファイルディスクリプターを引き数を取る他のシステムコールやライブラリ関数 (execveat(2), faccessat(2), fanotify_mark(2), fchmodat(2), fchownat(2), fstatat(2), futimesat(2), linkat(2), mkdirat(2), mknodat(2), name_to_handle_at(2), readlinkat(2), renameat(2), symlinkat(2), unlinkat(2), utimensat(2) mkfifoat(3), scandirat(3)) は二つの理由から用意されている。 ここでは、 openat コールに関して説明するが、この基本原理は他のインターフェースでも同じである。 最初の理由として、 openat() を使うと、 アプリケーションは、 カレントワーキングディレクトリ以外のディレク トリで open() を使ってファイルをオープンする際に起こり得る競合条件を避けることができる。 これらの競合条件 は、 open() に渡されたディレクトリプレフィックスの構成要素が open() の呼び出しと並行して変化する可能性が あるという点に由来している。 例えば、ファイル path/to/xxx が存在する場合にファイル path/to/xxx.dep を作成 したいとする。 問題は、存在確認とファイル作成の間に、 path や to (シンボリックリンクでもよい) が別の場所 を指すように変更されることがあるということだ。 このような競合条件は、 対象のディレクトリに対するファイル ディスクリプターをオープンし、 それから fstatat(2) や openat() の dirfd 引き数としてそのファイルディスク リプターを指定することで、 避けることができる。 二つ目として、 openat() を使うと、アプリケーションが管理するファイルディスクリプターにより、 スレッド単位 の「カレントワーキングディレクトリ」を実装することができる (この機能は、 /proc/self/fd/dirfd を使った方法 でも実現することができるが、 効率の面で落とる)。 O_DIRECT O_DIRECT フラグを使用する場合、ユーザー空間バッファーの長さやアドレス、 I/O のファイルオフセットに関して アラインメントの制限が課されることがある。 Linux では、アラインメントの制限はファイルシステムやカーネルの バージョンに よって異なり、全く制限が存在しない場合もある。 しかしながら、現在のところ、指定されたファイ ルやファイルシステムに対して こうした制限があるかを見つけるための、アプリケーション向けのインターフェース で ファイルシステム非依存のものは存在しない。 いくつかのファイルシステムでは、制限を確認するための独自の インターフェースが 提供されている。例えば、 xfsctl(3) の XFS_IOC_DIOINFO 命令である。 Linux 2.4 では、転送サイズ、 ユーザーバッファーのアライメント、ファイルオフセットは、 ファイルシステムの 論理ブロックサイズの倍数でなければならない。 Linux 2.6.0 以降では、 内部で使われるストレージの論理ブロッ クサイズのアライメント (通常は 512 バイト) で十分である。 論理ブロックサイズは ioctl(2) BLKSSZGET 操作や 以下のシェルコマンドから知ることができる。 blockdev --getss メモリーバッファーがプライベートマッピング (mmap(2) の MAP_PRIVATE フラグで作成されたマッピング) の場合に は、O_DIRECT I/O は fork(2) システムコールと同時に決して実行すべきではない (プライベートマッピングに は、ヒープ領域に割り当てられたメモリーや静的に 割り当てたバッファーも含まれる)。非同期 I/O インターフェー ス (AIO) 経由 やプロセス内の他のスレッドから発行された、このような I/O は、 fork(2) が呼び出される前に完 了されるべきである。 そうしなかった場合、データ破壊や、親プロセスや子プロセスでの予期しない 動作が起こる 可能性がある。 O_DIRECT I/O 用のメモリーバッファーが shmat(2) やMAP_SHARED フラグ 付きの mmap(2) で作成さ れた場合には、この制限はあてはまらない。 madvise(2) でメモリーバッファーにアドバイス MADV_DONTFORK が設定 され ている場合にも、この制限はあてはまらない(MADV_DONTFORK はそのメモリー バッファーが fork(2) 後に子プ ロセスからは利用できないことを保証するも のである)。 O_DIRECT フラグは SGI IRIX で導入された。SGI IRIX にも Linux 2.4 と同様の (ユーザーバッファーの) アライン メントの制限がある。 また、IRIX には適切な配置とサイズを取得するための fcntl(2) コールがある。 FreeBSD 4.x も同じ名前のフラグを導入したが、アラインメントの制限はない。 O_DIRECT が Linux でサポートされたのは、カーネルバージョン 2.4.10 である。 古い Linux カーネルは、このフ ラグを単に無視する。 O_DIRECT フラグをサポートしていないファイルシステムもあり、その場合は、 O_DIRECT を 使用すると open() は EINVAL で失敗する。 アプリケーションは、同じファイル、 特に同じファイルの重複するバイト領域に対して、 O_DIRECT と通常の I/O を混ぜて使うのは避けるべきである。 ファイルシステムがこのような状況において一貫性の問題を正しく 扱うこと ができる場合であっても、全体の I/O スループットは どちらか一方を使用するときと比べて低速になるであろう。 同様に、アプリケーションは、同じファイルに対して mmap(2) と直接 I/O (O_DIRECT) を混ぜて使うのも避けるべ きである。 NFS で O_DIRECT を使った場合の動作はローカルのファイルシステムの場合と違う。 古いカーネルや、ある種の設定 でコンパイルされたカーネルは、 O_DIRECT と NFS の組み合わせをサポートしていないかもしれない。 NFS プロト コル自体はサーバにフラグを渡す機能は持っていないので、 O_DIRECT I/O はクライアント上のページキャッシュを バイパスするだけになり、 サーバは I/O をキャッシュしているかもしれない。 クライアントは、 O_DIRECT の同期 機構を保持するため、サーバに対して I/O を同期して行うように依頼する。 サーバによっては、こうした状況 下、特に I/O サイズが小さい場合に 性能が大きく劣化する。 また、サーバによっては、I/O が安定したストレージ にまで行われたと、 クライアントに対して嘘をつくものもある。 これは、サーバの電源故障が起こった際にデータ の完全性が保たれない 危険は少しあるが、性能面での不利な条件を回避するために行われている。 Linux の NFS ク ライアントでは O_DIRECT I/O でのアラインメントの制限はない。 まとめると、 O_DIRECT は、注意して使うべきであるが、強力なツールとなる可能性を持っている。 アプリケーショ ンは O_DIRECT をデフォルトでは無効になっている性能向上のためのオプションと 考えておくのがよいであろう。 「O_DIRECT でいつも困るのは、インターフェース全部が本当にお馬鹿な点だ。 たぶん危ないマインドコント ロール剤で 頭がおかしくなったサルが設計したんじゃないかな」 — Linus
バグ
現在のところ、 open() の呼び出し時に O_ASYNC を指定してシグナル駆動 I/O を有効にすることはできない。 こ のフラグを有効にするには fcntl(2) を使用すること。 カーネルが O_TMPFILE 機能をサポートしているかを判定する際に、 EISDIR と ENOENT の 2 つのエラーコードを チェックしなければならない。
関連項目
chmod(2), chown(2), close(2), dup(2), fcntl(2), link(2), lseek(2), mknod(2), mmap(2), mount(2), open_by_handle_at(2), read(2), socket(2), stat(2), umask(2), unlink(2), write(2), fopen(3), fifo(7), path_resolution(7), symlink(7)
この文書について
この man ページは Linux man-pages プロジェクトのリリース 3.79 の一部 である。プロジェクトの説明とバグ報告 に関する情報は http://www.kernel.org/doc/man-pages/ に書かれている。