Provided by: freewnn-common_1.1.1~a021+cvs20130302-7build1_all
名称
UJIS形式辞書ファイル ― UJIS形式辞書ファイルの形式
機能
UJIS形式辞書ファイルは、バイナリ形式の固定形式辞書と登録可能形式辞書 をUJIS形式で 表現したものである。 UJIS形式辞書ファイルと固定形式辞書,および登録可能形式辞書間の相 互変 換は、辞書ユーティリティを用いて行う。 バイナリ形式に変換する場合、単語は読みでソート されていなければならない。 UJIS辞書ファイルに対する語句の追加,削除,及び変更は、vi 等 のエディ タで行う。 ファイルの形式 \comment コメント(CR) \total 総頻度(CR) \hinsi (CR) 読み(SP)単語(SP)品詞(SP)頻度(SP)[コメント](CR) 読み(SP)単語(SP)品詞(SP)頻度(SP)[コメント](CR) 読み(SP)単語(SP)品詞(SP)頻度(SP)[コメント](CR) | | | | | | | | | | | | (EOF) コメント 辞書全体に付けられたコメントである。 総頻度 辞書全体の頻度(その辞書が経験した単文節変換の回数)である。int 型。 読み 単語の読み。256文字までの長さで、ユーザ辞書はひらがな・ 「ー」・半角英数字、固 定形式辞書はひらがな・「ー」で逆順に表現する。 なお、半角英字は大文字・小文字の区 別をしない。 ソート時の文字の大小関係は、「ー」・ひらがな・半角英数字の順である。 単語 256文字までの半角文字・全角文字・外字など全ての文字表現が可能。 スペース、改行 文字などの制御文字は に続く2桁の8進数で表す。\ に 続く 0 以外の文字はその文字 になる(\\ → \)。 品詞 品詞名で、直接表現する。 名詞 固有名詞 品詞名は、/usr/local/lib/wnn/hinsi.data 参照。 頻度 各単語の頻度である。 コメント 512文字まで。 6 Septemter 1993 UJIS_DIC(5)