初めに
新シャレイア語辞典形式は、 シャレイア語の辞典データを表現するための専用の形式である。 旧来の辞典形式では多言語による説明の記述ができなかったため、 H3350 にそれを改善する新形式として提案され、 H3360 から本格的に使用されている。
概要
新シャレイア語辞典形式には、 単語データと設定データとマーカーデータの 3 種類のデータがある。 1 つの辞典データの中に単語データは複数存在するが、 設定データとマーカーデータはそれぞれ 1 つしか存在しない。
これらの各種データをどのようにファイルに格納するかに応じて、 ディレクトリ形式と単独ファイル形式の 2 つの保存形式が定められている。 ディレクトリ形式では 1 つのディレクトリで 1 つの辞典データを表現し、 単独ファイル形式では 1 つのファイルで 1 つの辞典データを表現する。
ディレクトリ形式は、 単語データと設定データとマーカーデータをそれぞれ特定のディレクトリ内のファイルに格納し、 そのディレクトリ全体で 1 つの辞典データを表現する形式である。 単語データは拡張子 .xdnw で保存され、 設定データとマーカーデータはともに拡張子 .xdns で保存される。 各データのファイル名については仕様上決められておらず、 ディレクトリ形式のデータを読み込むときも個々のデータのファイル名の情報は使わないので、 ファイル名は自由に決めて良い。
単独ファイル形式は、 単語データと設定データとマーカーデータを一続きにして 1 つのファイルに格納し、 そのファイルで 1 つの辞典データを表現する形式である。 単独ファイル形式のファイルは拡張子 .xdn で保存される。
各データの構造
単語データ
単語データは、 3 段階の階層構造になっている。 すなわち、 単語データは言語パートを複数個もち、 言語パートはセクションを複数個もち、 セクションはフィールドを複数個もつ。 単語データと言語パートとセクションは、 それぞれに特有のヘッダー行から始められ、 このヘッダー行によって各部分の範囲が明示される。
単語データは、 単語データヘッダー行から始まる。
単語データヘッダー行は、 *
の後にスペースを入れ、 さらに一意綴りと造語日がスペースで区切って記される。
造語日にはハイリア数を用い、 @
を接頭する。
* @1036 lic
この後には、 言語パートが複数個続く。
言語パートは、 言語パートヘッダー行から始まり、 次の言語パートヘッダー行の前もしくは単語データの終わりまで続く。
言語パートヘッダー行は、 !
の直後に、 その言語パートが書かれている言語の ISO 639-1 コードが大文字で記される。
!JA
言語パートヘッダー行の後には、 セクションが複数個続く。
セクションは、 セクションヘッダー行から始まり、 次のセクションヘッダー行の前もしくはそれが属する言語パートの終わりまで続く。
セクションヘッダー行は、 +
の後にスペースを入れ、 その単語の語彙的品詞を <
と >
で囲んだものを続ける。
+ <動>
セクションヘッダー行の後には、 フィールドが複数個続く。 フィールドは 1 行のみから成るデータであり、 そのフィールドの種類を表す記号の後に、 フィールドの中身が続けられる。 フィールドの記法については次の節で詳しく述べる。
このページの最後の節に単語データの例が載っているので、 それも参照すること。
設定データ
設定データは、 バージョンパート, アルファベット順パート, 変更履歴パートの 3 つのパートから成る。 設定データと各パートは、 それぞれに特有のヘッダー行から始められ、 このヘッダー行によって各部分の範囲が明示される。
設定データは、 設定データヘッダー行から始まる。
設定データヘッダー行は、 **
のみから成る行である。
この後には、 バージョンパートが続く。
バージョンパートは、 バージョンパートヘッダー行から始まり、 その次の行にバージョンフィールドが続いて終わる。
バージョンパートヘッダー行は、 !VERSION
のみから成る。
バージョンフィールドは、 -
の後にスペースを入れ、 言語のバージョン番号が続く。
!VERSION
- 5.5
続いて、 アルファベット順パートが置かれる。
アルファベット順パートは、 アルファベット順パートヘッダー行から始まり、 その次の行にアルファベット順フィールドが続いて終わる。
アルファベット順パートヘッダー行は、 !ALPHABET
のみから成る。
アルファベット順フィールドは、 -
の後にスペースを入れ、 アルファベット順を表す文字列が続く。
!ALPHABET
- sztdkgfvpbcqxjlrnmyhaâáàeêéèiîíìoôòuûù
続いて、 変更履歴パートが置かれる。
変更履歴パートは、 変更履歴パートヘッダー行から始まり、 変更履歴フィールドが複数個続いて終わる。
変更履歴パートヘッダー行は、 !REVISION
のみから成る。
変更履歴フィールドは、 -
の後にスペースを入れ、 変更前の綴りを {
と }
で囲んで記し、 →
とスペースで区切って、 変更語の綴りを {
と }
で囲まれて続ける。
-
とその後の記述の間にスペースで区切って日付を記すこともできる。
このとき、 日付にはハイリア数を用い、 @
を接頭する。
!REVISION
- @1139 {pacar} → {parec}
- {vafsuf} → {milcit}
マーカーデータ
厳密な仕様は策定中です。
単語データ内のフィールド
=
(訳語フィールド)
=
(訳語フィールド)
=
で始まる行には、 その単語の訳語を記す。
=
の後にスペースを入れ、 文法的品詞を <
と >
で囲んで記した後にスペースを入れ、 さらに格組の記述を (
と )
で囲んで記した後にスペースを入れ、 最後に訳語を ,
で区切って並べる。
文法的品詞と各組の記述は省略できる。
= <動> (/a/ が /e/ を) 見る, 目にする
M:
(語義フィールド)
M:
(語義フィールド)
M:
で始まる行には、 その単語の国語辞典的な意味を記す。
M:
の後にスペースを入れ、 その後は自由記述でフォーマットに特に制限はない。
M: 目を使って /e/ の様子を認識する。
E:
(語源フィールド)
E:
(語源フィールド)
E:
で始まる行には、 その単語の語源を書く。
E:
の後にスペースを入れ、 その後は自由記述でフォーマットに特に制限はない。
E: < [sox] (< {soxal}) + [sot] (< {sotik})。
U:
(語法フィールド)
U:
(語法フィールド)
U:
で始まる行には、 その単語の語法を書く。
U:
の後にスペースを入れ、 その後は自由記述でフォーマットに特に制限はない。
このフィールドは、 その単語自身の用法を記す部分であって、 その単語が表すものに関する情報を記す部分ではない。
例えば、 「学校」 を意味する単語であれば、 「基本的に高校までを指す」 というのはこの部分に書けるが、 人工世界における学校制度についてはここに書くべきではない。
このような情報は N:
フィールドに書く。
U: {e} 句には {kin} 節をとることができ、「~の様子を見る」の意味になる。
O:
(タスクフィールド)
O:
(タスクフィールド)
O:
で始まる行には、 その単語に関してこれから考察すべき内容を書く。
O:
の後にスペースを入れ、 その後は自由記述でフォーマットに特に制限はない。
O: {lòt} との差別化が明確にできていない。これまでの用例などを参考にして明確化すべき。
N:
(備考フィールド)
N:
(備考フィールド)
N:
で始まる行には、 その単語に関する備考を書く。
N:
の後にスペースを入れ、 その後は自由記述でフォーマットに特に制限はない。
これ以外のフィールドのどこにも該当しないような情報を書くのに使われる、 いわば 「その他」 に相当するフィールドである。 特に、 その単語が表すものに関する百科事典的な説明はここに書かれる。
N: 会話や思考の内容を表している文を囲んで用いる。
H:
(履歴フィールド)
H:
(履歴フィールド)
H:
で始まる行には、 その単語に関する変更内容や変更理由を書く。
H:
の後にスペースを入れ、 その後は自由記述でフォーマットに特に制限はない。
H: {kòd} と綴りが衝突していたため、綴りを [kùd] から {kudoq} に変更した。
P:
(成句フィールド)
P:
(成句フィールド)
P:
で始まる行には、 その単語を含む成句を書く。
P:
の後にスペースを入れ、 その後にシャレイア語による成句を記し、 →
とスペースで区切って、 日本語による訳語を ,
で区切って続ける。
さらにこの後には、 |
とスペースに続けて自由記述ができる。
|
の後の自由記述部分は省略できる。
P: {fi qelar} → 声に出して, 声を出して | 無言ではなく声に出して何かを行っていることを表す。
S:
(例文フィールド)
S:
(例文フィールド)
S:
で始まる行には、 その単語を含む例文を書く。
S:
の後にスペースを入れ、 その後にシャレイア語による文を記し、 →
とスペースで区切って、 説明の記述言語による翻訳文を続ける。
S: {pîtas a tel, dà kelitas a tel te lôk avév.} → 私は怖かったが、同時に安心もしていた。
-
(関連語フィールド)
-
(関連語フィールド)
-
で始まる行には、 その単語の関連語を書く。
=
の後にスペースを入れ、 文法的品詞を <
と >
で囲んで記した後にスペースを入れ、 さらに関連語を ,
で区切って並べる。
関連語の末尾に *
を付けることで、 その単語の語法欄に詳しい関連語の使い分けが記載されていることを表せる。
- <類> {likom}*, {káz}, {valcas}
隠しフィールド
訳語フィールドにおいて、 行頭の =
を =?
に変えると、 訳語データとして検索時には利用される一方、 単語データを画面に表示する際には表示されなくなる。
これは、 表記揺れを吸収するためによく用いられる。
同様に、 行頭がラテン大文字と :
で始まるフィールドにおいて、 その :
の前に ?
を入れる (O:
であれば O?:
とする) と、 同じく単語データを画面に表示する際に表示されなくなる。
辞書の編集者にのみ必要な情報などを書くのに用いられる。
=? りんご, 林檎
O?: 壁や別の棚に掛けて使うラックは {tòked} に入るか?
日付
行頭がラテン大文字と :
で始まるフィールドにおいて、 :
とその後の記述の間にスペースで区切って日付を記すことができる。
日付にはハイリア数を用い、 @
を接頭する。
H: @1982 何の手前なのかを {ie} 句ではなく {i} 句とした。
テキストの装飾
全てのフィールドの記述において、 以下のテキスト装飾タグが利用できる。
{}
(半角波括弧) で囲まれた部分は、 シャレイア語で書かれていると見なされ、 特定のフォントで表示され、 さらに自動的にそこに含まれる単語を検索するリンクになる。
[]
(半角角括弧) で囲まれた部分も、 同様にシャレイア語で書かれていると見なされ、 特定のフォントで表示されるが、 リンクは張られない。
//
(半角スラッシュ) で囲まれた部分は、 イタリック体で表示される。
`
を前置することで、 これらの装飾タグに使われる記号をエスケープできる。
その他
一意綴り
新シャレイア語辞典形式では、 同じ綴りの見出し語が 2 つあった場合、 片方の末尾に ~
を付けて 2 つを区別する。
同じ綴りの見出し語が 3 つ以上あった場合は、 2 つ目には ~
を付けて 3 つ目には ~~
を付けるといったように、 ~
の個数で区別する。
このようにして ~
を付けて本来同綴の単語を区別できるようにした綴りは、 「一意綴り」 と呼ばれる。
一意綴りから ~
を全て取り除いたものが、 その単語の本来の綴りである。
新シャレイア語辞典形式では、 単語データヘッダー行に書かれるのは本来の綴りではなく一意綴りである。
ZpDIC for Shaleian でのファイル名の決め方
執筆中です。
例
単語データ
以下は、 正当な単語データの例である。 2 つ (日本語と英語) の言語パートをもち、 さらに各言語パートが 2 つのセクションをもっている。 なお、 これはあくまで例のために作られたデータなので、 1 つの単語データとして特に意味があるわけではない。
* @1036 lic
!JA
+ <動>
= <動> (/a/ が /e/ を) 見る, 目にする
=? 見せる
M: 目を使って /e/ の様子を認識する。
E: < [sox] (< {soxal}) + [sot] (< {sotik})。
U: {e} 句には {kin} 節をとることができ、「~の様子を見る」の意味になる。
O: {lòt} との差別化が明確にできていない。これまでの用例などを参考にして明確化すべき。
N: 会話や思考の内容を表している文を囲んで用いる。
H: @2564 {kòd} と綴りが衝突していたため、綴りを [kùd] から {kudoq} に変更した。
P: {fi qelar} → 声に出して, 声を出して | 無言ではなく声に出して何かを行っていることを表す。
S: {pîtas a tel, dà kelitas a tel te lôk avév.} → 私は怖かったが、同時に安心もしていた。
- <類> {likom}*, {káz}, {valcas}
+ <動当>
= <副動> 急に, 突然, 突如
= <形> (/†’n/) 急の, 突然の
M: 予兆が全くなく。
E: < {tud} + [kol] (< {kolcav})。
- <類> {bâl}, {bazis}
!EN
+ <V>
= <V> (/a/, /e/) look at, watch
=? look, show
M: Pay attention to /e/ with one’s eyes.
E: < [sox] (< {soxal}) + [sot] (< {sotik}).
U: One can place a {kin}-clause in the {e}-phrase.
O: There is no clear differentiation from {lòt}. It should be clarified by referring to examples.
N: It is used to surround a sentence that expresses a conversation or thought.
H: @2564 Changed the spelling from [kùd] to {kudoq} because of the spelling conflict with {kòd}.
P: {fi qelar} → aloud, out loud | Indicates that one is doing something aloud rather than silently.
S: {pîtas a tel, dà kelitas a tel te lôk avév.} → I was scared, but at the same time, I was also relieved.
- <S> {likom}*, {káz}, {valcas}
+ <Vk>
= <Bv> suddenly, adruptly
= <A> (/†’n/) sudden, adrupt
M: With no signs at all.
E: < {tud} + [kol] (< {kolcav}).
- <S> {bâl}, {bazis}
設定データ
**
!VERSION
- 5.5
!ALPHABET
- sztdkgfvpbcqxjlrnmyhaâáàeêéèiîíìoôòuûù
!REVISION
- @1139 {pacar} → {parec}
- @1202 {los} → {loc}
- {vafsuf} → {milcit}