FANDOM


辞書の濃さ(DRP, Dictionary Richness Point)とは、人工言語における辞書の情報密度を表す数値のひとつである。Fafs falira sashimi氏が2014年に考案、2015年7月に辞書の情報密度を表す数値として提案した。

定義 編集

DRPは「辞書における、1単語あたりの情報量」として定義される。なお、ここでいう情報量とは、情報科学的な量(エントロピー)ではなく、単に字数に依拠して記述を定量化したものを指す。以下に述べるように、現時点で2通りの算出方法が提案されている。

PDIC方式編集

一般的な算出方法は、PDICを使ったものである。

  1. 最適化済みの人工言語の.dicファイルを用意する。
  2. (ファイルサイズ÷単語数)を小数第三位切り捨てで計算する。

たとえば、リパライン語の辞書は2016年8月12日時点において203.58DRPとなっている。

おかゆメソッド編集

おかゆ氏は、辞書から無作為に数百単語(可能であれば全単語)をサンプリングし、それぞれの単語の項目の文字数の平均を取るという算出方法を提案している。この算出方法では標準偏差も計算できるため、記述の偏りも見積もることができる。PDIC方式と異なり、各辞書の形式を同形式に整えないで計算するため、PDICの辞書形式をもたない人工言語でもDRPが算出できる一方で、辞書形式それ自体による系統誤差が生じる。

問題点・疑問点 編集

  • この数値の特定の解釈が日本の人工言語界隈で共有されていない
  • TP のような基準が 2019/03 現在も確定していない
    • 基準がないゆえにどの方式で算出したのかを明記する必要があるが合意がない
      • PDIC 方式の辞書形式では辞書の記載と無関係の要因がファイルサイズに影響を与えていると思われる。
  • 人工言語の評価は疎か辞書の評価にも直結しない場合がある
    • 追記などをしない場合、推敲や添削によって文字数が減ると相対的に値が減ってしまう
    • 適当な文字列を並べただけの語句の説明にもなっていない《自称》語句が辞書の質を担っているとは到底思えない
特に記載のない限り、コミュニティのコンテンツはCC-BY-SA ライセンスの下で利用可能です。