情報集合論(仮名) 情報集合の情報量
集合論における濃度の定義は・・・
集合Aからみて集合Bと1対1の対応がある
- 同じものを二度数えない( Aのどの元もBの二つの異なった元と対応している )
- 数え漏れをしない( Aのどの元をとっても、それに対応しているBの元がある )
この定義によると、自然数集合と奇数集合の濃度は同じです。これが情報技術としては論理的整合性がなく不便です。確かに有限区間内では関数を一つ用意すると、同じビット数で表現できますが、それだと無限と有限に距離がありすぎますし、変換関数が必要であるという情報が反映されていません。変換関数を用意しないと、整数と自然数では1ビットの差が生じます。たかが1ビットですが、情報技術者としては見逃せません。それで、既存の濃度の定義を拡張します。
集合Aと集合B双方の視点から見て1対1の対応がある
- 集合Aと集合Bの対応方法はフィルターである点に注意し、
双方の集合を追加する要素で構成される区間を考える。 - 通常の濃度の定義から集合Aから集合Bの1対1対応を考える。
※片方の対応が成り立つ場合、適切な変換関数があれば無理やり有限区間内に押し込められる。 - 集合Bから集合Aの1対1対応を考える。
- フィルターを通った要素の数をもとに、代数的に情報量を決定する。
例、自然数集合Nと整数集合Zの情報量を計算する。
Nは0以外の数値を通す。従って、0から∞の数を生成する関数ΓをもとにΓ - 1 の情報量を持つ。
Zはマイナス符号を持つ。マイナス符号は2個のパターンを生み出すから 2Γとなる。ただし、-0を認めない場合 2Γ - 1となる。
妥当性を確かめるために、区間 -10 から +10 の要素を通してみる。
Nは10個の要素を通し、Zは21個の要素を通す。従って、情報量が妥当だとわかる。
このΓ関数の名前はどうしようかな?名前がないと不自然だから、源数情報集合(げんすう)としておこう。もしかすると、「数え数」(かぞえすう)とした方がいいかもしれない。源数集合をGとすると、自然数集合Nの定義は{ x | x ∊ G ただし x <> 0 }となる。ただし、情報集合論では属するという概念がちょっと違うから、N{ x : x -|> G | x ≠ 0 }( 情報量I = G - 1 )という具合にしておこう。-|> 記号はフィルターを通す(条件を満たす)という感じがしていいと思う。その逆は、x -<| ( フィルターの壁を越えられなかった )としておきます。紙上でも思考内でも表現できる理論が好ましいから、わかりやすい情報集合論の記号も考えておく必要があります。