二体相関:ランダムなデータの場合
by Isoji MIYAGI @ Geological Survey of Japan, AIST
- by 宮城磯治
- 産業技術総合研究所 深部センター
- 作成:平成15年6月26日(木)
- デザイン変更:2008年1月4日金曜日
- 関連ページ:
目次 |
これは何か
数理設計研究所の「マクスウエルの悪魔」さんが作成した乱数データのうち「rndm_777」について,こちらのページと同様な解析をしてみました.
使用したデータ
このファイルrndm_777には0-255のランダムな数値が100000バイト連続しています.
このうち頭から1400バイト部分↑について解析しました.
したこと:
ファイル先頭からの位置を「データの位置」,その部分の数値を「データの強度」と考えます.そして,「データの強度」を「データの個数」におきかえます.たとえばそのデータが20の場合,その位置に20個の「粒」があると考えます.すると,様々な位置情報をもった,多数の粒を思いうかべることができます.
これら全ての粒について,お互いの距離を計算します.全ての粒のくみあわせについて,距離ごとに粒のペア数を数えあげ,距離を横軸にしてグラフに表示します.
結果
横幅10でのヒストグラム.横軸は「ある粒からみた,別の粒(但し自分自身も含む)までの距離」を意味します.縦軸は「その距離だけ離れている粒子ペアの累計」です.横軸のゼロが最大になる理由は,全ての粒は自分自身とペア(距離ゼロ)を組むので数が大くなることと,同じ位置に複数の粒を置いているからです.要するにこのグラフは,ある粒を中心に,その粒からどのような距離(横軸)にどれだけの量の粒(縦軸)が存在するか,確率を示しています.このグラフをみると,距離0以外縦軸の値は一定であることがわかります.すべての距離にまんべんなく粒が分布しており,ある特定の大きさのクラスターが形成されていないことを示しています.
横幅73でのヒストグラム.長い目でみても,粒子の存在確率は一定です.
ただし,データの端にちかづくにつれ存在確率は減少してゆきます(下図).ここでは先頭から1400バイトのデータを使用したので,それ以上の距離の粒子は存在しません.
解析に使用したデータ(先頭から1400バイト)の端付近までプロットしたもの.