統計学的見地による上西データの異常性 今まで上西データの異常性について述べてきたわけだが、一部の人と話をしていてその異常性についてなかなか伝わらないような気がした。よくよく話を聞くと正規分布という言葉すら聞いたことがないとのことだった。集団での行動には特有の正規分布とかポアソン分布という、一定の行動パターンがあることを、どうも一部の人はご存じないようだ。私も統計の専門家とは言うレベルではないが、普通に仕事で統計学的処理はよく使うので正規分布なんて当然誰でも知っていると思っていた(偏差値なんて言葉が当たり前に世の中で飛び交っているんだから)。 |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
上記の表及び、グラフは以前に仮想データの章で説明した上西データにおける手動作成分とPCによる自動作成分の割合を示したものである。私の意見はグラフのオレンジ色に示している部分がPCによって加速度1.1:初期値200,000から自動的に増やされ、それによって全体の値が水増しされていると考えている(これでも手動ウォッチ部分が約120,000/5分〜約174,000/5分となっており、前日の同時間帯に比べ5〜6倍程度になり、最終日における他のメンバーのデータ増加傾向と比較しても、想定される上西の最終日手動ウォッチ部分は前日データに対して類を見ないほど大きなものになっている)。もし、この自動PC分が本当にSNSツールでの発信の影響で多くの人が賛同して自然に集まってきたのであれば、ウォッチ数の増加傾向はそれなりの自然なデータ分布の傾向を示すはずである。 このケースは「NMBメンバー及びそのファンのSNSツールでの発信に反応し、755ウォッチバトルの参加したAKBGの動向に注目している集団の行動」というくくりで表現されると思う。本来そういうケースはポアソン分布で解析されるべきだが、NMBファンの中ではメンバーがSNSツールで発信したら無条件で多くの人が賛同し、上西のウォッチバトルに参加したと言っている輩もいるので、不特定多数が参加する集団の行動と判断して、一般的に使われる正規分布型のデータモデルを採用し、上西データの推移の異常性を説明しておきたいと思う。まあ、スマホへの755専用アプリの導入を導入しないと参加できないイベントで、短時間での新たなウォッチバトル参加者がSNSでの呼びかけだけで、前日比10倍〜30倍以上の規模で2時間程度にわたって継続的に増加することは通常はあり得ない。そうしたことが自然発生的に起きたと主張している時点で、同一目的での行動が極短時間に集中するという、ポアソン分布型での事象発現と言うこと自体にかなり無理があると思うが。 |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
上記の表及び、グラフは自動PC分の3,706,233ウォッチを正規分布に従って配分したものである。1回のSNSでの発信に全員が反応して同時に行動を起こしたと考えるのはあまりに無理があるので、有力メンバーの発信によって大きく2つのピークが発生したと考え、3,700,000の6割(2,220,000):増分1のグループが22:25にピークを迎え、残りの4割(1,480,000):増分2のグループが22:45にピークを迎えたと仮定してデータを作成した。なお、正規分布の性格上、増分1のグループにおける開始時の2,473(約0.1%)と、増分2のグループの終了時1,649(約0.1%)が対象時刻の範囲以外での発生になってしまい、傾向値としてグラフに反映されていないが、グラフ全体の傾向にはほとんど影響しないのでは今回はご容赦願いたい。 この集団は少なくとも24:00までの決められた時間で少しでも多くの結果を出さなきゃいけないことはわかっているはずだから、参加の意思のある者は一刻も早く参加しようと試みるはずである。従ってその行動パターンは本来早めの時間帯に多くの人が増えるのが必然で、時間の経過と共に少しずつ参加者が増えていく可能性は極めて低い。 また、もし新しく参加した人がそのまま継続してウォッチ活動を続けていたとしたら、その増分値の増加カーブは早い時期に急激に増加する形になり、自動PC型(上西の実測データ)のグラフのようになだらかに増加する形にはならないはずである。 どうだろうか、直感的にこちらのグラフの動きの方がより人間の行動パターンに近いと感じていただけるだろうか?特に変動率の折れ線グラフの動きは、今まで他の時間帯の変動率のグラフと似たような動きにはなっているようにも見えるが、いかがだろう?それに対して自動PC型の変動率の折れ線グラフも一見すると大きく上下に動いているようにも見えるが、これは変動率のグラフの目盛り幅が影響している。両者を同じ目盛り幅で比較したのが下記のグラフになる。 |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
上記グラフにおいてはその変動率の推移に著しい違いがあるのがわかるだろうか。自動PC型(上西の実測データ)の変動率の動きはプラスの範囲(0.77%〜17.86%)の狭い幅の中で動いているだけだが、正規分布型のデータモデルで考えると、その変動率は振幅範囲が-46.32%〜145.36%と非常に動きが激しくなる。 本来、多くの人に呼びかけ短時間で集まるのなら、必ずこのようなある一定の時間帯に参加者が急激に増加するようなことが起きるはずである。自動PC型のようになだらかに常に少しずつ参加者が増えるというような増え方はしない。 下記部分は削除(2015/05/26 7:00) 今回は比較のため手動データ部分はどちらも同じものを採用しているので22:55のピークはそうした影響が出ていると考えられる。 下記を追加(2015/05/26 7:00) また、本来手動データ部分に含まれているはずのSNSツール発信によるポアソン分布型のピークが22:55あたりに見られるはずだが、増分2の正規分散データの変動により打ち消されている。 |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
ポアソン分布型データ ポアソン分布型のデータはある特定の場所や目的に従って発生した現象に現れる傾向を示したものである。 ・一時間に特定の交差点を通過する車両の台数。 ・ある一定の時間内の店への来客数。 ・1分間のWebページのアクセス数。 など、特定の現象でポアソン過程において発生する離散的な自然現象に該当するものである。 大事なことは事象の起きる確率はそれ以前に起こった事象の回数や起こり方には無関係だという点である。 具体的なポアソン分布型のデータの例を下に示す。 |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
上記データ及びグラフは上西-古畑のUTBのイベントが終わった直後の高柳、小谷、太田の各W数及びその変動率をグラフ化したものである。高柳の変動率ピークが高いのは増分値自体が大きいというより、直前値との差が大きいことを意味している。表を見てもらえばわかるが、W数の増分値自体が大きいのは小谷の方になる。 なお、このグラフにおいては三者とも23:55のデータが存在しないので、24:00(0:00)の変動及び、変動率は23:50のデータとの比較になっている。 (23:55のデータがとれていない理由は大量データ作成編にあります) この三者のグループの行動は、「同じグループのメンバーがウォッチバトルで非常に接戦を繰り広げていたたためそちらの応援に回ったが、終了後直ちに推しメンのウォッチバトルに戻ってきた集団の行動パターン」と位置づけることができる。三者の5/4 0:00以降の増分値の動きを比べると、5/3 23時台の増分値と比較して5倍〜10倍程度の高い値で、少なくとも1時間程度は推移していることがわかる。このグラフは同じ目的で同じような行動をするグループは、その行動パターンにおいて同じような傾向となることを如実に表している。 ちなみに太田のデータで23:35あたりにピークがあるのはもう上西の勝ちが見えてきたので、さっさと戻ってきた一部ファンがある程度いたということだろう。 以上の結果から、「人は同じ目的で行動するとその行動パターンは一定の法則に従った動きになる」ことがわかってもらえただろうか? 上西の実測データにおいては、多くのメンバーたちが支援のメッセージを発信していたから、参加者のピークがたくさんでき、タイムラグが発生していたため少しずつ後ろにずれそのピークが徐々に増え続けるという形になり、そのため5分前直前値より毎回大きくなって全体的にわずかずつ増加していくデータになったということかもしれない。もしそうなら、そんなことが5分間隔で9回連続して起きる確率を明示してもらいたいものだ。たぶん天文学的に発生し得ない確率になると思うが。 もしそんなことがあったとしても、それが5分間隔で50分間の9回連続で起きる確率は、サイコロで6の目が9回連続で出る確率よりは低いものだと考える。 ちなみにサイコロで6の目が9回連続で出る確率は1億2,000万人の日本人の中から無作為に12人を選んだときに自分が選ばれる確率とほぼ同等である。 |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
2015/5/31追記 某巨大掲示板の地下アイドルスレでいろいろ情報を見ていたらおもしろいものが見つかった。本サイトに反論する立場の人が言うには、多くの人が上西氏のtwitterに反応してウォッチバトルに参加したきっかけは下記メッセージにあるというものだった。 https://twitter.com/jonishi3/status/594838296833822721 こちらとしてはメッセージ自体は確認していたが、何時何分に発信したものかわからなかったので言及するのを控えていたが、そこで書かれていた時間は21:17となっていた(転載不可のスレなんでソースとなった記事の転載はいたしません)。たぶんコメントをした人は上西氏のフォロワーで詳細な情報を取得できていた人なんだろう。 となると、以前にも述べたように最終日の詳細分析にも書いておいたが、計算結果から確認できた実際の急激な増分値データ変動の動き出しが、それ以前のタイミングで発生していたことと矛盾する。 逆に上西氏の発信はこちらの考えていた「データからは21:15ぐらいまでは人が認識できる急上昇の動きは見られないはず」という意見と一致する。つまり、データがいつもと違う大きな動きになっているということを認識してメンバーが情報発信したのは5/3 21:15以降で、それを見てNMBヲタを始めとしたAKBGファンが集まったと考えるのであれば、その直後にすぐさま動きがあったとしてもそのコメントに反応した参加者は22:00ぐらいまでにその多くが集中するはずである。少しでも早く追いつこうとしていたと考えられる上西側での参加者が22:00以降に徐々に増える理由は見つからない。いわゆる特定の目的で集まる人は、ある特定の時間帯に集中するはずだという、あえて統計学的に考えなくても常識の範囲内で十分理解できるのではないだろうか。 ちょっと上西氏の発信がこちらの予想したメッセージ発信のタイミングと合いすぎていたので、ここでの予想もそれほど間違ってはいないと確信できた。 |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
2016/5/25追記 上西の2015/5/3 21:05〜23:00のデータ変動に関する詳細な統計的検定結果については上西恵:最終日データ検討の章に記してあります。 |
トップへ戻る |