直線上に配置

NMB:グループ最大増分値予測

NMBでのグループ別最大増分値を検討するため、グループメンバーのトータルウォッチ数の多かった5月6日(小谷里歩、太田夢莉の最終日)の実績データに基づいて、統計的に増分値(5分間あたりのウォッチ数増加分)の最大値を検討した。NMBは同時に最大3名のメンバーがウォッチバトルに参加していたが、平均と標準偏差の章での数字の変動から見るとHKTのようなメンバー相互で補完し合うような関係性は見られない。5月2日や5月3日のデータ推移では各メンバーの集中タイムが基本的に21:00に集中しており、NMBヲタが相互に協力し合うというよりそれぞれの個推しのヲタが競い合っているようにすら見える。ここではグループ全体の能力を判断するので、それぞれのメンバーを応援するNMBヲタが協力して行動を取ったと仮定して、その最大値を検討してみる。

なお、データの分析に関しては基本的に21:00〜24:00の間に最大値が発生したものと考え、その時間帯で各値が正規分布していたかどうかも含め検討するため、19:35〜24:00と21:00〜24:00の間のデータ分布をヒストグラムで表示し、各時間帯における平均と標準偏差を計算した(標準偏差はExcel2013のSTDEV.S関数を利用して求めた)。NMBメンバーの場合も19:35〜24:00の間のデータで計算した平均と標準偏差と21:00〜24:00の間のデータで計算した平均と標準偏差を比較すると、両方とも後者の時間帯のデータで計算したもののほうが大きい。したがって21:00〜24:00の平均をμ、標準偏差をσとし、μ+2σを予想最大値(267,949/5分)と仮定した。なお、表中の水色に塗った値はμ+2σを超えた値、青く塗った値はμ+3σを超えた値を示している。

最終的に正規性診断ツールよって正規分布として認識できるデータ範囲から算出した平均と標準偏差を用い、1%有意水準で「最大増分値は予想最大値となる」という仮定が棄却されるかどうかを検定する。棄却された場合、累積分布関数の値が0.99となる増分値を最大値とする(累積分布関数の逆関数としてはExcel2013でのNORM.INV関数を用いて値を求めた)。

   
5/6
時刻
小谷 太田 合計
19:35 33,724 32,381 66,105
19:40 29,000 32,264 61,264
19:45 32,620 43,587 76,207
19:50 35,328 49,057 84,385
19:55 38,077 42,019 80,096
20:00 38,780 40,715 79,495
20:05 45,009 38,785 83,794
20:10 50,174 41,290 91,464
20:15 58,757 48,387 107,144
20:20 48,929 51,698 100,627
20:25 48,350 51,520 99,870
20:30 51,383 50,853 102,236
20:35 54,330 49,921 104,251
20:40 52,169 50,846 103,015
20:45 50,806 57,664 108,470
20:50 51,177 59,057 110,234
20:55 55,547 51,728 107,275
21:00 55,108 50,964 106,072
21:05 56,098 48,137 104,235
21:10 60,433 45,268 105,701
21:15 61,652 50,076 111,728
21:20 63,566 46,777 110,343
21:25 57,413 41,688 99,101
21:30 61,795 42,549 104,344
21:35 57,464 41,808 99,272
21:40 66,649 43,978 110,627
21:45 69,047 42,976 112,023
21:50 51,973 45,655 97,628
21:55 61,893 42,695 104,588
22:00 55,756 44,092 99,848
22:05 52,774 44,926 97,700
22:10 59,603 44,854 104,457
22:15 59,921 63,134 123,055
22:20 61,108 66,406 127,514
22:25 57,516 64,049 121,565
22:30 62,454 57,414 119,868
22:35 64,576 48,920 113,496
22:40 69,634 53,424 123,058
22:45 76,934 60,368 137,302
22:50 72,606 68,135 140,741
22:55 60,492 51,998 112,490
23:00 81,862 51,089 132,951
23:05 84,763 53,771 138,534
23:10 82,756 58,389 141,145
23:15 93,355 74,896 168,251
23:20 94,491 80,846 175,337
23:25 84,751 75,642 160,393
23:30 88,889 82,303 171,192
23:35 92,968 84,092 177,060
23:40 112,233 93,066 205,299
23:45 133,327 101,099 234,426
23:50 163,093 105,650 268,743
23:55 171,890 116,296 288,186
0:00 239,819 144,803 384,622
 
平均(19:35〜24:00) 127,756
標準偏差
(19:35〜24:00)
57,192
 
平均(21:00〜24:00) 144,132
標準偏差
(21:00〜24:00)
61,908
 
予想最大値 267,949
 

   
正規分布対象範囲データ
 
平均(19:35〜) 112,603
標準偏差(19:35〜) 26,269
 
平均(21:00〜) 125,967
標準偏差(21:00〜) 27,849
 
5%有意水準(0.95) 171,775
1%有意水準(0.99) 190,754
19:35〜24:00  
データ区間 頻度 累積 %
〜69999 2 3.70%
〜79999 2 7.41%
〜89999 3 12.96%
〜99999 7 25.93%
〜109999 13 50.00%
〜119999 8 64.81%
〜129999 4 72.22%
〜139999 3 77.78%
〜149999 2 81.48%
〜159999 0 81.48%
〜169999 2 85.19%
〜179999 3 90.74%
〜189999 0 90.74%
〜199999 0 90.74%
〜209999 1 92.59%
〜219999 0 92.59%
〜229999 0 92.59%
〜239999 1 94.44%
〜249999 0 94.44%
〜259999 0 94.44%
〜269999 1 96.30%
〜279999 0 96.30%
〜289999 1 98.15%
〜299999 0 98.15%
〜309999 0 98.15%
〜319999 0 98.15%
〜329999 0 98.15%
〜339999 0 98.15%
〜349999 0 98.15%
〜359999 0 98.15%
〜369999 0 98.15%
〜379999 0 98.15%
〜389999 1 100.00%
 
上西恵755写真集ウォッチバトル_NMBヒストグラム1-1
 上西恵755写真集ウォッチバトル_NMBヒストグラム1-2
21:00〜24:00  
データ区間 頻度 累積 %
〜69999 0 0.00%
〜79999 0 0.00%
〜89999 0 0.00%
〜99999 5 13.51%
〜109999 6 29.73%
〜119999 7 48.65%
〜129999 4 59.46%
〜139999 3 67.57%
〜149999 2 72.97%
〜159999 0 72.97%
〜169999 2 78.38%
〜179999 3 86.49%
〜189999 0 86.49%
〜199999 0 86.49%
〜209999 1 89.19%
〜219999 0 89.19%
〜229999 0 89.19%
〜239999 1 91.89%
〜249999 0 91.89%
〜259999 0 91.89%
〜269999 1 94.59%
〜279999 0 94.59%
〜289999 1 97.30%
〜299999 0 97.30%
〜309999 0 97.30%
〜319999 0 97.30%
〜329999 0 97.30%
〜339999 0 97.30%
〜349999 0 97.30%
〜359999 0 97.30%
〜369999 0 97.30%
〜379999 0 97.30%
〜389999 1 100.00%
 
上西恵755写真集ウォッチバトル_NMBヒストグラム2-1
 上西恵755写真集ウォッチバトル_NMBヒストグラム2-2
 ヒストグラムによるデータの検討

19:35〜24:00間のデータ分布と21:00〜24:00間のデータ分布を比較すると大きな違いとしては、19:35〜20:55においては60,000〜109,999までの値が占めているという点である。特にデータ区間:100,000〜109,999における値は13→6と半分以下に減っており、19:35〜24:00間のデータ分布ではピークとなっている区間であったが、21:00〜24:00間のデータ分布では第2位の頻度になっている。そのほかのデータ区間としてはデータ区間:60,000〜69,999が2→0、データ区間:70,000〜79,999が2→0、データ区間:80,000〜89,999が3→0、データ区間:90,000〜99,999が7→5、データ区間:110,000〜119,999が8→7といった具合に、減少幅は1〜3程度になっている。一見すると左右対称型の正規分布の形状としては19:35〜24:00間のデータ分布のほうが正規分布に近いように見えるが、正規分布にしてはピークとなるデータが一定のデータ区間に集中しすぎている。これらは毎日21:00の集中タイムを実施していた影響かと思われる。

ヒストグラムに関してはデータ区間の取り方によってその分布形状に違いが発生する。念のため5,000毎にデータ区間を区切ったヒストグラム2を19:35〜24:00と21:00〜24:00のそれぞれの時間帯で作成した。5,000毎のデータ区間で判断すると19:35〜24:00の間のデータでは100,000〜109,999の間の頻度が13であったが、その内訳としては100,000〜104,999にデータ区間に8、105,000〜109,999のデータ区間に5であったとことがわかる。19:35以降のデータも21:00以降のデータも、ヒストグラムから判断すると190,000/5分を超える値は正規分布の範囲に含まれないことが予測される。これらの点から考えても、どちらのデータ区間がより正規分布に近いかを判断するのは難しい。


  データの正規性に関する検討

データの正規性に関して正規性検討ツールを使い、1%有意水準でK2検定(D'Agostino and Pearson 検定)を行った。19:35〜24:00の間のデータを検定した場合、そのまま全データで検討すると「正規分布ではない」との判定であったので、正規性が認められるまで上位の値を除外してみたところ、177,060/5分を超える値を除外することで正規性を認められる範囲となった。したがって、19:35〜23::35の値は正規分布の可能性があるということになる。

21:00〜24:00の間のデータで検定した場合、全体の値そのままでは「正規分布ではない」との判定であったが、205,299/5分を超える値を除外することでデータの正規性が認められた。つまり、21:00〜23:40までの間の値で正規分布の可能性があるいうことになり、23:45以降のデータは自然発生的に増えたということではなく、最終日の終了間際という条件の場合のみに発生する特異な値で、継続的発生が期待できるものではないという判断になる。

以上の結果から19:35〜のデータ区間、21:00〜のデータ区間の両方で正規分布によるデータの発生があったと考え、その両区間の対象範囲のデータから平均と標準偏差を求めると左記の通りとなった。平均、標準偏差共に21:00〜のデータ区間のほうが大きいのでこちらを採用し、この値を元にして累積分布関数が0.95となる値(5%有意水準)、0.99となる値(1%有意水準)をそれぞれ求めたところ、171,775/5分(5%有意水準)、190,754/5分(1%有意水準)となった。当初の予想最大値:267,949を平均:125,967、標準偏差:27,849を用いて検定すると、267,949/5分>190,754/5分となるので、1%有意水準で267,949が最大値となるという仮説は棄却されることになり、最大値としては1%有意水準で計算した190,754/5分を選択する。つまり、当初の予想最大値:267,949/5分は終了間際に発生した特異的なデータがその平均や標準偏差に影響を及ぼしていたため、それを元にして求められた予想最大値は自然に発生すると考えられる値の範囲を逸脱していたということになる。

ちなみに、平均:125,967/5分、標準偏差:27,849/5分を用いて23:40に測定されている値より若干低い200,000の累積分布関数を求めると0.99607となる。したがって200,000/5分を超える値が発生する確率は1-0.99607で計算され0.00393となる。言い換えれば、NMBヲタだけが自然発生的に集まって200,000/5分を超えるウォッチ数で15分間継続できる確率は0.00393の3乗 = 6.0700/100,000,000程度だと言え、1億回やったら6回程度発生するという確率 = 1,666万回やって1回程度の確率になる。一般的にはこのようなことが起きる確率は極めて低いと言えるだろう。

ということは、このような値になるのは自然発生的ではない別の方法によって起きたと考えるべきだということになる。ただここでの発生はあくまで2名の合計による値なので、実際に発生した増分値は小谷と太田で傾向は違う。小谷の方は23:40以降の25分間が大きく変化しているが、太田の方は最後の5分間での変化が大きい。したがって大きな変化をもたらしているのは主に小谷の変動分ということになるから、小谷のデータ変動は参加者の行動によって自然に発生したのではなく、マクロ化した端末を増やしたりする方法により一人で複数台の端末稼働させるなどして、人工的な方法によってウォッチ数の増加がもたらされたものと考えた方が妥当だと思われる。

以上の点から1%有意水準で判断してNMBヲタの継続的に発生させる可能性のある最大増分値は190,754/5分程度だと言える。


前へ トップ アイコントップへ戻る


直線上に配置