直線上に配置

SKE:グループ最大増分値予測

SKEでのグループ別増分最大値を検討するため、高柳明音の最終日となった5月8日の実績データに基づいて、統計的に増分値(5分間あたりのウォッチ数増加分)の最大値を検討した。SKEは同時に最大2名のメンバーがウォッチバトルに参加していたが、古畑を除いては高柳一人しか参加していなかったので高柳の最終日データをサンプルとして採用した。SKEは基本的に箱推しのヲタが多いことが知られており、参加メンバーが誰であれ基本的にSKE箱推しファン全体で応援する形になるので、1名での参加であってもグループ全体ファンの最大限の能力が発揮されたと判断できる。

なお、データの分析に関しては基本的に21:00〜24:00の間に最大値が発生したものと考え、その時間帯で各値が正規分布していたかどうかも含め検討するため、19:35〜24:00と21:00〜24:00の間のデータ分布をヒストグラムで表示し、各時間帯における平均と標準偏差を計算した(標準偏差はExcel2013のSTDEV.S関数を利用して求めた)。19:35〜24:00の間のデータで計算した平均と標準偏差と21:00〜24:00の間のデータで計算した平均と標準偏差を比較すると、平均値(μ)は後者の時間帯のデータで計算したもののほうが大きいが、標準偏差(σ)は前者の方が大きい。実際にμ+2σを計算すると後者の時間帯で計算したものの方が大きいので、予想最大値:μ+2σは21:00〜24:00の時間帯で計算したものを採用した。なお、表中の水色に塗った値はμ+2σを超えた値、青く塗った値はμ+3σを超えた値を示している。高柳のデータにはμ+2σを超えてμ+3σ以下となる値は存在しなかった。

最終的に正規性診断ツールよって正規分布として認識できるデータ範囲から算出した平均と標準偏差を用い、1%有意水準で「最大増分値は予想最大値となる」という仮定が棄却されるかどうかを検定する。棄却された場合、累積分布関数の値が0.99となる増分値を最大値とする(累積分布関数の逆関数としてはExcel2013でのNORM.INV関数を用いて値を求めた)。


   
  高柳明音
日時 ウォッチ数 増分
19:30 41,152,713  
19:35 41,221,828 69,115
19:40 41,297,080 75,252
19:45 41,361,681 64,601
19:50 41,431,150 69,469
19:55 41,508,328 77,178
20:00 41,583,454 75,126
20:05 41,661,605 78,151
20:10 41,753,912 92,307
20:15 41,826,887 72,975
20:20 41,900,671 73,784
20:25 41,985,644 84,973
20:30 42,077,623 91,979
20:35 42,178,072 100,449
20:40 42,275,958 97,886
20:45 42,378,016 102,058
20:50 42,488,145 110,129
20:55 42,583,914 95,769
21:00 42,683,646 99,732
21:05 42,787,647 104,001
21:10 42,892,579 104,932
21:15 42,995,473 102,894
21:20 43,108,157 112,684
21:25 43,219,312 111,155
21:30 43,341,450 122,138
21:35 43,503,055 161,605
21:40 43,661,408 158,353
21:45 43,818,298 156,890
21:50 43,952,496 134,198
21:55 44,077,035 124,539
22:00 44,209,282 132,247
22:05 44,338,709 129,427
22:10 44,501,211 162,502
22:15 44,656,747 155,536
22:20 44,810,975 154,228
22:25 44,964,403 153,428
22:30 45,124,177 159,774
22:35 45,290,854 166,677
22:40 45,462,614 171,760
22:45 45,613,317 150,703
22:50 45,763,752 150,435
22:55 45,915,113 151,361
23:00 46,070,009 154,896
23:05 46,221,782 151,773
23:10 46,390,661 168,879
23:15 46,568,722 178,061
23:20 46,742,546 173,824
23:25 46,925,731 183,185
23:30 47,112,742 187,011
23:35 47,332,758 220,016
23:40 47,573,108 240,350
23:45 47,823,634 250,526
23:50 48,096,056 272,422
23:55 48,443,871 347,815
0:00 48,795,024 351,153
 
平均(19:35〜24:00) 141,524
標準偏差
(19:35〜24:00)
62,984
 
平均(21:00〜24:00) 167,868
標準偏差
(21:00〜24:00)
59,084
 
最大予想値 286,036
 
    
平均(19:35〜23:50) 133,526
標準偏差
(19:35〜23:50)
48,593
 
平均(21:00〜23:50) 157,490
標準偏差
(21:00〜23:50)
40,558
 
最大予想値(19:35〜) 230,712
最大予想値(21:00〜) 238,606
 
5%有意水準(0.95) 224,202
1%有意水準(0.99) 251,843
  
19:35〜24:00  
データ区間 頻度 累積 %
〜59999 0 0.00%
〜69999 3 5.56%
〜79999 6 16.67%
〜89999 1 18.52%
〜99999 5 27.78%
〜109999 5 37.04%
〜119999 3 42.59%
〜129999 3 48.15%
〜139999 2 51.85%
〜149999 0 51.85%
〜159999 11 72.22%
〜169999 4 79.63%
〜179999 3 85.19%
〜189999 2 88.89%
〜199999 0 88.89%
〜209999 0 88.89%
〜219999 0 88.89%
〜229999 1 90.74%
〜239999 0 90.74%
〜249999 1 92.59%
〜259999 1 94.44%
〜269999 0 94.44%
〜279999 1 96.30%
〜289999 0 96.30%
〜299999 0 96.30%
〜309999 0 96.30%
〜319999 0 96.30%
〜329999 0 96.30%
〜339999 0 96.30%
〜349999 1 98.15%
〜359999 1 100.00%
上西恵755写真集:SKEヒストグラム1-1
21:00〜24:00  
データ区間 頻度 累積 %
〜59999 0 0.00%
〜69999 0 0.00%
〜79999 0 0.00%
〜89999 0 0.00%
〜99999 1 2.70%
〜109999 3 10.81%
〜119999 2 16.22%
〜129999 3 24.32%
〜139999 2 29.73%
〜149999 0 29.73%
〜159999 11 59.46%
〜169999 4 70.27%
〜179999 3 78.38%
〜189999 2 83.78%
〜199999 0 83.78%
〜209999 0 83.78%
〜219999 0 83.78%
〜229999 1 86.49%
〜239999 0 86.49%
〜249999 1 89.19%
〜259999 1 91.89%
〜269999 0 91.89%
〜279999 1 94.59%
〜289999 0 94.59%
〜299999 0 94.59%
〜309999 0 94.59%
〜319999 0 94.59%
〜329999 0 94.59%
〜339999 0 94.59%
〜349999 1 97.30%
〜359999 1 100.00%
 
上西恵755写真集:SKEヒストグラム2-1
 上西恵755写真集:SKEヒストグラム2-2
 ヒストグラムのデータ検討

高柳の19:35〜24:00間のデータ分布と21:00〜24:00間のデータ分布を比較すると、大きな違いとしては19:35〜20:55においては109,999/5分以下の値が多いという点がポイントとして上げられる。ピークとなっているデータ区間:120,000を超える値に関しては両区間も変動はない。正規分布に関してこのヒストグラムから判断するピークのデータ区間:150,000〜159,999での頻度が11になっており、他の区間に比べて発生頻度が極めて高い状況が見られる。この状況から正規分布と判断するにはピークの頻度が高すぎるようにも思われる。念のため21:00〜24:00のデータの区間を5,000刻みにしてヒストグラムを作成すると150,000〜154,999の頻度が7、155,000〜159,999の頻度4に分散される。こうした点ではピークは分散され、130,000〜149,999のデータは存在していなかったが、19:35〜24:00のデータも21:00〜24:00のデータも、上位の値を除けば全体には正規分布と判断できる可能性は高い。


  データの正規性に関する検討

データの正規性に関して正規性検討ツールを使い、1%有意水準でK2検定(D'Agostino and Pearson 検定)を行った。19:35〜24:00の間のデータを検定した場合、そのまま全データで検討すると「正規分布ではない」との判定であったので、正規性が認められるまで上位の値を除外してみたところ、272,422を超える値を除外することで正規性を認められる範囲となった。したがって、19:35〜23:50の間の値で正規分布の可能性があるということになる。同様に21:00〜24:00の間のデータで検定した場合、全体の値そのままでは「正規分布ではない」との判定であったが、272,422を超える値を除外することでデータの正規性が認められた。つまり、21:00〜23:50までの間の値で正規分布の可能性があるいうことになった。

正規性検討ツールの診断結果では19:35〜24:00間のデータでも21:00〜24:00間のデータでも、終了間際の一部のデータを除けば正規性が見られるという結果になった。言い換えればどちらのデータ範囲でも除外される23:55以降のデータは自然発生的に増えたということではなく、最終日の終了間際という条件の場合のみに発生する特異な値で、継続的発生が期待できるものではないという判断になる。

他のグループでは19:35〜24:00の間の途中で急激にデータが上昇することが多かったので、19:35〜のデータでは除外する値が多く、21:00以降のデータには除外対象が最終の10分から20分程度の区間と限定され、正規性が見られることが多かった。しかし、高柳の最終日には多くの箱推しのSKEヲタが早い時間帯(18:00〜)から積極的に参加していたため、長時間にわたり時間の経過と共にウォッチ数が増えるという自然増の状況が見られ、それが19:35以降のデータ全体で正規性を確認できる理由かと思われる。

 上西恵755写真集:SKE増分値グラフ1
 
以上の結果から19:35〜のデータ区間、21:00〜のデータ区間の両方で正規分布によるデータの発生があったと考え、その両区間の対象範囲のデータから平均と標準偏差を求めると左記の通りとなった。平均(μ)は21:00〜のデータのほうが大きいが、標準偏差(σ)は19:35〜のデータのほうが大きい。そこで両方のμ+2σの値を計算し、値の大きくなるデータ区間の平均、標準偏差を採用することとした。計算したところデータ区間(19:35〜23:50)のμ+2σは230,712/5分、データ区間(21:00〜23:45)のμ+2σは238,606/5分となったので、データ区間(21:00〜23:50)を採用した。その平均と標準偏差を元にして累積分布関数が0.95となる値(5%有意水準)、0.99となる値(1%有意水準)をそれぞれ求めたところ、224,202/5分(5%有意水準)、251,843/5分(1%有意水準)となった。当初の予想最大値:286,036/5分を平均:157,490/5分、標準偏差:40,558/5分を用いて検定すると、286,036/5分>251,843/5分となるので、1%有意水準で286,036/5分が最大値となるという仮説は棄却されるので、最大値としては1%有意水準で計算した251,843/5分を選択する。つまり、当初の予想最大値:286,036/5分は終了間際に発生した特異的なデータがその平均や標準偏差に影響を及ぼしていたため、それを元にして求められた予想最大値は自然に発生すると考えられる値の範囲を逸脱していたということになる。

ちなみに、平均:157,490/5分、標準偏差:40,558/5分を用いて23:50に測定されている272,422/5分の累積分布関数を求めると0.9977となる。したがって272,422/5分を超える値が発生する確率は1-0.9977で計算され0.0023となる。言い換えれば、SKEヲタだけが自然発生的に集まって272,422/5分を超えるウォッチ数で15分間継続できる確率は0.0023の3乗 = 1.2167/100,000,000以下ということになり、1億回やったら1回以下しか発生しない確率になる。一般的にはこのようなことが起きる確率は極めて低いと言えるだろう。ということは、このような値になるのは自然発生的ではない別の方法によって起きたと考えるべきだということになる。

しかし実際には272,422/5分を超える値が10分続いているのであるから、確率的には0.0023の2乗 = 5.290/1,000,000程度になり、100万回やって5回程度、つまり20万回に1回ぐらいの確率で起きるということになる。この程度の確率なら自然発生的に起きないとは言えないが、当日の高柳の終了間際の発言で4,900万ウォッチまで数字を伸ばしたいとの発言があったことから考えると、たぶんこの値は参加者のウォッチ行動によって自然に発生したのではなく、マクロ化した端末を増やしたりする方法で一人で複数台の端末稼働させるなどして、人工的な別の方法によるウォッチ数の増加であったと考えた方が蓋然性が高い。それでないと終了間際の短時間で70,000/5分というウォッチ数が急激に増えた上、その増分値が連続することは考えにくい。

以上の点から1%有意水準で判断して、SKEヲタの継続的に発生させることができると予想される最大増分値は251,843/5分程度だと言える。


前へ トップ アイコントップへ戻る


直線上に配置