ベキ法則

2013年8月 7日 (水)

ツイッターのつぶやかれ数と得票数(暫定報告)

 2013年参議院選挙においてネットを使った選挙活動(ネット選挙)が解禁された。

 さまざまな注目点があったが、もっとも活発に使われた選挙区の1つが東京選挙区だ。

 下図はツイッターで選挙関連ワードと一緒につぶやかれた候補者名(X軸)と得票数(Y軸)のそれぞれの対数の散布図である。


2013y07m23d_131311238


 ネットによって得票数が伸びたということではなく、得票の多い候補、つまり関心を集めた候補は自然とつぶやかれる回数が多いといえるだろう。

 ネットが選挙にどう関わったか、今後分析してみたい。

 

| | コメント (0)

2010年8月26日 (木)

ブログは毎日書くと閲覧者数が増えるという話

 ブログは10日にに1回平均で更新されている。10日に1回の更新の場合の閲覧数は2pv/日で、上位5%でも100pv/日しかないが、これを毎日更新すると平均で30pv/日、上位5%で1,350pv/日、上位0.03%では10,000pv/日を期待できる。

 
 以前より、ブログの閲覧者数を増やす方法を聞かれる機会が多く、その都度テクニックなどを教えていたのだが、一番わかりやすい方法として「毎日更新すること」を勧めている。根拠は明確で更新頻度と閲覧数には相関が有り、更新頻度を上げると閲覧数もあがるからだ。

 下図はブログの更新頻度と閲覧数の散布図で、1日あたりの更新頻度の対数は平均-0.931 標準偏差0.517で正規分布にちかい形で、1ヶ月の閲覧数の対数は更新頻度x に対して1.15×log(x)+2.94 を平均とした標準偏差0.835 の正規分布になっている。

 2010y04m30d_171740703


 わかりやすく”数字”に落とすと、10日に1回の更新(更新頻度の平均)では閲覧数平均は2pv/日、上位5%であっても100pv/日しかない。

 更新頻度をあげて3日に1回にすると平均で8pv/日、上位5%で400pv/日を期待できる。さらに毎日書けば平均で30pv/日、上位5%は1350pv/日、上位0.03%に至っては10,000pv/日を期待できる。これらは理論値であるが、実際のデータをみてもほぼこれと同じ結果となっている。

 とはいえ、毎日更新するのはかなり大変だ。一時期「ブログ脳」といわれることもあったが、ブログを書かんがために1日中ネタをさがすようになってしまうなど、毎日記事を書くというのはかなりつらい。

 楽をするためのテクニックは2つあり、1つはテーマを決めること。テーマを決めることで書くことが決まりやすくなるうえに、閲覧者にもどういうブログかを明確にすることが出来る。もう1つは「3行記事」を上手に使うこと。長文を書くのはなかなか時間がかかることなので、写真+3行程度で平日をやりすごし週末に長文を書くなどのスタンスがとれればそれほど負荷になることはない。

 某有名ブログでは芸能人とブログの契約をする際に毎日更新することを義務付けているなどという噂も耳にするが、毎日更新することは必然的に閲覧者数をあげることだから、ありえない話しではない。

 ただし毎日更新しても下位5%は0.6pv/日しか期待できないから、毎日書いているのに閲覧数が上がらない可能性もある。


 参考:http://www.infosocio.org/vol5no1-5.pdf



| | コメント (0)

2010年7月16日 (金)

衆議院選挙 選挙区の得票率とベキ法則

 衆議院選挙(総選挙)の選挙区での得票率を分析すると、大政党と泡沫政党の差が大きく、綺麗なべき乗(または正規分布)にならない。しかし政党別の得票率の”偏差”は”得票率”と比例しており、対数正規分布の特徴(偏差が数値に比例して変化)に似た形になっている。
 
 
 図1と図2は2009年の総選挙の選挙区での得票率とその順位である。60%~30%と、10%以下の2つのグループに分かれており、綺麗なべき乗(または正規分布)にはなっていない。分析をはじめるまえはそれなりの綺麗なグラフになることを規定していただけにかなり驚く内容である。図2は2005年の総選挙でのデータだが、図1同様に中央が膨らんだグラフとなっている。

 このような”独特”なグラフになる理由は、小選挙区での選挙が定着し、自民と民主の2大政党に票が集まりやすい傾向が強まったためであると考えられる。2010年の参議院議員通常選挙における比例区の票は、多少のでこぼこはあっても綺麗なべき乗になっているから(参考)、これは小選挙区ゆえの特徴であるといえるだろう。

 このデータをそれぞれの政党ごとに分布を集計したのが図3と図4である。郵政旋風が吹き荒れた2005年と政権交代の風が吹いた2009年では自民と民主がその位置を入れ替えているのが良くわかるほか、2005年は共産が、2009年は共産にくわえて幸福実現が低い得票率の部分に固まっているのが見て取れる。それぞれの平均得票率と偏差が図5と図6だが、ほぼ全ての選挙区に候補者を立てた共産・民主・自民は、2005年は民主と郵政反対で無所属で立候補した元自民も含め、2009年は超泡沫である幸福実現等も含めて平均得票率と偏差がほぼ比例しており、ベキ法則=対数正規分布に近いという説における「対数正規分布は数値と偏差が比例する」という特徴に似た形となっている。

 逆に一部の選挙区にしか候補者を立てていない社民・国民はその他カテゴライズした泡沫候補と同様の平均よりも偏差が高い=候補者の実力差がばらばらであるという傾向、逆に公明党は偏差が低い=ばらつきが少なく、平均に近い得票率という傾向がある。これは公明の組織率の高さ、逆に社民や国民の個人人気に頼った選挙戦を伺わせる。尚、2009年のみんなの党は平均得票率21%で偏差は0.246 となってグラフからはみ出している。これは党首の渡辺の95%という驚異的な得票率(対立候補が幸福のみ)ということもあるが、やはり政党として平均しておらず、個人人気に頼った選挙戦であったという理由である。

 
2009sousenkyo
図1 2009年総選挙の選挙区の得票率と順位
 
 
2005sousenkyo
図2 2005年総選挙の選挙区の得票率と順位
 
 
2009
図3 2009年総選挙の選挙区の得票率の政党毎の集計
 
 
 2005
図4 2005年総選挙の選挙区の得票率の政党毎の集計
 
  
2009gr
図5 2009年総選挙の政党別得票率平均と偏差


2005gr
図6 2005年総選挙の政党別得票率平均と偏差
 
 
 

 
 

| | コメント (0)

2010年7月13日 (火)

参議院選挙 比例区得票数にみる組織票 ベキ法則による分析

 ベキ法則は社会学などで長く経験則として使われてきた法則で、ある統計データにおいて順位と数値をそれぞれ対数で散布図に表示すると直線状になる、というものである。例えば市町村の人口とその順位、ブログの閲覧数とその順位、個人別の収入とその順位などがベキ法則にあてはまることなどが広く知られている。今回はベキ法則を利用して第22回参議院議員通常選挙を分析してみる。

 図1は比例区の得票数と順位の散布図である。グラフをみると1位~17位、18位以下の部分に断絶があり、何らかの傾向の違いがあることが見て取れる。

 上位14名は堅い組織票および著名人が名前を連ねている。組織票としては1位~8位までがすべて公明党で、秋野・長沢・横山・谷合・浜田・荒木・浮島が名を連ねる。9位が社民の福島、10位~14位はタレント・著名人の、有田・谷・片山・佐藤ゆかりが入っている。14位が宗教系の山谷、15位は看護の高階、以下労組の直嶋、小林と続く。18位以下からも組織・タレントが続くが、上位ほどの力が無いようだ。18位はタレントの三原、19位は労組の柳沢で以下は、中村、石橋、脇と、官僚出身と労組であるが、上位18名にくらべれば得票数に断絶がある。

 つまり、このような上位と中位以下の断絶は、そこになんらかの組織の票分配があったことをうかがわせるものである。政党別に見るとこの傾向が強いのが公明党と民主党である。

 図2は政党ごとの順位と得票数だが、緑色の公明党のグラフはベキ法則を全く無視したグラフになっている。みごとなまでの組織内での票割といえる。

 同様に民主党も(図3)17位前後に大きな段差がある。獲得議席が16議席だから当選できた人と出来なかった人でなんらかの違いがあることはあきらかだ。図3から見る限りでは当選させたい人に対してある一定の下駄をはかせた=組織票を分配した可能性が指摘でき、逆に八代・安藤・喜納などは奮闘むなしく「落とされた」という見方も可能だ(注:グラフを見た限りの推測として)。

 対して図4は自民党だが、民主のような大きな段差はない。これは候補者同士での自由競争があった結果ではないかと思われる。同じく図2からはみんなの党も自民党と同じ様な競争がはたらいていたことを推測させるグラフとなっている。他にも一部有名人に票があつまった社民・国民・創新などの例も見て取れる。


 ベキ法則はまだまだ研究され尽くされていないが、以上のような「推測」を働かせることは可能で、他にもいろいろなものの分析に使えるのではないかと思われる。
 

(以上、敬称略)

 

 2010y07m13d_110453437_2

[図1]平成22年 参議院通常選挙比例区得票数 全体集計


2010y07m13d_105720484

[図2]平成22年 参議院通常選挙比例区得票数 政党別集計

2010y07m13d_134044046

[図3]平成22年 参議院通常選挙比例区得票数 民主党の集計


2010y07m13d_134751031

[図4]平成22年 参議院通常選挙比例区得票数 自民党の集計



| | コメント (0)

2010年7月 7日 (水)

ベキ法則から見るAKB48選抜総選挙の得票数の不思議

 ベキ法則は社会学などで長く経験則として使われてきた法則で、ある統計データにおいて順位と数値をそれぞれ対数で散布図に表示すると直線状になる、というものである。例えば市町村の人口とその順位、ブログの閲覧数とその順位、個人別の収入とその順位などがベキ法則にあてはまることなどが広く知られている。今回はベキ法則を利用してAKB48の総選挙について分析してみたい。

 説明するまでもないがAKB48は秋元康氏プロデュースによる秋葉原を本拠地として「会いに行けるアイドル」をコンセプトに活動しているアイドルグループである。2005年に誕生し、2007年にはNHK紅白歌合戦にも出場している。

 AKB48ではいままでのアイドルグループには無かった色々な新しい試みがされているが、2009年からAKB48選抜総選挙と称された人気投票が行われている。AKB48選抜総選挙はCDの購入者やファンクラブ等の会員に投票資格が与えられ、得票数によってその後の活動への関与が決まるというものだ。2009年は前田敦子さん、2010年は大島優子さんが1位となり、テレビなどでも話題となった。

 2009年と2010年をベキ法則で分析するといくつかの面白い特徴が見えてくる。

 まずは2009年に関して、グラフ化すると図1のようになる。1位から30位までほぼ直線状になっており、ベキ法則が当てはまっていることが見て取れる。5位と6位が非常に接戦で、また逆に11位12位、15位と16位のところにやや差がみてとれるなど、人気の分布が一様ではなく、いくつかの競争と差があることがあるが、ほぼベキ法則どおりの得票数であるといってよい。

 2009年AKB48選抜総選挙結果グラフ
(図1 2009年の順位と得票数)
 

 
 次に2010年に関してグラフ化すると図2のようになる。1位と2位が接戦(597票差)であるのがわかるほか、2位から22位までがほぼ直線になっており、ベキ法則に当てはまっている。逆に23位以下からはグラフが下に折れ曲がっており、23位以下の得票数の割合の低さが目立つ形となっている。

 さらに中間発表の数字も分析してみると、2010年の傾向をより詳しく見ることが出来る。6月2日時点の中間発表をグラフ化したものが図3である。図3からは2位の大島さんの票がベキ法則からみてやや得票数が上に、11位までの値と12位~18位、18位~19位、において大きな差が生まれているのが見て取れる。この傾向を図2の最終得票、および図1の昨年の傾向とあわせて考えると、


2010年AKB48選抜総選挙結果グラフ
(図2 2010年の順位と得票数)
 

2010年AKB48選抜総選挙中間発表結果グラフ
(図3 2010年の中間発表時の順位と得票数)
 

1)1位と2位の激しい競争

 2009年は1位と2位の差がベキ法則どおりだったが2010年はベキ法則から大きく外れている。これから2010年は前田さんと大島さんの間で激しいトップ争いが演じられていたことがわかる。それは中間発表前からくりひろげられていたようだ。

2)トップグループ、中間グループ、下位グループで明確な差

 グラフの分析をした後に知ったのだが、AKB48は上位12名で構成されるメディア選抜、21位までの選抜メンバー、22位~30位のアンダーガールズというカテゴライズがあり、それぞれの活躍の場に差がある。それを示すように、図3の中間発表ではメディア選抜に相当する上位11名と、選抜メンバーに相当する12位~19位とそれ以下においてグラフに段差が見らる。カテゴライズ毎の活動およびメディアでの露出の差が中間発表時の得票数の差という形で現れたといえるだろう。

3)メディア選抜(12位以内)、選抜メンバー(21位以内)入りをかけた激しい争い

 図2の最終発表の結果は図3の中間発表のような大きな断絶がなくなり、いくつかの細かい差が出ている。上位22名とそれ以下ので出た傾きの差から、選抜メンバーに入るための21位争いが上位22名で激しく繰り広げられていたことがわかる。さらに細かく見ると9位から13位(図の赤い点線部分)の数字がベキ法則からはずれてそれぞれの数値が非常に接近している。ここでもメディア選抜12名入りをかけて激しい競争が繰り広げられたことが見て取れる。同様に19位から22位までの部分((図の緑の点線部分))でもそれぞれの数値が接近しており、選抜メンバー入りの最後の生き残りをかけた激しい競争があったことがわかる。
 
 
 
 AKB48選抜総選挙はアイドルグループの新しい試みとして非常に注目された。得票数をベキ法則で分析すると「ガチです」と称したとおり、ガチな競争が繰り広げられていたであろうと推測される。また、メディア露出による人気の差や、今後の露出をかけた激しい競争の後も見て取れた。AKB48選抜総選挙は今回の盛り上がりをうけて次回も開催されるであろうから、次回に関してもベキ法則を利用して分析をしてみたい。


参考:http://sites.google.com/site/watasinopage/
 
 
 

 
 

| | コメント (0)