« 2010年6月 | トップページ | 2010年8月 »

2010年7月

2010年7月26日 (月)

英政府サイトも炎上 衆愚を排し、集合知を得るためのテクニック

 英政府が歳出削減のアイディアを募るためtにつくったサイト「http://spendingchallenge.hm-treasury.gov.uk」が炎上により閉鎖されてしまった。閉鎖理由は突拍子も無いアイディアや一部国民に対する誹謗中傷などが殺到したためで、移民や低所得者への差別発言などもあったようだ。

 この手のトラブルは今後のオープンガバメントを目指す人にとって最も重要な課題である。日本でも公職選挙法の改正にともなう国家議員の勉強会で誹謗中傷やなりすましにならんで炎上が恐いという意見もあったことなどから、意図しない議論が完全にコントロールできない状態になることへの不安はどの国でも共通なようだ。

 しかしネットを介したオープンガバメントへの志向は今後強まることが予想され、炎上しない構造をつくることは必須になるであろう。

 多くの提案を集めようとすればするほど「ろくでもない意見」も多くなる。これは現実社会も一緒で、某首長に話しをうかがったところ「陳情は毎日沢山うけるが、ほとんどがろくでもない、必要の無い陳情」とのことであった。行政のコストの大部分はこの「陳情」に費やされているという実体も有り、リアル・ネットの境無く、如何に必要な情報を吸い上げ、いらない意見を排除するかは、行政の効率化に関しての重要項目であるといえる。

 この「陳情コストの削減」と「良い意見を効率よく集める」をネットを介して上手にやったのが米国サンタクルーズ市である。サンタクルーズ市は財政破綻を機に「heard your voice」 というサイトで意見を募集した。意見募集のためにネットを使うというところまでは良くある施策なのだが、募集した意見をネットで公開し、意見が妥当かどうか、市の施策として取り組むベキかどうかをネット上で投票させ、投票の上位ランクのものを施策として実施という取り組みをした。上位ランクには素晴らしい意見が多くこれにより行政の財政が健全化している。「より多くの人が納得できる意見は案外素晴らしい意見だ」という集合知の理論が働いた好例ともいえよう。

 もちろん意見の下位ランクはもちろんとんでもない意見ばかりなのだが、これらは投票で排除されるほか、いままでリアルで受け付けていたこれら無駄な意見陳情をやらなくて済むようになったことで、行政の時間的コストの削減につながったという副次的な効果も生まれている。

 日本でも文部科学省がやっている「熟議」など、オープンガバメントを志向した施策があるが、担当者曰く炎上しないサイトらしいが、炎上しないのはつまるところ盛り上がっていないというのが実情といえる。 英国のように盛り上がりすぎて炎上状態になってしまうのも困りものだが、サンタクルーズの施策のように少し工夫するだけでよい議論が行われることもある。

 衆愚の危険性は民主主義国家なら常に抱える危険性であるが、それを集合知にするための工夫はいくつも存在する。英国のような失敗もあるが、今後10年20年のなかでさらに良い仕組みの提案があるだろう。そうであるからこの失敗にめげず、各国政府・行政体はいろいろなトライアルをすべきである。
  
 
 

| | コメント (0)

2010年7月16日 (金)

衆議院選挙 選挙区の得票率とベキ法則

 衆議院選挙(総選挙)の選挙区での得票率を分析すると、大政党と泡沫政党の差が大きく、綺麗なべき乗(または正規分布)にならない。しかし政党別の得票率の”偏差”は”得票率”と比例しており、対数正規分布の特徴(偏差が数値に比例して変化)に似た形になっている。
 
 
 図1と図2は2009年の総選挙の選挙区での得票率とその順位である。60%~30%と、10%以下の2つのグループに分かれており、綺麗なべき乗(または正規分布)にはなっていない。分析をはじめるまえはそれなりの綺麗なグラフになることを規定していただけにかなり驚く内容である。図2は2005年の総選挙でのデータだが、図1同様に中央が膨らんだグラフとなっている。

 このような”独特”なグラフになる理由は、小選挙区での選挙が定着し、自民と民主の2大政党に票が集まりやすい傾向が強まったためであると考えられる。2010年の参議院議員通常選挙における比例区の票は、多少のでこぼこはあっても綺麗なべき乗になっているから(参考)、これは小選挙区ゆえの特徴であるといえるだろう。

 このデータをそれぞれの政党ごとに分布を集計したのが図3と図4である。郵政旋風が吹き荒れた2005年と政権交代の風が吹いた2009年では自民と民主がその位置を入れ替えているのが良くわかるほか、2005年は共産が、2009年は共産にくわえて幸福実現が低い得票率の部分に固まっているのが見て取れる。それぞれの平均得票率と偏差が図5と図6だが、ほぼ全ての選挙区に候補者を立てた共産・民主・自民は、2005年は民主と郵政反対で無所属で立候補した元自民も含め、2009年は超泡沫である幸福実現等も含めて平均得票率と偏差がほぼ比例しており、ベキ法則=対数正規分布に近いという説における「対数正規分布は数値と偏差が比例する」という特徴に似た形となっている。

 逆に一部の選挙区にしか候補者を立てていない社民・国民はその他カテゴライズした泡沫候補と同様の平均よりも偏差が高い=候補者の実力差がばらばらであるという傾向、逆に公明党は偏差が低い=ばらつきが少なく、平均に近い得票率という傾向がある。これは公明の組織率の高さ、逆に社民や国民の個人人気に頼った選挙戦を伺わせる。尚、2009年のみんなの党は平均得票率21%で偏差は0.246 となってグラフからはみ出している。これは党首の渡辺の95%という驚異的な得票率(対立候補が幸福のみ)ということもあるが、やはり政党として平均しておらず、個人人気に頼った選挙戦であったという理由である。

 
2009sousenkyo
図1 2009年総選挙の選挙区の得票率と順位
 
 
2005sousenkyo
図2 2005年総選挙の選挙区の得票率と順位
 
 
2009
図3 2009年総選挙の選挙区の得票率の政党毎の集計
 
 
 2005
図4 2005年総選挙の選挙区の得票率の政党毎の集計
 
  
2009gr
図5 2009年総選挙の政党別得票率平均と偏差


2005gr
図6 2005年総選挙の政党別得票率平均と偏差
 
 
 

 
 

| | コメント (0)

2010年7月15日 (木)

ネットの普及と所得

 2002年の段階ではホワイトカラーはパソコンで、ブルーカラーは携帯電話を使ってインターネットを利用していた。現在ではiPhoneなどのスマートフォンがパソコンのそれに変わっているだろう。
 
 
 すこし前だが、インターネットの普及を促進させるためにどのような施策が必要かを検討するにあたり、県別のブロードバンドの普及率を調査した。図1は総務省発表のデータを引用した2002年度県別のブロードバンド゙の普及率(回線数/世帯数)だが、東京神奈川など関東の普及率が高く、続いて愛知・三重・静岡の東海、普及がすすんでいないのが鹿児島など九州が低いというデータが読み取れる。いくつかの仮説をたて、なぜ地域差がこれほどにまで広がっているかを検証したが、もっとも相関係数が高かったのが平均所得との関係である。

 図2は厚労省発表の県別の平均所得の数値と図1のデータの数値を散布図にしたものだが、回帰式0.14x-0.21相関指数0.63が得られた。ブロードバンドの用途はパソコンを介したインターネット利用であることから、パソコンは当時はそれなりの価格(1台30万円程度)であったために可処分所得が多くないと持てない事、パソコンを仕事でも利用している層はホワイトカラー層や都市部の管理部門の人間などでそれら層は必然的に所得が多いこと、インターネットという新しいメディアを理解するためにはある程度の知識が必要であり、知識を理解できる程度の能力があれば必然的に所得が高いこと(IQと所得にも相関がある)などがこの関係性を作ったと考えられる。

 比較のために携帯電話の普及率を同じ散布図にプロットしたのが図3である。ブロードバンドの普及と比較すると所得の低い件でも普及が進んでいることが読み取れる。携帯電話は初期コストがほとんど要らずに購入できたこと、パソコンとは違い通話目的で購入されること、操作が簡単で特に専門的な知識が必要でないことなどが低所得層にも普及した原因としてあげることが出来る。当時は携帯電話は「馬鹿が使うパソコン」などともいわれていた。

 この傾向を理解すると、パソコンサイトと携帯サイトでの利用動体の違いが理解できる。通販や広告売上の単価の違い、コミュニティでの議論の方向性の違いなどはこの所得差=社会階層の違いとも理解できる。携帯向けのネットサービスではストラップ1本売るのに苦労するという話しは当時の関係者からよく聞いた話だ。パソコンのコンテンツ売上の大部分が(-社外秘情報につき自粛-)であるのに対して、電子書籍の猥褻なものが携帯では良く売れるという現象もパソコン利用層と携帯利用層の違いをあらわしている。


 詳細のデータを手にしていないので分析できていないが、FTTHの普及率やiPhoneなどのスマートフォンが”パソコン”に置き換わっているのではないかと予測される。iPhoneアプリが有料でも良く売れたというのは可処分所得がある程度ある層がおおかったからではないかと思われる。またネットサービスではtwitterやfacebookなども同じ様な傾向を示すだろうと予測される。

 インターネットの普及が一巡し、これからは普及そのものではなくてパイの取り合いとなる。その際にどの層にアプローチできるかが今後の勝負の行方を左右するだろう。
  
 
BB1
【図1】 2002年度の県別ブロードバンド普及率


BB
【図2】 2002年の県別のブロードバンド普及率と県別の平均所得の相関図


Mobile
【図3】 2002年の県別の携帯電話普及率と県別の平均所得の相関図
  
 
 

 
  

| | コメント (0)

2010年7月13日 (火)

参議院選挙 比例区得票数にみる組織票 ベキ法則による分析

 ベキ法則は社会学などで長く経験則として使われてきた法則で、ある統計データにおいて順位と数値をそれぞれ対数で散布図に表示すると直線状になる、というものである。例えば市町村の人口とその順位、ブログの閲覧数とその順位、個人別の収入とその順位などがベキ法則にあてはまることなどが広く知られている。今回はベキ法則を利用して第22回参議院議員通常選挙を分析してみる。

 図1は比例区の得票数と順位の散布図である。グラフをみると1位~17位、18位以下の部分に断絶があり、何らかの傾向の違いがあることが見て取れる。

 上位14名は堅い組織票および著名人が名前を連ねている。組織票としては1位~8位までがすべて公明党で、秋野・長沢・横山・谷合・浜田・荒木・浮島が名を連ねる。9位が社民の福島、10位~14位はタレント・著名人の、有田・谷・片山・佐藤ゆかりが入っている。14位が宗教系の山谷、15位は看護の高階、以下労組の直嶋、小林と続く。18位以下からも組織・タレントが続くが、上位ほどの力が無いようだ。18位はタレントの三原、19位は労組の柳沢で以下は、中村、石橋、脇と、官僚出身と労組であるが、上位18名にくらべれば得票数に断絶がある。

 つまり、このような上位と中位以下の断絶は、そこになんらかの組織の票分配があったことをうかがわせるものである。政党別に見るとこの傾向が強いのが公明党と民主党である。

 図2は政党ごとの順位と得票数だが、緑色の公明党のグラフはベキ法則を全く無視したグラフになっている。みごとなまでの組織内での票割といえる。

 同様に民主党も(図3)17位前後に大きな段差がある。獲得議席が16議席だから当選できた人と出来なかった人でなんらかの違いがあることはあきらかだ。図3から見る限りでは当選させたい人に対してある一定の下駄をはかせた=組織票を分配した可能性が指摘でき、逆に八代・安藤・喜納などは奮闘むなしく「落とされた」という見方も可能だ(注:グラフを見た限りの推測として)。

 対して図4は自民党だが、民主のような大きな段差はない。これは候補者同士での自由競争があった結果ではないかと思われる。同じく図2からはみんなの党も自民党と同じ様な競争がはたらいていたことを推測させるグラフとなっている。他にも一部有名人に票があつまった社民・国民・創新などの例も見て取れる。


 ベキ法則はまだまだ研究され尽くされていないが、以上のような「推測」を働かせることは可能で、他にもいろいろなものの分析に使えるのではないかと思われる。
 

(以上、敬称略)

 

 2010y07m13d_110453437_2

[図1]平成22年 参議院通常選挙比例区得票数 全体集計


2010y07m13d_105720484

[図2]平成22年 参議院通常選挙比例区得票数 政党別集計

2010y07m13d_134044046

[図3]平成22年 参議院通常選挙比例区得票数 民主党の集計


2010y07m13d_134751031

[図4]平成22年 参議院通常選挙比例区得票数 自民党の集計



| | コメント (0)

2010年7月 7日 (水)

ベキ法則から見るAKB48選抜総選挙の得票数の不思議

 ベキ法則は社会学などで長く経験則として使われてきた法則で、ある統計データにおいて順位と数値をそれぞれ対数で散布図に表示すると直線状になる、というものである。例えば市町村の人口とその順位、ブログの閲覧数とその順位、個人別の収入とその順位などがベキ法則にあてはまることなどが広く知られている。今回はベキ法則を利用してAKB48の総選挙について分析してみたい。

 説明するまでもないがAKB48は秋元康氏プロデュースによる秋葉原を本拠地として「会いに行けるアイドル」をコンセプトに活動しているアイドルグループである。2005年に誕生し、2007年にはNHK紅白歌合戦にも出場している。

 AKB48ではいままでのアイドルグループには無かった色々な新しい試みがされているが、2009年からAKB48選抜総選挙と称された人気投票が行われている。AKB48選抜総選挙はCDの購入者やファンクラブ等の会員に投票資格が与えられ、得票数によってその後の活動への関与が決まるというものだ。2009年は前田敦子さん、2010年は大島優子さんが1位となり、テレビなどでも話題となった。

 2009年と2010年をベキ法則で分析するといくつかの面白い特徴が見えてくる。

 まずは2009年に関して、グラフ化すると図1のようになる。1位から30位までほぼ直線状になっており、ベキ法則が当てはまっていることが見て取れる。5位と6位が非常に接戦で、また逆に11位12位、15位と16位のところにやや差がみてとれるなど、人気の分布が一様ではなく、いくつかの競争と差があることがあるが、ほぼベキ法則どおりの得票数であるといってよい。

 2009年AKB48選抜総選挙結果グラフ
(図1 2009年の順位と得票数)
 

 
 次に2010年に関してグラフ化すると図2のようになる。1位と2位が接戦(597票差)であるのがわかるほか、2位から22位までがほぼ直線になっており、ベキ法則に当てはまっている。逆に23位以下からはグラフが下に折れ曲がっており、23位以下の得票数の割合の低さが目立つ形となっている。

 さらに中間発表の数字も分析してみると、2010年の傾向をより詳しく見ることが出来る。6月2日時点の中間発表をグラフ化したものが図3である。図3からは2位の大島さんの票がベキ法則からみてやや得票数が上に、11位までの値と12位~18位、18位~19位、において大きな差が生まれているのが見て取れる。この傾向を図2の最終得票、および図1の昨年の傾向とあわせて考えると、


2010年AKB48選抜総選挙結果グラフ
(図2 2010年の順位と得票数)
 

2010年AKB48選抜総選挙中間発表結果グラフ
(図3 2010年の中間発表時の順位と得票数)
 

1)1位と2位の激しい競争

 2009年は1位と2位の差がベキ法則どおりだったが2010年はベキ法則から大きく外れている。これから2010年は前田さんと大島さんの間で激しいトップ争いが演じられていたことがわかる。それは中間発表前からくりひろげられていたようだ。

2)トップグループ、中間グループ、下位グループで明確な差

 グラフの分析をした後に知ったのだが、AKB48は上位12名で構成されるメディア選抜、21位までの選抜メンバー、22位~30位のアンダーガールズというカテゴライズがあり、それぞれの活躍の場に差がある。それを示すように、図3の中間発表ではメディア選抜に相当する上位11名と、選抜メンバーに相当する12位~19位とそれ以下においてグラフに段差が見らる。カテゴライズ毎の活動およびメディアでの露出の差が中間発表時の得票数の差という形で現れたといえるだろう。

3)メディア選抜(12位以内)、選抜メンバー(21位以内)入りをかけた激しい争い

 図2の最終発表の結果は図3の中間発表のような大きな断絶がなくなり、いくつかの細かい差が出ている。上位22名とそれ以下ので出た傾きの差から、選抜メンバーに入るための21位争いが上位22名で激しく繰り広げられていたことがわかる。さらに細かく見ると9位から13位(図の赤い点線部分)の数字がベキ法則からはずれてそれぞれの数値が非常に接近している。ここでもメディア選抜12名入りをかけて激しい競争が繰り広げられたことが見て取れる。同様に19位から22位までの部分((図の緑の点線部分))でもそれぞれの数値が接近しており、選抜メンバー入りの最後の生き残りをかけた激しい競争があったことがわかる。
 
 
 
 AKB48選抜総選挙はアイドルグループの新しい試みとして非常に注目された。得票数をベキ法則で分析すると「ガチです」と称したとおり、ガチな競争が繰り広げられていたであろうと推測される。また、メディア露出による人気の差や、今後の露出をかけた激しい競争の後も見て取れた。AKB48選抜総選挙は今回の盛り上がりをうけて次回も開催されるであろうから、次回に関してもベキ法則を利用して分析をしてみたい。


参考:http://sites.google.com/site/watasinopage/
 
 
 

 
 

| | コメント (0)

« 2010年6月 | トップページ | 2010年8月 »