<<< back

エビデンスベーストアプローチによる図書館情報学研究の確立
第4回ワークショップ
エビデンスに基づく研究におけるインターネット・モニター調査の現在点」

議事録

開会の辞 | 発表T(辻:前半) | 発表T(辻:後半) | 発表U(長崎:前半) | 発表U(長崎:後半) | 質疑応答

::: 発表T(辻慶太氏:後半) :::


 次に、インターネット調査の利点のお話に行きます。「それは本質的ではないだろう」というのが学者の突っ込みによくあると思うんですけれど(笑)、それは置いておいて、インターネット調査の利点の一つに、調査に必要な作業が少ないというのがあります。まず郵送調査や訪問調査の場合、住民基本台帳や名簿を入手する必要があります。僕のやりたかった、司書資格を持って図書館員にならなかった人というのは連絡先を特定するのが困難です。多分、ほとんど不可能だと思います。そういう作業はインターネット調査では必要ありません。また郵送調査の場合、調査票を印刷して封入して送るという、ばかにならない手間があります。さらに返ってきた回答をコンピュータに入力する作業も郵送調査では必要になります。訪問調査でも多分必要になります。  インターネット調査では,上記のような作業がほとんど必要ないので、迅速に結果が得られるという利点があります。僕の司書資格調査も派遣職員調査も、調査票をYahoo! JAPANに提出してから、たしか2週間程度で最終結果が得られたような気がします。もっと短かったかもしれません。
 インターネット調査のほかの利点として低コストであるというのがあります。冒頭の金額を聞いて「低コストとは何ごとだ」と思われたかもしれないですが(笑)、訪問調査で同じサンプル数を確保しようとしたら2000万近くかかるらしいです。訪問調査では大体1件あたり1万円かかるんだそうです。僕は1800人に聞いたので、訪問調査だったら1800万かかる,と。それが先述のように198万でできるのですから、安いものではないかと思います。
 インターネット調査の3つ目の利点として,郵送調査と違って、マルチメディア対応の調査票がつくれる点が挙げられます。音楽を聞いてもらって評価してもらうなど、そういうのが可能になります。また回答に何分かかったとか、この問題をチェックした人はこっちへ行ったとか、そういうトラッキングが可能になるとも言われています。  では次にインターネット調査の欠点に行きます。インターネット調査には利点が多いですが、欠点もいろいろあります。欠点といったら外せない人がいるんですけれど、大隅昇さんという人がいます。この人は、インターネット調査は今のままではだめだろうということを繰り返し述べています。
 まず一番代表的な欠点としては、モニターの代表性に疑問があるという点です。モニターは一体だれを代表しているのかという話です。ほかにはインターネット調査は回答率が低いとか、虚偽の回答が混入しやすいということを言う人もいます。ただこれらの点はほかの調査でも問題なのではないかという気はします。
 サンプルが何を代表しているかがわからないというのは、対象とする母集団と実際に調査したサンプルに差が生じるという問題につながります。一般に、母集団と調査結果の差というのは5種類の原因で発生すると言われています。先ほどの代表性に問題があるといった話での誤差の原因としては、カヴァレッジ誤差と標本誤差の二つが問題になります。
 対象母集団というのは、例えば国勢調査では国民全体など,調査したい人たちです。これに対して、枠母集団とは標本抽出枠で,例えば住民基本台帳に書かれている人達などです。カヴァレッジ誤差は,これら対象母集団と枠母集団とがずれているといったリストの不完全性(すなわち住民基本台帳に書かれていない人がいるなど)によって起きます。標本誤差は、枠母集団全数ではなくて、そのうちの一部を使ったことによる誤差です。インターネット調査では、この二つがまざって代表性の問題を生むと考えられます。
 調査における誤差としてはほかに、無回答誤差、測定誤差、集計誤差というのがあります。ただ、これらはインターネット調査に限らず、ほかの手法でも起きる話なので、そんなに問題だとは思われません。
 調査対象者を選ぶ場合は、住民基本台帳から単純無作為抽出で選ぶとか、選挙人名簿から層化2段確率比例抽出で選ぶというのが必要だと伝統的な調査では考えられています。そういうふうに抽出することで、母集団の傾向を確率的に推定することが可能になると考えられています。これに対してインターネット調査のモニターは、このようなサンプリングを経ていません。「私、100円で回答します」といった人たちが集まって回答しているので、一体どういう人が集まっているのかがよくわからない。その結果から、母集団を確率的に推定するというのができないと考えられています。
 実際にインターネット調査回答者には、このような偏りがほかの調査手法の結果から比べるとあったと言われています。いろいろありますが、属性については高学歴な人が多い、専門職・技術職が多い。大企業勤務者が多くて、派遣が多くて、非正規が多い。この結果は主に本多さんという人が書いています。意識については、競争社会への志向が強い、満足度が低いなど、そのような傾向を本多さんや山形さんは見出しています。ただ、吉村さんという人も同じような小さな調査をしていますが、この人は先ほどと違って「満足度が高い」という傾向を見出していたので、この辺は微妙かもしれません。全般に物質や金銭志向が強い、老後に対する不安感が強い(笑)、充実していない、こういうものがあるようです。
 小遣い稼ぎのためにモニターに登録する人がいます。インターネット調査を行っているところはYahoo!リサーチに限らなくて、あちこちにいます。そういうところに全部登録する人がいて、そういう人に「あなたは、どれぐらいインターネット調査に回答していますか」と聞いたところ、週に一度以上回答していますという人が全体の7割を占める調査会社もあります。週に一度以上回答しているという人が、男性では10%から20%、(女性では)15%から30%という結果を見出している調査もあります。つまり、答えまくっている人も多いわけです。
 こういう結果は、先ほど言った金銭志向が強いというのと整合的な関係があるのではないかと考えられます。幾らだったか忘れましたが、そんなに多額のお金をもらえるわけではないですが、それでもやりたいという人たちが集まってきています。これらもサンプルとしての偏りにつながっていると考えられます。
 次に,これはよく言われることですけれども、インターネット調査の回答者は,定義上インターネットを割とよく利用する人である。こういうことも、偏りを生んでいると見られています。年齢や住んでいる都道府県で補正しても効果は少ないといった結果が、幾つかの調査で得られています。
 では、どんなふうにしたらこうした欠点を改善できるのか,その点に関してヒントとなる話を二つほどご紹介したいと思います。まず朝日新聞社のインターネット調査システムを紹介します。朝日新聞社は1992年から電話回線を使ってテレジェニック端末というのを用いて答えてもらうオンライン調査システムを稼働してきました。これを使って、自分たちが載せた広告をどれぐらい読んでもらえたか、見てもらえたかといった調査をしてきたそうです。
 テレジェニック端末というのはどんなものか、Googleイメージで検索して張りつけてこようと思ったのですがヒットしませんでした。論文に載っていた小さいのを見ると、本当に電話みたいなものでした。さて次に朝日新聞社はどうやって調査対象者を選んでいるかというと、これが重要なんですけれど、住民基本台帳から世帯を無作為抽出する。調査協力を依頼して応諾してくれた人に対して、テレジェニック端末を貸す。そして操作方法を説明します。こうして得られたモニターに対して、オンラインで調査を行うということをやってきました。
 「テレジェニック端末を使った調査はインターネット調査ではないじゃないか」と思われたと思います。時代の流れで、朝日新聞社は2004年からテレジェニック端末はやめてパソコンにかえました。ですが調査の流れ,特に調査対象者の抽出方法はこれまでと同じということです。パソコンを持たない人にはパソコンを貸します。しかもインターネットの使い方も教え、そして回答してもらっています。サンプルの抽出方法は住民基本台帳から同じように抽出しているということなので、一般的なインターネット調査とは調査対象者の集め方の点で違っています。
 ここで皆さんも思われたと思いますが、インターネットの使い方を教わったというのが、その人の人生観その他に大きな影響を与えて、回答傾向を変えたりはしないだろうかという素朴な疑問が僕にもあったんですけれど、さてどうなんでしょう。以上が朝日新聞社の改善の例です。
 インターネット調査の欠点の克服方法に関するもう一つの方向性として、ハリスインタラクティブという調査会社のプロペンシティ・スコアというのを紹介しておきます。「プロペンシティ」というのは、傾向とか、性癖、性向、その人のくせという意味らしいです。ハリスインタラクティブは、ニューヨーク州ロチェスター市に本社を置く会社です。この会社は、ハリスポールなど有名な調査結果をいろいろ出していて、ギャラップと並ぶアメリカの有名な調査会社だそうです。
 ここはどんなことをやっているかというと、Random Digit Dialingという無作為に電話番号を決めてサンプル抽出した電話調査とインターネット調査とを毎月行っています。その結果を突き合わせて、調査対象層の回答率をロジスティック回帰分析によって推定します。その回答率に基づいて結果の重みづけをします。そんなふうにして、結果を推定しています。説明変量は回答者の行動や態度です。この回帰式を毎月更新しています。  このようにして、電話調査とインターネット調査を併用してその両者を統合した結果を出しているということなので、単独よりも正確な予測ができるとしています。2000年の大統領選挙では、ブッシュとゴアの支持率を全米で一番正確に予測したという記録が残っています。両方を使っているので、電話調査単独やインターネット調査単独よりも正確という結果が出ているらしいです。
 最後に、こんなに時間がもつとは思わなかったんですけれど(笑)、改善方法としては,先述のように幾つかの手法を組み合わせる,住民基本台帳のようなものを使って、統計学者がうるさいことを言わないような方法を考える,あとは、企業や役所などが協力してデータ収集の効率化ができないかというのも考えられます。  関連文献は挙げたとおりです。

池内
 どうもありがとうございました。
 引き続き、長崎さんからご発表たまわりたいと思いますが、辻先生のご発表を終えられた段階で、何かお伺いしたいこと、確認しておきたいことがございましたら、この時間にご質問等をお受けいたします。
 どなたかいらっしゃいますでしょうか。――よろしいですか。
 それでは、後ほどまたディスカッションの時間を設けさせていただきたいと思います。
 それでは、インテージ・インタラクティブの長崎さんからご発表をお願いしたいと思います。
 よろしくお願いいたします。

<<< back