今回はSNSでのプロファイリングについてです。
Twitterの投稿で趣味嗜好が丸裸に!?
SNSに投稿された内容から個人の趣味嗜好をかなりの精度で見抜くことができると分かっています。
Twitter に投稿された日本語のデータを対象として、投稿に含まれるテキストがどの程度個人情報を運んでいるか編成で調べた。
約6000人の調査対象者を集め、性別や年齢層だけでなく、ストレスを感じやすいか・犬派か猫派か・Facebook の友達は150人以上いるかなど12種類の個人属性についての質問に答えてもらった。
そして許可を上に入れた上で参加者のツイートを収集した。収集したツイートを自然言語処理の方法で処理し、12種類の個人属性をそれぞれ言い当てることがどうか調べた
実験の結果、7つの属性において60%以上の確率で当てることができた。
Twitterの投稿だけでも、
- 専門書を読むかどうか
- テクノロジーに詳しいかどうか
- 既婚かどうか
などパーソナルな情報を言い当てることができるようです。
投稿内容から性格をプロファイリング
具体的に投稿の内容と性格の関連性を調べた研究もあります。
Facebook ユーザーを対象にした研究では、被験者の投稿内容を調べた上で性格テストを受けてもらったところ、書き込みの内容と本人の性格テストの結果に関係性が見られたそうです。その結果によると以下のような特徴が見られたとか。
- エクササイズ・食事・自分の業績などにの投稿が多い人:ナルシストの傾向
- 現在の恋人に関する投稿が多い人:自分に自信がない傾向が高い
- 自分のこどもに関する投稿が多い人:真面目、誠実
- 日々の平凡な暮らしに対する投稿が多い人:社交的
- 知的な話題に関するニュースなどによる投稿が多い人:知的好奇心が高いタイプ
探偵役が、SNSを見ただけでその人の性格を予測するような描写をすると面白いかもしれません。
「いいね!」だけで家族と同じぐらい性格を言い当てられる!?
もっとすごいのはSNS上の「いいね!」だけでも性格を分析できるということです。
ケンブリッジ大学の研究↓では、「いいね!」のデータをたくさん集めれば、パーソナリティをかなり正確に言い当てることができると分かっています。
ケンブリッジ大学でマイケル・コジンスキーが、Facebook の「いいね!」のデータを利用して、ユーザーの特徴を推定する実験を行った。
「マイパーソナリティ」という Facebook のアプリを作成し、約58000人のボランティアに個人属性に関するアンケートに答えてもらった。
その後、許可を得た上でボランティアの人たちの Facebook のデータを収集した
そしてニュース・アート・自動車メーカーなど約56000の Facebook 上の記事のうち、どれに「いいね!」をしたのかに関するデータを集めた。その後データから個人の趣味や属性を推定する統計モデルを構築。
その結果、「いいね!」のデータから、
- そのユーザーが男か女か
- 黒人か白人か
- 同性愛者かどうか
- 薬物を使用するかどうか
- 21歳まで実家暮らしをしていたか
といった個人情報まで言い当てることが できるとわかった。
ビックファイブの性格特性に関しても、かなりの精度で見抜くことができます。
「ビックファイブ」とは人間の性格を5つのスケール(外向性・調和性・勤勉性・情緒安定性・開放性)で分析する手法です。
その後の研究では、86222の Facebook の「いいね!」のデータを用いて解析を行った。
「いいね!」のデータから収集した個人情報で ビッグファイブの予測を行ったところ、人間よりもコンピューターの方がビッグファイブを正確に予測できた
具体的には、「いいね!」のデータが 10個で仕事の同僚、60~70個で友人、100~150個で家族、250~300個で配偶者と同程度にその人のビッグファイブを言い当てることができた
創作のアイデア
最近のミステリーでは、プロファイリングで犯人をあぶり出していく捜査なども描かれることが多いです。
データ分析に強い探偵役を描いて、容疑者のSNSの投稿から性格を割り出し、犯人像と照らし合わせる、といった描写も面白いかもしれません。
コメント