Prev

Next

034:2008年度 第1回 2008年6月7日開催

教育における協調フィルタリングの可能性を考える
あなたに「ぴったり」な学びをかなえる技術

  • あなたに「ぴったり」な学びをかなえる技術
  • あなたに「ぴったり」な学びをかなえる技術
  • あなたに「ぴったり」な学びをかなえる技術
  • あなたに「ぴったり」な学びをかなえる技術

0. 趣旨説明

山内祐平 今回のBEAT Seminarでは、協調フィルタリング、推薦システムが新しい学習環境に利用可能ではないかということから「あなたに『ぴったり』な学びをかなえる技術」というテーマを設定しました。
まず、産業技術総合研究所の神嶌敏弘氏より協調フィルタリングと推薦システムの概要についてご説明いただきました。次に、「関心空間」代表取締役の前田邦宏氏に、実際協調フィルタリングを、人のつながりを作るためにインターネット上でどう用いるかについてお話しいただきました。その後、BEATの特任助教から、教育への応用に当たってのアイデアが紹介されました。

1.「推薦システムと協調フィルタリング」
神嶌敏弘氏(産業技術総合研究所 脳神経情報研究部門 情報数理研究グループ)

1.1. 推薦システムの背景

神嶌敏弘 コンピュータが登場する以前は、情報を集めるのが大変であった。ところが、実際にコンピュータが登場すると、大容量化によって大量のデータの蓄積、高速通信が可能になり、今度は情報過多という状況が起きている。すなわち、情報が多すぎて、その中に情報があることはわかるが自分が欲しい情報がどこにあるのかわからない、また、どのように探したらよいかわからない、というように、せっかく情報があるのに利用できない状況になってしまっている。
このような情報過多の状況に対する一つの処方箋として、「推薦システム」がある。情報過多の状況でどうにかして情報を利用できないかと考えた時、もし人間であれば、ガイドブックを見る、他に詳しい人に聞く、などと言ったパターンがある。人間がこのように行う手順を、コンピュータを使って自動的に行おうと考えたのが「推薦システム」である。
「推薦システム」を使用した代表的なものにAmazon.comがある。マイストアを見ると、自分が過去に買った履歴から「この商品がお薦めです」という情報が出てくる。これは「特定の人の思考に合わせて商品を選ぶ」というパターンである。狭い意味では、「推薦システム」とは、このように個人化したパターンの形だが、他にも、「店舗の人が推薦するものを示す」「売れ筋のランキングを全体的に示す」といった個人化していないパターンも広い意味で「推薦システム」に含まれる。
「推薦システム」を実現するために必要な技術には、ヒューマンインタフェースの技術(推薦するアイテムの内容や、推薦しているものをどのように利用者に示すかを考えること)、認知心理系の技術(いかに好みというものをユーザーから引き出すか)がある。

1.2.「推薦システム」の実行過程

「推薦システム」の実行過程には、O-I-Pモデル(Output-Input-Process)と呼ばれる3つのステップがある。

  1. データ入力…「欲しい」、「好き」、「嫌い」、という情報をシステムのユーザーが入力するステップ
  2. 嗜好の予測…ユーザー自身が入力した嗜好データ、他のユーザーのデータ、推薦するアイテムのデータなどから計算してユーザーの嗜好の予測を行うステップ
  3. 推薦の提示…ユーザーに分かりやすいように推薦情報を提示するステップ

1.2.1. データの入力 ―嗜好データの獲得―

入力データとして代表的なものは、「嗜好データ(何が好き、嫌いか)」である。このデータを獲得するには、「明示的獲得(直接ユーザーに尋ねる)」と「暗黙的獲得(ユーザーのweb上のクリック回数などから予測する)」の2つの方法がある。

1.2.1.1. 明示的獲得

ユーザーに直接聞く方法であり、「採点法」と「格付け法」という代表的な2つの方法がある。

  • 採点法(scoring method)…5つ星など「数字」で聞く方法
  • 格付け法(rating method)…上中下、yes/noなど「段階」で聞く方法

「明示的獲得」の利点と不利点は、以下のようにまとめられる。

利点 不利点
ユーザー本人に直接好き嫌いを尋ねるため、データの内容の正確性が保証される。 ユーザーにとって、質問に逐一回答するのは面倒であるため、大量のデータの収集が困難である。
ユーザー自身にとっても得られたデータは納得できるものであることが多い。
1.2.1.2. 暗黙的獲得

例えば、ユーザーがあるDVDを買ったとすると、「買ったならばそのDVDは好きに違いない」、あるいはユーザーがあるWebページを読み飛ばしたとすると、「読み飛ばしたページの内容には興味がない」と判断するなど、ユーザーの取る行動から、本人の好き嫌いを察する方法である。
「暗黙的獲得」の利点と不利点は、以下のようにまとめられる。

利点 不利点
システムが計算を行うことで予測できるため、大量のデータを収集しやすい。 内容の正確性が保証されにくい(たとえば、ユーザーがあるDVDを買ったとしても、それは他人に頼まれて買っただけかもしれず、また、あるDVDを買わなかったからといって、単にそのDVDを知らないだけなのか、嫌いなためなのかは判別できない。)
本人の知らないところで計算されて推薦されたものに対して、ユーザーは簡単には納得しない。

1.2.2. 嗜好の予測―「内容ベースフィルタリング」と「協調フィルタリング」―

推薦に使う手掛かりには大きく分けて「内容ベースフィルタリング(アイテムの特徴を利用するもの)」と、「協調フィルタリング(他人の意見を利用するもの)」がある。近年は、両者を混合したハイブリッド型が主流になっている。

1.2.2.1.「内容ベースフィルタリング」

アイテムの内容を表わす情報(記事であれば題名、日付、本文など)の特徴を利用するものであり、「直接指定型」と「間接指定型」の2つがある。

  • 直接指定型…どんなものが好きか、アイテムの特徴を具体的にシステムに入力する方法
  • 間接指定型…利用者の過去の嗜好データを収集して用いる方法
1.2.2.2.「協調フィルタリング」

神嶌敏弘 ユーザーと嗜好の似ている他のユーザーらの情報を用いて、推薦情報を決定する方法である。いわゆる「口コミ」による推薦を、コンピュータで自動化しようというものである。「協調フィルタリング」には大きく分けて、「メモリベース法」と「モデルベース法」の2つがある。

メモリベース法

ユーザーが過去にそのシステムを利用した時のデータ(蓄積したデータ)そのものから推薦候補を予測する方法である。大きく「利用者間型」と「アイテム間型」に分けられる。

  • 利用者間型
    ユーザーと思考パターンが類似した標本ユーザーを探索し、その標本ユーザーが好むものを推薦する。ミネソタ大のJohn Riedlを中心としたグループが開発した「Group Lens」方式が代表的である
  • アイテム間型
    自分が好きなアイテムに似ているアイテムを推薦する方法。

「メモリベース法」の利点と不利点は、以下のようにまとめられる

利点 不利点
ユーザーやアイテムが変化しても、モデルを改めて作り直す必要がないためすぐに対応できる。 推薦時にデータを毎回調べるため時間がかかる。
モデルベース法

ユーザーがシステムを利用する前に、嗜好の規則性(モデル)を予め予測しておき、そのモデルを用いて推薦候補を予測する方法である。様々なモデルがあるが、代表的なものに、ある一回の評価付けで、どの利用者がどのアイテムを評価したかという同時確率でモデル化した「共起型モデル」がある。
「モデルベース法」の利点と不利点は、以下のようにまとめられる。

利点 不利点
事前にモデルの予測を行うため、素早い推薦が可能である。 ユーザーやアイテムが変化した場合モデルを作り直す必要があるためすぐに対応できない。
1.2.2.3.「内容ベースフィルタリング」と「協調フィルタリング」の比較
  • 「セレンディピティ(serendipity)」の観点からの比較
    「セレンディピティ」とは、単に知らないだけでなく、意外性もある推薦のことである。この場合、「協調フィルタリング」の方が、本人の過去の履歴を見る「内容ベースフィルタリング」よりも「セレンディピティ」を起こしやすいといえる。
  • 「ドメイン知識」の観点からの比較
    「ドメイン知識」とは、推薦対象の特徴である。アイテムの特徴を管理するデータベースの維持は高コストである。また、アイテムの特徴のみからユーザーにとって必要な推薦情報を予測することは困難である。よって、この場合も「協調フィルタリング」が有利である。
  • 「cold-start問題」の比較
    新規ユーザーの場合、その人の過去の履歴はわからない。この場合、どのユーザーと嗜好データが似ているかがわからないため、本人による情報の入力による「内容ベースフィルタリング」の方が有利である。

1.2.3. 推薦の提示

予測したアイテムの推薦候補は、ユーザーにとって適切な形式で表示される必要がある。ユーザーによる推薦システムの利用目的には次のようなものがある。

  • 適合アイテム発見
    ユーザーに明確な目的や、積極的な意志決定の動機があり、何か自分の嗜好に適合するアイテムを見つけ出そうとすること。
  • 評価閲覧
    ユーザーに積極的な意志決定の動機はなく、閲覧の方向付けが目的であること。

「適合アイテム発見」と「評価閲覧」の場合では、推薦の提示方法は異なる。「適合アイテム発見」の場合、適切だと考えられる順にソートして表示する。

1.3. 推薦システムは役に立つのか?

たぶん一番お知りになりたいところはここだと思う。もちろん、役に立つ。
ただし、ユーザーの意図に合致した情報を提供する必要がある。重要なのは以下の2点である。

  • 推薦理由の提示
    具体的にどんな情報を提供しているのかをユーザーに伝えなければならない。ユーザーが推薦を信用し受け入れやすくするためには、推薦そのものだけでなく、推薦の理由を提示することも重要である。
  • 推薦手法選択の手がかりの提示
    ユーザーの利用目的に応じてユーザーにとって適切な選択が可能となるように、個人に応じた推薦方法の選択が可能になるようにしなければならない。

※参考サイト
videolectures.net(http://videolectures.net/
英語だが、カンファレンスやチュートリアルを録画し、フリーで公開しているサイトである。簡単な推薦システムがあり、このビデオを見ている人はこのビデオを見ているということがわかる。

2.「関心空間に見る“気付き”を与え合う多次元協調フィルタリングの可能性」
前田邦宏氏(株式会社 関心空間 代表取締役)

2.1.「関心空間」とは

前田邦宏 「関心空間 http://www.kanshin.com/」は、今から7年くらい前、2000年の7月にテストサイト(関心ドットコム)を作ったところから始まった。5名のスタッフの知り合い40名ぐらいに持ちかけて、非公開で自分の関心のあることを投稿して、それをお互いにつなげてコミュニケーションするというものである。当時の事業計画としては、いろんな企業にコミュニケーションする、コンシューマー同士がコミュニケーションしたり、企業とコンシューマーがコミュニケーションするためのコミュニティエンジンとしてカスタマイズして提供するものであった。
どういう仕組みかというと、自分の興味のあること(=ここでは「キーワード」と呼ぶ。商品名・店舗名などの固有名詞)を数百字ぐらいの情報で自分の友達に説明し、1つのカード状の情報にする。その下にスレッドが出来て、掲示板のかたちになる。そして、そのキーワードに興味を持った別の人が、別のキーワードにつながりをつけることができる。これは、今でいうトラックバックに近い機能だが、当時はなかったため、我々はこれを「つながり」と呼んで、つながる理由をつけてつなげることをユーザーに勧めた、というものである。

2.2. 設計思想とその効果

あなたに「ぴったり」な学びをかなえる技術 実は、私はコミュニティや掲示板を作ることを主眼としてこのプラットフォームを設計したわけではない。「自分の好みの一つ先の情報を検索するにはどうすればよいか」という推薦システムの設計をしようと思い、こういう仕組みを作った。
2000年当時は、自分が投稿したエントリーに対して他人が勝手にリンクを貼って自分のページに導出するというのは、インターネットのエチケット上マナー違反と見なされていた。しかし、実際にこのような仕組みを作ってみたところ、ユーザーに好評で、私自身も自分が設計した時には想定していなかった効果もいろいろ見つけた。
ここで、突然であるが、自分の両親は徳島である。徳島では、お味噌汁はすだちを絞って入れる、という習慣があったが、東京の人に言うと「え?何それ?」ということがあった。実は、私が最初に投稿したのは「すだち」であった。本人が普通だと思っていることが他人にとって意外だ、という事実がどんどん判明した。いつも身近にいる人のプライベートな趣味を初めて知ることもあった。加えて、これまで自分の趣味と合うと思ってはいなかった情報が、自分のスタッフの1つ先の友人から手軽に手に入る、ということが連鎖的に起こった。
たとえば、「徳島の地元の人しか知らないつながり」ということで別のキーワードをつなげてくれた人がいた。あるいは、徳島つながりでなくても、「地元限定でしか食べられないB級グルメ」のつながりが生まれることもある。「好き」や「テイスト」はコンピュータにはわからない。何が「好きである」ことなのかを定義しなければならないためである。言語は検索できるが、郷土愛はわからない。キーワード同士のつながりは、人間が見れば、何のつながりかがわかる。

2.3. 今後の展望

その後、2001年にブログのトラックバック機能が公開された。他者の書いた記事・発言を自分の記事・発言とつなげていく連鎖が定着していったが、実はまだ実現していないことがある。それは、趣味の構造的な相似をマッチングさせるということである。
たとえば、人間だと、私が友人の家に行って本棚を見た時、中身を読まなくても、ぱっと見た時に、「コイツは○○系が好きなのかも…」というのが視覚的に、瞬間的にわかる。コンピュータでは、おそらく購買履歴というかたちでしかわからない。だからそのようなことをコンピュータでやりたい、と昔から思っている。今実際に行っているサービスの中では、まだその一部しか実現できていない。
現在「関心空間」には、「コレクション」という、ユーザーが投稿した情報をコレクションにして、一つのまとまりにする、という機能がある。そのコレクションを見て、共感した別の人がコメントをする。自分の投稿が別の人のコレクションに収納されることもある。コレクションとコレクションをつなぐこともできる。
4年ぐらい前に函館のスローライフなスポットを「関心空間」に投稿して、それを地理空間上にGPSのデータを使って可視化する、という地域マーケティングの意味もあるプロジェクトがあった(ハコダテスローマップ http://www.kanshin.jp/hakodate/index.php3?mode=top)。これは、何が目的かを直感的に実現している。1個目の投稿情報のその先にどんな投稿があるかを可視化している。1つ先だけでなく、さらにその先も見える。メタ情報がこの地図上に見えるのである。

2.4. まとめ

前田邦宏 今回、「教育と協調フィルタリング」というテーマを聞いて、事例を調べてみたがあまりなかった。
エンゲストロームの活動理論、ヴィゴツキーの最近接発達領域や、たとえば、プログラムを勉強しましょうといった時に、それを教えている先生が、「この人はたぶんオブジェクト指向が苦手だな」など、ある傾向を読み取って、「こういう本を読んでみたら?」「考え方を変えてこういうアプローチをしてみたら?」など、外側から見えるけれど本人にはわからないことをアドバイスすることが実際の教室の中である、という話を聞いて、これをコンピュータで何とか連鎖的に起こすことができるのではないか?とずっと思っていた。
「関心空間」をはじめてやっと7年経ったが、当時と今とで時代が大きく変わった。ゆるいサービスの中で日常的にコミュニケーションをとれるようになり、つながりを作って、そこにメタ情報を付与して、そこから推薦情報を得るということが理解される時代になった。
よって、まさに「協調フィルタリング」を利用した推薦情報の提示はこれからの方法として面白いのではないかと思う。例えばQ&Aコミュニティのようなものも、「関心空間」でいうと投稿情報にスレッドが出来たという時代からあまり変わっていない。情報が多くなると、トップページから検索せざるを得なくなる。そのためにつながりにタグを付けてみると、今度はタグが多くなり、タグを検索しなければいけなくなるというループ状態になる。3万人に定常的によいつながりを与えるのは難しい。我々の今の課題は、「このつながりは誰にとって有意味であるか有意味でないか」というデータを集め、その人に個別化した推薦情報を出すというアプローチである。
さらに、今はGPSだけでなくセンサの情報などによって、目に見える情報以外も扱えるようになった。今までデジタル化できなかった情報が、現在のインターネット上にはある。それらの情報を「協調フィルタリング」を利用して、自分の実感として得られているもの(気分、存在感など)を交換し合うアプローチは、先端的なサービスを作っている人の中で議論になっている。

3.「BEATスタッフが提案する教育応用のアイデア」

3.1.「授業・講義推薦システム」と「進路提案システム」
北村 智(BEAT 特任助教)

3.1.1. はじめに

北村 智 2つほどアイデアを出してみたい。「協調フィルタリング」が社会で使われる時、どういうものかを考えると、ユーザーが好きなものないしは、好きそうなものを推薦するという仕組みになっている。教育利用としてひねりを加えず考えるなら、例えば、好きそうな、得意そうな勉強を推薦する等である。

3.1.2. 授業・講義推薦システム

授業の履修状況や成績情報、その授業が面白かったかどうかというレーティングは、大学でも授業評価の観点からアンケートによる情報が集められるため、そのような情報を利用して、履修してみるとよさそうな授業・講義を推薦するシステムが大学にあってもよいかもしれない。
高校や中学校・小学校であると、カリキュラムの自由度が低いため難しいが、大学のような自由度の高いカリキュラムであれば考えられる。日本でも電通大の植野先生(2007)が「eラーニング・コース・リコメンデーション・システム」というものを実際に考案されているという事例もある。

3.1.3. 進路提案システム

進路を提案するというのも考えられる。興味関心や成績などの情報から、嗜好の近い人がどういうところに進学していると満足するのか、ということをもとにして、進学を考えると良さそうな大学・学部・学科などを推薦することも考えられる。卒業生の情報を蓄積していくと、データベースを構築することができるようになり、学校単位で運用可能になるのではないか。
ただし、実際には、何から推定するかということが一番の問題になる。推定の精度を高めるためには妥当なモデルを考えなければならないため、何を入力情報としなければならないのかが非常に大きな問題になる。よって、すぐに実現は難しいが、そのモデルが確立さえすればできるのではないかと思う。
他にも、就職する業界や職業、会社などどういうところを受けてみたらよいかということを迷っている人たちに対して提案できる仕組みも可能かもしれない。

3.2.「成績」を手がかりにする推薦システムの利用案
松河秀哉(BEAT 特任助教/大阪大学 大学教育実践センター 助教)

3.2.1. はじめに

松河秀哉 推薦システムは、もともと販売促進の手段として使われているものである。一般的には、消費者の現状や要求を入力してもらって、好まれる物品の予測をして、当たれば購入してもらえる、ということになる。消費者に変わることは求められていない。
一方で、推薦システムを教育に応用することを考えた場合、学習者の現状と要求を入力して、そこでの好まれる学習を予測して、それが当たれば学習するのでよいのか?というと、それは違うだろう。通常、学習者に変わることを求めるのが教育である。
好まれるものがいいのか、というとそうではない。つまり、望まれるシステムは、現状・要求が入力されたら、現状を変えるような学習を予測し、学習者が希望を持って学習できるシステムではないかと思う。
そこで、具体的な例として「成績」を手がかりにするシステムが考えられる。たとえば、現在、ある勉強法を採用しながら成績が上がらない学習者がいるとする。そこに、現状は同じでも1年後にはこういう勉強法を取っている人は成績が上がっているんだよ、ということを提示してあげられれば、励みになるのではないか。

3.2.2. 学習者の個々の勉強法を蓄積し利用する

たとえば、英語の学習を考えた場合、「解らない単語があるときは必ず辞書を引く:はい/いいえ」、「英語のまま理解しようとする:はい/いいえ」、「日本語に直して考える:はい/いいえ」というように、学習者がどんな勉強の仕方をしていたかを聞き、その答えを蓄積する。
その蓄積データを利用して、ある勉強法をとっている人が1年後、別のある勉強法に変わっていると成績が上がる傾向がありますよ、というようにシステムから出したとすると、たとえば「じゃあ英語のまま理解しようとした方がいいんだな」と学習者は思うようになるのではないか。

3.2.3. 学習者の間違えている問題を自動的に収集する

学習者が間違えている問題をシステムで自動的に収集し、それらの問題間の関係を分析できれば、「この単元を理解するためには、この問題がちゃんと解ける必要がある」ということがわかるだろう。これを利用すれば、たとえば、ベクトルの問題がうまく解けない学習者に対して、「特に三角関数を頑張って勉強すること」といったことを推すことができる。

3.2.4. 学習者の勉強法を蓄積、かつ間違えている問題を自動的に収集する

学習者の勉強法が入力されて蓄積され、かつ間違えている問題を自動的に収集できたとする。現状の理解度がわかったとしたら、1年後理解度がこのように上がっている人は、実は今はとっていないような、このような勉強法をとっている、あるいはあなたのこの勉強法はいらないということが「推薦システム」からわかる。

3.3.「授業支援」における推薦システムの利用案
山田政寛(BEAT 特任助教)

3.3.1. はじめに

山田政寛 私自身も現職に就く前に5年間非常勤講師をやっていたため、その経験を基に考えたことがある。
授業という文脈で「推薦システム」の利用を考えると、教室の規模・人数の規模を考えなければならない。「協調フィルタリング」を扱った論文を読んでみると、簡単なシミュレーションなどの実験は100人、200人ぐらいのデータを使っていることが多い。人数が多いクラスであれば「協調フィルタリング」は有効かもしれない。しかし、特に国立大学では100人そろう授業はなかなか難しい。その場合は、比較的少人数でも耐えられる「内容ベースフィルタリング」の方がよいのかもしれない。
また、授業では、できるだけ正確なものを薦めないと学生の成績は伸びない。自分に合わないようなコンテンツを薦められても学生は困る。授業での「推薦システム」の利用を考えると、データの収集は明示的な方がよいのかもしれない。しかし、ずっと明示的なもので進めていくと、学生のモチベーションを下げてしまう。よって、途中から暗黙的に進めていけるものがよいかと思う。
ここでは、授業支援における「推薦システム」利用のアイデアをいくつか提示したい。

3.3.2. 学習進捗予想システム(教員への支援)

最近e-learningが増えており、特に1回も対面で学生と教員が会わない、という授業も増えてきている。その場合、教員が学習者のつまずきやモチベーションを把握することは難しい。そこで、学習者の履修している各科目の進捗や成績を蓄積し、学習者間の比較分析データから、活動学習者(アクティブユーザー)の未履修科目や進捗予測をして、重点的に支援が必要な学習者を示すことができれば、教員の支援になるのではないかと思う。

3.3.3. リスニング学習システムなどの外国語学習システムへの応用

私のバックグラウンドは、「外国語教育におけるITの活用」である。外国語教育では、Krashen(1985)が、I + 1という、教材などは、自分のレベルよりもちょっと高いものを与えることで学習能力が向上すると主張されている。またインプットが自分と関連性が高いものがよいという研究成果も多い。
そこで自分と興味関心が近く、さらにちょっとレベルが高い人の勉強している教材を提供するように「推薦システム」を応用できればよいのではないだろうか。

3.3.4. 自分より少しだけレベルの高い学習者のポートフォリオを見せる

先輩やレベルの高い学習者のポートフォリオを見せるという方法も考えられるのではないだろうか。成績や科目の好みが似ており、成績がちょっと上の人を抽出して、彼らのポートフォリオを推薦する。ただ、レベルが高い人のものをだらだらと見せたり、大きくレベルが高い人のものを見せても意味がないため、成功体験や「これなら私もできそうだな」というようなところを感じさせるために、徐々に成長を見せていけるような推薦になるのがよいのではないか。このような情報提示は、学習者が学習を継続させていくモチベーションにも関係すると考える。

4. パネルディスカッション

パネラー

  • 神嶌敏弘氏(産業技術総合研究所 脳神経情報研究部門 情報数理研究グループ)
  • 前田邦宏氏(株式会社 関心空間 代表取締役)
  • 北村 智(BEAT 特任助教)
  • 松河秀哉(BEAT 特任助教/大阪大学 大学教育実践センター 助教)
  • 山田政寛(BEAT 特任助教)

司会

  • 山内祐平(BEATフェロー/東京大学大学院情報学環 准教授)

まず基本的なところからいきたいと思うのですが、神嶌先生、「協調フィルタリング」とは「データマイニング」とどう違うのか?という質問が来ています。

神嶌敏弘 神嶌:どちらも統計的な予測技術を背景にしている点では共通だと思う。
「誰のために使うのか」というところが、「データマイニング」と本質的に違うところである。「データマイニング」の方は、マーケッターの人たちが、売る側の立場になって、どういうものが売れのるかをデータから考えるところに軸足がある。
それに対し、「協調フィルタリング」は、ユーザーさんを第一に考える、ユーザーにもっとも有益になるように考える。具体的には、「データマイニング」を使ったマーケティングであると、マーケッターの人にリポートを出さないといけないが、そういうことを「推薦システム」は考えない。「何々の条件がそろっていたらこういうものが売れますよ」という大きな塊を相手にしたようなことは、あまり「推薦システム」ではやらない、といったところが違う。

ありがとうございます。次に、前田さん、「協調フィルタリング」だけではなく、人と人とのつながりが新しい知恵を生み出していくわけですが、「ある程度人が集まって、しかもそれに対する志向性がある人が集まらないとなかなかサービスが始められなかったり、うまくいかなかったりするのではないか?これはどうやって解決したらよいのか?」という質問が来ています。

前田邦宏 前田:これは逆に教育現場で通常行っている状況を利用すれば、簡単に解決できるのではないかと思う。
僕は担当授業の最初で、齋藤孝さんの「偏愛マップ」をよく用いる。すごく簡単で、A4の紙を配り、グループを作らせて、自分の今の関心を、特に自分だから好きなものだと思うものを絵で書かせる。書き終わったら隣の人に回してインタビューし合う。「これ、何のこと?」「この音楽はどういいの?」「こういうのが好きなのね。」など。裏側にその人がどういう嗜好の脈絡を持っているか、その人の人となりを書かせる、ということを順番に繰り返す。そうすると、「出身地が一緒!」「私もこの本好き!」など盛り上がる。これはアナログですぐにできる。最後には自分以外の4人ぐらいが自己分析をしてくれるおまけがつく。どちらかというと相手を褒める形で分析するため、そのほめ方が自分のテイストに合っていると、その人との信頼関係が生まれる。「授業」という強制的に○○をやりなさい、という場所があればすぐそこでできてしまう。これを応用して、専用のネットワーク環境を作って、4,5人だけで盛り上がるのではなく、40名同時に30分以内でできるコンピュータインタフェースなどを作ればよいのではないかと思う。

確認のために質問したいのですが、最初はどちらかというと対面でやる話だったと思うのですが、ネットワーク上での対面ができるとするならば、いわゆる同期・非同期という意味で、同期型でみんなが最初に盛り上がるものがあれば、その問題は解決できるというお話ですか?

前田:僕の中では、一番近いのは物理で言われる「ランダムグラフ」である。たとえばここにボタンを10個置いて、それを2個拾って2個つなぐという行為がボタンの数に対して2分の1に達すると、ほぼ確率的につながるという。つまり、40名学生がいて20個の関心を書けば、半分くらいのリンクを作ることが恣意的にできる。

ありがとうございました。続いてBEATの助教3名への質問です。
教育の中で「推薦してしまっていいもの」と「考えさせるべきもの」があるのではないかという指摘が来ています。

松河:どういうデータから推薦データを作るかにもよると思うが、結局あまり難しい推薦はできないと思う。
アイテムと人、というペアを提示することになるため、結局のところ推薦に対する解釈は、学習者側でも必要になる。よって、提示する側であらかじめ提示する情報を作り込むというのも一つの方法かもしれない。

北村 智 北村:何を推薦するのかということで、「考えたら出てきそうなもの」を推薦するのか、「考えても出てこないもの」を推薦するのか、というところがまず大きい。たとえば、自分の行動パターンから得意でない問題を「協調フィルタリング」で見つけてくる、というシステムであれば、別に教えても問題はなさそうだと思う。
あとは、推薦して選ぶという選択が「取り返しのつくもの」なのか、「つきにくいもの」なのかも問題になる。進路選択のようなものを先ほど具体例で出したが、進路は一度決めるとなかなか取り返しがつきにくいものである。しかし、たとえば「こういう授業を受けてみたらいいよ」というものについては、それを受けてみても、それがクリティカルになるということはあまりない。授業を選ぶという段階のため、そんなに考えなくて、試しに行ってみたらよいかな、となる。そのようなものについては構わないと思う。問題に対する答えをすぐ教えるか教えないか、ということは、そもそも物事の教え方をどうするか、という議論に近いと思う。

山田:何を学習させるかを考えていくと、自然と何を身につけさせたいかが見えてくる。
よって、それを直接的に教えてはいけないので、もちろんそこはカバーする、見せないとか、システムとして実装しないという考え方がある。この観点を無視して、教育利用は考えられないため、システムを作る場合には、「何を学習させるか」をしっかり意識するのが重要なのではないか。

おそらく「推薦システム」や「協調フィルタリング」に特徴的なこととして、流行りみたいなものがあって、それを「売れているからいいんだ」と、個人の志向が特定のものに偏ってしまう恐れがあるのではないか?ユーザーの行動の評価に依存しすぎることによって、かえって上手くいかないのではないか?という指摘が来ています。そのあたりはどうでしょうか?

神嶌:その辺は、ゲーム理論を使った市場モデルにおいて研究されている。特に、暗黙的な評価で、商品を買ったことによってポジティブな評価に変えるというパターンを採用すると、そのパターンに陥る、いわゆるロングテールのようなことが起こり、寡占化が起こる、ということはよく言われている。

その解決策というのは何かありますか?

神嶌:明示的に聞くということを考えるか、あとはアルゴリズムを工夫して、よいものから順に推薦するのではなくて、リストの中のちらばり具合、商品群の散らばり具合を無理やり広げることによって、解消しようという工夫が最近は行われている。

前田:ゲーム理論に近いのかもしれないが、一番早く予測した人に最大のポイントを与え、フォロワーの配分を小さくする。たとえば早くベストセラーを見つけた人にはポイントを高くする、フォロワーとみなされる人はレートを下げる、などしてその目利きの集団を仮想的に作って、目利きの集団の中をフォロワーに見せる、というやり方もある。

ここからは皆様に聞きたいと思います。
「協調フィルタリング」をはじめ、インターネットでデータを取得することにおいて、今までに注目されていなかったデータを取ると、実はすごく新しい推薦が可能になるかもしれません。そういう意味で今までのネット上で取ったことはなかったが、このデータを取ったら面白いのではないか?というアイデアがあれば教えてください。現在の技術的な枷は外しましょう。

山田政寛 山田:前田さんのプレゼンに「存在感」のお話があったが、e-learningの研究でGarrisonが「社会的存在感」という言葉を使っている。簡単に言うと「その人が目の前にいるような感覚の強さ」を意味するが、近年はこの尺度を開発しようとする研究もある。これをうまく使って社会的存在感(笑いや感情的な言葉)を使えば、コミュニティが発生できるような助けになる気がしている。

松河:月並みだが、「生体情報」をいろいろ取っておくと、どういう時にどういう関心を持っているのかがわかるかもしれない。取れるものは何でも取っておけばよいと思う。たとえば、心拍・呼吸が考えている間にどう変動しているかをリアルタイムでとれれば、その人がどういう状態の時にどういう情報を提示すればよいかがわかるのではないかと思う。

北村:別に「推薦システム」に限った話ではないが、一番取れたらよいなぁと思うのは、「目の輝き」。たとえば子どもたちの「目が輝いている」といわれるものをデータ化できると面白い。いろんな人の言っている「目の輝き」が一致しているのかはわからず、妥当性・信頼性を保証するのが難しいが。

前田:今言われた話はほとんど実際に実験されているような話で、たとえばアメリカの「Wired」という雑誌の日本のオンライン版WIRED VISIONのトピックを見たところ、不審な動きを動画から検出する技術があったり、脳のストレスをfMRIからセンシングし、送信する情報の種類を変えるというようなことも実験されているらしい。つまり学習が無理なことがわかる状態で、情報を過度に送りつけるのは非効率だとか。画像からやる気のない人を見つけて注意するとか(笑)。

神嶌:何か予測技術をやっている者からすると、こういう特徴が取れたら、ということはあまり考えない。なぜなら、とりあえず簡単に取れるデータは何でも取っておいて、入れておけばよいか、その後はアルゴリズムでどうにか処理する、ということになるためである。コストがかかるものは、とりあえず取って、データを抽出して、駄目だったら止めればよいか、という発想でいる。

最後の質問に行きたいと思います。
今までお話してきたものはわりと、「こうした方がいいよ」「こういうよいものがあるよ」「こういう知らないものがあるよ」という形で、記述できる知識を推薦するものでした。知識ではなく、知恵を学びたい時にはどのような支援を行えばよいのでしょうか?
個々の知識でAという知識が分かったというだけでなく、それを駆動するような、もっと上位レベルで身に付けるべき知識の塊、態度、思考習慣、スキル等、複雑な人間の知の獲得に対して「協調フィルタリング」はどう寄与することができるのでしょうか?

松河秀哉 松河:1つ考えられるのは、ユーザーベースの「協調フィルタリング」を使って、こういう知恵を持っていそうな人がこの人だ、というように、推薦する「人」の部分で止める、というのはあると思う。

山田:先ほど、外国語教育をバックグラウンドに持っていると申し上げたが、学校で勉強したとして、外国に行って通用するかというと通用しない。英語に限らず、学んだことを社会的文脈・現場でどう使うかを考えた時に、知識を現場でどう使っているかの紹介をするのは一つの方法かと思う。

北村:「学習方略」というのもある種の知恵であり、それを無理やり質問項目に落としてデータを取ってきている。一つの答えとしては質問紙法を含む心理測定法を使って何とかする、というのがあると思う。
後は、言語データを踏まえると、「協調フィルタリング」は数字データに落とさないといけないため、言語データや質的情報を計量化する方法を応用する、その方法として「テキストマイニング」などを使えるかもしれないと思う。

前田邦宏 前田:知恵という定義かどうかは微妙だが、昔検索のスキルを向上させるという新書を読んだことがあって、その中で「Self-efficacy(自己効力感)」という言葉があった。小さな成功体験を基に自分の能力が伸びた感触を与えることで、それは検索技術においてもそうである。その本も、初めは具体的な検索方法について書かれていたのが、最後には精神論になった。言語化しにくいが、逆上がりできないひとに、道具を使って逆上がりをさせる経験を味合わせるといったノウハウがある。そういった擬似的ノウハウをたくさんデータベース化してみるのはどうかと思う。

神嶌:ほとんど禅問答になるが、知恵は顕在化した時点で知識になってしまうので、本質的には無理ではないかと思う。確か、ゴルファーが本を書いて、自分のスキルを文にしてしまったことでスランプに陥ったという話を聞いたが、本質的にはそういうことがあるので、言葉を介さずに知恵が伝えられることが実現するまでは、たぶん無理なのではないかと思う。

まとめますと、人間の多様性の話をする時に真っ先に思い浮かべたのが、古典ですが、1970年代にCronbachが出した「適正処遇交互作用」です。平たく言うと、みんな学び方も性格も違う、一人一人違うから、一人一人違う処遇をした方がパフォーマンスが上がるというものです。逆に言うと、どういう適性にどういう処遇をすればよいかに関してはかなりざくっとした形しかなく、個別の処遇をデリバーしようというのは、実は今までありませんでした。そこで30年ぶりに現れたのがこの「推薦システム」「協調フィルタリング」といったテクノロジーです。
つまり、何かを行う時に本当はもっとよいやり方があるのに、自分ではなかなか気付かない。であれば、他人から推薦・紹介されればよいじゃないか、という理解やその理屈はすでに30年前にあったものの、その方法は分かっていないままであったのです。
人間の歴史が始まって以来、これほど人の行動、考えていること、色々なことが1つのプラットフォームに乗った時代はないと言えます。革命的な状況が起こりつつあり、「あなたはこうした方がいい」という推薦にとどまらず、何か今までにないもの、知識創発的なことができるのではないかと思います。
ヴィゴツキーの話では、社会的な環境の中で学習は支援されます。ネットの中の膨大な人間の集合知は、上手にデザインすれば、ZPD(Zone of Proximal Development: 最近接発達領域)の代わりになるのではないでしょうか。
今まで、ZPDは一対一、あるいは数名の人間で支援が行われるものでしたが、それが生身の人間の代わりに、ネット上でフィルターされた集合知になり得ます。しかし、そのような技術は未だなく、我々が作っていかなければなりません。
もしも、数年後に何らかの技術が出てきた時に、「これはあそこで話していたことだったよな」ということになればうれしいです。新しいビジョンの実現のためにがんばっていきたいと思います。

山内祐平
テーマ

あなたに「ぴったり」な学びをかなえる技術
教育における協調フィルタリングの可能性を考える

BEAT(東京大学情報学環 ベネッセ先端教育技術学講座)では、BEAT Seminar「あなたに『ぴったり』な学びをかなえる技術 -教育における協調フィルタリングの可能性を考える- 」を開催いたします。

近年、Amazon.comなどのeコマースサイトでは、私たちの好みに合わせ、購買意欲を喚起する商品広告がなされるようになりました。これらのサイトでは、どうやって私たちに「これが欲しかった!」と思わせるものを推薦しているのでしょうか?
このような推薦技術を教育に応用すれば、学習者に最適な教材配信など、学習者が「ぴったり」だと感じるサービスにつなげられるかもしれません。

今回のBEAT SeminarではAmazon.comの書籍推薦システムでの実用例などで有名な"協調フィルタリング"に着目し、教育への応用についてみなさまと考えていきたいと思います。

みなさまのご参加をお待ちしております。

日時
2008年6月7日(土)
午後2時より午後5時まで
場所
東京大学 本郷キャンパス
情報学環・福武ホール(赤門横) 福武ラーニングシアター(B2F)
内容
1. 趣旨説明 14:00−14:10
山内祐平(東京大学 准教授・BEAT併任)

2. 講演 14:10-16:00
●推薦システムと協調フィルタリング(仮題)
神嶌敏弘氏
(産業技術総合研究所 脳神経情報研究部門 情報数理研究グループ)

●気になるがつながる場「関心空間」(仮題)
前田邦宏氏
(株式会社 関心空間 代表取締役)
▼休憩

●BEATスタッフが提案する教育応用のアイデア
北村 智・松河秀哉・山田政寛
(BEAT 特任助教)

3. フロアディスカッション 16:00-16:30
フロアのみなさまのグループディスカッションから、質問や意見を出していただきます。

4. パネルディスカッション 16:30-17:00
「つながりから学びへ、その方策は?」
登壇者
司会
山内祐平(東京大学 准教授・BEAT併任)

パネラー
神嶌敏弘氏(産業技術総合研究所 脳神経情報研究部門 情報数理研究グループ)
前田邦宏氏(株式会社 関心空間 代表取締役)
松河秀哉(大阪大学 大学教育実践センター 助教・BEAT特任助教)
北村 智(BEAT特任助教)
山田政寛(BEAT特任助教)
定員
180名
参加費
無料
懇親会
参加希望者(有料)

Prev

Next

PAGE TOP