岩堀研究室トップページ 岩堀研究室トップページ 名古屋工業大学 情報メディア教育センター
[  研究紹介  ]  メンバー   FAQ   地図   リンク   目次 
 ご挨拶   画像情報処理   仮想現実感  [  情報メディア教育  ]  最適化アルゴリズム   論文検索   用語集 

Education Asistance
レポート類似度判定システム 

情報処理などコンピュータを利用する講義の増加に伴い、レポートをコンピュータで作成して提出することが多くなっています。そのため、コンピュータに関する知識が少しあれば簡単に他人のレポートを複製できてしまい、講義内容の習得率が低下しやすくなっています。

この問題を解決するために、各々のレポートが他の学生のレポートとどのくらい類似しているかを判定するシステムを構築しました。このシステムを利用することで、また、このシステムの存在を知らせるだけでも、レポートの複製という行為の無意味さを学生に気づかせ、学生のやる気を促すことができます。

当システムは文書検索の概念を用いて、以下のような流れで類似度判定を行います。(単純な類似度判定の例)

  1. レポートを一つの文書とみなし、形態素に分解します。
  2. 形態素の中から、実際に類似度判定に用いる形態素を抽出します。
  3. 形態素ごとにtfおよびidfを取得します。
  4. tf・idfを用いて文書ベクトルを作成し、ベクトル間のなす角の大きさを変換して類似度とし、似ているかどうかを判定します。

右図は、実際に講義で提出されたレポート639部に対して、本システムで類似度を判定した結果です。

類似度0.0〜0.1にデータが集中しているのは、類似しているレポートが全体的に少ないことを示しています。類似度が1.0と判定されたレポートは170組でした。これらのレポートに関しては「あまりに似すぎていて、写したと考えられる」と判定できます。

639部のレポートに対する類似度判定結果
この研究に関連する論文 UPBACKNEXT お問い合わせ