project:ishida

ニュースサイトによる人物や組織に関する記述の特徴分析

ニュースサイトの記述特徴とはそれぞれのサイトがよく見せる書き方・ものの取り上げ方といったもので、例として自民党に否定的な記述が多いや中国の毒餃子事件をよくとりあげるといったものがあります。 このような特徴をユーザーに知らせることで、ユーザーがニュースサイトでよくある記事や珍しい記事というものを判断でき、ユーザーのニュース理解を支援できると考えます。 記述特徴を分析するにあたって2つのアプローチがあります。 まず記事文内の主語目的語述語の関係に注目します。 記事文で人物や組織が主語や目的語で現れるとき、残りの語を人物や組織に関する記述として分析します。 そして2種類の特徴を計算します。まずニュースサイト内で記述が出現した頻度を計算しそのニュースサイトでよく出てくる記述を見つけます。 次に自サイトの記述の出現率を他サイトでのその記述の出現率の合計値で割った値を計算し、他のニュースサイトであまりでてこない記述をみつけます。 これら2つの値からそのニュースサイトの特徴的な記述を取り出します。 そして各サイトごとに人物や組織に対する特徴的な記述を提示します。

ishida.jpg

project/ishida.txt · Last modified: 2011/11/25 04:31 by ylab