memorandums

日々のメモです。

多言語用例検索システム Kiwi

情報処理学会の学会誌に掲載されていた安達先生らの研究成果です。

Web検索エンジンの検索が膨大になると全てを見ることは不可能になります。そこで検索結果に現れる文章をsnippetと呼ばれる短い文字列に分解して、その出現頻度と文字列の長さ*1の掛け算して求めた値を降順に表示するという仕掛けのようです。

*1:文字列が長いキーワードの方が利用者には理解しやすいため