FC2ブログ

プロフィール

カロシー

Author:カロシー
はじめまして。
訪問していただき
ありがとうございます。
よかったらコメントと拍手お願いします。


最新記事


最新トラックバック


月別アーカイブ


カテゴリ


カレンダー

11 | 2010/12 | 01
- - - 1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31 -

本の中で使われた語句の出現頻度を検索「Google Books Ngram Viewer」

Googleはデジタル化した書籍の5000億語の出現、使用
頻度を検索できる「「Google Books Ngram Viewer」を
公開したようです。

グーグル、「Google Books Ngram Viewer」を公開--書籍中の語句使用頻度をグラフ化
 Googleは米国時間12月16日、特定の単語や成句がどの程度頻繁に書籍に出現しているかを過去5世紀にわたって追跡し、表示できるツール「Google Books Ngram Viewer」を公開した。

 Google Labsの研究者たちが発表した同ツールは、書籍のデジタル化という、時として論議を呼ぶプロジェクトをGoogleが2004年に開始して以来、1500万点以上という膨大な書籍をスキャンした結果を分析する。分析対象は、Googleが「コーパスのサブセット」と呼ぶ、これまでに出版された全書籍のおよそ4%にあたる500万点以上の書籍のデータだ。これら500万点以上の書籍に出現する約5000億もの語句を追跡することで、Ngram Viewerは過去に遡って言葉の歴史と使用頻度の推移を示してくれる。

CNET Japanより

Google Ngram Viewer
http://ngrams.googlelabs.com/

語句を入力するだけで検索できる、ということなので
「Japan」を検索してみると
ngramviewr1.jpg
こんな感じでした。大文字、小文字の違いで結果が
変わるようです。

1950年から2008年で検索すると
ngramviewr5.jpg
最近は減少傾向のようです。

「from the coupus」をスペイン語にすると
ngramviewr6.jpg
こんな感じで、やはり1990年から1995年の間に山があり
ました。

「Internet」を検索すると、1990年あたりから急上昇。
ngramviewr4.jpg


複数の語句をカンマで区切って検索できるようです。
「Tofu,Sushi」で検索すると
ngramviewr7.jpg
Tofuは減少傾向のようです。


グラフの下のリンクをクリックすると
ngramviewr2.jpg
その年代に出版された書籍が一覧表示されます。ngramviewr3.jpg


Just MyShop(ジャストシステム)


人気ブログランキングへ

 | ホーム |