Friday, July 03, 2009

Dave Kees Teach English In China: Google vs British National Corpus

Dave Kees Teach English In China: Google vs British National Corpus
英語を勉強するのに、コーパスを使うのはいいのか悪いのか。
Daveはひとつの答えを出している。
「BNC(イギリスの有名なコーパス)は、
Telegramなんていう昔の言葉のほうが、Emailっつー今当たり前の言葉より
多く出てくるんだよ。使えないね。Googleのほうがまし」
確かに。

コーパスは使い方次第でよくも悪くもなる。
たとえば下の問題なら、コーパスは得意だ。

「「条件を満たす」を英訳→"xxxx the condition"
xxxxに入る動詞を探したい!」

すぐさまsatisfy the conditionが出てくるはずだ。
Googleさんの単語クラスタリングの判断基準は、
「同じ文に出てくるもの」ってな感じなので、広すぎます。
コーパスのほうが狭いが厳密。

皆さん、使い分けましょう!

No comments:

Post a Comment