頻出英単語をperlで扱いたい - 鈍足ランナーのＩＴ日記

Twien をさらに改造しなくては、英文ニュースのなかの難しそうな単語は予め英英辞典かなんかで調べておいてもらえるとうれしくないか？（日本語訳をどかんとだすのはなんか、私の目指しているのと違う気がするので）

なにが、難しそうな単語なのか判定する方法が必要になってくる。

ありました。BNCFreq.plというプログラムです。

ただ、IF的にファイルでのあつかいなのでこれをモジュールで扱えるように改造していきたいな。

うーん。英語の形態素解析をTaggerというらしい。とりあえず、Lingua::EN::Taggerをインストールしてみるかな。。

API公開している会社もあるみたい。でもいつまで公開されるかわからないものに頼るのも・・・