頻出英単語をperlで扱いたい
Twien をさらに改造しなくては、 英文ニュースのなかの難しそうな単語は予め英英辞典かなんかで 調べておいてもらえるとうれしくないか? (日本語訳をどかんとだすのはなんか、私の目指しているのと違う気がするので)
なにが、難しそうな単語なのか判定する方法が必要になってくる。
http://www.kilgarriff.co.uk/bnc-readme.html http://d.hatena.ne.jp/n_shuyo/20071128/vocabulary http://taichino.com/engineer-life/linux/365
ありました。BNCFreq.plというプログラムです。
https://metacpan.org/pod/distribution/WordNet-Similarity/utils/BNCFreq.pl
ただ、IF的にファイルでのあつかいなので これをモジュールで扱えるように改造していきたいな。
うーん。英語の形態素解析をTaggerというらしい。 とりあえず、Lingua::EN::Taggerをインストールしてみるかな。。
API公開している会社もあるみたい。でもいつまで公開されるかわからないものに 頼るのも・・・