鈍足ランナーのIT日記

走るのが好きな5流のITエンジニアのブログ。

趣味の範囲は広いけど、どれも中途半端なクソブロガー楽しめるWebアプリを作ってあっと言わせたい。サーバーサイドPerl(Mojolicious)、クライアントサイドVue.js。Arduinoにも触手を伸ばす予定。

頻出英単語をperlで扱いたい

Twien をさらに改造しなくては、 英文ニュースのなかの難しそうな単語は予め英英辞典かなんかで 調べておいてもらえるとうれしくないか? (日本語訳をどかんとだすのはなんか、私の目指しているのと違う気がするので)

なにが、難しそうな単語なのか判定する方法が必要になってくる。

http://www.kilgarriff.co.uk/bnc-readme.html http://d.hatena.ne.jp/n_shuyo/20071128/vocabulary http://taichino.com/engineer-life/linux/365

ありました。BNCFreq.plというプログラムです。

https://metacpan.org/pod/distribution/WordNet-Similarity/utils/BNCFreq.pl

ただ、IF的にファイルでのあつかいなので これをモジュールで扱えるように改造していきたいな。

うーん。英語の形態素解析Taggerというらしい。 とりあえず、Lingua::EN::Taggerをインストールしてみるかな。。

API公開している会社もあるみたい。でもいつまで公開されるかわからないものに 頼るのも・・・

http://d.hatena.ne.jp/n_shuyo/20100205/irt