鈍足ランナーのIT日記

走るのが好きな5流のITエンジニアのブログ。

趣味の範囲は広いけど、どれも中途半端なクソブロガー楽しめるWebアプリを作ってあっと言わせたい。サーバーサイドPerl(Mojolicious)、クライアントサイドVue.js。Arduinoにも触手を伸ばす予定。

S3でstaticなページを配信する時の権限

S3で静的ページをホスティングする時。
S3への直接アクセスはさせず、CloudFrontを介して配信する。
そうしないと、DOS攻撃を受けてクラウド破産を招くかも?
S3で直接アクセスを許さないように設定するには、以下のように設定してみた。

S3の権限設定

f:id:kechiya:20200401141521p:plain

CloudFrontの設定

オリジン設定で
Create a New IdentityはYESを選択
Grant Read Permissions on BucketはYes, Update Bucket Policyを選択

新しいバケットアクセスのアイデンティティが作られてバケットアクセスできるようになる。

エンドウ君リリース作業

スナップエンドウ検出アプリエンドウ君のリリース作業をまとめておこう。

darknetjsのインストール

コンパイラを最新にしないとビルドが通らないので以下のツールのdevtoolset-7をインストール。
www.hpc-technologies.co.jp

インストール後は以下で有効化

scl enable devtoolset-7 bash


そして、darknetjsをインストール
www.npmjs.com

cmakeのインストール

ソースからインストールする
cmake.org
uchy.me

git 2系のインストール

blog.1q77.com

opencvのインストール

docs.opencv.org

ld.so.confの編集

qiita.com

opencv4nodejsのインストール

npm installでインストールする前に環境変数の設定

export OPENCV4NODEJS_DISABLE_AUTOBUILD=1
export OPENCV_LIB_DIR =/usr/local/lib64

メモリ不足発生した場合

qiita.com

スナックエンドウ検出アプリ作成中

連休は、ずっとスナックエンドウアプリしてました。

機械学習

自身のノートPC(MacBookAir2016 8Gメモリ)では100エポックで10時間かかることが判明。
Google Colab(GPU)でも、何時間もかかりしかもkillされてしまうので、無料タイプでは厳しい感じがしました。
できなくはないけれど重みファイルを保存して途中から繰り返せば、2週間くらいでは終わるとは思います。

データ作成部分のバグでした

元となるデータの作成部分がバグつていたため、学習に時間がかかっていたようです。
直したら、GoogleColabでは3時間程度で終わるようになりました。

サンプル数

サンプル数がとても少ないので集めるところをしっかりしないと。
収穫時に使うアプリなので、取った後に並べるとちょっとバリエーションが足りない感じとは思います。

f:id:kechiya:20200224101524p:plain

検出アプリ

Express+express-ws+darknet.js+opencv4nodejsという構成です。
プラウザでビデオ画像をサーバにWebsocketで送り、jpg画像をdarknetで検出して
検出したBox領域をopencvで囲って返すというアプリです。
エンドウではまだ動かせていませんが、darknet付属のモデルでは動くところまで確認しました。

Darknetでスナックエンドウをリアルタイムに検出する

スナックエンドウの学習については、ほぼ目処がついたので
フロント部分の開発にも着手。

darknetコマンドをnode.jsで発行して返してあげる必要があるけれど
マルチプロセスで対応する必要があります。
detectコマンドはデフォルトではpredictions.jpgを出力するので
outオプションで出力するjpgの名前を指定する感じにする予定です。現在コーディング中。

./darknet detect cfg/endo_kun.cfg  cfg/endo_kun.weights out.jpg -out xxxxxxx

Google ColabでDarknet学習。

yoloのcfgの編集方法

filterの数の編集をしないとエラーになります。
https://nmxi.hateblo.jp/entry/2019/02/28/104546

yolov3-tiny-train.cfgの編集

akifukka.hatenablog.com

学習用の定義はgithubで準備しておく。

%%bash
cd  darknet
rm -rf endo_kun
git clone https://github.com/dokechin/endo_kun
mkdir endo_kun/backup
./darknet detector train endo_kun/data.txt endo_kun/yolov3-voc-train.cfg yolov3.weights

瞬時に学習が終了してしまう。なんで?

Loading weights from yolov3.weights...Done!
Saving weights to endo_kun/backup/yolov3-voc-train_final.weights

stackoverflow.com

答えらしきものがありました。あらかじめ学習された重みファイルを使うときには、学習を飛ばす?
「-clear 1」をつけたらなんかうまくいく?らしい。とりあえずつけて動かしたらすぐに終わることはなくなりました。
<<追記>>そもそも、初期の重みファイルを指定しなければ、大丈夫でした。

出力される重みファイルのバックアップ先はgoogledriveにしておく

Colab側でマウントするとともにdarknetのbackupの値も、マウント先に変更しておく。
12時間ルールで消えてしまうため。

学習している間に、タイムアウトしてしまう

90分ルールというのがあるので対応をする。
今のChromeで使用するときは、
初回は短い時間でリロード時間を設定して、ダイアログで「はい」を選択すると
次回からはダイアログが出なくなるみたい。

qiita.com

VOTTの出力するJSONからDarknet学習用のTXTデータを作成する

VOTT->YOLO変換用プログラムの作成で参考にしたのは以下です
https://qiita.com/clerk67/items/faecbbbcbe26537cb42c

Darknet/YOLOで学習させる定義はオブジェクトの中心と幅高さを0-1に正規化したものが
必要。
YOTTからエクスポートしたVOCのJSON定義は、
画像のサイズや、オブジェクトの左上、右上、右下、左下座標がが出力されるのでそれから変換しています。

const fs = require('fs');
var path = require('path');

// アノテーションデータに含まれる全てのタグ(この順番にタグ番号を付与する)
const tags = ['flower', 'seed'];
const repo_name = 'endo_kun';

let counter = 0;
const trainLists = [];
const testLists = [];
const lines = [];
const files = fs.readdirSync(__dirname);
let j=0;
for (let i = 0; i < files.length; i++) {
  // カレントディレクトリに存在する全ての JSON ファイルを取得する
  if (!files[i].match(/\.json$/)) continue;
  if (files[i].match('package.json')) continue;
  console.log(files[i]);
  const data = JSON.parse(fs.readFileSync(files[i], 'utf8'));
  console.log(data.asset.name);
  data.regions.forEach((region) => {
    var columns = [];
    columns.push(...[
      tags.findIndex(tag => tag === region.tags[0]), // タグ番号
      (((region.points[0].x + region.points[1].x) / 2 ) / data.asset.size.width).toFixed(6), // 中心のx座標
      (((region.points[0].y + region.points[2].y) / 2 ) / data.asset.size.height).toFixed(6), // 中心のy座標
      ((region.boundingBox.width) / data.asset.size.width).toFixed(6), // Obj幅
      ((region.boundingBox.height) / data.asset.size.height).toFixed(6), // Obj高さ
    ]);
    lines.push(columns.join(' '));
  });
  const txt = './data/' + path.basename(data.asset.name, path.extname(data.asset.name)) + '.txt';
  console.log(txt);
  fs.writeFileSync(txt, lines.join('\n'));
  if ((j++ % 10) == 0) {
    testLists.push ( repo_name + '/data/' + data.asset.name);
  } else {
    trainLists.push ( repo_name + '/data/' + data.asset.name);
  }
}

fs.writeFileSync('./train.txt', trainLists.join('\n'));
fs.writeFileSync('./test.txt', testLists.join('\n'));nc('./test.txt', testLists.join('\n'));

スナックエンドウの実の部分を検出したい

やりたいことは1つの画像にある、複数の物体を位置とともに検出したい。
qiita.com

shibafu3.hatenablog.com

qiita.com

www.nakasha.co.jp

eng-memo.info

qiita.com

github.com

結論VOTTv2.1ではJSON形式の定義がはかれ、今の所、
変換ツールも公開されていなくて、そのままでは
darknetで学習することはできない。(2020年2月現在)