テービーテックのデータサイエンス

未経験リケジョがゼロからデータサイエンティストを目指す姿を記す奮闘記です。2019/12/05文系出身者が共同で更新を開始

TAG index

DSIT講座 豊田校1期が終了しました!①

f:id:tbtech:20191121151521p:plain
製造業特化型データサイエンティスト集中講座」豊田校1期は
2019年5月20日より始まり、11月15日をもって終了しました。
半年間にも及ぶ長い講座でしたが、内容の濃~い充実したものでした(*゚▽゚*)

今回は、講座の最後を締めくくる、最後の演習について
たっぷりご紹介しようと思いますので、お付き合いください(`▽´*)

PBL2

講座の後半ではPBL(Project Based Learning)を行ってきました。
PBL1は以前の記事でご紹介しております↓↓
ds-blog.tbtech.co.jp

PBL1では多変量時系列データを使った異常予測を行いましたが、
PBL2では画像データを使った異常検知をやりました!!

課題内容

お題は、製造ラインに製品が流れてくる場面で
製品一つ一つをカメラで撮影し、その画像から異常を発見しアラートを出します。
異常にもいくつか種類があり、欠け・傷・打痕の3つをそれぞれ検知します。
f:id:tbtech:20191120150724p:plain

採点方法

今回は4~5名のグループ毎の点数で競い合います!
・まずは、正常と異常を正しく検知できているか。
 更に、異常の3種類を判別できるとポイントアップになります。
・ラインに流す速さも変更できるのですが、5分で20個を目安に
 それ以上の個数を流すことが出来るか、も大切なポイントです!
・環境構築にかかった費用もポイントに影響します。予め用意された物以外を使用すると
 コストとして計上され、コストが1万円を超えるとペナルティとなります。
・間違った判定を出すともちろんペナルティになりますが
 異常な製品をOKと判定すると、より多くのペナルティが科せられます!
 製造業では大切なことですねー!

作業ポイント

グループで作業をするので、それぞれ作業を分担して進めていきますが
各作業の内容やポイントをまとめてみます!

教師画像の撮影

各グループにサンプルとして正常1つ、異常6つ(異常3種を各2枚)が配布されます。
それをカメラで撮影し、モデルの教師データとして学習させます。
撮影用にいろんな種類の照明や、照明の色を変えるためのカラーセロファン
工具も揃っているので自由に環境を作ることができます(*゚▽゚*)

f:id:tbtech:20191120170456j:plainf:id:tbtech:20191120170516j:plain

☆撮影ポイント!
・外光や部屋の照明からの影響を考慮
 外光は時間によって変化し、部屋の照明も場所によって明るさや向きが変わります。
 それらを考えて撮影しないと、教師データと実際のデータに差が出てしまいます。
・照明による反射や影を考慮
 コンベアのベルトは光が反射しやすく、ハレーションが起こります。
 ハレーションがあると上手く製品形状を検知できなくなってしまうのです。

ハレーションによる影響の詳細は以前の記事に書いております↓↓
ds-blog.tbtech.co.jp

データの水増しやアノテーションなど

配布されているサンプルはとても数が少ないので、データを水増ししたり
他のグループと交渉してサンプルを貸してもらったりします(゚∀゚ ;)
アノテーションは様々な種類がありますが、
今回は画像のこの部分にこんな異常があるよーと、四角で囲っていく作業のことです。
一つずつ手作業で行うので時間と労力がかかります( ˘ω˘ )スヤァ…

PLCの制御

製品を流す搬送装置を操作するために、PLCの制御を行います。
今回の演習はデータサイエンスの領域に留まりません(`▽´*)!!
搬送装置については以前の記事に書いております↓↓
ds-blog.tbtech.co.jp
コンベアの速さや、カメラの下に製品が来るまでの時間を調整したり
コンベア停止の信号を受けてカメラで撮影、推論のための停止時間の考慮も必要です。
PLCを制御するためのラダー言語を扱う練習にもなりますね(^^*)

f:id:tbtech:20191121153711p:plainf:id:tbtech:20191120173139p:plain

推論モデルの構築

今回の演習のメインとなるモデルの構築!
教師データをもとに学習をして、推論を行います。

☆モデル構築のポイント!
・推論に用いるアルゴリズムの選定
 今回は画像データの異常検知なので、用いるアルゴリズムは限られてきますが
 どんなアルゴリズムを使うかは全くの自由!
 講座で学んだものから、最新の技術を取り入れてもOK! 

・推論に用いるデバイスの選定
 推論するにも時間に制限があるので、どんなモデルでどんなデバイスを用いるかが
 時間短縮に大きく影響を及ぼします。推論中に固まってしまったら大変です(;゚Д゚)

判定結果を出力

流れてきた製品を推論し、その結果をどのように出力するかも自由です!
電子工作キットも準備されているので、LEDの光でアラートを表現したり
テキストファイル等に結果を出すのもOKです(o^^o)

f:id:tbtech:20191121144503j:plainf:id:tbtech:20191121155008p:plain



以上のような作業を今回の演習では行ってまいりました!!
かなり盛り沢山ですが、これを7週間(週2日×3時間)で仕上げます(^^;

果たして各グループの結果はどうなったのか???
それは次回ご報告します!!お楽しみに~~~(*゚▽゚)ノ~~