TPTブログ

テックポート株式会社のブログです。 技術情報や製品・サービス情報、 また未経験社員がデータサイエンティストを 目指す奮闘記など、更新していきます。

AIとじゃんけんをしてみよう!

こんにちは。えーちゃんです。
この度いい感じのAIモデルができましたので、皆様にお裾分けしようと思います。

今回作成したのは「画像からじゃんけんのグーチョキパーを検出するモデル」です。
使う側でAIに正しく手を読んでもらう工夫が必要になりますが、
適切に使えばそれなりの精度で動き、ラズパイ上でも0.2秒程度で実行可能です。

このモデルを使ってじゃんけんができるスタックチャンを作ってみました。
とても可愛くて大満足です。

www.youtube.com

動作としてはラズパイ4にAIを搭載し、じゃんけんの判定をさせています。
スタックチャンはラズパイとBluetoothで通信し、掛け声やリアクションをします。
スタックチャンの音声はVOICEVOX:ずんだもんを使って作成しました。
ずんだもんボイスのちょっと強気な感じなスタックチャンも可愛いですね。

モデルの利用方法

githubリポジトリがあります。使い方はReadmeよりチェックしてください。
GitHub - yblue-alt292/janken_detector

モデル作成について

このモデルはyolov8に、hagridというハンドサインのデータセットを学習させて作成しました。
データセットからグーチョキパーの3クラスを抽出し学習させています。
github.com


使用上の注意点

データセットと私の技術力の都合上、読み取りに2点コツが要ります。
1. AI判定に使う画像に、手のひらが真正面に写るようにしてください。角度があると読み取りが失敗します。

2. グーをするときはなるべく手を画像のような、人差し指から小指のラインが床と水平になる感じにしてください。

ふだんのグーは人差し指から小指のラインが床と垂直になりますが、こちらは認識してくれません。

というのも、データセットに含まれるグーが、人差し指から小指のラインが床と水平になるグーだからです。
海外ではこちらがメジャーなのでしょうか?
AIには学習データにない画像はうまく判定できないという弱点があります。
そのため学習データにない日本式グーは認識してもらえない結果となりました。
日本式グーも読めるようモデルを調整できれば良かったのですがなかなかうまくいかず、断念してしまいました・・・
申し訳ありませんが、使う際は海外式グーを出すようにしてください。

海外式グー、手首がつりそうな感じになってわたしはとても苦手です。

おわりに

ここまで記事をお読みいただきありがとうございました。
このモデルを利用して、皆様がじゃんけんを楽しんでいただければとても幸いです。