ナチュラル @rch850

ナチュラル丼発祥の地、福井からお届けします。技術的な話題とか、雑談とか。

Amazon Machine Learning vs. サザエさん

ずーっと使ってこなかった Amazon Machine Learning なんですが、そろそろ何ができるか知っておきたいと思い、触ってみました。

チュートリアルを流してみたら、CSV を与えると予測ができるようになるんだなということが分かりました。さてどういうデータを与えようかなと考えてたらピンときたので、サザエさんと対決させることにしました。

が、これ既出でしたね。だいたい Developer.IO さんの記事と同じことをしました。

Amazon Machine Learningでサザエさんじゃんけんを予測してみた | Developers.IO

注意点としては、S3 にアップロードした CSV を指定した次の Schema を指定するときにそのままホイホイ進むと、せっかく CSV の先頭行にいれたカラム名が無視されてしまう、というか、データとして入ってしまうということです。

h1,h2,h3,h4,h5,y
パー,グー,パー,チョキ,グー,パー
パー,パー,グー,パー,チョキ,グー
チョキ,パー,パー,グー,パー,チョキ
(以下略)

こんな風にカラム名を先頭に入れた場合は、この選択肢の Yes を選びましょう。どうもデフォルトでは No になっているっぽいので、最初はこれを見逃して予測結果に y という謎のデータが入ってしまいました。

f:id:rch850:20160625215438p:plain

ちょこっと CSV 作って予測ができる Amazon Machine Learning はなかなか面白いです。しかも安い!

料金 - Amazon Machine Learning | AWS

学習にかかった時間1時間あたり 0.42 USD、予測が100件で 0.01 USD 程度です。安い!ソシャゲのイベントボーダー予測ぐらいには使えそうです。