AWSでAIに触れてみる
はじめに
私は1ヶ月に1度、社内で開催される勉強会に参加しているのです。
そして次の討議テーマが「AI」についてなんです。
なのでとりあえず気軽にAIに触れられるようなサービスはないかなーと探していたところ、Coopetの開発でも使っているAWSにもAI関連のサービスがいくつかあるということがわかりました。
今回はそんなAWSのAI関連サービスを紹介したいと思います。
(AWSのアカウント作成方法は今回は説明しません。機会があればそれも記事にしたいと思います)
サービス紹介
今回は機械学習以外のAIサービスについてご紹介します。
(機械学習系は次回以降やります)
Amazon Polly
AmazonPollyは24ヶ国語に対応し多言語文章を自然な音声で読み上げてくれるサービスです。
こんな画面にテキストを入力することで試すことができます。
男性声、女性声も選べるみたいですね。
またレキシコンという機能を使うと、発音をカスタマイズできるみたいです。
AWS CLIというCUIツールでコマンドラインから実行することも可能です。
例えば、以下のコマンドで「こんにちは」と女性の声で話すmp3ファイルが生成されます。
1aws polly synthesize-speech --output-format mp3 --voice-id Mizuki --text 'こんにちは' hello.mp3
実際に生成されたデータがこちらです。
アプリケーションからも呼び出して使うことができそうです。
(こちらのURLなど参照していただければ)
Amazon Rekognition
APIで利用できる画像解析ソリューションです。
物体と背景の検出や顔認識が行えるみたいです。
デモページが提供されていて、手軽に試すことができます。
試しにスティーブ・ジョブズの画像をアップロードしてみると…
Crowd(群衆)やAudience(聴衆)のスコアが高いのが気になりますが、Person・Human(人間)であることや、Speech・Lectureなどスピーチをしていることも読み取れているようですね。
APIのレスポンスとしては以下のようなJSONが受け取れるようです。
1{
2 "LabelModelVersion": "2.0",
3 "Labels": [
4 {
5 "Confidence": 99.79688262939453,
6 "Instances": [],
7 "Name": "Crowd",
8 "Parents": [
9 {
10 "Name": "Person"
11 }
12 ]
13 },
14 {
15 "Confidence": 99.79688262939453,
16 "Instances": [
17 {
18 "BoundingBox": {
19 "Height": 0.915002703666687,
20 "Left": 0.050240013748407364,
21 "Top": 0.05236506834626198,
22 "Width": 0.8705257177352905
23 },
24 "Confidence": 97.955322265625
25 }
26 ],
27 "Name": "Person",
28 "Parents": []
29 }, ...
例えばCoopetの開発においては、動物の写真であるかを判断して無関係な画像のアップロードを禁止することもできそうですね(本当にやるのはちょっと怖いですが…)。
Amazon Lex
自然言語理解と対話を行うサービスです。チャットボットってやつですね。
残念ながら、現状は日本語対応はしていないようです。
いくつか用意されているサンプルを開いてみた画面です。
詳しくは説明できませんが、受け答えの設定を左側のエリアに設定して、Buildをすると右側のエリアでテストができるみたいですね。
ざっと眺めた程度ですが、実装はなかなか難しそうな印象です。
おわりに
今回はAWSが提供するAI関連サービスのうち、機械学習以外のサービスについてご紹介しました。
機械学習については別途記事を設け、簡単なアプリケーションを作って、勉強会の討論のネタにしようかなと思っています。
それでは、今回はこの辺で。ここまで読んでいただき、ありがとうございました!