chikurin

2017.12.12

Alexaを使ってスキルを作りたい!

前置き

お久しぶりです。
最近綾波と浜風の改造が完了しまして、夕立と合わせて雷管キチ艦隊で遊んでいるちくりんです。
ちなみにルルイエ鎮守府に居ます。

今回は11月に国内でも発売されたAmazon EchoとAlexaについての紹介・概要のまとめ記事となります。
ライトな記事ですので、スキルの開発については既に参考になるサイトがありますのでそちらを参照してください。


さてAmazonの提供するスマートスピーカですが、11/9-10辺りに申請を出しました。
しかしながらこの記事を書いている12/12時点で未だにレスポンスありません。
見事なまでのKonozama組です、本当に有難うございました。
社内のガジェット好き面子の中では、僕よりも1日早くリクエストした方々が12月頭にブツを手にしており、煽られる日々をおくっています(誇張)。

当初スマートスピーカ自体はあまり興味がなかったのですが、スキルという形でサービスやソリューションを開発・連携する事が出来るという事を知り、面白そうなことができそうだったのでアレコレ調べてみました。

一番やりたいのは、Alexaの音声をゆかりさんや琴葉姉妹などのVOICEROIDと置き換えることなんですが、その辺りは公式がやってくれると信じてその上で走るスキルについて触れたいと思います。

ちなみにスキルの開発自体はブツが無くてもAmazonから提供されているシミュレータなどを使えば出来るようです。
が、Macに話しかけるのも切ないので、今回に関してはAlexaやスキルについての解説や紹介を行います。

Alexa概要

Wikipedia曰くAmazonの開発したAIアシスタントです。
AIアシスタントというと違和感ありますが、ざっくり言ってしまえば音声入力を解析して、適切なアクションを実行するだけです(だけと言ってもこの音声の認識やら意味解析が凄いわけなんですが)。

詳細については今回説明しませんが、仕組みとしてはAndroidのIntentによるアプリの連携がわかりやすいかと思います。
Alexaがユーザのリクエストを解析してIntentを発行。発信されたIntentに対応できるスキルがそれを受け取り、処理するという流れになります。

Alexa_Images.001.jpeg

アクションには2タイプ存在し、プリセットの定義済みアクションとユーザによって追加可能なスキルが存在します。

定義済みアクションは、天気やスケジュールの確認、ニュースの読み上げ、動画や音楽のコントロールなどが該当します。
音楽についてはAmazonMusicが対象プラットフォームとなるため、ホームネットワーク内のPCに存在するiTunesを操作するといった事はできないようです。
また、AmazonMusicへのアップロードする事でAlexa経由でのコントロールが可能となりますが、250曲までと制限されているため「俺の作ったプレイリストのこの曲を再生したいんだ!」など強いこだわりがある場合は微妙かもしれません。課金することでアップロード出来る上限を変えることも出来るようです。

Amazon.com Help: Ways to Listen to Music Media on Alexa

(余談ですがAmazonMusicにはFalcom系ならほとんどありますし、モンスターハンターや世界樹、Bloodborneなどのサントラもあるので、ゲームミュージック好きもある程度楽しめるかと思います。)

 

次はユーザが追加可能なスキルについてです。
Alexaは企業や個人が開発・公開している様々なスキルを以下のサイトから追加できるようになっています。

Amazon.com: Alexa Skills

今のところ日本語専用のサイトはありませんが、国内販売が決定した時点で250種類以上のスキルが公開されている様なので、専用サイトの公開も間近かもしれません。

アマゾン、日本語版「Alexa」スキルの一覧を大公開! いきなり「250種以上」のスキルが登場 | ロボスタ

 

ハードウェアについて

次にぼくがKonozamaされているハードウェアについて触れておきます。
国内では以下の3種がラインナップされており、Alexaを利用するだけならDotを用意すれば大丈夫です。

  • Dot:一番シンプル。Alexaとの対話用インタフェース(マイクとスピーカ)のみ
  • Echo:Dotよりもリッチなスピーカを搭載
  • Echo+:Echoにスマート家電のコントロール機能をつけたもの

調べるまで知らなかったのですが、所謂スマート家電を導入して遠隔操作を行なうためにはハブと呼ばれるハードウェアを購入する必要があるとのことです。
そのハブ機能を搭載したものがEcho+となり、ハブ自体が結構良いお値段なのでもしスマート家電の導入を考えているのであればEcho+の方がお得かもしれません。

スマートハブ その1
スマートハブその2

僕はワンルームのアパートに住んでいるので今のところEchoを購入する予定です。
Dotでも良いかなって思いましたが、これをいじりたいと思ったきっかけが、とあるAIが出て来るゲームの所為なんですが、そのゲームの主題歌がEchoだったのでそっちをリクエストしました。

Alexa Skill

さてメインとなるスキルについてです。

開発出来るスキルは利用するAPI毎にタイプが存在しています。
公式のドキュメント曰く3つだったのですが、開発コンソールには4つ目に”ビデオスキル”が存在しており、日本語ドキュメントの”スマートホームスキルAPIにおけるエンターテイメント端末の制御”の部分がVideoスキルに該当するようです。
日本語ドキュメントではリンクが死んでるのでビデオスキルに関しては英語ドキュメントを参照してください。

  • カスタムスキル : ユーザ定義、汎用のスキル
  • スマートホームスキル : 家電製品などの制御
  • フラッシュブリーフィングスキル : ニュースの再生
  • ビデオスキル : ビデオデバイスとの連携やストリーミング再生のコントロール

Understand the Video Skill API | Video Skills

それぞれのスキルについて少し触れておきます。

カスタムスキル

一番汎用的なものがこのカスタムスキルに該当します。
カスタムスキルを実行する際には、「Alexa、”スキル名称”をスタート」などと話しかけることで実行されます。
スキル名称は開発者が設定することが可能ですが、Alexa自身のコントロールの関係上、スキル名称には色々制約があるので注意が必要です。
また、人名や一般的な名詞なども不可能とのことです。
以下に気になった点についてピックアップしておきます。

  • リクエスト毎のトリガワードを設定出来る
    • ただしトリガワードとして識別し易いこと、競合しないことなどからちゃんとデザインする必要あり
    • https://developer.amazon.com/ja/designing-for-voice/
    • 〜を起動して とか 〜を実行して とかがAlexaの予約なのでムリっぽい
    • ビッグオー、ショータイムなどは可能かもしれない

スマートホームスキル

スマートホーム端末を制御するスキルを開発する場合はこちらになります。
こちらについては、コントロールが限定されるため(照明をつける・消すなど)、カスタムスキルほど複雑な設定は不要なようです。
コントロール対象となるデバイス毎に対応するワードを設定する必要があるので、端末がたくさんある場合などは少々手こずるかもしれません。

フラッシュブリーフィングスキル

Alexaのニュースの読み上げ機能に対応したコンテンツを提供する場合に必要になるのがフラッシュブリーフィングスキルになります。
ニュースコンテンツのテキスト読み上げだけでなく、画像や動画についてはAlexaのモバイルアプリを導入してる端末への配信などもこちらで行なうようです。

ビデオスキル

このスキルではAlexaを経由して対応するAV機器やクラウドに接続できるTVデバイスのコントロールが出来るそうです。
再生や停止などの操作はもちろんですが、コンテンツの提供に重点が置かれているようで、このスキルによって提供されるコンテンツをAlexaが把握し、ユーザの視聴履歴などの情報を加味して適切なコンテンツをチョイスしたりしてくれるそうです。
動画コンテンツ提供者の利用を想定しているので一般的なユーザがこのスキルを開発ことは少なそうです。

さいごに

いかがでしたでしょうか?

今回はAlexaとスキルの概要止まりでしたが、次回はカスタムスキルの開発について掘り下げた内容をお送りしたいと思います。
ちょっと想像以上に端末が届かないので若干テンション下がり気味ですが、引き続きよろしくお願いします。

 

関連リンク

Alexa Skills Kitによるスキルの作成 | ASK 

Amazon Alexa のスキルを日本語化する – Qiita 

アマゾン、日本語版「Alexa」スキルの一覧を大公開! いきなり「250種以上」のスキルが登場 | ロボスタ 

Amazon.com: Alexa Skills