そのねこがうたうとき

物語偏愛者の詭弁と戯言

Amazon Echoはもっと「ながら」使いがしたい

スマートスピーカーはしばらく様子見するつもりだったんだけど、Amazon Echo Dotが「Prime会員なら3,980円」という予想外の低価格で出してきたので、ついポチってしまった。上位2モデルとの違いは音質とスマートホーム対応?らしいけど、音質の点で言えば、満足できなければBluetoothや有線で外部スピーカーに繋げることはできるし、Dotでも十分だと思う。

で、うーん、どうなんだ。使ってはみたけど便利なのかどうなのか。

個人的に、スマートフォンでも出来るようなことをあえてスマートスピーカーでやる利点は、「ながら」ができる点にあると思ってる。スマホはどうしても、目的の情報を見つけるまで眼と指をガッツリと占有されるため、マルチタスクには向かないというのは「歩きスマホ」の問題を見てもわかる。その点、スマートスピーカーであれば、朝の忙しい時間に食事しながら、化粧をしながら天気や交通情報が確認できるし、家族での団欒中に、一声で空調を入れたり、音楽をかけたりできる。

なんだが、こういった用途、Amazon Echoについてはちょっと弱くないかと感じる。まぁ単なるワガママかもしれないけど、基本的にEchoは「一問一答」で応えてくれるので、朝に天気、交通情報、予定を確認したければ、3往復の会話が必要になる。それだったらスマホを取り出した方が早いようにも思える。

あと、Echoはデフォルトの機能が充実しているというより、様々な企業やデベロッパーが提供する「スキル」を有効化して、要はスマホアプリのような機能の取捨選択ができるのだけど、それ故に「スキルを呼び出して」「欲しい情報を訊く」という2段階が必要になったりする。以下の画像はAndroidのAlexaアプリのスキル紹介画面だけど、例えばJR東日本ならこういう呼び出し方が求められる。

https://gyazo.com/770a555f91313d2dc7f05dca592bed9c

あんま嬉しくなくないか。てか長くね? 「JR東日本の」とかわざわざ言いたくなくね?? というかその単語が必要なんだって、いざってとき思い出せなくね?? 仕方ないか。仕方ないのか。しかしこれがNAVITMEだと「NAVITIME 乗換案内」「NAVITIME フライト情報」「NAVITIME 運行情報」を呼び分けなきゃいけなくて、さすがにちょっと笑ってしまったんだけど。

調べた感じだと、このあたりはGoogle Homeの方が気が利いているようにも見える。どうも朝は「Google、おはよう」と言うだけで天気、交通情報、予定なんかの「その日の情報」をずらずらっと喋ってくれるらしくて、それはなかなか「わかってる」感じだ。他にも「ショートカット」機能があって、よく使う機能を好きな言葉に置き換えたりもできるらしい。

スマートスピーカー、ともすれば「AIスピーカー」と呼ばれるように、「人工知能が魔法のようにいろいろやってくれるんだろ?」という機能面に注目が集まっているようにも思えるけど、自分としてはUX改善の方に力を上げて欲しい。声によるコミュニケーションって、コンピュータと相対しているという感覚を多少なり下げるはずで。だからこそ、自然な会話ができるかってのがすごく気になってしまう。

Amazon Echoはある程度こちらの発言を柔軟に読み取ってはくれるんだけど、それでも決まった発声というのがコマンド実行かのように求められるし、現状はAlexaが上手く動くようこちらが配慮してやらなくてはならない。そういう「道具を使っている」状態を抜け出して、もっと会話的に、何気なく「ながら」で使えるようになったらいいんだけど。

ちなみに機能面についても触れておくと、スマートホームやIFTTTで自分に合った使い方をカスタムしたいなと思っているし、むしろそれが真骨頂ではとも思っている。

IFTTTにはすでにAlexa関連のAppletがいくつか存在してて、Hey Alexa, call my device - IFTTTとか便利そうなんだけど、残念ながら日本語での発話にはまだイマイチ対応できてないっぽかったり。ただ、Alexaの「やることリスト」をTodoistに連携させる、といった発話を伴わない連携は有効なので、今はそれを使っている。部屋の中でふと何か思い出したとき、メモやスマホを取り出さずとも、Alexaに話せばTodoistに記録できるのがすごく便利。

スマートホームについてはHueなどの設備面への投資が必要なのですぐには実現できないけど、21世紀入って17年も経ってるんだからいい加減リモコン使い分けてポチポチ押して操作なんて古いよなー声でやりたいよなーって感じ。Hueだけでも買ってみようかと前から少し思ってるんだが、遊ぶ用途には高いのよな、アレ。

IFTTTやHueを繋げて、声で操作可能な範囲を増やせば増やすほど「高度に発達した科学は魔術と見分けがつかない」状態になるし、そういった機能の追加については現状でも難しくはないのだ。だからやっぱりUI、UXが大事なんだと思う。ディスプレイを伴わない、VUI(Voice User Interface)の設計が。