音声業界は昨年からメジャーになってきており、音声認識システムも進み、音声サービスの開発のハードルも下がってきてるため、今後様々なサービスが生み出されると予想されています。
今回は、音声関連のB2Bソフトウェアスタートアップをご紹介し、今後ビジネスとどうかかわって行くのかをご紹介していきます。
音声サービスを特定のドメイン/レイヤーに特化させたアプリケーションの開発
音声認識エンジンを思いついて、そこから得た膨大な量のデータを収集する大企業と、価格の下落を促す規模の経済を持つ人たちと競争しようとするのは、おそらくスタートアップとしては最善の取りくみではないでしょう。 しかし、特定ドメインに特化したスタートアップは、これらの周辺の特定のデータを収集すると、Google、Amazonなどの一般的なエンジンよりも優れた結果を得ることができると予想されています。
Chorus.aiというサービスは、ビジネスのセールス部門に特化させ、会議の情報を録音、分析、音声読み上げなどをリアルタイムで行うことができるというサービスです。これによって会議の効率性をあげることができます。
音声ビジネスのドメインは以下の画像のレイヤーに分類されるとしています。
音声認識技術、これは20年以上前から研究が進められていた分野。そして次に「自然言語理解」、人工知能の自然言語処理の一分野であり、コンピュータに自然言語を理解(読解)または意図を抽出させるという試みであり、ニュース収集、テキスト分類、音声アクティベーション、アーカイブなどの大規模コンテンツ解析といった様々な応用があるため、商業化の面でも関心が強い分野のテクノロジーとして知られています。そして最後にアメージング!なUXUIを用いたアプリケーションの開発。以上3点です。グーグルホームやスマートスピーカーはこのUXUIを変えた革新者と言えるでしょう。
また、スタートアップが音声サービスにおいて、3つの例があると指摘しています。
①まずは、速さと効率性を重視したインタラクションについてです。Voxoは、企業向けのサービスで、普段の音声会話には、有用であるものの、活用されていないデータが豊富に保存されている中で、Voxoは、あなたの音声会話の貴重な情報を識別、コンパイル、視覚化するサービスです。顧客が求めていること、代理店はあなたの顧客に何を伝えているか、Voxoは、個々のインタラクションの詳細な詳細や、数百万の音声インタラクションの全体的な傾向を集約して把握するのに役立ちます。
②音声次にハンズフリーでエンゲージメントを発生させるサービスです。例えばAgvoiceというサービスは、農業むけのボイスインタラクションサービスを開発している会社です。
③そして最後、会話の透明化をはかるためのもので、先ほど紹介したChorus.aiというサービスは、ビジネスのセールス部門に特化させ、自動で会議の情報を録音、分析、音声読み上げなどをリアルタイムで行うことができるものは、これに該当します。
もしスタートアップが音声サービスを展開する場合、音声が他のインターフェイスより優れているユースケースを見つけることに加えて、その周りの優れたユーザーエクスペリエンスを設計することが重要です。
音声認識と、自然言語理解=NLUの部分に関しては、人間の会話を正確に認識して処理できたらかなりすごいことです。音声データは、既存のNLUモデルの基になっている文章(新聞、マニュアル、書籍など)とは大きく異なり、実際には、話し言葉ははるかに自発的、エラー、中断、躊躇などが記録に表示されるので、テキストデータよりもはるかに複雑で、句読点、空白、大文字小文字などがないため、理解が難しいとされています。
B2B2Cの音声サービスが最初に流行りそう?
AmazonのAlexa、AppleのSiri、Google Assistant、MicrosoftのCortana、SamsungのBixbyなどの音声起動アシスタントを使用する人数は6,050万人を超え、米国のインターネットユーザーの3分の1が2019年までに音声アシスタントに話しかけるとされています。
参照:Geomarketing
ZyngaがFacebookで行ったように、企業は、成長するプラットフォームを安価な流通チャネルとして活用することができます。ここでのB2Bのチャンスは、その製品の一部のプラットフォームを活用してB2C企業に役立つソリューションを提供することです。
スタートアップの良い例はCardiocube(→なぜか公式サイトがない?)であり、心疾患患者の在宅治療支援ツールを病院に提供します。彼らは、Amazonエコーまたは別の音声優先装置を介してデータを収集し、自宅で患者に尋ね、医学的なデータを医師のウェブベースのインターフェースで患者に提示しています。
しかし、B2B2Cの音声サービスを開発するにあたり、Amazon AlexaやGoogle Homeの上にアプリケーションを構築すると、アプリケーションの機能が制限されることがあります。たとえば、前のセクションで説明したように、独自の音声認識やNLPを構築することが難しいと言う点に加えて、Alexaスキルからだと、生の音声やテキストを得ることはできません。
音声エコシステムを活用したサードパーティ向けサービスの構築
ますます多くの専用音声デバイスが私たちの生活に入り、プラットフォーム(Amazon Alexa、Google Homeなど)の周りに構築されているため、私が音声空間でB2Bソフトウェアを立ち上げた場合の3番目の機会は、これらの新しい生態系に電力供給するための第三者サービスはくると思われます。これらのサービスは、分析、流通、広告、およびマーケティングの周りにあることが期待されます。
Amazon AlexaやGoogle Homeの開発者向けの音声体験分析機能を提供するVoiceLabs、開発者がコーディングせずに音声アプリケーションを作成できるようにする音声やストーリーラインのクロスプラットフォームアプリケーションを開発することを可能にするJovoは、この機会に取り組むスタートアップの例です。
音声サービスを立ち上げる際に見極めておくべきこと
まずは、サービスが爆発的な成長の出発点にあるかどうかです。
具体的な質問の1つは、サービスを使用する上で、明確なROIを持つ潜在顧客の数はどれくらいあり、支払う費用はいくらかどうか。
音声は、ほとんどの組織にとってまだかなり新しく、ほとんどの企業では、音声アプリケーションを社内で開発するための予算、時間、技術的スキルはありません。結果として、ROIが明確になると、アイデアを試して社内に移動するための第一歩として、サードパーティのサービスを利用することがあります。したがって、サービスにより、迅速かつ安価に、競争優位性を失うことなく、物事を行うことができるかどうかを理解することが重要です。
大きなプラットフォームには所有されない
AmazonやGoogleは現在、音声領域に大きな力を発揮しており、大きなプラットフォームがサードパーティのプロバイダに所有または開設しても構わないものを特定することが重要です。たとえば、Amazonは5月21日に広告ポリシーを更新した後、Voice Labsは広告ネットワークをシャットダウンする必要がありました。
つまり、アプリの配布においては、既存のグーグルプレイなどを利用せず、Aptoideと行ったような、ユーザーと企業が独自のApp Storeをセットアップして管理できる最大の独立したAndroid App Storeのような物を利用したほうが有効だと判断される場合もあります。これは、明らかにボイススペースのB2Bソフトウェアのスタートアップにとって興味深い機会の広範なリストではなく、多くのスマートな人々が他の大きなチャンスを特定したと確信しています。
参照:Medium