menu

利用者は5億人超、謎のAI企業の音声アプリが変える中国の風景

賃の支払いや電気代のことをカナダ人の賃借人に連絡しなければならない時、北京在住のシュー・ガンさん(46歳)は、スマホにダウンロードしてあるアイフライテック・インプット(iFlytek Input)というアプリを開き、マイクのアイコンをタップして話しかける。すると、ソフトウェアが中国語の音声メッセージを英語のテキスト・メッセージに変換し、カナダ人に送信してくれる。このアプリは、カナダ人が入力する英語のテキストメッセージを中国語に翻訳することもでき、二言語間でのコミュニケーションを可能にしてくれる。

中国では、ガンさんが抱えているようなコミュニーケーションの障害を乗り越えるために、5億人を超える人々がアイフライテック・インプットを利用している。運転中に音声コマンドでテキスト・メッセージを送ったり、異なる方言を話す中国語話者とコミュニケーションをとるためにアプリを使うユーザーもいる。アイフライテック・インプットを開発したのは、中国のAI企業、アイフライテック (iFlytek)だ。同社は、深層学習や音声認識、自然言語処理、機械翻訳、データマイニングなどさまざまな技術を応用してアイフライテック・インプットを開発した(「2017年版スマート・カンパニー50参照

裁判所では、長時間の裁判記録の書き起こしに、アイフライテックの音声認識技術を利用している。企業のコールセンターは、アイフライテックの音声合成技術を使って、自動返答音声を作成している。また、中国で人気の配車アプリ、ディディ(Didi)でも、ドライバーに向けた配車注文の通知にアイフライテックのテクノロジーが活用されている。

音声認識と即時翻訳の目覚ましい進歩がガンさんとカナダ人とのやり取りを可能にした一方で、言語理解と翻訳が機械にとってとても困難な仕事であることに変わりはない(「AI’s Language Problem」参照)。

ガンさんは、アプリによって誤解が生じた体験談を語ってくれた。賃貸契約の更新のために賃借人のサインが必要だったガンさんは、相手が仕事を終えて、サインをするために来ることができるのが、何時になるのか訊ねようとした。しかし、アプリで送信されたのは「今日は何時に仕事に行きますか?」というテキスト・メッセージだった。誤訳が生じたのは、恐らく「今日は何時までお仕事ですか?」という言い回しで質問をしたためだろうと、ガンさんは語る。「状況によっては、こちらの意図が正しく伝えられないこともあります」。そう語りながらも、今でもガンさんはこのアプリを頼りにしている。

ガンさんの体験談には、できるだけ多くのデータを現実の会話から集めることが、アイフライテックのような企業にとって非常に重要なことを表している。アイフライテック・インプットは無料で提供されており、2010年に公開されて以来、実世界で交わされるコミュニケーションのデータを収集し続けている。

アイフライテックの開発者プラットフォームである、アイフライテック・オープン・プラットフォームは、スマート・ホームやモバイル・インターネットといったさまざまな産業の開発者40万人以上に向けて、音声ベースのAI技術を提供している。アイフライテックの企業評価額は800億元(120億ドル) 。米国での子会社設立や、中国語以外の言語への対応に向けた取り組みなども計画しており、海外展開への意欲を見せている。一方で、中国国内では自動車運転、医療、教育など数多くの分野で、事業者とユーザーのコミュニケーションのあり方に変革をもたらしている。

iFlytek is headquartered in Hefei, China.
アイフライテックは中国の合肥(ホーフェイ)市に本社を置いている。

8月、アイフライテックはドライバー向け音声アシスタント「Xiaofeiyu(小さなトビウオ)」を発表した。運転中の安全性を重視して、スクリーンもボタンも付いていないシンプルなデザインだが、ドライバーのスマホがインターネットに接続されると、電話を掛ける、音楽を流す、目的地の方向を確かめる、レストランを探す、といった機能が音声コマンドを通じて利用できる。家庭用の音声アシスタントとは違い、Xiaofeiyuは騒がしい環境下でもユーザーの声が認識できるように設計されている。

人間とコンピューターの音声インタラクション技術の開発に取り組んでいるもう一つの中国企業、AIスピーチ(AISpeech)のミン・チュウ副社長は、ドライバー向け音声アシスタントはある意味でスマート・スピーカーやスマホ搭載型のバーチャル・アシスタントよりも期待できる存在だと語る。運転中は視界と両手が塞がるため、音声命令を利用することの合理性がより高まる。さらに、ドライバーが口頭による指示で要件を伝えることに慣れてしまえば、アシスタントは指示されたことを受動的にこなすだけでなく、コンテンツ・プロバイダーとなってさまざまな娯楽をすすめるようになるかもしれない。このように、新たなビジネスモデルが発展していくだろう。

人工知能(AI)を医療産業に応用すれば、コスト削減や治療効果の増進などのメリットが得られる可能性がある。しかし、医師不足でありながら多くの患者を抱えて既に疲弊している医療システムに、さらなる混乱が生じるのを恐れ、AIの導入に消極的な病院も多い。

AIを応用した実験を数多く実施している安徽省立医院では、音声ベースのテクノロジーが医療サービスに多面的な変化をもたらしている。女の子の姿をしたロボット型音声アシスタント10体が、アイフライテックのテクノロジーを利用して外来ロビーを訪れる患者に挨拶し、働きづめの受付係員の負担を軽減する。外来患者は音声アシスタントに自分の症状を伝え、何科を受診すればいいか訊くことができる。

6月から収集されたデータによると、音声アシスタントは84%の確率で患者を適切な診療科へと案内した。

安徽省立医院では、医師たちもアイフライテックを活用している。医師が患者のバイタルサインや処方薬、その他の情報をモバイルアプリにむけて口述すると、アプリが全ての情報を文字に変換し、記録してくれる。このアプリは声紋認識技術を署名システムとして使用することで記録の改ざんを防止している。アプリが収集するデータを基にして、アルゴリズムが徐々に改善されていく。

音声ベースのAI技術は、さまざまな場面でより便利に利用できるようになってきているが、根本的な課題は依然として残っている。北京大学で自然言語処理を研究するシャオジュン・ワン教授は、機械が自ら導き出した回答を理解しないというのがその課題だと語る。口頭で質問を受けたAIは、それまでに与えられた膨大なデータの中から関連のある回答を検索するして質問に答えるが、その回答が何を意味しているのかを実際に理解してはいないのだ。

言い換えれば、現在音声アシスタントを支えている自然言語処理のテクノロジーは、一連の決まりきった法則に基づいているのであり、そのためにガンさんが経験したような誤った解釈が生じてしまう。

音声ベースのAI機器は今後、日々の生活に欠かせなくなるだろう。機械による言語処理の手法に変革がもたらされれば、AI機器を開発する企業の手助けとなる。「自然言語処理の分野に突破口を開く企業は、大きな市場競争力を獲得することができるでしょう」とチュウ副社長は語る。(MIT Technology News)

SNSの炎上リスクを“チャンス”に変える 海外発の「おわび品配送サービス」

猛スピードで3兆円企業に!異色のCEOが導くAirbnb成長物語

関連記事

  1. 誰でもできる初めてのAI

    AIは誰でもできる、という記事があったので、試しに自分の環境で建てて見ま…

  2. ドイツの スタートアップ事情 スタートアップのハ…

    ドイツのスタートアップ事情欧州の中心的な都市の中でも比較…

  3. 豪州不動産事情

    2017年の後半ごろから不動産価格が低迷を始め、シドニーでもわずかながら1.…

  4. workstyle

    フランスから見た、日本の働き方改革に足りない視点…

    100年以上も続く、日本の働き方改革。その動きが活発化してきたことは歓迎しま…

  5. 30u30europegroup

    フォーブスが選ぶ30歳未満、欧州版で唯一リスト入…

    毎年、世界で活躍する30歳以下の起業家、イノベーター、アーティストたちが選出…

  6. トルコ空港

    トルコ・イスタンブールに新国際空港、世界最大規模…

    10月30日 AFP】トルコの最大都市イスタンブ…

  7. 日立システムズ、IoT機器へのサイバー攻撃を検知…

    日立システムズは、IoT機器を対象としたサイバー攻撃を組込ソフトで検知し、管…

  8. unicorn

    (後)未来のユニコーンを育む 世界のスタートアッ…

    2010年ごろからIT業界にはリスクマネーが供給されるようになり、自己資金や…

暗号通貨相場


最近の記事

  1. 登録されている記事はございません。

暗号通貨

bitFlyer ビットコインを始めるなら安心・安全な取引所で

為替コンバータ

ブログ更新をメールで受け取る

メールアドレスを記入して購読すれば、更新をメールで受信できます。アドレスは管理人でも知られません。

PAGE TOP