F8-4-1

聴覚障害者コミュニティに絶大の支持を得る音声認識アプリはいかにして開発されたのか? #1

「表現とケアとテクノロジー」をめぐる4つの対話 ③

聴覚障害者コミュニティに絶大の支持を得る音声認識アプリはいかにして開発されたのか? #1の画像

「障害は世界を捉え直す視点」をテーマに、カテゴリーにとらわれないプロジェクトを通して表現の捉え方を再考する活動に取り組む田中みゆきさん。「アート」と「ケア」の視点からさまざまな先駆的事業を実施している奈良県の市民団体「たんぽぽの家」が主宰するプロジェクト「Art for Well-being」に全体監修として関わっている小林茂さん。

本連載インタビューでは、障害者支援とテクノロジー実装の最前線に立つ実践者たちにたいして、二人が行った四つの対話を掲載していきます。対話を通じて、「誰のための技術か?」を多様な視点から深掘りしていきます。

第3回目は、リアルタイム音声認識アプリ「YYProbe」開発の中心人物である、株式会社アイシンの中村正樹さんにお話を伺います。「YYProbe」は、聴覚障害を抱える方のコミュニケーションを支援する目的で開発されたアプリであり、ろう者コミュニティから絶大な支持を得ています。前篇では、「YYProbe」が生まれた背景や開発のプロセスについてお聞きしました。

ライティング:宮本裕人
編集:山田兼太郎

Contents

    聴覚障害者との交流からうまれた音声認識アプリ

    小林 この対話シリーズでは、障害とテクノロジーをめぐるプロジェクトに取り組んでいらっしゃる方々から、田中みゆきさんと小林茂の二人でお話を伺っています。

    第3回は、リアルタイム音声認識アプリ「YYProbe」(以下、YY)をはじめとする一連のプロダクト開発の中心人物である中村正樹さんにお話を伺います。リアルタイム音声認識アプリは、AIの応用が定着している領域であり、先行するプロダクトも数多くあります。しかしながら、YYはそれらと比較して性能で優れているだけでなく、使い勝手が随分違うものになっています。おそらく、プロダクト開発の過程にその鍵があるのではないかと思い、お話を伺えるのを楽しみにしておりました。

    田中 私は普段、障害のある人と一緒にプロジェクトをやっていて、「YYProbe」のことを聞いたのも、ろう者の友人とご飯を食べているときでした。その友人は「最近はこればかり使っている」と言って、おもむろに携帯を2人の真ん中に置いて使い始めたんですけど、うるさい飲食店だったのに綺麗に文字起こしされていて、すごく驚いたというのが一番最初の出会いでした。

    障害のある人と協働するにあたって、多くの人が最初のハードルを高く感じられていて、当事者と出会えない、どう出会って進めていけばいいのかがわからないと、踏み出しづらい状況があると思っています。「関心はあるけれどもどうやっていけばいいのかわからない」という人に対して、何かヒントになるようなものが提案できたらなと思い、YYのお話を伺いたいと思った次第です。

    中村正樹 ありがとうございます。私たちのやっている音声認識アプリなんですけど、開発とか仕組みの作り方として、当事者の方との交流に何よりも重きを置いています。当事者の方に「これいいね」と思っていただけるものを、一番優先度高く開発しています。

    具体的には、LINEのオープンチャットを立ち上げていまして、ここに結構な人数の聴覚障害者の方が入っています。LINEオープンチャットランキングにも出てくるぐらいの書き込みがあって、このなかで「どんな機能がいる」とか「日常的にどんなことに困っている」とかを、心理的安全性がある状態で自由に話せるような場がやっとできてきました。

    私もそこに参加して、開発者の目線でいろいろ話を聞いて、「こういうのがあったらいいよね」という話を聞いてます。SNSを通じて機能を作っているのが、YYの特徴だと思っています。その結果、当事者が、自分の働く会社、近隣の自治体や学校に対して、「ぜひYYを導入してくれませんか」と話をして、ユーザーが使いたいという前提があったうえで私たちに問い合わせがくるようなプロセスになっています。

    田中 当事者がこうしたツールの開発チームに入っていないどころか、ツールの選定にも関わっていないことがほとんどだと思います。当事者が本当に何を求めているかわからないままに、非当事者の中で使われているものを何となく選ぶ流れになっています。それと比較すれば、当事者からニーズが上がるのは理想的な流れですね。

    中村 そうなんです。一般的に企業がこうしたサービスを作ると、たとえば人事担当者とか、情報システム部門に「こういうアプリがあるけど使いませんか?」と言って、当事者の声を聞かずに導入を決めてしまうことが結構多いと思うんです。だけど僕らは問い合わせがあっても、「社内の当事者の方の意見はどうですか?」と聞くようにして、当事者のニーズが確認できているところにしか契約をしないようにしています。

    残念ながら、当事者が何が必要かを、あまり重要視せずに決めてしまう傾向が強いなと思うんです。そこを変えたいなと思って、こういうスタイルをとった結果、ユーザーからダイレクトに意見が来たり、オフィスに来てくれたりする関係性が生まれてきました。開発チームとユーザーの飲み会もやっています。ユーザーとの交流がかなりたくさんあるプロダクトだなと思っています。

    聴覚障害者コミュニティに絶大の支持を得る音声認識アプリはいかにして開発されたのか? #1の画像
    中村正樹さん

    自動車部品メーカーがなぜ音声認識アプリを作ったのか?

    田中 そもそもの始まりのところを詳しく聞きたいのですが、アイシンという自動車部品メーカーが音声認識アプリを作ろうと思った背景を伺ってもよろしいですか?

    中村 私は秋葉原勤務なんですけど、アイシンは愛知県に本社のあるトヨタグループの会社です。製造業なので従業員数がかなり多く、連結で12万人ぐらいいます。それぞれが暗黙的な知識を持っているため、組織が縦割りになりがちで、情報の共有化ができなかったり、ヒエラルキー組織であるがゆえの仕事のやりにくさがありました。

    そのなかで組織の生産性をどう効率化するか、という課題が常にありました。役員と話すなかで、組織の上層部から見て、従業員が何をしているかが見える化され、その知識をみんながデジタルデータとしてシェアできるといいなと思ったのが開発のきっかけでした。そのためには、従業員一人ひとりがどういう経験をしているか、どういう感性を持っているかをデータにしていく必要がありました。その手段として、成果管理シートではなくて、日々話す生の声をデータにしたいという理由で音声認識アプリの開発が始まりました。

    田中 そうだったんですね。

    中村 というのも、たとえば、業績のシートって、いいことしか書かないじゃないですか。だから日常的な発話を取って、それを統計的に処理することによって、本当の一人ひとりの社員が見えてくるんではないかというところが、YYが生まれたきっかけなんです。

    だいぶ機能ができてきたところで、社内の聴覚障害者と交流していたときに、コミュニケーションツールとして「この音声認識を使いたい」という相談を受けたんですね。そのときに、僕は「はっ」としたんですね。聴覚障害がある社員にとっては、音声認識をベースにしたシステムを組んでも、結局一部の人にしか使えないデータになってしまう。つまり、やり方として間違っているということに気づいたんですね。

    音声をもとにした共有知識を作るためにも、まずは、社会的マイノリティの方が、そこに簡単にアクセスできて、平等にデータ化できる仕組みを最初に作らないといけないなと。それで、まずはコミュニケーション支援として音声認識アプリを普及させて、相手の言葉を音声認識で文字にすることで相互にコミュニケーションが取れる状態を先に作らないといけないと思ったんですね。

    田中 生の声を集めるという前提自体が公平ではなかったということですね。

    中村 聴覚障害者のことを当時はよく知らなかったんですけど、密に交流をしていった結果、そんな簡単に解決できる問題ではないことを知りました。聴覚障害と一言でいっても奥が深くて、いろんな症状やバックグラウンドをもった方がいます。もっと多くの当事者と接点を持って、彼ら彼女らの困ったことにアプローチしていかないと、やろうとしていることにたどり着けないなと。今はそこにどっぷりはまっているんです。

    聴覚障害者コミュニティに絶大の支持を得る音声認識アプリはいかにして開発されたのか? #1の画像
    YYSystemは、 主に障害のある方を対象に、声や音を見える化する独自のアルゴリズムをコアとして「意思疎通支援」を行うアプリケーションシリーズ。会話や複数での会議に役立つYYProbe」、聴覚障害のある方の日常をサポートする「YY文字起こし」、プロジェクターや透明ディスプレイなどに音声テキストを表示できる「YYレセプション」などのサービスを展開。

    さまざまな聴覚障害者へ対応するためのたゆまぬアップグレード

    田中 そうすると、事業として始まったというよりも、研究プロジェクトとして始まり、実績を作られていったんですね。

    中村 そうです。アイシンの社内に聴覚障害者の方が300名ぐらいいまして、会社全体を支援しましょうという話になり、社内で実証していくことになりました。そして、研究開発部署が開発したものをそのままアプリ製品としてリリースしました。当事者同士のつながりもあって、口コミ的に広がって、多くの方にご利用していただいてます(2025年9月現在180万ダウンロード)。

    田中 なるほど。アプリはろう者の方の発音でも対応できるんですか?

    中村 いま、ろう者の方の少し独特な話し方に関してはモデルを作ろうとしているところです。文章を読んでもらって音響モデルを作って、なるべく認識できるようなカスタムモデルを作ろうとしています。

    田中 それはとても重要ですね。一般的な音声認識のモデルは非当事者を前提に作られているので、当事者が発話した時に上手く認識されないのを見ると、いつも複雑な気持ちになります。

    中村 それでもやっぱり対応できるのが一部の方に限られていますので、いろんなマルチモーダルな入力に対応するためにはまだまだやることがたくさんあります。ChatGPTがマルチモーダルになってきていたり、ソフトバンクの「SureTalk」[★01]★01で手話の認識ができるようになっているので、うまく連携して、多様な方の入力を処理できるAIの開発が必要だなと思っています。

    またベーシックな音声認識はマイクロソフトと提携し、「Azure」[★02]★02という技術を使っています。我々はマイクロソフトのトップとも交流がありまして、Azure自体の音声認識のベースも、本国のエンジニアと一緒にカスタマイズをしているのも強みかなと思っています。あと、音声認識エンジンの利用料金もかなり安くしてもらっていまして、それでアプリを無料で提供できています 。

    実は、米マイクロソフトCEOのサティア・ナデラさんがこの取り組みにすごく共感してくれています。AIを高付加価値を生むためというよりは、社会的マイノリティの方が困っていることを解消するために使うべきだと。それでかなり協力いただいており、たくさんの文字情報をいっぺんに読めないAPD(聴覚情報処理障害)の方が、AIの要約によって読みやすくなるようにする実証実験も一緒に行っています。

    聴覚障害者コミュニティに絶大の支持を得る音声認識アプリはいかにして開発されたのか? #1の画像
    「YY文字起こし」の機能紹介

    社会の模範となる会社がやらなくてはいけない

    田中 一つ気になったのは、そうすると、収益事業という扱いではないということですか。

    中村 ただですね、いま結構法人の契約が増えてきておりまして、関連するセクション全部の人件費までにはいたりませんが、開発費や運用費はまかなえている状態です。社会貢献と事業化は両立が難しいと思うんですけど、一応両方やれている状態にはなってきました。

    小林 冒頭におっしゃられていた当事者からの導入依頼が、実際にちゃんと機能しているということですよね。

    中村 そう思います。アイシンの関連企業やトヨタグループ各社にこれを導入しようという動きもあります。そうすると、かなりの規模になってくるんですよ。社内の仲間とかグループの仲間に困っている人がいるので、その人たちがしっかり働けるようになると生産性も上がるし、企業の取り組みとしてもそういうのが求められているので、導入しやすくなってきています。

    障害者差別解消法の改正(2024年)も賛否あると思うんですけど、強制的にこうした取り組みを進める一歩かなと思っています。僕らとしては「法律が変わるので、上場している大企業やCSRに積極的な企業は、社会の模範として率先してやりましょうよ」という話をさせてもらっています。

    田中 グループのなかに聴覚障害の方が多く働かれてる子会社があると伺いましたが、そこではもう日常的に使われてるんですか?

    中村 アイシンにもグループ会社がたくさんあるんですが、ほとんど使っている状態です。透明なディスプレイのようなデバイスとつなげられるようにもなっていて、これもいま自治体やホテル、鉄道事業者などに広がっていっています。鏡にテキストを出せる技術も素材メーカーさんと一緒に開発をしていまして、これを使うと聴覚障害者の方が美容院に行けない問題にアプローチすることができます。こういうのもじわじわ広がっていくんだろうなと思います。

    「YYレセプション Window」

    ★01 SureTalkとはソフトバンク株式会社が開発した、手話ユーザーと音声ユーザーのコミュニケーションをより円滑にするサービスです。AI(人工知能)を使用し 手話と音声をリアルタイムでテキストに変換し、画面を通して会話ができるウェブツール。 ★02 Azureとは、マイクロソフトが提供するクラウドプラットフォームで、アプリケーションの構築、実行、管理を、インターネット経由で利用できる様々なクラウドサービスを提供している。

    聴覚障害者コミュニティに絶大の支持を得る音声認識アプリはいかにして開発されたのか? #1の画像
    中村正樹なかむら・まさき
    自動車部品メーカーの株式会社アイシンに勤務するiOSエンジニア。意思疎通支援アプリ「YYSystem」の開発リーダー。会話や環境音をリアルタイムで可視化・文字化する技術を通じて、聴覚障がい者や聞こえづらい人々のコミュニケーションを支援。ユーザーとの共創を重視した開発スタイルで、グッドデザイン賞金賞などを受賞している。
    競技用義足をつうじて、走ることの民主化をめざす(前篇)の画像
    田中みゆきたなか・みゆき
    キュレーター・プロデューサー。「障害は世界を捉え直す視点」をテーマに、カテゴリーにとらわれないプロジェクトを企画。表現の見方や捉え方を障害当事者含む鑑賞者とともに再考する。2022年7月から12月までACCのフェローシップを経てニューヨーク大学障害学センター客員研究員。2025大阪・関西万博 日本館基本構想クリエイター。主な仕事に、「ルール?展」(2021年、21_21 DESIGN SIGHT)、「語りの複数性」(2021、東京都公園通りギャラリー)、「オーディオゲームセンター+CCBT」(2024、シビック・クリエイティブ・ベース東京)など。主な書籍に、『誰のためのアクセシビリティ?』(リトルモア)など。
    障害は、テクノロジーによって、解決するべき「課題」なのか?
    小林茂こばやし・しげる
    情報科学芸術大学院大学[IAMAS]図書館長・教授。人工知能などのテクノロジーは、中立の単なる道具でもなければ不可避で抗えない決定論的なものでもなく自在に解釈できるものであると捉え、多様な人々が手触り感を持って議論に参加できるような手法を探求している。著書に『テクノロジーって何だろう?——〈未完了相〉で出会い直すための手引き』(ビー・エヌ・エヌ)、監訳書に『デザインと障害が出会うとき』(オライリー・ジャパン)など。岐阜県大垣市において隔年で開催されているメイカームーブメントの祭典「Ogaki Mini Maker Faire」では2014年より総合ディレクターを担当。撮影:丸尾隆一

    Recommend おすすめ記事