
パーソナルボイスは、Appleが今週発表したアクセシビリティ機能の中で最も期待される機能の一つでしたが、ほとんどの人には関係ないと思われたかもしれません。しかし、本日発表された新たなレポートによると、 iOS 17のリリース時には、誰もがこの機能を活用するべきだと示唆されています。
ALS(筋萎縮性側索硬化症)などの病気によって、言語能力の喪失は突然起こる可能性があるからです。自分の声に似た合成音声が必要だと気づいた時には、手遅れになっているかもしれません…
スティーブン・ホーキングのロボット音声から音声バンキングまで
故スティーブン・ホーキング博士が使っていた音声合成装置は、誰もがご存知でしょう。彼は単語やフレーズを選択して音声化することができましたが、その音声は非常にロボットのようなものでした。
次の大きな進歩は、Siri が使用するような、より自然な音声でした。
しかし、はっきりと話せなくなった人やまったく話せなくなった人にとって、最善の選択肢は、自分とまったく同じ声を出すことです。
これは、ボイスバンキングと呼ばれる技術を使うことで可能になります。一連のフレーズを話す際の音声を録音し、コンピューターシステムが音色、アクセント、イントネーション、タイミングを学習することで、あなたそっくりの音声を作成します。
音声バンキングは現在数週間かかる
従来の音声バンキングは手間のかかるプロセスです。通常、約1,500のフレーズを話す必要があり、費用と時間がかかります。
ALSに特化した非営利団体の理事フィリップ・グリーン氏は、音声バンキングの導入に数週間かかったとFastCoに語った。
4年前、フィリップ・グリーンが自分の声を記録した時、練習のために1500ものフレーズを録音しなければならなかった。これは大変な作業で、完了するまでに数週間かかった。だから、他の人がなぜその声に向き合うのを避けてしまうのか、彼は理解している。
「正直に言うと、『2年後、6か月後、あるいは4年後に必要になるかもしれない自分の声を保存するために時間を投資すべきだ』ということよりも、もっとたくさんのことが頭の中にあるんです」と、ALS患者を支援する非営利団体チーム・グリーソンの理事であるグリーン氏は言う。
チーム・グリーソンは、2011年にALSと診断された後に、元ニューオーリンズ・セインツ選手のスティーブ・グリーソンによって設立されました。
グリーン氏は続ける。
「皆さんはそんなことを本当に考えていないでしょう。でも、私たちがやろうとしているのは、人々に知ってもらうことです。診断が分かったらすぐに行動を起こしてください。なぜなら、それはいわば、使わなくて済むことを願う保険のようなものだからです。」
自分らしい声を使うことができるようになると、それは人生において非常に意味深い経験となることがあります。「家族に私の合成音声を聞いて、ロボットだと思われたくないんです」とグリーンさんは説明します。「でも、診断を受ける前の私と同じ人間だと思ってほしいんです。」
場合によっては、原因が分からないうちに声が出なくなってしまうこともあります。
母はALSとの7ヶ月に及ぶ闘病の末、12月に亡くなりました。彼女が最初に失ったものの一つは声でした。実際、正式にALSと診断された時には、声はほとんど失われていました。
パーソナルボイスは15分で効果を発揮します
Apple が Personal Voice で実現したのは、強力な AI システムを使用して、音声バンキングのプロセスをわずか 15 分で実行することです。
ユーザーは、ランダムに生成されたテキストプロンプトを読みながら、iPhoneまたはiPadで15分間の音声を録音することで、パーソナルボイスを作成できます。この音声アクセシビリティ機能は、デバイス上の機械学習を用いてユーザー情報のプライバシーとセキュリティを確保し、Live Speechとシームレスに統合されているため、大切な人と話す際にパーソナルボイスで話すことができます。
すべての処理はデバイス上で行われます
従来の音声バンキングに関する懸念点の一つは、サーバー上で実行されることです。そのサーバーがハッキングされた場合、誰かがあなたの音声ファイルを入手し、あなたそっくりの電話をかけられるリスクが生じます。
Apple のアクセシビリティ責任者である Sarah Herrlinger 氏は、同社がこの種のリスクを非常に意識しており、そのためすべての処理は Neural Engine を使用してユーザー自身のデバイス上でローカルに行われると述べています。
「アクセシビリティは当社の中核的な企業価値のひとつですが、プライバシーも同様です。どちらか一方を得るために他方を犠牲にすべきではないと考えています」とヘリンガー氏は言う。
Personal Voice は、発話障害につながることが知られている症状をすでに診断されている人々の時間と労力を軽減するだけでなく、痛みもほとんどないため、保険として誰もが行うのが理にかなっています。
Salesforce 幹部の Brooke Eby 氏も同意する。
ALSと診断された後、エビーさんはインスタグラムやTikTokで自身の経験を共有し、ALSについて他の人に啓蒙し、この病気や患者への影響について世間がもっと気軽に話せるように努めた。
コミュニティの人たちと話していると、「『もっと早くボイスバンクしておけばよかった』という声をよく聞きます」と彼女は言います。「中には、突然、ろれつが回らなくなってしまい、ボイスバンクするにはもう手遅れになってしまう人もいます。『どうせ私じゃないんだから、(一般的な)ロボットボイスを使えばいいんじゃない?』って思うんです」
私は間違いなくこれをやります。あなたはどうですか?
写真: Soundtrap/Unsplash
yiemt.com を Google ニュース フィードに追加します。
FTC: 収益を生み出す自動アフィリエイトリンクを使用しています。詳細はこちら。