AIの読唇術

読心術
読心術

 

AIの読心術レベルが人間を越えたということでニュースになりました。理屈で考えるとAI向きの要素が非常に高いので簡単に納得してしまいましたが、日々のAIの進化速度というのは凄まじいものがありますね。

[blogcard url=”https://www.google.com/url?rct=j&sa=t&url=https://gigazine.net/news/20161125-google-ai-lip-read/&ct=ga&cd=CAIyHGFlMGQ0MjQyNmJkYzAyNmI6Y28uanA6amE6SlA&usg=AFQjCNGGl1lOVJTrGWwIUZb-ivyhvzfQMg”]

 

映像を小回りのようにカットしていきその顔の動きと音声を合わせ言葉を抽出する。人間でも読心術は難しいのにこれが出来るということは音声変換よりも、簡単に言葉を具現化出来るので聴覚障害者の方々にはうってつけの機能になることは間違いありません。きっと次回のGoogleGlassのリリース時には、これらの機能も備わりリアルタイムで言語役ができるぐらいのレベルになっているんだろうなと非常に期待に胸をふくらませています。

 

一方で、

開発ではAIのニューラルネットワークに何千時間分ものBBCのTV放送で読唇術を学習させ、実際の発言内容の46.8%を正確に読唇可能なソフトウェアに仕上がったそうです。「46.8%」という数字だけ見るとそれほど画期的なソフトウェアではないように感じるかもしれませんが、AIが読唇した映像をプロの読唇術者が同じように読唇したところ、正しく言葉を拾えたのは全体のわずか12.4%のみで、AIがいかに高精度であるかがわかります。

上記のようなことが言われていますが、言葉の話し方は人それぞれ違い、口を大きく開けて話す場合もあればゴニョゴニョと口を開けずに話さない人もいるわけで、ある見方をすると実用に耐えるレベルではないのかもしれません。しかしながら、このニュースを聞いて喜んだ人はとても多くおられると思います。

 

テクノロジーの進化とは人を幸せにするものであると思っています。AIの進歩によって今後どれだけ多くのテクノロジーが進化していくのかは私には全く持ってわかりませんが、このような素晴らしい事例があがってくると私たちもSpeak BuddyというAI技術を世に広めていくことできっと世界を良い方向に持っていくことが出来るのだろうな。なんて、自らの仕事に誇りを持つきっかけになるような嬉しいニュースでした。とはいえ、Googleはやっぱりすごくて、同時になんでもやっていっちゃうから怖いなぁ((((;゚Д゚))))ガクガクブルブル と同時に恐怖も覚えています。

 

この記事が気に入ったら
いいね!しよう

最新情報をお届けします

Twitter でAISpeakBuddyをフォローしよう!

Leave a comment

メールアドレスが公開されることはありません。