人間をリアルにシミュレーションする技術

「デジタル・ヒューマン」という言葉をご存じでしょうか。コンピューターによるサービスをより身近にさせるテクノロジーで、近年急速に注目を集めています。

最近の代表例は、2019年末のNHK紅白歌合戦に“出演”した「AI美空ひばり」です。国民的歌手として親しまれた故・美空ひばりさんをAIとCGで復活させ、世代を超えて大きな話題を呼びました(あまりにも有名な方の模倣だったこともあり、同時に議論も巻き起こりました)。

「AI美空ひばり」は、ステージ上で歌うだけの一方通行の存在でしたが、もしも、お互いに話のやり取りができるとしたらどうでしょう? 今後大きな可能性を秘めているのが、こうした「デジタル・ヒューマン」です。 音声の認識と合成の技術、自然言語処理の技術で、無味乾燥なITサービスに「人間臭さ」を足すことで、共感を引き起こすことを狙いとしています。 類似のアプローチとしては、チャットボットがあります。コールセンターやウェブサイトなど、すでに多くのITサービスで使われています。質問を入力すると、蓄積した「よくある質問(FAQ)」から、適切な回答を提供する、といったものです。やり取りに関わる人の効率化や自動化を狙いとしています。 こうした狙いもあって、チャットボットでは、やり取りが無味乾燥になりがちです。決まったシナリオに沿って、決まったテキストを入力しなければスムーズに対応できない場合もしばしばです。 これに対してデジタル・ヒューマンは、より人間味を持ち、共感をもたらす対話を可能とします。単なる業務効率化ではなく、コミュニケーションそのものに大きな比重を置いていることが特徴となっています。
 

デジタル・ヒューマン実現への課題

とはいえ、デジタル・ヒューマンの実現は、容易なことではありません。

人間は何を手がかりに相手の意図や感情を読み取っているかご存じですか?心理学のある研究によれば、コミュニケーションにおいて言葉が占める割合はわずか7%なのだそうです。言葉の抑揚・声色(38%)や表情(55%)といった要素が、より重要な役割を果たすといわれています。

これと同じふるまいをデジタル・ヒューマンも再現できなければなりません。単に自然言語を理解して問いに答えるだけでなく、カメラでとらえた相手の表情から感情を理解し、例えば相手が笑っていれば笑顔を返し、悲しそうな顔をしていたなら「何かお困りごとがありますか?」と温和に問いかけるなど、その時々のシーンにあわせて自らの表情を変化させていく必要があるのです。しかも、この複雑で高度な処理をリアルタイムに実行できなくてはなりません。

加えて、出てくる議論が、いわゆる「不気味の谷」と呼ばれる心理現象です。人間に中途半端に近いデジタル・ヒューマンを目の前にすると、不気味さや嫌悪感、恐怖感を抱いてしまうともいわれています。つまり、リアリティが本物の人間とまったく同じレベルに達するまで、好感をもって受け止めてもらうことができないわけです。この課題の克服が非常に困難だったこともあり、本物の人間からは程遠いアニメのキャラクター、あるいは、それとみてCGとわかるアバターを意図的に使う場合もあるのだそうです。 
 

日本人の感性でデジタル・ヒューマンを繊細に作り込む

そうした中で3Dアナトミー(骨格からのモデリング)やスキニング(骨格の動きに応じてキャラクターをなめらかに変形させる)、レーザースキャニング(人間のモデルから3Dデータをサンプリングする)などの最先端のCG技術は、本物の人間と遜色のないほぼ完全な表情やふるまいを再現したり、ゼロから作り出したりすることを可能としました。これによりデジタル・ヒューマンは、いよいよ実用可能なレベルに近づいてきました。

現在では、デジタル・ヒューマンをクラウド型で提供する企業も登場してきており、大規模・複雑なインフラ要らずで、自社のサービスにデジタル・ヒューマンを組み込むことができるようになってきています。

実際に、富裕層向け金融商品のセールスアドバイザー、コネクテッドカーの車内アシスタントなど、さまざまなシーンへの活用が広がっており、例えばUneeQ社のデジタル・ヒューマンなどで実現されています。

もっとも、実際のITサービスにデジタル・ヒューマンを適用するためには、対象業務の多様なシーンにあわせて表情に感情を組み込んでいく、エモーショナル・マークアップと呼ばれるチューニング作業が必須となります。

このデジタル・ヒューマンの繊細な作り込みこそが、日本人の感性を最大限に生かせる真骨頂であると考えています。「仏作って魂入れず」を是としない私たち日本の文化は、造形物に対しても愛情を込めて育てていこうとします。

こうして日本で生まれ、広がったデジタル・ヒューマンのさまざまなサービスが世界に向けて発信されていく―そんな将来を日本人として夢みています。

 

※ 実際にエモーショナル・マークアップを実施して、デジタルヒューマンの繊細な作り込みをしていく過程については、ブログ「デジタル・ヒューマンに魂を入れるテクノロジーと工夫」でご紹介していますのでぜひご覧ください。

 

About the author

著者:吉見 隆洋 (Takahiro Yoshimi)
DXCテクノロジー・ジャパン CTO。製造業向けサービスならびに情報活用を中心に20年以上IT業界に従事。業務分析の他、各種の講演や教育にも携わる。東京大学大学院 工学系研究科 博士課程修了。博士(工学)、PMP

CTO for Japan 吉見のストーリーをtalentbookで見る

あわせて見る

Microsoft HoloLens 2を活用した遠隔業務支援 ~ ニューノーマルに向け需要が高まるXR技術

最先端デバイスとして注目される「Microsoft HoloLens 2」の活用事例を踏まえ、業務における活用方法や注意点を紹介します。

デジタル・ヒューマンに魂を入れるテクノロジーと工夫

デジタル・ヒューマンが自然に会話をするために取り入れられている様々な技術についてご紹介します。

デジタル工房

DXCのデジタル工房で、デジタル・ヒューマンのデモをご覧いただけます。