NTTの先端技術総合研究所である NTTコミュニケーション科学基礎研究所(以下、CS研)は、6月1日と2日の二日間、最新の取り組み(研究テーマ)を紹介する、毎年恒例の展示会「NTTコミュニケーション科学基礎研究所オープンハウス2023」を、大阪のQUINTBRIDGE(NTT西日本)で開催する。5月末には、それに先駆けた内覧会が都内で開かれた。

▼関連記事「人をより深く理解し、それを先端技術に活かす。「NTTコミュニケーション科学基礎研究オープンハウス2022」6月2日よりオンラインで開催」

 CS研では、人と人、人と機械の間の「こころまで伝わるコミュニケーション」をテーマに各種技術研究を行なっているが、今年のオープンハウスでは16のテーマで研究成果を展示・発表。そのうち5つの項目について、東京開催の内覧会にて、その詳細を説明してくれた。会の冒頭、同所の所長でもある納谷氏は、「科学と技術の両輪で、コミュニケーションの本質を読み解き、今の時代に求められる多様性も加味しつつ、脳のメカニズムの解明に迫っていきたい」と力強くコメントしていた。

▲CS研 所長 納谷 太氏

▲CS研の研究領域

「興味のある話題に聞き耳を立てる/意味で音声を分離抽出する新しい信号処理技術ConceptBeam」

 以下、今回の展示について順を追って紹介したい。まずは「興味のある話題に聞き耳を立てる/意味で音声を分離抽出する新しい信号処理技術ConceptBeam」。これは何度説明を聞いても原理の理解にたどり着かないのだが、技術としては、提示した「意味」にマッチする信号(ここでは音声)を取り出す技術になる。信号処理に意味理解を加味した、世界初のものになるという。展示では、複数の話者・話題が混じった会話の中から、意味=野球の選手の映像を提示し、それに付随する音声を取り出す、というデモを行なっていた。音声や画像認識ではなく、提示された意味に関する情報を高速に特定して抽出できることで、この情報過多の社会の中で、有益な情報の選択に有効に使える、としていた。

▲複数の話題が混じった会話(左の波形)の中から、プロ野球の選手の画像を提示し、それに関する話題(=野球の会話)を抜き出したのが右の波形になる

「生徒それぞれに適度なレベルの問題を出題します/Monotonic VAEに基づいた個別最適な問題推薦手法」

 これは、学生(生徒)ひとり一人の得意(あるいは弱点)な分野・ジャンルなどを簡単なテストに基づいて測定・分析し、個別学習に役立てるものとなる。簡単な設問に応えていくと、正誤・未解答といったデータから、個人の特徴が導き出され、それを元に、程よい難度の問題をおススメしてくれるので、学力レベルに応じた効率的な学習に役立つようになる、ということだ。

▲設問の例

▲設問に応えていくと、写真のような座標に結果がプロットされる。どの象限に入るかで分析が行なわれる

「離れていても柔らかく触れる?/遠隔操作ロボットにおける高追従低剛性制御の実現」

 展示内容は、まさにタイトルの通り。遠隔でロボット(ロボットアーム)を操作する際、追従性がよく(=遅れが少ない・正確に動かす)、しかも、対象物に柔らかく触れることを目的とした展示。これまでは、追従性と柔らかく触れる動作の両立は難しかったそうだが、人の意図を汲んで動かす技術・制御を開発、それを実現した、ということだ。遠隔医療や介護ロボットに貢献したい、としている。

▲もの(風船)に柔らかく触れることができるため、割れない、というデモ。従来通りの制御では見事に割れていた

「マグネットシェイプ/磁気作動式ピンディスプレイ」

 オルゴールのような原理を用いて、立体的な形状を作り出すピンディスプレイの簡素化を実現したもの。従来のピンディスプレイでは、ピンの動作のための機構が必要で、システムが大きく、複雑になってしまうが、本システムでは磁気を使うことで、より簡単にピンの動作を可能にしたのが特徴となる。冷蔵庫に貼り付けているようなマグネットシートに磁気で模様を描き(覚えさせ)、升目に入れたピンの底部に磁石を取り付けることで、その升目をマグネットシートの上を動かすと、磁力の反発によって、ピンが上下。その動きが模様を作る、というものだ。コストも抑えられるし、環境負荷も低減できる、としている。

▲短冊状にしたマグネットシートがベルトコンベアのように動いていて(←方向)、中央にあるピンの入った升目部分(ハウジング)を通過すると、ピンの底部に付けられた磁石が反発して浮き上がり、模様を作る。写真は「NTT」と表示されている(はず)

▲ピンの底に磁石がついている

▲マグネットシートは固定しておき、その上に磁石ピンを入れたハウジングを動かすと、シートに磁気記録された模様が浮き上がるというデモ。磁石を使ったお絵描きボードの立体版という感じで、子供用のおもちゃにしても面白そう

「細かな目の動きから心の動きを読み取る/瞳孔・眼球運動に基づくマインドリーディング」

 これもその名の通りの技術で、目の瞳孔の反応と動き(眼球運動)を測定することで、人の認知状態を推測しようという研究。さまざまな計測データの蓄積によって、反応(動き)と認知には相関があることが分かったそうで、これを進めることで、脳の深い理解=心の動きの分析につなげたい、という研究だ(と書いていても、なかなか理解が難しい)。

▲左右で聞こえてくる声の性別が異なり、例えば女性の声(左から聞こえる)に注目すると、目を動かしていなくても左に注目している反応(瞳孔の開き具合、眼球の動き)が見られるという

▲上記の結果を踏まえ、目の動きを計測することで、人がどこに、何に注目しているのかを推測することができるようになるだろう、としている

https://group.ntt/jp/newsrelease/2023/05/30/230530d.html