昨年末に一般販売を開始したfinalのフラッグシップワイヤレスイヤホン「TONALITE」が、新たな音楽鑑賞方法を提唱している。世界初の音色パーソナライズ技術「DTAS for Personalized Timbre」を搭載し、個人の身体形状に合わせた “いい音” を試聴できるという。同社ではこれまでも「ZE8000」で同様の処理を行う「自分ダミーヘッド(JDH)」サービスを展開していた。DTASはそれをアプリで再現するもので、そこにはソフトウェアの長足の進歩も見て取れる。今回は麻倉さんと一緒にfinal本社にうかがい、株式会社final 代表取締役社長の細尾 満さんと、営業部プロジェクトリーダーの森 圭太郎さんに、注目技術誕生の裏側を聞いた。(まとめ・撮影:泉 哲也)

ワイヤレスイヤホン:final TONALITE ¥39,800(税込)

●使用ドライバー:f-CORE for DTAS
●通信方式:Bluetooth 6.0
●対応Bluetoothコーデック:SBC、AAC、LDAC
●連続音楽再生時間:最大9時間(充電ケース込み最大27時間)
●バッテリー容量:イヤホン本体100mAh/充電ケース700mAh
●防水性能:IPX4(本体)
※付属品:充電ケース、イヤーピース(FUSION-G S/M/L/LLサイズ)、アジャストリング(S/Mサイズ)、ダストフィルター、DTASキット(ARマーカーシール、ヘアバンド)

 「TONALITE」はfinalの最新ワイヤレスイヤホンで、同社が持つ高音質のための技術を多く盛り込んだモデルだ。
高いANC(アクティブノイズキャンセリング)機能を実現するために、SonySemiconductor Solutions製の最高クラスANC専用チップ「CXD3784」を搭載。有線イヤホンのフラッグシップモデル「A10000」で培った超低歪技術を投入することで、ハイエンド有線イヤホンをも凌駕する音質を実現した。

 さらに、世界初のパーソナライズ技術「DTAS」(Digital Twin Audio Simulation)を採用。アプリで身体をスキャンし、個人の身体形状に合わせた音を作成することで、超高音質な再生音をダイレクトに体感することが可能になっている。

TONALITEには、DTASの測定で使うためのアイテムも同梱されている。測定時は、写真の上側のヘアバンドにARマーカーシール(写真右側)を貼り付けて装着する。何回か測定する人もいるであろうことを考え、シールは複数枚入っている

麻倉 TONALITE(トナリテ、フランス語で音色)はfinalの新しいフラッグシップモデルとして、よくできた製品です。ノイズキャンセリング機能の搭載はもちろん、ハイレゾコーデックのLDACにも対応、自社開発の超低歪ドライバー「f-CORE for DTAS」も搭載するなど、finalの技術が惜しみなく投入されています。

 さらに注目されるのが、個人性適用技術「DTAS」です。スマホアプリで耳の写真を撮影、質問に答えていくことで自分の身体的な特特徴にあった音を体験できます。finalでは以前も「ZE8000」用に自分ダミーヘッドサービスを実施していましたが、あの時は測定や試聴などいくつかのステップも必要でした。今回それをアプリに落とし込めたのは、画期的だと思います。まずはDTASアプリ開発の苦労話から聞かせて下さい。

細尾 自分ダミーヘッドは麻倉さんにも体験していただきましたが、あの時は弊社まで足を運んでもらい、3Dスキャナーでの測定や試聴におつきあいいただく必要がありました。

麻倉 あれは結構たいへんでした。でも、自分ダミーヘッドサービスを試してみたいという方もたくさんいたそうですね。

細尾 弊社までおいでいただいた方もいらっしゃいますし、他にも耳形のデータ収集としてこちらからお願いしたり、トータルで600人を超える方の測定を行いました。

麻倉 それは凄いですね。でもあれだけ手間を掛けてひとりひとり測定するには限界もあります。しかし、今回のDTASなら、個人性適用を万人に解放できる。これは素晴らしい提案です。

細尾 ありがとうございます。アプリでの測定は、当初からの狙いだったんですが、一気に達成するのは難しいという判断でした。

イヤホン部は、バッテリーや基板などのパーツをすべて筐体の外側(耳の外に出る部分)へ集約し、耳への挿入部を極限まで小型化している。これにより、耳の小さな人でも圧迫感のない快適な装着性を実現している

麻倉 アプリによる個人性適用は、以前から別のブランドでも提案されていました。私も色々試してきましたが、正直効果があると感じたことは、残念ながら一度もありませんでした。それくらい難しい技術だと思っています。今回finalがそれを実現できた理由は?

細尾 イヤホンの個人性適応はアイデアとしては一般的で、全メーカーが取り組んでいくと思います。ただ実際に形にしようとすると、恐ろしいほどのたいへんさがありました。前回の自分ダミーヘッドの開発の際にも、社内の担当スタッフがみんな集まって、これはもうやめませんかっていう提案をしてきたくらいです。

麻倉 それくらい、たいへんだったということですね?

 忘れもしません、まさにこの部屋で直訴しました。開発者20名くらいで会議をしていたんですが、このサービスはしんどいし、実現は難しいだろうという話になり、細尾に現状を訴えることにしました。「そうだな、これはしんどいからやめよう」と言ってくることを全員が期待していたんです。

麻倉 測定作業そのものがたいへんだったんですか?

 作業というよりも、耳形のスキャンにしてもどれくらいの精度でOKにするのか判断が難しかったし、測定もこうするべきだという判断基準が定まっていなかったんです。それもあって、これは無理でしょうという話でした。

細尾 ここに来たら、みんな真面目な顔をしているから、これは嫌なことを言われるんだろうなと思ったんです(笑)。そしたら案の定、アプリの開発は無理だと思うということでした。そこで一人ずつ理由を聞いてみたら、言っていることは筋が通っているから、納得はできたんです。でもその理由が、原理的にできないという話じゃなかったんです。そこで、みんなが言っているのはたいへんだという話だよね、ということはたいへんな理由を解決すればいいよねと説得していきました。

麻倉 それはすごい! このリーダーシップは素晴らしい(笑)。

 そうかもしれませんが、我々としては困っちゃいましたよ。

個人性適用技術の「DTAS」は、専用アプリ「TONALITE APP」から操作する。スマホにアプリをインストールした後、TONALITEをBluetooth接続して操作すればいい(詳細は次回)

細尾 先ほど申し上げた通り、イヤホン/ヘッドホンを発売している会社ならどこも個人性適用[SS2]を研究しているでしょう。でもなかなか形になってないし、いいものには仕上がっていません。その理由は明確で、この技術には全体のすり合わせがひじょうに重要だからです。

 例えばR&Dや研究開発の人間は、ちょっとパラメーターを変えただけで、お客さんの体験が劇的に変わってしまうから、どこが最適なのか決めるのが難しい。仮にそこが決められたとしても、アプリのUIをちょっと変えるだけでうまくいかなくなってしまう場合もある。要素のどこを触っても、全体が変わってしまうのです。

 でも弊社は大きな会社と違って、担当者同士のコミュニケーションが密にできます。1人1人の研究規模だと大手メーカーに負けるかもしれないけど、みんなで情報を共有して結果を出すのは、むしろうちぐらいの規模の方が有利なはずだと思っていました。だから今回もみんなの話を聞いて、これなら頑張ればできると確信したのです。

麻倉 ひじょうに感動的なお話です。技術開発については、原理的にできないという話と、たいへんだからできないという話がありますが、後者については諦めなければ実現は可能です。今回もその好例だったんですね。

細尾 そうやって、たいへんな理由をひとつずつ消していったら、ZE8000に採用した自分ダミーヘッドが完成したわけです。

麻倉 そもそものお話として、なぜイヤホン/ヘッドホンで個人性適用が必要なのでしょうか。

細尾 数人で音を聴く時には、スピーカーの試聴なら同じスピーカーの音を同じように聴いて評価します。そこについては条件は同じで、あとは各人の嗜好によって感想が違ってくるということです。

 しかし、イヤホン/ヘッドホンの場合は身体の影響があるので、鼓膜に届く前に違った音になってしまいます。さらに、この影響は人によって異なりますので、イヤホン/ヘッドホンでは感想が一致しないんです。

 私がfinalを設立した時に目指したテーマがありました。第一がイヤホン/ヘッドホンの物理特性で、まずはそこをきちんとやるべきだと。その次に身体形状のアライメントがあって、その上に初めて音の好みの話が出てくるというものでした。音の好みと二段目のアライメントはハードウェアだけじゃ実現できないから、ソフトウェアを含めたデジタル信号処理が必要になるだろうとこの頃から考えていました。

優れたANC効果のために、イヤホンにはフィードフォワード用✕2とフォードバック✕1の合計3基のマイクを搭載する

麻倉 素晴らしい。イヤホン/ヘッドホンの開発で、このように論理立てて進めている会社は少ないんじゃないでしょうか。そこで問題になるのは、身体形状のアライメントをどう解決するかですね。

細尾 そのためには実験、検証が不可欠でした。そこで、2016年頃に私の鼓膜の極近の音を測定して、精緻に実験するといったことを始めています。

麻倉 社長自ら、自分の外耳道内の測定をしたんですか?

細尾 雇用関係のある社員だと色々問題が出てきますが、社長ならそういったことはありませんので(笑)。

麻倉 なんと、経営者もたいへんですね。それによって何が分かったんでしょうか?

細尾 まず、イヤホンやヘッドホンのターゲットカーブの検討をするために、インサーションゲイン(鼓膜位置でのスピーカー再生音とイヤホン再生音の音圧周波数特性の違い)について調べました。すると、インサーションゲインにも周波数によって独特の山谷があって、それらを精緻に調整しすぎると、嫌な音がし始めることがわかりました。

 もちろん測定誤差もありますが、インサーションゲインを完全になくそうとすると、ちょっとずれただけで、いわゆる不気味の谷現象的なものを感じたんです。あるところまではひじょうにうまくいくんですが、さらに精緻に調整していくと、すごくひどい音になる。もっと追い込んでいくと少しよくなりますが、結局そこで止まってしまったんです。

 そこで、効果が一番いいところはどこなのかを色々検証し、私たちなりのターゲットカーブを作って、今はそれを使っています。実は、インサーションゲインは、HRTF(頭部伝達関数)とも無関係ではないんです。

株式会社final 代表取締役社長の細尾 満さん

麻倉 これまではHRTFは万能で、個人のHRTFさえわかれば最適な臨場感が得られると言われていましたよね。

細尾 確かに、方向感の再現は良くなります。ですが、音色が悪化する場合があるんです。

麻倉 HRTFで音色が変わるという話はあまり聞いたことがありませんね。

細尾 そこからHRTFと音色の関係について研究していった結果、弊社のR&Dのスタッフが音の方向と音色の情報を、数理的に分解して考える方法を見つけたんです。ここが大きなブレイクスルーでした。このふたつを数理的に記述できるようになったので、狙った個人性適用が実現できました。

麻倉 数理的に処理できるというのは、数式に落とし込めるという事ですね。それを作れるというのは、相当頭の良い人ですね。

細尾 難しすぎて私には説明できませんが(笑)、麻倉さんもよくご存知の浜崎と、R&Dのスタッフが発見しました。

 ただ、2チャンネル再生で方向情報を入れすぎると音色が悪化するので、今回は音色にフォーカスしています。とはいえ、マルチチャンネル用の製品も検討していますので、その場合には方向情報のパラメーターも使っていく予定です。

麻倉 マルチチャンネルというのは、いわゆる前方定位の方向情報とは違うんですか?

細尾 2チャンネルでの定位は人の脳が認識して作り出していて、データの中に方向情報が含まれているわけではないんです。でも、マルチャンネル音源だったら方向情報が含まれているので、それを再生しましょうということです。

株式会社final 営業部プロジェクトリーダーの森 圭太郎さん

麻倉 finalの現行ラインナップには、イマーシブヘッドホンはありませんよね。これから発売するということですか?

細尾 検討はしていきます。ただ、イマーシブサウンドのバイノーラルレンダリングを独自にやるとすると、イマーシブサウンドのフォーマットを展開している企業の許諾が必要になる場合があるので、まずはこの辺りを検討していかなければなりません。

麻倉 それが実現して、様々なイマーシブ音源で方向情報までちゃんと再現できれば、正しい音場の体験が可能になりますね。他社のヘッドホンで聴くイマーシブサウンドも、本当に正しい再現ができているのかわからないこともありますからね。

 ちなみに現在のやり方だと、オリジナルの音色が再現できているということなんですよね。

細尾 そのはずだと考えています。逆に言うと、皆さんが本当に正しい音色が聴こえているかは、測定できないんです。今は、アプリで耳の写真を撮って、その特徴からどういう音色特性になるかを推測して、これなら数理的にも正しいはずだということで処理を行っています。この方法で、多くの方からいい評価をいただいているので、大丈夫だろうと思っています。

麻倉 そこが不思議ですよね。ZE8000のように耳の形をスキャンするなら納得できるんですが、写真でできるのが信じられない。

細尾 AIの機械学習的な処理も行っています。たまたまシミュレーションを専門にしている社員がいて、彼に頼んだらサクッと仕上げてくれたんです。案外簡単なのかなと思っていたんですが、他のスタッフに聞いたら、これは相当凄いことですと言われました(笑)。

麻倉 自分ダミーヘッドでは、3Dスキャンの結果からバーチャルダミーヘッドを作っていました。それは今回も同じですか?

細尾 バーチャルダミーヘッドの考え方は同じですが、今までのHRTFの推定の仕方とはちょっと変えています。そこも肝と言えば肝で、耳の画像から特徴量を推測して、それによってどういう音圧になるかを推測します。写真からの推測ですので、前回の3Dスキャンとはかなり違いますが、ここにAI的な進化も入っているわけです。

「DTAS」を体験して、アプリによる個人性適用技術を初めて評価したという麻倉さん

麻倉 そこまで出来たら、あとはアプリに落とし込めばいいと。

細尾 アプリにまとめるのもたいへんでした。アプリ制作チームには営業、デザイナー、R&D担当がいて、みんなでミーティングをするんですが、1回のミーティングで7時間くらいかかっていました。全員終電ギリギリでしたね。

麻倉 それだけ確認事項が多かったと。

細尾 それもありますし、アプリとして仕上がってくると、どうしても複雑なプログラムになってしまうんです。でも、これじゃ駄目だと思ったらすべてリセットして、いちからやり直ました。それが結果としてはよかったですね。

 彼らはその作業を1年半くらい、延々やっていました。

麻倉 その中でも、一番難しかったのはどういう点だったんですか?

細尾 サーバーやセキュリティの問題も難しかったですね。またUIも悩みました。UIが使いにくいとDTASを試してもらえません。最終的に好きな音を選んでいただく部分を含めて、何十回もUIを作っては壊しを繰り返しました。

 何の手引きもなしにお客さんが1人で扱える、さらに私たちが設計した通りの結果を得られるようにしなきゃいけないところが難しかったですね。

細尾 アプリのバグ取りも必要でしたので、外部の専門家にお願いしました。途中で操作を中断したり、ひとつの過程をやっている最中に、別の製品(イヤホン)をつないだりといった予想外の使い方まで試してくれたんです。

 また使っているチップの仕様まで遡らないと解決できないバグもありました。チップメーカーがなかなかそれを認めてくれなくて、論理的な証明とデータ検証も行ったんです。交渉をギリギリまで続けた感じでしたね。

※後編に続く