ARC Studio の話を聞いてどう思うか
なんか盛り上がっているようなので便乗したいと思います。
今日は家族が妻以外全員ダウン + 妻が外出しているので、子どもたちをリビングで寝かしつけしつつ、メールの返信しつつ、時間があるので、つらつらと勝手な持論を展開したいと思います。さっき耳鼻科行ってきました。激混みでした。皆さん体調管理には十分ご配慮を。
気づけば子どもたちをお風呂に入れて寝かしつけしながらまだカキカキしています。
特に音響知識の裏取りをしっかりしているわけではなく、あくまで個人的な感想を書いているだけなので、適当に流し読みしてください。
該当製品はこちら (アフィリエイトなし)
https://www.ikmultimedia.com/products/arcstudio/
IK Multimedia ARC Studio
音場補正? メーカーサイトを見ると、モニター環境をよりよい環境へ、という文句が見えるので、スピーカー補正とも捉えられるけど、まぁ音響補正ハードウェアってことでいいでしょう。
こういう製品は FOH でもずいぶん昔から常用されていると思いますし、レコーディングの現場や MA の現場でも規模が大きくなるスタジオでは導入しているところはありました。
たぶん、皆さんが知らないだけで超業務レベルで存在してました。特に映画のダビングステージだと必ずありました。
ただし、お高いとか、設置が難しいとか、専門的な知識や測定が必要だとか、非常に敷居が高かったのです。
そして現在の世の中になって計算コストや測定コストが大幅に下がったので、コンシューマーでも実現してきたということです。
Trinov というシステムは Dolby Atmos 以降、結構聞くことが増えたと思います。お高いやつです。
お前らこれ $299 だぞ!?
現在の円安の影響で日本円で測定マイク付きで 52,800 円くらい (私は価格をチェックしてない) らしいけど、$299 ってところにやっぱいろいろ思いを馳せるべきでしょう。
これは「安い、高い」という話ではなく、今までの音場補正のハードウェアを考えたときに IK Multimedia というイタリアの老舗メーカーが実用レベルだと判断した製品を市場に投入してきたという、背景を考えるべきだとは思います。
他の業務向け音場補正のソフトの値段やハードウェアの値段知ってます?
こいつ、めっちゃ安いんですよ。今までの常識からすると。SoundID はソフトウェアと測定マイクで今いくらですか? ハードウェア付いてくるんだから驚きです。
やっぱこそ考えるべきですよね。超個人的な意見ですが、そういう背景を知る自分は企業努力は褒め称えるべきであると思います。あとは好き嫌いの問題じゃないかなぁ…
いいか悪いかじゃねぇ!需要があるかどうかだ!
ここ最近の IK Multimedia 製品ってなんか日本市場やベッドルームプロデューサーにドンピシャな製品多いです?
味〆たのかなってって思うくらい、多い気がするのは個人的な体感。多分、小回りの効くスピーカーを出してから補正系のアプリやスピーカーに全振り感ハンパないですよね。
そう…考えましょう。
299 ドルもする?
299 ドルしかしない?
その感想は ぶっちゃけあなたの財布事情でずいぶん変わる ので、この議論は殆ど意味をなさないと思います。
ARC が Version 4 まで出ているので、悪い製品ではないでしょう。私は ARC3 を試したことがあり、普通に内容を理解していれば実用的だと思います。まぁ書き出しミスとかやらないようにね。
買い物とは自分が良ければすべて良しなのだ
価格の価値観や製品に対する価値観とかは共有が難しいけど、自分にとってこの買い物は得るものがあったと思えればそれでいいのだ〜♪
あーだこーだいうことになにも罪はないです。たぶん。ただし、問題は「買うときに誰の意見を参考にしたらいいのだろうか」とか「正しい背景知識があるかどうか」や、こういう「音響補正に対する経験値があるどうか」は情報収集や購入の決断には必要になる。
あと、もちろん、自分と意見が違う人がいてもいいし、反論するのは全然いいことだと思うんだけど、反論意見を言われると「人格否定された」と被害妄想しちゃう人もいたり、実際に人格否定というか、だからあいつの意見は参考にならない、とかあいつの意見を聞いてはいけない、という思考を表に出してはいけないだけでしょう。
単に嫌うのはいいと思います。私自身、めっちゃ嫌われていると思いますし。だた、それは表に出さなければいいこと。
開示請求されちゃうぞ♪
あと、大体みんな同時刻に ARC Studio のレビュー動画が上がってて、僕はニヤニヤ。
音響補正の個人的な知見と意見
以降は音響工学の話をしても、それは教科書の写しとなるので、音響補正をしたときに、個人的に考えなくていけない事柄を羅列しようと思います。
そして、すべてにカウンターイシューを投げたいと思います。思います。
ディップが多い部屋は良くない…?
確かにそう思うかもしれないけど、ディップが存在しない部屋は「無響音室」となるため、そこを目指すのは非現実的であるのです。ですので、普通の環境の方はディップをそこまで気にする必要はないと思います。
± 12 dB とか最大/最小の上下値で 24 dB の差があると、ちょっとそれは問題ありだから対策考えたほうがいいと思うよ…とかあるとは思うんですが、最低限の吸音と防振の対策はできるけど、そちらのほうがお金がかかるし、現在の住環境の場合、退去時の原状復帰というものがあるので、難しいの一言しか感想が出てこない人も多いでしょう。
超郊外 (ド田舎) で外来ノイズがほぼなく、ポツンと一軒家住みが最強一択となります、たぶん!
解決策 .1
そもそも部屋の大きさに合っていないスピーカーの大きさや出力音量があるので、スピーカー選びが間違っていた可能性があります。部屋の大きさに合わせて適切な大きさのスピーカーを選ぼう。
なぜかというと、高級なスピーカーになればなるほど、もちろん小音量でもスピーカーの素晴らしい特性を維持すると思うのだが、そんなスピーカーをわざわざ 6 畳一間の部屋に置かないでしょう…? え?俺の部屋は貧乏人じゃあるまいし 12 畳以上はある…? それでも 5 インチ、6.5 インチが関の山では…?
数値だけ見るのであれば、スピーカーの特性試験の dB SPL 値がすでに日本の一般的な都市部の住環境で出せるレベルの音量ではないんですよね…まぁこの辺はスピーカーによるとしか言えませんが。
もちろん、スピーカーの距離が離れるほど、視聴スポットでの音量は減衰するために、小さいスピーカーで出来るだけ音量のスポットを探して鳴らせられるか、のようなチキンレースじみたことになるのはたぶん、みんなわかっていることでしょう。
普通のご家庭や現代の 1 ルーム住環境でスピーカーの測定音量 85〜90 dB SPL を達成するのは並大抵のご環境をお持ちの方ではないと難しい。近隣住民への配慮など考えたら、小さいスピーカーでなるべく小さい音量で、が基本になると思います。
一例ですが Dolby Atmos は 85 dBC を各スピーカーから確保しなくてはいけません。もし同時にたくさんのスピーカーが鳴る場合、普通に騒音ってレベルじゃない音が出る場合があります。映画館かよってレベルで鳴るはずです。もちろん、LUFS の規定があるので、上限値はあります。
そうなると、音響測定値がそもそも意味をなさない。
測定はある程度の音量を出して測定するため (ARC Studio は知らないけど)、そこまで大きな音を出して測定しても実際の利用音量よりディップが少ない、ということは往々にして起こるからなのです。そして音量によってスピーカー特性が極端に変化するものもあるでしょう。そうなったらもっと測定値が役に立ちません。
当たり前ですが、冬場と夏場で若干異なるでしょうし、一番はその日の自分の環境というか体調でも劇的に変化します。
ARC Studio は入力レベルは下げないといけませんし、おそらく EQ を適応すると同義のものなので、出力レベルはもっと下がる可能性があり、実は自身が決めた規定音量レベルを維持管理することは結構面倒そうです。
私の自宅スタジオのスピーカーに 最大 +24 dBu で出力、-20dBFS を出力すると 90 dBC 音がでるので、+17 dBu だと音量が自分の規定に届かない可能性は十分にあります。まぁ、そのへんはぶっちゃけやり様はありますし、90 dBC なんてずっと出すわけがないので、普通の方の環境なら問題はないかな…
これは現状の簡易システムの殆どの音響補正に言えることです。大きな SR システムでは SPL が大きいので補正云々よりもアンプの性能云々の話のほうが大きい気がしますが、僕は詳しくないので僕に聞かないでください。
解決策 .2
測定自体には非常に大いに意味があります。最近のスピーカーは音量差でそこまで測定値と乖離しないはずだし (一定の価格以上なら信じてるよ)、工場出荷時の特性はほとんどフラットだと仮定すれば、その環境の音響特性を自身が知っておくことは非常に大きな意味を見いだせるでしょう。
補正値を有効にして音を聴く、補正値をバイパスして音を聴く、これだけで自身はスピーカー 2 台持ちである擬似空間を構築できます。これはでかい。
補正がされていることが良い、補正されていないことが悪い、とは思わずに、2 種のモニター環境を手に入れたと考えると良いだろう。もちろん補正値を 50% だけ有効にしたりができるはず (知らない) なので、そのあたりの塩梅は個人が好きなようにしたらいいと思うが、違うモニター環境を手に入れたと思うことが重要です。
両方の切り替えで自分の意図と乖離していなければそれは及第点の音であろう、と推測できます。
ヘッドフォンやフルレンジスピーカーを導入
$299 を払って音響補正値を測定して、かつ、更にフルレンジやヘッドホンを導入する必要性がわからないだろう。そうなんだ。これは経験則からでしか語れないのです。
結局、一つの音響システムから鳴っている音なんて当てにならない信用ならない、ということなんです。
スマホにデータを一旦移して iPhone とかで聴く人もいるだろうし、Bluetooth 飛ばしたり、Web API 経由で飛ばしたり、いろいろな状況を想定してみて聞いてることは非常に大事であるということです。
この話はいちいち掘り下げて解説することでもないので、詳しくは語りませんが、たくさんの環境で聴くことはなにか自分が間違ったことをしてはいないか、の確認に使えるよって言う話で、結局は音響補正とは結果的な着地点は一緒じゃね? っていう話だと思います。
キャンセレーション (打ち消し合い) は補正しても蘇らない
確かにこの意見は工学的には正しい。ただし、音楽的には、実はそうでもないことも多いです。
ただし、この話は超高度なモニタリングテクニックの話なので、気を付ける部分を以下に上げます。
高域の音量補正はかなり良い意味で効果を感じる
音響補正に慣れていない方にとって、重要なのは高域のキャンセレーションによる音量の乱れが緩和されることによって、音の見え方が格段によくなる場合があることです。
でも僕、これ、ちゃんと調べてなくて補正カーブの重み付けの詳細を知らないので C 特性なのか A 特性なのかを把握できるからそれも把握しつつ、吸音しすぎていると高域が逆に落ち込み過ぎたり、なんていうこともあるでしょうから、それらも把握しつつ。
ですからいい塩梅を模索するために補正は非常に良い選択だと思います。
脱線
通常、人はそこまで低域にいつも耳のフォーカスをあわせていません。もちろん言語認識的な低域補足という側面は英語圏にはありますが、日本語を喋るとき、帰国子女の方や長い間、英語等を話されている人の日本語発音を聞いてみてください。喉の下の方から発声していると思います。
Naokimanshow さんをご存知でしょうか?
「はいみなさんこんにちは〜」
の人ですが、彼は帰国子女なので日本語を喋るときも 上ずった声 では喋りません、もちろんテンションがあると結構可愛い声だしますよね、ナオキマン、え? 岡山の? それは別の Naoki さん。しかし、日本で話のうまい NHK のアナウンサーの声を聞いて見ください。あんまりドスの聞いた声では喋らないと思います。
でも映画館の広告の英語ナレーション、めっちゃドス聞いてますよね、Coming soon… って。あれ言語発音特性ね。
でも日本語で通る声って喉の上の方で発音したり鼻から抜けてくるような声で喋ります。非常に脱線しましたね…
ですから低域にフォーカスするときとそれ以外でしっかりと頭で切り替えることが重要な場合はモニター環境が完璧ではない場合には多用するテクニックだとは思います。
脳内補正や脳内切り替えって大事なんだね…
低域のディップを把握して常に意識すること
音響特性 (測定した値) は頭にずっと入れて、低域のキャンセレーションの帯域の楽器や、なにか処理を行うときに毎回毎回ケアすること。
キャンセレーションを回避するため、ヘッドフォンを利用すること。この場合、イヤーパッド内の反射がほぼ考慮しなくていい開放型をおすすめします。もちろん、密閉型、オンイヤー、オーバーイヤーでも低域が増幅?されて聞こえるものをあえて使うのもいいでしょう。それは好みです。ただ開放型のヘッドフォンは反射が構造上存在しないので、疑い深い人はおすすめ。
または別のスピーカーでチェックすること。フルレンジスピーカーを利用してみること。
元々、35 Hz (-6dB) 近くまで発声するスピーカーなんて自宅作業で置くほうがおかしなレベルなので、低域のモニタリングは最初から諦めること。
実際に Comm Filter の影響をよく受ける周波数は 70 〜 150 Hz あたりで、もうそこのモニタリングは最初からスピーカーでは諦めるという、諦め、は重要である。そして普通の環境は 50 Hz 以下もなかなかモニターできないので、サブウーファーを入れて上手にキャンセルを回避するようにクロスフィルター調整するか、ヘッドフォンに頼るか、みたいな選択の話になってくるので、最初からサブ周波数帯域は限られた住環境では諦めるのは潔いとは思う…。
だってサブウファーのほうが一般家庭に置くの辛いと思うので…
そしてサブウファーの設置の場合のクロスフィルター設定だってめっちゃ難しいし、サブウファー使ったってディップは起こりうるので、複数の再生環境チェックは必須であると、言えるでしょう。
DAW が発声する周波数を監視し続ける
周波数ディップが発生するメカニズムは反射です。つまり、周期が短い音は直接ディップはそこまで影響しない。(ただし、これは周期の話と複合的な周波数が鳴る場合はもっと複合的な要素を考えなくてはいけない)
例えば 100 Hz がディップする部屋があったとしよう。当たり前ですが最初の 100 Hz はキャンセレーションせずに聞こえるはずです。最初の発声はスピーカー直で耳に到達するからです。その後にキャンセレーションして音が減衰して聞こえるでしょう。
(もちろん指向性を理論値に置き換えて考えり、実際に知覚できるのかお前は? って話は限りなく無理だと思うぞ)
だから瞬間的な低域周波数の発音の場合はキャンセレーションはそこまで極端に影響しないことを一つ頭においておこう。
(ただし、実際に直接音 100 Hz が知覚できるか、の話とはちょっと違う。複合的な波形を考えたときにそこまで瞬間的な音に対して 100Hz ディップの影響がでるのかって話で瞬間的な知覚の話をしているぞ。結局エンベロープの解釈の話に繋がってあまりおもしろい話じゃない)
実は低域の持続音は生楽器では実は珍しい現象であり、極端な低周波で単音で持続する楽器は限られており、また、シンセサイザーで作るときは、おそらく、すでにそういう低域を鳴らす場合、音量ケアはしているはずであるからして、低域の持続音が長い音に集中していれば、あまり気にならない、という高度なモニター方法もあります。
つまり、測定した音響補正値を適応せず、頭に覚えておき (もしくは画面を起動しっぱなしで無効状態) でかつ、再生している周波数をメーターで監視し続けて、脳内補正して聴くという、高度なレベルの話になります。これはあくまで割り切れ、という話でちゃんと聞き取れるか、とはちょっと異なります。
モノによるとしか言えませんがサブと定義される領域で音程が一定の音色は少なく、明らかに音色の幅が狭いので経験則で回避できる。基本シンセベースの基音とか、エフェクトベース系とかベースドロップ系とか。
これは非常に高度なモニタリング構えの話であり、結局複数のモニター環境が必須となる話であるため、この記事の筆者の妄想話として捉えてください。これは私は考えて実行しています。
大体、ベース系全般(エレキベースから低音弦楽器、管楽器、ピアノの低周波共振とか…) と特殊な打ち込み系の音源だったり低周波のシンセサイザー加工音などで、生楽器系で低周波数が持続する楽器で低音楽器以外ほぼ無いと思いますが、部屋の鳴りとか、外的要因の低周波はちょっとケアが大変です。それはモニターで聞こえているか、以前の問題もあるので、深くは突っ込みません。
例えば Kick は 50 〜 60Hz あたりが基音になることが多いので、キャンセレーションが多い周波数とは被りにくい。
ただし、ベースの低域を聞かせるための倍音調整的なものあると思うんですけど、それって低域の再生能力がないものに対する対処的な話なので別枠の話となるでしょう。だからフルレンジでも聞こうね…って話に戻ってくる
低域をメーターで把握してフォーカスして聴く
最近は 80Hz/12dB oct. の Low Pass を通して音を聴くなどが可能です。
もちろん 120Hz/24dB oct. など設定できますのでその視聴範囲選択は様々です。
それはモニタリングツールを使えば容易に再現できますので、どうやるかは各々で決めて見てください。
この場合、モニターディップがある場合、極端にヘッドフォンや他の特性を有するモニターとは違う音が確認できます。また補正を掛けてみて、音のディップがどのように変化するか聞いてみてください。
大体、補正を有効にすると、サブ帯域の音量が下がるので、音量が小さくなりすぎたり、大きくなりすぎる、みたいな反作用は実は減るのかな、と思ったりますが、こればっかりは経験則のバランスや頻繁に自分のリファレンス楽曲を聴く努力が必要にはなります。
そして、どこまで行っても補正は FIR フィルター、ですよね? なのでやっぱりトランジェント特性が変化するとは思うんですよね、もちろん、リニアフェーズだとかノンリニアだとかはあると思いますが、マニュアル嫁って話だわな、面倒い。だれか早く IR 検査してくれることを願おう。
多分、低域はミニマムフェーズでしょう。
ですから、有効/無効を切り替えて聞いて、そしてフィルター視聴も同時にやってみるなど、ARC Studio を導入することで、視聴環境におけるケア部分が増えるということだ。
理論値と実行値の話をごっちゃにしない
こういうとき、反射音が綺麗に同じ音量レベルでかつ減衰も分散も周波数変動もしない、理論値を持ち出して語る方がいます。至極当然に正しい見解なのですが、理論値と実行値には隔たりがあるということを認識しつつ、キャンセリング、打ち消しあった音は復活しない、という事実も大事なんですが、完全に打ち消し合うことも、非常に稀だぞ…って話をしたいと思います。
ですからスピーカーの設置を気を配れば (もしかすると日本の住環境なら壁ベタ付けのほうがいいんじゃないかな?) 完全に打ち消し合う音があります!みたいなことは無いと思います。無いと思いたいです。無いわけじゃないと思いますが、稀だと思います。
そうなんですよ、打ち消し合いというよりかは、マスキングと似てて、ってかマスキングの一種なんですけど、互いに干渉しあってるだけで、完全に消失するような周波数が存在するか、と言われたら、多分無いです。だって同じ音量同じ角度で耳に入ってこないと行けないからです。
もちろん、-1 dB 変われば、それはそれは大きな変化であると人間気づけますし、0.2 dB 程度の微細な変化でも、だいたいの健常者の聴感覚であれば可能だそうです。特別な訓練は必要ありません。
ですから、個人的にはぶっちゃけキャンセレーション煽りしているポスト、あんまり好きじゃないです。大きなディップ以外はそこまで悲観的になる必要性は無いと思います。できるだけ設置に多少は気を使って、半分あきらめて。ここでは、その対策的な話をしているので。
反射音は制御できない
結局こういうのってある程度ルームアコースティック調整してる前提になってくるので、ディップができてしまうのは仕方がないし、どこまで行っても FIR フィルタ補正 (僕たちにとっては EQ 補正と全く一緒) なので、部屋の残響音が変わるわけでもないし、やれることやってから試してみましょうねぇ〜って話になるから、僕もなんだか、説明してて、嫌になります。
レイテンシーの問題
これを利用する場合、おそらくレコーディングには使えない。どう頑張ってもリニアフェーズは数学的な遅延が必要であるため、音響補正を有効にすると、Low Letency モード以外は 20ms は遅れるんじゃないだろうか。
精神衛生上の問題
私の自宅スタジオは現在 AES/EBU でスピーカーに出力しているので、もはやインターフェイスは D/D 転送装置と化している。もう、AD/DA の質、どこいった? もちろん D/D 転送もインターフェイスの実力が発揮されますので、重要な要素ではあるんですが、この製品 DAW から DA した信号をまた AD/DA するんですよね。なんか、精神衛生上無理って言う人いるんですよ。僕です。
別に気にしなきゃいい話ですが、50 万円もした AD/DA Converter のアナログ信号を本体のみ 44,000 円の AD/DA に突っ込む気にはならん、そういう話です。理解とかしなくていいです。ただの生理的な感情なだけです。
導入は決して悪いことではない
導入してから、あなたがどこまで視聴環境におけるケアを考えることができるか、でしょう。
音響補正とは、適応して、ポイ。ではないのです。
そこから色々な背景知識を学び、自分にとって「現状ベスト」を模索することです。
どこまで行っても Low End Focus の話は終わりません。
だって、すごい良いモニター環境をお持ちの方ですら、Trinov で頑張って調整したりサブウファーの微調整頑張っていたり、2.2ch が至高!って言う人もいるだろうし。つまり、52,800 円、$299 であなたのお悩み、すべて解決しますよ…? って言う話ではないことをしっかりと受け止めましょう。
僕も最近は自分の環境が事実上 2way 同軸 + Subwoofer の 2.2ch 仕様にはなっているので、めっちゃ視聴や調整が大変です。逆に音場補正かけるとめっちゃくちゃ低域ボケます。ただし高域のフォーカスはちゃんとします。なんだこのイタチごっこ!
どこまで行っても 完璧なモニター環境なぞ作れやしない のですから、52,800 円でしたっけ? $299 をっポンと払える人は是非お試しあれ。結局は音響補正しようがしまいが、あなたの音楽、対して変わらねぇから大丈夫だ心配すんな。
新たな知見と見識が得られる機会だと思ってお勉強代としては個人的には $299 ならあり、52,800 円だと躊躇するなってくらいです。それただの為替のトリックや…
これはすべて完全な個人的な見解ですので、この情報が役に立つ人も全く役に立たない人もいますので、戯言だと思って最後まで読んで、時間を無駄にした、と嘆いてください。