ぼすきーアドカレ2024 12/15 ノイズ処理の話by真䯂
皆さんおはこんばんちわっす!妖怪オンゲントロです!
合成音声を作るときに欠かせないのがノイズ処理、基本的にノイズ処理は避けては通れません
ノイズ処理が不要なほど整った環境を使える人の方が珍しいですからね
まあ私はぼ民ならノイズ処理引き受けているのでコーパスぶん投げてくれればノイズ処理して投げ返すんですけど「ノイズ処理含めてできれば自分でやってみたい」っていう人も割といらっしゃるようなので、今回は私のノイズ処理の知識をまとめておきます
※思いついたことをそのまま殴り書きしているので結構文章ごちゃっついてますごめんなさい
※なお筆者は普段RX 10 Standardを使用しているため、知識がRX 10 Standardに偏っている部分があります、また、RXの最新版は執筆時点で11ですので最新版にて追加、変更された機能についての知識は不完全ですのでご了承ください
※この記事は、「ぼすきー Advent Calendar 2024」参加記事です。
その前に…(録音ソフトの話)
ノイズ処理をするとは言っても限界があります、ファイル形式の変換はなるべく行わずに済むのが理想です(特に拡張子)
また、録音ソフトによって音質が変わる可能性もあります(未検証なので正しいかはわかりませんが)
なので基本的にOREMOもしくはRecStarを使ったほうがいいです
ノイズ処理とは関係ないですが、ファイル名のつけなおしなども楽になるのでにOREMOかRecStarを使いましょう、MYCOEの場合10文とかならともかく、文数が増えてくるとOREMOかRecStarを使わずに録音した場合リネーム作業が地獄になります、UTAUの場合も多分地獄だと思います
それでは本題に参りましょう!
では、ノイズ処理の説明に移ります
今回は「UVr5」「Clarity™ Vx」「RX」について解説していきます(おまけもあるよ)
(audacityの話はしないんかい!って言われそうですけど、そもそも使い方よくわからんかったのでパスで)(audacityの話は去年のアドカレで記事書かれているらしいですよ…?)
使い方の解説はそこそこに、ソフトごとの長所短所を重点的に解説していきます
UVr5
本来は曲からボーカルをぶっこぬくソフトらしいんですが、ノイズ処理にも応用できるらしいです
操作が簡単、ちょっとポチポチするだけで完了する
逆に言うと細かい設定はあんまりできない、MODELはいろいろ種類あるけどどれがどういう結果になるかぱっと見ではわからないのでトライアンドエラーするしかない(今回は解説記事の通りにしかやってないからどうなるかはわからない)
そこそこノイズは小さくなるが、MYCOE学習に使うとなる時になるくらいは残る
ポップノイズに対しては無力、おそらく声の判定が出てるんじゃないかと
あと出力音声がステレオになるっぽいのでモノラルに直す必要がありそう
部屋鳴り(反響)は多分どうにもならない
Clarity™ Vx
Wavesが販売している有料のノイズ処理専門のVSTプラグインです、VSTプラグインなので単品では動きません、外部プラグインを使えるフリーのDAWをどこかからDLしてきましょう、audacityでも起動はできるっぽいけど「音をプラグインに聞かせて学習させる」という工程が必要になるのでaudacityでちゃんと使えるかはわかりません、音声ファイルは数周させるといいらしい
操作が簡単、いわゆるワンノブ、モード切替のボタンはあるが合成音声作る時はBroad2にしておけばよさそう、細かい調整はあまりできない
録音した音声が小さいとうまくいかないかも、連続的なバックグラウンドノイズならかなりでかくても何とかなる
全体的にそこそこ良い感じにはなるが、細かいところがちょっと気になるときがあるリップノイズとかポップノイズが残ったりすることがある
Clarity™ Vxはセール常習犯なので定価で買ってはいけない
部屋鳴り(反響)は別プラグインのClarity™ Vx DeReverbが必要(良い検証用音声素材がないため割愛)
上位版のClarity™ Vx Pro(Clarity™ Vx DeReverb Pro)もあるが値段差に対して性能はそんなに大した違いないのでこっちは買わない方がいい
※今回の解説にはデモ版を利用しています、俺はClarity™ Vx買ってないです
RX
iZotopeのノイズ処理専門ソフトです。Elements・Standard・Advancedがあり、Standard以上には RX Audio Editorが付属するため単品起動ができます。Elementsを使うときは外部プラグインを使えるフリーのDAWをどこかからDLしてきましょう
とにかく機能が多い、そのおかげでいろんなノイズに対応できる、ただし初見だと何をどう使えばいいのかわかりにくいかも(ただ個人的にはaudacityよりは使いやすいような気がする)
かなりユーザー数が多いので、YouTubeとかに解説動画が豊富にある、専門用語多めではあるが、iZotope Japan公式の解説動画もあるため以外とかなんとかなりそう
性能は高いが、その分値段もクソ高い、値段のせいで正直お勧めしにくい
グレードごとの評価
Elements:そこそこ優秀ではあるが、Voice De-noiseだとバックグラウンドノイズによっては声がこもったような感じになることがある、部屋鳴り(反響)の処理ができるDe-reverbもついてくる
Repair AssistantにはiZotopeと言えばなAI機能付きのためAIにある程度設定させといて微調整するだけでそこそこ良いのができる、ボイロ(広義)を1~2人くらいお迎えできる値段(記事公開時点で16,900円)ではあるが、ごくまれにではあるが無料配布が来るときもあるので来た時には絶対もらっておくべき(次いつ来るかはわからんけど来たら多分一部のぼ民が騒ぎだすだろうし俺も騒ぐ)
Standard:大体のノイズなら困ることがない、参考として出してる音声はRX10のSpectral De-noise+Mouth De-clickなのでこれにさらに優秀なDialogue Isolateが使えるため個人的には最強だと思っている、ただし値段がクソ高い(記事公開時点で67,800円)、かなりセールを頻繫に行っているものの、それでも3万ちょい~4万する、高い
(俺がRX10からアップグレードしてないのも値段のせい、アップグレード版でも高ぇよ)
作曲とかする人でOzoneとかNeutronとかその他いろいろなiZotope製品が欲しいよっていう人はセール時に(←ここ重要)Music Production Suiteを買うのがよさそう、Music Production Suiteのセールを狙うならiZotopeの何かの期間限定無料配布をもらっておくとクロスグレードに使えてさらにお得に買えることもあるから何か来たらもらっておこう、そうじゃないならあんまりおすすめしません
Advanced:機能はめちゃくちゃ多いがユーザーモデル制作だと役不足、おまけに鬼高い(記事公開時点で200,600円)、RX11からDialogue IsolateがStandardでも使えるようになったので正直Standardで十分、Advancedをわざわざ買う必要はない、Advancedはまじのプロが使う用の物なので…
(Advancedを買うなんてぼ民だとおじきりくらいの大富豪じゃないと無理だしたとえおじきりだとしてもこんなの買うくらいならボイロボカロ(広義)に金使ったほうがいい)
―――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――――
おまけ
Q.そもそもおまけって何?
A.こういうソフトもあるよって軽く紹介する感じのやつです、上三つの解説に比べると簡単な紹介くらいになります(正直な話いろいろな理由であまりおすすめではない奴だったりする)
あとはEQとかGateとかみたいな一般エフェクトの話もします
――――――――――――――――――――――――――――――ー
――――――――――――――――
VEA
「Voice Enhancement Assistant」略して「VEA」、さっき紹介したiZotopeの製品です
RXの一部の機能にOzone、Nectar由来のボーカルMIX機能を足して操作性を単純化した感じのプラグインです、VSTプラグインなので以下略
そこそこ良い、がそこそこどまり、完全に取りきるのは難しい、伴奏付きのボーカル用であれば気にならなさそうだけど声だけで聴くとちょっとねな感じ
どちらかというとMIX機能の方が優秀、ノイズ処理のしあげにちゃっとかける感じがよさそう
別売りのAudiolens(かなり高頻度で無料配布してる)と組み合わせることで参考にしたい音声に音色を近づける、なんてこともできるらしい(俺やったことないけど)
値段はだいぶ安い(記事公開時点で4,900円(2025年1月5日までセールで3,000円になってるらしい))
RXとかに比べるとセール頻度は少ない気もするが元値が安いからそんなに気にしなくてもいいかも
――――――――――――――――
C-Suite C-Vox™
Universal Audioのノイズ処理エフェクトです、リアルタイムノイズリダクション用のエフェクトですがリアルタイムじゃなくても使えると思うので(正直これの話を書きたくておまけセクション書いたんですよね)(ちょっと触ってみたかった)
――――――――――――――――――――――
―――――――――――――――――――
かなり優秀、あまりにもノイズがクソでかの場合は若干残ってしまうものの、声質にあまり影響が出ない、リップノイズやポップノイズの処理はできない
優秀ではあるものの、基本的にソフト利用のハードルがクッソ高いからおすすめできません
まずソフトがそもそも高い(記事公開時点で$349(日本円だと53,700円前後))、そしてApolloなどの専用ハードが必須(一番安いのでも記事公開時点で$499(76,700円前後))、ソフトのコンセプト的に専用ハードが不要になる日はおそらく来ないんじゃないかな~と(UADでリアルタイム系エフェクトならApolloを使わないという手はないはずだし…)
※真䯂はApolloユーザーなので全UADプラグインを14日間無料体験できるのでそれで試しました
※買ってません
――――――――――――――――
EQとかGateとかの一般エフェクトを活用しようという話
低音には声以外の音しか入っていない部分もあるのでEQでローカットしたり、しゃべっていない無音部分を完全な無音にするためにGateかけたり、歯擦音(サ行とか)がうるさい場合はDeEsserを使ってみたり、ノイズ処理専門ではないエフェクトも使うとよりいい音声になります、
こういうのは大体そこらに転がってるフリーVSTで良いです
もっとこだわるなら:録音時に気にすること
ノイズ処理は最終手段なので録音時に減らせるものは減らす方がよいです
ということでできるだけノイズを減らす方法を書いておきます
その① 切れる家電は切る
当然ですが音が出る家電は切れるなら切るべきです
ですが、夏場冬場にエアコン切って体調崩すのはだめです
なのでエアコンなしでも快適に生活できる時期 に録音するのが最適ではあります
(ですがそういう季節には花粉という問題もあったりほかにもそれぞれ何かあるでしょうしいろいろと難しい話ではあるので無理はしないように…)
その② マイクの指向性、位置を考える
どうしてもエアコンなどを切れない場合や、PC録音するときのPCファンの音など、どうしても発生してしまう雑音はあります
そこで、マイクの指向性を気にすることでマイクが拾う雑音を減らすことができます
マイクが音を拾いにくい向きにエアコンなど雑音の発生源が来るように録音しましょう
マイクによって音を拾いやすい向きは違うため、この向きがよいと断言はできないので具体的な話はここでは省略させていただきます、各自で調べてください
その③ 口から出る空気に注意
口から出た空気がマイクに直撃するとポップノイズが発生することがあります
口に対するマイクの向きを調整したり、録音直後にチェックしてポップノイズが発生してないかを確認し、発生した場合は再録音した方が手っ取り早いです
ポップガードを使うのも有効です、多分これが一番早いと思います
ダイナミックマイクの場合は物によってはポップガードは必要ない…はず…多分
その④ ノイズの発生原因が録音機材にある場合もある
どうしようもない場合は買い換えてしまったほうが良い
機材同士の相性や機材とコードの相性、もしくは機材そのものの問題でノイズが発生している場合は買い替えた方がよいです
オーディオインターフェースの余計な機能がオンになっていてそれが原因で雑音が入ってしまう場合もあるため確認をしましょう
AG06系のオーディオインターフェースのアンプシミュレーター機能などは要注意(n敗)
その⑤ 背もたれが動く椅子などに座って録音する場合は寄りかからない方がいい
背もたれが動く椅子に寄り掛かると「ギギギギギ…」と音が鳴ってしまうことがあります
マイクにもよりますがこの音結構マイクが拾っちゃうんですよね
なので寄りかからない方がいいです
(そもそも背もたれによっかかりながらだと発声にも影響出そうだし)
その⑤ 録音開始と録音終了するときはちょっと待ってから
録音開始終了はちょっと待ってからしましょう
特に録音開始はキーボードやマウスのクリック音がはいってしまうこともあるので、それが声と重なると大変です
重ならなければどうにでもなります
その⑥ 結局レンタルスタジオが最強
そもそもの話、レンタルスタジオを借りて録音した方がいい環境でとれます
そんなに沢山録音する予定がなく、近場にレンタルスタジオがあって、いい機材を持っていない場合はレンタルスタジオ借りた方がいいです
まあレンタルスタジオにUTAU原音やMYCOE用のコーパス録音しに来る人は少数派な気がするので録音風景をスタッフに見られるタイプのスタジオだと(この人何してるんだろう…)って思われる可能性もあるかもですね…知らんけど(真䯂本人はレンタルスタジオ行ったことないので詳しくはない)
あとレンタルスタジオが近場に無いなら宅録のほうがいいです、遠いと普通にモチベ削れるので
配信とかのためにすでに録音機材をそろえてる場合orとりあえずスマホで録音する場合も宅録でいいんじゃないですかね?
その⑦ 選挙期間中に録音するのはやめとけやめとけ!ペットの声も要注意
選挙カーの音はノイズ処理最大の敵!
人の声が重なると本当にどうしようもないので選挙終わってからにしましょう、まじで
ペットの声も声なので重なると厳しいです、重なっちゃったらとりなおしましょう
そう考えると夏場に宅録は本当にやめた方がいいかも(セミなどの虫の声が…)
多分もっとありそうだけどきりないし、ざっとこれくらいでいいかな…
録音機材を買いたい!という人向け
おすすめ機材の話(主観全開)
どれだけノイズ処理を頑張っても結局録り音がダメならどうにもならんのですよ!
スマホ録音でも大抵はそこそこなものが録れるとは思うんですが…特にandroidはピンキリなので…
ダメな場合はとことんだめですし、商業ソフトとかと共演したりするとさすがにちょっと気になるかもしれませんね
まあさっきも言った通り正直本気で音質極めるならめちゃくちゃいい機材借りられるレンタルスタジオ探してそこに行った方がいいとは思うんですけど…配信したい!Seiren VoiceとかMMVCとかVoidolとか使いたい!のように滅茶苦茶高頻度で良い機材を使いたい状態が他にあったり、白痴ーさん並みに大量にスタイルつくりたい!みたいになってくるとおそらくちょっと環境を妥協してもそこそこ良い機材買って宅録のほうがいいですよね
で・す・が・! 高い機材を買えばいいというわけじゃないんです! 高級機材の性能を最大限生かすためにはそれ相応の録音環境が必要になります!
と、いうわけで、ここからは真䯂の主観にはなりますが、おすすめ機材の話をしていきます
ちなみにここからはパソコンを持っている前提で進めていきます、スマホに接続できるオーディオインターフェースとマイクがあるっていう話も聞いたことがあるような気はしますけど正直そっちは俺も詳しくないし、スマホ録音なら内臓マイクで十分だと思うし、それに金かけるくらいならパソコン買っちゃったほうがいいと思うので…
先に結論
パターン①:「AG03MK2」&「AT2020」or「AT2040」or「YCM01」
パターン②:「Apollo」&「SC-1」or「SD-1」or「Sphere」
パターン③:試奏ができる店に行って実際に試して選ぶ
がおすすめだと思います
パターン① 「AG03MK2」&「AT2020」or「AT2040」or「YCM01」
初めての機材としてよく紹介される(気がする)オーディオインターフェースAG03MK2と
コンデンサーマイクAT2020の王道の組み合わせ、「プロがAG03使うな」発言で論争が発生したことがあったりしますが、あまり環境が整っていない宅録の場合はこれくらいがちょうどいいと思います、MYCOEIROINK二芳の録音は絶叫系のスタイルと脱力、雑多、量産スタイル、音源紹介動画以降に追加されたスタイル以外のスタイルはこの組み合わせで録音しています(厳密にはオーディオインターフェースはMK2ではないのでMK2の商品説明やレビューによるともっといい音になるらしい)(さらに後半はオーディオインターフェースの故障により発生したホワイトノイズをRX10で消しているので完全な状態ではないと思われる)
YCM01は使ったことは無いですが、同じYAMAHAの製品ですし、セット販売もあるので相性はいいんじゃないですかね、AT2020と価格帯もほぼ同じなのでYouTubeに上がってるレビュー動画とかを参考にして好みでどちらにするか決めるといいと思います
コンデンサーマイクよりダイナミックマイクのほうがいいならAT2040がいいかも
製品URL:「AG03MK2」「AT2020」「AT2040」「YCM01」
パターン②:「Apollo」&「SC-1」or「SD-1」or「Sphere」
お金に余裕があるのであればこちらもおすすめです
「さっき宅録ならこれくらいがちょうどいいって言っただろ!」ってコメントが飛んできそうですが、これにはちゃんとした理由があります
こちらの組み合わせのおすすめポイントは「付属するプラグインの優秀さ」にあります
オーディオインターフェースのApolloにはコンプレッサーやEQなどのUADプラグインが付属しています
UADプラグインは実機の音の最限度がほかのどのプラグインよりも高いという評判があり、プラグイン探求の終着点という評価をする人もいるほど、かなり評判がいいです、UADプラグインの音が好みに合うならばおすすめです
マイクのSphereとSC-1、SD-1 にはいろいろなマイクの音を再現できるプラグインが入っています、Sphereの方のプラグインはもっと細かい設定ができたりするみたいです(まあ私はこのマイクはレビュー動画を見ただけなので詳しくはないんですが…)
ダイナミックマイクならSD-1、コンデンサーマイクならSC-1、ガチるならSphereって感じですかね、ただしApolloもSD-1もSC-1もSphereも割と高額なので本当に余裕がある人じゃないならパターン①のほうがいいです、オーディオインターフェースだけApolloにしてマイクだけパターン①のでもいいかもですね(今回解説に使ったコーパスの録音はApollo+AT2020でしたものです)
ただしApolloはどうやらOBSと相性悪いらしいので配信したい人にはあんまりお勧めできないです
(ノイズ処理実演セクションでOBS使ってだらだらしゃべりながら解説しようとしたらOBS君がマイクの音拾ってくれなかった(俺が機械音痴なのかもしれんけど実際にApolloは配信には向いて無いって言ってるサイトがちょくちょくあるので…))
製品URL:「Apollo」「SD-1」「SC-1」「Sphere LX」「Sphere DLX」
ちなみにダイナミックマイクとコンデンサーマイクの違いですが
ダイナミックマイクは丈夫で雑音を拾いにくい代わりに音質と感度は控えめ
コンデンサーマイクは音質と感度は良いが雑音を拾いやすい、あと衝撃や湿気に弱い
という感じです、持ち運ぶならダイナミックマイクがいいですね
個人的な感覚としてはコンデンサーマイクのほうが高音がはっきりしていると思います、ダイナミックマイクのほうが若干こもってるというか音が暗めというか何というか…
ほかにもファンタム電源がなんとか~とかあるんですがだいぶややこしい上にオーディオインターフェースのボタン一つで解決することなので割愛
パターン③ 試奏ができる店に行って実際に試して選ぶ
やっぱりこだわるなら実際に試したほうがいいと思うんですよね
店員さんにおすすめを聞くこともできるので
ただし店員さんによってはプリアンプのEQいじってよく見せようとする人もいるらしいので注意
その音がマイク本来の音なのか別で音をいじっているのかを見極める必要がある場合があるということですね
結論:迷ったりめんどくさかったらダイナミックマイクとコンデンサーマイクのどっちがいいかだけ考えてパターン①から選ぶべし
何だったんだこのセクションは…
まとめ
いろいろ難しい話を書いてきましたが、最初はこんなにいろいろ考えなくてもいいです!スマホなど手持ちの機材でちゃちゃっと録音しちゃいましょう!
ぼすきーである程度活動しているひとであれば俺に録音したコーパス投げてくれればノイズ処理して投げ返します!もちろんぼ民なら無料です!金銭のやり取りめんどくさい!(アカウントミュートしてたりワードハードミュート引っかかって非表示にされてたらすまん!あまりにも反応がない場合は文章かえて再送するか別名義垢のDMにでもぶん投げてください!別名義垢のほうはブロミュ0ワードミュート0で運用してるので届かないことは無いはずなので!)
こだわるのは後からいくらでもできますからね!
為せば成る!皆さんも良き合成音声ライフを!
追記
寝れないからってアドカレの記事書くやつがあるか!
機材の話とまとめは深夜テンション入ってますごめんなさい!