
顔出し無しでYouTubeをやる方法!などはよく聞くけど、声出しなし?
私はYouTubeとInstagramの運営をするにあたって、身バレ防止のため顔だけではなく声出しもしたくないなと思っているよ。
副業だからね。

顔出しなしばかりがフィーチャーされることの方が多いですが、結構声出しもしたくない人は多いのではないでしょうか?
YouTubeの動画はもちろん、Instagramのリール(ショート動画)も音声を入れた方がSNSアカウントとしては望ましいので、自分の声を使わずに動画を作成する方法について今日は紹介します。
最近の音声生成AIの躍進により、無料・有料ともにさまざまなサービスがあるので有名なサービスをピックアップしてお伝えします。

声出ししない方法を求めて、無料・有料いろんな方法をこれまで試してきた経験から最後におすすめの方法を紹介します!
まず、自分の声を使わない方法として大きくは以下の2つの方法があります。
- 音声読み上げソフトウェアを使う方法
- ボイスチェンジャーを使う方法
「音声読み上げソフトウェアを使う方法」では、テキストを読み込ませて音声を生成するため自分で話す必要はありません。
「ボイスチェンジャーを使う方法」の場合は、自分で読み上げて作成した音声を利用します。
それぞれのケースで利用できるソフトウェア(サービス)を紹介します。
音声読み上げソフトウェアを使う方法
音声読み上げソフトウェアを使うメリットは、ボイスチェンジャーを使う場合と比較して以下が挙げられます。
- 事前の音声録音は不要
- テキストを作成するため、読み上げた文字をテロップなどに流用できる
Canva(有料)
Canvaでは以下の2つの読み上げアプリが用意されています。
- MURF.AI(以下、MURF)
- D-ID AI Presenters(以下、D-ID)
MURFもD-IDも外部のサービスをCanvaから連携してアプリとして利用できるサービスです。
そのため、本格的に利用する場合には、各サービスの利用料が発生します。
MURF.AI
MURFは、入力したテキストから音声をAIが生成してくれるサービスです。
MURFは無料版でもサンプルとして音声生成を行うことが可能ですが、作成した音源をダウンロードしたり、Canva内に挿入して使用するには有料になります。
1番安いプランで19ドル/月でした。
参考:料金表
実際にMURFを使って音声生成をしてみましたが、普通の機械音声といった感じです。

MURFはCanvaで音声だけ作成したい人におすすめです。
D-ID
D-IDは、AIアバターに生成した音声を喋らせることができるサービスです。
事前に用意されているアバターに喋らせてもいいですし、自分がアップした画像を使用して喋らせることも可能です。
写真だけでなく、イラストもOkですが、動物など人物でないものは喋らせることができないので注意が必要です。
(猫や犬のイラストなどを使ったりはできない。)
無料のトライアルプランだと20クレジットがついてくるのでお試ししたい人はまずはトライアルプランで登録してみてください。
1番安いLiteプランで4.7ドル/月でした。(ただし、Liteプランだと透かしが入るのと商用利用はできない。)
参考:料金表

D-IDは、Canvaで音声だけでなくアバターも一緒に作成したい人におすすめです。
VOICEPEAK(有料)
VOICEPEAKとは
AI音声技術を活用した文章読み上げソフトウェアです。
公式サイトはこちらから。
VOICEPEAKは何と言っても自然な読み上げが特徴です。
また、イントネーションを調整することが可能なため不自然な箇所もチューニングをすることができます。

「感情パラメータ」という設定項目では、"明るい"や"怒り"など感情を指定することで声のトーンを自動で変更してくれたりもします。
「VOICEPEAK 商用可能 6ナレーターセット」には6人(男女3人ずつ)+1人の女の子の声が利用可能で複数の音声を使い分けたい人にとっては大変お得だと思います。
さらには、さまざまなキャラクターの声も販売されています。
私は、実際に「VOICEPEAK 東北きりたん」という女の子のキャラクターの音声を購入して使用しています。
イントネーションを詳細に設定することができるので、他の読み上げソフトと比較して圧倒的に自然です。
読み上げソフトを使用するとどうしても機械感を感じてしますのですが、VOICEPEAKはほとんど違和感なく聞くことができます。
やはり全てのイントネーションが自動で完璧という訳にはいかないので、違和感があるイントネーションを調整する場合にはそれなりに手間がかかりますね。慣れるまでは、イントネーションをどの高さに設定すれば思ったとおりの発音になるのかも分からないので、結構大変な作業になります。

一度チューニングした単語は辞書として登録もできるので、繰り返しチューニングをすることで品質をあげることができます。
VOICEPEAKを採用するシーンとしては、読み上げソフト以上のクオリティの読み上げ音声が欲しい場合で、頻繁に生成が求められないものがいいと思いました。
もし、毎日更新するようなYouTubeで使用したい場合は、チューニングが大変なので多少イントネーションが変でも許容して使用するくらいの気持ちでいた方が良さそうです。
VOICEPEAKはかなり性能が高いので、チューニングを一切しなくても十分なクオリティではあります。
どうしても気になる箇所だけ調整する、とかもありかと思います。
ちなみに、VOICEPEAKのライセンスは買い切りになります。
本当に自然なので、試しに公式サイトで是非サンプル音源を聴いてみてください!!

音声生成AIの機械っぽさがどうしても気になるという人はVOICEPEAKおすすめです。
Vrew(無料)

みんな大好き、無料で使用できるVrew先生です。
Vrewは元々、音声ファイルから文字起こしをするためのツールでしたが、今では、テキストからAI音声を生成できる機能を有しています。

無料で生成したい人はもはやVrew一択って感じですね。
Capcut(無料)
ショート動画の作成にCapcutを使っている人も多いのではないでしょうか?
Capcutは無料で使用できる動画編集サービスとしてとても人気ですよね。
入力したテキストから音声読み上げを行う機能もついています。
Capcutは以前は商用利用できなかったのですが、今は一部の素材については、商用利用可能となっています。
(商用利用可能な素材かどうかはCapcutのフィルタで確認することができます。)
Capcutは動画編集サービスですが、テキストから音声を生成する機能だけでも使いやすいです。

ただ、Capcutの規約では、Capcutを使用して作成した動画の権利が作成者から離れるとなっており、勝手に作成した動画のコンテンツを利用される可能性もあります。ビジネスシーンでの利用を想定するのであれば現時点ではCapcutは避けた方が無難かなと思います。
ボイスチェンジャーを使う方法
ボイスチェンジャーを使うメリットは、音声読み上げソフトウェアと比較して、以下が挙げられます。
- 自然な音声になる
- 元音声があるので、イントネーションが正しいことが多く読み間違いがない
- 音声ファイルがあればいいので、テキストの準備が不要
MyEdit(有料)
ブラウザから利用できるサービスで、音声ファイルをアップロードするだけでボイスチェンジが可能です。
サンプルで最初の10秒を変換した音声を聴くことができますが、10秒以上の変換とダウンロードには有料プランの契約が必要です。
オーディオ編集プランを年額契約すると月の利用料は580円です。
参考:料金表

アプリのダウンロードも不要で、音声ファイルがあればボイスチェンジ可能なためサクッと変換したい人にオススメです。
PowerDirector(有料)
動画編集ソフトウェアとして有名なPowerDirectorですが、ボイスチェンジャー機能もついています。
30日間はトライアル期間で、無料でほぼ全ての機能利用をすることができますが、以降、本格的に利用しようとすると有料となります。
30日を超えても無料プランというプランは用意されていますが、書き出した動画に透かしが入る上、商用利用不可なのでプライベート利用とかでない限りは有料プランへの加入が必須となります。
(ちなみにトライアル期間でも透かしは入る。)
料金は年額プラン&セール適用だと558円/月と割と良心的な金額だと思います。
参考:料金表

動画編集とセットで音声を変更したい場合はPowerDirecrtorがおすすめです。
まとめとオススメのサービス

音声生成ソフトウェアに求める優先順位によってどのサービスを利用するかは変わってきます。
例えば…、
- 無料で使用したいならVrew
- 可能な限り自然な音声が必要ならVOICEPEAKまたはボイスチェンジャー
ちなみに私は、利用シーンによってVOICEPEAKとMyEditを使い分けています!
音声生成サービスはなかなか無料で…ということは難しいですが、声出ししたくない人は自分に合ったサービスを1つ契約するといいと思います。
ボイスチェンジャーだと、月額500ちょっととかなので、コスパはとても良いと思います。
最後まで読んでいただきありがとうございました。