1年ぐらい前にテキストを音声にするVOICEPEAKを購入しました。いわゆるAI音声合成ソフトです。AI音声はさまざまなタイプがあり、昔ながらのロボットみたいな読み上げソフトもあれば、ボーカロイド、ゆっくりなど様々です。いろいろ比べた結果、バランスが良く高品質だったのでVOICEPEAKを購入しました。また買い取り&商用可能であること良い点です。

購入したのはVOICEPEAK 商用可能 6ナレーターセットです。追加でVOICEPEAK フリモメンと宮舞モカも購入しました。上記テキストを読み上げてみましょう。以下、特に設定をせずに適当に再生したものです。どうですか、なかなか素晴らしいですよね。

フリモメン読み上げ動画

宮舞モカ読み上げ動画

声の設定

設定もいくつかあります。まず右側に声の設定と感情です。設定は速さ、ピッチ、ポーズ、音量。感情はキャラクターよって少し違うようです。ポーズの違いがよく分かりませんでした。実際に聞きながら調整するのが良いでしょう。

アクセントの設定

次にアクセントとイントネーションと長さを調整できます。違和感があるときに調整するとよいでしょう。アクセントとイントネーションの違いが分かるけど、はっきりどうしたらよいか分からないので、いろいろ試すとよいでしょう。

辞書機能

読み上げでwavと入力すると、ダブリューエーブイと読み上げてしまいますが、辞書を作成することでワブと読ませることができます。便利です。

オーディオデータ出力

作成したテキスト音声は、出力からwav等で出力できます。ブロックごとの保存や命名ルールなども設定できます。

 

テキストの読み上げですが、最近のAI音声は優れていますよね。使える品質だと感じませんか。思ったより自然です。すごい時代になったものです。ライセンスに関しては細かい区分があるようでして、実際に利用する際には要注意です。

 

個⼈商用ライセンス利用範囲
https://www.ssw.co.jp/products/talk/voicepeak_una/VOICEPERAK_Personal_Commercial_License.pdf

VOICEPEAK
https://www.ah-soft.com/