1年ぐらい前にテキストを音声にするVOICEPEAKを購入しました。いわゆるAI音声合成ソフトです。AI音声はさまざまなタイプがあり、昔ながらのロボットみたいな読み上げソフトもあれば、ボーカロイド、ゆっくりなど様々です。いろいろ比べた結果、バランスが良く高品質だったのでVOICEPEAKを購入しました。また買い取り&商用可能であること良い点です。
購入したのはVOICEPEAK 商用可能 6ナレーターセットです。追加でVOICEPEAK フリモメンと宮舞モカも購入しました。上記テキストを読み上げてみましょう。以下、特に設定をせずに適当に再生したものです。どうですか、なかなか素晴らしいですよね。
フリモメン読み上げ動画
宮舞モカ読み上げ動画
声の設定
設定もいくつかあります。まず右側に声の設定と感情です。設定は速さ、ピッチ、ポーズ、音量。感情はキャラクターよって少し違うようです。ポーズの違いがよく分かりませんでした。実際に聞きながら調整するのが良いでしょう。
アクセントの設定
次にアクセントとイントネーションと長さを調整できます。違和感があるときに調整するとよいでしょう。アクセントとイントネーションの違いが分かるけど、はっきりどうしたらよいか分からないので、いろいろ試すとよいでしょう。
辞書機能
読み上げでwavと入力すると、ダブリューエーブイと読み上げてしまいますが、辞書を作成することでワブと読ませることができます。便利です。
オーディオデータ出力
作成したテキスト音声は、出力からwav等で出力できます。ブロックごとの保存や命名ルールなども設定できます。
テキストの読み上げですが、最近のAI音声は優れていますよね。使える品質だと感じませんか。思ったより自然です。すごい時代になったものです。ライセンスに関しては細かい区分があるようでして、実際に利用する際には要注意です。
個⼈商用ライセンス利用範囲
https://www.ssw.co.jp/products/talk/voicepeak_una/VOICEPERAK_Personal_Commercial_License.pdf
VOICEPEAK
https://www.ah-soft.com/