音声合成ソフトウェアを開発するにあたり、必要なことを教えていただきたい


以下のようなことを実現したいのですが、まったくの素人です。
お詳しい方、アドバイス頂けますと幸いです。

○最終目標
 →テキストを入力すると、自動で音声化されるソフトウェアの開発

○ソフトウェアの要件
 ・男性声、女性声など、音声の高低をある程度カスタマイズできる(話し方の癖などの調整は難しいのではという認識)
 ・パッケージとして発売、または利用した分量に応じて課金する
 ・ソフトウェアを利用して制作した音声の権利を保有できる(そのため、既存のツールは利用できないという認識)
 ・発話の自然さは一旦問わないが、今後の学習量によってより改善を進めたい

○持っているもの
 ・音声、およびテキスト(権利を保有している)

○持っていないもの
 ・エンジニア的な知識はほぼなし。自分でやってみたいが、場合によっては外注も視野。

○最も知りたいこと
 ・音声の権利は必ず保持する必要がある。その上で、最も効率的な道筋(Python?などを一から勉強する必要があるのか、商用利用可能なツールのようなものがあるのか、など)

回答の条件
  • 1人50回まで
  • 登録:
  • 終了:2022/10/31 15:10:05

回答0件)

回答はまだありません

  • id:Yoshiya
    元プログラマの戯言として聞いて下さい。
    音声合成ソフトウェア(音声合成エンジン)は無料から有料まで数限り無くあり、最新の音声合成ソフトウェアは人間が自然に話す音声に近いです。
    今や音声合成ソフトウェアの業界はレッドオーシャンであり、よほど高性能かつ無料もしくは低価格で無いと新規参入は難しいと思います。
    質問者さんが利益を考えないのであれば、質問文の条件にあうエンジニアもしくは開発会社を探せばいいと思いますが、開発費用が百万円単位で収まるとは思えません。
    なので、趣味で活動するのであれば、そこそこの開発費用をかければ、それなりの音声合成ソフトウェアができると思いますが、実際に利用、課金してくれるユーザーは少ないと思います。

    それと、汎用なのかゲームや配信に特化したものかで音声合成ソフトの種類も代わってきます。
    その点も考慮に入れて、開発するかどうか考えた方がいいと思います。

    参考サイト

    https://www.dtmstation.com/archives/55090.html
    音声合成業界に激震! もはや人間の喋り声、入力文字読み上げソフトVOICEPEAKはビジネス用途でも自由に利用可能・DTM STATION 2022.02.27
  • id:cafe-beret
    Yo様

    丁寧にご説明くださりありがとうございます。
    難しいこととは承知していたつもりでしたが、そこまでとは知識不足でした(特にリンク先は大変参考になりました)。

    質問があまりに稚拙だったのか、残念ながら回答もつきませんでした…。

    今後の方向性の大きな参考となりました。改めて御礼申し上げます。

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

回答リクエストを送信したユーザーはいません