タグ

音声合成に関するunaristのブックマーク (5)

  • 商用でも利用可能なAI音声合成ソフトウェア『VOICEVOX』がオープンソースとして無料でリリース|DTMステーション

    日8月1日、音声合成技術の世界に、また画期的な動きがありました。「Seiren Voice」や「Yukarinライブラリ」の開発者としても知られるヒロシバ(@hiho_karuta)さんが、ITAコーパスを利用した商用利用も可能なAI音声合成システム、VOICEVOXなるソフトウェアをオープンソースのとして無料でリリースしたのです。具体的には現時点Windowsで動くシステムで、「ずんだもん」および「四国めたん」の声でテキストを読み上げるシステムとなっています。 これがオープンソースとなったことで、一般ユーザーが自由に利用できるというだけでなく、さまざまなシステムに組み込んで喋らせることが可能になったのが画期的なところ。たとえばロボットなどに組み込んで対話型のシステムを作ることや、観光案内システムに導入して喋らせる……といったこともできるほか、クラウド型のシステムを構築し、ブラウザを経由

    商用でも利用可能なAI音声合成ソフトウェア『VOICEVOX』がオープンソースとして無料でリリース|DTMステーション
    unarist
    unarist 2021/08/02
    エンジンもフロントエンドも LGPLv3 or ソース公開不要なライセンス、のデュアルライセンスなるほど
  • 音声の分析・合成処理の基本 ―― 携帯電話やVoIPで使われている音声圧縮技術の仕組み

    音声の分析・合成処理の基 ―― 携帯電話やVoIPで使われている音声圧縮技術の仕組み 川村 新,尾知 博 ここでは人が声を出すのと同じような仕組みで音声を処理する技術を取り上げます.携帯電話で使われている音声圧縮技術である分析合成方式について具体的に説明します.この方式では,PCMやADPCMなどの波形符号化方式よりも高い圧縮率を実現できます. (編集部) ※ 記事は,ディジタル・デザイン・テクノロジ No.6から転載いたしました.同誌はこちらから購入できます. 稿では,音声波形そのものを符号化する波形符号化方式とは異なり,音声の発生機構をモデル化し,そのパラメータを符号化する分析合成方式について説明します.この方式は,携帯電話やVoIPで用いられています. 1.分析合成方式の原理 音声の発声機構とそのモデルを図1に示します. 図1 音声の発声機構のモデル化 音源は比較的単純な波形と

  • SPTKの使い方 (7) メルケプストラム分析合成 - 人工知能に関する断創録

    SPTKの使い方 (6)(2012/8/5)の続き。 今回は、SPTK(2012/7/1)を使って音声合成の実験をしてみました。ここで言う音声合成は、テキストを音声に変換するTTS(Text-to-Speech)ではなく、分析合成と呼ばれるものです。 分析合成では、人間の音声からパラメータを抽出し、ソース・フィルタモデル(Wikipedia)を用いて音声を再合成します。いわゆるヴォコーダーという技術です。ヴォコーダー(Wikipedia)を調べると 来の意味は通信用の音声圧縮技術で、携帯電話などの多くの機器で使用されている。音声の波形を直接送るのではなくパラメータ化して送り、受信側ではそれらのパラメータから元の音声を合成する。 ヴォコーダー(Wikipedia) とあります。ん?ということは、携帯電話で聞いているのは実際の肉声ではなく、パラメータから再合成した合成音声なのですかね?これは

    SPTKの使い方 (7) メルケプストラム分析合成 - 人工知能に関する断創録
  • 第250回 Ubuntuに日本語を話してもらおう(前編) | gihyo.jp

    今回から2回に渡り、Ubuntuで利用可能ないくつかのソフトウェアを組み合わせて、入力テキストを喋る仕組みを作るレシピをお届けします。Mbrola、MeCabを使って音声を合成し、Linuxのサウンドサブシステムを通じて音声を出力します。 MBROLAプロジェクトとは MBROLAとは、汎用音声合成エンジン「mbrola」と、mbrolaで利用可能な音声データベースを開発するプロジェクトです[1]⁠。1995年にベルギーのFaculte Polytechnique de Mons大学のTCTS研究室が開始しました。音声合成エンジンもデータベースもバイナリーの形で提供されているためオープンソースソフトウェアではありませんが、フリーなライセンス[2]のもとで利用できます。 DebianやUbuntuではmbrolaのパッケージが提供されています。Ubuntuソフトウェアセンターでmbrolaを

    第250回 Ubuntuに日本語を話してもらおう(前編) | gihyo.jp
  • 無料なのに多機能!音声合成ソフト「CeVIO Creative Studio FREE」ご紹介

    【より詳しいPV第2弾も絶賛公開中!⇒ http://t.co/4ve50lK9Yo 】 クリエイター向け創作支援プロジェクト「CeVIO」がお贈りするWindows音声合成ソフト「CeVIO Creative Studio FREE」がついに公開!誰でも無料でダウンロードでき、非商用利用であればご自由にお使い頂けます。どんなソフトなのか、オリジナルキャラクター「さとうささら」がその特徴をご紹介!興味を持って下さった方はぜひ、CeVIO公式サイト http://cevio.jp/ からダウンロードして色々と試してみて下さいね! さらに「CeVIO Creative Studio FREE」は今後もバージョンアップを予定しており、6月末には歌声合成機能の追加版­も(もちろん無償で!)公開できる見込みです。 最新情報は"CeVIOスタッフtwitter http://twitter.com

    無料なのに多機能!音声合成ソフト「CeVIO Creative Studio FREE」ご紹介
    unarist
    unarist 2013/04/29
    喋り向けにしたボーカロイドって感じの音とUI
  • 1