ポッドキャスト シリーズ「XRey」が人工知能でフランコの声を複製するために Vicomtech を利用
この音声クローン作成は大きな科学技術的課題であり、Vicomtech は音声処理に適用される人工知能技術を通じて解決しました。
XRey、一連の ストーリーラボ 独占ポッドキャストの形で スポティファイ 監督・脚本は アルバロ・デ・コサル、によって制作されました。 トニー・ガリド、25 分の 10 章を通して、その生涯を振り返ります。 名誉国王フアン・カルロス1世。
未公開の音声、インタビュー、元国王院長官ラファエル・スポトルノなどの 40 を超える直接証言を通じて。ヒスパニストのポール・プレストンや政治家のアルフレッド・ペレス・ルバルカバなど、君主の人生における最も重要な瞬間が明らかにされる。
シリーズ「The Story Lab」では、彼が望んでいたのは、 フランシスコ・フランコの声を複製する。彼らは独裁者の声を真似するために俳優のところに行くのではなく、自らを権力の手に委ねるのだ。 ビコムテック。
バスクの会社は、脚本の 2 つの重要な瞬間と、シリーズを完成させる 2 つのボーナス トラックのうちの 1 つ(作成プロセスが説明されている)専用に、フランコのクローン音声を生成しました。
この開発の目的は、テクノロジーを通じてスクリプトの要件に応答することにのみ焦点を当てています。 XRey これは第4章でフランコの声を再現することで構成されており、フランコ自身が息子のフアン・カルロスを国家元首の後継者に提案するドン・ファンに宛てて書いた手紙を朗読する場面と、第5章での別の介入が含まれていた。
をベースとした今回の開発の技術的挑戦 人工知能 これは、特定の声のクローンを革新的なナラティブ技術に適用することで構成されており、まだ探求されていない可能性が数多くあります。
使用されているテクノロジーとそれに基づく ディープニューラルネットワーク、最初は約 20 個のトレーニング オーディオを見つけて、高品質のモデルを生成しました。ただし、この場合、良好な状態でノイズがなく、求められていた語り口調の音声を見つけるのが困難だったため、主に独裁者のクリスマス演説で構成されたモデルをわずか 6 時間で生成する必要がありました。
この限られた材料と高度な人工知能技術の応用により、Vicomtech は、 リアルな音声合成モデル これにより、最終的にフランコの声のすべての特徴、ニュアンス、スタイルが得られます。
開発されたテクノロジーは、Vicomtech の音声および自然言語テクノロジー研究グループの関与と数週間の作業の結果です。
今週、Spotifyはフランコの声を複製するプロセスがどのようなものか詳しく説明したボーナストラックを公開した。
この記事は気に入りましたか?
購読してください ニュースレター 何も見逃すことはありません。


















