【Voice Engine】15秒間のスピーチを真似してしゃべるAIをOpenAIが開発！一般公開日は不明

阿部隼也

22 9月 2025 — 2 min read

OpenAIが15秒の声をコピーして、そっくりな音声を生成することができるAI「Voice Engine」を発表しました！（読み方は”ボイス・エンジン”です。）

1. Voice Engineは何がすごい？

Voice Engineの凄いところは、本物の音源そっくりな音声を生成できることにあります。

たった15秒間の音声サンプルだけで、似た音声を出すことができるのは今までの音声AIと比べて革新的といえるでしょう。

OpenAIがテキストを音声に変換するAPIの開発を始めたのが2022年の後半です。同じ時期にChatGPT 音声機能の開発が始まりました。

テキストを音声に変換する機能は音楽アプリSpotifyでも活用されており、ポッドキャストの別の言語に翻訳する際に使われているようです。

Voice Engineはさまざまなインターネットの音源を元にトレーニングされたそうですが、ファイン・チューニングはされていません。

自然な音声を再現するために、ディフュージョンプロセスとトランスフォーマーを活用しているようです。

そのおかげで、わずか15秒という短い音源をコピーすることで、本物そっくりな音声をだすことができるようになったと言われています。

（引用元：OpenAI公式サイト）

2. Voice Engineは他の音声AIに勝てるのか

OpenAIというAI界のトップリーダーが音声AIを発表ことは注目に値するでしょう。

しかし、Eleven LabsやReplica Studiosといった他の音声AIがすでに市場にでている状態ではあります。

後出のVoice Engineは音声AI界で普及するのでしょうか。

Tech Crunchの調査によると、Voice Engineが100万字の音声を生成するのにかかるコストは15ドル（約2250円）だそうです。

ライバルサービスであるEleven Labsは10万字で11ドル（1650円）かかることを考えると、Voice Engineの方がコストパフォーマンスは良いといえるでしょう。

ただ、Voice Engineには声の調整機能がついていません。

15秒間の録音した声がそのまま音声の質に反映されるため、望む声が作れないといった不便さはあると考えられそうです。

一方、Eleven Labsは声のトーンやピッチなどを調整することができるので、よりユーザーが聞きたい声を再現しやすいです。

3. Voice Engineはいつ公開？

Voice Engineが公開されるかはまだわかっていません。

ただ、OpenAIはVoice Engineが悪用されないように入念な確認作業を進めているようです。

オープンソースとして公開することも検討はされているもののリスクが大きいため、いまだ検討段階であるようです。

OpenAIのプロダクトスタッフ、ジェフ・ハリス氏はインタビューで「私たちはこの技術の危険性を理解しており、その対策を講じている」と答えました。

今日、AIを使ったディープフェイクが蔓延しており、詐欺や政治的プロパガンダにおいて使用されています。

そういったリスクを抑えるためOpenAIは慎重に開発を進めていることがわかります。

一般公開されるとしても、ハッキング対策やセキュリティのチェックが必要になるので、リリースは当面先になることが予想されます。

いま分かっていることは、OpenAIは最初、約10グループのディベロッパーにのみVoice Engineを公開するということです。

その10グループに共通するのは「音声」をテーマにしたビジネスを提供していたことでした。

10グループのうちに、教育に特化したITサービスを提供する「Age of Learning」、動画生成AIプラットフォームの「HeyGen」などが含まれています。

4. ディープフェイクとして悪用される危険性はある？

Voice Engineがディープフェイクとして悪用される危険性は低いと考えられます。

その理由は、Voice Engineには音声用の「透かし」がつけられることが明らかにされているからです。

ハリス氏はインタビューで、「透かし」を回避する方法がないとは断言しなかったものの、回避耐性があることを明らかにしています。

OpenAIがVoice Engineによって生成された音声を聞き分けることは簡単とも明言していることから悪用される危険性はかなり低くなると予想されるでしょう。

参考文献・Navigating the Challenges and Opportunities of Synthetic Voices ・OpenAI built a voice cloning tool, but you can’t use it… yet ・OpenAI previews voice generator, acknowledging election risks

リアルタイム投票アプリ5選【ライブ配信やイベントで】

ウェビナーやセミナー、社内研修を実施する際、「参加者が受け身になってしまう」「質問がなかなか出てこない」といった課題を感じたことはないでしょうか。オンラインでの情報発信が当たり前になった今、一方的な配信だけでは参加者の満足度を高めることが難しくなっています。そこで注目されているのが、リアルタイムで参加者の意見を集約し、その場で結果を共有できる投票・質問ツールです。本記事では、ライブ配信やイベント、研修などで活用できるリアルタイム投票アプリを5つ厳選してご紹介します。リアルタイム投票でつながる参加者とイベントリアルタイム投票やQ&A機能を使うと、視聴者や参加者の意見を即座に集計・表示できます。講義や会議の進行を妨げず、参加者全員が自分の意見を簡単に表明できる仕組みです。従来の挙手による質疑応答では、発言しづらいと感じる参加者も少なくありません。特にオンラインイベントでは、カメラがオンになっていることへの抵抗感や、大人数の前で質問することへのハードルが存在します。しかし、スマートフォンから匿名で投票やコメントができる仕組みがあれば、参加者は気軽に自分の意見を伝えら

質問受付ツールの選び方とおすすめ5選を紹介

セミナーや講演会、社内研修などで「質問はありませんか?」と投げかけても、なかなか手が挙がらない経験はないでしょうか。参加者に有益な情報を提供しても、疑問や意見が共有されないまま終わってしまうのは、主催者にとっても参加者にとっても大きな機会損失です。こうした課題を解決するために注目されているのが「質問受付ツール」です。参加者がスマートフォンから匿名で質問を投稿できるため、発言への抵抗感が下がり、活発なコミュニケーションが生まれます。本記事では、質問受付ツールの基本機能から、実際に役立つおすすめツール5選、そして選定時に押さえておきたいポイントまで、実務に活かせる情報をまとめて解説します。質問受付の現場課題イベントやセミナーの運営で最も頭を悩ませる問題の一つが、参加者からの質問をいかに引き出すかという点です。質問タイムを設けても、会場がシーンと静まり返ってしまい、仕方なく「それでは時間になりましたので」と締めくくる光景は珍しくありません。この背景には、日本特有の文化的要因も関係しています。大勢の前で発言することへの恥ずかしさ、自分の質問が的外れではないかという不安、他

オンラインセミナーアプリの選び方。参加者エンゲージメントを高めるポイント

近年、オンラインセミナーの活用が急速に広がっています。会場のコストや移動時間を気にすることなく、全国・世界中から参加者を集められる点は大きな魅力です。しかし、せっかく開催しても「参加者が途中で離脱してしまう」「ただ見ているだけで反応が薄い」といった課題を抱えている企業も少なくありません。本記事では、参加者のエンゲージメントを高め、成果につながるオンラインセミナーアプリの選び方と、実務に役立つ具体的なポイントを解説します。参加者とのつながりを生むオンライン環境の設計オンラインセミナーにおける最大の課題は、画面越しの距離感です。会場で直接顔を合わせる機会がないからこそ、参加者が「ただ見ているだけ」にならないような仕組みが求められます。適切なツールと機能選びが、参加者のエンゲージメントを左右します。従来のオフラインセミナーでは、会場の雰囲気や参加者同士の反応が自然と生まれましたが、オンラインではそうした「空気感」が伝わりにくくなります。だからこそ、双方向のコミュニケーション機能や、参加者の行動データを活用した設計が重要になるのです。エンゲージメントを高

参加者の質問を効率的に管理！ZoomウェビナーQ&A機能の使い方を徹底解説

オンラインでのセミナーやイベントが日常化する中で、Zoomウェビナーを活用している企業が増えています。しかし、ウェビナーの開催で意外と頭を悩ませるのが「参加者からの質問をどう管理するか」という点ではないでしょうか。セミナーが盛り上がり、次々と質問が寄せられるのは嬉しいことです。一方で、質問が多すぎて整理しきれない、どの質問に優先的に答えるべきか判断に迷う、といった課題も生じます。こうした問題を解決するために役立つのが、ZoomウェビナーのQ&A機能です。本記事では、ZoomウェビナーのQ&A機能の基本的な使い方から、参加者の質問を効率的に管理する実践的なテクニックまで、詳しく解説していきます。 ZoomウェビナーのQ&A機能とは ZoomウェビナーのQ&A機能は、ウェビナー開催中に参加者が質問を投稿し、主催者側が回答を行うための専用機能です。この機能を使うことで、質問と回答がスレッド形式で整理され、効率的なコミュニケーションが可能になります。チャット機能との違い Zoomには「チャット機能」もあるため、「Q&A機能とチャット機能の違いは何か」と疑問に思う方も多いで