【WhisperAX】オフラインで動かせる翻訳AIの使い方を徹底解説!

みなさんは、世界中の人とおしゃべりできるようになりたいと思ったことはありませんか。

ドラえもんであった「翻訳こんにゃく」が実現したらいいのに…と誰もが考えたことがあると思います。

でも、この願いがAI(人工知能)によって叶ってしまうかもしれません。

今回はiPhoneのローカルで動かせる翻訳&文字書き起こしAIである「WhisperAX」の使い方を徹底解説していきます。

1. オフライン翻訳AI「WhisperAX」とは

WhisperAXとはリアルタイムで音声を翻訳したり、文字起こしをしたりすることができるアプリです。 もともとWhisperAXの「Whisper」とは、2022年9月にOpenAIによってオープンソース化された音声認識AIでした。 2023年11月に設立されたArgmaxというスタートアップによって、WhisperとアップルのCoreMLフレームワークが統合され、WhisperAXが生まれました。 現在はArgmaxによってAIをMac上で開発できる「WhisperKit」が公開され、誰でもAI開発が可能になっています。 また、WhisperKitは商用利用も可能となっており、マネタイズをしたい企業にとっても使いやすいツールとなっているといえるでしょう。

↑WhisperAXの使用画面。英語でも日本語でも文字起こしをしてくれます。

2.WhisperAXの使い方

WhisperAXの使い方を説明します。なお、WhisperAXはiPhoneのiOSにのみ公開されており、Androidではアプリが使えないので注意が必要です。

  1. App Storeから「TestFlight」をダウンロードします。
  2. 次にWhisperAXのベータ版にアクセスしてください。するとWhisperAXのベータ版がアプリとして表示されます。
  3. WhisperAXを開いて、好みのAIモデルをローディングします。(おすすめは”whisper-large-v3 turbo 954MB”です。)
  4. インストールが完了するまで数分待ちます。
  5. インストールが完了したら、「Stream(ストリーム)」というボタンを押し、好きな言語を設定し、書き起こしや翻訳をお試しください。

より詳しく説明していきます。 ① 「TestFlight」のアプリを下のURLからダウンロード。 → TestFlight

(画像:App Storeより引用) ② TestFlightがインストール出来たら、「WhisperAX」のベータ版にアクセス。 下記ののURLにアクセスして、”ベータ版に参加する”というタイトルの下にある「テストを開始」というボタンをクリックします。 → ベータ版に参加する

(画像:App Storeより引用) ③ WhisperAXを開いて「whisper-large-v3 turbo 954MB」をロードする。 ロードするAIモデルは「whisper-large-v3 turbo 954MB」がおすすめです。他のモデルも試してみましたが、このモデルが一番速くて正確な気がします。

(画像:App Storeより引用) ④ モデルがロードされるのを2、3分待つ。 ロード中もアプリを開いておいた方が良さそうです。ロード時間が長かったので他のアプリを開いていたら、ロードが止まってしまいました(汗)

(画像:App Storeより引用) ⑤ ロードが完了したら、「Stream」というボタンをクリックして翻訳の準備が完了です! ちなみに「Stream」ではリアルタイムでの翻訳や文字起こしをしてくれて、「Transcribe」では音声ファイルや録音したものの文字起こしをしてくれます。 実際に「Stream」で文字起こしをさせたときの結果が下の通りです。翻訳が間違っているときにも自動でAIが編集して直してくれます。 Languageを「Japanese」にすることをお忘れなく!

(画像:Whisperkitサービス利用画面を撮影)

3. WhisperAXの使用用途

まずWhisperAXを使うことによって、議会の文字起こしが簡単になりそうだと思いました。 日本語での発言を正確に書き起こしてくれるので、今まで手動で行っていた作業がかなり楽になります。人間の手で文字起こしをすると30分の会議でも6時間ぐらいかかってしまいます。それを一瞬で行ってくれるのはやはりAIの凄さだと思います。 その次には、翻訳です。3、4秒のラグはあるものの、話したことを別の言語に翻訳してくれるのはとても便利だと思いました。 今まではGoogle翻訳やDeepLで翻訳をしていましたが、WhisperAXを使うことでボタン操作をすることなくリアルタイムで翻訳ができるようになったと思います。 自動翻訳がもう少し速くなったら、言語学習をする必要性も将来的にはなくなるかもしれません。 今までは言語が通じない国に行くのが恐いと感じていましたが、WhisperAXを使えばコミュニケーションが取れるのでかなり気持ちが楽になります。 日本語だけで世界旅行ももうすぐかもしれませんね! また、AI相談.comでも無料で使えるAIチャットを公開しています。調べ事がしたい時や、AIの専門家と話したいときにぜひチャットをご活用ください。

参考文献 ・WhisperAX on TestFlightCore MLCore ML Integrate machine learning models into your appWhisperKit / License

Read more

リアルタイム投票アプリ5選【ライブ配信やイベントで】

リアルタイム投票アプリ5選【ライブ配信やイベントで】

ウェビナーやセミナー、社内研修を実施する際、「参加者が受け身になってしまう」「質問がなかなか出てこない」といった課題を感じたことはないでしょうか。 オンラインでの情報発信が当たり前になった今、一方的な配信だけでは参加者の満足度を高めることが難しくなっています。そこで注目されているのが、リアルタイムで参加者の意見を集約し、その場で結果を共有できる投票・質問ツールです。 本記事では、ライブ配信やイベント、研修などで活用できるリアルタイム投票アプリを5つ厳選してご紹介します。 リアルタイム投票でつながる参加者とイベント リアルタイム投票やQ&A機能を使うと、視聴者や参加者の意見を即座に集計・表示できます。講義や会議の進行を妨げず、参加者全員が自分の意見を簡単に表明できる仕組みです。 従来の挙手による質疑応答では、発言しづらいと感じる参加者も少なくありません。特にオンラインイベントでは、カメラがオンになっていることへの抵抗感や、大人数の前で質問することへのハードルが存在します。 しかし、スマートフォンから匿名で投票やコメントができる仕組みがあれば、参加者は気軽に自分の意見を伝えら

By 阿部 隼也
質問受付ツールの選び方とおすすめ5選を紹介

質問受付ツールの選び方とおすすめ5選を紹介

セミナーや講演会、社内研修などで「質問はありませんか?」と投げかけても、なかなか手が挙がらない経験はないでしょうか。参加者に有益な情報を提供しても、疑問や意見が共有されないまま終わってしまうのは、主催者にとっても参加者にとっても大きな機会損失です。 こうした課題を解決するために注目されているのが「質問受付ツール」です。参加者がスマートフォンから匿名で質問を投稿できるため、発言への抵抗感が下がり、活発なコミュニケーションが生まれます。 本記事では、質問受付ツールの基本機能から、実際に役立つおすすめツール5選、そして選定時に押さえておきたいポイントまで、実務に活かせる情報をまとめて解説します。 質問受付の現場課題 イベントやセミナーの運営で最も頭を悩ませる問題の一つが、参加者からの質問をいかに引き出すかという点です。質問タイムを設けても、会場がシーンと静まり返ってしまい、仕方なく「それでは時間になりましたので」と締めくくる光景は珍しくありません。 この背景には、日本特有の文化的要因も関係しています。大勢の前で発言することへの恥ずかしさ、自分の質問が的外れではないかという不安、他

By 阿部 隼也
オンラインセミナーアプリの選び方。参加者エンゲージメントを高めるポイント

オンラインセミナーアプリの選び方。参加者エンゲージメントを高めるポイント

近年、オンラインセミナーの活用が急速に広がっています。会場のコストや移動時間を気にすることなく、全国・世界中から参加者を集められる点は大きな魅力です。 しかし、せっかく開催しても 「参加者が途中で離脱してしまう」 「ただ見ているだけで反応が薄い」 といった課題を抱えている企業も少なくありません。 本記事では、参加者のエンゲージメントを高め、成果につながるオンラインセミナーアプリの選び方と、実務に役立つ具体的なポイントを解説します。 参加者とのつながりを生むオンライン環境の設計 オンラインセミナーにおける最大の課題は、画面越しの距離感です。会場で直接顔を合わせる機会がないからこそ、参加者が「ただ見ているだけ」にならないような仕組みが求められます。適切なツールと機能選びが、参加者のエンゲージメントを左右します。 従来のオフラインセミナーでは、会場の雰囲気や参加者同士の反応が自然と生まれましたが、オンラインではそうした「空気感」が伝わりにくくなります。だからこそ、双方向のコミュニケーション機能や、参加者の行動データを活用した設計が重要になるのです。 エンゲージメントを高

By 阿部 隼也
参加者の質問を効率的に管理!ZoomウェビナーQ&A機能の使い方を徹底解説

参加者の質問を効率的に管理!ZoomウェビナーQ&A機能の使い方を徹底解説

オンラインでのセミナーやイベントが日常化する中で、Zoomウェビナーを活用している企業が増えています。しかし、ウェビナーの開催で意外と頭を悩ませるのが「参加者からの質問をどう管理するか」という点ではないでしょうか。 セミナーが盛り上がり、次々と質問が寄せられるのは嬉しいことです。一方で、質問が多すぎて整理しきれない、どの質問に優先的に答えるべきか判断に迷う、といった課題も生じます。こうした問題を解決するために役立つのが、ZoomウェビナーのQ&A機能です。 本記事では、ZoomウェビナーのQ&A機能の基本的な使い方から、参加者の質問を効率的に管理する実践的なテクニックまで、詳しく解説していきます。 ZoomウェビナーのQ&A機能とは ZoomウェビナーのQ&A機能は、ウェビナー開催中に参加者が質問を投稿し、主催者側が回答を行うための専用機能です。この機能を使うことで、質問と回答がスレッド形式で整理され、効率的なコミュニケーションが可能になります。 チャット機能との違い Zoomには「チャット機能」もあるため、「Q&A機能とチャット機能の違いは何か」と疑問に思う方も多いで

By 阿部 隼也