【設定方法】Windows11対応のAI音声読み上げアプリ、英語や中国語など外国語の文章にも対応【ソフト/YouTuber/海外向け製品動画作成/iMyFone VoxBox レビュー】

YouTubeなど動画サービスがビジネスで多用される中、「入力した文章をAIの機械音声で読み上げてくれるアプリ」が注目を集めています。

例えば、製品紹介のナレーションで長文や専門用語が多い場合、自分の声を録音するより音声読み上げアプリを利用したほうが効率的です。

教育分野でも、授業の資料を予め音声でデータ化することにより簡単に繰り返し利用でき、視覚に障がいのある児童・生徒に向けて分かりやすい授業を行うことができます。

今回は、日本語だけでなく英語や中国語など46種類以上の外国語に対応し、読み上げとは逆の文字起こしにも対応した「VoxBox」というソフトウェアをご紹介いたします。

【iMyFone VoxBox】主な機能
音声読み上げに必要なもの
VoxBoxの特長
活用事例
【無料トライアル版】インストール設定方法
【使用方法】テキスト読み上げ
画像の文字を読み取って音声読み上げする方法
PDFやWordファイルを文字変換して音声読み上げする方法
便利な機能
ユーザーレビュー
有料版ライセンスの購入方法
レビュー・参考サイト
まとめ

【iMyFone VoxBox】主な機能

「iMyFone VoxBox」は、入力した文章の読み上げ・録音・音声形式の変換・編集などの機能を備えた統合型オーディオツールです。

全機能を利用可能な「有料版」がオススメですが、使いたい機能が自分に合っているかまず「無料トライアル版」でテストしましょう。

「iMyFone VoxBox」の便利な機能はコチラ

テキスト読み上げ（日本語、英語・中国語など各外国語対応）
画像、PDF、WordのOCR音声読み上げ（文字認識）
音声データの書き起こしでテロップ作成
オリジナル音声データの録音、編集
YouTubeやTwitterなど動画データの音声変換
musicデータのボーカル除去（※近日公開予定）

音声読み上げに必要なもの

音声読み上げアプリを利用するには、ソフトをインストールするパソコンとマイク・スピーカーが必要です。不足するものがあれば以下を参考に準備しましょう。

・「VoxBox」をインストールするPC

マイクロソフト Surface Pro X/Microsoft SQ1 / Office H&B 2019 搭載 / 13インチ / SQ1 / 8GB / 128GB / LTE/ブラック MJX-00011

マイクロソフト

¥81,500 （2023/09/17 16:31時点 | Amazon調べ）

Amazon

楽天市場

ポチップ

・スピーカー＋マイク　※PCに内蔵していない場合

Anker PowerConf S3 スピーカーフォン会議用マイク Bluetooth 対応 24時間連続使用グループモード対応 USB-C接続オンライン会議テレワーク在宅会議用システムウェブ会議テレビ会議ビデオ会議（グレー：ファブリック）

Anker

¥9,990 （2023/04/30 17:38時点 | Amazon調べ）

Amazon

楽天市場

ポチップ

・マイク　※PCに内蔵していない場合

マランツプロコンデンサーマイク、ゲーミング、配信、録音、単一指向性、ショックマウント、ウインドスクリーン、マイクスタンド、XLRケーブル付属 48Vファンタム電源 MPM-1000

マランツプロ(Marantz Professional)

¥6,000 （2023/04/30 17:40時点 | Amazon調べ）

Amazon

楽天市場

ポチップ

マイク付き有線ヘッドセットステレオサラウンドヘッドセットPCゲーミングヘッドセット（ピンク）

Mokochy

¥2,294 （2023/04/30 17:41時点 | Amazon調べ）

Amazon

ポチップ

Hakeeta ミニヘッドマウント有線マイク装着型マイクコンデンサーマイク教師、コーチ、プレゼンテーション、ツアーガイド向け

Hakeeta

¥899 （2023/04/30 17:42時点 | Amazon調べ）

Amazon

ポチップ

VoxBoxの特長

多言語対応
日本語はもちろん、英語や中国語、ヒンディー語など多くの言語に対応

多彩なAIボイス
男性・女性、ニュースキャスターや子供、ヨーダやスポンジボブなどのキャラクターやラッパーなど豊富な音声より選ぶことが出来ます。

シンプルな操作とセキュリティ
操作は簡単。テキストを入力して言語と声を選ぶだけ。音声データは日々更新されています。また、広告や個人情報を読み取るようなプログラムはなく、安心安全に利用することが出来ます。

活用事例

ビジネス
海外向けの商品提案として、翻訳したテキストを入力し音声読み上げすることで英語や外国語を話すことが出来なくてもYouTubeなどでナレーションを付けた動画を作成することが出来ます。

接客
留守電やAIの待ち受けシステムなど定型的な音声を生成することが出来ます。

音声ブック、ラジオ
本などの長文テキストも高品質に音声読み上げすることが可能です。

SNS
YouTubeだけでなく、Twitter・Instagram・TikTokやFacebookなどSNSのショート動画へ簡単に音声を追加することができます。

【無料トライアル版】インストール設定方法

公式サイトより「無料ダウンロード」を選択します。

ファイル名「imyfone-voxbox_setup-com_jp.exe」のダウンロードが完了したら「ファイルを開く」を選択します。※図はWindows Edgeの例

ダウンロード先より実行でもOKです。

「VoxBox」のインストーラーが起動したら使用許諾にチェックが入っていることを確認し「インストール」を選択します。
右下の「カスタムインストール」は、インストールする場所を変更することが出来ます。

数十秒程度でインストールが完了しますので「今すぐ開始」を選択します。

完了画面は閉じます。

インストールが完了すると「VoxBox」が立ち上がります。

以上でインストールは完了です。

【使用方法】テキスト読み上げ

今回は利用方法の一例として、「ChatGPT」でサンプルの文章を生成し「VoxBox」で読み上げます。

「ChatGPT」へ「サンプルスピーチをAIをテーマに200字程度にまとめて」と入力。

左メニューより「テキスト読み上げ」を選択します。
次に「ChatGPT」で生成した文章をコピーして「テキストボックス」へ貼り付け、入力言語と出力言語を「日本語」に設定して「変換」を選択します。

無料トライアル版は変換文字数に制限（2000文字）がありますが、今回はテストなのでそのまま「確認」を選択します。

変換が完了すると音声確認項目が表示されるので、音声を確認し問題なければ「出力」を選択します。

「出力」画面で、「ファイル名」「出力形式」「保存先」を選んで「確認」を選択します。

出力形式
MP3　→　圧縮されデータ量は少ないが音質は下がる、対応機種が多い。
AAC　→　圧縮されデータ量は少ないが音質は下がる、Apple製品など。
WAV　→　音質はいいがデータ量が大きくなる。

「開く」もしくは「確認」を選択して音声ファイルを確認します。

このような読み上げを行うことが可能です。

https://youtu.be/FKlXWElNORg

iMyFone VoxBox 2023 04 30_読み上げ

【参考】「ボイスのスタイル」「ボイス」を選択することで、読み上げる声などを変更することが出来ます。

【参考】各ボタンを操作することで、音声読み上げデータに「一時停止」「音量」「ピッチ」「速度」「強調」などを変更することが出来ます。

画像の文字を読み取って音声読み上げする方法

「png」や「jpg」など画像データにあるテキストデータを文字認識（OCR）して読み上げることが出来ます。※他jpeg/bmp/tiff

左メニューの「画像読み上げ」より「ファイルを追加」を選択します。

今回は「VoxBox」の口コミ記事を画像切り抜きして読み取りを行います。
以下のような画像なのでテキストデータはコピーできません。

画像で読み上げたい言語を選んで「読み取り」を選択します。今回は日本語です。
日本語以外にも、「English」「spanish」「chinese」「korean」など各外国言語に対応します。

読み取りが完了すると画像よりテキストデータが自動で入力されます。
一部、変換がおかしい箇所があるので目視で修正します。

テキスト読み上げと同じように、入力言語や出力言語などを選び「変換」を選択して音声読み上げを行います。

PDFやWordファイルを文字変換して音声読み上げする方法

「pdf」や「doc/docx」などPDFやワードデータのテキストデータを文字認識（OCR）して読み上げることが出来ます。

左メニューの「PDF読み上げ」より「ファイルを追加」を選択します。

今回は、文部科学省で一般公開されている「令和3年版科学技術・イノベーション白書　本文（PDF版）」の資料を利用します。第１部　Society 5.0の実現に向けて

以下のように読み込まれました。「変換」を選択することで音声読み上げデータを生成することが出来ます。

便利な機能

ここまで紹介した「入力した文章の音声読み上げ」や「画像やPDFの音声読み上げ」の他、音声ファイルの書き起こしや別の声で読み上げ、録音や動画ファイルから音声データの変換など便利な機能は「iMyFone VoxBox 使用ガイド」をご確認下さい。

ユーザーレビュー

iMyFone VoxBox ユーザーレビュー

有料版ライセンスの購入方法

トライアル版で機能を確認し、データ復元できそうであれば有料版ライセンスを購入してライセンスキーを取得します。

無料トライアル版と有料版の違い

	無料トライアル版	有料版
読み上げ文字数	3,000文字	25万文字以上
文字起こし時間	3分	120分以上
録音の長さ	1分	制限なし
音声変換	ファイルの半分	制限なし
音声と言語	制限あり	3200種類以上の音声 46種類以上の言語