はじめに:文字起こしは録音がすべて
文字起こしのツールはたくさんあって、どれを使ったらいいか迷いますよね。でも、文字起こしにおいて最も重要なのは文字起こしツールではなく「録音」なんです。アナウンサーさんがニュースの原稿を読んでいるような録音、あるいはインタビューのように録音機器に近い位置での録音であれば、どのようなツールであってもすばらしい完成度になります。
一方で、広い会場で複数の人が意見を交わす会議のようなものは録音状態が悪くなりがちで、あまりうまくいきません。出席者が多い場合は、むしろオンライン会議のほうがよく声を拾いますので、ZoomやTeamsなどのほうが安心です。これらには文字起こし機能もあって、そのままテキストを取り出すこともできますしね。それに、録画しておけば、誰が発言したかあとから確認することも可能です。ただ、通信環境に左右されてしまうという弱点もあります。
オンライン会議ではない場合は、マイクの準備を含めて、できるだけよい録音状態になるように工夫してみてください。話し手の背中側から録音するとうまく音が拾えないことがありますので、レコーダーの位置にも注意が必要です。「文字起こしは録音がすべて」といっても過言ではありません。
パソコン環境を確認しよう
文字起こしのツールはいろいろありますが、まず、ご自分のPC環境を確認してみましょう。例えば、Microsoft365を利用していれば、今すぐあっという間に文字起こしができますし、Googleであれば、Geminiの有料プランに入っている場合も同様です。
もちろん、どちらも利用していなくても文字起こしはできますので安心してください。ただ、無料でできることは限られていますので、どのみち、なにがしかの料金が発生するのであれば、日本語の文字起こしに特化したサービスを利用したいというお考えも一理あると思います。ですから、どこにお金をかけるか、またはかけないかを決める必要があるんですね。これは文字起こしの頻度や量にもよると思います。
この記事では、「1.Windows系」「2.Google系」、そして「3.日本語の文字起こしに特化した外部ツール」の3つに分けて、簡単に利用できる代表的な3つの方法をご紹介したいと思います。
1.Windows系:「Word+Copilot」の文字起こし
Word(ワード)は日常的に使っているかと思いますが、WordとCopilotを使った文字起こしがとても優秀なので、ぜひとも使っていただきたいと思います。特別に何か新しいアプリを入れる必要もなく、すぐに使い始めることができます。また、文字起こしだけではなく話者立てや要約までしてくれるんですね。
何より安心なのが、音声ファイルのアップロード先が自分のOneDrive内ということです。これなら大事な音声ファイルが行方不明になりませんし、こまめに削除するなど管理も容易です。
ただ、Microsoft365の利用が必須です。Officeは使っていても、「買い切り版」だと残念ながら文字起こしはできません。各自でどのプランを利用しているか確認してみてくださいね。

「Word+Copilot」で文字起こしをする手順
では、Wordを使って文字起こしする手順を順番に紹介していきたいと思います。

【ステップ1】まず、Wordで[白紙の文書]を開きます。[ホーム]から「右端」のマイクマークのディクテーションの下向き矢印をクリックし、「トランスクリプト」を選択します。

【ステップ2】すると「音声をアップロード」が選べる画面になりますので、お使いのPC内から起こしたい音声ファイルや動画ファイルをアップロードします。
対応している保存形式は「wav mp4 m4a mp3」ですので、それ以外はファイル変換ソフトなどで変換する必要があります。拡張子を確認しましょう。
アップロードすると自動で文字起こしが開始されます。少し時間がかかりますので終了するまでしばらく待ちます。

【ステップ3】文字起こしが完了すると、下に「ドキュメントに追加」のボタンが出現します。そこで、テキストだけ取り出すのかタイムスタンプも一緒に取り出すのかなど選ぶことができますし、話者名を編集することもできます。希望の形を選んで「ドキュメントに追加」すればWordの白紙の文書にコピーされます。とっても簡単ですよね。
また、Copilotを使うと、「文字起こし」だけでなく、「要約」や「感情分析」なども可能です。特に「要約」は優秀ですので、文字起こしに慣れてきたらこうした機能も使いこなしていきましょう。
ただ、これはまだ下書きの段階ですので、実際の文字起こしの作業はここからです。つまり、聴き直して修正する作業が大事なんですね。これでやっと下準備ができたところです。
文字起こしは「とても耳に負担のかかる作業」ですので、できるだけ下準備としてこうしたツールを用いることをお勧めします。
2.「Google系」:マイクに向かって話すならGoogleドキュメント
次にGoogle系で文字起こしできるものをご紹介していきたいと思います。
「Googleドキュメント」はGoogleが無料で提供しているサービスですが、これを使えば簡単に文字起こしができます。ただし、この方法は基本的に「マイクに向かって話しながら文字にする」ために設計されています。
録音されたものを再生しながら文字化することも可能ですが、その場合も「スピーカーで音声を再生しながらマイクに拾わせる」という方法になりますので、1時間の録音なら1時間かかることになります。また、PCによってはマイクなどの設定を変えなければならないことがあります。
あらかじめ録音したファイルの文字起こしに使ってみたところ、ちょくちょく動作が停止してしまうので、そのたびにマイクボタンを押す必要があって、その点は不便ですが、自分の声を文字にしたり短い録音で手軽に利用したい場合にはとても使いやすい機能です。文字起こしした文字データはGoogleドキュメント内に保存されます。
Googleドキュメントで文字起こしをする手順
それでは、Googleドキュメントを使って文字起こしする手順をご紹介していきたいと思います。
(1)Googleのサイトの右端の点々マークから「ドキュメント」を選択します。次に、新しいドキュメントを「+」ボタンで作成します。

(2)画面上部のメニューから「ツール」をクリックし、「音声入力」を選択します。

(3)マイクのアイコンが表示されるので、アイコンをクリックして有効にします。右上のマイクの認識を示すところが赤丸になっていればOKです。マイクに向かって話しかけると話した内容がリアルタイムで文字に変換されていきます。音声ファイルを再生させる場合は、先に音声を再生させ、そのあとにマイクのアイコンをクリックします。

音声ファイルの文字化に適したGoogleのサービスは?
ただ、この方法はあらかじめ録音されたものを文字起こしするには時間がかかりすぎるのが難点です。ほかにGoogleが提供する文字起こし機能としては、「Google AI Studio」でAIに文字起こしを依頼する方法と「有料版のGemini」を使う文字起こしがあります。
「Google AI Studio」は無料で利用できます。一般向けのものではなく開発者向けなので少しわかりにくいところがありますが、慣れれば問題なく利用できます。また、プロンプトを入れて自分の好みの形式にすることもできます。つまり、「”えー”とか”あのう”は取って日本語の文字起こしをしてください」というようにAIに指示できるんですね。
【Google AI Studioで文字起こしをする手順】
・文字起こししたい音声ファイルをMP3やWAV形式で用意します。
・Googleアカウントにログインした状態で「Google AI Studio」にアクセスします。
・チャット画面の右下にある「+」ボタンをクリックし、「Upload file」から用意した音声ファイルをアップロードします。
・音声ファイルが読み込まれたら、テキスト入力欄に文字起こしの指示(プロンプト)を入力します。(例:「この音声ファイルを日本語で文字起こししてください」)
・プロンプトを入力し「実行(Run)」ボタンを押すとAIが文字起こしを開始します。
・結果はチャット画面に表示されるので、コピーして活用してください。
ただ、長すぎる音声ファイルは処理に失敗することがあるので、その場合はファイルを分割して試してみてください。
有料版のGeminiも機能としてはほぼ同じですが、大きな容量の音声ファイルを一度に処理できますので「Google AI Studio」のように制限を気にせずに利用できます。
【Google AI Proで文字起こしをする手順】
・Geminiを開いて「+」から音声ファイルや動画ファイルをアップロードします。
・プロンプトの欄に「このファイルを日本語で文字起こししてください」というように指示して実行します。
Geminiは「+」を押して素材をアップロードして、プロンプトを書いて指示するだけ!ですので、とてもシンプルでストレスなく利用できます。また、「以下の会議の音声ファイルを文字起こししてください。その上で決定事項を箇条書きでリストアップしてください」というような高度なプロンプトにも応えてくれます。ただ、現状では動画ファイルはアップロードできないようです。
AIはどれも優秀なので、Geminiの有料版にするか、Copilotが使える契約にするか、それともChatGTPを充実させるかなど迷いますよね。AIは文字起こしだけに使うわけではないと思いますので、総合的に判断してみてくださいね。
3.「notta」:日本語の文字起こしに特化したサービスを利用する
ここまでMicrosoft系とGoogle系の文字起こし機能について触れてきましたが、ChatGTPも含め、これらはみんな海外企業のサービスなんですね。もちろん、日本企業のサービスも海外企業のシステムがベースになっていますので、海外企業であることに何の問題もありません。
ただ、問題はサポートです。どうしてもわからないとき、困ったとき、相談したいときに、海外の企業だと心もとないことがあって、そもそも直接やりとりできないことも少なくありません。
そこでおすすめしたいのがnottaです。nottaは東京に本社を置く企業ですので国内の需要についてよく理解していますし、サポートも充実しています。文字情報だけでなくYouTubeでの解説動画もたくさんあります。
ただ、費用対効果を考えると、おすすめできる対象は高頻度で文字起こしをする必要がある人ということになるでしょうか。

nottaは、「Notta Memo」というAIボイスレコーダーと組み合わせることができますので、登記用の議事録を作りたいという本格的な利用はもとより、商談や電話の内容を証拠として記録しておきたい、時系列に沿って内容をきちんと書きとどめておきたいというビジネスシーンにぴったりです。しかも「Notta Memo」はリアルタイム翻訳機能もあるというすぐれものです。
ビジネス用途ばかりでなく、例えば医療現場において、海外からいらした患者さんとのコミュニケーションも翻訳機能を使えばスムーズでしょうし、会話の内容を録音して、その内容を文字情報として記録に残せます。これから日本に移住されてくる方がどんどん増えていきますので、このような需要は増すばかりではないでしょうか。
このように、場に応じたアドオンのサービス内容や設定方法などについても、日本の企業であれば丁寧に相談に乗ってくれるはずです。nottaを最大限に活用してコミュニケーションの壁をどんどん低くしてみてくださいね。
nottaの登録方法は下の「文字起こしさん」のサイトが詳しいので参考にしてみてください。nottaの難点は使い始める登録段階が少し面倒なんですね。自分の「ワークスペース」を作って、そこで作業するイメージです。私はこちらのサイトを参考にさせていただきました。
利用頻度が少ない場合は、むしろ「文字起こしさん」が料金もお手頃ですし、操作も簡単でおすすめです。「文字起こしさん」も日本語に特化した文字起こしサービスを展開しています。それぞれご自分に合ったものを選んでみてくださいね。

おわりに
今回は、手始めに文字起こしのためのツールをご紹介しました。ただ、文字起こしはこれで終わりではありません。ここから聴き直して正確な議事録や講演録に仕上げていくんですね。次回は、取り出した文字データを修正する方法についてまとめてみたいと思います。最後まで読んでくださってありがとうございました。


