Macでの文字起こし:Siriの音声入力を使うべき時とAIオプションを使うべき時

Macでの文字起こし:Siriの音声入力を使うべき時とAIオプションを使うべき時

音声のリアルタイム文字起こしや既存の音声ファイルの文字起こしは、時代とともにますます進化しています。Macで最適なオプションとその使い方をご紹介します。

音声の書き起こしは、録音した音声を一時停止したり、再生したり、巻き戻したり、すべての単語の音節を二重に確認したりしなければならないなど、まさに悪夢のような作業になりかねません。生のスピーチの場合はさらに大変です。相手に何度も繰り返してもらうのは気が進まないし、そもそも無理かもしれません。理由が何であれ、Macで音声を書き起こす方法はいくつかあります。

Siriで音声を書き起こす

Siri によるディクテーションには欠点もあります。

Siri によるディクテーションには欠点もあります。

すぐに使えるオプションはSiriです。どのMacでもSiriを使えば、マイクから送られてくる音声のライブストリームを文字起こしできます。ただし、まずこの機能を有効にする必要があります。

Siriで音声入力を有効にする方法:

  1. システム設定を開く
  2. キーボード設定メニューに入る
  3. ディクテーションの下で、ディクテーションを有効にするオプションにチェックを入れます
  4. 優先言語を設定する
  5. ディクテーションを有効にするためのショートカットを選択します。デフォルトでは、Ctrl キーを 2 回押します。

Siriによる音声入力を有効にすると、Macで入力可能な特定の状況でショートカットを押すと、Siriが音声入力を開始します。ただし、Siriが音声入力を行う例外として、Safari以外のブラウザで表示される特定のウェブページ(Google ChromeのGoogleドキュメントなど)があります。

精度に関しては、Siriは通常、あなたが話していることを理解し、音声入力は複数の言語で問題なく機能します。ただし、Siriが特に劣るのは句読点です。Siriはほとんどの音声を1つの連続したテキストとして書き起こします。Siriを使用すると、長いテキストを入力する手間が省けるので便利ですが、すべての句読点を音声で入力したくない場合は、AIベースの文字起こしアプリを使用する方がよいでしょう。

AIベースの文字起こし

Macで利用できるAIベースの文字起こしサービスは、Otter.aiとWhisper Transcriptionの2つです。どちらのサービスも、ユーザー自身で音声を録音して文字起こししたり、音声ファイルをインポートして文字起こししたりできます。さらに、どちらのサービスにも有料のプレミアムオプションがあり、SlackやZoomなどの特定のアプリと連携して通話の音声を文字起こしできます。

どちらのアプリケーションでも、提供する音声ファイルが明瞭であればあるほど、より良い結果が得られます。ライブで入力した音声の書き起こしに関しては、どちらのアプリケーションも非常に優れたパフォーマンスを発揮します。一般的に、どちらのアプリケーションも単語を正確に認識し、句読点も正確に書き起こす点で優れています。しかし、それぞれのサービスには独自の長所があります。

OpenAI の Whisper の句読点は実に完璧です。

OpenAI の Whisper の句読点は実に完璧です。

OpenAIが開発したWhisperは、ほぼあらゆる言語で音声を書き起こせるという大きなメリットがあります。現時点では、Otterは英語のみの書き起こしが可能です。Siriよりも優れた精度と正確な句読点といったメリットは、他の言語でも同様に発揮されます。英語以外の音声を正確に書き起こしたいなら、Macで利用できるWhisperは間違いなく最良の選択肢です。Whisper Transcriptionアプリは、AppleのApp Storeからダウンロードできます。

オッターの最初のパスは、正確さの点で少々不安定かもしれない。

オッターの最初のパスは、正確さの点で少々不安定かもしれない。

Otterの最大の強みは、ビジネス用途への活用です。Otterで録音された音声は、タイムスタンプの付与に加え、話者を識別できます。また、Otterはリアルタイムの書き起こしも提供しており、その精度は驚くほど高いです。Otterが音声を解析する時間をかけた後の書き起こしは、特に句読点の精度がさらに向上します。

Otter の改訂パスは、特にタイムスタンプとスピーカー ラベルが含まれているため、非常に正確です。

Otter の改訂パスは、特にタイムスタンプとスピーカー ラベルが含まれているため、非常に正確です。

オーディオハイジャック

Macユーザーが利用できる音声文字起こしの最後の選択肢は、Audio Hijackです。Audio Hijackは主に音声録音アプリですが、OpenAIのWhisper Transcriptionを搭載した文字起こし機能も備えています。Audio Hijackは、Macで再生されているあらゆる音声を録音し、文字起こしすることができます。

Audio HijackはOpenAIのWhisperを使用することで、正確な文字起こしを提供します。Audio Hijackを使用する際に一部のユーザーが遭遇する可能性のある唯一の問題は、アプリ自体のインストールです。インストールにはMacのリカバリモードで設定を変更する必要があり、一部のユーザーにとっては少々面倒に感じるかもしれません。

音声文字起こしのニーズが何であれ、ニーズに合ったオプションが見つかります。英語以外の言語での正確な文字起こしから、複数のスピーカーによる会議の文字起こしまで、選択肢は豊富です。