文字起こしとは、音声の内容を文字に変換する作業のことを指します。録音された会話を、音声ファイルとして文章として書き出します。
文字起こしの利用のきっかけは自治会の会議の議事録を作成するのに会話内容を聞き取りながらまとめるのに苦労しました。
重要な点をもらさず、わかりやすくまとめたいとの思いで文字起こしアプリとソフトを使ってみました。
文字起こしの方法として、
・スマホアプリを使って録音しながら文字起こしする。
・スマホアプリで音声ファイルをアップロードして文字起こしする。
・PCで音声ファイルを取り込んで文字起こしする。
会議を文字起こしするため、念のためスマホで会議を録音してその音声ファイルをアップロードして文字起こししました。
又音声ファイルをアップロードした方が文字起こしに要する時間が圧倒的に早くなり無料で使える時間を節約できます。
音声ファイル作成は、スマホで簡単に最高音質で録音ができる、スマホアプリ「PCM録音」を使い作成しました。
録音時の音声の劣化がほぼ無く、綺麗な音質で保存ができるPCM(WAV)、AAC(M4A)形式に対応している点が大きな特長です。
私がお勧めするのは「LINE WORKS AiNote」です。
AIを活用した議事録自動作成ツールで2024年11月下旬から提供開始しています。
「CLOVA Note β(2022年リリース)」の正式版として、法人向けに機能を強化したものですが個人でも使用できます。
利用開始の流れ
https://line-works.com/products/ainote/
「今すぐはじめる」をクリックしてください。
個人で利用するので下記としました。
「企業団体名」は:個人事業主、「業種」は個人事業主、「従業員数」は1名(個人事業主) 、
「企業団体の電話番号」は携帯電話番号を記入しました。
つづいて登録に必要な個人情報を入力します。
「姓・名」、個人のメールアドレス入力します。
メールアドレスの認証を行います。
全ての項目に同意します。
つづいてログインに使用するアカウント情報を入力します。
携帯番号で簡単開設を選んでください。
SMS(ショートメッセージサービス)に届いた[認証番号]を入力
LINE WORKSを開設する理由を選択して、[OK]をクリック
ログインIDが設定されていますので確認してください。
パスワードは未登録となっていますので登録してください。
スマホアプリをダウンロードして登録
App Storeからアプリをダウンロードします。
プラウザ版で設定したIDとパスワードでログインします。
LINE WORKS AiNoteプラウザ版にログインして文字起こし
スマホ版と同様にプラウザ版にIDとパスワードでログインします。
文字起こしの条件は
・アップロードできるファイルサイズは最大300MBです。
WAVファイルは非圧縮でM4A(AAC)ファイルは圧縮で高品質ですのでファイルサイズが300MB以上ならAACファイルに変換します。
・1回の録音およびアップロードできるファイルの再生時間の上限は180分に制限されます。
音声ファイルをアップロードする場合はこの条件は適用外です。
・無料のフリープランは文字起こし時間は300分です。
・文字起こし利用可能時間は毎月更新され、未使用の時間は次月に繰越できません。
音声ファイルをアップロードします。録音時間1時間程です。
アップロード後文字起こしが始まります。一分以内で文字起こしが完了します。
それぞれの発言者を分けて文字起こししてくれます。
これを話者分離機能と言い、AI音声認識技術による複数の話者を認識する機能です。
編集で参加者 1~を名前に変えることができます。
スマホでこのまま読んでまとめてもよいのですが音声記録をダウンロードした方が分かりやすく音声記録ファイルををword形式でダウンロードしました。
スマホ版でもプラウザ版と同様な文字起こしができます。
Microsoft Wordのトランスクリプトを使った文字起こし、Google ドキュメントでの文字起こし
LINE WORKS AiNoteと比較のためこの文字起こしを使ってみました。
この文字起こしは録音、再生時間と同じ時間を要し文字起こしに時間がかかります。
課金の心配はなく気軽に利用できます。
Microsoft Wordの音声入力の機能を使い、録音した音声ファイルを再生しながらマイクで音声を受け文字変換するのですが、音声入力で録音音声を認識させようとしても、そのままでは基本的にうまく認識されません。
パソコンのスピーカーから再生される音声をマイクがうまく拾えないからです。
そこで裏技として、音声入力の機能を使って録音音声を文字化したい場合はステレオミキサーを使います。
ステレオミキサーはパソコンの再生音を直接スピーカーを通さずPC内で認識させることができるようになります。
ステレオミキサーの設定
スタート>すべて>windowsツールシステム>「コントロールパネル」選択>「ハードウェアとサウンド」選択>「サウンド」選択>「録音」選択
[録音]タブの一覧に「ステレオミキサー」が表示されていない場合は、何も表示されていない部分を右クリックし、表示されるメニューから[無効なデバイスの表示]を選択してオンにします。
ステレオミキサーが搭載されている場合は、一覧に表示されます。
[無効なデバイスの表示]をオンにしても表示されない場合は、サウンドカードのドライバを更新してみると、デバイスが追加される場合があります。
ステレオミキサーの設定
[録音]タブの一覧に「ステレオミキサー」が表示されたら、「ステレオミキサー」で右クリックし、表示されるメニューから[有効]を選択します。
ステレオミキサーが有効になります。
「ステレオミキサー」を選択し、右下の[プロパティ]ボタンをクリックします。
ステレオミキサーのプロパティが表示されるので、レベルタブを選択します。
ステレオミキサーの音量を設定できます。
Web版のWordならMicrosoftアカウントでサインインすれば無料で利用できます。
Web版のWordには、「トランスクリプト」機能が備わっています。
音声からテキストに変換する文字起こし機能のことで、これを使えばICレコーダーなどで録音した音声ファイルから文書を作成できます。
今回はこのトランスクリプト機能使います。
下記URLにアクセスします。
https://www.microsoft.com/ja-jp/microsoft-365/free-office-online-for-the-web
Microsoftアカウントでサインインします。
新規作成「ドキュメント」を選択します。
「ホーム」にある「ディクテーション」をクリックし録音データを再生を開始すれば、文字起こしが始まります。
Wordでの文字起こしは、Googleドキュメントと同じように発言者の区別がありません。「、」「。」などの文字の区切りもないので、文字起こしが終わったら見直しが必要です。
以上文字起こし方法を紹介しましたがLINE WORKS AiNoteが高い音声認識精度と世界トップクラスの話者分離を実現してくれるのが魅力的で一番のおすすめです。
以上