お役立ちコラム

音声入力を使ってみよう!

音声入力を使ったことがありますか?
スマートフォンを使っていらっしゃる方でしたらiPhoneでもAndroidのスマートフォンでも、
文字入力のメニューにマイクのマークがあると思います。
そのマイクを押して話をするだけでメモ帳への入力や、メールその他SNSへの入力も音声で行うことができます。
パソコンでもブラウザにGoogle アカウントを持っていれば「Google Document」に音声入力機能が付いています。

 

私は、以前より録音した会話の文字起こしをするのに、録音した音声そのままの音では無理ですが、録音した音声を聞きながら「Google Document」に自分が明瞭な言葉で言い直して音声入力を利用しているのですが、昨年あたりから急に認識率がアップし、録音した話の文字起こしもスピードアップができています。

 

残念ながらGoogleドキュメントの音声入力では、日本語の日本語の文章に欠かせない「、」や「。」などに対応していないため文章が全部続いてしまい、とても読みにくい文章になってしまいますので、後で「、」や「。」改行など文章の体裁を整える必要があります。

Google Documentの音声入力

「ツール」→ 「音声入力」
Google Documentの音声入力

「スマートフォンでの音声入力」

今のところ日本語の「、」や「。」改行に、対応しているのはiPhone,iPadなどiOSの音声入力だけです。
iOSの音声入力は(かっこ)や「カギかっこ」など記号入力にも対応しているのでとても便利です。
文章の下書きにも音声入力を利用しています。
Androidスマートフォンも同様に音声入力ができますが、Google Documentと同様、「、」や「。」改行には対応していないので、後で修正に手間がかかります。
(図 このコラムの文章もiPhoneの音声入力で下書き)

 

iPhoneの音声入力

「Wordでも音声入力」(Word Dictate)

最近のWordにDictateという機能が追加されました。Windows10 Office2013以上で動作するようです。
「WordDictate」は、以下URLより
http://dictate.ms/
右のボタンをクリックしダウンロードしてインストール後、Wordの「ファイル」→「オプション」→「アドイン」で有効にします。
(PCが64ビットでもOffice 32-bitを選択してください)

 

Wordでも音声入力

 

アドインされるとWordに「Dictation」というメニューが追加されます。

 

Dictation

 

マイクマークのStartをクリックすると音声入力の開始です。

音声入力だけでなく翻訳機能も!

このメニューよく見ると、「From」「To」のメニューがあり、日本語入力する場合は「From」「To」共にJapaneseを選択しますが「From」「To」に多国語を設定することにより、翻訳も出来るのです。
日本語で話して英語に翻訳してみました。
「明日は重要な会議があるため、私は朝早く会社に聞く必要があります」
英語に翻訳されました。なかなか使えそうなレベルです。

 

他言語音声入力

中国の人がスマートフォンのスピーカーに話しながら、歩いているのを目にすることがよくあると思います。
電話で話をしているだけでなく、SNSなどの入力も音声入力を利用していることが多いそうで、中国語は同じ発音の漢字が多く、文字変換がとても手間なので、音声入力の方が便利だそうです。
音声入力の精度がどのくらいか試してみました。
私の拙い中国語の発音でも、ちゃんと認識してくれて驚きです。
中国語の発音は音程の高低だけで全く別の意味になるなど、とても難しく、国土が広いため地方によりイントネーションが違うので中国国内で放映されているドラマに中国語の字幕が付いているぐらいですから、少々発音が違っていても前後の単語から推測できる機能があるのではないかと思います。

 

他言語音声入力

 

Google翻訳の音声入力で 中国語→日本語を試してみました。
やはり中国語の音声認識率はとても高いです。
私の発音では中国の人にはなかなか伝わらないのに、Googleは認識してくれます。

 

Google翻訳の音声入力

 

英語の音声入力は、発音の練習にもなるので便利だなと思いつつ、キーボードから入力するより、スペルの間違いを防ぐことができるので、とっても便利です。
他国で音声入力が進んでいる理由がよくわかります。

会話見える化コミュニケーションアプリ

話している言葉がすぐに文字になったら…
多くの「聞こえない」「聞こえにくい」方にも筆談より早くて便利だと思います。
音声入力でも少し目的が違う「UDトーク」というスマートフォンアプリがあります。
話している言葉が次々に文字に変換されて、筆記することがいらなくなります。
一文ごとに切れてしまうので長文には向きませんが、一文ごと分かれて表示されるのでちょっとした筆談には見やすく便利です。
音声入力、手書き文字入力、キーボード入力の混在ができるのでスマートフォンをメモ用紙代わりにコミュニケーションをとることもできます。
連続会話3分間までは無料で利用できます。

UDトーク UDトーク

音声入力の今後

昨年後半は、Amazon、Google、LINEそれぞれからスマートスピーカーと呼ばれる音声で指示ができるスピーカーが
発売されて、音楽を聴く、買い物をする、家電を操作する、などに家庭内でも音声入力が利用され始めました。
実は音声認識技術で日本語は他国と比較して、とても遅れているのです。
地球上で日本語を話す人口が少ないうえに、個人情報保護が過剰に働いてしまい、音声のテストデータ、
誤変換のデータを収集することができていないのです。

 

音声入力が将来的にAIに広がっていきます。個人が特定できないデータは上手に活用し、日本語だけ遅れているとか、
日本語だけサービスが受けられないとかにならないで欲しいなと思っています。
まだ利用していない方、以前利用してまだまだだな…と思っていた人にも、日々進化している音声入力を
試してみていただきたいと思います。

執筆者

冨田さより冨田 さより
株式会社ペンタゴン 代表取締役
http://pentagon-jp.com/
1979年の創業以来、パタンナーの経験を活かし、アパレル業界のIT化の支援を行う。縫製工場向けの生産・販売・在庫管理パッケージソフトの導入 支援では、日本、中国、東南アジアなどで100社を超える。零細工場から中堅、大手アパレル、大手通販企業のシステム構築時のRFP策定から仕様作成、導 入運用支援などを担当。2008年頃より、クラウド環境の利用やスマホ&タブレットなどの活用提案を行う。2013年12月より西武信用金庫の専門家とし ても活動中。

お役立ちコラムの
トップへ

ページの先頭へ