Windows Vista の音声認識のステップ バイ ステップ ガイド

Windows Vista® には最先端の音声認識機能が備わっています。このオペレーティング システムの音声認識を使用すると、電子メールやドキュメントをディクテーションしたり、自分の声を使用してお気に入りプログラムの制御や Web サイト間の移動を行うことができます。 Windows Vista の音声認識により、ドキュメントをすばやく作成でき、操作を反復するストレスによる障害の危険性を軽減できます。 Windows Vista の音声認識は、操作しやすい画期的なデザインになっているので、これまでの音声認識よりも短時間で使いこなせるようになります。

音声認識とは

音声認識テクノロジでは、音声でコンピュータを制御できます。 ユーザーがコンピュータに話し掛けると、ドキュメントや電子メールのディクテーションなど、ユーザーの声をテキストに変換するかどうか、または操作の実行に必要なコマンドが指定されたかどうかをソフトウェアが適切に判断します。

Windows Vista の音声認識の新機能

Windows Vista の音声認識は、世界的に認められた精度だけでなく、これまでで最も使いやすいエンド ツー エンドの音声認識エクスペリエンスを提供します。 既存の製品では不満に感じていたり、ユーザーの混乱を招いていたような大きな問題に対処しています。 Windows Vista の音声認識では、次のように効率的かつ楽しめる方法で、自分の音声による作業を行うことができます。

  • システムを "機能させる" ことに重点を置いているので、学習時間が少なくて済みます。

  • ユーザー インターフェイスのデザインが見直されたことにより、単純かつ効率的なエクスペリエンスが提供されるので、テキストをディクテーションして編集し、間違いがあれば修正できます。

  • 音声認識の使用方法を指導する対話形式のチュートリアルがあります。このチュートリアルを実行していくに従って、コンピュータがユーザーの声を学習していきます。

  • 音声テクノロジの認識精度が飛躍的に向上しています。

  • 新しいインターフェイスを使ってコンピュータを制御できます。この新しいインターフェイスにより、アプリケーションを操作しやすい方法で使用できます。

  • 分類と解釈が強化されています。 複数の解釈が可能なコマンドを指定すると、何を実行するかを明確に示すように、システムから問い合わせを受けます。

音声認識の対象者

このガイドは、以下の読者を対象としています。

  • 反復性ストレス障害を抱えた従業員、四肢に障害のある従業員、および視野に制限のある従業員に補助テクノロジ ソリューションを提供する IT プランナと HR 部門。

  • 教育部門の IT プランナ

  • 早期導入ユーザー

音声認識は、特に電子メール アプリケーション、文書処理アプリケーション、および Web ブラウザを主に使用するインフォメーション ワーカーのニーズに対処することを目的としています。

次のようなユーザーは、Windows Vista の音声認識による優れたエクスペリエンスを得ることはないでしょう。

  • オープン プラン式のオフィスなど、コンピュータに話しかけることが他の社員に悪影響を及ぼす環境のユーザー。

  • 文法的には正しくないテキストを使って操作することが多いユーザー (プログラマ、スプレッドシート ユーザー、コンピュータの管理者)。

  • 緊密に統合されたスクリーン リーダーと音声認識ソリューションを必要とするユーザー。

音声認識の利点

音声認識では、次のことが行えます。

  • 自分の声で作業を行うことで、キーボードとマウスの使用を大幅に減らすことができます。

  • コンピュータに向かって話し掛けることで、ドキュメントを効率的に作成できます。

  • 自分の声でコンピュータを制御できます。たとえば、アプリケーションの起動や切り替え、メニューやボタンの選択などを行えます。

音声認識の主なシナリオ

ここでは、ドキュメントのディクテーションと音声コマンドの指定を行う単純なシナリオについて説明します。

Windows Vista の一部として同梱されている音声認識チュートリアルには、お試しいただく価値のある多くのシナリオが含まれています。

前提条件

この作業を完了するには、次の要件を満たしていることを確認します。

  • 高品質マイクの使用。 例 :

    • USB ヘッドセット マイク

    • アレイ マイク

  • 対話型の音声認識チュートリアルの完了。 このチュートリアルを実施することにより、コンピュータがユーザーの声を正確に認識できるように学習を開始します。 また、チュートリアルを完了すると、自分の声を使って作業を行うために必要な音声コマンドについて理解できます。

ドキュメントのディクテーションの概要

音声認識の最も一般的なシナリオの 1 つは、ドキュメントのディクテーションです。これには、次の操作が含まれます。

  • 文書処理アプリケーションを起動する

  • ドキュメントの本文をディクテーションする

  • ドキュメントを保存する

ドキュメントをディクテーションする手順

音声認識チュートリアルを完了するには
  1. [スタート] ボタンをクリックし、[すべてのプログラム]、[アクセサリ]、[ユーザー補助] の順にクリックします。 [音声認識] オプションを選択します。

  2. 初期セットアップ画面を進めて、マイクを構成します。 その後、音声認識チュートリアルが起動します。

  3. 音声認識チュートリアルを完了します。

ドキュメントを作成、ディクテーション、保存するには
  1. 「聞き取り開始 (Start Listening)」と言います。

  2. 「ワードパッドを開く (Open WordPad)」と言います。

  3. 「これは音声認識のテストですまる (This is a test of speech recognition period)」と言います。

    Note

    句読点を発音することを忘れないでください。

  4. 間違いを修正するには、「修正 (correct)」と発音した後、続いて間違って入力された語を読み上げます。次に、音声認識によって提供される一覧から正しい語を選ぶか、正しい語を再び繰り返します。 たとえば、コンピュータが「スピーチ (speech)」を「ピーチ (peach)」と誤認識した場合、「修正ピーチ (correct peach)」と言ってから、一覧から正しい語を選ぶか、「スピーチ (speech)」と再び発音します。

  5. ドキュメントを保存するには、「ファイル」と言ってから、「名前を付けて保存」と言います。

  6. 「テスト ドキュメント」と言います。

  7. 「保存」と言います。

既知の問題点

ディクテーション

音声認識を使用する際、次の問題が発生することがあります。

  • 音声認識のディクテーションは、Text Services Framework というテクノロジをサポートする限られたアプリケーションでしか機能しません。 このテクノロジをサポートするアプリケーションには、次のものがあります。

    • Microsoft Word および Outlook

    • Windows Vista に含まれているほぼすべてのアプリケーション

  • 多くのアプリケーションでディクテーションが機能しません。 これには次のようなアプリケーションがあります。ただし、ディクテーションが機能しないアプリケーションは他にもあります。

    • Microsoft PowerPoint

    • Excel

    • WordPerfect

    • Eudora

    • Lotus Notes

音声コマンドの認識レベルが低い

音声を使用して作業を完了するのが困難な場合、よくある原因として、コンピュータがユーザーの音声を正確に認識していても、ユーザーが間違ったコマンドを指示していることが考えられます。

音声参照カードを参照して、使用できるコマンドを理解してください。 音声参照カードにアクセスするには、マイク コントロール バーを右クリックします。

フィードバックの送信とバグの報告

バグを報告するには、Microsoft Beta Web サイト (http://go.microsoft.com/fwlink/?LinkId=46992) (英語) の指示に従ってください。 音声認識の機能に関するご要望や全般的なご感想もお待ちしております。

音声認識の追加サポートが必要な方は、音声認識チーム (listen@microsoft.com 宛て) に直接電子メールをお送りください。

関連リソース

ベータ テスタまたは特別な TAP (Technology Adoption Program) ベータ プログラムに参加している場合は、Microsoft 開発チームの担当メンバから支援を受けることができます。