Polecenie głosowe

W przypadku korzystania z poleceń głosowych spojrzenie jest zwykle używane jako mechanizm określania wartości docelowej, niezależnie od tego, czy jako wskaźnik ("select") lub kierując polecenie do aplikacji ("zobacz to, powiedzmy"). Oczywiście niektóre polecenia głosowe w ogóle nie wymagają celu, na przykład "go to start" lub "Hej, Cortana".

Obsługa urządzeń

Funkcja HoloLens (1. generacja) HoloLens 2 Immersyjne zestawy nagłowne
Polecenie głosowe ✔️ ✔️ ✔️ (z dołączonym zestawem słuchawkowym)

Jak używać głosu

Rozważ dodanie poleceń głosowych do dowolnego środowiska, które tworzysz. Głos to zaawansowany i wygodny sposób kontrolowania systemu i aplikacji. Ponieważ użytkownicy mówią z różnymi dialektami i akcentami, właściwy wybór słów kluczowych mowy zapewni, że polecenia użytkowników są interpretowane jednoznacznie.

Najlepsze rozwiązania

Poniżej przedstawiono niektóre rozwiązania, które pomogą w bezproblemowym rozpoznawaniu mowy.

  • Użyj zwięzłych poleceń — jeśli to możliwe, wybierz słowa kluczowe dwóch lub większej liczby sylab. Jednosygowe słowa mają tendencję do używania różnych dźwięków vowel, gdy mówione przez osoby o różnych akcentach. Przykład: "Odtwórz wideo" jest lepszy niż "Odtwórz aktualnie wybrane wideo"
  • Użyj prostego słownictwa — przykład: "Pokaż notatkę" jest lepszy niż "Pokaż tabliczkę"
  • Upewnij się, że polecenia są niedestrukcyjne — upewnij się, że każda akcja, którą można wykonać za pomocą polecenia mowy, nie jest destrukcyjna i można je łatwo cofnąć w przypadku przypadkowego wyzwolenia polecenia przez inną osobę w pobliżu użytkownika.
  • Unikaj podobnych poleceń dźwiękowych — unikaj rejestrowania wielu poleceń mowy, które brzmią bardzo podobnie. Przykład: "Pokaż więcej" i "Pokaż sklep" może być bardzo podobny do dźwięku.
  • Wyrejestruj aplikację, gdy nie jest używana — jeśli aplikacja nie jest w stanie, w którym określone polecenie mowy jest prawidłowe, rozważ wyrejestrowanie jej, aby inne polecenia nie zostały zdezorientowane dla tego polecenia.
  • Przetestuj z różnymi akcentami — przetestuj aplikację przy użyciu różnych akcentów.
  • Zachowaj spójność poleceń głosowych — jeśli "Wstecz" przechodzi do poprzedniej strony, zachowaj to zachowanie w aplikacjach.
  • Unikaj używania poleceń systemowych — następujące polecenia głosowe są zarezerwowane dla systemu. Nie powinny one być używane przez aplikacje.
    • "Hej Cortana"
    • "Wybierz"

"Wybierz"

Powiedzenie "select" w dowolnym momencie aktywuje wszystko, co kursor spojrzenia wskazuje.

Uwaga: w HoloLens 2 kursor spojrzenia musi najpierw zostać wywołany, mówiąc słowo "select". Ponownie powiedz "select", aby aktywować. Aby ukryć kursor wzroku, wystarczy użyć rąk do airtap lub dotknąć obiektu.

Zobacz to, powiedz

Windows Mixed Reality zastosował model głosu "zobacz, powiedz to", w którym etykiety na przyciskach są identyczne ze skojarzonymi poleceniami głosowymi. Ponieważ nie ma żadnego dysononansu między etykietą a poleceniem głosowym, użytkownicy mogą lepiej zrozumieć, co powiedzieć, aby kontrolować system. Aby to wzmocnić, podczas gdy mieszkanie na przycisku, "głos mieszka porada" wydaje się komunikować, które przyciski są włączone głos.

See it say it example 1

See it say it example 2
Przykłady "zobacz, powiedz to"

Mocne strony głosu

Wprowadzanie głosu to naturalny sposób komunikowania naszych intencji. Funkcja Voice jest szczególnie dobra w przechodzeniu przez interfejs, ponieważ może pomóc użytkownikom w przecięciu wielu kroków interfejsu (użytkownik może powiedzieć "wróć" podczas przeglądania strony internetowej, zamiast przechodzić w górę i klikać przycisk Wstecz w aplikacji). Te małe oszczędności czasu mają potężny wpływ emocjonalny na postrzeganie środowiska użytkownika i daje im niewielką ilość supermocarstwa. Korzystanie z głosu jest również wygodną metodą wprowadzania, gdy mamy pełne ręce lub są wielozdaniowe. Na urządzeniach, na których wpisywanie na klawiaturze jest trudne, dyktowanie głosowe może być wydajnym, alternatywnym sposobem wprowadzania danych. Wreszcie, w niektórych przypadkach, gdy zakres dokładności spojrzenia i gestu jest ograniczony, Funkcja Voice może być jedyną zaufaną metodą wprowadzania danych przez użytkownika.

Jak korzystanie z głosu może przynieść korzyści użytkownikowi

  • Skraca czas — powinien sprawić, że cel końcowy będzie bardziej wydajny.
  • Minimalizuje nakład pracy — powinno to sprawić, że zadania będą bardziej płynne i bez wysiłku.
  • Zmniejsza obciążenie poznawcze — jest intuicyjne, łatwe do nauki i zapamiętywanie.
  • Jest to akceptowalne społecznie - powinno pasować do norm społecznych pod względem zachowania.
  • To rutynowe - głos może łatwo stać się zwykłym zachowaniem.

Słabości głosu

Głos ma również pewne słabości. Precyzyjna kontrola jest jedną z nich. (na przykład użytkownik może powiedzieć "głośniej", ale nie może powiedzieć, ile. "Trochę" trudno jest określić ilościowo. Przenoszenie lub skalowanie rzeczy za pomocą głosu jest również trudne (głos nie oferuje szczegółowości kontroli). Głos może być również niedoskonały. Czasami system głosowy nieprawidłowo słyszy polecenie lub nie słyszy polecenia. Odzyskiwanie po takich błędach jest wyzwaniem w dowolnym interfejsie. Wreszcie głos może nie być społecznie akceptowalny w miejscach publicznych. Istnieją pewne rzeczy, których użytkownicy nie mogą powiedzieć lub których nie powinni powiedzieć. Te klify umożliwiają używanie mowy do tego, co jest najlepsze.

Stany opinii głosowej

Gdy funkcja Voice jest prawidłowo stosowana, użytkownik rozumie, co może powiedzieć, i uzyskać wyraźną opinię o tym, że system prawidłowo je usłyszał. Te dwa sygnały sprawiają, że użytkownik czuje się pewnie przy użyciu funkcji Voice jako podstawowych danych wejściowych. Poniżej przedstawiono diagram pokazujący, co dzieje się z kursorem, gdy dane wejściowe głosu są rozpoznawane i jak komunikują się z użytkownikiem.

Voice feedback states for cursor
Stany opinii głosowej dla kursora

Najważniejsze rzeczy, które użytkownicy powinni wiedzieć o "mowy" w rzeczywistości mieszanej

  • Powiedz "Wybierz" podczas określania wartości docelowej przycisku (możesz użyć go w dowolnym miejscu, aby kliknąć przycisk).
  • Możesz powiedzieć nazwę etykiety przycisku paska aplikacji w niektórych aplikacjach, aby wykonać akcję. Na przykład podczas przeglądania aplikacji użytkownik może powiedzieć polecenie "Usuń", aby usunąć aplikację ze świata (pozwala to zaoszczędzić czas na kliknięcie jej ręką).
  • Możesz zainicjować Cortana słuchania, mówiąc :"Hej Cortana". Możesz zadać jej pytania ("Hej Cortana, jak wysoka jest wieża Eiffla?"), powiedz jej, aby otworzyła aplikację ("Hej Cortana, otwórz Netflix") lub powiedz jej, aby podnieść menu Start ("Hej Cortana, zabrać mnie do domu") i nie tylko.

Typowe pytania i obawy użytkowników dotyczące głosu

  • What can I say? (Co mogę powiedzieć?)
  • Jak mogę wiedzieć, że system usłyszał mnie poprawnie?
    • System ciągle otrzymuje moje polecenia głosowe źle.
    • Nie reaguje, gdy daję mu polecenie głosowe.
  • Reaguje na niewłaściwy sposób, gdy daję mu polecenie głosowe.
  • Jak mogę kierować mój głos do określonego polecenia aplikacji lub aplikacji?
  • Czy mogę używać głosu do polecenia elementów ramki holograficznej na HoloLens?

Zobacz też