Soyez efficace et naturel
[Microsoft Agent est déconseillé à partir de Windows 7 et peut ne pas être disponible dans les versions ultérieures de Windows.]
Lors de l’accomplissement de tâches, les conversations humaines efficaces sont généralement des échanges de brèves informations. Souvent, les éléments de la discussion sont établis entre les parties, puis référencés indirectement à l’aide de réponses abrégées. Ces formes d’abréviations sont bénéfiques, car elles sont efficaces et impliquent également que le conférencier et l’écouteur ont un contexte commun ; autrement dit, qu’ils communiquent. L’utilisation de formes d’abréviation appropriées rend également une boîte de dialogue plus naturelle.
Une forme d’abréviation de conversation est l’utilisation de contractions. Lorsqu’ils ne sont pas utilisés, ils font paraître un orateur plus formel et rigide, et parfois moins humain. La plupart des conversations humaines montrent une plus grande liberté dans les règles linguistiques que le texte écrit.
Anaphora, l’utilisation de pronoms est une autre forme courante d’abréviation dans les conversations. Par exemple, quand quelqu’un vous demande « avez-vous vu votre facture aujourd’hui ? » les réponses qui remplacent « it » par « Bill » sont plus naturelles que la répétition du nom. La substitution est une indication selon laquelle les parties de la boîte de dialogue partagent un contexte commun qui est « il ». Gardez à l’esprit que le mot « I » fait référence au caractère lorsqu’il le dit.
Le contexte partagé est également communiqué par l’utilisation de points de suspension linguistiques, la troncation d’un grand nombre des mots de la requête d’origine. Par exemple, l’écouteur peut répondre, « oui, je l’ai vu », en montrant le contexte partagé de quand ou même répondre avec une simple « Oui » qui démontre le contexte partagé de qui et quand.
La compréhension implicite peut également être transformatée par d’autres formes de style conversationnel abrégé, où le contenu est déduit sans répétition, comme illustré dans l’exemple suivant :
Utilisateur : J’aimerais une pizza de Chicago.
Caractère : Avec « des fromage supplémentaires » ?
De même, si quelqu’un dit « il est chaud ici », l’expression est compréhensible et ne nécessite aucun détail si vous savez où se trouve l’intervenant. Toutefois, si le contexte n’est pas bien établi ou est ambigu, l’élimination de toutes les références contextuelles peut rendre l’utilisateur confus.
Lorsque vous utilisez une communication abrégée, prenez toujours en compte le contexte de l’utilisateur et le type de contenu. Il convient d’utiliser des descriptions plus longues pour les informations nouvelles et inconnues. Toutefois, même avec de longues informations descriptives, essayez de le diviser en plus petits segments. Cela vous donne la possibilité de modifier l’animation au fur et à mesure que le caractère parle. Il permet également à l’utilisateur d’interrompre le caractère, en particulier lors de l’utilisation d’une entrée vocale.
La cohérence est importante dans la sortie vocale. Des modèles de discours étranges ou des prosodie peuvent être interprétés comme une mise à niveau de l’intelligence du caractère. De même, le basculement entre TTS et la parole enregistrée peut amener les utilisateurs à interpréter le caractère comme étrange ou possédant plusieurs personnalité. Les mouvements de la bouche synchronisée avec la lèvre peuvent améliorer la netteté. Microsoft agent prend en charge automatiquement la synchronisation LIP pour les moteurs TTS conformes à ses interfaces SAPI requises. Toutefois, la synchronisation Lip est également prise en charge pour la reconnaissance vocale enregistrée. Les fichiers audio peuvent également être améliorés à l’aide de l’outil d’édition de sons linguistique de Microsoft.