Commande vocale du smartphone

Il existe de nombreuses solutions différentes pour la commande vocale des fonctions des téléphones intelligents, mais toutes ne sont pas mises en œuvre avec une qualité suffisante. Nous avons sélectionné ceux qui fonctionnent vraiment.

La commande vocale lorsque vous travaillez avec des smartphones et des communicateurs modernes équipés de processeurs suffisamment puissants est une tendance établie dans la création d'interfaces utilisateur pratiques. Cela est possible à des degrés divers sur toutes les principales plates-formes mobiles. Sous iOS, il est apparu en version 3.0 (entièrement fonctionnel à partir de 4.0), dans Google Android - en version 1.6 (entièrement fonctionnel - à partir de 2.2). Cette fonctionnalité est relativement bien implémentée dans Windows Mobile et S60. Nous avons sélectionné plusieurs solutions qui peuvent remplacer les modules de commande vocale standard, ainsi que des logiciels pour étendre les fonctionnalités.

Principales caractéristiques des systèmes de reconnaissance vocale

Au cours des deux ou trois dernières années, le contrôle de la parole a été considéré comme l'une des technologies les plus prometteuses utilisées dans la création d'interfaces utilisateur. Ceci est annoncé par les dirigeants de Microsoft, et les représentants de Google et d'Apple manifestent un intérêt notable.

En effet, le contrôle d'un appareil de communication mobile en appuyant sur des boutons semble déjà archaïsme. Les écrans tactiles et la voix sont commercialisés comme des moyens naturels pour les humains d'interagir avec un appareil intelligent. Une caractéristique importante de ces systèmes est la reconnaissance correcte des commandes. Si avec le contrôle tactile tout est plus ou moins clair (les smartphones modernes prennent même en charge le contrôle à l'aide de gestes multipoints complexes), alors avec les commandes vocales, les choses ne sont pas si simples.

Premièrement, le système peut ne pas toujours répondre correctement à la façon dont les commandes sont prononcées. Vous devrez vous adapter à un tel contrôle, ce qui n'est pas toujours pratique: il est très fatiguant de garder une trace du timbre de la voix et des intonations tout le temps. Dans ce cas, les commandes doivent être séparées du bruit de fond général, ce qui nécessite des ressources de calcul.

Deuxièmement, un tel système ne s'allume pas automatiquement - pour l'activer, vous devez généralement appuyer sur un bouton d'un appareil ou d'un accessoire (par exemple, un casque sans fil). L'inclusion de logiciels n'est pas toujours pratique. Sur les communicateurs avec Windows Mobile avec pile logicielle Broadcomm, l'activation de Microsoft Voice Commander à partir d'un casque Bluetooth peut fonctionner de manière instable ou ne pas fonctionner du tout.

Troisièmement, la commande vocale n'est pas encore en mesure de corriger les inexactitudes et les erreurs des utilisateurs. Par exemple, si vous essayez de commencer à jouer une chanson d'un groupe dont le nom contient l'article «le» sans le mentionner, dans la plupart des cas, l'appareil ne comprendra pas une telle commande. Des difficultés surviennent également lorsque vous composez des noms et des noms à partir d'un cahier - pour un fonctionnement correct, vous devez remplir le champ «surnom» et attribuer une commande de lancement supplémentaire.

Quatrièmement, pour l'utilisation constante de la numérotation vocale (par exemple, lors de la rédaction d'un SMS), le processeur de l'appareil mobile lance des modules assez gourmands en ressources du système de reconnaissance. Cela n'a pas le meilleur effet sur les performances et la durée de vie de la batterie du communicateur. Cependant, maintenant ce problème est progressivement résolu.

Vlingo est un module de commande vocale multiplateforme pour travailler avec des logiciels tiers

Speereo Voice Launcher offre un riche ensemble de fonctions pour le contrôle vocal et comprend même une prononciation pas très claire

Gestion des fonctions système standard et recherche vocale.

Dans tous les systèmes d'exploitation mobiles courants, à un degré ou à un autre, la possibilité de reconnaissance vocale des commandes pour lancer des applications typiques est mise en œuvre. Par exemple, composer un numéro à partir d'un bloc-notes, ouvrir un client de messagerie ou démarrer une liste de lecture. En outre, ces modules peuvent sonner les processus du système, indiquant que le téléphone est faible ou qu'il est passé en mode d'alerte silencieuse. Aucun des programmes n'est capable d'exécuter des commandes plus complexes (par exemple, «ouvrir un client de messagerie, écrire une lettre à M. Ivanov et marquer tous les messages de la boîte de réception comme lus après leur envoi»). Cependant, ils se développent progressivement. Donc, si vous demandez à un iPhone basé sur iOS4 quelle heure il est maintenant, l'heure du système sera annoncée. Outre,le même programme vocal de ce système d'exploitation comprend les réponses négatives de l'utilisateur: «non», «faux», «faux», etc. Dans d'autres systèmes mobiles, vous devez plutôt recourir au contrôle tactile.

Sur les appareils WM classiques, deux packages sont utilisés pour la commande vocale: Cyberon Voice Commander et Microsoft Voice Command. Cependant, les utiliser en même temps ne fonctionnera pas - vous devez en choisir un.

Le premier nécessite une formation pour reconnaître les commandes, bien que la liste ne soit pas très longue. Le programme peut appeler des contacts, des entrées de calendrier, exécuter toutes les applications standard et certaines applications tierces et lire de la musique, ainsi que lire les messages entrants. Le deuxième package contrôle en outre le volume, le mode de fonctionnement des connexions sans fil et les événements système sonores. Microsoft a également récemment eu un produit intéressant, TellMe, pour le contrôle vocal avancé. Il est capable de lancer le client de recherche Bing avec une demande d'informations dictée, de parler des cours des actions, des résultats sportifs, de la météo, des films et des conditions de circulation. Mais pour tout cela, l'appareil doit être connecté à Internet et se trouver dans le champ de vision des satellites GPS. Ce sont ces outils qui sont utilisés pour calculer l'emplacement.De plus, ce service n'est pas disponible en russe.

Dans iOS et Android au-dessus de la version 2.2 de FroYo, les systèmes de numérotation vocale intégrés sont à peu près les mêmes, à l'exception du fait que le produit de Google a la capacité d'acheminer des itinéraires à l'aide de cartes vers l'emplacement du bureau d'une entreprise donnée ou d'un point spécifique. Dans Symbian OS 5e édition, la commande vocale est uniquement responsable de l'exécution des fonctions standard du système, et pour la recherche vocale, vous devrez installer un logiciel séparé - par exemple, Google Mobile App.

Commande vocale de fonctions supplémentaires et lancement de programmes tiers

Bien sûr, les outils vocaux doivent non seulement faciliter partiellement le travail quotidien avec le communicateur, mais prendre complètement en charge l'exécution des activités quotidiennes. Et pas seulement avec des programmes standard, mais également installés en plus par l'utilisateur. À ces fins, vous pouvez utiliser des produits distincts - par exemple, Speereo Voice Launcher. Ce programme est compatible avec Symbian OS (y compris S60), Windows Mobile et à l'avenir avec Android OS. Il s'agit d'un shell compact qui vous permet de planifier le lancement de toutes les applications et fichiers et de passer à toutes les pages Web du navigateur.

Le produit ne dépend pas beaucoup des particularités de la voix du propriétaire de l'appareil: le moteur de reconnaissance est capable de détecter les commandes prononcées avec un accent ou des défauts de diction mineurs. L'intégration avec les programmes standard (notebook, organiseur, client de messagerie instantanée) est fournie, mais il n'y a pas de transfert de signets depuis les favoris. La définition des commandes à lancer se fait via les paramètres de l'application. L'utilisateur écrit le nom de la commande en russe en latin ou dans l'une des langues prises en charge (anglais, allemand, français, etc.), après quoi il est entré dans la base de données. Fait intéressant, Speereo prend les commandes même dans les environnements bruyants.

Pour les versions de Google Android inférieures à 2.2, il existe trois applications qui remplacent le service de lanceur d'applications Voice Actions apparu dans Android OS FroYo. Premièrement, ce sont les programmes Edwin et Vlingo, qui ne fonctionnent qu'en anglais.

Le premier est un client avancé de reconnaissance de commandes vocales qui fournit non seulement des recherches Google, mais également des formules mathématiques dans Wtolfram Alpha, l'envoi de messages à Twitter, etc.

Le deuxième client (fonctionne sur les plates-formes iOS, WM, S60 et RIM BlackBerry) a les mêmes fonctionnalités que TellMe de Microsoft. En plus de la possibilité d'envoyer des statuts aux réseaux sociaux, de rechercher des itinéraires et des coordonnées sur les entreprises de la région. Enfin, il existe TopVoiceControl pour les communicateurs Android. En plus de la numérotation habituelle des numéros à partir du carnet d'adresses et de la reconnaissance des numéros prononcés, il peut contrôler les interfaces sans fil et ouvrir le calendrier.

Liste de choses à faire

Les organisateurs vocaux sont encore exotiques, mais les premières applications de ce type font déjà leur apparition et gagnent en popularité. Ainsi, le développeur susmentionné Speereo Software propose le programme Speereo Voice Organizer, conçu pour créer des entrées dans le «Calendrier» et les «Tâches», les e-mails. Cependant, dans ce cas, la voix n'est pas convertie en texte. Le message est envoyé sous forme de fichier audio joint et d'alertes sur les tâches en cours. IOS dispose d'un client de messagerie QuickVoice2Text qui reconnaît les messages dictés et les traduit au format texte.

Pour Google Android, une application vocale Taskos To Do List a été publiée pour ajouter des tâches à une liste de tâches et un programme pour envoyer des SMS, des lettres et des messages à Twitter appelé VoiceLink.

Liste de tâches à faire Créez une liste de tâches en les dictant à votre appareil Android OS

Référence historique

Les premières technologies de reconnaissance vocale sont apparues en 1952 et ont permis de détecter automatiquement les nombres prononcés. Au début des années 1990, des solutions sont apparues sur le marché qui pouvaient gérer des mots et des phrases simples, ainsi que des phrases simples. Ils étaient courants aux États-Unis et utilisés par les médecins et les militaires. La vulgarisation des systèmes de commande vocale auprès des consommateurs ordinaires n'a commencé qu'au tournant des 20e et 21e siècles - avec l'avènement des smartphones.