Les API vocales de Google Cloud deviennent moins chères et apprennent de nouveaux langages

Google a annoncé aujourdhui une mise à jour de ses API Cloud Speech-to-Text et Text-to-Speech qui introduit quelques nouvelles fonctionnalités qui devraient être particulièrement intéressantes pour les utilisateurs dentreprise, ainsi quun meilleur support linguistique et une réduction des prix.
La plupart de ces mises à jour se concentrent sur le produit Speech-to-Text, mais Cloud Text-to-Speech reçoit une mise à jour majeure avec 31 nouveaux WaveNet et 24 nouvelles voix standard. Le service prend désormais en charge sept nouvelles langues : Bokmål danois, portugais/portugais, russe, polonais, slovaque, ukrainien et norvégien. Ils sont tous en version bêta en ce moment et étendent la liste des langues prises en charge à 21 au total.
A lire en complément : Maximiser votre expérience de téléchargement avec Uptobox Premium
Le service offre désormais la possibilité d’optimiser la lecture audio pour des appareils spécifiques. Cela peut paraître anodin, mais cela vous permet d’optimiser une application de centre d’appels pour les réponses vocales interactives et une autre application à utiliser avec un casque d’écoute.
Comme pour Cloud Speech-to-Text, cette mise à jour vise à rendre le service plus utilisable dans les situations où les développeurs doivent supporter les utilisateurs sur plusieurs canaux – pensez à une conférence téléphonique. Pour cela, l’entreprise a introduit l’an dernier la reconnaissance multi-canaux en version bêta ; aujourd’hui, cette fonctionnalité est généralement disponible.
A voir aussi : Le démarrage de Data Narrative rapporte 3 millions de dollars de plus
De même, les modèles d’IA haut de gamme de Google pour la vidéo et les téléphones améliorés ont été lancés en version bêta l’an dernier avec la promesse de moins d’erreurs de transcription que les autres modèles de Google, qui se concentrent principalement sur les requêtes courtes et les commandes vocales. Ce modèle aussi est maintenant généralement disponible.
En plus des nouvelles fonctionnalités, Google a également décidé de réduire le prix d’utilisation du service Speech-to-Text. La société a décidé de réduire de 33 pour cent les prix du modèle vidéo standard et premium pour la transcription de vidéos pour ceux qui choisissent de participer au programme d’enregistrement de données de Google. En vous inscrivant, vous autorisez Google à utiliser vos données pour aider à former les modèles de Google. L’entreprise promet que seul un nombre limité d’employés auront accès aux données et qu’elle les utilisera uniquement pour former et améliorer ses produits, mais il est probable que tout le monde ne se sentira pas à l’aise d’y participer, même si cela signifie une réduction.
Heureusement, le modèle vidéo premium régulier est désormais 25 % moins cher sans avoir à se connecter à l’enregistrement des données de Google. Comme avant, les 60 premières minutes sont toujours gratuites.