POURQUOI SOVO

De façon à obtenir le meilleur sous-titrage en direct, SOVO utilise des éléments uniques tirés de sa technologie, de son personnel et de ses méthodes opérationnelles. Dans cette section, nous expliquons ce qui rend le service de SOVO unique et inégalé.

PLATEFORME DE SOUS-TITRAGE EN DIRECT UNIQUE AU MONDE

La suite logicielle développée par SOVO, nommée STDirect, est unique à plusieurs égards, entre autres par son aspect multimodal. En effet, les sous-titreurs peuvent combiner l’utilisation de leur voix, d’une manette de jeu vidéo et d’une interface graphique sur ordinateur afin de produire les meilleurs sous-titres possibles en temps réel, tel que décrit ci-bas. La solution est particulièrement efficace lorsque le contenu à sous-titrer est rapide et non scripté.

La reconnaissance vocale utilisée dans le système STDirect se base sur des modèles acoustiques qui représentent les différents sons qui façonnent les mots dans une langue. Ces modèles sont construits avec des techniques avancées d’intelligence artificielle, à l’aide d’une immense quantité de processeurs spécialisés et utilisant des dizaines de milliers d’heures de fichiers audio annotés de façon minutieuse. SOVO est le chef de file dans l’application des technologies de «deep learning» à la tâche de sous-titrage en direct par reconnaissance vocale. Les modèles acoustiques ultraperformants résultants sont indépendants du locuteur, ce qui fait qu’ils n’ont pas à être adaptés à la voix de chacun des sous-titreurs. Ceci mène à une qualité plus uniforme.

La version 8.0 de STDirect amène un nouvel élément, soit la technologie «Dynamic-LM». Outre les modèles acoustiques, une autre composante essentielle d’un système de reconnaissance de la parole est le modèle de langage qui représente les probabilités de séquences de mots dans une langue ou un domaine particulier. La technologie Dynamic-LM permet d’utiliser des modèles beaucoup plus complexes et fidèles que les systèmes traditionnels. Un exemple d’application de cette technologie est l’utilisation en temps réel d’une sous-grammaire ultracomplexe et spécialisée représentant les nombres et leurs variations en décimales, fractions, ordinaux, etc. L’atteinte de grande précision dans les nombres est évidemment cruciale pour l’intelligibilité des sous-titres dans les domaines des affaires, des sports, de la météo, des affaires publiques, etc.

En plus de leur voix, les sous-titreurs utilisent une manette de jeu vidéo pour la ponctuation et les autres caractères spéciaux ou texte indiquant par exemple un changement d’interlocuteur, des bruits de fond, des applaudissements ou autres. Ceci permet aux sous-titreurs de ne pas avoir à verbaliser tous les points, virgules ou autres caractères fréquents, menant à un flux de sous-titres beaucoup plus rapide, fluide et précis, en particulier quand le rythme de parole est élevé. Finalement, une interface graphique sur mesure permet aux sous-titreurs de cliquer des mots ou du texte préparé à l’avance en combinaison avec la voix et la manette de jeu. Cette approche offre énormément de flexibilité aux sous-titreurs afin de leur permettre de créer les meilleurs sous-titres possibles en temps réel. Par exemple, les noms d’athlètes qui sont complexes et qui risquent de n’être utilisés que pour un événement en particulier (par exemple les noms des équipiers de bobsleigh de l’Ukraine pendant les jeux olympiques d’hiver) peuvent être préparés à l’avance et cliqués plutôt qu’ajoutés aux dictionnaires de reconnaissance vocale. Tout matériel préparé à l’avance peut être utilisé directement à l’aide de cette interface pour obtenir 100% de précision lors de ces segments.

L’architecture logicielle, unique dans l’industrie, permet un partage inégalé des données ainsi que des ressources matérielles et logicielles parmi l’ensemble des sous-titreurs œuvrant chez SOVO. L’approche « serveur » utilisée chez SOVO, contrairement à une approche chez nos compétiteurs où les sous-titreurs utilisent un logiciel de dictée personnel sur leur propre ordinateur, permet de bénéficier de puissantes ressources informatiques centralisées. De plus, chaque sous-titreur bénéficie de façon instantanée du travail de ses collègues depuis des années, ainsi que des changements faits aux systèmes par les ingénieurs afin d’obtenir de meilleures performances. Dans d’autres organisations, les sous-titreurs travaillent souvent en silo et peuvent difficilement partager les nouveaux mots, les grammaires et les autres améliorations.

MODÈLES DE LANGAGE ET DICTIONNAIRES

Au fil des ans, SOVO a bâti une propriété intellectuelle considérable dans le sous-titrage en direct d’émissions télé, sessions parlementaires, et autres événements. Une grande partie de cette propriété intellectuelle prend forme dans un arsenal d’algorithmes, de modèles de langage et de dictionnaires qui sont utilisés pour modéliser les mots, séquences de mots et phrases spécifiques à chaque production en direct. Les dictionnaires SOVO, qui comptent plus d’un demi-million de mots avec chacun une ou plusieurs prononciations, sont mis à jour de façon régulière. Les modèles de langage quant à eux sont optimisés en continu pour des tâches spécifiques. SOVO a travaillé depuis plus d’une décennie à élaborer ses dictionnaires contenant entre autres des dizaines de milliers de noms de personnes, d’endroits, d’équipes, et autres termes spécifiques utilisés dans les différentes diffusions. Ces dictionnaires, partagés entre tous les sous-titreurs de l’entreprise, représentent ainsi un actif colossal.

Les modèles de langage, représentant les probabilités de mots et de séquences de mots selon le domaine, sont optimisés pour la tâche spécifique. SOVO a développé et raffiné des modèles de langage pour chacune des grandes disciplines sportives couvertes en direct, pour les affaires publiques, pour les émissions pour enfants, pour les événements culturels, pour les différents types de nouvelles, etc. Ces modèles sont entraînés sur des dizaines de milliers de documents de la catégorie appropriée, minutieusement corrigés. Les modèles sont utilisés en production et améliorés de façon automatique en continu afin d’assurer une performance optimale.

SOVO investit des sommes considérables à chaque année dans le développement et la maintenance de ses dictionnaires et modèles de langage spécialisés.

 MÉTHODES DE PRODUCTION

assurer la cohérence
et la qualité

Même si une production est diffusée en direct, il est toujours possible de préparer cette émission à l’avance afin d’optimiser la précision des sous-titres. Chez SOVO, les sous-titreurs ont une période de préproduction réservée à leur horaire de travail pour se préparer à leur production en direct. Ils bénéficient de ce temps pour revoir tout document fourni par le client (scripts, topos, liste et bio des intervenants) ou toute information pertinente pouvant être trouvée sur Internet au sujet de la production à venir (événements du jour ou articles à débattre à l’ordre du jour). Les dictionnaires sont mis à jour en fonction de l’information, les prononciations sont vérifiées, des listes de mots sont créées à l’avance pour assurer le meilleur rendu possible

Immédiatement après la production, ou dans les heures qui suivent, SOVO fait un retour sur la production. Si des mots ont causé des problèmes pendant la production, les modèles et les dictionnaires sont revisités. Dans plusieurs cas, SOVO entreprend une correction systématique des sous-titres pour certaines productions (selon le niveau de service requis par le client), et une correction d’une certaine proportion des autres productions. Les sous-titres corrigés peuvent servir jusqu’à trois objectifs : l’amélioration des modèles de langage, l’évaluation de la performance de la production en direct, et potentiellement (si nécessaire) la création d’un fichier de sous-titres revus et corrigés pouvant être utilisé pour une rediffusion de l’émission.

Même si le niveau de service n’exige pas que SOVO fasse de correction des sous-titres, l’équipe corrigera tout de même une partie des productions pour fins d’analyse et d’optimisation. L’effort considérable investi par SOVO dans la postproduction fait que le système s’améliore significativement avec le temps pour chacun de ses sous-titreurs et pour chacun des types d’émission sur le calendrier de production. De plus, les améliorations liées au travail fait pour un client aident à l’amélioration des performances chez tous les clients.

FORMATION CONTINUE ET GESTION DE LA PERFORMANCE

L’investissement de SOVO en formation continue et en gestion de la performance assure une grande qualité et une grande constance dans nos résultats, et ce à travers l’ensemble de nos productions.

Toute la technologie et les meilleures méthodes opérationnelles au monde ne suffisent pas à rendre un service exceptionnel si les sous-titreurs ne sont pas totalement compétents, bien formés aux différentes tâches et très motivés.

SOVO porte une attention particulière au recrutement et à la formation continue de son équipe. La performance de chaque sous-titreur dans les différents domaines de production est continuellement mesurée, et des séances d’entraînement et de correction sont planifiées régulièrement à l’horaire afin d’optimiser les résultats sur une grande étendue de contenu divers.

Contrairement à plusieurs compétiteurs, les sous-titreurs chez SOVO travaillent tous dans nos bureaux, ce qui nous permet d’avoir un meilleur contrôle sur la qualité du travail. De plus, les sous-titreurs ont l’opportunité de participer à plusieurs types de productions, ainsi qu’à des projets de recherche et développement, à des projets pilotes, etc.