Classification CIB

Sections
G - Physique
G10L - Analyse ou synthèse de la parole; reconnaissance de la parole; traitement de la parole ou de la voix; codage ou décodage de la parole ou de signaux audio

G10L 11/00	Détermination ou détection des caractéristiques de la parole ou des signaux audio qui ne se limitent pas à un seul des groupes ; G10L 15/00-G10L 21/00
G10L 11/02	Détection de présence ou d'absence de signaux de parole
G10L 11/04	Détermination de la hauteur des signaux de parole
G10L 11/06	Distinction entre parties voisées et non voisées des signaux de parole (G10L 11/04 a priorité);;
G10L 13/00	Synthèse de la parole; Systèmes de synthèse de la parole à partir de texte
G10L 13/02	Procédés d'élaboration de parole synthétique; Synthétiseurs de parole
G10L 13/04	Procédés d'élaboration de parole synthétique; Synthétiseurs de parole - Détails des systèmes de synthèse de la parole, p.ex. structure du synthétiseur ou gestion de la mémoire
G10L 13/06	Unités élémentaires de parole utilisées dans les synthétiseurs de parole; Règles de concaténation
G10L 13/07	Règles de concaténation
G10L 13/08	Analyse de texte ou génération de paramètres pour la synthèse de la parole à partir de texte, p.ex. conversion graphème-phonème, génération de prosodie ou détermination de l'intonation ou de l'accent tonique
G10L 13/10	Règles de prosodie dérivées du texte; Intonation ou accent tonique
G10L 13/027	Synthétiseurs de parole à partir de concepts; Génération de phrases naturelles à partir de concepts automatisés
G10L 13/033	Procédés d'élaboration de parole synthétique; Synthétiseurs de parole Édition de voix, p.ex. transformation de la voix du synthétiseur
G10L 13/047	Architecture des synthétiseurs de parole
G10L 15/00	Reconnaissance de la parole
G10L 15/01	Estimation ou évaluation des systèmes de reconnaissance de la parole
G10L 15/02	Extraction de caractéristiques pour la reconnaissance de la parole; Sélection d'unités de reconnaissance
G10L 15/04	Segmentation; Détection des limites de mots
G10L 15/05	Détection des limites de mots
G10L 15/06	Création de gabarits de référence; Entraînement des systèmes de reconnaissance de la parole, p.ex. adaptation aux caractéristiques de la voix du locuteur
G10L 15/07	Adaptation au locuteur
G10L 15/08	Classement ou recherche de la parole
G10L 15/10	Classement ou recherche de la parole utilisant des mesures de distance ou de distorsion entre la parole inconnue et les gabarits de référence
G10L 15/12	Classement ou recherche de la parole utilisant des techniques de programmation dynamique, p.ex. normalisation temporelle par comparaison dynamique [DTW]
G10L 15/14	Classement ou recherche de la parole utilisant des modèles statistiques, p.ex. des modèles de Markov cachés [HMM]
G10L 15/16	Classement ou recherche de la parole utilisant des réseaux neuronaux artificiels
G10L 15/18	Classement ou recherche de la parole utilisant une modélisation du langage naturel
G10L 15/19	Contexte grammatical, p.ex. désambiguïsation des hypothèses de reconnaissance par application des règles de séquence de mots
G10L 15/20	Techniques de reconnaissance de la parole spécialement adaptées de par leur robustesse contre les perturbations environnantes, p.ex. en milieu bruyant ou reconnaissance de la parole émise dans une situation de stress
G10L 15/22	Procédures utilisées pendant le processus de reconnaissance de la parole, p.ex. dialogue homme-machine
G10L 15/24	Reconnaissance de la parole utilisant des caractéristiques non acoustiques
G10L 15/25	Reconnaissance de la parole utilisant des caractéristiques non acoustiques utilisant la position des lèvres, le mouvement des lèvres ou l’analyse du visage
G10L 15/26	Systèmes de synthèse de texte à partir de la parole
G10L 15/28	Reconnaissance de la parole - Détails de structure des systèmes de reconnaissance de la parole
G10L 15/30	Reconnaissance distribuée, p.ex. dans les systèmes client-serveur, pour les applications en téléphonie mobile ou réseaux
G10L 15/32	Reconnaisseurs multiples utilisés en séquence ou en parallèle; Systèmes de combinaison de score à cet effet, p.ex. systèmes de vote
G10L 15/34	Adaptation d’un reconnaisseur unique pour traitement en parallèle, p.ex. par utilisation de processeurs multiples ou informatique en nuage
G10L 15/065	Adaptation
G10L 15/183	Classement ou recherche de la parole utilisant une modélisation du langage naturel selon les contextes, p.ex. modèles de langage
G10L 15/187	Contexte phonémique, p.ex. règles de prononciation, contraintes phonotactiques ou n-grammes de phonèmes
G10L 15/193	Grammaires formelles, p.ex. automates à états finis, grammaires hors contexte ou réseaux de mots
G10L 15/197	Grammaires probabilistes, p.ex. n-grammes de mots
G10L 17/00	Identification ou vérification du locuteur
G10L 17/02	Opérations de prétraitement, p.ex. sélection de segment; Représentation ou modélisation de motifs, p.ex. fondée sur l’analyse linéaire discriminante [LDA] ou les composantes principales; Sélection ou extraction des caractéristiques
G10L 17/04	Entraînement, enrôlement ou construction de modèle
G10L 17/06	Techniques de prise de décision; Stratégies d’alignement de motifs
G10L 17/08	Utilisation d’une mesure de distorsion ou d’une distance particulière entre un motif d’analyse et les modèles de référence
G10L 17/10	Systèmes multimodaux, c. à d. basés sur l’intégration de moteurs multiples de reconnaissance ou de fusion de systèmes experts
G10L 17/12	Normalisation du score
G10L 17/14	Par catégorisation phonémique ou reconnaissance de la parole avant identification ou vérification du locuteur
G10L 17/16	Modèles de Markov cachés
G10L 17/18	Réseaux neuronaux artificiels; Approches connexionnistes
G10L 17/20	Transformations de motifs ou opérations ayant pout but d’augmenter la robustesse du système, p.ex. contre le bruit du canal ou les différentes conditions de fonctionnement
G10L 17/22	Procédures interactives; Interfaces homme-machine
G10L 17/24	Procédures interactives; Interfaces homme-machine l’utilisateur étant incité à prononcer un mot de passe ou une phrase prédéfinie
G10L 17/26	Reconnaissance de caractéristiques spéciales de voix, p.ex. pour utilisation dans les détecteurs de mensonge; Reconnaissance des voix d’animaux
G10L 19/00	Techniques d'analyse ou de synthèse de la parole ou des signaux audio pour la réduction de la redondance, p.ex. dans les vocodeurs; Codage ou décodage de la parole ou des signaux audio utilisant les modèles source-filtre ou l’analyse psychoacoustique
G10L 19/002	Allocation dynamique de bit
G10L 19/03	Prédiction spectrale pour empêcher le pré-écho; Mise en forme de bruit temporaire [TNS], p.ex. dans MPEG2 ou MPEG4
G10L 19/04	Techniques d'analyse ou de synthèse de la parole ou des signaux audio pour la réduction de la redondance, p.ex. dans les vocodeurs; Codage ou décodage de la parole ou des signaux audio utilisant les modèles source-filtre ou l’analyse psychoacoustique utilisant des techniques de prédiction
G10L 19/005	Correction d’erreurs induites par le canal de transmission, lorsqu’elles sont liées à l’algorithme de codage
G10L 19/06	Détermination ou codage des caractéristiques spectrales, p.ex. des coefficients de prédiction à court terme
G10L 19/07	Vocodeurs à paires de spectres linéaire [LSP]
G10L 19/008	Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage
G10L 19/09	Prédiction à long terme, c. à d. en éliminant les redondances périodiques, p.ex. en utilisant un répertoire adaptatif ou un prédicateur de hauteur tonale
G10L 19/10	Détermination ou codage de la fonction d'excitation; Détermination ou codage des paramètres de prédiction à long terme la fonction d'excitation étant l’excitation multi-impulsionnelle
G10L 19/012	Codage du bruit de confort ou du silence
G10L 19/13	Prédiction linéaire excitée par le résidu [RELP]
G10L 19/14	Détails non prévus dans les groupes ; G10L 19/06-G10L 19/12, p.ex. codage du gain, conception du post-filtrage ou structure du vocodeur
G10L 19/16	Architecture de vocodeur
G10L 19/018	Mise en place d’un filigrane audio, c. à d. insertion de données inaudibles dans le signal audio
G10L 19/20	Vocodeurs utilisant des modes multiples utilisant un codage spécifique de la catégorie de son, des encodeurs hybrides ou un codage basé objet
G10L 19/022	Constitution de blocs, c. à d. regroupement d’échantillons temporels; Choix des fenêtres d’analyse; Facteur de recouvrement
G10L 19/24	Codecs à débit variable, p.ex. pour générer différentes qualités en utilisant une représentation évolutive comme le codage hiérarchique ou le codage par couches
G10L 19/025	Détection de transitions ou d’attaques pour le changement de résolution temps/fréquence
G10L 19/26	Pré-filtrage ou post-filtrage
G10L 19/028	Remplacement du bruit, c. à d. en substituant des sources de bruit à des composantes spectrales non-tonales
G10L 19/032	Quantification ou dé-quantification de composantes spectrales
G10L 19/035	Quantification scalaire
G10L 19/038	Quantification vectorielle, p.ex. TwinVQ audio
G10L 19/083	Détermination ou codage de la fonction d'excitation; Détermination ou codage des paramètres de prédiction à long terme la fonction d’excitation étant un gain d’excitation
G10L 19/087	Détermination ou codage de la fonction d'excitation; Détermination ou codage des paramètres de prédiction à long terme utilisant des modèles d’excitation mixte, p.ex. MELP, MBE, LPC bande double ou HVXC
G10L 19/093	Détermination ou codage de la fonction d'excitation; Détermination ou codage des paramètres de prédiction à long terme utilisant des modèles d’excitation sinusoïdale
G10L 19/097	Détermination ou codage de la fonction d'excitation; Détermination ou codage des paramètres de prédiction à long terme utilisant des codeurs par décomposition ou interpolation de formes d’ondes prototype [PWI]
G10L 19/107	Excitation par impulsions éparses, p.ex. par utilisation d’un répertoire algébrique
G10L 19/113	Excitation par impulsions régulières
G10L 19/125	Excitation de la hauteur tonale, p.ex. prédiction linéaire à excitation de code avec innovation synchrone de la hauteur tonale [PSI-CELP]
G10L 19/135	Prédiction linéaire excitée par une somme vectorielle [VSELP]
G10L 21/00	Traitement du signal de parole ou de voix pour produire un autre signal audible ou non audible, p.ex. visuel ou tactile, afin de modifier sa qualité ou son intelligibilité
G10L 21/01	Correction de l’axe temporel
G10L 21/02	Amélioration de l'intelligibilité de la parole, p.ex. réduction de bruit ou annulation d'écho
G10L 21/003	Changement de la qualité de la voix, p.ex. de la hauteur tonale ou des formants
G10L 21/04	Compression ou expansion temporelles
G10L 21/06	Transformation de la parole en une représentation non audible, p.ex. visualisation de la parole ou traitement de la parole pour les aides tactiles
G10L 21/007	Changement de la qualité de la voix, p.ex. de la hauteur tonale ou des formants caractérisé par le procédé utilisé
G10L 21/10	Transformation en information visible
G10L 21/12	Transformation en information visible en affichant l’information du domaine temporel
G10L 21/013	Adaptation à la hauteur tonale ciblée
G10L 21/14	Transformation en information visible en affichant l’information du domaine fréquentiel
G10L 21/16	Transformation en représentation non-visible
G10L 21/18	Transformation de la parole en une représentation non audible, p.ex. visualisation de la parole ou traitement de la parole pour les aides tactiles - Détails du procédé de transformation
G10L 21/028	Séparation du signal de voix utilisant les propriétés des sources sonores
G10L 21/034	Réglage automatique
G10L 21/038	Amélioration de l'intelligibilité de la parole, p.ex. réduction de bruit ou annulation d'écho utilisant des techniques d’étalement de bande
G10L 21/043	Compression ou expansion temporelles par changement de la vitesse
G10L 21/045	Compression ou expansion temporelles par changement de la vitesse en réduisant ou en insérant une forme d’onde
G10L 21/047	Compression ou expansion temporelles par changement de la vitesse en réduisant ou en insérant une forme d’onde caractérisée par le type de forme d’onde à réduire ou à insérer
G10L 21/049	Compression ou expansion temporelles par changement de la vitesse en réduisant ou en insérant une forme d’onde caractérisée par l’interconnexion des formes d’onde
G10L 21/055	Compression ou expansion temporelles pour la synchronisation avec d’autres signaux, p.ex. signaux vidéo
G10L 21/057	Compression ou expansion temporelles pour améliorer l'intelligibilité
G10L 21/0208	Filtration du bruit
G10L 21/0216	Filtration du bruit caractérisée par le procédé d’estimation du bruit
G10L 21/0224	Traitement dans le domaine temporel
G10L 21/0232	Traitement dans le domaine fréquentiel
G10L 21/0264	Filtration du bruit caractérisée par le type de mesure du paramètre, p.ex. techniques de corrélation, techniques de passage par zéro ou techniques prédictives
G10L 21/0272	Séparation du signal de voix
G10L 21/0308	Séparation du signal de voix caractérisée par le type de mesure du paramètre, p.ex. techniques de corrélation, techniques de passage par zéro ou techniques prédictives
G10L 21/0316	Amélioration de l'intelligibilité de la parole, p.ex. réduction de bruit ou annulation d'écho en changeant l’amplitude
G10L 21/0324	Amélioration de l'intelligibilité de la parole, p.ex. réduction de bruit ou annulation d'écho en changeant l’amplitude - Détails du traitement à cet effet
G10L 21/0332	Amélioration de l'intelligibilité de la parole, p.ex. réduction de bruit ou annulation d'écho en changeant l’amplitude - Détails du traitement à cet effet impliquant la modification des formes d’onde
G10L 21/0356	Amélioration de l'intelligibilité de la parole, p.ex. réduction de bruit ou annulation d'écho en changeant l’amplitude pour la synchronisation avec d’autres signaux, p.ex. signaux vidéo
G10L 21/0364	Amélioration de l'intelligibilité de la parole, p.ex. réduction de bruit ou annulation d'écho en changeant l’amplitude pour améliorer l'intelligibilité
G10L 21/0388	Amélioration de l'intelligibilité de la parole, p.ex. réduction de bruit ou annulation d'écho utilisant des techniques d’étalement de bande - Détails du traitement à cet effet
G10L 23/00	Analyse de la parole non prévue dans les autres groupes de la présente sous-classe
G10L 25/00	Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes
G10L 25/03	Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par le type de paramètres extraits
G10L 25/06	Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par le type de paramètres extraits les paramètres extraits étant des coefficients de corrélation
G10L 25/09	Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par le type de paramètres extraits les paramètres extraits étant des taux de passage par zéro
G10L 25/12	Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par le type de paramètres extraits les paramètres extraits étant des coefficients de prédiction
G10L 25/15	Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par le type de paramètres extraits les paramètres extraits étant des informations sur les formants
G10L 25/18	Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par le type de paramètres extraits les paramètres extraits étant l’information spectrale de chaque sous-bande
G10L 25/21	Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par le type de paramètres extraits les paramètres extraits étant l’information sur la puissance
G10L 25/24	Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par le type de paramètres extraits les paramètres extraits étant le cepstre
G10L 25/27	Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par la technique d’analyse
G10L 25/30	Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par la technique d’analyse utilisant des réseaux neuronaux
G10L 25/33	Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par la technique d’analyse utilisant la logique floue
G10L 25/36	Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par la technique d’analyse utilisant la théorie du chaos
G10L 25/39	Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par la technique d’analyse utilisant les algorithmes génétiques
G10L 25/45	Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par le type de fenêtre d’analyse
G10L 25/48	Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes spécialement adaptées pour un usage particulier
G10L 25/51	Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes spécialement adaptées pour un usage particulier pour comparaison ou différentiation
G10L 25/54	Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes spécialement adaptées pour un usage particulier pour comparaison ou différentiation pour la recherche
G10L 25/57	Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes spécialement adaptées pour un usage particulier pour comparaison ou différentiation pour le traitement des signaux vidéo
G10L 25/60	Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes spécialement adaptées pour un usage particulier pour comparaison ou différentiation pour mesurer la qualité des signaux de voix
G10L 25/63	Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes spécialement adaptées pour un usage particulier pour comparaison ou différentiation pour estimer un état émotionnel
G10L 25/66	Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes spécialement adaptées pour un usage particulier pour comparaison ou différentiation pour extraire des paramètres en rapport avec l’état de santé
G10L 25/69	Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes spécialement adaptées pour un usage particulier pour l’évaluation de signaux de voix synthétiques ou décodés
G10L 25/72	Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes spécialement adaptées pour un usage particulier pour transmettre les résultats de l’analyse
G10L 25/75	Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes pour la modélisation des paramètres du conduit vocal
G10L 25/78	Détection de la présence ou de l’absence de signaux de voix
G10L 25/81	Détection de la présence ou de l’absence de signaux de voix pour différencier la parole de la musique
G10L 25/84	Détection de la présence ou de l’absence de signaux de voix pour différencier la parole du bruit
G10L 25/87	Détection de points discrets dans un signal de voix
G10L 25/90	Détermination de la hauteur tonale des signaux de parole
G10L 25/93	Différenciation entre parties voisées et non voisées des signaux de la parole
G10L 99/00	Matière non prévue dans les autres groupes de la présente sous-classe