G10L 11/00
|
Détermination ou détection des caractéristiques de la parole ou des signaux audio qui ne se limitent pas à un seul des groupes ; G10L 15/00-G10L 21/00 |
G10L 11/02
|
Détection de présence ou d'absence de signaux de parole |
G10L 11/04
|
Détermination de la hauteur des signaux de parole |
G10L 11/06
|
Distinction entre parties voisées et non voisées des signaux de parole (G10L 11/04 a priorité);; |
G10L 13/00
|
Synthèse de la parole; Systèmes de synthèse de la parole à partir de texte |
G10L 13/02
|
Procédés d'élaboration de parole synthétique; Synthétiseurs de parole |
G10L 13/04
|
Procédés d'élaboration de parole synthétique; Synthétiseurs de parole - Détails des systèmes de synthèse de la parole, p.ex. structure du synthétiseur ou gestion de la mémoire |
G10L 13/06
|
Unités élémentaires de parole utilisées dans les synthétiseurs de parole; Règles de concaténation |
G10L 13/07
|
Règles de concaténation |
G10L 13/08
|
Analyse de texte ou génération de paramètres pour la synthèse de la parole à partir de texte, p.ex. conversion graphème-phonème, génération de prosodie ou détermination de l'intonation ou de l'accent tonique |
G10L 13/10
|
Règles de prosodie dérivées du texte; Intonation ou accent tonique |
G10L 13/027
|
Synthétiseurs de parole à partir de concepts; Génération de phrases naturelles à partir de concepts automatisés |
G10L 13/033
|
Procédés d'élaboration de parole synthétique; Synthétiseurs de parole Édition de voix, p.ex. transformation de la voix du synthétiseur |
G10L 13/047
|
Architecture des synthétiseurs de parole |
G10L 15/00
|
Reconnaissance de la parole |
G10L 15/01
|
Estimation ou évaluation des systèmes de reconnaissance de la parole |
G10L 15/02
|
Extraction de caractéristiques pour la reconnaissance de la parole; Sélection d'unités de reconnaissance |
G10L 15/04
|
Segmentation; Détection des limites de mots |
G10L 15/05
|
Détection des limites de mots |
G10L 15/06
|
Création de gabarits de référence; Entraînement des systèmes de reconnaissance de la parole, p.ex. adaptation aux caractéristiques de la voix du locuteur |
G10L 15/07
|
Adaptation au locuteur |
G10L 15/08
|
Classement ou recherche de la parole |
G10L 15/10
|
Classement ou recherche de la parole utilisant des mesures de distance ou de distorsion entre la parole inconnue et les gabarits de référence |
G10L 15/12
|
Classement ou recherche de la parole utilisant des techniques de programmation dynamique, p.ex. normalisation temporelle par comparaison dynamique [DTW] |
G10L 15/14
|
Classement ou recherche de la parole utilisant des modèles statistiques, p.ex. des modèles de Markov cachés [HMM] |
G10L 15/16
|
Classement ou recherche de la parole utilisant des réseaux neuronaux artificiels |
G10L 15/18
|
Classement ou recherche de la parole utilisant une modélisation du langage naturel |
G10L 15/19
|
Contexte grammatical, p.ex. désambiguïsation des hypothèses de reconnaissance par application des règles de séquence de mots |
G10L 15/20
|
Techniques de reconnaissance de la parole spécialement adaptées de par leur robustesse contre les perturbations environnantes, p.ex. en milieu bruyant ou reconnaissance de la parole émise dans une situation de stress |
G10L 15/22
|
Procédures utilisées pendant le processus de reconnaissance de la parole, p.ex. dialogue homme-machine |
G10L 15/24
|
Reconnaissance de la parole utilisant des caractéristiques non acoustiques |
G10L 15/25
|
Reconnaissance de la parole utilisant des caractéristiques non acoustiques utilisant la position des lèvres, le mouvement des lèvres ou l’analyse du visage |
G10L 15/26
|
Systèmes de synthèse de texte à partir de la parole |
G10L 15/28
|
Reconnaissance de la parole - Détails de structure des systèmes de reconnaissance de la parole |
G10L 15/30
|
Reconnaissance distribuée, p.ex. dans les systèmes client-serveur, pour les applications en téléphonie mobile ou réseaux |
G10L 15/32
|
Reconnaisseurs multiples utilisés en séquence ou en parallèle; Systèmes de combinaison de score à cet effet, p.ex. systèmes de vote |
G10L 15/34
|
Adaptation d’un reconnaisseur unique pour traitement en parallèle, p.ex. par utilisation de processeurs multiples ou informatique en nuage |
G10L 15/065
|
Adaptation |
G10L 15/183
|
Classement ou recherche de la parole utilisant une modélisation du langage naturel selon les contextes, p.ex. modèles de langage |
G10L 15/187
|
Contexte phonémique, p.ex. règles de prononciation, contraintes phonotactiques ou n-grammes de phonèmes |
G10L 15/193
|
Grammaires formelles, p.ex. automates à états finis, grammaires hors contexte ou réseaux de mots |
G10L 15/197
|
Grammaires probabilistes, p.ex. n-grammes de mots |
G10L 17/00
|
Identification ou vérification du locuteur |
G10L 17/02
|
Opérations de prétraitement, p.ex. sélection de segment; Représentation ou modélisation de motifs, p.ex. fondée sur l’analyse linéaire discriminante [LDA] ou les composantes principales; Sélection ou extraction des caractéristiques |
G10L 17/04
|
Entraînement, enrôlement ou construction de modèle |
G10L 17/06
|
Techniques de prise de décision; Stratégies d’alignement de motifs |
G10L 17/08
|
Utilisation d’une mesure de distorsion ou d’une distance particulière entre un motif d’analyse et les modèles de référence |
G10L 17/10
|
Systèmes multimodaux, c. à d. basés sur l’intégration de moteurs multiples de reconnaissance ou de fusion de systèmes experts |
G10L 17/12
|
Normalisation du score |
G10L 17/14
|
Par catégorisation phonémique ou reconnaissance de la parole avant identification ou vérification du locuteur |
G10L 17/16
|
Modèles de Markov cachés |
G10L 17/18
|
Réseaux neuronaux artificiels; Approches connexionnistes |
G10L 17/20
|
Transformations de motifs ou opérations ayant pout but d’augmenter la robustesse du système, p.ex. contre le bruit du canal ou les différentes conditions de fonctionnement |
G10L 17/22
|
Procédures interactives; Interfaces homme-machine |
G10L 17/24
|
Procédures interactives; Interfaces homme-machine l’utilisateur étant incité à prononcer un mot de passe ou une phrase prédéfinie |
G10L 17/26
|
Reconnaissance de caractéristiques spéciales de voix, p.ex. pour utilisation dans les détecteurs de mensonge; Reconnaissance des voix d’animaux |
G10L 19/00
|
Techniques d'analyse ou de synthèse de la parole ou des signaux audio pour la réduction de la redondance, p.ex. dans les vocodeurs; Codage ou décodage de la parole ou des signaux audio utilisant les modèles source-filtre ou l’analyse psychoacoustique |
G10L 19/002
|
Allocation dynamique de bit |
G10L 19/03
|
Prédiction spectrale pour empêcher le pré-écho; Mise en forme de bruit temporaire [TNS], p.ex. dans MPEG2 ou MPEG4 |
G10L 19/04
|
Techniques d'analyse ou de synthèse de la parole ou des signaux audio pour la réduction de la redondance, p.ex. dans les vocodeurs; Codage ou décodage de la parole ou des signaux audio utilisant les modèles source-filtre ou l’analyse psychoacoustique utilisant des techniques de prédiction |
G10L 19/005
|
Correction d’erreurs induites par le canal de transmission, lorsqu’elles sont liées à l’algorithme de codage |
G10L 19/06
|
Détermination ou codage des caractéristiques spectrales, p.ex. des coefficients de prédiction à court terme |
G10L 19/07
|
Vocodeurs à paires de spectres linéaire [LSP] |
G10L 19/008
|
Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage |
G10L 19/09
|
Prédiction à long terme, c. à d. en éliminant les redondances périodiques, p.ex. en utilisant un répertoire adaptatif ou un prédicateur de hauteur tonale |
G10L 19/10
|
Détermination ou codage de la fonction d'excitation; Détermination ou codage des paramètres de prédiction à long terme la fonction d'excitation étant l’excitation multi-impulsionnelle |
G10L 19/012
|
Codage du bruit de confort ou du silence |
G10L 19/13
|
Prédiction linéaire excitée par le résidu [RELP] |
G10L 19/14
|
Détails non prévus dans les groupes ; G10L 19/06-G10L 19/12, p.ex. codage du gain, conception du post-filtrage ou structure du vocodeur |
G10L 19/16
|
Architecture de vocodeur |
G10L 19/018
|
Mise en place d’un filigrane audio, c. à d. insertion de données inaudibles dans le signal audio |
G10L 19/20
|
Vocodeurs utilisant des modes multiples utilisant un codage spécifique de la catégorie de son, des encodeurs hybrides ou un codage basé objet |
G10L 19/022
|
Constitution de blocs, c. à d. regroupement d’échantillons temporels; Choix des fenêtres d’analyse; Facteur de recouvrement |
G10L 19/24
|
Codecs à débit variable, p.ex. pour générer différentes qualités en utilisant une représentation évolutive comme le codage hiérarchique ou le codage par couches |
G10L 19/025
|
Détection de transitions ou d’attaques pour le changement de résolution temps/fréquence |
G10L 19/26
|
Pré-filtrage ou post-filtrage |
G10L 19/028
|
Remplacement du bruit, c. à d. en substituant des sources de bruit à des composantes spectrales non-tonales |
G10L 19/032
|
Quantification ou dé-quantification de composantes spectrales |
G10L 19/035
|
Quantification scalaire |
G10L 19/038
|
Quantification vectorielle, p.ex. TwinVQ audio |
G10L 19/083
|
Détermination ou codage de la fonction d'excitation; Détermination ou codage des paramètres de prédiction à long terme la fonction d’excitation étant un gain d’excitation |
G10L 19/087
|
Détermination ou codage de la fonction d'excitation; Détermination ou codage des paramètres de prédiction à long terme utilisant des modèles d’excitation mixte, p.ex. MELP, MBE, LPC bande double ou HVXC |
G10L 19/093
|
Détermination ou codage de la fonction d'excitation; Détermination ou codage des paramètres de prédiction à long terme utilisant des modèles d’excitation sinusoïdale |
G10L 19/097
|
Détermination ou codage de la fonction d'excitation; Détermination ou codage des paramètres de prédiction à long terme utilisant des codeurs par décomposition ou interpolation de formes d’ondes prototype [PWI] |
G10L 19/107
|
Excitation par impulsions éparses, p.ex. par utilisation d’un répertoire algébrique |
G10L 19/113
|
Excitation par impulsions régulières |
G10L 19/125
|
Excitation de la hauteur tonale, p.ex. prédiction linéaire à excitation de code avec innovation synchrone de la hauteur tonale [PSI-CELP] |
G10L 19/135
|
Prédiction linéaire excitée par une somme vectorielle [VSELP] |
G10L 21/00
|
Traitement du signal de parole ou de voix pour produire un autre signal audible ou non audible, p.ex. visuel ou tactile, afin de modifier sa qualité ou son intelligibilité |
G10L 21/01
|
Correction de l’axe temporel |
G10L 21/02
|
Amélioration de l'intelligibilité de la parole, p.ex. réduction de bruit ou annulation d'écho |
G10L 21/003
|
Changement de la qualité de la voix, p.ex. de la hauteur tonale ou des formants |
G10L 21/04
|
Compression ou expansion temporelles |
G10L 21/06
|
Transformation de la parole en une représentation non audible, p.ex. visualisation de la parole ou traitement de la parole pour les aides tactiles |
G10L 21/007
|
Changement de la qualité de la voix, p.ex. de la hauteur tonale ou des formants caractérisé par le procédé utilisé |
G10L 21/10
|
Transformation en information visible |
G10L 21/12
|
Transformation en information visible en affichant l’information du domaine temporel |
G10L 21/013
|
Adaptation à la hauteur tonale ciblée |
G10L 21/14
|
Transformation en information visible en affichant l’information du domaine fréquentiel |
G10L 21/16
|
Transformation en représentation non-visible |
G10L 21/18
|
Transformation de la parole en une représentation non audible, p.ex. visualisation de la parole ou traitement de la parole pour les aides tactiles - Détails du procédé de transformation |
G10L 21/028
|
Séparation du signal de voix utilisant les propriétés des sources sonores |
G10L 21/034
|
Réglage automatique |
G10L 21/038
|
Amélioration de l'intelligibilité de la parole, p.ex. réduction de bruit ou annulation d'écho utilisant des techniques d’étalement de bande |
G10L 21/043
|
Compression ou expansion temporelles par changement de la vitesse |
G10L 21/045
|
Compression ou expansion temporelles par changement de la vitesse en réduisant ou en insérant une forme d’onde |
G10L 21/047
|
Compression ou expansion temporelles par changement de la vitesse en réduisant ou en insérant une forme d’onde caractérisée par le type de forme d’onde à réduire ou à insérer |
G10L 21/049
|
Compression ou expansion temporelles par changement de la vitesse en réduisant ou en insérant une forme d’onde caractérisée par l’interconnexion des formes d’onde |
G10L 21/055
|
Compression ou expansion temporelles pour la synchronisation avec d’autres signaux, p.ex. signaux vidéo |
G10L 21/057
|
Compression ou expansion temporelles pour améliorer l'intelligibilité |
G10L 21/0208
|
Filtration du bruit |
G10L 21/0216
|
Filtration du bruit caractérisée par le procédé d’estimation du bruit |
G10L 21/0224
|
Traitement dans le domaine temporel |
G10L 21/0232
|
Traitement dans le domaine fréquentiel |
G10L 21/0264
|
Filtration du bruit caractérisée par le type de mesure du paramètre, p.ex. techniques de corrélation, techniques de passage par zéro ou techniques prédictives |
G10L 21/0272
|
Séparation du signal de voix |
G10L 21/0308
|
Séparation du signal de voix caractérisée par le type de mesure du paramètre, p.ex. techniques de corrélation, techniques de passage par zéro ou techniques prédictives |
G10L 21/0316
|
Amélioration de l'intelligibilité de la parole, p.ex. réduction de bruit ou annulation d'écho en changeant l’amplitude |
G10L 21/0324
|
Amélioration de l'intelligibilité de la parole, p.ex. réduction de bruit ou annulation d'écho en changeant l’amplitude - Détails du traitement à cet effet |
G10L 21/0332
|
Amélioration de l'intelligibilité de la parole, p.ex. réduction de bruit ou annulation d'écho en changeant l’amplitude - Détails du traitement à cet effet impliquant la modification des formes d’onde |
G10L 21/0356
|
Amélioration de l'intelligibilité de la parole, p.ex. réduction de bruit ou annulation d'écho en changeant l’amplitude pour la synchronisation avec d’autres signaux, p.ex. signaux vidéo |
G10L 21/0364
|
Amélioration de l'intelligibilité de la parole, p.ex. réduction de bruit ou annulation d'écho en changeant l’amplitude pour améliorer l'intelligibilité |
G10L 21/0388
|
Amélioration de l'intelligibilité de la parole, p.ex. réduction de bruit ou annulation d'écho utilisant des techniques d’étalement de bande - Détails du traitement à cet effet |
G10L 23/00
|
Analyse de la parole non prévue dans les autres groupes de la présente sous-classe |
G10L 25/00
|
Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes |
G10L 25/03
|
Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par le type de paramètres extraits |
G10L 25/06
|
Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par le type de paramètres extraits les paramètres extraits étant des coefficients de corrélation |
G10L 25/09
|
Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par le type de paramètres extraits les paramètres extraits étant des taux de passage par zéro |
G10L 25/12
|
Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par le type de paramètres extraits les paramètres extraits étant des coefficients de prédiction |
G10L 25/15
|
Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par le type de paramètres extraits les paramètres extraits étant des informations sur les formants |
G10L 25/18
|
Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par le type de paramètres extraits les paramètres extraits étant l’information spectrale de chaque sous-bande |
G10L 25/21
|
Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par le type de paramètres extraits les paramètres extraits étant l’information sur la puissance |
G10L 25/24
|
Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par le type de paramètres extraits les paramètres extraits étant le cepstre |
G10L 25/27
|
Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par la technique d’analyse |
G10L 25/30
|
Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par la technique d’analyse utilisant des réseaux neuronaux |
G10L 25/33
|
Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par la technique d’analyse utilisant la logique floue |
G10L 25/36
|
Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par la technique d’analyse utilisant la théorie du chaos |
G10L 25/39
|
Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par la technique d’analyse utilisant les algorithmes génétiques |
G10L 25/45
|
Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par le type de fenêtre d’analyse |
G10L 25/48
|
Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes spécialement adaptées pour un usage particulier |
G10L 25/51
|
Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes spécialement adaptées pour un usage particulier pour comparaison ou différentiation |
G10L 25/54
|
Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes spécialement adaptées pour un usage particulier pour comparaison ou différentiation pour la recherche |
G10L 25/57
|
Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes spécialement adaptées pour un usage particulier pour comparaison ou différentiation pour le traitement des signaux vidéo |
G10L 25/60
|
Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes spécialement adaptées pour un usage particulier pour comparaison ou différentiation pour mesurer la qualité des signaux de voix |
G10L 25/63
|
Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes spécialement adaptées pour un usage particulier pour comparaison ou différentiation pour estimer un état émotionnel |
G10L 25/66
|
Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes spécialement adaptées pour un usage particulier pour comparaison ou différentiation pour extraire des paramètres en rapport avec l’état de santé |
G10L 25/69
|
Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes spécialement adaptées pour un usage particulier pour l’évaluation de signaux de voix synthétiques ou décodés |
G10L 25/72
|
Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes spécialement adaptées pour un usage particulier pour transmettre les résultats de l’analyse |
G10L 25/75
|
Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes pour la modélisation des paramètres du conduit vocal |
G10L 25/78
|
Détection de la présence ou de l’absence de signaux de voix |
G10L 25/81
|
Détection de la présence ou de l’absence de signaux de voix pour différencier la parole de la musique |
G10L 25/84
|
Détection de la présence ou de l’absence de signaux de voix pour différencier la parole du bruit |
G10L 25/87
|
Détection de points discrets dans un signal de voix |
G10L 25/90
|
Détermination de la hauteur tonale des signaux de parole |
G10L 25/93
|
Différenciation entre parties voisées et non voisées des signaux de la parole |
G10L 99/00
|
Matière non prévue dans les autres groupes de la présente sous-classe |