Modulate, Inc.

États‑Unis d’Amérique

Retour au propriétaire

1-23 de 23 pour Modulate, Inc. Trier par
Recheche Texte
Affiner par
Type PI
        Brevet 18
        Marque 5
Juridiction
        États-Unis 17
        International 5
        Canada 1
Date
2025 2
2024 2
2023 5
2022 2
2021 7
Voir plus
Classe IPC
G10L 15/02 - Extraction de caractéristiques pour la reconnaissance de la paroleSélection d'unités de reconnaissance 11
G10L 15/06 - Création de gabarits de référenceEntraînement des systèmes de reconnaissance de la parole, p. ex. adaptation aux caractéristiques de la voix du locuteur 10
G10L 15/22 - Procédures utilisées pendant le processus de reconnaissance de la parole, p. ex. dialogue homme-machine 9
G10L 19/018 - Mise en place d’un filigrane audio, c.-à-d. insertion de données inaudibles dans le signal audio 9
G10L 25/30 - Techniques d'analyse de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par la technique d’analyse utilisant des réseaux neuronaux 9
Voir plus
Classe NICE
09 - Appareils et instruments scientifiques et électriques 4
42 - Services scientifiques, technologiques et industriels, recherche et conception 1
Statut
En Instance 5
Enregistré / En vigueur 18

1.

SYSTEM AND METHOD FOR CREATING TIMBRES

      
Numéro d'application 19301342
Statut En instance
Date de dépôt 2025-08-15
Date de la première publication 2025-12-11
Propriétaire Modulate, Inc. (USA)
Inventeur(s)
  • Huffman, William Carter
  • Pappas, Michael

Abrégé

A method of building a new voice having a new timbre using a timbre vector space includes receiving timbre data filtered using a temporal receptive field. The timbre data is mapped in the timbre vector space. The timbre data is related to a plurality of different voices. Each of the plurality of different voices has respective timbre data in the timbre vector space. The method builds the new timbre using the timbre data of the plurality of different voices using a machine learning system.

Classes IPC  ?

  • G10L 21/013 - Adaptation à la hauteur tonale ciblée
  • G10L 15/02 - Extraction de caractéristiques pour la reconnaissance de la paroleSélection d'unités de reconnaissance
  • G10L 15/06 - Création de gabarits de référenceEntraînement des systèmes de reconnaissance de la parole, p. ex. adaptation aux caractéristiques de la voix du locuteur
  • G10L 15/22 - Procédures utilisées pendant le processus de reconnaissance de la parole, p. ex. dialogue homme-machine
  • G10L 19/018 - Mise en place d’un filigrane audio, c.-à-d. insertion de données inaudibles dans le signal audio
  • G10L 25/30 - Techniques d'analyse de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par la technique d’analyse utilisant des réseaux neuronaux

2.

USER INTERFACE FOR CONTENT MODERATION FOR VOICE CHAT

      
Numéro d'application 19231045
Statut En instance
Date de dépôt 2025-06-06
Date de la première publication 2025-09-25
Propriétaire Modulate, Inc. (USA)
Inventeur(s)
  • Huffman, William Carter
  • Pappas, Michael
  • Morino, Ken
  • Pickart, David

Abrégé

A content moderation system analyzes speech, or characteristics thereof, and determines a toxicity score representing the likelihood that a given clip of speech is toxic. A user interface displays a timeline with various instances of toxicity by one or more users for a give session. The user interface is optimized for moderation interaction, and shows how the conversation containing toxicity evolves over the time domain of a conversation.

Classes IPC  ?

  • H04L 12/18 - Dispositions pour la fourniture de services particuliers aux abonnés pour la diffusion ou les conférences
  • G06F 3/0482 - Interaction avec des listes d’éléments sélectionnables, p. ex. des menus
  • G06F 3/0484 - Techniques d’interaction fondées sur les interfaces utilisateur graphiques [GUI] pour la commande de fonctions ou d’opérations spécifiques, p. ex. sélection ou transformation d’un objet, d’une image ou d’un élément de texte affiché, détermination d’une valeur de paramètre ou sélection d’une plage de valeurs
  • G10L 15/08 - Classement ou recherche de la parole
  • G10L 25/27 - Techniques d'analyse de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par la technique d’analyse
  • G10L 25/63 - Techniques d'analyse de la parole ou de la voix qui ne se limitent pas à un seul des groupes spécialement adaptées pour un usage particulier pour comparaison ou différentiation pour estimer un état émotionnel
  • H04L 65/403 - Dispositions pour la communication multipartite, p. ex. pour les conférences

3.

MULTI-STAGE ADAPTIVE SYSTEM FOR CONTENT MODERATION

      
Numéro d'application 18660835
Statut En instance
Date de dépôt 2024-05-10
Date de la première publication 2024-09-05
Propriétaire Modulate, Inc. (USA)
Inventeur(s)
  • Huffman, William Carter
  • Pappas, Michael
  • Howie, Henry

Abrégé

A toxicity moderation system has an input configured to receive speech from a speaker. The system includes a multi-stage toxicity machine learning system having a first stage and a second stage. The first stage is trained to analyze the received speech to determine whether a toxicity level of the speech meets a toxicity threshold. The first stage is also configured to filter-through, to the second stage, speech that meets the toxicity threshold, and is further configured to filter-out speech that does not meet the toxicity threshold.

Classes IPC  ?

  • G10L 25/63 - Techniques d'analyse de la parole ou de la voix qui ne se limitent pas à un seul des groupes spécialement adaptées pour un usage particulier pour comparaison ou différentiation pour estimer un état émotionnel
  • G06N 5/022 - Ingénierie de la connaissanceAcquisition de la connaissance
  • G10L 15/02 - Extraction de caractéristiques pour la reconnaissance de la paroleSélection d'unités de reconnaissance
  • G10L 15/06 - Création de gabarits de référenceEntraînement des systèmes de reconnaissance de la parole, p. ex. adaptation aux caractéristiques de la voix du locuteur

4.

System and method for creating timbres

      
Numéro d'application 18528244
Numéro de brevet 12412588
Statut Délivré - en vigueur
Date de dépôt 2023-12-04
Date de la première publication 2024-04-11
Date d'octroi 2025-09-09
Propriétaire Modulate, Inc. (USA)
Inventeur(s)
  • Huffman, William Carter
  • Pappas, Michael

Abrégé

A method of building a new voice having a new timbre using a timbre vector space includes receiving timbre data filtered using a temporal receptive field. The timbre data is mapped in the timbre vector space. The timbre data is related to a plurality of different voices. Each of the plurality of different voices has respective timbre data in the timbre vector space. The method builds the new timbre using the timbre data of the plurality of different voices using a machine learning system.

Classes IPC  ?

  • G10L 21/013 - Adaptation à la hauteur tonale ciblée
  • G10L 15/02 - Extraction de caractéristiques pour la reconnaissance de la paroleSélection d'unités de reconnaissance
  • G10L 15/06 - Création de gabarits de référenceEntraînement des systèmes de reconnaissance de la parole, p. ex. adaptation aux caractéristiques de la voix du locuteur
  • G10L 15/22 - Procédures utilisées pendant le processus de reconnaissance de la parole, p. ex. dialogue homme-machine
  • G10L 19/018 - Mise en place d’un filigrane audio, c.-à-d. insertion de données inaudibles dans le signal audio
  • G10L 25/30 - Techniques d'analyse de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par la technique d’analyse utilisant des réseaux neuronaux

5.

SCORING SYSTEM FOR CONTENT MODERATION

      
Numéro d'application 18204869
Statut En instance
Date de dépôt 2023-06-01
Date de la première publication 2023-12-07
Propriétaire MODULATE, INC. (USA)
Inventeur(s)
  • Huffman, William Carter
  • Pappas, Michael
  • Morino, Ken
  • Pickart, David

Abrégé

A method for online voice content moderation provides a multi-stage voice content analysis system. The system includes a pre-moderator stage having a toxicity scorer configured to provide a toxicity score for a given toxic speech content from a user. The toxicity score is a function of a platform content policy. The method generates a toxicity score for the given toxic speech content. The toxic speech content is provided to a moderator as a function of the toxicity score.

Classes IPC  ?

  • G10L 15/08 - Classement ou recherche de la parole
  • G10L 25/27 - Techniques d'analyse de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par la technique d’analyse

6.

User interface for content moderation of voice chat

      
Numéro d'application 18204873
Numéro de brevet 12341619
Statut Délivré - en vigueur
Date de dépôt 2023-06-01
Date de la première publication 2023-12-07
Date d'octroi 2025-06-24
Propriétaire Modulate, Inc. (USA)
Inventeur(s)
  • Huffman, William Carter
  • Pappas, Michael
  • Morino, Ken
  • Pickart, David

Abrégé

A content moderation system analyzes speech, or characteristics thereof, and determines a toxicity score representing the likelihood that a given clip of speech is toxic. A user interface displays a timeline with various instances of toxicity by one or more users for a give session. The user interface is optimized for moderation interaction, and shows how the conversation containing toxicity evolves over the time domain of a conversation.

Classes IPC  ?

  • H04L 12/18 - Dispositions pour la fourniture de services particuliers aux abonnés pour la diffusion ou les conférences
  • G06F 3/0482 - Interaction avec des listes d’éléments sélectionnables, p. ex. des menus
  • G06F 3/0484 - Techniques d’interaction fondées sur les interfaces utilisateur graphiques [GUI] pour la commande de fonctions ou d’opérations spécifiques, p. ex. sélection ou transformation d’un objet, d’une image ou d’un élément de texte affiché, détermination d’une valeur de paramètre ou sélection d’une plage de valeurs
  • G10L 15/08 - Classement ou recherche de la parole
  • G10L 25/27 - Techniques d'analyse de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par la technique d’analyse
  • G10L 25/63 - Techniques d'analyse de la parole ou de la voix qui ne se limitent pas à un seul des groupes spécialement adaptées pour un usage particulier pour comparaison ou différentiation pour estimer un état émotionnel
  • H04L 65/403 - Dispositions pour la communication multipartite, p. ex. pour les conférences

7.

SCORING SYSTEM FOR CONTENT MODERATION

      
Numéro d'application US2023024193
Numéro de publication 2023/235517
Statut Délivré - en vigueur
Date de dépôt 2023-06-01
Date de publication 2023-12-07
Propriétaire MODULATE, INC. (USA)
Inventeur(s)
  • Huffman, William, Carter
  • Pappas, Michael
  • Morino, Ken
  • Pickart, David

Abrégé

A method for online voice content moderation provides a multi-stage voice content analysis system. The system includes a pre-moderator stage having a toxicity scorer configured to provide a toxicity score for a given toxic speech content from a user. The toxicity score is a function of a platform content policy. The method generates a toxicity score for the given toxic speech content. The toxic speech content is provided to a moderator as a function of the toxicity score.

Classes IPC  ?

  • G06F 40/40 - Traitement ou traduction du langage naturel
  • G06N 5/04 - Modèles d’inférence ou de raisonnement
  • H04L 51/212 - Surveillance ou traitement des messages utilisant un filtrage ou un blocage sélectif
  • G06N 20/00 - Apprentissage automatique

8.

PREDICTIVE AUDIO REDACTION FOR REALTIME COMMUNICATION

      
Numéro d'application 18132251
Statut En instance
Date de dépôt 2023-04-07
Date de la première publication 2023-10-12
Propriétaire MODULATE, INC. (USA)
Inventeur(s)
  • Huffman, William Carter
  • Fishman, Joshua D.
  • Nevue, Zachary

Abrégé

Illustrative embodiments employ trained artificial intelligence to provide real-time (e.g., zero introduced latency), or near-real-time (e.g., less than 500 ms of introduced latency), moderation of a verbal communication, without the need for human moderators. Illustrative embodiments employ trained artificial intelligence to provide real-time (e.g., zero introduced latency), or near-real-time (e.g., less than 500 ms of introduced latency), moderation of a verbal communication, without the need for human moderators. By using predictive technology with pre-defined knowledge of undesirable content (e.g., speech to be redacted from a verbal communication), undesirable content of a verbal communication (e.g., human speech or text-to-speech communication) may be censored, as the verbal communication is created. Prediction of undesirable content may be based on context of the initial audio communication (e.g., words preceding the offensive language) and/or the phonetic content of the verbal communication preceding the undesirable content, and/or the phonetic content of the undesirable content itself (e.g., the first sounds of offensive language).

Classes IPC  ?

  • A63F 13/67 - Création ou modification du contenu du jeu avant ou pendant l’exécution du programme de jeu, p. ex. au moyen d’outils spécialement adaptés au développement du jeu ou d’un éditeur de niveau intégré au jeu en s’adaptant à ou par apprentissage des actions de joueurs, p. ex. modification du niveau de compétences ou stockage de séquences de combats réussies en vue de leur réutilisation
  • G10L 15/187 - Contexte phonémique, p. ex. règles de prononciation, contraintes phonotactiques ou n-grammes de phonèmes
  • G10L 15/197 - Grammaires probabilistes, p. ex. n-grammes de mots
  • G10L 15/22 - Procédures utilisées pendant le processus de reconnaissance de la parole, p. ex. dialogue homme-machine
  • G06F 21/60 - Protection de données

9.

PREDICTIVE AUDIO REDACTION FOR REALTIME COMMUNICATION

      
Numéro d'application US2023017930
Numéro de publication 2023/196624
Statut Délivré - en vigueur
Date de dépôt 2023-04-07
Date de publication 2023-10-12
Propriétaire MODULATE, INC. (USA)
Inventeur(s)
  • Huffman, William Carter
  • Fishman, Joshua D.
  • Nevue, Zachary

Abrégé

Illustrative embodiments employ trained artificial intelligence to provide realtime (e.g., zero introduced latency), or near-real-time (e.g., less than 500 ms of introduced latency), moderation of a verbal communication, without the need for human moderators. By using predictive technology with pre-defined knowledge of undesirable content (e.g., speech to be redacted from a verbal communication), undesirable content of a verbal communication (e.g., human speech or text-to-speech communication) may be censored, as the verbal communication is created. Prediction of undesirable content may be based on context of the initial audio communication (e.g., words preceding the offensive language) and / or the phonetic content of the verbal communication preceding the undesirable content, and/ or the phonetic content of the undesirable content itself (e.g., the first sounds of offensive language).

Classes IPC  ?

  • G10L 15/16 - Classement ou recherche de la parole utilisant des réseaux neuronaux artificiels
  • G10L 15/30 - Reconnaissance distribuée, p. ex. dans les systèmes client-serveur, pour les applications en téléphonie mobile ou réseaux
  • G06N 20/00 - Apprentissage automatique

10.

MULTI-STAGE ADAPTIVE SYSTEM FOR CONTENT MODERATION

      
Numéro d'application US2021054319
Numéro de publication 2022/076923
Statut Délivré - en vigueur
Date de dépôt 2021-10-08
Date de publication 2022-04-14
Propriétaire MODULATE, INC. (USA)
Inventeur(s)
  • Huffman, William, Carter
  • Pappas, Michael
  • Howie, Henry

Abrégé

A toxicity moderation system has an input configured to receive speech from a speaker. The system includes a multi-stage toxicity machine learning system having a first stage and a second stage. The first stage is trained to analyze the received speech to determine whether a toxicity level of the speech meets a toxicity threshold. The first stage is also configured to filter-through, to the second stage, speech that meets the toxicity threshold, and is further configured to filter-out speech that does not meet the toxicity threshold.

Classes IPC  ?

  • G10L 15/00 - Reconnaissance de la parole
  • G10L 15/02 - Extraction de caractéristiques pour la reconnaissance de la paroleSélection d'unités de reconnaissance
  • G10L 15/08 - Classement ou recherche de la parole
  • G10L 17/00 - Techniques d'identification ou de vérification du locuteur
  • G10L 15/04 - SegmentationDétection des limites de mots

11.

Multi-stage adaptive system for content moderation

      
Numéro d'application 17497862
Numéro de brevet 11996117
Statut Délivré - en vigueur
Date de dépôt 2021-10-08
Date de la première publication 2022-04-14
Date d'octroi 2024-05-28
Propriétaire Modulate, Inc. (USA)
Inventeur(s)
  • Huffman, William Carter
  • Pappas, Michael
  • Howie, Henry

Abrégé

A toxicity moderation system has an input configured to receive speech from a speaker. The system includes a multi-stage toxicity machine learning system having a first stage and a second stage. The first stage is trained to analyze the received speech to determine whether a toxicity level of the speech meets a toxicity threshold. The first stage is also configured to filter-through, to the second stage, speech that meets the toxicity threshold, and is further configured to filter-out speech that does not meet the toxicity threshold.

Classes IPC  ?

  • G10L 25/63 - Techniques d'analyse de la parole ou de la voix qui ne se limitent pas à un seul des groupes spécialement adaptées pour un usage particulier pour comparaison ou différentiation pour estimer un état émotionnel
  • G06N 5/022 - Ingénierie de la connaissanceAcquisition de la connaissance
  • G10L 15/02 - Extraction de caractéristiques pour la reconnaissance de la paroleSélection d'unités de reconnaissance
  • G10L 15/06 - Création de gabarits de référenceEntraînement des systèmes de reconnaissance de la parole, p. ex. adaptation aux caractéristiques de la voix du locuteur

12.

M MODULATE

      
Numéro d'application 1615454
Statut Enregistrée
Date de dépôt 2021-07-26
Date d'enregistrement 2021-07-26
Propriétaire Modulate, Inc. (USA)
Classes de Nice  ? 09 - Appareils et instruments scientifiques et électriques

Produits et services

Downloadable computer programs for editing and altering sound; downloadable application software that alters and modifies the properties of a sound recording; downloadable application software for adding sound effects to sound recordings; downloadable software applications for enhancing audio recordings; downloadable computer software for use in sound database management, system administration, for generating and processing sound signals, and for converting analog and digital sound signals.

13.

System and method for creating timbres

      
Numéro d'application 17307397
Numéro de brevet 11854563
Statut Délivré - en vigueur
Date de dépôt 2021-05-04
Date de la première publication 2021-08-19
Date d'octroi 2023-12-26
Propriétaire Modulate, Inc. (USA)
Inventeur(s)
  • Huffman, William Carter
  • Pappas, Michael

Abrégé

A method of building a new voice having a new timbre using a timbre vector space includes receiving timbre data filtered using a temporal receptive field. The timbre data is mapped in the timbre vector space. The timbre data is related to a plurality of different voices. Each of the plurality of different voices has respective timbre data in the timbre vector space. The method builds the new timbre using the timbre data of the plurality of different voices using a machine learning system.

Classes IPC  ?

  • G10L 21/013 - Adaptation à la hauteur tonale ciblée
  • G10L 15/02 - Extraction de caractéristiques pour la reconnaissance de la paroleSélection d'unités de reconnaissance
  • G10L 15/22 - Procédures utilisées pendant le processus de reconnaissance de la parole, p. ex. dialogue homme-machine
  • G10L 15/06 - Création de gabarits de référenceEntraînement des systèmes de reconnaissance de la parole, p. ex. adaptation aux caractéristiques de la voix du locuteur
  • G10L 19/018 - Mise en place d’un filigrane audio, c.-à-d. insertion de données inaudibles dans le signal audio
  • G10L 25/30 - Techniques d'analyse de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par la technique d’analyse utilisant des réseaux neuronaux

14.

M MODULATE

      
Numéro d'application 213689000
Statut Enregistrée
Date de dépôt 2021-07-26
Date d'enregistrement 2023-05-10
Propriétaire Modulate, Inc. (USA)
Classes de Nice  ? 09 - Appareils et instruments scientifiques et électriques

Produits et services

(1) Downloadable computer programs for editing and altering sound; downloadable application software that alters and modifies the properties of a sound recording; downloadable application software for adding sound effects to sound recordings; downloadable software applications for enhancing audio recordings; downloadable computer software for use in sound database management, system administration, for generating and processing sound signals, and for converting analog and digital sound signals.

15.

Generation and detection of watermark for real-time voice conversion

      
Numéro d'application 16994432
Numéro de brevet 11538485
Statut Délivré - en vigueur
Date de dépôt 2020-08-14
Date de la première publication 2021-02-18
Date d'octroi 2022-12-27
Propriétaire Modulate, Inc. (USA)
Inventeur(s)
  • Huffman, William Carter
  • Kelly, Brendan

Abrégé

A method watermarks speech data by using a generator to generate speech data including a watermark. The generator is trained to generate the speech data including the watermark. The training process generates first speech from the generator. The first speech data is configured to represent speech. The first speech data includes a candidate watermark. The training also produces an inconsistency message as a function of at least one difference between the first speech data and at least authentic speech data. The training further includes transforming the first speech data, including the candidate watermark, using a watermark robustness module to produce transformed speech data including a transformed candidate watermark. The transformed speech data includes a transformed candidate watermark. The training further produces a watermark-detectability message, using a watermark detection machine learning system, relating to one or more desirable watermark features of the transformed candidate watermark.

Classes IPC  ?

  • G10L 19/018 - Mise en place d’un filigrane audio, c.-à-d. insertion de données inaudibles dans le signal audio
  • G06N 3/04 - Architecture, p. ex. topologie d'interconnexion
  • G06N 3/08 - Méthodes d'apprentissage
  • G10L 21/007 - Changement de la qualité de la voix, p. ex. de la hauteur tonale ou des formants caractérisé par le procédé utilisé
  • G10L 21/013 - Adaptation à la hauteur tonale ciblée
  • G10L 25/30 - Techniques d'analyse de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par la technique d’analyse utilisant des réseaux neuronaux

16.

GENERATION AND DETECTION OF WATERMARK FOR REAL-TIME VOICE CONVERSION

      
Numéro d'application US2020046534
Numéro de publication 2021/030759
Statut Délivré - en vigueur
Date de dépôt 2020-08-14
Date de publication 2021-02-18
Propriétaire MODULATE, INC. (USA)
Inventeur(s)
  • Huffman, William Carter
  • Kelly, Brendan

Abrégé

A method watermarks speech data by using a generator to generate speech data including a watermark. The generator is trained to generate the speech data including the watermark. The training process generates first speech from the generator. The first speech data is configured to represent speech. The first speech data includes a candidate watermark. The training also produces an inconsistency message as a function of at least one difference between the first speech data and at least authentic speech data. The training further includes transforming the first speech data, including the candidate watermark, using a watermark robustness module to produce transformed speech data including a transformed candidate watermark. The transformed speech data includes a transformed candidate watermark. The training further produces a watermark-detectability message, using a watermark detection machine learning system, relating to one or more desirable watermark features of the transformed candidate watermark.

Classes IPC  ?

  • G10L 19/018 - Mise en place d’un filigrane audio, c.-à-d. insertion de données inaudibles dans le signal audio
  • G10L 15/02 - Extraction de caractéristiques pour la reconnaissance de la paroleSélection d'unités de reconnaissance
  • G10L 25/30 - Techniques d'analyse de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par la technique d’analyse utilisant des réseaux neuronaux
  • G10L 15/06 - Création de gabarits de référenceEntraînement des systèmes de reconnaissance de la parole, p. ex. adaptation aux caractéristiques de la voix du locuteur
  • G10L 15/22 - Procédures utilisées pendant le processus de reconnaissance de la parole, p. ex. dialogue homme-machine

17.

TOXMOD

      
Numéro de série 90485675
Statut Enregistrée
Date de dépôt 2021-01-25
Date d'enregistrement 2022-12-13
Propriétaire Modulate, Inc. ()
Classes de Nice  ? 42 - Services scientifiques, technologiques et industriels, recherche et conception

Produits et services

Providing temporary use of on-line non-downloadable software for monitoring, analyzing and managing online platform user communications and interactions and policing online platform behavior in view of user community behavior standards

18.

VOICEWEAR

      
Numéro de série 90485671
Statut Enregistrée
Date de dépôt 2021-01-25
Date d'enregistrement 2022-03-22
Propriétaire Modulate, Inc. ()
Classes de Nice  ? 09 - Appareils et instruments scientifiques et électriques

Produits et services

Downloadable software featuring computer programs for editing and altering sound; downloadable software for creating, enhancing and supplementing audio effects in only games and entertainment platforms

19.

System and method for creating timbres

      
Numéro d'application 16846460
Numéro de brevet 11017788
Statut Délivré - en vigueur
Date de dépôt 2020-04-13
Date de la première publication 2020-07-30
Date d'octroi 2021-05-25
Propriétaire Modulate, Inc. (USA)
Inventeur(s)
  • Huffman, William Carter
  • Pappas, Michael

Abrégé

A method of building a new voice having a new timbre using a timbre vector space includes receiving timbre data filtered using a temporal receptive field. The timbre data is mapped in the timbre vector space. The timbre data is related to a plurality of different voices. Each of the plurality of different voices has respective timbre data in the timbre vector space. The method builds the new timbre using the timbre data of the plurality of different voices using a machine learning system.

Classes IPC  ?

  • G10L 21/013 - Adaptation à la hauteur tonale ciblée
  • G10L 15/02 - Extraction de caractéristiques pour la reconnaissance de la paroleSélection d'unités de reconnaissance
  • G10L 15/22 - Procédures utilisées pendant le processus de reconnaissance de la parole, p. ex. dialogue homme-machine
  • G10L 15/06 - Création de gabarits de référenceEntraînement des systèmes de reconnaissance de la parole, p. ex. adaptation aux caractéristiques de la voix du locuteur
  • G10L 19/018 - Mise en place d’un filigrane audio, c.-à-d. insertion de données inaudibles dans le signal audio
  • G10L 25/30 - Techniques d'analyse de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par la technique d’analyse utilisant des réseaux neuronaux

20.

M MODULATE

      
Numéro de série 88462668
Statut Enregistrée
Date de dépôt 2019-06-06
Date d'enregistrement 2022-07-05
Propriétaire Modulate, Inc. ()
Classes de Nice  ? 09 - Appareils et instruments scientifiques et électriques

Produits et services

Downloadable computer programs for editing and altering sound; downloadable application software that alters and modifies the properties of a sound recording; downloadable application software for adding sound effects to sound recordings; downloadable software applications for enhancing audio recordings; downloadable computer software for use in sound database management, system administration, for generating and processing sound signals, and for converting analog and digital sound signals

21.

System and method for creating timbres

      
Numéro d'application 15989072
Numéro de brevet 10622002
Statut Délivré - en vigueur
Date de dépôt 2018-05-24
Date de la première publication 2018-11-29
Date d'octroi 2020-04-14
Propriétaire Modulate, Inc. (USA)
Inventeur(s)
  • Huffman, William Carter
  • Pappas, Michael

Abrégé

A method of building a new voice having a new timbre using a timbre vector space includes receiving timbre data filtered using a temporal receptive field. The timbre data is mapped in the timbre vector space. The timbre data is related to a plurality of different voices. Each of the plurality of different voices has respective timbre data in the timbre vector space. The method builds the new timbre using the timbre data of the plurality of different voices using a machine learning system.

Classes IPC  ?

  • G10L 21/013 - Adaptation à la hauteur tonale ciblée
  • G10L 15/02 - Extraction de caractéristiques pour la reconnaissance de la paroleSélection d'unités de reconnaissance
  • G10L 15/22 - Procédures utilisées pendant le processus de reconnaissance de la parole, p. ex. dialogue homme-machine
  • G10L 15/06 - Création de gabarits de référenceEntraînement des systèmes de reconnaissance de la parole, p. ex. adaptation aux caractéristiques de la voix du locuteur
  • G10L 19/018 - Mise en place d’un filigrane audio, c.-à-d. insertion de données inaudibles dans le signal audio
  • G10L 25/30 - Techniques d'analyse de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par la technique d’analyse utilisant des réseaux neuronaux

22.

System and method for voice-to-voice conversion

      
Numéro d'application 15989062
Numéro de brevet 10614826
Statut Délivré - en vigueur
Date de dépôt 2018-05-24
Date de la première publication 2018-11-29
Date d'octroi 2020-04-07
Propriétaire Modulate, Inc. (USA)
Inventeur(s)
  • Huffman, William Carter
  • Pappas, Michael

Abrégé

A method of building a speech conversion system uses target information from a target voice and source speech data. The method receives the source speech data and the target timbre data, which is within a timbre space. A generator produces first candidate data as a function of the source speech data and the target timbre data. A discriminator compares the first candidate data to the target timbre data with reference to timbre data of a plurality of different voices. The discriminator determines inconsistencies between the first candidate data and the target timbre data. The discriminator produces an inconsistency message containing information relating to the inconsistencies. The inconsistency message is fed back to the generator, and the generator produces a second candidate data. The target timbre data in the timbre space is refined using information produced by the generator and/or discriminator as a result of the feeding back.

Classes IPC  ?

  • G10L 15/06 - Création de gabarits de référenceEntraînement des systèmes de reconnaissance de la parole, p. ex. adaptation aux caractéristiques de la voix du locuteur
  • G10L 21/013 - Adaptation à la hauteur tonale ciblée
  • G10L 15/02 - Extraction de caractéristiques pour la reconnaissance de la paroleSélection d'unités de reconnaissance
  • G10L 15/22 - Procédures utilisées pendant le processus de reconnaissance de la parole, p. ex. dialogue homme-machine
  • G10L 19/018 - Mise en place d’un filigrane audio, c.-à-d. insertion de données inaudibles dans le signal audio
  • G10L 25/30 - Techniques d'analyse de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par la technique d’analyse utilisant des réseaux neuronaux

23.

System and method for building a voice database

      
Numéro d'application 15989065
Numéro de brevet 10861476
Statut Délivré - en vigueur
Date de dépôt 2018-05-24
Date de la première publication 2018-11-29
Date d'octroi 2020-12-08
Propriétaire Modulate, Inc. (USA)
Inventeur(s)
  • Huffman, William Carter
  • Pappas, Michael

Abrégé

A timbre vector space construction system for building a timbre vector space has an input. The input is configured to receive a first speech segment in a first voice and a second speech segment in a second voice. The system also includes a temporal receptive field to transform the first speech segment into a first plurality of analytical segments, and the second speech segment into a second plurality of analytical segments. Each of the first plurality of smaller analytical segments, and each of the second plurality of analytical segments have a frequency distribution that represents a different portion of the timbre data of the respective voices. The system also includes a machine learning system configured to map the first voice relative to the second voice in the timbre vector space as a function of the frequency distribution of the first plurality of analytical segments the second plurality of analytical segments.

Classes IPC  ?

  • G10L 21/00 - Techniques de traitement du signal de parole ou de voix pour produire un autre signal audible ou non audible, p. ex. visuel ou tactile, afin de modifier sa qualité ou son intelligibilité
  • G10L 21/013 - Adaptation à la hauteur tonale ciblée
  • G10L 15/02 - Extraction de caractéristiques pour la reconnaissance de la paroleSélection d'unités de reconnaissance
  • G10L 15/22 - Procédures utilisées pendant le processus de reconnaissance de la parole, p. ex. dialogue homme-machine
  • G10L 15/06 - Création de gabarits de référenceEntraînement des systèmes de reconnaissance de la parole, p. ex. adaptation aux caractéristiques de la voix du locuteur
  • G10L 19/018 - Mise en place d’un filigrane audio, c.-à-d. insertion de données inaudibles dans le signal audio
  • G10L 25/30 - Techniques d'analyse de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par la technique d’analyse utilisant des réseaux neuronaux