Deep Vision, Inc.

États‑Unis d’Amérique

Retour au propriétaire

1-28 de 28 pour Deep Vision, Inc. Trier par
Recheche Texte
Affiner par
Type PI
        Brevet 27
        Marque 1
Juridiction
        États-Unis 24
        International 4
Date
Nouveautés (dernières 4 semaines) 1
2025 août 1
2025 (AACJ) 4
2024 2
2023 9
Voir plus
Classe IPC
G06N 3/063 - Réalisation physique, c.-à-d. mise en œuvre matérielle de réseaux neuronaux, de neurones ou de parties de neurone utilisant des moyens électroniques 15
G06F 9/30 - Dispositions pour exécuter des instructions machines, p. ex. décodage d'instructions 11
G06N 3/04 - Architecture, p. ex. topologie d'interconnexion 10
G06N 3/08 - Méthodes d'apprentissage 10
G06F 17/16 - Calcul de matrice ou de vecteur 6
Voir plus
Classe NICE
09 - Appareils et instruments scientifiques et électriques 1
42 - Services scientifiques, technologiques et industriels, recherche et conception 1
Statut
En Instance 8
Enregistré / En vigueur 20

1.

DEEP VISION PROCESSOR

      
Numéro d'application 19188630
Statut En instance
Date de dépôt 2025-04-24
Date de la première publication 2025-08-21
Propriétaire Deep Vision, Inc. (USA)
Inventeur(s)
  • Qadeer, Wajahat
  • Hameed, Rehan

Abrégé

Disclosed herein is a processor for deep learning. In one embodiment, the processor comprises: a load and store unit configured to load and store image pixel data and stencil data; a register unit, implementing a banked register file, configured to: load and store a subset of the image pixel data from the load and store unit, and concurrently provide access to image pixel values stored in a register file entry of the banked register file, wherein the subset of the image pixel data comprises the image pixel values stored in the register file entry; and a plurality of arithmetic logic units configured to concurrently perform one or more operations on the image pixel values stored in the register file entry and corresponding stencil data of the stencil data.

Classes IPC  ?

  • G06F 9/30 - Dispositions pour exécuter des instructions machines, p. ex. décodage d'instructions
  • G06F 17/16 - Calcul de matrice ou de vecteur
  • G06N 3/045 - Combinaisons de réseaux
  • G06N 3/063 - Réalisation physique, c.-à-d. mise en œuvre matérielle de réseaux neuronaux, de neurones ou de parties de neurone utilisant des moyens électroniques
  • G06N 3/08 - Méthodes d'apprentissage
  • G06T 1/20 - Architectures de processeursConfiguration de processeurs p. ex. configuration en pipeline
  • G06T 15/00 - Rendu d'images tridimensionnelles [3D]

2.

SYSTEM AND METHOD FOR MAINTAINING DEPENDENCIES IN A PARALLEL PROCESS

      
Numéro d'application 18984492
Statut En instance
Date de dépôt 2024-12-17
Date de la première publication 2025-04-17
Propriétaire Deep Vision Inc. (USA)
Inventeur(s)
  • Shahim, Mohamed
  • Reddy, Sreenivas Aerra
  • Datla, Raju
  • Bokam, Lava Kumar
  • Vennam, Suresh Kumar
  • Banerjee, Sameek

Abrégé

A method includes: dequeuing a signal primitive from a signaling command queue in the set of command queues, the signal primitive pointing to a waiting command queue; in response to the signal primitive pointing to the waiting command queue, incrementing a number of pending signal primitives in the signal-wait counter matrix; dequeuing a wait primitive from the waiting command queue, the wait primitive pointing to the signaling command queue; in response to the wait primitive pointing to the signaling command queue, accessing the register to read the number of pending signal primitives; in response to the number of pending signal primitives indicating at least one pending signal primitive: decrementing the number of pending signal primitives; and dequeuing an instruction from the waiting command queue; and dispatching a control signal representing the instruction to a resource.

Classes IPC  ?

  • G06F 9/48 - Lancement de programmes Commutation de programmes, p. ex. par interruption
  • G06F 9/52 - Synchronisation de programmesExclusion mutuelle, p. ex. au moyen de sémaphores
  • G06N 3/063 - Réalisation physique, c.-à-d. mise en œuvre matérielle de réseaux neuronaux, de neurones ou de parties de neurone utilisant des moyens électroniques

3.

METHOD FOR AUTOMATIC HYBRID QUANTIZATION OF DEEP ARTIFICIAL NEURAL NETWORKS

      
Numéro d'application 18984655
Statut En instance
Date de dépôt 2024-12-17
Date de la première publication 2025-04-10
Propriétaire Deep Vision Inc. (USA)
Inventeur(s)
  • Qadeer, Wajahat
  • Hameed, Rehan
  • Uppalapati, Satyanarayana Raju
  • Ghanore, Abhilash Bharath
  • Ram, Kasanagottu Sai

Abrégé

A method includes, for each floating-point layer in a set of floating-point layers: calculating a set of input activations and a set of output activations of the floating-point layer; converting the floating-point layer to a low-bit-width layer; calculating a set of low-bit-width output activations based on the set of input activations; and calculating a per-layer deviation statistic of the low-bit-width layer. The method also includes ordering the set of low-bit-width layers based on the per-layer deviation statistic of each low-bit-width layer. The method additionally includes, while a loss-of-accuracy threshold exceeds the accuracy of the quantized network: converting a floating-point layer represented by the low-bit-width layer to a high-bit-width layer; replacing the low-bit-width layer with the high-bit-width layer in the quantized network; updating the accuracy of the quantized network; and, in response to the accuracy of the quantized network exceeding the loss-of-accuracy threshold, returning the quantized network.

Classes IPC  ?

  • G06N 3/0495 - Réseaux quantifiésRéseaux parcimonieuxRéseaux compressés
  • G06F 17/18 - Opérations mathématiques complexes pour l'évaluation de données statistiques
  • G06N 3/04 - Architecture, p. ex. topologie d'interconnexion
  • G06N 3/045 - Combinaisons de réseaux
  • G06N 3/048 - Fonctions d’activation

4.

METHOD AND TENSOR TRAVERSAL ENGINE FOR STRIDED MEMORY ACCESS DURING EXECUTION OF NEURAL NETWORKS

      
Numéro d'application 18957297
Statut En instance
Date de dépôt 2024-11-22
Date de la première publication 2025-03-13
Propriétaire Deep Vision Inc. (USA)
Inventeur(s)
  • Shahim, Mohamed
  • Datla, Raju
  • Hameed, Rehan
  • Kallem, Shilpa

Abrégé

A tensor traversal engine in a processor system comprising a source memory component and a destination memory component, the tensor traversal engine comprising: a control signal register storing a control signal for a strided data transfer operation from the source memory component to the destination memory component, the control signal comprising an initial source address, an initial destination address, a first source stride length in a first dimension, and a first source stride count in the first dimension; a source address register communicatively coupled to the control signal register; a destination address register communicatively coupled to the control signal register; a first source stride counter communicatively coupled to the control signal register; and control logic communicatively coupled to the control signal register, the source address register, and the first source stride counter.

Classes IPC  ?

  • G06F 9/345 - Adressage de l'opérande d'instruction ou du résultat ou accès à l'opérande d'instruction ou au résultat d'opérandes ou de résultats multiples
  • G06F 3/06 - Entrée numérique à partir de, ou sortie numérique vers des supports d'enregistrement
  • G06F 9/30 - Dispositions pour exécuter des instructions machines, p. ex. décodage d'instructions
  • G06F 9/50 - Allocation de ressources, p. ex. de l'unité centrale de traitement [UCT]
  • G06F 9/54 - Communication interprogramme
  • G06N 3/02 - Réseaux neuronaux
  • G06N 3/063 - Réalisation physique, c.-à-d. mise en œuvre matérielle de réseaux neuronaux, de neurones ou de parties de neurone utilisant des moyens électroniques

5.

PROCESSOR SYSTEM AND METHOD FOR INCREASING DATA-TRANSFER BANDWIDTH DURING EXECUTION OF A SCHEDULED PARALLEL PROCESS

      
Numéro d'application 18671756
Statut En instance
Date de dépôt 2024-05-22
Date de la première publication 2024-10-24
Propriétaire Deep Vision Inc. (USA)
Inventeur(s)
  • Datla, Raju
  • Shahim, Mohamed
  • Vennam, Suresh Kumar
  • Reddy, Sreenivas Aerra

Abrégé

A broadcast subsystem of a processor system includes: a set of broadcast buses, each broadcast bus in the set of broadcast buses electrically coupled to a subset of primary memory units in the set of primary memory units; a primary memory unit queue: configured to store a first set of data transfer requests associated with the set of primary memory units; electrically coupled to the data buffer a broadcast scheduler: electrically coupled to the primary memory unit queue; electrically coupled to the set of broadcast buses; and configured to transfer source data from the data buffer to a target subset of primary memory units in the set of primary memory units via the set of broadcast buses based on the set of data transfer requests stored in the primary memory unit queue.

Classes IPC  ?

  • G06N 3/10 - Interfaces, langages de programmation ou boîtes à outils de développement logiciel, p. ex. pour la simulation de réseaux neuronaux
  • G06F 13/16 - Gestion de demandes d'interconnexion ou de transfert pour l'accès au bus de mémoire
  • G06F 13/28 - Gestion de demandes d'interconnexion ou de transfert pour l'accès au bus d'entrée/sortie utilisant le transfert par rafale, p. ex. acces direct à la mémoire, vol de cycle
  • G06N 3/04 - Architecture, p. ex. topologie d'interconnexion
  • G06N 3/08 - Méthodes d'apprentissage

6.

System and method for maintaining dependencies in a parallel process

      
Numéro d'application 18442603
Numéro de brevet 12210902
Statut Délivré - en vigueur
Date de dépôt 2024-02-15
Date de la première publication 2024-08-15
Date d'octroi 2025-01-28
Propriétaire Deep Vision Inc. (USA)
Inventeur(s)
  • Shahim, Mohamed
  • Reddy, Sreenivas Aerra
  • Datla, Raju
  • Bokam, Lava Kumar
  • Vennam, Suresh Kumar
  • Banerjee, Sameek

Abrégé

A method includes: dequeuing a signal primitive from a signaling command queue in the set of command queues, the signal primitive pointing to a waiting command queue; in response to the signal primitive pointing to the waiting command queue, incrementing a number of pending signal primitives in the signal-wait counter matrix; dequeuing a wait primitive from the waiting command queue, the wait primitive pointing to the signaling command queue; in response to the wait primitive pointing to the signaling command queue, accessing the register to read the number of pending signal primitives; in response to the number of pending signal primitives indicating at least one pending signal primitive: decrementing the number of pending signal primitives; and dequeuing an instruction from the waiting command queue; and dispatching a control signal representing the instruction to a resource.

Classes IPC  ?

  • G06F 9/46 - Dispositions pour la multiprogrammation
  • G06F 9/48 - Lancement de programmes Commutation de programmes, p. ex. par interruption
  • G06F 9/52 - Synchronisation de programmesExclusion mutuelle, p. ex. au moyen de sémaphores
  • G06N 3/063 - Réalisation physique, c.-à-d. mise en œuvre matérielle de réseaux neuronaux, de neurones ou de parties de neurone utilisant des moyens électroniques

7.

Deep vision processor

      
Numéro d'application 18217353
Numéro de brevet 12307252
Statut Délivré - en vigueur
Date de dépôt 2023-06-30
Date de la première publication 2023-12-28
Date d'octroi 2025-05-20
Propriétaire Deep Vision Inc. (USA)
Inventeur(s)
  • Qadeer, Wajahat
  • Hameed, Rehan

Abrégé

Disclosed herein is a processor for deep learning. In one embodiment, the processor comprises: a load and store unit configured to load and store image pixel data and stencil data; a register unit, implementing a banked register file, configured to: load and store a subset of the image pixel data from the load and store unit, and concurrently provide access to image pixel values stored in a register file entry of the banked register file, wherein the subset of the image pixel data comprises the image pixel values stored in the register file entry; and a plurality of arithmetic logic units configured to concurrently perform one or more operations on the image pixel values stored in the register file entry and corresponding stencil data of the stencil data.

Classes IPC  ?

  • G06T 1/20 - Architectures de processeursConfiguration de processeurs p. ex. configuration en pipeline
  • G06F 9/30 - Dispositions pour exécuter des instructions machines, p. ex. décodage d'instructions
  • G06F 17/16 - Calcul de matrice ou de vecteur
  • G06N 3/045 - Combinaisons de réseaux
  • G06N 3/063 - Réalisation physique, c.-à-d. mise en œuvre matérielle de réseaux neuronaux, de neurones ou de parties de neurone utilisant des moyens électroniques
  • G06N 3/08 - Méthodes d'apprentissage
  • G06T 15/00 - Rendu d'images tridimensionnelles [3D]

8.

Method for automatic hybrid quantization of deep artificial neural networks

      
Numéro d'application 18232233
Numéro de brevet 12205011
Statut Délivré - en vigueur
Date de dépôt 2023-08-09
Date de la première publication 2023-11-30
Date d'octroi 2025-01-21
Propriétaire Deep Vision Inc. (USA)
Inventeur(s)
  • Qadeer, Wajahat
  • Hameed, Rehan
  • Uppalapati, Satyanarayana Raju
  • Ghanore, Abhilash Bharath
  • Ram, Kasanagottu Sai

Abrégé

A method includes, for each floating-point layer in a set of floating-point layers: calculating a set of input activations and a set of output activations of the floating-point layer; converting the floating-point layer to a low-bit-width layer; calculating a set of low-bit-width output activations based on the set of input activations; and calculating a per-layer deviation statistic of the low-bit-width layer. The method also includes ordering the set of low-bit-width layers based on the per-layer deviation statistic of each low-bit-width layer. The method additionally includes, while a loss-of-accuracy threshold exceeds the accuracy of the quantized network: converting a floating-point layer represented by the low-bit-width layer to a high-bit-width layer; replacing the low-bit-width layer with the high-bit-width layer in the quantized network; updating the accuracy of the quantized network; and, in response to the accuracy of the quantized network exceeding the loss-of-accuracy threshold, returning the quantized network.

Classes IPC  ?

  • G06N 3/0495 - Réseaux quantifiésRéseaux parcimonieuxRéseaux compressés
  • G06F 17/18 - Opérations mathématiques complexes pour l'évaluation de données statistiques
  • G06N 3/04 - Architecture, p. ex. topologie d'interconnexion
  • G06N 3/048 - Fonctions d’activation
  • G06N 3/045 - Combinaisons de réseaux

9.

Method and tensor traversal engine for strided memory access during execution of neural networks

      
Numéro d'application 18207439
Numéro de brevet 12190113
Statut Délivré - en vigueur
Date de dépôt 2023-06-08
Date de la première publication 2023-10-05
Date d'octroi 2025-01-07
Propriétaire Deep Vision Inc. (USA)
Inventeur(s)
  • Shahim, Mohamed
  • Datla, Raju
  • Ghanore, Abhilash Bharath
  • Bokam, Lava Kumar
  • Vennam, Suresh Kumar
  • Ereddy, Rajashekar Reddy

Abrégé

A tensor traversal engine in a processor system comprising a source memory component and a destination memory component, the tensor traversal engine comprising: a control signal register storing a control signal for a strided data transfer operation from the source memory component to the destination memory component, the control signal comprising an initial source address, an initial destination address, a first source stride length in a first dimension, and a first source stride count in the first dimension; a source address register communicatively coupled to the control signal register; a destination address register communicatively coupled to the control signal register; a first source stride counter communicatively coupled to the control signal register; and control logic communicatively coupled to the control signal register, the source address register, and the first source stride counter.

Classes IPC  ?

  • G06F 3/06 - Entrée numérique à partir de, ou sortie numérique vers des supports d'enregistrement
  • G06F 9/30 - Dispositions pour exécuter des instructions machines, p. ex. décodage d'instructions
  • G06F 9/345 - Adressage de l'opérande d'instruction ou du résultat ou accès à l'opérande d'instruction ou au résultat d'opérandes ou de résultats multiples
  • G06F 9/50 - Allocation de ressources, p. ex. de l'unité centrale de traitement [UCT]
  • G06F 9/54 - Communication interprogramme
  • G06N 3/063 - Réalisation physique, c.-à-d. mise en œuvre matérielle de réseaux neuronaux, de neurones ou de parties de neurone utilisant des moyens électroniques
  • G06N 3/02 - Réseaux neuronaux

10.

SYSTEM AND METHOD FOR PROFILING ON-CHIP PERFORMANCE OF NEURAL NETWORK EXECUTION

      
Numéro d'application US2022053534
Numéro de publication 2023/122102
Statut Délivré - en vigueur
Date de dépôt 2022-12-20
Date de publication 2023-06-29
Propriétaire DEEP VISION INC. (USA)
Inventeur(s)
  • Uppalapati, Satyanarayana, Raju
  • Ereddy, Rajasekhar, Reddy
  • Banerjee, Sameek
  • Shahim, Mohammed
  • Kallem, Shilpa
  • Vennam, Suresh, Kumar
  • Ghanore, Abhilash, Bharath
  • Datla, Raju
  • Qadeer, Wajahat
  • Hameed, Rehan

Abrégé

A method includes: accessing a static schedule of a target neural network for execution by a processing device, the target neural network including a set of layers; generating a set of expected performance metrics of the target neural network based on the static schedule, the set of expected performance metrics including a first expected performance metric for a first layer in the set of layers; accessing a set of runtime performance metrics captured during execution of the target neural network by the processing device, the set of runtime performance metrics including a first runtime performance metric for the first layer; and, in response to detecting a difference between the first runtime performance metric and the first expected performance metric exceeding a threshold, serving an alert at a user interface.

Classes IPC  ?

  • G06F 11/30 - Surveillance du fonctionnement
  • G06F 11/36 - Prévention d'erreurs par analyse, par débogage ou par test de logiciel
  • G06N 3/02 - Réseaux neuronaux
  • G06N 3/0985 - Optimisation d’hyperparamètresMeta-apprentissageApprendre à apprendre

11.

SYSTEM AND METHOD FOR PROFILING ON-CHIP PERFORMANCE OF NEURAL NETWORK EXECUTION

      
Numéro d'application 18085220
Statut En instance
Date de dépôt 2022-12-20
Date de la première publication 2023-06-22
Propriétaire Deep Vision Inc. (USA)
Inventeur(s)
  • Uppalapati, Satyanarayana Raju
  • Ereddy, Rajasekhar Reddy
  • Banerjee, Sameek
  • Shahim, Mohammed
  • Kallem, Shilpa
  • Vennam, Suresh Kumar
  • Ghanore, Abhilash Bharath
  • Datla, Raju
  • Qadeer, Wajahat
  • Hameed, Rehan

Abrégé

A method includes: accessing a static schedule of a target neural network for execution by a processing device, the target neural network including a set of layers; generating a set of expected performance metrics of the target neural network based on the static schedule, the set of expected performance metrics including a first expected performance metric for a first layer in the set of layers; accessing a set of runtime performance metrics captured during execution of the target neural network by the processing device, the set of runtime performance metrics including a first runtime performance metric for the first layer; and, in response to detecting a difference between the first runtime performance metric and the first expected performance metric exceeding a threshold, serving an alert at a user interface.

Classes IPC  ?

  • G06F 11/34 - Enregistrement ou évaluation statistique de l'activité du calculateur, p. ex. des interruptions ou des opérations d'entrée–sortie
  • G06N 3/045 - Combinaisons de réseaux

12.

METHOD AND TENSOR TRAVERSAL ENGINE FOR STRIDED MEMORY ACCESS DURING EXECUTION OF NEURAL NETWORKS

      
Numéro d'application 18076354
Statut En instance
Date de dépôt 2022-12-06
Date de la première publication 2023-05-25
Propriétaire Deep Vision Inc. (USA)
Inventeur(s)
  • Shahim, Mohamed
  • Datla, Raju
  • Hameed, Rehan
  • Kallem, Shilpa

Abrégé

A tensor traversal engine in a processor system comprising a source memory component and a destination memory component, the tensor traversal engine comprising: a control signal register storing a control signal for a strided data transfer operation from the source memory component to the destination memory component, the control signal comprising an initial source address, an initial destination address, a first source stride length in a first dimension, and a first source stride count in the first dimension; a source address register communicatively coupled to the control signal register; a destination address register communicatively coupled to the control signal register; a first source stride counter communicatively coupled to the control signal register; and control logic communicatively coupled to the control signal register, the source address register, and the first source stride counter.

Classes IPC  ?

  • G06F 9/345 - Adressage de l'opérande d'instruction ou du résultat ou accès à l'opérande d'instruction ou au résultat d'opérandes ou de résultats multiples
  • G06F 9/30 - Dispositions pour exécuter des instructions machines, p. ex. décodage d'instructions
  • G06N 3/063 - Réalisation physique, c.-à-d. mise en œuvre matérielle de réseaux neuronaux, de neurones ou de parties de neurone utilisant des moyens électroniques
  • G06F 9/50 - Allocation de ressources, p. ex. de l'unité centrale de traitement [UCT]
  • G06F 9/54 - Communication interprogramme
  • G06F 3/06 - Entrée numérique à partir de, ou sortie numérique vers des supports d'enregistrement

13.

Processor system and method for increasing data-transfer bandwidth during execution of a scheduled parallel process

      
Numéro d'application 17984763
Numéro de brevet 12026628
Statut Délivré - en vigueur
Date de dépôt 2022-11-10
Date de la première publication 2023-03-02
Date d'octroi 2024-07-02
Propriétaire Deep Vision Inc. (USA)
Inventeur(s)
  • Datla, Raju
  • Shahim, Mohamed
  • Vennam, Suresh Kumar
  • Reddy, Sreenivas Aerra

Abrégé

A broadcast subsystem of a processor system includes: a set of broadcast buses, each broadcast bus in the set of broadcast buses electrically coupled to a subset of primary memory units in the set of primary memory units; a primary memory unit queue: configured to store a first set of data transfer requests associated with the set of primary memory units; electrically coupled to the data buffer a broadcast scheduler: electrically coupled to the primary memory unit queue; electrically coupled to the set of broadcast buses; and configured to transfer source data from the data buffer to a target subset of primary memory units in the set of primary memory units via the set of broadcast buses based on the set of data transfer requests stored in the primary memory unit queue.

Classes IPC  ?

  • G06N 3/10 - Interfaces, langages de programmation ou boîtes à outils de développement logiciel, p. ex. pour la simulation de réseaux neuronaux
  • G06F 13/16 - Gestion de demandes d'interconnexion ou de transfert pour l'accès au bus de mémoire
  • G06F 13/28 - Gestion de demandes d'interconnexion ou de transfert pour l'accès au bus d'entrée/sortie utilisant le transfert par rafale, p. ex. acces direct à la mémoire, vol de cycle
  • G06N 3/04 - Architecture, p. ex. topologie d'interconnexion
  • G06N 3/08 - Méthodes d'apprentissage

14.

System and method for queuing commands in a deep learning processor

      
Numéro d'application 17973290
Numéro de brevet 11941440
Statut Délivré - en vigueur
Date de dépôt 2022-10-25
Date de la première publication 2023-02-16
Date d'octroi 2024-03-26
Propriétaire Deep Vision Inc. (USA)
Inventeur(s)
  • Shahim, Mohamed
  • Reddy, Sreenivas Aerra
  • Datla, Raju
  • Bokam, Lava Kumar
  • Vennam, Suresh Kumar
  • Banerjee, Sameek

Abrégé

A method includes: dequeuing a signal primitive from a signaling command queue in the set of command queues, the signal primitive pointing to a waiting command queue; in response to the signal primitive pointing to the waiting command queue, incrementing a number of pending signal primitives in the signal-wait counter matrix; dequeuing a wait primitive from the waiting command queue, the wait primitive pointing to the signaling command queue; in response to the wait primitive pointing to the signaling command queue, accessing the register to read the number of pending signal primitives; in response to the number of pending signal primitives indicating at least one pending signal primitive: decrementing the number of pending signal primitives; and dequeuing an instruction from the waiting command queue; and dispatching a control signal representing the instruction to a resource.

Classes IPC  ?

  • G06F 9/46 - Dispositions pour la multiprogrammation
  • G06F 9/48 - Lancement de programmes Commutation de programmes, p. ex. par interruption
  • G06F 9/52 - Synchronisation de programmesExclusion mutuelle, p. ex. au moyen de sémaphores
  • G06N 3/063 - Réalisation physique, c.-à-d. mise en œuvre matérielle de réseaux neuronaux, de neurones ou de parties de neurone utilisant des moyens électroniques

15.

KINARA

      
Numéro d'application 1709254
Statut Enregistrée
Date de dépôt 2022-08-02
Date d'enregistrement 2022-08-02
Propriétaire Deep Vision Inc. (USA)
Classes de Nice  ?
  • 09 - Appareils et instruments scientifiques et électriques
  • 42 - Services scientifiques, technologiques et industriels, recherche et conception

Produits et services

Microprocessors; integrated circuit modules; multichip modules; downloadable computer software development tools; downloadable software development kits (SDKs); downloadable proxy software; downloadable computer software; all of the foregoing for use in edge computing, fog computing, decentralized computing, Internet of Things, artificial intelligence, machine learning, deep learning, image feature extraction, predictive analytics, software development, high performance computing and computer and telecommunication networks. Development and implementation of computer software, computer hardware and technology solutions for edge AI applications for the purpose of low power consumption and highly efficient AI computing and distributed device management; consulting services in the fields of artificial intelligence and edge computing.

16.

Deep vision processor

      
Numéro d'application 17868438
Numéro de brevet 11734006
Statut Délivré - en vigueur
Date de dépôt 2022-07-19
Date de la première publication 2022-11-10
Date d'octroi 2023-08-22
Propriétaire Deep Vision, Inc. (USA)
Inventeur(s)
  • Qadeer, Wajahat
  • Hameed, Rehan

Abrégé

Disclosed herein is a processor for deep learning. In one embodiment, the processor comprises: a load and store unit configured to load and store image pixel data and stencil data; a register unit, implementing a banked register file, configured to: load and store a subset of the image pixel data from the load and store unit, and concurrently provide access to image pixel values stored in a register file entry of the banked register file, wherein the subset of the image pixel data comprises the image pixel values stored in the register file entry; and a plurality of arithmetic logic units configured to concurrently perform one or more operations on the image pixel values stored in the register file entry and corresponding stencil data of the stencil data.

Classes IPC  ?

  • G06T 1/20 - Architectures de processeursConfiguration de processeurs p. ex. configuration en pipeline
  • G06T 15/00 - Rendu d'images tridimensionnelles [3D]
  • G06F 17/16 - Calcul de matrice ou de vecteur
  • G06F 9/30 - Dispositions pour exécuter des instructions machines, p. ex. décodage d'instructions
  • G06N 3/08 - Méthodes d'apprentissage
  • G06N 3/063 - Réalisation physique, c.-à-d. mise en œuvre matérielle de réseaux neuronaux, de neurones ou de parties de neurone utilisant des moyens électroniques
  • G06N 3/045 - Combinaisons de réseaux

17.

PROCESSOR SYSTEM AND METHOD FOR INCREASING DATA-TRANSFER BANDWIDTH DURING EXECUTION OF A SCHEDULED PARALLEL PROCESS

      
Numéro d'application 17461288
Statut En instance
Date de dépôt 2021-08-30
Date de la première publication 2022-03-03
Propriétaire Deep Vision Inc. (USA)
Inventeur(s)
  • Datla, Raju
  • Shahim, Mohamed
  • Vennam, Suresh Kumar
  • Reddy, Sreenivas Aerra

Abrégé

A broadcast subsystem of a processor system includes: a set of broadcast buses, each broadcast bus in the set of broadcast buses electrically coupled to a subset of primary memory units in the set of primary memory units; a primary memory unit queue: configured to store a first set of data transfer requests associated with the set of primary memory units; and electrically coupled to the data buffer a broadcast scheduler: electrically coupled to the primary memory unit queue; electrically coupled to the set of broadcast buses; and configured to transfer source data from the data buffer to a target subset of primary memory units in the set of primary memory units via the set of broadcast buses based on the set of data transfer requests stored in the primary memory unit queue.

Classes IPC  ?

  • G06N 3/10 - Interfaces, langages de programmation ou boîtes à outils de développement logiciel, p. ex. pour la simulation de réseaux neuronaux
  • G06N 3/04 - Architecture, p. ex. topologie d'interconnexion
  • G06F 13/28 - Gestion de demandes d'interconnexion ou de transfert pour l'accès au bus d'entrée/sortie utilisant le transfert par rafale, p. ex. acces direct à la mémoire, vol de cycle
  • G06N 3/08 - Méthodes d'apprentissage

18.

Processor system and method for increasing data-transfer bandwidth during execution of a scheduled parallel process

      
Numéro d'application 17461221
Numéro de brevet 11526767
Statut Délivré - en vigueur
Date de dépôt 2021-08-30
Date de la première publication 2022-03-03
Date d'octroi 2022-12-13
Propriétaire Deep Vision Inc. (USA)
Inventeur(s)
  • Datla, Raju
  • Shahim, Mohamed
  • Vennam, Suresh Kumar
  • Reddy, Sreenivas Aerra

Abrégé

A broadcast subsystem of a processor system includes: a set of broadcast buses, each broadcast bus in the set of broadcast buses electrically coupled to a subset of primary memory units in the set of primary memory units; a primary memory unit queue: configured to store a first set of data transfer requests associated with the set of primary memory units; and electrically coupled to the data buffer a broadcast scheduler: electrically coupled to the primary memory unit queue; electrically coupled to the set of broadcast buses; and configured to transfer source data from the data buffer to a target subset of primary memory units in the set of primary memory units via the set of broadcast buses based on the set of data transfer requests stored in the primary memory unit queue.

Classes IPC  ?

  • G06N 3/10 - Interfaces, langages de programmation ou boîtes à outils de développement logiciel, p. ex. pour la simulation de réseaux neuronaux
  • G06N 3/08 - Méthodes d'apprentissage
  • G06F 13/28 - Gestion de demandes d'interconnexion ou de transfert pour l'accès au bus d'entrée/sortie utilisant le transfert par rafale, p. ex. acces direct à la mémoire, vol de cycle
  • G06N 3/04 - Architecture, p. ex. topologie d'interconnexion
  • G06F 13/16 - Gestion de demandes d'interconnexion ou de transfert pour l'accès au bus de mémoire

19.

A PROCESSOR SYSTEM AND METHOD FOR INCREASING DATA-TRANSFER BANDWIDTH DURING EXECUTION OF A SCHEDULED PARALLEL PROCESS

      
Numéro d'application US2021048235
Numéro de publication 2022/047306
Statut Délivré - en vigueur
Date de dépôt 2021-08-30
Date de publication 2022-03-03
Propriétaire DEEP VISION INC (USA)
Inventeur(s)
  • Datla, Raju
  • Shahim, Mohamed
  • Vennam, Suresh Kumar
  • Reddy, Sreenivas Aerra

Abrégé

A broadcast subsystem of a processor system includes: a set of broadcast buses, each broadcast bus in the set of broadcast buses electrically coupled to a subset of primary memory units in the set of primary memory units; a primary memory unit queue: configured to store a first set of data transfer requests associated with the set of primary memory units; and electrically coupled to the data buffer a broadcast scheduler: electrically coupled to the primary memory unit queue; electrically coupled to the set of broadcast buses; and configured to transfer source data from the data buffer to a target subset of primary memory units in the set of primary memory units via the set of broadcast buses based on the set of data transfer requests stored in the primary memory unit queue.

Classes IPC  ?

  • G06F 13/14 - Gestion de demandes d'interconnexion ou de transfert

20.

Method and tensor traversal engine for strided memory access during execution of neural networks

      
Numéro d'application 17331585
Numéro de brevet 11714651
Statut Délivré - en vigueur
Date de dépôt 2021-05-26
Date de la première publication 2021-12-02
Date d'octroi 2023-08-01
Propriétaire Deep Vision Inc. (USA)
Inventeur(s)
  • Shahim, Mohamed
  • Datla, Raju
  • Ghanore, Abhilash Bharath
  • Bokam, Lava Kumar
  • Vennam, Suresh Kumar
  • Ereddy, Rajashekar Reddy

Abrégé

A tensor traversal engine in a processor system comprising a source memory component and a destination memory component, the tensor traversal engine comprising: a control signal register storing a control signal for a strided data transfer operation from the source memory component to the destination memory component, the control signal comprising an initial source address, an initial destination address, a first source stride length in a first dimension, and a first source stride count in the first dimension; a source address register communicatively coupled to the control signal register; a destination address register communicatively coupled to the control signal register; a first source stride counter communicatively coupled to the control signal register; and control logic communicatively coupled to the control signal register, the source address register, and the first source stride counter.

Classes IPC  ?

  • G06F 3/06 - Entrée numérique à partir de, ou sortie numérique vers des supports d'enregistrement
  • G06F 9/345 - Adressage de l'opérande d'instruction ou du résultat ou accès à l'opérande d'instruction ou au résultat d'opérandes ou de résultats multiples
  • G06F 9/30 - Dispositions pour exécuter des instructions machines, p. ex. décodage d'instructions
  • G06N 3/063 - Réalisation physique, c.-à-d. mise en œuvre matérielle de réseaux neuronaux, de neurones ou de parties de neurone utilisant des moyens électroniques
  • G06F 9/50 - Allocation de ressources, p. ex. de l'unité centrale de traitement [UCT]
  • G06F 9/54 - Communication interprogramme
  • G06N 3/02 - Réseaux neuronaux

21.

Method and tensor traversal engine for strided memory access during execution of neural networks

      
Numéro d'application 17331590
Numéro de brevet 11550586
Statut Délivré - en vigueur
Date de dépôt 2021-05-26
Date de la première publication 2021-12-02
Date d'octroi 2023-01-10
Propriétaire Deep Vision Inc. (USA)
Inventeur(s)
  • Shahim, Mohamed
  • Datla, Raju
  • Hameed, Rehan
  • Kallem, Shilpa

Abrégé

A tensor traversal engine in a processor system comprising a source memory component and a destination memory component, the tensor traversal engine comprising: a control signal register storing a control signal for a strided data transfer operation from the source memory component to the destination memory component, the control signal comprising an initial source address, an initial destination address, a first source stride length in a first dimension, and a first source stride count in the first dimension; a source address register communicatively coupled to the control signal register; a destination address register communicatively coupled to the control signal register; a first source stride counter communicatively coupled to the control signal register; and control logic communicatively coupled to the control signal register, the source address register, and the first source stride counter.

Classes IPC  ?

  • G06F 9/345 - Adressage de l'opérande d'instruction ou du résultat ou accès à l'opérande d'instruction ou au résultat d'opérandes ou de résultats multiples
  • G06F 9/30 - Dispositions pour exécuter des instructions machines, p. ex. décodage d'instructions
  • G06N 3/063 - Réalisation physique, c.-à-d. mise en œuvre matérielle de réseaux neuronaux, de neurones ou de parties de neurone utilisant des moyens électroniques
  • G06F 9/50 - Allocation de ressources, p. ex. de l'unité centrale de traitement [UCT]
  • G06F 9/54 - Communication interprogramme
  • G06F 3/06 - Entrée numérique à partir de, ou sortie numérique vers des supports d'enregistrement
  • G06N 3/02 - Réseaux neuronaux

22.

Deep vision processor

      
Numéro d'application 17356372
Numéro de brevet 11436014
Statut Délivré - en vigueur
Date de dépôt 2021-06-23
Date de la première publication 2021-10-21
Date d'octroi 2022-09-06
Propriétaire Deep Vision, Inc. (USA)
Inventeur(s)
  • Qadeer, Wajahat
  • Hameed, Rehan

Abrégé

Disclosed herein is a processor for deep learning. In one embodiment, the processor comprises: a load and store unit configured to load and store image pixel data and stencil data; a register unit, implementing a banked register file, configured to: load and store a subset of the image pixel data from the load and store unit, and concurrently provide access to image pixel values stored in a register file entry of the banked register file, wherein the subset of the image pixel data comprises the image pixel values stored in the register file entry; and a plurality of arithmetic logic units configured to concurrently perform one or more operations on the image pixel values stored in the register file entry and corresponding stencil data of the stencil data.

Classes IPC  ?

  • G06T 1/20 - Architectures de processeursConfiguration de processeurs p. ex. configuration en pipeline
  • G06T 15/00 - Rendu d'images tridimensionnelles [3D]
  • G06F 17/16 - Calcul de matrice ou de vecteur
  • G06F 9/30 - Dispositions pour exécuter des instructions machines, p. ex. décodage d'instructions
  • G06N 3/08 - Méthodes d'apprentissage
  • G06N 3/063 - Réalisation physique, c.-à-d. mise en œuvre matérielle de réseaux neuronaux, de neurones ou de parties de neurone utilisant des moyens électroniques
  • G06N 3/04 - Architecture, p. ex. topologie d'interconnexion

23.

System and method for queuing commands in a deep learning processor

      
Numéro d'application 17211707
Numéro de brevet 11513847
Statut Délivré - en vigueur
Date de dépôt 2021-03-24
Date de la première publication 2021-09-30
Date d'octroi 2022-11-29
Propriétaire Deep Vision Inc. (USA)
Inventeur(s)
  • Shahim, Mohamed
  • Reddy, Sreenivas Aerra
  • Datla, Raju
  • Bokam, Lava Kumar
  • Vennam, Suresh Kumar
  • Banerjee, Sameek

Abrégé

A method includes: dequeuing a signal primitive from a signaling command queue in the set of command queues, the signal primitive pointing to a waiting command queue; in response to the signal primitive pointing to the waiting command queue, incrementing a number of pending signal primitives in the signal-wait counter matrix; dequeuing a wait primitive from the waiting command queue, the wait primitive pointing to the signaling command queue; in response to the wait primitive pointing to the signaling command queue, accessing the register to read the number of pending signal primitives; in response to the number of pending signal primitives indicating at least one pending signal primitive: decrementing the number of pending signal primitives; and dequeuing an instruction from the waiting command queue; and dispatching a control signal representing the instruction to a resource.

Classes IPC  ?

  • G06F 9/46 - Dispositions pour la multiprogrammation
  • G06F 9/48 - Lancement de programmes Commutation de programmes, p. ex. par interruption
  • G06F 9/52 - Synchronisation de programmesExclusion mutuelle, p. ex. au moyen de sémaphores
  • G06N 3/063 - Réalisation physique, c.-à-d. mise en œuvre matérielle de réseaux neuronaux, de neurones ou de parties de neurone utilisant des moyens électroniques

24.

Method for static scheduling of artificial neural networks for a processor

      
Numéro d'application 17127904
Numéro de brevet 12373257
Statut Délivré - en vigueur
Date de dépôt 2020-12-18
Date de la première publication 2021-06-24
Date d'octroi 2025-07-29
Propriétaire Deep Vision Inc. (USA)
Inventeur(s)
  • Bokam, Lava Kumar
  • Bannerjee, Sameek
  • Ghanore, Abhilash Bharath
  • Ereddy, Rajashekar Reddy
  • Qadeer, Wajahat
  • Hameed, Rehan
  • Shahim, Mohamed
  • Reddy, Sreenivas Aerra

Abrégé

A method for scheduling an artificial neural network includes: accessing a processor representation of a multicore processor comprising processor cores, direct memory access cores, and a cost model; and accessing a network structure defining a set of layers. The method also includes, for each layer in the set of layers: generating a graph based on the processor representation, the graph defining compute nodes, data transfer nodes, and edges representing dependencies between the compute nodes and the data transfer nodes; and generating a schedule for the layer based on the graph, the schedule assigning the compute nodes to the processor cores and assigning the data transfer nodes to the direct memory access cores. The method further includes aggregating the schedule for each layer in the set of layers to generate a complete schedule for the artificial neural network.

Classes IPC  ?

  • G06N 3/02 - Réseaux neuronaux
  • G06F 3/04842 - Sélection des objets affichés ou des éléments de texte affichés
  • G06F 9/48 - Lancement de programmes Commutation de programmes, p. ex. par interruption
  • G06F 9/50 - Allocation de ressources, p. ex. de l'unité centrale de traitement [UCT]
  • G06F 18/20 - Analyse
  • G06F 18/21 - Conception ou mise en place de systèmes ou de techniquesExtraction de caractéristiques dans l'espace des caractéristiquesSéparation aveugle de sources
  • G06F 30/20 - Optimisation, vérification ou simulation de l’objet conçu
  • G06F 119/06 - Analyse de puissance ou optimisation de puissance

25.

Method for automatic hybrid quantization of deep artificial neural networks

      
Numéro d'application 17112889
Numéro de brevet 11763158
Statut Délivré - en vigueur
Date de dépôt 2020-12-04
Date de la première publication 2021-06-10
Date d'octroi 2023-09-19
Propriétaire Deep Vision Inc. (USA)
Inventeur(s)
  • Qadeer, Wajahat
  • Hameed, Rehan
  • Uppalapati, Satyanarayana Raju
  • Ghanore, Abhilash Bharath
  • Ram, Kasanagottu Sai

Abrégé

A method includes, for each floating-point layer in a set of floating-point layers: calculating a set of input activations and a set of output activations of the floating-point layer; converting the floating-point layer to a low-bit-width layer; calculating a set of low-bit-width output activations based on the set of input activations; and calculating a per-layer deviation statistic of the low-bit-width layer. The method also includes ordering the set of low-bit-width layers based on the per-layer deviation statistic of each low-bit-width layer. The method additionally includes, while a loss-of-accuracy threshold exceeds the accuracy of the quantized network: converting a floating-point layer represented by the low-bit-width layer to a high-bit-width layer; replacing the low-bit-width layer with the high-bit-width layer in the quantized network; updating the accuracy of the quantized network; and, in response to the accuracy of the quantized network exceeding the loss-of-accuracy threshold, returning the quantized network.

Classes IPC  ?

  • G06F 17/18 - Opérations mathématiques complexes pour l'évaluation de données statistiques
  • G06N 3/04 - Architecture, p. ex. topologie d'interconnexion
  • G06N 3/082 - Méthodes d'apprentissage modifiant l’architecture, p. ex. par ajout, suppression ou mise sous silence de nœuds ou de connexions
  • G06N 3/048 - Fonctions d’activation

26.

Deep vision processor

      
Numéro d'application 16670800
Numéro de brevet 11080056
Statut Délivré - en vigueur
Date de dépôt 2019-10-31
Date de la première publication 2020-12-31
Date d'octroi 2021-08-03
Propriétaire Deep Vision, Inc. (USA)
Inventeur(s)
  • Qadeer, Wajahat
  • Hameed, Rehan

Abrégé

Disclosed herein is a processor for deep learning. In one embodiment, the processor comprises: a load and store unit configured to load and store image pixel data and stencil data; a register unit, implementing a banked register file, configured to: load and store a subset of the image pixel data from the load and store unit, and concurrently provide access to image pixel values stored in a register file entry of the banked register file, wherein the subset of the image pixel data comprises the image pixel values stored in the register file entry; and a plurality of arithmetic logic units configured to concurrently perform one or more operations on the image pixel values stored in the register file entry and corresponding stencil data of the stencil data.

Classes IPC  ?

  • G06T 1/20 - Architectures de processeursConfiguration de processeurs p. ex. configuration en pipeline
  • G06T 15/00 - Rendu d'images tridimensionnelles [3D]
  • G06F 17/16 - Calcul de matrice ou de vecteur
  • G06F 9/30 - Dispositions pour exécuter des instructions machines, p. ex. décodage d'instructions
  • G06N 3/08 - Méthodes d'apprentissage
  • G06N 3/063 - Réalisation physique, c.-à-d. mise en œuvre matérielle de réseaux neuronaux, de neurones ou de parties de neurone utilisant des moyens électroniques
  • G06N 3/04 - Architecture, p. ex. topologie d'interconnexion

27.

Deep vision processor

      
Numéro d'application 16026480
Numéro de brevet 10474464
Statut Délivré - en vigueur
Date de dépôt 2018-07-03
Date de la première publication 2019-01-10
Date d'octroi 2019-11-12
Propriétaire DEEP VISION, INC. (USA)
Inventeur(s)
  • Qadeer, Wajahat
  • Hameed, Rehan

Abrégé

Disclosed herein is a processor for deep learning. In one embodiment, the processor comprises: a load and store unit configured to load and store image pixel data and stencil data; a register unit, implementing a banked register file, configured to: load and store a subset of the image pixel data from the load and store unit, and concurrently provide access to image pixel values stored in a register file entry of the banked register file, wherein the subset of the image pixel data comprises the image pixel values stored in the register file entry; and a plurality of arithmetic logic units configured to concurrently perform one or more operations on the image pixel values stored in the register file entry and corresponding stencil data of the stencil data.

Classes IPC  ?

  • G06T 1/20 - Architectures de processeursConfiguration de processeurs p. ex. configuration en pipeline
  • G06T 15/00 - Rendu d'images tridimensionnelles [3D]
  • G06F 9/30 - Dispositions pour exécuter des instructions machines, p. ex. décodage d'instructions
  • G06N 3/08 - Méthodes d'apprentissage
  • G06F 17/16 - Calcul de matrice ou de vecteur
  • G06N 3/04 - Architecture, p. ex. topologie d'interconnexion
  • G06N 3/063 - Réalisation physique, c.-à-d. mise en œuvre matérielle de réseaux neuronaux, de neurones ou de parties de neurone utilisant des moyens électroniques

28.

DEEP VISION PROCESSOR

      
Numéro d'application US2018040721
Numéro de publication 2019/010183
Statut Délivré - en vigueur
Date de dépôt 2018-07-03
Date de publication 2019-01-10
Propriétaire DEEP VISION, INC. (USA)
Inventeur(s)
  • Qadeer, Wajahat
  • Hameed, Rehan

Abrégé

Disclosed herein is a processor for deep learning. In one embodiment, the processor comprises: a load and store unit configured to load and store image pixel data and stencil data; a register unit, implementing a banked register file, configured to: load and store a subset of the image pixel data from the load and store unit, and concurrently provide access to image pixel values stored in a register file entry of the banked register file, wherein the subset of the image pixel data comprises the image pixel values stored in the register file entry; and a plurality of arithmetic logic units configured to concurrently perform one or more operations on the image pixel values stored in the register file entry and corresponding stencil data of the stencil data.

Classes IPC  ?

  • G06K 9/56 - Combinaisons de fonctions de prétraitement en utilisant un opérateur local, c. à d. des moyens pour opérer sur un point image élémentaire en fonction des éléments situés à proximité immédiate de ce point
  • G06T 5/20 - Amélioration ou restauration d'image utilisant des opérateurs locaux