Auteur : Paul Veradittakit, partenaire chez Pantera Capital ; Traduction : xiaozou de Golden Finance
Résumé :
VLA* L'innovation et l'effet d'échelle propulsent la naissance de robots humanoïdes économiques, efficaces et polyvalents.*
Avec l'expansion des robots de stockage vers le marché des robots grand public, la sécurité des robots, le financement et les mécanismes d'évaluation méritent d'être explorés en profondeur.
La technologie de la cryptographie contribuera au développement de l'industrie des robots en fournissant des garanties économiques pour la sécurité des robots et en optimisant leurs infrastructures d'intégration, leurs délais et leurs processus de collecte de données.
ChatGPT a complètement réécrit les attentes humaines concernant l'intelligence artificielle. Lorsque les grands modèles de langage ont commencé à interagir avec le monde des logiciels externes, beaucoup ont pensé que les agents IA représentaient la forme ultime. Mais en regardant des films de science-fiction classiques comme "Star Wars", "Blade Runner" ou "RoboCop", on réalise que le véritable rêve de l'humanité est que l'intelligence artificielle puisse interagir avec le monde physique sous forme de robot.
Selon Pantera Capital, le "moment ChatGPT" dans le domaine des robots est imminent. Nous commencerons par analyser comment les percées en intelligence artificielle au cours des dernières années ont modifié le paysage industriel, puis nous examinerons comment la technologie des batteries, l'optimisation des délais et l'amélioration de la collecte de données façonneront l'avenir, ainsi que le rôle que joue la technologie cryptographique dans ce cadre. Enfin, nous expliquerons pourquoi nous pensons que la sécurité des robots, le financement, l'évaluation et l'éducation sont des domaines verticaux qui nécessitent une attention particulière.
1**, Éléments de transformation**
(1)Percée de l'intelligence artificielle
Les avancées dans le domaine des modèles de langage multimodaux dotent les robots du "cerveau" nécessaire pour exécuter des tâches complexes. Les robots perçoivent principalement leur environnement par la vision et l'audition.
Bien que les modèles de vision par ordinateur traditionnels (comme les réseaux de neurones convolutionnels) excellent dans les tâches de détection ou de classification d'objets, ils ont du mal à transformer les informations visuelles en instructions d'action ciblées. Les grands modèles linguistiques, bien qu'ils excellent dans la compréhension et la génération de textes, sont limités par leur capacité à percevoir le monde physique.
Grâce au modèle visuel-linguistique-action (VLA), les robots peuvent intégrer la perception visuelle, la compréhension du langage et l'action physique dans un cadre informatique unifié. En février 2025, Figure AI a lancé le modèle de contrôle de robot humanoïde universel Helix, qui établit une nouvelle référence dans l'industrie grâce à sa capacité de généralisation à zéro échantillon et à son architecture système 1/système 2. La caractéristique de généralisation à zéro échantillon permet aux robots de s'adapter instantanément à de nouveaux scénarios, objets et instructions sans avoir besoin d'un entraînement répétitif pour chaque tâche. L'architecture système 1/système 2 sépare le raisonnement de haut niveau du raisonnement léger, réalisant ainsi un robot humanoïde commercial capable de pensée humaine et de précision en temps réel.
(2) Les robots économiques deviennent une réalité
Les technologies qui changent le monde ont toutes une caractéristique commune : leur capacité à se généraliser. Les smartphones, les ordinateurs personnels et les technologies d'impression 3D se sont répandus grâce à des prix accessibles à la classe moyenne. Lorsque des robots comme le Unitree G1 coûtent moins cher qu'une Honda Accord ou le revenu annuel minimum de 34 000 dollars aux États-Unis, il n'est pas étonnant d'imaginer un monde où le travail physique et les tâches quotidiennes sont principalement réalisés par des robots.
(3)De l'entreposage au marché de consommation
La technologie robotique s'étend des solutions d'entreposage vers le domaine de la consommation. Ce monde est conçu pour les humains - les humains peuvent accomplir tous les travaux des robots spécialisés, tandis que les robots spécialisés ne peuvent pas effectuer tous les travaux des humains. Les entreprises de robotique ne se limitent plus à fabriquer des robots destinés aux usines, mais développent plutôt des robots humanoïdes plus polyvalents. Ainsi, le front de la technologie robotique n'est pas seulement présent dans les entrepôts, mais va également s'infiltrer dans la vie quotidienne.
Le coût est l'un des principaux goulots d'étranglement de l'évolutivité. L'indicateur qui nous préoccupe le plus est le coût global par heure, qui est calculé comme suit : le coût d'opportunité du temps d'entraînement et de recharge, le coût d'exécution des tâches et le coût d'acquisition des robots, le tout divisé par la durée totale de fonctionnement des robots. Ce coût doit être inférieur au niveau de salaire moyen du secteur concerné pour être compétitif.
Pour pénétrer pleinement le domaine de l'entreposage, le coût total des robots par heure doit être inférieur à 31,39 $. Dans le plus grand marché de consommation - le secteur de l'éducation privée et des services de santé - ce coût doit être maintenu en dessous de 35,18 $. Actuellement, les robots évoluent vers moins chers, plus efficaces et plus polyvalents.
2**, La prochaine percée de la robotique**
(1) Optimisation de la batterie
La technologie des batteries reste un goulot d'étranglement pour les robots conviviaux. Les premiers véhicules électriques comme la BMW i3 ont eu du mal à se généraliser en raison des limitations de la technologie des batteries, entraînant une autonomie courte, des coûts élevés et une faible praticité, et les robots sont confrontés à la même difficulté. Le robot Spot de Boston Dynamics a une autonomie de seulement 90 minutes, tandis que la batterie du Unitree G1 a une autonomie d'environ 2 heures**. Les utilisateurs ne souhaitent manifestement pas recharger manuellement toutes les deux heures**, c'est pourquoi le chargement autonome et les infrastructures de connexion sont devenus des axes de développement prioritaires. Actuellement, il existe principalement deux modes de chargement pour les robots : le remplacement de la batterie ou le chargement direct.
Le mode de remplacement des batteries permet de réaliser des opérations continues grâce à un remplacement rapide des batteries épuisées, minimisant ainsi les temps d'arrêt, et est adapté aux scénarios en extérieur ou en usine. Ce processus peut être effectué manuellement ou de manière automatisée.
La charge par induction utilise une méthode d'alimentation sans fil. Bien que le temps de charge complet soit relativement long, elle permet de réaliser un processus entièrement automatisé.
(2)optimisation des délais
Les opérations à faible latence peuvent être classées en deux catégories : la perception de l'environnement et le contrôle à distance. La perception fait référence à la capacité des robots à comprendre l'espace environnant, tandis que le contrôle à distance fait spécifiquement référence au contrôle en temps réel par un opérateur humain.
Selon une étude de Cintrini, le système de perception des robots commence par des capteurs bon marché, mais le véritable avantage technologique réside dans le logiciel d'intégration, le calcul à faible consommation et les boucles de contrôle précises à la milliseconde. Une fois que le robot a terminé le positionnement spatial, un réseau de neurones léger identifiera des éléments tels que les obstacles, les palettes ou les êtres humains. Une fois que l'étiquette de scène est entrée dans le système de planification, des instructions pour les moteurs destinées aux pieds, aux roues ou aux bras mécaniques sont immédiatement générées. Un délai de perception inférieur à 50 millisecondes équivaut à la vitesse de réflexion humaine**——**tout délai dépassant ce seuil entraînera des mouvements maladroits du robot. Par conséquent, 90 % des décisions doivent être prises localement par un réseau unique de vision-langage-action.
Les robots entièrement autonomes doivent garantir que le modèle VLA ait un délai inférieur à 50 millisecondes ; les robots télécommandés exigent quant à eux que le délai de signal entre le terminal d'opération et le robot ne dépasse pas 50 millisecondes. L'importance du modèle VLA est ici particulièrement mise en avant : si les entrées visuelles et textuelles sont traitées par différents modèles avant d'être soumises à un modèle de langage de grande taille, le délai global dépassera largement le seuil de 50 millisecondes.
(3) Optimisation de la collecte des données
La collecte de données se fait principalement par trois moyens : données vidéo du monde réel, données synthétiques et données de télécommande. Le principal obstacle entre les données réelles et les données synthétiques réside dans le rapprochement des comportements physiques des robots et des modèles de simulation vidéo. Les données vidéo réelles manquent de détails physiques tels que le retour de force, les erreurs de mouvement des articulations et les déformations des matériaux ; les données de simulation, quant à elles, manquent de variables imprévisibles telles que les pannes de capteurs et les coefficients de friction.
La méthode de collecte de données la plus prometteuse est le contrôle à distance - des opérateurs humains contrôlent à distance des robots pour exécuter des tâches. Mais le coût de la main-d'œuvre est le principal facteur limitant la collecte de données par contrôle à distance.
Le développement de matériel personnalisé propose également de nouvelles solutions pour la collecte de données de haute qualité. La société Mecka combine des méthodes traditionnelles avec du matériel personnalisé pour collecter des données sur les mouvements humains sous plusieurs dimensions, qui, une fois traitées, sont transformées en ensembles de données adaptés à l'entraînement des réseaux neuronaux des robots, fournissant ainsi une grande quantité de données de haute qualité pour l'entraînement des robots IA avec un cycle d'itération rapide. Ces pipelines technologiques raccourcissent ensemble le chemin de conversion des données brutes aux robots déployables.
3**, Domaines clés à explorer**
(1)Fusion de la technologie cryptographique et des robots
La technologie de la cryptographie peut inciter les parties non fiables à améliorer l'efficacité des réseaux de robots. Sur la base des domaines clés mentionnés précédemment, nous pensons que la technologie de la cryptographie peut améliorer l'efficacité dans trois domaines : l'intégration des infrastructures, l'optimisation des délais et la collecte de données.
Le réseau d'infrastructure physique décentralisée (DePIN) promet de révolutionner l'infrastructure de recharge. Lorsque des robots humanoïdes fonctionneront à l'échelle mondiale comme des voitures, les stations de recharge devront être aussi accessibles que des stations-service. Les réseaux centralisés nécessitent des investissements initiaux énormes, tandis que DePIN répartit les coûts entre les opérateurs de nœuds, permettant ainsi une expansion rapide des installations de recharge dans davantage de régions.
DePIN peut également utiliser une infrastructure distribuée pour optimiser la latence de la télécommande. En agrégant les ressources de calcul des nœuds de périphérie géographiquement dispersés, les instructions de télécommande peuvent être traitées par des nœuds locaux ou les plus proches disponibles, minimisant ainsi la distance de transmission des données et réduisant considérablement la latence de communication. Cependant, les projets DePIN actuels se concentrent principalement sur le stockage décentralisé, la distribution de contenu et le partage de bande passante. Bien que certains projets démontrent les avantages de l'informatique en périphérie dans le streaming ou l'Internet des objets, cela n'a pas encore été étendu aux robots ou au domaine de la télécommande.
Le contrôle à distance est la méthode de collecte de données la plus prometteuse, mais le coût d'embauche de professionnels par des entités centralisées pour collecter des données est extrêmement élevé. DePIN résout ce problème en incitant des tiers à fournir des données de contrôle à distance via des jetons cryptographiques. Le projet Reborn construit un réseau mondial d'opérateurs à distance, transformant leurs contributions en actifs numériques tokenisés, formant un système décentralisé sans autorisation - les participants peuvent à la fois obtenir des revenus et participer à la gouvernance tout en contribuant à l'entraînement des robots AGI.
(2) La sécurité est toujours une préoccupation centrale
L'objectif ultime de la robotique est d'atteindre une autonomie complète, mais comme le mettent en garde les films de la série « Terminator », l'humanité craint le plus que l'autonomie transforme les robots en armes offensives. Les problèmes de sécurité des grands modèles de langage ont suscité des inquiétudes, et lorsque ces modèles acquièrent des capacités d'action physique, la sécurité des robots devient une condition préalable essentielle à l'acceptation sociale.
La sécurité économique est l'un des piliers de la prospérité de l'écosystème robotique. Dans ce domaine, la société OpenMind construit FABRIC - une couche de coordination des machines décentralisée, qui réalise l'authentification de l'identité des dispositifs, la vérification de la présence physique et l'accès aux ressources par le biais de preuves cryptographiques. Contrairement à une simple gestion de marché de tâches, FABRIC permet aux robots de prouver de manière autonome leurs informations d'identité, leur localisation géographique et leurs enregistrements de comportement sans dépendre d'intermédiaires centralisés.
Les contraintes comportementales et l'authentification des identités sont exécutées par des mécanismes on-chain, garantissant que tout le monde peut auditer la conformité. Les robots conformes aux normes de sécurité, aux exigences de qualité et aux réglementations régionales recevront des récompenses, tandis que les contrevenants feront face à des sanctions ou à une disqualification, établissant ainsi un mécanisme de responsabilité et de confiance dans le réseau de machines autonomes.
Les réseaux de re-staking tiers (comme Symbiotic) peuvent également fournir des garanties de sécurité équivalentes. Bien que le système de paramètres de pénalité doive encore être amélioré, la technologie pertinente est déjà à un stade pratique. Nous prévoyons que des normes de sécurité pour l'industrie seront bientôt établies, et à ce moment-là, les paramètres de pénalité seront modélisés en fonction de ces normes.
Exemple de plan de mise en œuvre :
Les entreprises de robots rejoignent le réseau Symbiotic.
Définir des paramètres de saisie vérifiables (comme "Appliquer une force de contact humaine supérieure à 2500 newtons");
Les stakers fournissent une marge pour s'assurer que le robot respecte les paramètres ;
En cas de violation, le dépôt sera utilisé comme indemnité pour la victime.
Ce modèle incite les entreprises à placer la sécurité au premier plan tout en favorisant l'acceptation des consommateurs grâce au mécanisme d'assurance du pool de fonds de staking.
L'équipe Symbiotic a une vision sur le domaine des robots :
Symbiotic* Le cadre de staking universel vise à étendre le concept de staking à tous les domaines nécessitant une garantie de sécurité économique, que ce soit par un modèle partagé ou indépendant. Ses cas d'application vont de l'assurance à la robotique et nécessitent une conception spécifique pour chaque cas. Par exemple, un réseau de robots peut être entièrement construit sur le cadre Symbiotic, permettant aux parties prenantes de fournir une garantie économique pour l'intégrité du réseau.*
4**, combler les lacunes de la pile technologique des robots**
OpenAI a favorisé la généralisation de l'IA, mais les fondations de ChatGPT étaient déjà posées. Les services cloud ont brisé la dépendance des modèles à la puissance de calcul locale, Huggingface a rendu les modèles open source et Kaggle a fourni une plateforme d'expérimentation pour les ingénieurs en IA. Ces avancées progressives ont conjointement contribué à la vulgarisation de l'IA.
**Contrairement à l'IA, le domaine de la robotique est difficile d'accès lorsque les fonds sont limités. Pour réaliser la diffusion des robots, le seuil de développement doit être réduit à un niveau de commodité similaire à celui du développement d'applications IA. Nous pensons qu'il y a des possibilités d'amélioration dans trois domaines : le mécanisme de financement, le système d'évaluation et l'écosystème éducatif.
Le financement est un point de douleur dans le domaine de la robotique. Le développement de programmes informatiques nécessite seulement un ordinateur et des ressources de cloud computing, tandis que la construction de robots entièrement fonctionnels nécessite l'achat de moteurs, de capteurs, de batteries et d'autres matériels, ce qui fait facilement dépasser le coût de 100 000 dollars. Cette nature matérielle rend le développement de robots moins flexible et plus coûteux par rapport à l'IA.
Les infrastructures d'évaluation des robots dans des scénarios réels en sont encore à leurs débuts. Dans le domaine de l'IA, un système de fonctions de perte clair a été établi, et les tests peuvent être entièrement virtualisés. Cependant, d'excellentes stratégies virtuelles ne peuvent pas être directement traduites en solutions efficaces dans le monde réel. Les robots ont besoin d'installations d'évaluation pour tester des stratégies autonomes dans des environnements réels diversifiés afin de réaliser une optimisation itérative.
Lorsque ces infrastructures seront matures, les talents afflueront en masse et les robots humanoïdes reproduiront la courbe d'explosion du Web2. La société de robots cryptographiques OpenMind avance dans cette direction - son projet open source OM1 ("système Android pour robots") transforme le matériel brut en agents intelligents évolutifs dotés de conscience économique. Les modules de vision, de langage et de planification des mouvements peuvent être plug-and-play comme des applications mobiles, et toutes les étapes de raisonnement sont présentées en anglais clair, permettant aux opérateurs d'auditer ou d'ajuster le comportement sans toucher au firmware. Cette capacité de raisonnement en langage naturel permet à la nouvelle génération de talents d'entrer sans couture dans le domaine de la robotique, franchissant une étape clé vers l'explosion d'une plateforme ouverte pour la révolution robotique, tout comme le mouvement open source a accéléré l'IA.
La densité des talents détermine la trajectoire de l'industrie. Un système éducatif structuré et inclusif est crucial pour l'approvisionnement en talents dans le domaine de la robotique. L'introduction d'OpenMind sur le NASDAQ marque le début d'une nouvelle ère où les machines intelligentes participent à l'innovation financière et à l'éducation réelle. OpenMind** et Robostore annoncent conjointement le lancement du premier cours d'éducation générale basé sur le robot humanoïde Unitree G1 dans les écoles publiques américaines K-12. **Ce cours est conçu pour être indépendant de la plateforme, pouvant s'adapter à diverses formes de robots, et offrant aux étudiants des opportunités de pratique. Ce signe positif renforce notre jugement : dans les années à venir, la richesse des ressources éducatives en robotique sera comparable à celle du domaine de l'IA.
5**, Perspectives d'avenir**
L'innovation et les effets d'échelle du modèle visuel-linguistique-action (VLA) ont donné naissance à des robots humanoïdes économiques, efficaces et polyvalents. Alors que les robots d'entreposage s'étendent au marché de consommation, la sécurité, les modèles de financement et les systèmes d'évaluation deviennent des directions clés d'exploration. Nous croyons fermement que la technologie de la cryptographie va promouvoir le développement des robots par trois voies : fournir des garanties économiques pour la sécurité, optimiser les infrastructures de recharge, améliorer les performances de latence et les pipelines de collecte de données.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Partenaire de Pantera : l'ère des Bots alimentés par le chiffrement
Auteur : Paul Veradittakit, partenaire chez Pantera Capital ; Traduction : xiaozou de Golden Finance
Résumé :
VLA* L'innovation et l'effet d'échelle propulsent la naissance de robots humanoïdes économiques, efficaces et polyvalents.*
Avec l'expansion des robots de stockage vers le marché des robots grand public, la sécurité des robots, le financement et les mécanismes d'évaluation méritent d'être explorés en profondeur.
La technologie de la cryptographie contribuera au développement de l'industrie des robots en fournissant des garanties économiques pour la sécurité des robots et en optimisant leurs infrastructures d'intégration, leurs délais et leurs processus de collecte de données.
ChatGPT a complètement réécrit les attentes humaines concernant l'intelligence artificielle. Lorsque les grands modèles de langage ont commencé à interagir avec le monde des logiciels externes, beaucoup ont pensé que les agents IA représentaient la forme ultime. Mais en regardant des films de science-fiction classiques comme "Star Wars", "Blade Runner" ou "RoboCop", on réalise que le véritable rêve de l'humanité est que l'intelligence artificielle puisse interagir avec le monde physique sous forme de robot.
Selon Pantera Capital, le "moment ChatGPT" dans le domaine des robots est imminent. Nous commencerons par analyser comment les percées en intelligence artificielle au cours des dernières années ont modifié le paysage industriel, puis nous examinerons comment la technologie des batteries, l'optimisation des délais et l'amélioration de la collecte de données façonneront l'avenir, ainsi que le rôle que joue la technologie cryptographique dans ce cadre. Enfin, nous expliquerons pourquoi nous pensons que la sécurité des robots, le financement, l'évaluation et l'éducation sont des domaines verticaux qui nécessitent une attention particulière.
1**, Éléments de transformation**
(1)Percée de l'intelligence artificielle
Les avancées dans le domaine des modèles de langage multimodaux dotent les robots du "cerveau" nécessaire pour exécuter des tâches complexes. Les robots perçoivent principalement leur environnement par la vision et l'audition.
Bien que les modèles de vision par ordinateur traditionnels (comme les réseaux de neurones convolutionnels) excellent dans les tâches de détection ou de classification d'objets, ils ont du mal à transformer les informations visuelles en instructions d'action ciblées. Les grands modèles linguistiques, bien qu'ils excellent dans la compréhension et la génération de textes, sont limités par leur capacité à percevoir le monde physique.
Grâce au modèle visuel-linguistique-action (VLA), les robots peuvent intégrer la perception visuelle, la compréhension du langage et l'action physique dans un cadre informatique unifié. En février 2025, Figure AI a lancé le modèle de contrôle de robot humanoïde universel Helix, qui établit une nouvelle référence dans l'industrie grâce à sa capacité de généralisation à zéro échantillon et à son architecture système 1/système 2. La caractéristique de généralisation à zéro échantillon permet aux robots de s'adapter instantanément à de nouveaux scénarios, objets et instructions sans avoir besoin d'un entraînement répétitif pour chaque tâche. L'architecture système 1/système 2 sépare le raisonnement de haut niveau du raisonnement léger, réalisant ainsi un robot humanoïde commercial capable de pensée humaine et de précision en temps réel.
(2) Les robots économiques deviennent une réalité
Les technologies qui changent le monde ont toutes une caractéristique commune : leur capacité à se généraliser. Les smartphones, les ordinateurs personnels et les technologies d'impression 3D se sont répandus grâce à des prix accessibles à la classe moyenne. Lorsque des robots comme le Unitree G1 coûtent moins cher qu'une Honda Accord ou le revenu annuel minimum de 34 000 dollars aux États-Unis, il n'est pas étonnant d'imaginer un monde où le travail physique et les tâches quotidiennes sont principalement réalisés par des robots.
(3)De l'entreposage au marché de consommation
La technologie robotique s'étend des solutions d'entreposage vers le domaine de la consommation. Ce monde est conçu pour les humains - les humains peuvent accomplir tous les travaux des robots spécialisés, tandis que les robots spécialisés ne peuvent pas effectuer tous les travaux des humains. Les entreprises de robotique ne se limitent plus à fabriquer des robots destinés aux usines, mais développent plutôt des robots humanoïdes plus polyvalents. Ainsi, le front de la technologie robotique n'est pas seulement présent dans les entrepôts, mais va également s'infiltrer dans la vie quotidienne.
Le coût est l'un des principaux goulots d'étranglement de l'évolutivité. L'indicateur qui nous préoccupe le plus est le coût global par heure, qui est calculé comme suit : le coût d'opportunité du temps d'entraînement et de recharge, le coût d'exécution des tâches et le coût d'acquisition des robots, le tout divisé par la durée totale de fonctionnement des robots. Ce coût doit être inférieur au niveau de salaire moyen du secteur concerné pour être compétitif.
Pour pénétrer pleinement le domaine de l'entreposage, le coût total des robots par heure doit être inférieur à 31,39 $. Dans le plus grand marché de consommation - le secteur de l'éducation privée et des services de santé - ce coût doit être maintenu en dessous de 35,18 $. Actuellement, les robots évoluent vers moins chers, plus efficaces et plus polyvalents.
2**, La prochaine percée de la robotique**
(1) Optimisation de la batterie
La technologie des batteries reste un goulot d'étranglement pour les robots conviviaux. Les premiers véhicules électriques comme la BMW i3 ont eu du mal à se généraliser en raison des limitations de la technologie des batteries, entraînant une autonomie courte, des coûts élevés et une faible praticité, et les robots sont confrontés à la même difficulté. Le robot Spot de Boston Dynamics a une autonomie de seulement 90 minutes, tandis que la batterie du Unitree G1 a une autonomie d'environ 2 heures**. Les utilisateurs ne souhaitent manifestement pas recharger manuellement toutes les deux heures**, c'est pourquoi le chargement autonome et les infrastructures de connexion sont devenus des axes de développement prioritaires. Actuellement, il existe principalement deux modes de chargement pour les robots : le remplacement de la batterie ou le chargement direct.
Le mode de remplacement des batteries permet de réaliser des opérations continues grâce à un remplacement rapide des batteries épuisées, minimisant ainsi les temps d'arrêt, et est adapté aux scénarios en extérieur ou en usine. Ce processus peut être effectué manuellement ou de manière automatisée.
La charge par induction utilise une méthode d'alimentation sans fil. Bien que le temps de charge complet soit relativement long, elle permet de réaliser un processus entièrement automatisé.
(2)optimisation des délais
Les opérations à faible latence peuvent être classées en deux catégories : la perception de l'environnement et le contrôle à distance. La perception fait référence à la capacité des robots à comprendre l'espace environnant, tandis que le contrôle à distance fait spécifiquement référence au contrôle en temps réel par un opérateur humain.
Selon une étude de Cintrini, le système de perception des robots commence par des capteurs bon marché, mais le véritable avantage technologique réside dans le logiciel d'intégration, le calcul à faible consommation et les boucles de contrôle précises à la milliseconde. Une fois que le robot a terminé le positionnement spatial, un réseau de neurones léger identifiera des éléments tels que les obstacles, les palettes ou les êtres humains. Une fois que l'étiquette de scène est entrée dans le système de planification, des instructions pour les moteurs destinées aux pieds, aux roues ou aux bras mécaniques sont immédiatement générées. Un délai de perception inférieur à 50 millisecondes équivaut à la vitesse de réflexion humaine**——**tout délai dépassant ce seuil entraînera des mouvements maladroits du robot. Par conséquent, 90 % des décisions doivent être prises localement par un réseau unique de vision-langage-action.
Les robots entièrement autonomes doivent garantir que le modèle VLA ait un délai inférieur à 50 millisecondes ; les robots télécommandés exigent quant à eux que le délai de signal entre le terminal d'opération et le robot ne dépasse pas 50 millisecondes. L'importance du modèle VLA est ici particulièrement mise en avant : si les entrées visuelles et textuelles sont traitées par différents modèles avant d'être soumises à un modèle de langage de grande taille, le délai global dépassera largement le seuil de 50 millisecondes.
(3) Optimisation de la collecte des données
La collecte de données se fait principalement par trois moyens : données vidéo du monde réel, données synthétiques et données de télécommande. Le principal obstacle entre les données réelles et les données synthétiques réside dans le rapprochement des comportements physiques des robots et des modèles de simulation vidéo. Les données vidéo réelles manquent de détails physiques tels que le retour de force, les erreurs de mouvement des articulations et les déformations des matériaux ; les données de simulation, quant à elles, manquent de variables imprévisibles telles que les pannes de capteurs et les coefficients de friction.
La méthode de collecte de données la plus prometteuse est le contrôle à distance - des opérateurs humains contrôlent à distance des robots pour exécuter des tâches. Mais le coût de la main-d'œuvre est le principal facteur limitant la collecte de données par contrôle à distance.
Le développement de matériel personnalisé propose également de nouvelles solutions pour la collecte de données de haute qualité. La société Mecka combine des méthodes traditionnelles avec du matériel personnalisé pour collecter des données sur les mouvements humains sous plusieurs dimensions, qui, une fois traitées, sont transformées en ensembles de données adaptés à l'entraînement des réseaux neuronaux des robots, fournissant ainsi une grande quantité de données de haute qualité pour l'entraînement des robots IA avec un cycle d'itération rapide. Ces pipelines technologiques raccourcissent ensemble le chemin de conversion des données brutes aux robots déployables.
3**, Domaines clés à explorer**
(1)Fusion de la technologie cryptographique et des robots
La technologie de la cryptographie peut inciter les parties non fiables à améliorer l'efficacité des réseaux de robots. Sur la base des domaines clés mentionnés précédemment, nous pensons que la technologie de la cryptographie peut améliorer l'efficacité dans trois domaines : l'intégration des infrastructures, l'optimisation des délais et la collecte de données.
Le réseau d'infrastructure physique décentralisée (DePIN) promet de révolutionner l'infrastructure de recharge. Lorsque des robots humanoïdes fonctionneront à l'échelle mondiale comme des voitures, les stations de recharge devront être aussi accessibles que des stations-service. Les réseaux centralisés nécessitent des investissements initiaux énormes, tandis que DePIN répartit les coûts entre les opérateurs de nœuds, permettant ainsi une expansion rapide des installations de recharge dans davantage de régions.
DePIN peut également utiliser une infrastructure distribuée pour optimiser la latence de la télécommande. En agrégant les ressources de calcul des nœuds de périphérie géographiquement dispersés, les instructions de télécommande peuvent être traitées par des nœuds locaux ou les plus proches disponibles, minimisant ainsi la distance de transmission des données et réduisant considérablement la latence de communication. Cependant, les projets DePIN actuels se concentrent principalement sur le stockage décentralisé, la distribution de contenu et le partage de bande passante. Bien que certains projets démontrent les avantages de l'informatique en périphérie dans le streaming ou l'Internet des objets, cela n'a pas encore été étendu aux robots ou au domaine de la télécommande.
Le contrôle à distance est la méthode de collecte de données la plus prometteuse, mais le coût d'embauche de professionnels par des entités centralisées pour collecter des données est extrêmement élevé. DePIN résout ce problème en incitant des tiers à fournir des données de contrôle à distance via des jetons cryptographiques. Le projet Reborn construit un réseau mondial d'opérateurs à distance, transformant leurs contributions en actifs numériques tokenisés, formant un système décentralisé sans autorisation - les participants peuvent à la fois obtenir des revenus et participer à la gouvernance tout en contribuant à l'entraînement des robots AGI.
(2) La sécurité est toujours une préoccupation centrale
L'objectif ultime de la robotique est d'atteindre une autonomie complète, mais comme le mettent en garde les films de la série « Terminator », l'humanité craint le plus que l'autonomie transforme les robots en armes offensives. Les problèmes de sécurité des grands modèles de langage ont suscité des inquiétudes, et lorsque ces modèles acquièrent des capacités d'action physique, la sécurité des robots devient une condition préalable essentielle à l'acceptation sociale.
La sécurité économique est l'un des piliers de la prospérité de l'écosystème robotique. Dans ce domaine, la société OpenMind construit FABRIC - une couche de coordination des machines décentralisée, qui réalise l'authentification de l'identité des dispositifs, la vérification de la présence physique et l'accès aux ressources par le biais de preuves cryptographiques. Contrairement à une simple gestion de marché de tâches, FABRIC permet aux robots de prouver de manière autonome leurs informations d'identité, leur localisation géographique et leurs enregistrements de comportement sans dépendre d'intermédiaires centralisés.
Les contraintes comportementales et l'authentification des identités sont exécutées par des mécanismes on-chain, garantissant que tout le monde peut auditer la conformité. Les robots conformes aux normes de sécurité, aux exigences de qualité et aux réglementations régionales recevront des récompenses, tandis que les contrevenants feront face à des sanctions ou à une disqualification, établissant ainsi un mécanisme de responsabilité et de confiance dans le réseau de machines autonomes.
Les réseaux de re-staking tiers (comme Symbiotic) peuvent également fournir des garanties de sécurité équivalentes. Bien que le système de paramètres de pénalité doive encore être amélioré, la technologie pertinente est déjà à un stade pratique. Nous prévoyons que des normes de sécurité pour l'industrie seront bientôt établies, et à ce moment-là, les paramètres de pénalité seront modélisés en fonction de ces normes.
Exemple de plan de mise en œuvre :
Les entreprises de robots rejoignent le réseau Symbiotic.
Définir des paramètres de saisie vérifiables (comme "Appliquer une force de contact humaine supérieure à 2500 newtons");
Les stakers fournissent une marge pour s'assurer que le robot respecte les paramètres ;
En cas de violation, le dépôt sera utilisé comme indemnité pour la victime.
Ce modèle incite les entreprises à placer la sécurité au premier plan tout en favorisant l'acceptation des consommateurs grâce au mécanisme d'assurance du pool de fonds de staking.
L'équipe Symbiotic a une vision sur le domaine des robots :
Symbiotic* Le cadre de staking universel vise à étendre le concept de staking à tous les domaines nécessitant une garantie de sécurité économique, que ce soit par un modèle partagé ou indépendant. Ses cas d'application vont de l'assurance à la robotique et nécessitent une conception spécifique pour chaque cas. Par exemple, un réseau de robots peut être entièrement construit sur le cadre Symbiotic, permettant aux parties prenantes de fournir une garantie économique pour l'intégrité du réseau.*
4**, combler les lacunes de la pile technologique des robots**
OpenAI a favorisé la généralisation de l'IA, mais les fondations de ChatGPT étaient déjà posées. Les services cloud ont brisé la dépendance des modèles à la puissance de calcul locale, Huggingface a rendu les modèles open source et Kaggle a fourni une plateforme d'expérimentation pour les ingénieurs en IA. Ces avancées progressives ont conjointement contribué à la vulgarisation de l'IA.
**Contrairement à l'IA, le domaine de la robotique est difficile d'accès lorsque les fonds sont limités. Pour réaliser la diffusion des robots, le seuil de développement doit être réduit à un niveau de commodité similaire à celui du développement d'applications IA. Nous pensons qu'il y a des possibilités d'amélioration dans trois domaines : le mécanisme de financement, le système d'évaluation et l'écosystème éducatif.
Le financement est un point de douleur dans le domaine de la robotique. Le développement de programmes informatiques nécessite seulement un ordinateur et des ressources de cloud computing, tandis que la construction de robots entièrement fonctionnels nécessite l'achat de moteurs, de capteurs, de batteries et d'autres matériels, ce qui fait facilement dépasser le coût de 100 000 dollars. Cette nature matérielle rend le développement de robots moins flexible et plus coûteux par rapport à l'IA.
Les infrastructures d'évaluation des robots dans des scénarios réels en sont encore à leurs débuts. Dans le domaine de l'IA, un système de fonctions de perte clair a été établi, et les tests peuvent être entièrement virtualisés. Cependant, d'excellentes stratégies virtuelles ne peuvent pas être directement traduites en solutions efficaces dans le monde réel. Les robots ont besoin d'installations d'évaluation pour tester des stratégies autonomes dans des environnements réels diversifiés afin de réaliser une optimisation itérative.
Lorsque ces infrastructures seront matures, les talents afflueront en masse et les robots humanoïdes reproduiront la courbe d'explosion du Web2. La société de robots cryptographiques OpenMind avance dans cette direction - son projet open source OM1 ("système Android pour robots") transforme le matériel brut en agents intelligents évolutifs dotés de conscience économique. Les modules de vision, de langage et de planification des mouvements peuvent être plug-and-play comme des applications mobiles, et toutes les étapes de raisonnement sont présentées en anglais clair, permettant aux opérateurs d'auditer ou d'ajuster le comportement sans toucher au firmware. Cette capacité de raisonnement en langage naturel permet à la nouvelle génération de talents d'entrer sans couture dans le domaine de la robotique, franchissant une étape clé vers l'explosion d'une plateforme ouverte pour la révolution robotique, tout comme le mouvement open source a accéléré l'IA.
La densité des talents détermine la trajectoire de l'industrie. Un système éducatif structuré et inclusif est crucial pour l'approvisionnement en talents dans le domaine de la robotique. L'introduction d'OpenMind sur le NASDAQ marque le début d'une nouvelle ère où les machines intelligentes participent à l'innovation financière et à l'éducation réelle. OpenMind** et Robostore annoncent conjointement le lancement du premier cours d'éducation générale basé sur le robot humanoïde Unitree G1 dans les écoles publiques américaines K-12. **Ce cours est conçu pour être indépendant de la plateforme, pouvant s'adapter à diverses formes de robots, et offrant aux étudiants des opportunités de pratique. Ce signe positif renforce notre jugement : dans les années à venir, la richesse des ressources éducatives en robotique sera comparable à celle du domaine de l'IA.
5**, Perspectives d'avenir**
L'innovation et les effets d'échelle du modèle visuel-linguistique-action (VLA) ont donné naissance à des robots humanoïdes économiques, efficaces et polyvalents. Alors que les robots d'entreposage s'étendent au marché de consommation, la sécurité, les modèles de financement et les systèmes d'évaluation deviennent des directions clés d'exploration. Nous croyons fermement que la technologie de la cryptographie va promouvoir le développement des robots par trois voies : fournir des garanties économiques pour la sécurité, optimiser les infrastructures de recharge, améliorer les performances de latence et les pipelines de collecte de données.