Plaidoyer en faveur du calcul décentralisé dans l’IA

Ce qui suit est un article invité de Jiahao Sun, PDG et fondateur de FLock.io.

Dans le paysage en constante évolution de l’intelligence artificielle (IA), le débat entre informatique centralisée et décentralisée s’intensifie. Les fournisseurs centralisés comme Amazon Web Services (AWS) dominent le marché, offrant des solutions robustes et évolutives pour la formation et le déploiement de modèles d’IA. Cependant, l’informatique décentralisée apparaît comme un concurrent redoutable, présentant des avantages et des défis uniques qui pourraient redéfinir la manière dont les modèles d’IA sont formés et déployés à l’échelle mondiale.

Rentabilité grâce aux ressources inutilisées

L’un des principaux avantages de l’informatique décentralisée dans le domaine de l’IA est la rentabilité. Les fournisseurs centralisés investissent massivement dans l’infrastructure, en maintenant de vastes centres de données avec des GPU dédiés aux calculs de l’IA. Ce modèle, bien que puissant, est coûteux. L’informatique décentralisée, en revanche, exploite des GPU « inutilisés » provenant de diverses sources à travers le monde.

Il peut s’agir d’ordinateurs personnels, de serveurs inutilisés ou même de consoles de jeu. En exploitant ce vivier de ressources sous-utilisées, les plateformes décentralisées peuvent offrir une puissance de calcul à une fraction du coût des fournisseurs centralisés. Cette démocratisation des ressources de calcul rend le développement de l’IA plus accessible aux petites entreprises et aux startups, favorisant ainsi l’innovation et la concurrence dans le domaine de l’IA.

Accessibilité améliorée des GPU

La pénurie mondiale de GPU a considérablement réduit la capacité des petites entreprises à obtenir la puissance de calcul nécessaire auprès de fournisseurs centralisés. Les grandes entreprises concluent souvent des contrats à long terme, monopolisant ainsi l’accès à ces ressources essentielles.

Les réseaux de calcul décentralisés atténuent ce problème en s’approvisionnant en GPU auprès d’un large éventail de contributeurs, notamment des joueurs PC individuels et des fournisseurs à petite échelle. Cette accessibilité accrue garantit que même les petites entités peuvent obtenir la puissance de calcul dont elles ont besoin sans être éclipsées par les géants du secteur.

Confidentialité des données et contrôle des utilisateurs

La confidentialité des données reste une préoccupation majeure dans le développement de l’IA. Les systèmes centralisés nécessitent que les données soient transférées et stockées au sein de leurs infrastructures, ce qui fait perdre le contrôle à l’utilisateur. Cette centralisation présente des risques importants en matière de confidentialité. L’informatique décentralisée offre une alternative intéressante en gardant les calculs à proximité de l’utilisateur. Cela peut être réalisé grâce à l’apprentissage fédéré, où les données restent sur l’appareil de l’utilisateur, ou en utilisant des fournisseurs de calcul décentralisés sécurisés.

Le Cloud Compute privé d’Apple illustre cette approche en intégrant plusieurs nœuds de calcul iCloud autour d’un utilisateur spécifique, préservant ainsi la confidentialité des données tout en exploitant la puissance de calcul du cloud. Bien que cette méthode implique toujours un certain degré de centralisation, elle souligne une évolution vers un plus grand contrôle des utilisateurs sur les données.

Protocoles de vérification et sécurité

Malgré ses avantages, l’informatique décentralisée est confrontée à plusieurs défis. L’un des problèmes cruciaux est la vérification de l’intégrité et de la sécurité des nœuds de calcul décentralisés. Veiller à ce que ces nœuds ne soient pas compromis et qu’ils fournissent une véritable puissance de calcul est un problème complexe.

Les progrès de la technologie blockchain offrent des solutions potentielles, permettant des mécanismes d’auto-vérification qui vérifient la légitimité des nœuds de calcul sans compromettre la sécurité.

Préserver la confidentialité des données dans les systèmes décentralisés

Un autre défi majeur est l’exposition potentielle des données personnelles lors des calculs décentralisés. Les modèles d’IA s’appuient sur de vastes ensembles de données, mais sans technologies de préservation de la confidentialité, la formation décentralisée pourrait entraîner des violations de données. Des techniques telles que l’apprentissage fédéré, les preuves à connaissance nulle et le chiffrement entièrement homomorphe peuvent atténuer ces risques.

L’apprentissage fédéré, largement adopté par les grandes entreprises depuis 2017, permet aux données de rester locales tout en contribuant à l’entraînement des modèles. En intégrant ces technologies de cryptage et de préservation de la confidentialité dans des réseaux informatiques décentralisés, nous pouvons améliorer la sécurité des données et la confidentialité des utilisateurs, repoussant ainsi les limites de ce que l’IA décentralisée peut réaliser.

Problèmes de bande passante et d’efficacité

L’efficacité des réseaux informatiques décentralisés est un autre sujet de préoccupation. L’efficacité de la transmission dans un système décentralisé sera inévitablement inférieure à celle des clusters centralisés en raison de la nature distribuée du réseau. Des anecdotes historiques, comme le transfert de données par AWS de Toronto à Vancouver pendant une tempête de neige, mettent en évidence les défis logistiques de la transmission de données.

Toutefois, les progrès réalisés dans les techniques d’IA, comme le réglage fin de LoRA et la compression des modèles, peuvent contribuer à atténuer ces goulots d’étranglement de la bande passante. En optimisant les processus de transfert de données et en affinant les techniques de formation des modèles, les réseaux informatiques décentralisés peuvent atteindre des niveaux de performance compétitifs par rapport à leurs homologues centralisés.

Combler le fossé grâce aux technologies émergentes

L’intégration de la technologie blockchain à l’IA offre une voie prometteuse pour relever de nombreux défis auxquels est confrontée l’informatique décentralisée. La blockchain fournit un registre transparent et immuable permettant de suivre la provenance des données et l’intégrité des nœuds de calcul. Cela garantit que tous les participants du réseau peuvent faire confiance aux données et aux calculs effectués.

De plus, les mécanismes de consensus de la blockchain peuvent faciliter la gouvernance décentralisée, permettant aux communautés de gérer et d’améliorer collectivement le réseau.

De plus, les avancées en matière d’apprentissage fédéré et de chiffrement homomorphe sont essentielles pour garantir la confidentialité des données tout en exploitant la nature distribuée des réseaux informatiques décentralisés. Ces technologies permettent aux modèles d’IA d’apprendre à partir d’ensembles de données distribués sans exposer d’informations sensibles, équilibrant ainsi le besoin de grandes quantités de données avec des exigences strictes en matière de confidentialité.

L’avenir du calcul décentralisé dans l’IA

Le potentiel des réseaux informatiques décentralisés pour révolutionner le développement de l’IA est immense. En démocratisant l’accès aux ressources informatiques, en améliorant la confidentialité des données et en tirant parti des technologies émergentes, l’IA décentralisée peut offrir une alternative robuste aux systèmes centralisés. Cependant, le chemin est semé d’embûches qui nécessitent des solutions innovantes et des efforts collaboratifs de la part des communautés de l’IA et de la blockchain.

À mesure que nous progressons, nous devons continuer à explorer et à développer des solutions informatiques décentralisées qui répondent à ces défis. En favorisant un écosystème collaboratif, nous pouvons garantir que les avantages de l’IA soient accessibles à tous, favorisant ainsi un avenir plus équitable et innovant pour le développement de l’IA.

L’article Le cas du calcul décentralisé dans l’IA est apparu en premier sur CryptoSlate.