Vers une décentralisation du stockage de la donnée

Séduisant par sa simplicité, le stockage en ligne centralisé est abondamment utilisé par les entreprises, les organisations et les particuliers. Les centaines de pétaoctets (1 pétaoctet = 1024 téraoctets) de données qui y transitent sont rarement chiffrés.

Leur accessibilité est conditionnée par le bon fonctionnement et la bonne volonté de l'opérateur qui les stocke. Elles sont amassées dans des Data Centers, véritables usines de la donnée qui sont soumises à divers risques pouvant affecter leur sécurité et leur pérennité :

  • Risque physique (vandalisme, vol de matériel contenant les données, incendies criminels, ou encore casse des serveurs) ;
  • Risque météorologique (inondation, foudre ou encore canicule) ;
  • Risque électrique (microcoupure, panne totale) ;
  • Risque numérique et attaque informatique (vol de donnée, compromission, effacement).

Pour réduire ces risques, une solution est d’augmenter le nombre de Data Centers. Néanmoins, cela ne fait que déconcentrer le stockage de données d’un point de vue géographique. Celui-ci demeure toujours centralisé, car il reste aussi aux mains d’un nombre limité d’acteurs.

Même si les Français Orange Business Services, Scaleway, 3DS Outscale ou OVH proposent des solutions performantes, le stockage de données en ligne est en grande majorité géré par un oligopole à prédominance américaine (Alphabet, Amazon, Apple, Dropbox, Facebook, Microsoft, Oracle, …).

Cela implique des risques de compromission, de liberté d’expression (censure), de sécurité juridique et économique, ou encore de souveraineté. En plus de la résilience d’accès à la donnée, l’un des enjeux du stockage décentralisé réside en la suppression de la centralisation du stockage aux mains d’un petit groupe d'acteurs, vers un très grand nombre d’acteurs n’ayant aucune possibilité de monopole ni de regard sur les données qu’ils stockent.

De nombreuses définitions existent pour définir plus ou moins précisément le stockage décentralisé. Pour faire simple, retenons que le stockage décentralisé (decentralized storage en anglais) est un système qui partage entre de nombreux opérateurs indépendants, la conservation de données informatiques.

Ensemble, ces opérateurs indépendants forment en quelque sorte un réseau de stockage pair-à-pair où les échanges (stockages et récupérations) de données peuvent se faire directement entre différents ordinateurs connectés au système, sans transiter par un serveur central. Le fait d’opérer en réseau ainsi que de chiffrer les données complexifie et réduit de façon drastique le risque d’attaque. Attaquer un seul opérateur est envisageable, attaquer un réseau qui en compte des milliers est aussi possible, mais techniquement et économiquement nettement plus difficile à soutenir.

La fiabilité et la sécurité de ce type de stockage sont directement corrélées au nombre d’opérateurs utilisant le réseau. En multipliant le nombre d’opérateurs, un réseau de stockage décentralisé permet de réaliser des économies d'échelle en permettant à quiconque (entreprises ou particuliers) de participer en tant que fournisseur de stockage (hébergeur) tout en monétisant son espace libre sur son disque dur.

Comment cela fonctionne-t-il ?

Sorte d’infrastructure as a service (IaaS) du cloud computing, les réseaux de stockage décentralisés s'appuient fortement sur la technologie blockchain, condition essentielle à leur sécurité, fiabilité et autonomie. Concrètement, voici l’une des méthodes d'utilisation d’un réseau décentralisé.

Lorsqu’un utilisateur (locataire) souhaite stocker des fichiers en ligne de façon décentralisée, il doit utiliser les services d’une organisation (entreprise, fondation, association) de decentralized storage. Celle-ci lui fournira un logiciel (généralement open source) d’accès à un réseau décentralisé. Ce logiciel va procéder à son « anonymisation » (même si dans certains cas le terme de « pseudonymisation » serait plus approprié), puis va créer différents segments (ou fragments) de ses fichiers avant leur téléversement sur le réseau.

Ces segments sont chiffrés et copiés de nombreuses fois (redondance), puis distribués aléatoirement à différents hébergeurs. Cette distribution sur le réseau d’hébergeurs est régie par des smart contrats (contrats intelligents) qui fixent les prix, les engagements de disponibilité, et d'autres aspects de la relation entre locataires et d’hébergeurs. Ces smart contrats sont ensuite exécutés sur la blockchain du réseau soutenu par l’organisation de decentralized storage. Cela permet la traçabilité et la validation des segments des fichiers du locataire.

S'appuyant sur la technologie blockchain, les smart contrats sont automatiquement générés et appliqués sur le réseau. Pour s’exécuter, les smart contrats ont besoin de preuves validées par la blockchain. Par exemple, les smart contrats peuvent demander une preuve de stockage (proof of storage), d’espace (proof of space), de conservation (PoH), de service (PoSe), d'espace-temps (proof of spacetime), de réplication (proof of replication), etc. Ces méthodes ne requièrent aucun intermédiaire pour fonctionner. Si une preuve apparaît sur la blockchain dans un certain délai, les hébergeurs sont automatiquement payés. Sinon, l’hébergeur est pénalisé.

Lorsqu'un locataire veut accéder à ses fichiers, il le demande au réseau qui peut utiliser des tables de hachage distribuées pour localiser tous les segments et les assembler. Le locataire qui les télécharge dispose de sa propre clé privée pour en valider la propriété. La redondance (multiplication des segments) permet de récupérer complètement le fichier d’origine d'un utilisateur avec seulement quelques segments (de façon peer-to-peer, sans transiter par un serveur central). Gage de résilience, cela signifie que même si un ou plusieurs opérateurs du réseau sont hors ligne, l’accès aux données est encore possible.

Dans un réseau de stockage décentralisé, les locataires et les hébergeurs utilisent majoritairement des cryptomonnaies pour se rémunérer via des micropaiements (déclenché par l’exécution de smart contrats). Le monde du decentralized storage a vu naître de nombreux projets au cours de ces dernières années : Storj de Storj Labs Inc., Sia de Nebulous Inc., ou encore Filecoin (FIL), crypto-monnaie soutenu par la fondation du même nom.

De plus, pour pallier aux délais dus à la récupération des données (souvent plus long qu’avec un stockage centralisé classique), certains services de decentralized storage proposent aux hébergeurs de leurs réseaux disposant de connexions à faible latence, ou d’une bande passante large, proches des utilisateurs finaux, une rémunération plus élevée.

👉 Pour aller plus loin - Sinovate (SIN) - Le service de stockage Cloud décentralisé permettant de générer des revenus passifs

D’une lente démocratisation, vers un équilibre et une utilisation hybride

Malgré des qualités intrinsèques, ce type de stockage peine à se démocratiser. Il est utilisé de façon anecdotique par les entreprises et très peu par les particuliers. L’un des reproches qui peut être fait au stockage décentralisé est la « lenteur » de sa connexion. En effet, les processus d’envoi et de récupération des segments de fichiers souvent disséminés partout dans le monde, ainsi que leurs concaténations (agrégation pour reformer le fichier voulu) prennent un certain nombre de centièmes de secondes. Ce délai de latence ne permet pas (entre autres et pour le moment) la pleine exécution de logiciel en ligne (Saas).

L’utilisation de logiciels en ligne est l’une des forces de la démocratisation du stockage centralisé classique. C’est en ce sens que le stockage décentralisé n’est pas réellement du cloud computing mais plutôt du cloud storage. L’arrivée récente de cette méthode de stockage soulève des risques d’immaturité de développement et l'utilisation des cryptomonnaies peu stables (source de spéculations hautement mercantiles), participe aussi à la défiance d’éventuels utilisateurs.

Le volet juridique du decentralized storage est un autre point important, source d’incertitude. En effet, ne disposant d’aucun organe de centralisation et étant éclaté géographiquement, quel droit est applicable pour encadrer ces échanges ? En cas de contentieux, la charge de la responsabilité juridique des données et de leur traitement peut se poser. Une solution serait d’intégrer à certains niveaux du réseau (en relation directe avec la validité des smart contrats) des « opérateurs de confiance juridique » dont la responsabilité légale serait d’assurer le fonctionnement des règles du réseau et du stockage établies par les parties prenantes. Source d’emplois, cette tâche pourrait être dévolue à des huissiers, notaires, avocats, juristes, experts-comptables, banquiers, délégué aux données, voire même des cabinets spécialisés dans ce domaine.

En outre, un travail de pédagogie est nécessaire pour qu’un tel service de stockage puisse se développer, afin qu’il ne paraisse pas aussi disruptif pour les entreprises de prime abord. Ce type de service doit être aussi simple à l’utiliser pour les utilisateurs que ce que proposent les concurrents traditionnels.

Toutes les architectures de service de système informatique (IaaS) ont des forces et des faiblesses, et aucune solution unique ne convient à tous les cas d'utilisation possibles. Le stockage décentralisé offre une alternative intéressante à son voisin centralisé traditionnel. Immature, ne pouvant pas (pour le moment) se substituer au stockage classique, il semble pertinent de l’utiliser en complément, en tant que système de stockage secondaire. Utilisé pour stocker certains éléments critiques d'entreprises et de particuliers, il leur permet d’être résilientes en cas de défaillance de leur réseau de stockage primaire.

Plus précisément pour les entreprises, l’utilisation hybride entre stockage décentralisé et centralisé est une solution économique de sécurisation au sens large des données, nécessaire à leur pérennité et à leur continuité d’activité, qui mérite d’être étudiée, testée et éprouvée. La gestion des données et par extension le stockage, est un sujet hautement politique, économique et social. Néanmoins, il ne faut pas faire preuve de naïveté, « le pouvoir financier » est en embuscade, arbitre puissant et hyper concentré by design.

👉 Sur le même thème - Lancement de Tardigrade, une solution de stockage décentralisé basée sur Ethereum

Newsletter 🍞

Recevez un récapitulatif de l'actualité crypto chaque dimanche 👌 Et c'est tout.

A propos de l'auteur : Camille Ouya

twitter-soothsayerdata

Competitive Intelligence & Innovation.

Ma devise : « collaborons en bonne intelligence afin d’œuvrer à des synergies positives ! » 🚀
Tous les articles de Camille Ouya.

guest
1 Commentaire
Inline Feedbacks
View all comments
Jeremy

Sujet bien traité avec plusieurs angles de vue, très intéressant !
Attention toutefois à ne pas tout mélanger. Storj est bien un système de stockage décentralisé mais nutilise la blockchain que pour sa couche de paiement. La technologie intrinsèque ne s'appuie pas dessus (bien qu'elle ressemble au mécanisme que vous avez décrit).