Devenir une entreprise data-centric grâce au cloud

Si le cloud et les hyperscalers sont prometteurs sur le plan des données et de l’analytique, le cloud ne convient pas forcément à tous les besoins.

Synthèse

La récompense : le cloud et les hyperscalers multiplient les promesses en matière de données et d’analytique — et pourtant, le cloud ne convient pas à tous les besoins.

Un large fossé. L’approche data-centric gagne de plus en plus rapidement le paysage informatique mondial. Par contraste, les entreprises traditionnelles ont été conçues autour d’unités opérationnelles et d’applications, où les données sont considérées comme un produit dérivé, et non comme une ressource de valeur.

Les entreprises traditionnelles se retrouvent ainsi dépassées dans un environnement dynamique data-centric (centré sur les données), incapables de s’adapter et d’agir sur les données à la vitesse demandée.1

Vous serez toujours en retard dans un domaine ou un autre si vous persistez à vous tenir éloigné du cloud. Les hyperscalers — Amazon, Google et Microsoft — et le secteur du capital-risque investissent massivement dans un écosystème de solutions de données et d’analytique, où le cloud est considéré comme une option de déploiement incontournable. Pour les données augmentées et le processus décisionnel, par exemple, il est impossible de suivre le rythme si vous n’êtes pas dans le cloud.

Le cloud ne répond pas à tous les besoins. Pour autant, il serait déraisonnable de voir le monde dans la seule optique du cloud. Pour des raisons de sécurité, de performance, de coût ou encore de conformité, le cloud peut s’avérer inadapté à certains systèmes et données. Lorsque le coût de la transformation est pris en compte, l’étude de cas perd de son intérêt ; de plus, la capacité de l’entreprise à migrer vers le cloud sera freinée par l’inertie organisationnelle, la disponibilité des compétences et la volonté du changement. Quelle est la valeur d’une stratégie quand elle ne peut pas être mise en œuvre ?

Déterminer la récompense : lancez-vous dans le parcours du cloud en commençant par calculer la valeur ajoutée que les solutions cloud offriront à votre entreprise.

Innovation : placer les données au cœur de votre entreprise. Une entreprise réellement guidée par les données accélère ses prises de décision, celles-ci étant basées sur des données plus nombreuses et de meilleure qualité ; toutefois, cette approche exige une transformation qui place les données au cœur de l’entreprise, afin de générer des revenus et d’autres résultats opérationnels. En injectant de l’innovation à de nombreux niveaux, le cloud peut jouer un rôle majeur dans cette transformation. Le cloud rend possible de nouveaux modèles d’affaires, comme la construction d’écosystèmes de données. Le cloud rend également possible le machine learning (ML) et l’intelligence artificielle (IA) via des modèles et des services prêts à l’emploi qui prennent en charge tout le cycle de vie ML/IA. 

Ce n’est pas tout : il peut également ouvrir le sanctuaire qu’est la science des données — auparavant la chasse gardée de spécialistes éminents et de scientifiques des données — et remettre les données et les outils dans les mains de citoyens scientifiques des données. Enfin, le cloud peut contribuer à valoriser ces mêmes données, par exemple via des jeux de données ouverts.

Agilité : l’avantage du cloud. La crise du COVID-19 a démontré toute la valeur de l’agilité. Si certaines entreprises ont pu reconfigurer leurs opérations sans difficulté, d’autres ont connu des difficultés. De la même façon, l’accélération du changement dans l’ensemble de l’économie souligne l’importance capitale de l’agilité : coûts variables ou fixes, à la demande ou à la commande, fluide ou statique, modulaire ou monolithique, approche « test-and-learn » ou « plan-and-specify ». C’est lorsque le cloud vient de lui-même qu’on parle d’agilité, car il offre l’évolutivité requise et rend possible l’expérimentation rapide. Le cloud améliore également le flux et la fluidité des données, rend les données composables sous forme de blocs favorisant l’assemblage rapide de nouvelles capacités analytiques et commerciales. Les responsables peuvent ainsi poser les questions importantes et ignorées jusqu’alors.

Gestion des donnés : intégration, automatisation et contrôle. Le cloud offre de nombreuses opportunités de transformation et d’optimisation de la gestion des données — une qualité essentielle dont dépend l’approche centrée sur les données. La gestion des données cloud facilite considérablement l’intégration des données partout dans l’entreprise et au-delà, au moyen de hubs de données et de “data meshes”. Le cloud permet également de réduire la prolifération des données engendrée par ce qu’on appelle « l’effet spaghettis  »2. De plus, avec l’automatisation, le cloud peut durcir la discipline en matière de gestion de données. Enfin, le cloud multiplie les options de stockage des données — pour un cloud optimisé en fonction du type de données et de traitement.

Coût : faites vos calculs sans attendre. Le cloud réduira le CapEx et, s’il est correctement déployé, facilitera la maîtrise des coûts. Pourtant, comme l’a souligné d’Andreesen Horowitz dans un article récent, il est peu probable que le cloud réduira les coûts totaux3, notamment si l’entreprise est arrivée à maturité. Sur site ou dans le cloud, l’intérêt économique du calcul et du stockage dépendra de vos alternatives de coût, mais aussi de votre utilisation des workloads et des données. En réalité, vous maximiserez les économies en rationalisant les applications et les données avant de migrer vers le cloud. Ne tardez pas à peser le pour et le contre, car les implications architecturales sont nombreuses. N’oubliez pas non plus d’intégrer les coûts — souvent sous-estimés — de mise en réseau, de transfert des données et de transformation.

Questions importantes : avant de décider comment et où adopter le cloud pour les données et l’analytique, posez-vous certaines questions importantes, dont les réponses serviront de garde-fous tout au long du parcours.

Stratégie : de quels résultats commerciaux et informatiques avons-nous besoin pour fournir l’analytique et les données ? Question élémentaire : comment comptez-vous rivaliser avec la concurrence et créer une valeur ajoutée avec les données et l’analytique ? Par exemple, accorderez-vous la priorité à l’analyse et l’exploration, ou à l’analytique opérationnelle ? Quels sont les plus précieux types de données ? Rares sont les entreprises qui peuvent se permettre de se focaliser uniquement sur le long terme : aussi, votre stratégie doit également consister à résoudre les problèmes au moment où ils surviennent — comme les problèmes liés aux réglementations ou aux performances que les parties prenantes signaleront.

Conformité : quelles règles les données et l’analytique doivent-elles respecter, et comment garantir la conformité ? Les programmes cloud sont trop souvent freinés par la nécessité de remplacer des règles statutaires. Aussi, une première étape essentielle consiste à identifier l’ensemble des réglementations. Si certaines entreprises sont soumises à des réglementations spécifiques relatives au cloud, les règles de gouvernance des données, comme le Règlement Général sur la Protection des Données (RGPD), s’appliquent à tous les secteurs. Les changements graduels ont pu entraîner, au fil des ans, certaines négligences de conformité, mais attention : l’approche “software-defined” du cloud vous demandera de lever toute ambiguïté. Alors que les réglementations évoluent désormais constamment, la conformité doit être rendue pérenne via une approche logicielle guidée par des règles — et non par des contrôles solidement ancrés.

Sécurité : comment sécuriser les données et les applications analytiques dans le cloud ? Si les hyperscalers proposent des infrastructures cloud d’un niveau de sécurité exceptionnel, le cloud élargit inévitablement la surface d’attaque, et c’est à vous (et pas à l’hyperscaler) de protéger les données dans le cloud. Vous souhaiterez probablement explorer de nouveaux modèles de sécurité — Confiance zéro, approche data-centric, gestion moderne des identités et des accès, notamment — pour renforcer la sécurité et réduire ces risques.

Architecture : qu’elle est l’architecture globale des données et de l’analytique dans le cloud ? Des choix s’imposent en matière d’architecture. Tout d’abord, chaque cas d’utilisation principal exige un modèle spécifique d’ingestion, de stockage et de gestion des données. Ensuite, il existe un large éventail de modèles architecturaux disponibles. Lac de données, hub d’intégration de données-data mesh ou entrepôt des données : chaque solution a ses partisans. De nouvelles initiatives naîtront certainement dans le cloud, mais la plupart des entreprises existantes disposeront encore d’applications analytiques et d’entrepôts de données inadaptés au cloud, rendant nécessaire la mise en place de solutions hybrides.

Partenaires : qui seront les partenaires stratégiques de notre parcours cloud ? Les hyperscalers ne sont pas tous égaux sur le plan des données et de l’analytique. Chacun propose des capacités spécifiques : vitesse, mise à l’échelle, mais aussi jeux de données ouverts, modèles d’intelligence artificielle (voix et texte) ou services pour le cycle de vie de développement du modèle. Des prestataires spécialisés occupent en outre des niches particulières sur le marché. Notez également que le parcours implique de nombreuses technologies innovantes, dans un contexte de rareté des compétences. Aussi, choisir le bon fournisseur de services IT est essentiel pour réduire le risque, le coût et les délais.

De la stratégie à l’action : une fois les questions clés traitées, vous pouvez passer de la stratégie à l’action.

Données. Pour déterminer où et comment les données doivent être stockées et traitées, vous devez étudier un large éventail de facteurs : besoins métier, sécurité, conformité, coût et performances techniques — des facteurs qui se contredisent souvent et exigent des compromis. Surtout, compte tenu des frais de données sortantes et de la gravité des données (force exercée par les données pour attirer d’autres données), vos décisions auront des répercussions sur le long terme. Puisque les données finiront certainement par être stockées dans plusieurs emplacements, il est vital de prévoir une couche de métadonnées commune afin d’empêcher l’apparition de nouveaux silos.

Gestion des donnés. Si le cloud vous offre l’opportunité d’améliorer la gestion des données et de l’information, votre marge de manœuvre reste étroite. Vous devrez cartographier les principaux flux de données, avec des modèles distincts définis pour chaque flux — aide à la décision opérationnelle, analytique en libre-service et data-science, par exemple. Chose intéressante, ces flux peuvent fonctionner très différemment selon qu’ils se trouvent dans le cloud ou sur site, l’approche ELT (Extraction-Chargement-Transformation) pouvant par exemple remplacer l’approche ETL (Extraction-Transformation-Chargement). De même, vous devrez définir les outils, les processus et la gouvernance que vous utiliserez pour gérer l’information tout au long du cycle de vie. Domaines clés : augmentation des données, métadonnées, traçabilité des données, catalogues de données et archivage.

Un périmètre enrichi pour les données et l’analytique. Une plateforme cloud d’entreprise dotée de composants communs — authentification unique, mise en réseau, sécurité zero-trust, surveillance, DevOps, etc. — est un préalable essentiel pour tout programme de données et d’analytique cloud. Même si sa construction prendra généralement entre trois et six mois, une telle plateforme permettra ensuite d’accélérer le rythme : chaque projet ne nécessitera aucun effort inutile et fournira une solution plus homogène. De la même façon, un périmètre enrichi pour les données et l’analytique est vital pour rassembler les outils et processus de gestion et de gouvernance de l’information (catalogage, protection, traçabilité des données, etc.). Sans un tel périmètre, vous ne pourrez ni vous normaliser, ni intégrer la conformité et la sécurité dès le stade de la conception. Vos dépenses s’envoleront, car des projets successifs se mettront à proposer leur propre vision de la circularité, pour pouvoir ensuite réinventer la roue.

Migration et transformation. Pour pouvoir construire à partir de ce premier périmètre, vous aurez besoin d’une feuille de route d’amélioration, ainsi que d’une approche robuste et reproductive en matière de migration, de transformation et d’archivage — grandement facilitée par une approche d’usine, qui réduit les coûts et applique une normalisation. Comme pour déplacer des systèmes d’exploitation, vous devez, pour chaque application ou entrepôt de données, décider si vos objectifs commerciaux sont mieux servis via un réhébergement et un replatforming, ou via des opérations plus complexes de refactoring et de re-architecting. Même lorsque l’objectif est la transformation, vous devrez décider de soit transformer et migrer, soit migrer et effectuer un refactoring/re-engineering : en effet, le cloud propose de nombreux outils qui facilitent la transformation et le nettoyage des données. Enfin, une stratégie robuste d’archivage des systèmes et des données est indispensable pour tirer pleinement parti du passage au cloud.

Objectif : faire fonctionner la structure. Le parcours cloud impose de trouver l’équilibre entre plusieurs facteurs (coût, risque, conformité, sécurité, performances techniques et résultats opérationnels) : aussi, vous avez besoin de structures organisationnelles et d’une gouvernance pour que la structure fonctionne. Au niveau opérationnel, des experts Conformité et Sécurité doivent être intégrés aux équipes afin de garantir la conformité et la sécurité dès le stade de la conception ; ces équipes doivent en outre compter des architectes pour garantir le respect des principes en matière de design et d’architecture. Au niveau supérieur, un bureau d’affaires cloud (CBO) applique des décisions intégrées lorsque les efforts individuels ne résolvent pas les problèmes où qu’une défaillance touche plusieurs équipes. Au-dessus du CBO, une équipe d’éxécutifss fait remonter les problèmes, même si la décision finale incombera à un seul dirigeant.

Conclusion : le cloud joue un rôle essentiel pour se réorienter vers les données — un atout clé dans l’entreprise du XXIe siècle.

On voit difficilement comment la plupart des entreprises ne se trouveront pas au cœur de la transformation vers les processus centrés sur les données. Évitons toutefois d’adopter une vision « romantique », qui aurait tendance à sous-évaluer la difficulté de la migration vers le cloud et à ignorer la nécessité d’une solution hybride dans les grandes entreprises aux systèmes hérités complexes. La réussite dépendra d’une pensée descendante claire, qui permettra de répondre aux questions importantes et d’élaborer une stratégie d’adoption à grande échelle. Cette approche descendante doit toutefois être tempérée par une planification et une action ascendante, car les problèmes complexes ne peuvent être résolus que par un travail minutieux et un apprentissage pratique.

Keep reading

Download the full paper

Learn more about how to transform to a data-centric enterprise through cloud. Read the full paper.

Les auteurs

About the authors

David Rimmer

David Rimmer est conseiller industriel Banque et Marchés de capitaux chez DXC Technology. Sa mission : comprendre les problèmes commerciaux des clients et développer des solutions numériques pouvant être fournies rapidement (par le biais de POC et de pilotes rapides) afin de les aider à atteindre leurs objectifs rapidement. Il a auparavant travaillé chez Hewlett Packard Enterprise Services, où il était responsable du secteur Services financiers pour les entreprises de taille intermédiaire au Royaume-Uni.

Dave Wilson

Dave Wilson est chef de la technologie de compte et chercheur chez DXC Technology, où sa mission se focalise sur l’innovation et les nouvelles activités. Dave était auparavant spécialiste en architecture d’entreprise chez Hewlett Packard Enterprise Services, chargé de structurer des solutions numériques pour les clients.

Contributeurs

James Coleman, Michael Conlin, Mamoun Hirzalla, Sebastian Kloeser, Andriy Sas et Chris Swan


Bibliographie

1Supercharging your data metabolism, recherche DXC, septembre 2021
2Chris Swan, Spaghetti and meatballs, Weblog di Chris Swan, 7 juillet 2019.  
3Sarah Wang e Martin Cosado, The cost of cloud, a trillion dollar paradox, Future from a16z, 27 mai 2021.