Big Data : état de l’art

Big Data : état de l'art

Informations sur la formation

Détail de la formation

Objectifs de la formation

  • Comprendre les traitements du Big Data, depuis l'acquisition jusqu'à l'output
  • Appréhender les relations entre Cloud et Big Data
  • Comprendre la classification, la sécurité et la confidentialité des données
  • Connaitre l'Open Data
  • Découvrir le Matériel pour les architectures de stockage
  • Décortiquer les méthodes de traitement et champs d'application

Prochaines sessions


Public cible

  • DSI
  • Membres de DSI
  • Direction études
  • Directeurs, managers, chefs de projets,
  • Consultants, chargés d’études

Programme

Introduction

  • Les origines du Big Data.
  • Une définition par les quatre V.
  • La provenance des données.
  • Le Big Data vu par l'industrie informatique.
  • Une rupture : changements de quantité, de qualité, d'habitudes.
  • La valeur de la donnée: un changement d'importance.
  • La donnée en tant que matière première.
  • Conservation à l'infini.

Big Data : traitements, depuis l'acquisition jusqu'au résultat

  • L'enchaînement des opérations.
  • Les anciennes données
  • La qualité des données
  • Un ou plusieurs gisements de données ?
  • La connaissance de la question.

Relations entre Cloud et Big Data

  • Motivations des Clouds publics et privés.
  • Les services XaaS.
  • Les objectifs et avantages des architectures Clouds.
  • les infrastructures.
  • Les égalités et les différences entre Clouds et Big Data.
  • Les Clouds de stockage.

Classification, sécurité et confidentialité des données

  • La structure comme critère de classification : non structurées, structurées, semi structurées.
  • Selon le cycle de vie : temporaires, permanentes, archives actives.
  • Difficultés supplémentaires liées aux augmentations de volumétries.
  • Les solutions potentielles.

Introduction à l'Open Data

  • La philosophie des données ouvertes et les objectifs.
  • La libération des données publiques.
  • Les difficultés de la mise en œuvre.
  • Les bénéfices escomptés.

Matériel pour les architectures de stockage

  • Les serveurs, disques, réseau et l'usage des disques SSD.
  • Les architectures Clouds et les architectures plus traditionnelles.
  • Les avantages et les difficultés.
  • Le TCO. La consommation électrique : serveurs (IPNM), disques (MAID). Les disques denses.
  • Le stockage objet. Les principes et les mécanismes des objets.
  • Le stockage objet par rapport aux stockages traditionnels NAS et SAN.

Architecture logicielle

  • Niveaux d'implantation de la gestion du stockage.
  • Le « Software Defined Storage ».
  • Architecture centralisée (Hadoop File System).
  • L'architecture Peer-to-Peer et l'architecture mixte.
  • Les interfaces et connecteurs : S3, CDMI, FUSE etc.
  • Avenir des autres stockages (NAS, SAN) par rapport au stockage objet.

Protection des données

  • La conservation dans le temps face aux accroissements de volumétrie.
  • La sauvegarde, en ligne ou locale ?
  • L'archive traditionnelle et archive active.
  • Les liens avec la gestion de hiérarchie de stockage : avenir des bandes magnétiques.
  • La réplication multisites.
  • La dégradation des supports de stockage.

Méthodes de traitement et champs d'application

  • Hadoop : Map Reduce.
  • L'écosystème Hadoop.
  • L'Openstack (Ceph).
  • Le Complex Event Processing.
  • Le décisionnel et le transactionnel renouvelés : les bases de données NoSQL.
  • Accéder aux données par les métadonnées. Quelles métadonnées ?
  • Bénéfices : navigation, recherche des données, nouveaux types de données, fédération des entrepôts de données existants.

Cas d'usage et conclusion

  • L'anticipation, la sécurité et les recommandations.
  • Analyses marketing et analyses d'impact.
  • Distribution de la donnée.
  • PRA. Recours aux Clouds publics
  • Quel avenir pour les données ?
  • Gouvernance du stockage dans l'entreprise ?

0%

 

This course does not have any sections.

Plus de formations de cet éditeur