Les données structurées et leur traitement

  1. Vidéo d'introduction :



  2. Vocabulaire à retenir :

      • Donnée : représentation d’une information au sein d’un système informatique.

        Une donnée est une valeur décrivant un objet « réel ».

        •  Exemple : Un contact téléphonique est un objet et le numéro de téléphone de ce contact est une donnée.

      • Descripteur : mot ou un groupe de mots choisi pour caractériser les informations contenues dans un document et pour faciliter les recherches.

        Plusieurs descripteurs peuvent être utiles pour décrire un même objet.

        • Exemple : Plusieurs descripteurs permettent de caractériser un contact : nom, prénom, adresse, numéro de téléphone, ...

      • Donnée personnelle : donnée permettant d’identifier une personne physique.

      • Collection de données : ensemble d’objets qui partagent les mêmes descripteurs.

        •  Exemple : collection des contacts d’un carnet d’adresses.

          La structure de table permet de présenter une collection : les objets en ligne, les descripteurs en colonne et les données à l’intersection. Les données sont alors dites structurées.

            Descripteur 1 Descripteur 2 Descripteur 3 · · ·
          Objet 1 · · · · · · · · · · · ·
          Objet 2 · · · · · · · · · · · ·
          · · · · · · · · · · · · · · ·

    • Base de données : Une base de données regroupe plusieurs collections de données reliées entre elles.

      • Exemple : La base de données d’une bibliothèque conserve les données sur les livres, les abonnés et les emprunts effectués.

    • Métadonnées : Données permettant de décrire le contenu d'un fichier.

      • Exemples : date de création, utilisateur ayant créé le fichier, ...

    • Typage des descripteurs :

      Pour des raisons de gestion de l’espace disque et d’organisation des enregistrements, chaque descripteur est d’un type précis.

      Les types les plus fréquents sont :

      • Numérique : Entier, Réel

      • Texte (taille illimitée)

      • Chaîne de n caractères

      • Date, heure

      • Booléen (uniquement 2 valeurs possibles : vrai/oui ou faux/non)

      • Il existe aussi d’autres types comme ceux liés à la géolocalisation : coordonnées d’un point, coordonnées du contour d’une forme géographique, ....

    • Clé primaire : descripteur suffisant pour identifier un enregistrement dans le cadre d'une table.
       Toutes les structures de données n'ont pas nécessairement de clé primaire, mais quand elle est présente, elle permet d’identifier un enregistrement de manière unique. Il peut arriver qu’un seul descripteur ne soit pas suffisant pour différencier deux enregistrements.

    • Mégadonnées (bigdata) : on parle de mégadonnée quand le volume de données est tel qu’on peut faire des analyses statistiques qui permettent de prédire des informations, même si les données sont très diverses, sans information structurée, et approximatives.

    • Données ouvertes (opendata) : données numériques, d’origine publique ou privée, diffusées de manière structurée selon une méthode et une licence libre, garantissant leur libre accès et leur réutilisation par toutes et tous, sans restriction technique, juridique ou financière.

    • Licence libre : licence s’appliquant à une œuvre de l’esprit (document, logiciel, . . . ) par laquelle l’autrice ou l’auteur concède les droits que lui confère le droit d’auteur : usage de l’œuvre , étude de l’œuvre pour en comprendre le fonctionnement ou l’adapter à ses besoins, modification (amélioration, extension et transformation) ou incorporation de l’œuvre en une œuvre dérivée, redistribution de l’œuvre, c’est-à-dire sa diffusion à d’autres usagers, y compris commercialement.

    • Informatique durable (green IT) : vise à réduire l’empreinte écologique, économique et sociale des technologies de l’information et de la communication.

    • Règlement général sur la protection des données (RGPD) : renforce et unifie la protection des données pour les personnes au sein de l’Union Européenne.
      https://fr.wikipedia.org/wiki/Règlement_général_sur_la_protection_des_données

  3. Repères historiques :

    • 1930 : utilisation des cartes perforées, premier support de stockage de données.

    • 1956 : invention du disque dur permettant de stocker de plus grandes quantités de données, avec un accès de plus en plus rapide.

    • 1970 : invention du modèle relationnel (E. L. Codd) pour la structuration et l’indexation des bases de données.

    • 1979 : création du premier tableur, VisiCalc.

    • 2009 : Open Government Initiative du président Obama.

    • 2013 : charte du G8 pour l’ouverture des données publiques.

       

  4. Trois graphiques importants :

    • Internet/Les technologies de demain (Tome 1) Jean-Michel Cornu


    • Etude IDC Novembre2018



    • Le futur du stockage en informatique (http://www.emsi-histoireinformatique.fr/le-stockage-en-informatique/)



  5. Liens

  6. Fichiers liés

Menu Sciences Numériques et Technologie

 


Imprimer