Les différents types de données
La nature des données que vous allez manipuler est extrêmement variée. Il est donc important de les identifier afin de choisir la bonne approche de stockage ou de traitement de l'information.
Données structurées
Les données structurées sont stockées dans un format bien défini. Elles respectent un schéma et sont organisées en colonnes. Elles sont idéales pour les requêtes SQL car on accède facilement à une information particulière.
Exemples :
- Fichiers CSV
- Fichiers Excel
- Bases de données relationnelles (MySQL, PostgreSQL, SQL Server, ...)
Données semi-structurées
Les données semi-structurées ne sont pas stockées dans un format relationnel, mais elles contiennent des marqueurs qui permettent de les organiser et de les hiérarchiser. Elles sont moins rigides que les données structurées, mais plus faciles à analyser que les données non structurées.
Exemples :
- Fichiers JSON
- Fichiers XML
- Fichiers YAML
Données non structurées
Les données non structurées ne suivent pas un format précis et ne peuvent pas être organisées facilement. Elles nécessitent des outils spécifiques pour être analysées et exploitées.
Exemples :
- Fichiers texte
- Images
- Vidéos
- Fichiers audio
Le problème des formats propriétaires
Certains formats de données sont dits " propriétaires ", car ils sont spécifiques à un logiciel ou à une entreprise. Ils peuvent être difficiles à lire ou à convertir avec d'autres outils, ce qui peut poser des problèmes d'interopérabilité et de pérennité des données. Il est donc préférable d'utiliser des formats ouverts et standardisés autant que possible.
`Les différents types de données
La nature des données que vous allez manipuler est extrêmement variée. Il est donc important de les identifier afin de choisir la bonne approche de stockage ou de traitement de l'information.
Données structurées
Les données structurées sont stockées dans un format bien défini. Elles respectent un schéma et sont organisées en colonnes. Elles sont idéales pour les requêtes SQL car on accède facilement à une information particulière.
Exemples :
- Fichiers CSV
- Fichiers Excel
- Bases de données relationnelles (MySQL, PostgreSQL, SQL Server, ...)
Données semi-structurées
Les données semi-structurées ne sont pas stockées dans un format relationnel, mais elles contiennent des marqueurs qui permettent de les organiser et de les hiérarchiser. Elles sont moins rigides que les données structurées, mais plus faciles à analyser que les données non structurées.
Exemples :
- Fichiers JSON
- Fichiers XML
- Fichiers YAML
Données non structurées
Les données non structurées ne suivent pas un format précis et ne peuvent pas être organisées facilement. Elles nécessitent des outils spécifiques pour être analysées et exploitées.
Exemples :
- Fichiers texte
- Images
- Vidéos
- Fichiers audio
Le problème des formats propriétaires
Certains formats de données sont dits " propriétaires ", car ils sont spécifiques à un logiciel ou à une entreprise. Ils peuvent être difficiles à lire ou à convertir avec d'autres outils, ce qui peut poser des problèmes d'interopérabilité et de pérennité des données. Il est donc préférable d'utiliser des formats ouverts et standardisés autant que possible.
`
