Les modalités de gestion des données sont l’un des principaux défis auxquels chaque société est confrontée à l’heure actuelle. Les organisations font face à des quantités toujours plus grandes de données mais aussi à un éventail grandissant de types de données provenant de sources multiples grâce à des innovations telles que les capteurs de l’Internet des objets (IoT).
En même temps, on souhaite de plus en plus que ces données brutes soient transformées en quelque chose d’utile, en temps réel ou presque. Tout cela augmente la pression sur les systèmes dont vous avez besoin pour recueillir, conserver et traiter les données.
Quand il s'agit de gérer cette manne de données, les deux options principales sont la solution d'un entrepôt de données ou celle d’un lac de données. Le premier est un concept qui existe depuis de nombreuses années et que les responsables informatiques devraient donc tous connaître, alors que le lac de données est un terme relativement nouveau qui est apparu avec l’ère du big data.
Certaines personnes penseront qu’un lac de données est simplement la modernisation de l’entrepôt de données, et les deux termes sont parfois utilisés de manière interchangeable pour désigner un dépôt centralisé des données d’une entreprise. Mais il existe quelques différences importantes entre les deux. Il est donc crucial de comprendre ces différences et leurs conséquences pour la gestion des données quand vous décidez laquelle de ces technologies conviendra le mieux à votre entreprise.
Données brutes ou traitées
L’une des grandes différences entre un entrepôt de données et un lac de données est le type d'informations qu’ils contiennent. Pour l’essentiel, un lac de données est un système dans lequel une entreprise peut déposer tous les types de données, y compris les données brutes et non structurées depuis toutes les sources auxquelles l’organisation a accès. Un entrepôt de données, en revanche, gère des données prétraitées et structurées qui ont été nettoyées et transformées en un format prêt à être analysé.
Cela veut-il dire que l’entrepôt de données est l’option à privilégier pour les analyses ? Pas nécessairement, car cela dépend du type de données que votre entreprise génère, et de ce que vous souhaitez en faire. Par exemple, les sociétés de services financiers trouveront un entrepôt de données extrêmement utile, car une grande partie des informations qu’elles conservent sont déjà très structurées et faciles à gérer.
Certains secteurs, en revanche, gèrent des données bien moins structurées. Les soins de santé, par exemple, possèdent beaucoup d'informations cliniques, de notes sur les patients et d'images médicales qui devront être analysées. Mais vu la grande variété des types et sources concernés, et l’absence de structures claires, les entrepôts ne sont pas la manière la plus efficace de gérer les données pour ces organisations.
Avez-vous des projets bien définis pour vos données ?
Comme les entrepôts de données offrent un environnement plus structuré, ces solutions conviennent beaucoup mieux aux entreprises qui ont une idée très claire de ce qu’elles veulent faire de leurs données et des types de résultats attendus.
En général, les données conservées dans un entrepôt de données sont plus faciles à étudier et à exploiter que celles d’un lac de données moins structuré. En plus, comme les données auront déjà été traitées avant d’être transférées dans l’entrepôt, il est probable qu’elles auront été utilisées dans un but spécifique et seront donc plus pertinentes que les données brutes.
Un lac de données ne possède pas cette structure mais il peut offrir plus d'agilité qu'un entrepôt. Le fait de pouvoir travailler directement avec les données brutes permet aux utilisateurs d’essayer de nouvelles techniques, de reconfigurer leurs modèles et leurs interrogations afin de répondre à un large éventail de questions, et de faire preuve de plus d'innovation dans leur manière de gérer les données. Donc, si vous n’avez pas déjà une idée bien définie de l’utilisation que vous ferez de vos données, un lac de données est une solution idéale pour expérimenter.
Qui entre en interaction avec les données ?
Depuis quelques années on constate un intérêt croissant pour l'idée comme quoi les données devraient être utiles pour tous, et pas seulement réservées aux experts en informatique. Mais si vous encouragez les unités commerciales et les professionnels opérationnels à interagir directement avec vos données, une solution d’entreposage sera sans doute préférable.
En effet, le format plus structuré des données permettra aux personnes n’ayant pas de connaissances et d’expérience poussées de la programmation d'interagir plus facilement avec le système et d’en retirer des informations utiles. Les lacs de données, en revanche, sont plus difficiles à naviguer et exigent des compétences plus spécialisées pour les exploiter au maximum. Ils peuvent apporter des réponses à un plus grand nombre de questions qu’un entrepôt de données, mais leur exploitation devra être réservée à des experts en science des données.
Accédez aux dernières connaissances commerciales en informatique
Avoir accès
Commentaires
Rejoindre la conversation…