Flux de données Power BI

article dataflow power bi power bi service Sep 30, 2024

Les flux de données Power BI sont un élément clé de l'écosystème Power BI qui simplifie la préparation des données et permet une plus grande évolutivité que les ensembles de données ordinaires. Il existe de nombreuses façons de les utiliser, et avec les bonnes connaissances, vous pouvez les configurer rapidement et mieux contrôler votre pipeline de données. Dans cet article de blog, nous explorerons ce que sont les flux de données Power BI et fournirons un guide complet sur la façon de les utiliser efficacement. 

Définition les flux de données Power BI

Les flux de données Power BI agissent comme une couche de préparation des données en libre-service au sein de Power BI. Ils permettent aux utilisateurs d'ingérer, de transformer et de charger des données provenant de diverses sources, en fournissant une base structurée et propre pour la création de rapports et de tableaux de bord pertinents. Ils peuvent être considérés comme des ensembles de données centralisés, car ils comportent un grand nombre d'options et d'interfaces identiques à celles des ensembles de données.  

Flux de données et ensembles de données

Dans la plupart des cas, un jeu de données peut faire tout ce qu'un flux de données peut faire, alors pourquoi ne pas utiliser les jeux de données ? Les flux de données nous permettent de stocker des transformations dans les données en amont. Cela signifie que nous pouvons attacher toute logique supplémentaire à cette source unique que d'autres ensembles de données utiliseront au lieu d'avoir à copier cette logique dans plusieurs ensembles de données.  

Cette centralisation signifie qu'au lieu que nos rapports touchent une source plusieurs fois et la rafraîchissent, nous n'utilisons qu'un seul fil Thread dans notre flux de données. Cela simplifie également la création de nouveaux rapports qui doivent être tirés d'une source principale au sein d'une organisation.  

Lors de la création d'un nouveau rapport, nous n'avons qu'à extraire les tables nécessaires auxquelles nous avons déjà appliqué nos étapes. Cela supprime une grande partie des frais généraux liés à la mise en ordre des ensembles de données ainsi qu'aux données.  

Pour commencer
Accéder aux flux de données Power BI :

Pour commencer à utiliser les flux de données, naviguez vers le service Power BI. 

Ouvrez l'espace de travail Power BI dans lequel vous souhaitez créer le flux de données. 

Sélectionnez la nouvelle liste déroulante et les nouveaux flux de données

Création d'un flux de données vierge :

La partie suivante du processus est déterminée par la manière dont vous souhaitez configurer le flux de données. Dans le cas présent, nous partons de zéro, mais les flux de données permettent de se connecter à partir d'autres espaces de travail ou d'importer des flux de données antérieurs. 

Sélectionnez « Définir de nouvelles tables » 

Configuration de la source de données :

Les flux de données offrent les mêmes types de connexion que les ensembles de données, de sorte que toute source de données existante peut être facilement connectée de la même manière. 

S'il existe une passerelle de connexion, celle-ci sera automatiquement indiquée dans le champ « Connexion » si la configuration est correcte. 

Transformer les données :

Les flux de données permettent d'effectuer les mêmes transformations d'interrogation que celles qui peuvent être faites dans un ensemble de données, de sorte qu'il est très facile de transférer les connaissances vers cet outil. 

 

Une fois qu'une table provenant d'une source a été ajoutée à la requête Power, d'autres sources ou tables peuvent également être ajoutées selon une méthode similaire à celle des ensembles de données, en obtenant des données, en les dupliquant ou en les saisissant. 

Une fois que toutes les étapes ont été appliquées et que les tableaux ont été remplis, nous pouvons continuer en cliquant sur « Enregistrer et fermer » au bas de la page. 

Flux de données créé :

Maintenant que les transformations ont été effectuées, nous disposons de quelques options pour l'utilisation du flux de données. 

Rafraîchissement incrémentiel - Cette option peut être mise en œuvre pour ne rafraîchir que les nouvelles données au cours de la période spécifiée. Cette option est utile si les données historiques n'ont pas beaucoup changé et permet de réduire les temps de rafraîchissement et l'utilisation. 

Rafraîchissement programmé - Comme pour les ensembles de données, il est possible de configurer des heures fixes pour le rafraîchissement du flux de données. Étant donné que les ensembles de données seront tirés de cette source, il est recommandé de déclencher les temps d'actualisation avant les ensembles de données afin que les données les plus récentes les alimentent. 

Configuration facile

Une excellente fonctionnalité de Power BI est la possibilité de copier facilement une table transformée d'un jeu de données Power BI dans un flux de données.  

Comme les flux de données utilisent le même Power Query que les ensembles de données, nous pouvons copier et coller des tableaux à partir de fichiers de rapport ouverts dans l'éditeur Power Query vers les flux de données. Toutes les étapes appliquées à la table seront automatiquement reprises et si elle est connectée à la source précédente, vous verrez toutes les mêmes données. 

Cette fonctionnalité permet de mettre en place très facilement des flux de données basés sur des ensembles de données précédemment construits et de commencer à les utiliser. Cette méthode peut également être utilisée entre les flux de données ou, bien sûr, les ensembles de données. 

Limites des flux de données

Dataflow présente quelques limitations mineures, dont la plupart ne poseront pas de problème aux utilisateurs qui travaillent fréquemment avec des ensembles de données. Le seul véritable inconvénient qui pourrait empêcher plusieurs utilisateurs de l’espace de travail est la visibilité limitée de la propriété. Seul le propriétaire du flux de données peut voir directement les tables et les options qui lui sont associées, et si vous ne possédez pas directement le flux de données, il est difficile d'en comprendre le contenu.  

Même avec toutes les autorisations accordées, la vue du flux de données est très limitée, même par rapport aux ensembles de données/rapports dans l'espace de travail. À moins de transférer la propriété, la seule véritable solution pour afficher l’éditeur de requête consiste à exporter la source de données. 

Conclusion

Les flux de données de Power BI se sont imposés comme la pierre angulaire du parcours de préparation des données, offrant aux organisations une approche évolutive, efficace et collaborative de la gestion des données. En adoptant la puissance des Dataflows, les organisations peuvent mieux contrôler leurs données tout en facilitant plus que jamais leur utilisation. 

Ne ratez pas nos prochains contenus

Inscrivez vous à notre Newsletter pour recevoir tous nos prochains contenus gratuits : Articles, Webinaires, Podcasts, Astuces vidéos,...

Data AI Lab

Transformez votre quotidien avec des compétences clés en data. Des formations, conseils et défis pour une maîtrise pointue en Data Science et IA.

 

Liens

Accueil
Challenges Data
Consulting

 

Formations

Parcours Data Analyst
Parcours Data Engineer
Voir toutes les formations

 

Ressources

Articles
Webinaires
Tuto vidéos

 

All rights reserved 2024 - Mentions légales - Politique de confidentialité