Github et power BI pour les équipes de Data Analyst
Jun 26, 2024Depuis environ 1 an Microsoft a lancé un nouveau format de rapport éditable en code source: le .pbip.
Grâce à cette nouveauté il est devenu possible d'utiliser des outils de versionning pour mieux maîtriser les évolutions du rapport au sein d'une équipe de développement.
Nous vous expliquons dans cet article pourquoi le versionning est important pour les data analyst, et comment le mettre en place avec github.
L'importance du versioning avec GitHub
Le versioning est un pilier fondamental de la gestion de projet IT, où les modifications itératives sont fréquentes. En effet la gestion efficace des structures de données, des scripts complexes et des modèles qui évolue constamment est essentielle pour garantir la qualité des données, la fluidité de la collaboration et l'avancement du projet.
GitHub est une plateforme de gestion des versions de code basée sur le cloud qui offre un ensemble d'outils puissants pour organiser, suivre et partager vos projets. Elle vous permet de :
- Gardez une trace de vos modifications : Chaque modification apportée à votre code est enregistrée sous la forme d'un « commit », ce qui vous permet de revenir en arrière et de récupérer des versions antérieures si nécessaire.
- Éviter les conflits de code : Lorsque plusieurs personnes travaillent sur le même projet, GitHub vous permet de fusionner les modifications en douceur, en évitant les conflits et en garantissant l'intégrité du code.
- Suivre l'évolution du projet : GitHub offre un aperçu clair de l'historique des commits, ce qui permet de suivre l'évolution du projet et de mesurer la contribution de chaque membre de l'équipe.
En intégrant GitHub dans vos flux de travail, vous gagnez en efficacité et en collaboration.
Démarrer sur GitHub : Créer un compte
Pour commencer à utiliser GitHub, il suffit de créer un compte gratuit. La procédure est simple et rapide :
Accédez à https://github.com/ et cliquez sur le bouton « Inscription ».
Remplissez le formulaire d'inscription avec vos données personnelles et une adresse électronique valide.
Choisissez un nom d'utilisateur unique et un mot de passe sécurisé.
Validez votre adresse e-mail en suivant les instructions envoyées par GitHub.
Utiliser GitHub de manière indépendante
Une fois votre compte créé, vous pouvez commencer à utiliser GitHub pour vos propres projets. Les commandes de base de Git vous permettent d'effectuer les opérations essentielles :
- git init : Initialise un nouveau repository Git local pour votre projet.
- git add : Ajoute des fichiers modifiés à l'étape intermédiaire en préparation d'un commit.
- git commit : Enregistre les modifications ajoutées avec un message descriptif.
- git branch : Crée et gère des branches de développement pour travailler sur des fonctionnalités distinctes sans affecter la branche principale.
- git checkout : Permet de passer d'une branche de développement à une autre.
- git push : Envoie vos modifications locales vers le repository GitHub distant, rendant ainsi vos modifications accessibles aux autres.
- git pull : Récupère les modifications récentes du dépôt GitHub distant pour mettre à jour votre projet local.
Cas d’usage de PowerBI et Github :
Dans cette article nous utilisons le logiciel PowerBI Desktop et Github Desktop pour installer le Git.
Associer les fichiers PBIP (Power BI Project) à GitHub, permet une gestion simplifiée de projets Power BI. Les fichiers PBIP font apparaître les éléments du projet dans une structure claire, facilitant la navigation et la compréhension. Il est ainsi possible de suivre l'historique des modifications apportées au rapports Power BI, revenir à des versions antérieures si nécessaire et garantir la reproductibilité des analyses. De plus, GitHub facilite la collaboration en équipe, permettant de fusionner les modifications sans conflits, de gérer les droits d'accès et de favoriser la communication via des discussions et des commentaires.
Commencez par enregistrer votre rapport sous format PBIP:
Ensuite créez votre repository, le répertoire du projet qui contient tous les développements qui lui sont dédiés, localement sur Github Desktop:
Ensuite, publiez le "repository" sur le cloud:
Modifiez votre rapport , et ajoutez une mesure (ici, « SumQuantity »), et enregistrez:
Retournez sur le github desktop et remarquez qu'un changement est apparu : la mesure vient d'être ajoutée au fichier .tmdl.
Pour enregistrer la nouvelle version de votre code et ainsi la stocker sur github, vous devez faire un nouveau « commit » avec un titre correspondant à la modification réalisé comme par exemple : « Ajout de la mesure SumQuantity ». Vous pouvez aussi ajouter une description à votre évolution.
Vous pouvez aussi supprimer l'intégralité de vos rapport et faire un « commit »:
Si par erreur vous souhaitez annuler les changements que vous avez effectués, vous pouvez le faire en cliquant sur "revert commit":
Gestion de l'accès aux répertoires
Filtrage des listes d'équipes :
- Dans GitHub.com, allez sur la page principale du repository.
- Sous le nom de votre répertoire, cliquez sur Paramètres.
- Dans la section "Accès" de la barre latérale, cliquez sur Collaborateurs.
- Sous "Gérer l'accès", dans le champ de recherche, commencez à taper le nom de l'équipe ou de la personne que vous souhaitez trouver. Si vous le souhaitez, utilisez les menus déroulants pour filtrer votre recherche.
Ajouter une équipe ou un employé
- Dans GitHub.com, allez sur la page principale du repository.
- Sous le nom de votre dépôt, cliquez sur Paramètres.
- Dans la section "Accès" de la barre latérale, cliquez sur Collaborateurs.
- À droite de "Gérer l'accès", cliquez sur Ajouter des personnes.
- Dans le champ de recherche, commencez à taper le nom de l'équipe ou de la personne que vous souhaitez inviter, puis cliquez sur un nom dans la liste des correspondances.
- Sous " Choisir un rôle ", sélectionnez le rôle de dépôt que vous souhaitez attribuer à l'équipe ou à la personne, puis cliquez sur Ajouter un nom au dépôt.
Supprimer l'accès d'une équipe ou d'un employé :
- Dans GitHub.com, allez sur la page principale du repository.
- Sous le nom de votre dépôt, cliquez sur Paramètres.
- Dans la section "Accès" de la barre latérale, cliquez sur Collaborateurs.
- Sous "Gérer l'accès", à côté de l'équipe ou de l'employé dont vous souhaitez supprimer l'accès, cliquez sur Supprimer.
Conclusion
La gestion en mode devops de PowerBI apporte des avantanges en terme d'efficacité grâce à une gestion intelligente des évolutions mais aussi du stockage.
D'un point de vue isolé il permet de suivre l'historique des modifications et de revenir habilement à une version précédente en cas de besoin.
Les équipes de data analyst devant intervenir sur un même rapport trouveront dans cette combinaison un environnement adequate qui les rendra plus sereins et productifs, à condition d'être rigoureux dans leur organisation et leur communication.