‹ Retour au blogue

Communauté de pratique numérique | Exploiter les données issues d’une plateforme de billetterie avec Google Data Studio

Comme nous l’avons expliqué dans le premier texte de cette série, les données historiques de ventes (ou de visites, pour les événements gratuits) d’un diffuseur de spectacles sont précieuses. 

L’équipe du Carrefour international de théâtre le sait et a déployé, de façon itérative, différents outils pour exploiter ces données. Nous vous présentons ici le résultat de leur plus récente itération, réalisée avec l’accompagnement de la Communauté de pratique numérique du Conseil de la culture des régions de Québec et de Chaudière-Appalaches (CPN). Ce nouvel outil de tableau de bord s’appuie sur la solution Google Data Studio.

Point de départ

Les données d’usage du Carrefour ont historiquement été exportées depuis l’outil de billetterie (il y a eu plusieurs outils différents utilisés au cours des dernières années, pour des raisons que nous n’aborderons pas ici). Un membre de l’équipe avait développé un processus d’extraction, de stockage, de traitement et de consultation des données avec l’outil RapidMiner

La solution présentait différents problèmes :

  • à cause de la complexité technique du processus et des outils, l’équipe commerciale n’était pas suffisamment autonome pour interroger les données
    • l’interrogation des données reposait donc sur les compétences d’une seule personne (qui ne fait d’ailleurs pas partie de l’équipe commerciale) ;
  • la difficulté de croiser des données de différentes sources (à titre d’exemple, les recoupements entre les donateurs et les acheteurs de billets, ou l’impact de campagnes de promotion sur les achats à travers le système de billetterie) ;
  • les tableaux de bord disponibles n’étaient pas présentés visuellement, de façon à permettre une interprétation rapide ;
  • l’outil n’était pas disponible en ligne, et donc son utilisation limitée à certains postes de travail (moyennant des frais de licence de l’application RapidMiner).

C’est pour trouver des solutions à ces problèmes que l’équipe du Carrefour a contacté la CPN.

État des lieux

Pour appuyer la recherche de solutions, l’équipe de la CPN a d’abord dressé un état des lieux portant sur les données disponibles, les systèmes utilisés, et les besoins. Ce bilan, réalisé suite à des entrevues avec les membres de l’équipe du Carrefour, a permis de rédiger un document de définition de projet, qui couchait par écrit :

  • les enjeux et les problèmes du système actuel (évoqués précédemment)
  • les types de données (clients, spectacles, donateurs…)
  • l’inventaire des systèmes qui génèrent ou accumulent des données (billetterie, site web, fichiers Excel…)
  • les besoins qui devaient être comblés (visualiser l’évolution de certains indicateurs, générer des listes…)

C’est évidemment le dernier item, qui porte sur les besoins à combler, qui revêt le plus d’intérêt pour le développement d’une nouvelle solution.

Analyse, conception et prototypage

À partir de l’état des lieux, il a été possible de commencer à réfléchir aux solutions à mettre en place. Le conseiller de la CPN a fait des recherches, et a travaillé à définir encore plus clairement, avec l’équipe du Carrefour, le genre de visualisations recherchées. 

Pour garder les choses simples et faire des itérations rapides sur ce qu’il fallait développer, l’équipe est partie de concepts faits sur papier, en partie à main levée. Ensuite, les premiers tests avec la solution qui semblait le mieux répondre au besoin, Google Data Studio, ont été réalisés avec un petit nombre de données fictives, générées aléatoirement dans Google Sheets.

Une fois que l’équipe est arrivée à la conclusion que l’approche pouvait fonctionner (on avait une « preuve du concept »), le conseiller de la CPN a préparé une première version de l’outil s’appuyant sur les vraies données historiques du Carrefour. C’est évidemment là que ça se complique : bien que les données fussent relativement « propres », il était quand même nécessaire d’effectuer certaines opérations de « nettoyage ». À titre d’exemple, il peut s’agir de standardiser les codes postaux. Tout le « nettoyage » a pu être réalisé avec des formules dans Google Sheets. Ainsi, même lorsqu’on doit remplacer un jeu de données, aucun travail manuel n’est nécessaire pour le nettoyage : les formules prédéfinies font le travail.

Finalement, c’est l’équipe du Carrefour qui a développé les tableaux de bord finaux, avec la méthodologie suggérée par la CPN.

Le résultat

Le résultat final, pour les usagers du Carrefour, et une suite de tableaux de bord qui permettent de visualiser les données de ventes extraites de la plateforme de billetterie.

Les images suivantes montrent certains de ces tableaux de bord (certaines données ont été volontairement masquées; le tableau de bord affiche évidemment des montants ou des noms précis) :

Une page du tableau de bord permet de consulter les données de ventes, en unités, en valeur, et une répartition selon le mode de paiement, le spectacle, le lieu de vente, etc. Les outils en haut de l’écran servent à filtrer les données analysées. Par exemple, ici on analyse un seul spectacle (pour les plus observateurs, ça explique pourquoi le diagramme circulaire du centre contient une seule donnée qui représente 100 %).

Une autre page est dédiée à la clientèle. Encore une fois, des filtres par spectacle, codes de tarif ou lieux de vente sont disponibles. Le tableau de bord permet de visualiser le nombre de billets achetés, l’origine des acheteurs, etc.

La provenance des acheteurs peut être visualisée autrement, sur une carte, dans cette autre page. La carte est interactive, il est possible de faire un « zoom » pour explorer de façon plus précise les données d’une ville ou d’un quartier.

La solution s’appuie sur un processus qui implique des étapes manuelles et des étapes automatisées :

Résumé d’un processus ETL très simple. Les données sont extraites de la plateforme de billetterie au format CSV. La transformation (nettoyage et certaines manipulations) est effectuée dans Google Sheets. Enfin, les données sont chargées dans Google Data Studio.

Apprentissages et autres notes

Comme mentionné précédemment, c’est évidemment au moment d’intégrer les « vraies » données que les choses sont devenues un peu plus complexes. L’équipe du Carrefour s’y attendait parce qu’elle avait déjà tenté d’exploiter ces données, et connaissait les éléments à nettoyer. Un des apprentissages issus de ce projet est clairement de ne pas sous-estimer la difficulté associée à la (non) qualité des données.

L’autre élément notable est que Google Data Studio est un outil puissant, mais tout de même complexe. Il demande donc un certain apprentissage, et n’est pas nécessairement à la portée de tous. Une fois les tableaux de bord créés, la consultation est simple. Mais la création des tableaux de bord elle-même est relativement compliquée. À moins d’avoir la chance, comme le Carrefour international de théâtre, de disposer d’un geek ou d’une geekette en interne, il pourrait être utile de se faire accompagner pour cette étape.

Enfin, notons que ce genre de solution a l’inconvénient d’avoir une « espérance de vie » limitée. En effet, si la plateforme dont sont issues les données modifie ses formats d’exportation, la chaîne doit être revue. De plus, dès que le diffuseur change de système de billetterie, la solution doit également être adaptée… à moins de sélectionner une plateforme de billetterie qui offre des outils d’analyse de données qui rendent les tableaux de bord externes moins essentiels! C’est d’ailleurs ce que l’équipe du Carrefour a choisi de faire tout récemment.

Comment en savoir plus?

Au cours des prochaines semaines, nous publierons un autre texte portant sur les données de billetterie. Cette fois, nous explorerons la démarche du Théâtre du Trident, qui a pris une approche différente pour combler des besoins similaires à ceux du Carrefour. Assurez-vous d’être abonnés à l’infolettre de la CPN ou membres du groupe Facebook pour être informés de la publication du texte.

De plus, n’hésitez pas à prendre rendez-vous à la Clinique de la CPN si vous souhaitez discuter du sujet avec nous!

Crédits

Les icônes utilisées dans les schémas sont tirées de The Noun Project : Software de Adrien Coquet, CSV de StoneHub, spreadsheet de Erickson Duverge et dashboard de Rafael Garcia Motta.

Les tableaux de bord sont la création du Carrefour international de théâtre et sont reproduits (avec des données anonymisées) avec autorisation.


La communauté de pratique regroupait des membres de CCNCA autour de projets numériques favorisant le développement des compétences dans les domaines de la découvrabilité et la commercialisation des œuvres, dans l’objectif de répondre à ces enjeux.  Articulée autour d’activités d’apprentissage, de cliniques et de laboratoire, la communauté a permis à ses membres de mutualiser les expérimentations, les apprentissages et leurs coûts. La communauté à conclus ses activités au début de l’année 2023. Cet article constitue une archive.

Vous pourriez vous intéresser à ceci :