Blogue : Données d'enrichissement disponibles à faible coût

Date de publication : 2018-01-08

Données du recensement et données d'enrichissement


Les données du dernier recensement sont maintenant disponibles et pour les entreprises, elles constituent une source intéressante d'enrichissement de leurs données de la clientèle...

Il va sans dire que pour une entreprise et en particulier pour un commerce de détail, il est essentiel de profiler sa base de clients. L'analyse des profils d'achats (l'historique transactionnel et interactions aux points de contact en magasin et sur le WEB) lorsqu'on peut l'enrichir au préalable à faible coût, on augmente le nombre de dimensions et la richesse de l'analyse résultante.

Les données sociodémographiques des Canadiens sont disponibles pour différentes unités géographiques et l'aire de diffusion constitue une unité d’appariement intéressante. En moyenne, une aire de diffusion regroupe de 400 à 600 individus. On fait le lien avec cette unité géographique soit en utilisant l'adresse complète ou seulement le code postal du lieu résidence de ses clients ou prospects.


Faites-vous partie du 1 %


Je vous propose un petit jeu amical où j’ai saisi et codé les coordonnées de différents types de commerces et de lieux publics de ma zone commerciale à l'étude et j’ai calculé la distance qui les sépare des codes postaux résidentiels…

En d’autres mots, par traitements de données, j’ai développé une matrice qui donne pour chaque code postal la distance minimale qui sépare différents types de commerces ou lieux du domaine public des lieux de résidence. En fait, dans la pratique, je préfère toujours utiliser l'adresse complète qui s'avère beaucoup plus précise pour l'appariement des données par aire de diffusion.

Histogramme revenus

J’utilise le revenu après impôt des ménages privés comme variable dépendante du modèle. Plus précisément j’ai codé pour chaque code postal de la région à l'étude (située sur l'île de Montréal), la donnée du revenu après impôt des ménages en deux classes distinctes : a) les codes postaux associés au 5% des revenus les plus élevés et b) les codes postaux où l’on retrouve les autres revenus moyens inférieurs 95%

Aux fins de cet exercice, je nomme mes deux modalités de revenues : les 1% (le groupe des plus fortunés) versus les autres… 99%…

Afin d’identifier quelles variables s’avèrent les plus discriminantes quant à votre appartenance ou non au groupe des 1%, j’utilise un arbre de décision, CHAID modifié.

La cellule supérieure regroupe l’ensemble de l’échantillon, soit les codes postaux distincts de la zone commerciale retenue. En fait, nous sommes généreux en utilisant le top 5% des codes postaux avec la tranche de revenus les plus élevés pour désigner nos fameux 1%.


Arbre de décision des variables discriminantes selon l’appartenance ou non aux 1%

Arbre de décision

La première variable discriminante permettant de scinder l’échantillon s’avère la proximité d’une épicerie. On observe dans ma zone à l'étude que si vous habitez à plus d’un tiers de kilomètre (0,39 km) d’une épicerie vous avez plus de chance de faire partie des fameux 1%, passant d’une proportion de 5% à 15% ; de plus, si vous habitez à moins de 2,24 kilomètres d’un musée public, vos chances augmentent encore avec une proportion succès de 33%, finalement, si vous combinez cela avec une proximité de moins de 3,16 kilomètres à un parc public, la proportion de succès atteint 47%.


Distance au dépanneur et statut social... le Postal Code Envie

Fascinant de voir comment la distance moyenne entre codes postaux des épiceries, musées et parc public aux lieux de résidence constitue des points repèrent cohérents de la distribution de la richesse dans notre société…

Cela dit, je repense quelquefois à mon vieux dépanneur de quartier où jadis j'étais un Montréalais, un vrai 514… Tout cela avant de devenir un autre banlieusard… Il était fort sympathique ce vieux dépanneur et je m’ennuie de ces petites marches avec mon chien où j’allais le retrouver pour parler de la pluie et de beau temps. Aujourd'hui, je dois prendre l'auto pour aller chercher une pinte de lait!

En conclusion, les entreprises et en particulier les entreprises de commerce de détail ont avantage à tirer profil des données d'enrichissement de la qualité de celle du recensement canadien. Les données d'enrichissement sont multiples et souvent accessibles à un coût raisonnable. Dans un environnement commercial en fortes mutation et forte concurrence, on n'a pas le choix, on doit tout mettre en oeuvre pour mieux connaître et comprendre notre clientèle et leurs besoins.

Une version antérieure de ce texte a été publiée sur le blogue : Le marketing analytique par Guy Mercier WordPress