LOGICIELS & TECHNOLOGIES GÉOMARKETING
geocodage pour geomarketing

Géocodage pour le géomarketing : localiser magasins, agences et clients

Le présent article vise à donner quelques éléments importants à connaître pour optimiser son géocodage. Localiser une adresse semble être d’une grande simplicité. Or, les différentes contraintes techniques rendent les projets de géocodage un peu plus complexes que prévu initialement. Voici quelques retours d’expérience pour bien débuter.

Géocodage : définition et intérêt

Le géocodage est une des premières étapes d’une analyse géomarketing efficace. Ce géocodage consiste à géolocaliser et à visualiser son activité sur une zone géographique donnée. Ce résultat est possible par l’enrichissement d’une base de données, en y ajoutant des adresses (latitude et longitude).
Le géocodage de ses magasins, de ses agences, de ses clients ou de encore de ses prospects, donne une lecture de sa couverture géographique. La pratique du géocodage permet d’en apprendre beaucoup sur :

  • le maillage du réseau de vente
  • la portée de son attractivité, pour les clients sur le territoire
  • la pénétration locale de la vente par internet

Ces informations feront éclore les zones à développer ou les zones saturées.
L’intérêt du géocodage (et de la géolocalisation) dépasse la simple représentation géographique. Il en découle bien plus d’indicateurs intéressants :

  • le taux de pénétration
  • la couverture par typologie de quartier
  • l’influence du temps d’accès sur la fréquentation
  • la typologie d’implantation

 

La précision du géocodage : une nécessité indiscutable

Un prestataire de géocodage sérieux doit être en mesure de vous fournir ces éléments :

  • Des statistiques sur le niveau de géocodage obtenu
  • La liste des adresses trouvées comparée à celles de votre fichier
  • Les coordonnées géographiques latitude/longitude – « XY »

Il existe différents niveaux de géocodage qui sont généralement les suivants :

  • L’adresse au numéro exact
  • L’adresse au numéro connu le plus proche
  • Le milieu de la rue
  • La commune
  • Le code postal
  • Le pays

 

Le numéro exact : une précaution importante pour le géocodage

Dans le géocodage, l’adresse retranscrite n’est pas toujours la véritable adresse géographique. On positionne souvent un numéro 8 au milieu d’une rue commençant au 2 et se terminant au 14. C’est “l’interpolation”. Cependant, l’implantation des numéros dans une rue est souvent irrégulière. Des adresses géocodées peuvent ainsi apparaître sur les bâtiments d’à côté. Les adresses en bis/ter seront traitées comme numéro entier (le 2bis devient le 2).

Exemple de répartition des numéros de bâtiments dans une rue.

geocodage géomarketing

 

En somme, 3 éléments vont déterminer la qualité de votre géocodage :

  • La qualité des adresses de votre fichier
  • La qualité du référentiel cartographique
  • La qualité des algorithmes de rapprochement

Nous détaillons ces points ci-dessous :

> Qualité des adresses du fichier d’entrée, dans le géocodage

La disponibilité des informations, leur qualité et la façon dont elles sont structurées, vont déterminer la qualité du fichier.


Les données manquantes

Les données manquantes ou incomplètes sont un classique des projets marketing/géomarketing. C’est encore plus vrai dans les cas d’une base de données de clients ou de points de vente. Plusieurs facteurs peuvent expliquer cela :

L’indisponibilité de l’adresse 
Par exemple, lors des enquêtes sorties caisse où la précision géographique se limite au code postal

Le numéro de rue
Il n’est pas demandé pour préserver l’anonymat. Les sondés en face-à-face sont plus enclins à donner le nom de leur rue seul, pour éviter d’être re-sollicités.

L’adresse est absente
Car elle a été jugée superflue pour retrouver la localisation. “IKEA Nantes” peut sembler suffisant à retrouver une adresse. Or, cela est effectivement vrai pour le facteur, mais l’est moins pour le géocodeur (bien que cela soit en train de changer cf. plus bas).

Les adresses d’usage

Les adresses d’usage seront comprises par votre facteur, mais pas par un géocodeur. Un logiciel de géocodage ne saura pas interpréter ces adresses. Ce dernier a besoin de précision, et ne sait gérer les approximations.
Par exemple, « Centre commercial Auchan » n’est pas une adresse valide.

Exemple typique d’adresses d’usage :géocodage géomarketing adresses usage

Une donnée d’adresse mal structurée

La structuration de la donnée d’adresse est primordiale car elle a un impact direct sur l’efficacité des algorithmes de rapprochement entre adresses et coordonnées géographiques.
Des adresses bien structurées, donneront un géocodage efficace.

Adresse de faible qualité due à la structuration :géocodage géomarketing structuration adresses

Structuration simple et efficace :géocodage géomarketing structuration adresses

 

La structuration postale

Pour normaliser vos adresses, la structuration postale est une excellente pratique. Cependant, les référentiels d’adresses géographiques ne sont pas définis par la Poste, mais par les producteurs de cartes, comme l’IGN, et son référentiel adresses.

Le Service national de l’adresse recommande la structuration suivante :

  • Ligne 1 : Raison ou dénomination sociale
  • Ligne 2 : Identité du destinataire ou du service
  • Ligne 3 : Complément de localisation de la construction – Zone industrielle, Bâtiment, Immeuble…
  • Ligne 4 : N° et libellé de la voie – Rue, Avenue, Boulevard, Hameau…
  • Ligne 5 : Service de distribution – Mention spéciale (BP, Lieu-dit, TSA…)
  • Ligne 6 : Code postal (ou Cedex) et Localité (ou Libellé Cedex)

Attention cependant, le rôle du géocodage n’est pas de normaliser l’adresse, dans ses caractéristiques postales. Certaines sociétés peuvent malgré tout le proposer. Cela permet notamment de corriger les adresses.

 

> Qualité du référentiel cartographique

Le référentiel des routes

Le référentiel des routes est stratégique car c’est lui qui permet de localiser un emplacement, un nom de voie plus précisément.
Or, et comme vous pouvez le constater sur vos GPS, la mise à jour des bases cartographiques des routes demande du temps. Les constructions de nouvelles routes, et le renommage d’autres, se font souvent désirer. Sans parler des voies privées ou celles qui sont difficiles d’accès. La règle générale est de prioriser la couverture de population, avant la couverture géographique… Bref, les bases cartographiques routières ne sont jamais complètement fiables.

Ensuite, il faut noter qu’un nombre important d’erreurs provient du fait qu’une voie peut porter 2 noms, notamment dans les grandes villes. Par exemple, une nationale ou une départementale peut devenir un boulevard ou une avenue… La D4 devient l’avenue du Général de Gaulle. Ce qui est gênant quand votre fichier retient l’avenue du Général de Gaulle et que votre référentiel ne connaît que la D4.

A noter que le fichier des noms de voies et de lieux dits est gratuit et disponible sur le site des collectivités locales.

Les référentiels de communes

Chaque année de nombreuses communes s’unissent et d’autres se séparent. Ainsi, il devient complexe de localiser avec précision une route, dans la bonne commune. La propagation de ces mises à jour nécessite un certain temps. Un exemple souvent repris est celui de la commune de Lomme, qui a fusionné avec Lille, il y a de nombreuses années. Certains géocodeurs ne parviennent plus à la placer, car pour eux, elle n’existe plus.

Pour en savoir plus sur les fusions/séparations de communes le fichier officiel des communes est le C.O.G.

Les référentiels des numéros de rues

Comme cela est expliqué plus haut, bien souvent, les numéros dans les rues sont estimés par interpolation. Cependant, ce n’est pas toujours le cas ! Et notamment dans les bases dérivées du cadastre, comme les 26 millions d’adresses de l’IGN (point adresse et bd adresse) ou encore la récente initiative BANO et son géocodeur sur 15 millions d’adresses. A noter que la base BANO est téléchargeable gratuitement sous licence ODBL.

Les Points d’intérêt (POI)

Vous l’aurez compris, les géocodeurs ont tendance à préférer les adresses de type postal. Cependant, en géomarketing, c’est davantage la localisation d’une personne, d’un bâtiment ou d’un magasin qui est pertinente. C’est ce qui a poussé des acteurs comme Google ou Here à intégrer des points d’intérêt dans leurs bases d’adresse. Ainsi, un magasin ou un arrêt de bus peut devenir une adresse à part entière.

 

> Qualité des algorithmes de rapprochement de géocodage

N’hésitez pas à tester les solutions de géocodage. Pour cela, créez un jeu d’adresses, en faisant varier les éléments suivants : avec/sans numéro, avec/sans code postal, avec uniquement le numéro de département, avec des fautes d’orthographe, en mettant la ville en premier … Vous serez surpris des résultats. En effet, chaque géocodeur a ses petits défauts.

 

Géocoder coûte que coûte… Attention danger !

La qualité d’un logiciel de géocodage se juge à son taux de géocodage, soit le nombre d’adresses localisées, comparées aux nombres d’adresses d’un fichier.
Ainsi, ces géocodeurs sont poussés à donner un maximum de résultats, à géolocaliser à tout prix. Parfois au détriment de la qualité. Forcer la substitution d’adresses mène souvent à du grand n’importe quoi. Les logiciels de géocodage géolocalisent souvent mes adresses à l’autre bout de la France ! Donc attention à bien vérifier vos résultats et à effectuer un post-traitement, pour obtenir de taux de géocodage fiable.
Pour réduire l’impact de ces géolocalisations approximatives, certains géocodeurs proposent une note de qualité, en entrée, en sortie, ou les deux. Ils proposent également de forcer les codes postaux, ou le département. Si malgré tous vos efforts l’adresse n’est pas trouvée, il ne reste plus qu’à l’ajouter à la main.

Pour tester les géocodeurs on-line, essayez des adresses et des fautes d’orthographes sur geocheck.

Traitement statistique des erreurs

Les erreurs sont plus lourdes à traiter sur un fichier de 3 millions de porteurs de cartes de fidélité, que sur un fichier de quelques adresses. C’est pourquoi, on ne les traite pas de la même façon. Sur de petits volumes, il est possible de rectifier directement sur la carte.
Chez Parabellum et Mygeomarket, nous préférons maximiser la qualité à chaque étape de géocodage : en corrigeant les adresses, les fautes d’orthographe, en excluant les adresses géocodées avec peu de qualité, et en croisant les résultats de différents géocodeurs. Nous préférons un bon géocodage à la commune qu’un mauvais à l’adresse.

Précision du geocodage

Certains géocodeurs « professionnels » proposent des options intéressantes comme le décalage des adresses trouvées de quelques mètres. Cette transformation permet notamment de faire des comptages au quartier, tout en limitant les erreurs topologigues, si les limites ne passent pas exactement au milieu d’une voie.

 

Services et outils de géocodage

Ca y est ? Vous êtes prêts à géocoder ? Mygeomarket, à travers Parabellum, propose des services de géocodage pour les gros volumes et pour l’international. Pour des volumes d’adresses plus limités, des solutions gratuites existent, comme le géocodeur de la base nationale. Ces outils sont gratuits, simples, utiles et de bonne qualité. Pour des besoins de production, nous pouvons vous recommander différents outils, n’hésitez pas à nous contacter pour en parler.
Pour les plus technophiles, il existe quantité d’algorithmes et autres supports plus ou moins performants : Nous aimons bien nominatim pour OSM.

présentation offre de données mygeomarket