La densification de la population et du trafic nécessite une meilleure planification des flux de mobilité. Il existe beaucoup de données relatives à la mobilité et certaines sont même en accès libre comme celles de l’Office fédéral de la statistique. Pourtant, un accès aux données n’est pas suffisant, car il faut pouvoir les faire parler en les valorisant. Contrairement à d’autres domaines de la durabilité, il existe énormément de parties prenantes dans la mobilité qui sont impactées à chaque instant par les actions des utilisateur-trices du réseau. Il est également difficile d’infléchir le comportement des personnes privées, car cela relève de la liberté de déplacement qui est perçue comme une liberté essentielle. Ainsi, les changements de politique publique provoquent des réactions parfois violentes (pensons aux Gilets jaunes en France en 2018 ou aux achats paniques des Anglais en 2021 lorsque la pénurie d’essence guettait).
L'importance de la science des données
Si un véhicule privé est effectivement synonyme de liberté, il est aussi indispensable aux personnes vivant dans des régions périphériques. Les choix politiques sont donc délicats dans ce domaine, car chaque acteur-trice défend une logique qui lui est propre (financière, d’optimisation ou électorale). Ainsi, pour prendre les décisions qui sauront répondre aux attentes de la population et mettre en place des politiques publiques efficaces et durables, il est important de pouvoir se baser sur la science des données.
L'apprentissage distribué
Certains projets de recherche portent sur la conception de modèles d’apprentissage distribué sans serveur dans des scénarios dynamiques ou gossip learning. Mais en quoi cela consiste exactement ? Dans un modèle classique d’apprentissage automatique, des ordinateurs transmettent des données à un serveur central qui les analyse pour prédire quelque chose, telle que la détection d’une maladie. Mais dans le gossip learning, il n’y a pas de serveur ni d’entité centrale. Les données restent là où elles ont été générées. Chaque ordinateur entraîne son modèle local et le partage avec d'autres ordinateurs, préservant ainsi la confidentialité des utilisateur-trices.
Meilleures performances et une confidentialité améliorée
Les avantages d’un tel système sont nombreux : le système est évolutif, puisqu’il est possible d’ajouter de nouveaux nœuds (ou ordinateurs) au réseau. Le système tolère mieux les pannes et fait preuve de robustesse, car si un nœud tombe en panne, les autres ordinateurs prennent le relais. La performance est accrue et les calculs se font plus rapidement, car l’utilisation des ressources est distribuée et optimisée. Le coût du système est moindre, puisqu’il n’y a pas besoin d’un serveur puissant pour centraliser les données, mais de plusieurs petits nœuds. Finalement, en évitant un ordinateur central de traitement des données, la confidentialité se trouve améliorée, car les données sensibles des utilisateur-trices ne sont pas partagées.
Pourquoi appeler cela du gossip learning ?
Tout simplement parce que les informations se distribuent à travers le réseau à l’image de la propagation des potins ou des commérages à travers un groupe de personnes. Chaque nœud du réseau met à jour ses paramètres de modèle en échangeant avec d’autres nœuds du réseau pour converger à un consensus. L’apprentissage distribué est évolutif, décentralisé et permet de réduire le volume de communications. Par exemple, cela est très intéressant pour analyser un grand volume de données afin d’améliorer les flux de données des systèmes énergétiques ou pour simuler des concepts mécaniques ou physiques complexes afin d’améliorer virtuellement des produits ou des appareils. Ces projets peuvent être dédiés à des cas pratiques d’usage dans les domaines de la mobilité. Il est, en effet, possible d’utiliser le gossip learning pour effectuer des prédictions concernant le trafic routier, pour prévenir les accidents éventuels des véhicules autonomes, ou d’étudier le comportement des piétons pour mieux organiser l’environnement urbain.