Econométrie spatiale
L’économétrie est utilisée en science régionale, comme en économie et dans d’autres sciences sociales, pour donner un contenu empirique à la théorie et pour tester les hypothèses dérivées de cette théorie. Pour prendre un exemple simple, de nombreux modèles de localisation prédisent que le commerce entre les lieux est décroissant par rapport à la distance entre ces lieux. L’économétrie peut être utilisée pour vérifier si le commerce diminue effectivement avec la distance (c’est-à-dire pour tester une hypothèse dérivée de la théorie) et, dans l’affirmative, pour fournir une estimation du degré de diminution du commerce lorsque la distance augmente (c’est-à-dire pour donner un contenu empirique à la théorie). Si les méthodes économétriques générales ont été largement appliquées à la science régionale, celle-ci est particulièrement associée au développement et à l’application de l’économétrie spatiale. L’économétrie spatiale trouve ses origines au début des années 1970, lorsque des tentatives ont été faites pour commencer à traiter les questions méthodologiques qui se posent dans les modèles multirégionaux lorsqu’il existe une certaine forme de dépendance statistique entre les résultats dans différentes régions. Bien sûr, l’économétrie aspatiale se préoccupe également de ces questions, mais ce qui distingue l’économétrie spatiale, c’est sa préoccupation pour la dépendance spatiale. En d’autres termes, la notion d’espace géographique, au sens large, contribue à façonner la nature de toute dépendance. L’économétrie spatiale s’intéresse également à la structure spatiale ou à l’hétérogénéité. Encore une fois, la caractéristique qui distingue l’économétrie spatiale de l’économétrie aspatiale est le souci de comprendre et de prendre en compte le rôle de l’hétérogénéité dans l’espace géographique.
Il y a trois raisons principales de prendre en compte les effets spatiaux, y compris la dépendance spatiale et l’hétérogénéité. Premièrement, la validité d’un certain nombre de techniques économétriques couramment utilisées repose sur des hypothèses sous-jacentes qui seront violées en présence de ces effets spatiaux. Il est donc important de corriger ces effets spatiaux si l’on veut parvenir à des conclusions valables sur la nature des relations d’intérêt. Ce point de vue de l’espace comme nuisance des effets spatiaux a été une préoccupation majeure de la littérature sur l’économétrie spatiale. Deuxièmement, une modélisation correcte des effets spatiaux peut aider à extraire des informations des données et à améliorer les prédictions des variables déterminées dans l’espace, même dans les situations où nous ne comprenons pas pourquoi ces effets spatiaux se produisent. Ce point de vue des effets spatiaux, selon lequel » l’espace est une source d’information « , est depuis longtemps une préoccupation de la littérature sur les statistiques spatiales et a suscité un intérêt considérable dans certains domaines de la géographie physique (par exemple, le krigeage). Contrairement à ces points de vue de la nuisance et de l’information, la troisième raison de considérer les effets spatiaux est que « l’espace compte ». En d’autres termes, l’intérêt est de développer des techniques qui permettent d’expliquer comment l’espace affecte la relation d’intérêt. Bien que ces préoccupations ne soient clairement pas mutuellement exclusives, ces trois points de vue contrastés, et la nécessité d’équilibrer les efforts de recherche pour y répondre, représentent une source de tension permanente en termes de relation de l’économétrie spatiale à la fois avec la science régionale et avec la communauté plus large des sciences sociales.
L’intérêt initial pour l’économétrie spatiale est venu de chercheurs intéressés par les modèles multirégionaux. L’espace a clairement une importance ici, mais cela ne s’est pas nécessairement reflété dans les premiers développements qui se sont concentrés sur la détection et la correction de l’autocorrélation spatiale résiduelle ou sur l’amélioration des prédictions en présence d’une telle autocorrélation. Pour prendre un exemple stylisé, imaginons un chercheur souhaitant savoir si le taux de criminalité dans un quartier est déterminé par les caractéristiques socio-économiques des individus vivant dans ce quartier. Après avoir recueilli les données appropriées sur le quartier, le chercheur effectue une régression linéaire du taux de criminalité sur certaines caractéristiques du quartier. En utilisant le modèle estimé, le chercheur est en mesure de prédire le taux de criminalité d’un quartier sur la base des données socio-économiques disponibles. Ces taux de criminalité prédits peuvent être comparés aux taux réels et un « résidu » inexpliqué est calculé comme étant la différence entre les deux. Ces résidus devraient être aléatoires, c’est-à-dire ne présenter aucune tendance systématique. Un écart possible par rapport au caractère aléatoire, et une question clé de l’économétrie spatiale, concerne la configuration spatiale de ces résidus. Par exemple, lorsqu’il est reporté sur une carte, le résidu d’un quartier donné ne devrait pas être lié à ceux des autres quartiers voisins. Si, au contraire, des résidus positifs dans un quartier ont tendance à être associés à des résidus positifs dans les quartiers voisins (et de même pour les résidus négatifs), alors les résidus présentent une autocorrélation spatiale. Au mieux, cela a des implications sur la signification statistique des résultats du chercheur ; au pire, cela signifie que la force ou même la direction des relations estimées peuvent être erronées. En outre, si l’intérêt est de prédire les taux de criminalité en soi, alors l’utilisation de l’information sur la nature de cette autocorrélation spatiale peut aider à améliorer ces prédictions, même si nous ne comprenons pas les processus socio-économiques qui entraînent réellement cette autocorrélation.
Il serait clairement utile que ces types d’erreurs puissent être détectés et la littérature sur l’économétrie spatiale (utilisant souvent les idées des statistiques spatiales) a développé des tests pour le faire. Les deux plus courants sont le I de Moran et le C de Geary, bien que d’autres mesures soient disponibles. Il est clair que si une autocorrélation spatiale est détectée, le modèle de régression doit être respécifié. La manière exacte dont il doit être respécifié dépend toutefois de la source de l’autocorrélation spatiale. Il existe trois possibilités, que l’on peut illustrer en continuant à utiliser l’exemple de la relation entre la criminalité dans un quartier et les caractéristiques socio-économiques. La première possibilité est que le taux de criminalité d’un quartier augmente, ce qui, à son tour, augmente directement le taux de criminalité des quartiers voisins. Par exemple, une augmentation des crimes dans un quartier encourage les crimes copiés dans les quartiers voisins. Ce phénomène peut être pris en compte dans le modèle de régression par l’inclusion d’informations sur les taux de criminalité dans les quartiers voisins. La deuxième possibilité est que les caractéristiques socio-économiques d’un quartier changent d’une manière qui augmente la criminalité dans ce quartier et augmente aussi directement la criminalité dans les quartiers voisins. Par exemple, le nombre de jeunes dans un quartier augmente et ils commettent des délits à la fois dans ce quartier et dans les quartiers voisins. Ce phénomène peut être pris en compte dans le modèle de régression par l’inclusion d’informations sur les caractéristiques socio-économiques des quartiers voisins. La troisième possibilité est que des taux de criminalité élevés et inattendus dans un quartier tendent à être associés à des taux de criminalité élevés et inattendus dans les quartiers voisins, mais que cet effet ne fonctionne pas directement (par le biais, par exemple, de la criminalité copieuse) ou indirectement (par le biais des caractéristiques socio-économiques). Cela se produit lorsqu’il existe des facteurs à l’origine de la criminalité qui ne sont pas observés (du moins par le chercheur) et qui sont corrélés entre les quartiers. On peut en tenir compte en supposant qu’il existe une autocorrélation spatiale entre les résidus des quartiers. En d’autres termes, une solution au problème de l’autocorrélation spatiale des résidus consiste spécifiquement à prendre en compte l’autocorrélation spatiale des résidus dans une spécification révisée ! Cela semble quelque peu circulaire et, en termes de compréhension des processus socio-économiques sous-jacents, n’est approprié que si l’on peut exclure les deux autres mécanismes par lesquels l’autocorrélation spatiale apparaît.
Cette discussion peut bien donner l’impression qu’il est difficile de distinguer entre ces trois différentes possibilités. Le traitement plus formel disponible dans les textes standards d’économétrie spatiale confirme que c’est effectivement le cas. Il serait juste de dire que ces problèmes d’identification ont reçu peu d’attention dans la littérature sur l’économétrie spatiale. L’attention s’est plutôt concentrée sur la spécification et l’estimation des modèles de régression spatiale linéaire (y compris les débats autour de la détermination des » matrices de poids spatial » appropriées) et sur les propriétés formelles des estimateurs qui en résultent et des statistiques de test associées. Des efforts ont également été déployés pour étendre l’approche spatiale aux données de panel et à l’estimation de choix discrets. De plus en plus, cet accent et un intérêt croissant pour la dépendance spatiale ont fait entrer l’économétrie spatiale dans la littérature économétrique courante.
Bien qu’admirables, ces progrès dans le traitement de l’espace en tant que nuisance et en tant que source d’information pour la prédiction n’ont cependant pas été égalés par des avancées comparables dans la littérature économétrique spatiale appliquée pour accroître notre compréhension des situations dans lesquelles l’espace compte. Deux problèmes principaux se posent ici. Tout d’abord, un trop grand nombre d’articles sur l’économétrie spatiale appliquée se concentrent sur la mise en œuvre de l’économétrie spatiale, ce qui fait que l’on accorde bien trop peu d’attention à l’élaboration d’analyses qui renseignent sur la théorie. Le « secteur » florissant de la convergence de la croissance en est un bon exemple. Lorsque l’attention se porte plus directement sur la théorie, le problème est que les tests proposés pour de nombreuses propositions théoriques concernant le comportement spatial n’identifient pas correctement le mécanisme précis par lequel l’interdépendance se produit. Bien entendu, dans le cadre spatial, ce type d’identification est extrêmement difficile. Dans l’exemple de la criminalité ci-dessus, il est presque impossible de déterminer si l’interdépendance spatiale des taux de criminalité fonctionne par le biais du mécanisme direct ou indirect. Pour séparer ces deux mécanismes, il faudrait pouvoir modifier de manière exogène les taux de criminalité dans un quartier et voir quel effet cela a sur les quartiers voisins. En réalité, le seul moyen d’y parvenir serait de modifier les caractéristiques socio-économiques d’un quartier, mais les deux mécanismes seraient alors à l’œuvre et il n’y aurait aucun moyen de les séparer. Dans certaines situations, il peut être possible de modifier directement la variable dépendante, mais même dans ce cas, tout changement doit être indépendant des modifications des autres variables explicatives. Par exemple, lorsqu’on examine la concurrence fiscale entre les juridictions, il peut être possible d’identifier l’interaction entre les taux d’imposition, à condition que les changements ne reflètent pas d’autres changements dans les quartiers. Une plus grande attention à l’obtention de prédictions claires à partir de la théorie et la recherche d’identification associée devraient être au cœur de l’application de l’économétrie spatiale par les scientifiques régionaux qui tentent de tester les théories spatiales. Ce n’est pas le cas, et par conséquent, alors que la théorie de l’économétrie spatiale est en train de s’intégrer dans la littérature économétrique dominante, une grande partie de l’économétrie spatiale appliquée est ignorée par le courant économique dominant. Bien sûr, l’acceptation par le courant économique dominant n’est pas l’objectif de nombreux scientifiques régionaux. Mais la question cruciale ici est la raison de ce rejet et non le rejet en soi. Une histoire similaire, impliquant également le lien entre la théorie et l’empirique, se déroule en ce qui concerne les modèles d’impact régional, qui représentent un autre ensemble d’outils méthodologiques clés dans la science régionale.