Spatialekonometri
Ekonometri används inom regionalvetenskap, liksom inom ekonomi och andra samhällsvetenskaper, för att ge empiriskt innehåll åt teorin och för att testa hypoteser som härleds från teorin. För att ta ett enkelt exempel förutspår många lokaliseringsmodeller att handeln mellan platser minskar med hänsyn till avståndet mellan dessa platser. Ekonometri kan användas för att testa om handeln verkligen minskar med avståndet (dvs. testa en hypotes som härrör från teorin) och, om så är fallet, för att ge en uppskattning av i vilken grad handeln minskar när avståndet ökar (dvs. för att ge teorin ett empiriskt innehåll). Även om allmänna ekonometriska metoder har tillämpats i stor utsträckning inom regionalvetenskapen, är den särskilt förknippad med utvecklingen och tillämpningen av rumslig ekonometri. Rumslig ekonometri har sitt ursprung i början av 1970-talet när man försökte börja hantera de metodologiska frågor som uppstår i multiregionala modeller när det finns någon form av statistiskt beroende mellan resultaten i olika regioner. Naturligtvis oroar sig även aspatial ekonometri för sådana frågor, men det som skiljer spatial ekonometri åt är dess intresse för rumsligt beroende. Det vill säga att det geografiska utrymmet, i vid bemärkelse, bidrar till att forma arten av ett eventuellt beroende. Rumslig ekonometri handlar också om rumslig struktur eller heterogenitet. Återigen är det som skiljer spatial ekonometri från aspatial ekonometri att man vill förstå och ta hänsyn till heterogenitetens roll i det geografiska rummet.
Det finns tre huvudskäl till att ta hänsyn till rumsliga effekter, inklusive rumsligt beroende och heterogenitet. För det första bygger giltigheten hos ett antal vanligt förekommande ekonometriska tekniker på underliggande antaganden som kommer att brytas i närvaro av dessa rumsliga effekter. Det är därför viktigt att korrigera för dessa rumsliga effekter om man ska kunna dra giltiga slutsatser om hur de aktuella sambanden ser ut. Denna syn på rumsliga effekter som en olägenhet har varit en viktig fråga i litteraturen om rumslig ekonometri. För det andra kan en korrekt modellering av rumsliga effekter hjälpa till att extrahera information från data och förbättra förutsägelserna av rumsligt bestämda variabler, även i situationer där vi inte förstår varför sådana rumsliga effekter uppstår. Denna syn på rumsliga effekter som en informationskälla har länge varit en viktig fråga inom den rumsliga statistiklitteraturen och har varit av stort intresse inom vissa områden av den fysiska geografin (t.ex. kriging). I motsats till denna syn på olägenhet och information är det tredje skälet till att beakta rumsliga effekter att ”utrymmet har betydelse”. Det vill säga, man vill utveckla tekniker som gör det möjligt att förklara hur utrymmet påverkar det aktuella förhållandet. Även om dessa tre kontrasterande synsätt uppenbarligen inte utesluter varandra, och behovet av att balansera forskningsinsatser för att ta itu med dem, utgör en källa till ständiga spänningar när det gäller rumslig ekonometriens förhållande både till regionalvetenskap och till det bredare samhällsvetenskapliga samfundet.
Det första intresset för rumslig ekonometri kom från forskare som var intresserade av multiregionala modeller. Det är uppenbart att utrymmet spelar roll här, men detta återspeglades inte nödvändigtvis i den tidiga utvecklingen som fokuserade på att upptäcka och korrigera för kvarvarande rumslig autokorrelation eller på att förbättra förutsägelserna i närvaro av sådan autokorrelation. För att ta ett stiliserat exempel kan man tänka sig en forskare som är intresserad av om brottsligheten i ett område bestäms av socioekonomiska egenskaper hos de individer som bor i området. Efter att ha samlat in lämpliga uppgifter om grannskapet gör forskaren en linjär regression av brottsligheten på utvalda egenskaper i grannskapet. Med hjälp av den uppskattade modellen kan forskaren förutsäga brottsligheten i grannskapet på grundval av de tillgängliga socioekonomiska uppgifterna. Dessa förutspådda brottsfrekvenser kan jämföras med de faktiska och en oförklarad ”residual” beräknas som skillnaden mellan de två. Dessa rester bör vara slumpmässiga och således inte uppvisa något systematiskt mönster. En möjlig avvikelse från slumpmässighet, och en nyckelfråga av intresse för rumslig ekonometri, gäller det rumsliga mönstret för dessa residualer. När restvärdet för ett visst bostadsområde visas på en karta bör det till exempel inte ha något samband med restvärdet för andra närliggande bostadsområden. Om däremot positiva residualer i ett kvarter tenderar att vara förknippade med positiva residualer i närliggande kvarter (och på samma sätt för negativa), uppvisar residualerna rumslig autokorrelation. I bästa fall har detta konsekvenser för den statistiska betydelsen av forskarens resultat; i värsta fall innebär det att styrkan eller till och med riktningen på de uppskattade sambanden kan vara fel. Om man dessutom är intresserad av att förutsäga brottsfrekvensen i sig, kan användningen av information om arten av denna rumsliga autokorrelation bidra till att förbättra dessa förutsägelser, även om vi inte förstår de socioekonomiska processer som faktiskt driver denna autokorrelation.
Det är uppenbart att det skulle vara användbart om dessa typer av fel kunde upptäckas, och litteraturen om rumslig ekonometri (ofta med hjälp av insikter från rumslig statistik) har utvecklat tester för att göra just detta. De två vanligaste är Morans I och Gearys C, även om andra mått finns tillgängliga. Om rumslig autokorrelation upptäcks bör regressionsmodellen naturligtvis omdefinieras. Exakt hur den ska ändras beror dock på källan till den rumsliga autokorrelationen. Det finns tre möjligheter, som bäst illustreras genom att fortsätta använda exemplet med förhållandet mellan brottslighet i grannskapet och socioekonomiska egenskaper. Den första möjligheten är att brottsligheten i ett område ökar och att detta i sin tur direkt ökar brottsligheten i närliggande områden. Till exempel uppmuntrar en ökning av brottsligheten i ett grannskap till att man uppmuntrar till kopiering av brottslighet i närliggande grannskap. Detta kan fångas upp i regressionsmodellen genom att inkludera information om brottsligheten i närliggande bostadsområden. Den andra möjligheten är att de socioekonomiska egenskaperna i ett grannskap förändras på ett sätt som ökar brottsligheten i det grannskapet och som också direkt ökar brottsligheten i närliggande grannskap. Till exempel ökar antalet ungdomar i ett kvarter och de begår brott både i det kvarteret och i närliggande kvarter. Detta kan fångas upp i regressionsmodellen genom att inkludera information om de socioekonomiska egenskaperna i närliggande bostadsområden. Den tredje möjligheten är att oväntat hög brottslighet i ett område tenderar att vara förknippad med oväntat hög brottslighet i närliggande områden, men att denna effekt inte fungerar direkt (genom t.ex. copycat-brottslighet) eller indirekt (genom socioekonomiska egenskaper). Detta händer när det finns faktorer som orsakar brottslighet som inte observeras (åtminstone inte av forskaren) och som är korrelerade mellan olika stadsdelar. Detta kan fångas upp genom att anta att det finns rumslig autokorrelation mellan kvarterens residualer. Det vill säga, en lösning på problemet med rumslig autokorrelation av residualerna är specifikt att tillåta rumslig autokorrelation av residualerna i en reviderad specifikation! Detta känns något cirkulärt och är, när det gäller att förstå de underliggande socioekonomiska processerna, endast lämpligt om man kan utesluta de två andra mekanismerna genom vilka rumslig autokorrelation uppstår.
Denna diskussion kan mycket väl ge intryck av att det är svårt att skilja mellan dessa tre olika möjligheter. Den mer formella behandling som finns tillgänglig i standardtexter om spatial ekonometri bekräftar att detta verkligen är fallet. Det skulle vara rättvist att säga att dessa identifieringsproblem har fått liten uppmärksamhet i den spatiala ekonometriska litteraturen. Uppmärksamheten har i stället varit inriktad på specifikation och estimering av linjära rumsliga regressionsmodeller (inklusive debatter kring fastställandet av lämpliga ”rumsliga viktmatriser”) och de formella egenskaperna hos de resulterande estimatorerna och tillhörande teststatistik. Man har också strävat efter att utvidga det rumsliga tillvägagångssättet till att omfatta paneldata och skattning av diskreta val. Denna betoning och ett växande intresse för rumsligt beroende har i allt högre grad fört in den rumsliga ekonometrin i den vanliga ekonometriska litteraturen.
Och även om det är beundransvärt har dessa framsteg när det gäller att hantera rummet som en olägenhet och som en källa till information för förutsägelser inte motsvarats av jämförbara framsteg i den tillämpade rumsliga ekonometriska litteraturen när det gäller att öka vår förståelse för situationer där rummet har betydelse. Det finns två huvudproblem här. För det första fokuserar alltför många artiklar om tillämpad rumslig ekonometri på genomförandet av rumslig ekonometri, vilket leder till att alldeles för lite uppmärksamhet ägnas åt att konstruera analyser som är informativa om teorin. Den spirande ”industrin” för tillväxtkonvergens är ett bra exempel på detta. När uppmärksamheten riktas mer direkt mot teorin är problemet att de föreslagna testerna av många teoretiska påståenden om rumsligt beteende inte korrekt identifierar den exakta mekanism genom vilken det ömsesidiga beroendet uppstår. Naturligtvis är denna typ av identifiering extremt svår i en rumslig miljö. I exemplet med brottslighet ovan är det nästan omöjligt att avgöra om det rumsliga ömsesidiga beroendet i brottsligheten fungerar genom en direkt eller indirekt mekanism. För att skilja dessa två mekanismer åt skulle man behöva ett sätt att exogent förändra brottsligheten i ett område och se vilken effekt detta hade på närliggande områden. I verkligheten är det enda sättet att göra detta genom att ändra de socioekonomiska egenskaperna i ett bostadsområde, men då kommer båda mekanismerna att fungera och det finns inget sätt att skilja dem åt. I vissa situationer kan det vara möjligt att direkt ändra den beroende variabeln, men även då måste alla förändringar vara oberoende av förändringar i de andra förklarande variablerna. När man t.ex. överväger skattekonkurrens mellan olika jurisdiktioner kan det vara möjligt att identifiera interaktionen mellan skattesatser, förutsatt att förändringarna inte återspeglar andra förändringar i grannskapet. Större uppmärksamhet på att få fram tydliga förutsägelser från teorin och det därmed sammanhängande sökandet efter identifiering bör vara centralt i tillämpningen av rumslig ekonometri av regionala forskare som försöker testa rumsliga teorier. Detta är inte fallet, och som en följd av detta ignoreras en stor del av den tillämpade rumsliga ekonometrin av den vanliga ekonometriska litteraturen, samtidigt som den rumsliga ekonometriska teorin håller på att integreras i den vanliga ekonomin. Många regionalforskare har naturligtvis inte som mål att bli accepterade av de vanliga ekonomerna. Men den avgörande frågan här är orsaken till detta avvisande, inte avvisandet i sig självt. En liknande historia, som också handlar om kopplingen mellan teori och empiri, utspelar sig när det gäller modeller för regional påverkan, som utgör en annan uppsättning viktiga metodologiska verktyg inom regionalvetenskapen.