Hyperlokale Umweltdaten mit einer mobilen Plattform in städtischen Umgebungen

Scientific Data Band 10, Artikelnummer: 524 (2023) Diesen Artikel zitieren

77 Zugriffe

Details zu den Metriken

Umweltdaten mit einer hohen räumlich-zeitlichen Auflösung sind von entscheidender Bedeutung für die Information über Maßnahmen zur Bewältigung städtischer Nachhaltigkeitsherausforderungen. Der Zugang zu hyperlokalen Umweltdatenquellen ist jedoch aufgrund fehlender Überwachungsinfrastruktur, konsistenter Datenqualität und Datenverfügbarkeit für die Öffentlichkeit begrenzt. Dieses Papier berichtet über Umweltdaten (PM, NO2, Temperatur und relative Luftfeuchtigkeit), die von 2020 bis 2022 gesammelt und in vier Einsätzen in drei globalen Städten kalibriert wurden. Jede Datenerfassungskampagne zielte auf ein bestimmtes städtisches Umweltproblem im Zusammenhang mit der Luftqualität ab, wie z. B. Baumvielfalt, Unterschiede in der Exposition der Bevölkerung und übermäßiger Verbrauch fossiler Brennstoffe. Zunächst stellen wir das Design der mobilen Plattform und seinen Einsatz in Boston (USA), NYC (USA) und Beirut (Libanon) vor. Zweitens stellen wir den Datenbereinigungs- und Validierungsprozess für die Luftqualitätsdaten vor. Abschließend erläutern wir das Datenformat und wie hyperlokale Umweltdatensätze eigenständig und mit anderen Daten verwendet werden können, um eine evidenzbasierte Entscheidungsfindung zu unterstützen. Unsere mobilen Umweltsensordatensätze umfassen Städte unterschiedlicher Größe und zielen darauf ab, der Datenknappheit in Entwicklungsregionen entgegenzuwirken und eine evidenzbasierte Umweltpolitik zu unterstützen.

Messungen)

Feinstaub, gasförmige Schadstoffe

Technologietyp(en)

Kostengünstige Umgebungssensorplattform (City Scanner)

Probeneigenschaft – Umgebung

Stadt

Probenmerkmal – Standort

Global

Die rasante Urbanisierung stellt Planer, Ingenieure, Wissenschaftler und Bürger im Zeitalter des Klimawandels vor neue Nachhaltigkeitsherausforderungen. Hyperlokale Umweltdaten sind für Wissenschaftler und Praktiker wünschenswert, um Expositions-Hotspots zu identifizieren, die räumliche Verteilung der städtischen Luftverschmutzung zu verstehen und eine evidenzbasierte Eindämmung des Klimawandels zu unterstützen. Dennoch bleibt die hyperlokale Datenerfassung sowohl in Industrie- als auch in Entwicklungsregionen eine Herausforderung. Unter allen städtischen Umweltdaten gehören Luftverschmutzungsdaten aufgrund ihrer hohen räumlichen und zeitlichen Variabilität zu den am schwierigsten zu überwachenden Daten. In Städten gibt es vielfältige Emissionsquellen für die Luftverschmutzung und die Emissionsverteilung ist sehr volatil1. In den letzten Jahren spielt die mobile Überwachung eine immer wichtigere Rolle als Ergänzung zu traditionellen Überwachungsmethoden wie der stationären Überwachung und der Satellitenfernerkundung2,3,4. Es bietet eine hoch skalierbare Alternative für den Betrieb in verschiedenen städtischen Umgebungen und gleichzeitig die Generierung hochauflösender Daten.

Mobile Luftqualitätsmesstechniken sind in einer schnell wachsenden Literaturmenge dokumentiert. Zu den bemerkenswertesten gehört eine Reihe von Studien, die in Zusammenarbeit mit Google Street View-Autos in Houston, der San Francisco Bay Area, Amsterdam, Kopenhagen und London durchgeführt wurden (https://www.google.com/earth/outreach/special-projects /Luftqualität). In Städten wurden Referenz- und Forschungsluftmessgeräte mitgeführt, die in Zeiträumen von Monaten bis Jahren wiederholt die meisten Straßenabschnitte vermessen. Ihre Rohdaten wurden teilweise über eine Online-Datenbank und API eines Drittanbieters veröffentlicht (https://explore.openaq.org). Während die räumliche und zeitliche Abdeckung umfangreich war, konzentrierten sich die Luftüberwachungskampagnen von Google auf bevölkerungsreiche städtische Gebiete mit einer guten Samplingdichte von Street View-Bildern. Von Wissenschaftlern betriebene mobile Überwachungsinstrumente und Labore sind eine weitere wichtige Datenquelle zur Luftqualität. Dennoch handelt es sich bei den Endergebnissen einer solchen Bereitstellung häufig um wissenschaftliche Arbeiten und Berichte, häufig ohne Veröffentlichung des vollständigen Datensatzes5,6,7,8. Auch wenn einigen Arbeiten Rohdatendateien beigefügt sind, ist die Datenqualität von Projekt zu Projekt aufgrund der Unterschiede im Studienumfang, der Instrumentierung, dem Personal, den Stichprobenmethoden und der Datenvalidierung weniger konsistent. Ein weiterer wichtiger Datenpool zur Luftqualität entsteht durch die breitere Einführung kostengünstiger Luftsensortechnologie, Bürgerwissenschaft und Crowdsourcing-Überwachungskampagnen9. Darüber hinaus hat das Fehlen eines einheitlichen Open-Source-Kanals zum Indexieren und Abrufen von Daten aus einzelnen Studien eine erhebliche Hürde für Nicht-Akademiker geschaffen, auf diese Daten außerhalb wissenschaftlicher Veröffentlichungen zuzugreifen und sie weiter zu nutzen.

Unsere Arbeit zielt darauf ab, die Lücke in der Verfügbarkeit hyperlokaler Umweltdaten sowohl in Industrie- als auch in Entwicklungsregionen zu schließen und dabei drei reproduzierbare und kostengünstige Vorteile durch konsistente Instrumentierung, Probenahmemethoden und Datenvalidierungsverfahren zu erzielen10. Wir stellen zunächst die mobile Plattform vor, die wir in realen Einsätzen in globalen Städten verwendet haben, und wie ihre benutzerdefinierten Konfigurationen diese Anwendungen am besten bedienen können. Darüber hinaus präsentieren wir validierte Umweltsensordaten mit Schwerpunkt auf kalibrierten Luftüberwachungsdaten aus mehreren mobilen Überwachungseinsätzen in verschiedenen städtischen Kontexten vom Nahen Osten bis Nordamerika sowohl in entwickelten als auch in Entwicklungsregionen. Abschließend demonstrieren wir typische Anwendungsfälle von Luftverschmutzungsdaten selbst und anderen Datenquellen in New York City, einschließlich der Schlussfolgerung von Emissions-Hotspots und der Vorhersage der Luftqualität. Unsere Ergebnisse stimmen gut mit den geltenden Regulierungskarten zur Vorhersage der Luftqualität überein und belegen die Gültigkeit unserer Datenerfassungs- und Kalibrierungsmethode. Dieses Papier ist für Umweltpraktiker und -forscher genau der richtige Zeitpunkt, um über traditionelle Ansätze zur Erfassung und Veröffentlichung von Luftqualitätsdaten nachzudenken, und bietet ein gutes Beispiel für zukünftige Praktiken.

Luftqualitätsdatensätze in dieser Studie wurden mit unserer selbst entwickelten und hergestellten mobilen Sensorplattform City Scanner (CS) erfasst11,12. Ziel ist es, groß angelegte Umwelterfassungsaufgaben zu ermöglichen, bei denen vorhandene städtische Flotten wie Taxis, Busse und kommunale Servicefahrzeuge als Erfassungsknoten genutzt werden. Wir stellen unser Sensordesign vor, das auf drei in Abb. 1 zusammengefassten Konzepten basiert: kostengünstiges Design, modulare Sensoreinheiten und Internet-of-Things (IoT)-Fähigkeiten. Unser kostengünstiges Design folgt der Definition eines kostengünstigen Luftsensors durch die US-Umweltschutzbehörde (EPA), die eine Kostenobergrenze von 2.500 US-Dollar festlegt (https://www.epa.gov/air-sensor-toolbox). /how-use-air-sensors-air-sensor-guidebook). Mit den modularen Sensoreinheiten von CS können Benutzer ihre Sensorfunktionen oder eine Reihe von Umgebungssensoranwendungen einfach anpassen. CS ist IoT-fähig, wobei erfasste Luftqualitätsdaten und Gerätestatus sofort zur Speicherung und Analyse über ein Mobilfunknetz in die Cloud gestreamt werden können. Wie in Abb. 1 dargestellt, erfüllen die Kombinationen der beiden Designkonzepte drei Hauptfunktionen: a) Überwachung des Status einzelner Sensoren und sofortiger Fernzugriff auf Daten, b) Vielseitigkeit in komplexen städtischen Umgebungen, Ausgleich des Energieverbrauchs, der Kosten und des Datenbedarfs des Geräts und c) eine Vision für die Schwarmerkennung, bei der eine CS-Flotte koordiniert agiert, um Stadtscans in Echtzeit zu erreichen. Um einen großen städtischen Raum zu erfassen, sind nur wenige Sensoren erforderlich13.

Die Designgrenze (innen) und die Funktionsgrenze (außen) des City Scanners.

Konkret besteht jedes CS aus zwei Hauptfächern: dem Steuer- und dem Sensorfach. Im Steuerfach sind die Hauptplatine, das Datenkommunikations- und lokale Speichersystem sowie das Energie- und Wärmeleistungsmanagementsystem untergebracht. Der Sensorbereich ist für die Datenerfassung relevanter und wird in diesem Abschnitt näher erläutert. Abbildung 2 zeigt die Grundkonfiguration der aktuellen CS-Iteration mit dem Namen „Whiteburn II“, wobei der Schwerpunkt auf dem Sensorfach in der Vorderansicht liegt.

Grundkonfiguration des Whiteburn II.

In der Standardkonfiguration des Sensorraums wird ein kostengünstiger optischer Partikelzähler Alphasense OPC-N3 zur Messung der Partikelkonzentration (PM) eingesetzt. Es zählt die Anzahl der Partikel, indem es einen Laserstrahl durch den angesaugten Luftstrom sendet, sodass OPC durch Zählen der von Partikeln im Luftstrom gestreuten Lichtimpulse auf die Anzahl der Partikel unterschiedlicher Größe schließen kann. Diese Technik wurde in akademischen und bürgerwissenschaftlichen Projekten weithin übernommen14,15. Im Sensorraum können gleichzeitig zwei Gassensoren untergebracht werden. Bei den in dieser Studie berichteten Sensoreinsätzen verwendeten wir die elektrochemischen Gassensoren von Alphasense für CO, NO2 und SO2. Das Oberflächenmaterial eines elektrochemischen Gassensors reagiert mit dem gasförmigen Zielschadstoff, was zu einem elektrischen Strom führt, der von der Arbeitselektrode zur Referenzelektrode fließt. Der Strom wird gemessen und ist proportional zur Konzentration des Zielschadstoffs. CS verfügt über eine Basisplattform mit einem OPC und der Fähigkeit, bis zu zwei gasförmige Schadstoffe zu erfassen. Die Plattform ist außerdem mit grundlegenden Umgebungssensorfunktionen ausgestattet, einschließlich der Messung der Umgebungslufttemperatur und der relativen Luftfeuchtigkeit. Die Wettersensoren sind auf dem mikroBUSTM-Sockel montiert, der aus einem Paar 1 × 8-Buchsenleisten besteht. Die Pinbelegung besteht aus drei Gruppen von Kommunikationspins (SPI, UART und I2C), sechs zusätzlichen Pins (PWM, Interrupt, Analogeingang, Reset und Chipauswahl) und zwei Leistungsgruppen (+3,3 und 5 V). Tabelle 1 dokumentiert eine Liste der derzeit verwendeten Umweltsensoren, die problemlos ersetzt werden können, sofern die Datenkommunikationsprotokolle konform sind.

Für die Datenerfassung mit hoher räumlich-zeitlicher Auflösung verwendeten wir die CS-Plattformversion „Whiteburn II“, die als Plug-and-Play-Umgebungssensorplattform konzipiert ist. Nach einer vollständigen Aufladung wurde jeder CS auf dem Dach eines Fahrzeugs montiert, dessen Flotteninformationen in Tabelle 2 aufgeführt sind. Der CS sollte so platziert werden, dass der OPC-Lufteinlass zur Seite zeigt und das Sensorfach in Fahrtrichtung zeigt. Durch diese Ausrichtung wird der Einfluss der Fahrzeuggeschwindigkeit auf den OPC-Lufteinlass minimiert, während die passiven Messgassensoren so weit wie möglich der Umgebungsluft ausgesetzt werden. Wir haben eine opportunistische Datenerfassungsmethode eingeführt, bei der die CS-Datenerfassung nicht der Hauptzweck des Fahrens ist. Es weist darauf hin, dass wir keine vorgeschriebenen Routen für die Fahrzeuge haben. Um räumliche und zeitliche Verzerrungen bei der Probenahme zu vermeiden (an manchen Orten und in manchen Zeitfenstern werden zu viele Stichproben durchgeführt), wurde jede Datenerhebungskampagne über einen ausreichend langen Zeitraum durchgeführt, der mindestens zwei Monate dauerte. Der Probenahmezeitraum und das Probenahmegebiet hängen auch vom Untersuchungsumfang jedes Einsatzes ab. Insgesamt sind unsere Plattformdesign- und Bereitstellungsprotokolle einfach anzuwenden und zu verwenden, mit dem Ziel, die Umweltsensorik einer größeren Bevölkerung und möglichst vielen Gemeinden zugänglich zu machen.

Zwei Einsätze in New York City zielen auf den Bezirk Bronx mit 2 Millionen Einwohnern, überwiegend ethnischen und rassischen Minderheiten. Die Bronx ist überproportional den Gefahren der Luftqualität ausgesetzt, ebenso wie viele andere gefährdete Viertel, die mit Umweltproblemen überlastet sind16. Die Region wird von vier Referenzstationen abgedeckt, die vom New York State Department of Environmental Conservation betrieben werden, von denen nur zwei neben PM auch gasförmige Schadstoffe messen. Das New York City Department of Health hat seit 2008 die New York City Community Air Survey (NYCCAS) mit einem feineren Luftüberwachungsnetzwerk aus hochwertigen, aber nicht referenztauglichen Sensoren entwickelt (https://www.nyc.gov/site/doh/ data/data-sets/air-quality-nyc-community-air-survey). NYCCAS betreibt fünfzehn Überwachungsstandorte in der Bronx und erfasst einmal pro Saison stündlich PM2,5-, Ruß-, NO- und NO2-Konzentrationen. Unsere Bronx-Einsätze arbeiteten gemeinsam mit diesen lokalen Behörden zusammen, um das bestehende Netzwerk zu ergänzen und mehr Details zur räumlichen und zeitlichen Variabilität der Luftqualität bereitzustellen. Darüber hinaus sind mobile Luftqualitätsmessungen nützlich, um Unterschiede in der Luftverschmutzungsbelastung mit hoher räumlich-zeitlicher Auflösung zu quantifizieren, was zu gerechten und gerechten Plänen zur Luftverschmutzungsminderung führt.

Beim Boston-Einsatz haben wir hyperlokale Luftqualitätsdaten in einem Viertel nördlich des Boston Logan International Airport gesammelt. Wir haben CS-Einheiten in einem mobilen Umweltlabor der Forschungsklasse montiert, das Partikel- und NOx-Konzentrationen in Echtzeit misst, deren Gültigkeit in früheren Veröffentlichungen nachgewiesen wurde17,18. Wir haben CS-erfasste Daten mit hochwertigen mobilen Labordaten verglichen und so die Übertragbarkeit und Robustheit unseres Ansatzes zur mobilen Luftqualitätsprobenahme demonstriert.

Der letzte in dieser Studie vorgestellte Einsatz fand in Beirut, der Hauptstadt des Libanon, statt. Das Land steht vor einem schweren wirtschaftlichen Zusammenbruch und leidet unter der Luftverschmutzung durch Dieselgeneratoren, da das zentrale Stromnetz nur wenige Stunden am Tag in Betrieb ist. Derzeit gibt es keine staatlich regulierte Infrastruktur zur Überwachung der Luftqualität. Unseres Wissens betreiben unsere Mitarbeiter an der American University Beirut die einzige forschungsfähige Luftüberwachungsanlage, die PM- und Gasverschmutzung misst. Das äußerst spärliche Luftüberwachungsnetz kann nicht viele nützliche Informationen zur Bewältigung des sich verschlechternden lokalen Luftqualitätsproblems liefern. In diesem Fall zielt unser Einsatz darauf ab, die lokale Datenlücke zur Luftqualität in einer daten- und ressourcenknappen städtischen Umgebung zu schließen. Insgesamt haben unsere CS-Einsätze die Genauigkeit, Gültigkeit, Haltbarkeit und Vielseitigkeit in einer Vielzahl unkontrollierter städtischer Umgebungen bewiesen, die verschiedenen Zwecken dienen, darunter Luftqualitätsmanagement, Eindämmung des Klimawandels, Bürgerbeteiligung und Wissensverbreitung.

Kostengünstige Sensoren sind anfällig für Probleme mit der Datenqualität und -stabilität. Beispielsweise kann kostengünstiges OPC keine Partikel aus Wassertröpfchen unterscheiden. Daher funktioniert es in Umgebungen mit hoher Luftfeuchtigkeit (85 %) nicht gut19,20. Daher ist es notwendig, die Sensorkollokation und -kalibrierung durchzuführen, um genaue und robuste Messungen sicherzustellen. Hier definieren wir Kollokation als den Prozess des Einsatzes kostengünstiger Sensoren neben Referenzmonitoren und Kalibrierung als die Anpassung roher Sensormesswerte mithilfe von Kollokationsdaten und mathematischen Modellen. Die in dieser Studie veröffentlichten Luftqualitätsdatensätze wurden nach einem standardisierten Rahmen gereinigt, kalibriert und validiert, der sich auf die im Jahr 2021 veröffentlichten Leistungstestprotokolle für Luftsensoren der US-Umweltschutzbehörde EPA bezieht10,21,22. Die US-amerikanische EPA ist eine Bundesbehörde, die Umweltschutzangelegenheiten regelt und verwaltet. Sie bieten außerdem Referenzen, Richtlinien und Vorschriften, die vor allem in den USA und vielen anderen Ländern als „Goldstandard“ für die Überwachung der Luftqualität gelten. Ein allgemeines Flussdiagramm unseres Nachbearbeitungs- und Validierungsprozesses ist in Abb. 3 dargestellt.

Datennachbearbeitungs- und Validierungsprotokolle.

Unmittelbar vor oder nach mobilen Einsätzen, die länger als drei Monate dauern, führen wir mindestens drei Wochen lang eine stationäre Kollokation durch, da Referenzstationen in der Regel stündlich Messungen melden, sodass wir etwa fünfhundert übereinstimmende Datenpunkte für die Entwicklung von Kalibrierungsmodellen erhalten können. Wir empfehlen die Verwendung von Kollokationsdaten mit höherer zeitlicher Auflösung, idealerweise pro Minute, für Modellierungstraining, Validierung und Tests, da CS-Messwerte alle fünf Sekunden erfolgen. Bei den Modellen handelt es sich um statistische Modelle, die unter Verwendung meteorologischer Faktoren und CS-Messwerte als erklärende Variablen und Referenzmonitormesswerten als Zielvariable entwickelt wurden. Das heißt, CS-Geräte anhand der Referenz zu „kalibrieren“. Empirisch nutzen wir hauptsächlich vier meteorologische Faktoren einer zentralen Wetterstation für alle in einer Stadt zirkulierenden CS-Einheiten, darunter Lufttemperatur, Luftfeuchtigkeit, Luftdruck und Taupunkt. Für jede CS-Einheit haben wir ein einheitenspezifisches Kalibrierungsmodell entwickelt, um die Variabilität zwischen Sensoren kostengünstiger Sensoren zu berücksichtigen, bei denen jeder Sensor auf die gleiche Luftschadstoffkonzentration reagiert, die sich geringfügig von den anderen unterscheidet. Wir haben zwei Arten von baumbasierten Kalibrierungsmodellen übernommen, nämlich Random Forest und Gradient Boosting Tree, die eine schnellere Trainingsgeschwindigkeit und eine bessere Interpretierbarkeit aufweisen. Insbesondere wurde beim zweiten Einsatz in NYC das Gradient Boosting Tree-Kalibrierungsmodell verwendet, da mehr Kollokationsdaten vorliegen (27.000 Minutenmessungen pro CS-Einheit im Vergleich zu durchschnittlich 2.000 bei anderen Einsätzen). Die anderen Bereitstellungen wurden mit einem Random-Forest-Modell kalibriert, das eine bessere Genauigkeit und bessere Generalisierbarkeit mit weniger Kollokationsdaten bietet. Das Modelltraining wurde in Python mithilfe der Bibliotheken scikit learn23 und LightGBM24 realisiert. Detaillierte Informationen zur Hyperparameter-Optimierung finden Sie in unserer aktuellen Veröffentlichung10.

Die Leistung von Kalibrierungsmodellen wird mit k-facher Kreuzvalidierung23 und zwei statistischen Metriken, dem r und dem quadratischen Mittelfehler (Root Mean Square Error, RMSE), bewertet, wie in den Gleichungen dargestellt. 1, 2. r ist der Pearson-Korrelationskoeffizient zwischen kalibrierten CS-Messwerten und Referenzmesswerten. RMSE misst die absolute Differenz zwischen diesen beiden Messwerten. In den Trainings- und Testdatensätzen wurden die CS-Messwerte für Luftschadstoffe und meteorologische Faktoren, einschließlich Temperatur, Luftfeuchtigkeit, Taupunkt und Luftdruck, als erklärende Faktoren verwendet, während die Referenzmonitormesswerte als Zielfaktor behandelt wurden. Andere meteorologische Faktoren, die häufig in lokalen Wetterstationen vorkommen, darunter Windgeschwindigkeit, Windrichtung und gefühlte Temperatur, wurden ebenfalls in den Modellen getestet, aber aufgrund statistischer Bedeutungslosigkeit entfernt.

Wo:

yi und \({\widehat{y}}_{i}\) sind beobachtete und vorhergesagte Zielmerkmale im Testdatensatz;

\(\mathop{y}\limits^{-}\) und \(\overline{\widehat{y}}\) sind Mittelwerte der beobachteten und vorhergesagten Zielmerkmale im Testdatensatz;

n ist die Größe des Testdatensatzes.

Die Kalibrierungsmodelle wurden dann auf gereinigte mobile Luftqualitätsdaten angewendet, um die Datensätze zu erstellen, über die wir in diesem Artikel berichten. Unser Datenbereinigungsprozess ist unkompliziert und folgt dem Prinzip, so viele Datenpunkte wie möglich zu erhalten. Erstens funktionieren alle Sensoren und liefern numerische Ergebnisse. CS ist so konzipiert, dass es „Nicht anwendbar (NA)“-Signale ausgibt, wenn Sensoren mit Anomalien arbeiten, wie z. B. niedrigem Batteriestand oder Überhitzung. Zweitens sind Messwerte bei hoher Luftfeuchtigkeit (>90 % oder Regen) ausgeschlossen, da der von uns verwendete kostengünstige Partikelzähler bekanntermaßen unter diesen Bedingungen verzerrte Reaktionen aufweist19,25. Schließlich eliminieren wir Aufzeichnungen mit Messwerten außerhalb der angemessenen Bereiche (<1 ug/m3 oder >1000 ug/m3 für PM2,5, <200 mv oder >900 mv für NO2-Elektrosignal). Die angemessenen Bereiche werden durch die vorherige Kenntnis der Umgebung und der Sensoren selbst bestimmt26,27. Insgesamt werden etwa 15 % der Rohdaten bei der Datenbereinigung ausgeschlossen.

Die Leistung der PM2,5-Kalibrierungsmodelle für alle Städte ist in Tabelle 3 dargestellt. Es ist erwähnenswert, dass das Kalibrierungsmodell beim Beirut-Datensatz schlecht abschneidet, was auf die begrenzten Luftüberwachungsressourcen Beiruts zurückzuführen ist. Idealerweise sollte CS vor dem Einsatz anhand von Referenzinstrumenten kalibriert werden, deren Anschaffung und Wartung häufig einen erheblichen finanziellen Beitrag von Regierungen und Behörden erfordern. Allerdings verfügt Beirut derzeit aufgrund eines wirtschaftlichen Zusammenbruchs nicht über genügend Ressourcen, um eine Referenzstation zur Überwachung der Luftqualität zu betreiben, noch über eigenständige Luftmessgeräte mit Referenzqualität, auf die wir zugreifen können. Alternativ verwendeten wir für die Kollokation und Kalibrierung einen PM-Sensor in Forschungsqualität, nämlich einen tragbaren Met One E-BAM Environmental Beta-Attenuation Mass Monitor, der von unseren lokalen Mitarbeitern bereitgestellt wurde. Obwohl der Monitor hochwertig ist, kann er die Standards von Referenzmonitoren nicht erfüllen. Es zeigt sich, dass begrenzte öffentliche Investitionen in die Überwachung und Regulierung der Luftqualität wiederum zu einer größeren Luftregulierung und Forschungslücken in weniger entwickelten Regionen führen können. Unser Design der CS-Plattform und die Veröffentlichung unserer Luftüberwachungsdaten zielen darauf ab, diese Lücken zu schließen. Dennoch bestehen in unserem Ansatz gewisse Einschränkungen.

Datensätze aller Geräte für denselben Umweltindikator (z. B. PM1, PM2,5, PM10 und NO2) in jedem Einsatz werden im selben Datensatz zusammengefasst. Nach der Datenbereinigung und -kalibrierung gibt es 118.765 (NYC-Pilot 1), 515.917 (NYC-Pilot 2), 123.192 (Boston) und 56.628 (Beirut) 5-Sekunden-Intervalldatensätze. Jede Datendatei umfasst fünf Kategorien von Feldern: eindeutige Sensor-IDs, Zeitstempel, GPS-Koordinaten, Wetter und kalibrierte Konzentrationen, wie in Tabelle 4 dargestellt. Die Anzahl der Felder für jeden Einsatz hängt davon ab, wie viele Schadstoffe wir gemessen und kalibriert haben. Wir kartieren die räumlichen Verteilungen der PM2,5-Konzentrationen in den vier Einsätzen in Abb. 4. Die Datensätze sind unter der Creative Commons Attribution-Lizenz bei Zenodo28 verfügbar.

Räumliche Verteilungen der PM2,5-Konzentrationen in (a) New York Pilot 1, (b) New York Pilot 2, (c) Boston und (d) Beirut.

Hyperlokale Luftqualitätsdaten bieten einzigartige Möglichkeiten für datengesteuerte Umwelt- und Klimaentscheidungen. Da die mobile Überwachung einen großen Bereich mit hoher räumlicher Auflösung abdeckt, unterliegt sie einer höheren Unsicherheit als die stationäre Überwachung, da der Sensor nur eine Momentaufnahme eines bestimmten Standorts erfasst. Daher ist es wichtig, wiederholte Messungen am selben Ort durchzuführen. Es wird empfohlen, mindestens vier zufällige Messungen an verschiedenen Tagen zu aggregieren, um einen Durchschnittswert der Luftverschmutzung an einem bestimmten Ort in derselben Jahreszeit zu ermitteln7. In der Praxis kann ein bestimmter Standort durch Straßensegmente oder Gitterzellen unterschiedlicher Größe definiert werden. Angesichts der unterschiedlichen Datenerfassungsdauer und -intensität bei unseren Einsätzen reichte die Rastergröße, die wir für unsere Beobachtungen aggregierten, von 100 x 100 m bis 300 x 300 m. Als Faustregel gilt, dass mindestens 500 Gitter mindestens ein Drittel der Landfläche einer Stadt mit mehr als zehn Beobachtungen von mindestens vier verschiedenen Tagen in derselben Jahreszeit abdecken sollten, um eine robuste Luftqualitätsoberfläche zu erzeugen. Dies gewährleistet eine gute räumliche Darstellung einer Stadt mit repräsentativen Luftverschmutzungsgraden. Hier stellen wir einige mögliche Anwendungen unserer Luftqualitätsdatensätze vor, mit besonderem Schwerpunkt auf dem New York City-Datensatz und seiner Anwendung bei der Luftverschmutzungskartierung.

Zunächst betrachten wir die kalibrierten mobilen Messdaten in der Bronx, New York City. Wir haben die Daten in 100 x 100 m großen Rasterzellen aggregiert. Alle Zellen in Abb. 5 enthalten mindestens zehn Beobachtungen von vier verschiedenen Tagen. Diese Karte ist nützlich, um Emissions- und Luftverschmutzungs-Hotspots zu identifizieren, wo wir beobachten, dass Autobahnen und Industriegebiete in der unteren rechten Ecke deutlich höhere PM2,5-Konzentrationen aufweisen.

Gemessene PM2,5-Konzentrationen in der Bronx nach Kalibrierung und Aggregation.

Eine weitere häufige Verwendung für mobile Luftqualitätsdaten ist die Landnutzungsregression (LUR), eine räumliche Regressionstechnik, die die Nähe von Landnutzungs- und Emissionsindikatoren nutzt, um die Luftverschmutzung an Orten ohne Messung zu erklären und abzuschätzen. Mithilfe der gemessenen PM2,5-Konzentrationen in jeder Gitterzelle erstellen wir Puffer unterschiedlicher Größe im Bereich von 50 bis 1000 m und extrahieren Landnutzungs- und Emissionsindikatoren innerhalb jeder Puffergröße. Die Indikatoren sind in Tabelle 5 dokumentiert, die mit den im Rahmen des New York City Community Air Survey (NYCCAS)-Programms entwickelten regulatorischen Luftverschmutzungskarten übereinstimmen und von der offenen Datenplattform New Yorks abgerufen werden (https://nyccas.cityofnewyork.us/nyccas2021v9). /sites/default/files/NYCCAS-appendix/Appendix1.pdf). Unsere in Abb. 6 dargestellte Vorhersagekarte zeigt ein räumliches Muster, das dem NYCCAS-Regulierungsmuster im gleichen zeitlichen Bereich ähnelt, auch wenn sich die absoluten Luftverschmutzungswerte geringfügig unterscheiden. Darüber hinaus verglichen wir unsere PM2,5-Vorhersagen in 100 x 100 m großen Rasterzellen Zelle für Zelle mit den NYCCAS-Vorhersagen. Da die Daten für 2021 nicht in einer guten Auflösung verfügbar waren, haben wir zum Vergleich Daten aus dem Jahr 2020 herangezogen. Die Pearson-Korrelation zwischen den beiden Datensätzen beträgt 0,38 und der quadratische Mittelfehler beträgt 2,02 µg/m3. Da es sich bei den NYCCAS-Vorhersagen für 2020 auch um auf Beobachtungen trainierte Modellergebnisse handelt, wird eine relativ geringe Korrelation zwischen den beiden Modellen erwartet. Dennoch zeigen die Statistiken eine zufriedenstellende Leistung unseres Vorhersagemodells und damit die Gültigkeit unserer mobilen Stichprobenmethode und Datenqualitätssicherung.

Landnutzungs-Regressionsflächen der PM2,5-Konzentrationen in der Bronx anhand (a) City Scanner-Daten und (b) NYCCAS-Daten.

Benutzer werden ermutigt, weitere Erkenntnisse aus unseren Luftqualitätsdatensätzen, Kalibrierungsmodellen und Anwendungsfällen zu gewinnen. In diesem Abschnitt werden mögliche zukünftige Forschungsrichtungen für zukünftige Diskussionen und Bemühungen vorgestellt. Erstens ist es für Forscher und Praktiker nützlich, sich eingehender mit den Ursachen von Emissions- und Luftverschmutzungs-Hotspots zu befassen, die möglicherweise nicht räumlich aufeinander abgestimmt sind, um über ihre aktuellen Emissionsminderungs- und Luftqualitätsmanagementstrategien nachzudenken. Zweitens kann man durch die Überlagerung räumlicher Verteilungen von Luftqualitäts- und Gesundheitsindikatoren wie Asthmarate, Notaufnahmebesuchen und Inzidenz anderer Atemwegs- und Herz-Kreislauf-Erkrankungen die gesundheitsschädlichen Auswirkungen der Luftverschmutzung aus epidemiologischer Sicht verfolgen. Schließlich ist es interessant, die Luftverschmutzungsbelastung und ihre Unterschiede zwischen Gemeinden durch eine statische, auf dem Wohnort basierende Analyse oder eine auf dynamischen Mobilitätsmustern basierende Analyse zu untersuchen.

Hier erkennen wir einige bekannte Mängel der veröffentlichten Datensätze an. Erstens ist das kostengünstige OPC, das wir für die PM-Messung verwenden, dafür bekannt, dass es in Umgebungen mit hoher Luftfeuchtigkeit schlechtere Leistungen erbringt, da es PM nicht von Wassertröpfchen in der Luft unterscheiden kann. Daher umfassen unsere Datensätze keine Beobachtungen, die bei >90 % relativer Luftfeuchtigkeit gesammelt wurden. Zweitens wurden die Datensätze von Boston und Beirut mit Sensoren in Forschungsqualität und nicht mit Sensoren in Referenzqualität kalibriert. Die in Boston verwendeten Forschungssensoren wurden unmittelbar vor dem mobilen Einsatz an einer Referenzstation kalibriert. In Beirut waren die forschungstauglichen Sensoren die einzige verfügbare Option für die lokale Kalibrierung, da es keine staatlich regulierten Referenzstationen gab. Wir glauben nicht, dass dies zu erheblichen Verzerrungen in den veröffentlichten Datensätzen führen würde. Drittens wurden unsere Temperatur- und Luftfeuchtigkeitsdaten nicht mit Referenzmonitoren kalibriert, da sie nicht im Mittelpunkt unserer Einsätze stehen. In diesem Fall wurde ihre Gültigkeit nicht als Kriterium für die Datenbereinigung übernommen, die darauf abzielt, die maximale Anzahl gültiger Beobachtungen für Feinstaub und NO2 zu erhalten. Wir raten dem Publikum dringend, sie nur zu pädagogischen oder sinnvollen Zwecken zu übernehmen und vor jeder Form der Analyse eine Überprüfung der geistigen Gesundheit durchzuführen. Da es sich bei CS schließlich um eine kostengünstige Umgebungssensorplattform handelt, ist es von entscheidender Bedeutung, die Plattform vor der lokalen Verwendung zusammenzustellen und zu kalibrieren. Dies ist besonders wichtig, wenn bei einem Einsatz PM gemessen wird, da der OPC Partikel in Behältern unterschiedlicher Größe zählt und dann die Massenkonzentration anhand von Annahmen über Form und Dichte schätzt, die von Ort zu Ort und von Saison zu Saison erheblich variieren können.

Neben mit Zeit und Ort versehenen Luftqualitätsdaten bieten wir auch eine Zusammenstellung von Landnutzungs-GIS-Ebenen an, die in unseren und den LUR-Modellen von NYCCAS verwendet werden, um die Ergebnisse bequem in unserem Github-Repository (https://github.com/) reproduzieren zu können. MIT-Senseable-City-Lab/OSCS/tree/main). Diese GIS-Layer werden von den Regierungen von New York City und dem Bundesstaat New York veröffentlicht und von den Autoren für die Modellierung verarbeitet, wobei 2021 das Basisjahr ist. Das Publikum wird ermutigt, das Repository zu erkunden und Einzelheiten darüber zu erfahren, wie wir die CS-Plattform entwerfen, bauen, kalibrieren und nutzen. Für die automatische Extraktion von Landnutzungsmerkmalen, das LUR-Training und die Leistungsbewertung steht Python-Code zur Verfügung.

Anjomshoaa, A., Santi, P., Duarte, F. & Ratti, C. Quantifizierung des räumlich-zeitlichen Potenzials der Vorbeifahrerkennung in Smart Cities. Journal of Urban Technology 28, 199–216 (2020).

Artikel Google Scholar

Leifer, I. & Melton, C. Verwendung mobiler Oberflächen-In-situ- und Fernerkundung sowie luftgestützter Fernerkundung, um Emissionen aus einem produzierenden Ölfeld in Zentralkalifornien in komplexem Gelände abzuleiten. Atmos Pollut Res 12, 101145 (2021).

Artikel CAS Google Scholar

Simon, MC et al. Kombination von Messungen aus der mobilen Überwachung und einem Referenzstandort zur Entwicklung von Modellen für die Konzentration ultrafeiner Partikel in der Umgebung von Wohngebäuden. Environ Sci Technol 52, 6985–6995 (2018).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Southerland, VA et al. Bewertung der Verteilung von Gesundheitsrisiken durch Luftverschmutzung in Städten: Eine Analyse auf Nachbarschaftsebene unter Nutzung hochauflösender Datensätze in der Bay Area, Kalifornien. Environ Health Perspect 129, EHP7679 (2021).

Artikel Google Scholar

Apte, JS et al. Hochauflösende Luftverschmutzungskartierung mit Google Street View Cars: Nutzung von Big Data. Environ Sci Technol 51, 6999–7008 (2017).

Artikel ADS CAS PubMed Google Scholar

Kerckhoffs, J. et al. Mixed-Effects-Modellierungsrahmen für Amsterdam und Kopenhagen für NO2-Konzentrationen im Freien unter Verwendung von Messungen, die mit Google Street View Cars durchgeführt wurden. Environ Sci Technol acs.est.1c05806, https://doi.org/10.1021/ACS.EST.1C05806 (2022).

Messier, KP et al. Kartierung der Luftverschmutzung mit Google Street View Cars: Effiziente Ansätze mit mobiler Überwachung und Landnutzungsregression. Environ Sci Technol 52, 12563–12572 (2018).

Artikel ADS CAS PubMed Google Scholar

Mui, W. et al. Entwicklung eines Leistungsbewertungsprotokolls für Luftsensoren, die in einem Google Street View-Auto eingesetzt werden. Environ Sci Technol 55, 1477–1486 (2021).

Artikel ADS CAS PubMed Google Scholar

Thompson, JE Crowdsourcing-Studien zur Luftqualität: Ein Überblick über die Literatur und tragbare Sensoren. Trends in Environmental Analytical Chemistry 11, 23–34 (2016).

Artikel CAS Google Scholar

Wang, A. et al. Nutzung von Algorithmen für maschinelles Lernen, um die kostengünstige Kalibrierung von Luftsensoren in stationären und mobilen Umgebungen voranzutreiben. Atmos Environ 301, 119692 (2023).

Artikel CAS Google Scholar

Anjomshoaa, A. et al. Stadtscanner: Aufbau und Planung einer mobilen Sensorplattform für Smart City-Dienste. IEEE Internet Things J 5, 4567–4579 (2018).

Artikel Google Scholar

Mora, S., Anjomshoaa, A., Benson, T., Duarte, F. & Ratti, C. Auf dem Weg zur großflächigen Vorbeifahrterkennung mit Mehrzweck-Stadtscannerknoten. IEEE 5. Weltforum zum Internet der Dinge, WF-IoT 2019 – Konferenzbeiträge 743–748, https://doi.org/10.1109/WF-IOT.2019.8767186 (2019).

O'Keeffe, KP, Anjomshoaa, A., Strogatz, SH, Santi, P. & Ratti, C. Quantifizierung der Sensorleistung von Fahrzeugflotten. Proceedings of the National Academy of Sciences 116, 12752–12757 (2019).

Artikel ADS Google Scholar

deSouza, P. et al. Überwachung der Luftqualität mit mobilen, kostengünstigen Sensoren an Müllwagen: Methodenentwicklung und gewonnene Erkenntnisse. Sustain Cities Soc 60, 102239 (2020).

Artikel Google Scholar

Santana, P. et al. Kartierung und Visualisierung der Luftqualität: Eine kostengünstige Lösung basierend auf einem fahrzeugmontierten Sensornetzwerk. J Clean Prod 315, 128194 (2021).

Artikel Google Scholar

Spira-Cohen, A., Chen, LC, Kendall, M., Lall, R. & Thurston, GD Persönliche Belastung durch verkehrsbedingte Luftverschmutzung und akute Atemwegserkrankungen bei Bronx-Schulkindern mit Asthma. Environ Health Perspect 119, 559–565 (2011).

Artikel PubMed PubMed Central Google Scholar

Hudda, N., Simon, MC, Patton, AP & Durant, JL Reduzierung der verkehrsbedingten Ruß- und Ultrafeinpartikelkonzentrationen in einem Stadtviertel während der COVID-19-Pandemie. Science of The Total Environment 742, 140931 (2020).

Artikel ADS CAS PubMed Google Scholar

Simon, MC et al. Vergleich der verkehrsbedingten Konzentrationen ultrafeiner Partikel, die in zwei städtischen Gebieten durch zentrale, Wohn- und mobile Überwachung gemessen wurden. Atmos Environ 169, 113–127 (2017).

Artikel ADS CAS Google Scholar

Crilley, LR et al. Evaluierung eines kostengünstigen optischen Partikelzählers (Alphasense OPC-N2) zur Umgebungsluftüberwachung. Atmos Meas Tech 11, 709–720 (2018).

Artikel Google Scholar

Di Antonio, A., Popoola, OAM, Ouyang, B., Saffell, J. & Jones, RL entwickeln eine Korrektur der relativen Luftfeuchtigkeit für kostengünstige Sensoren zur Messung von Feinstaub in der Umgebung. Sensoren 2018, Bd. 18, Seite 2790 18, 2790 (2018).

Google Scholar

US-EPA. Leistungstestprotokolle, Metriken und Zielwerte für Feinstaub-Luftsensoren: Verwendung in der Umgebung, im Freien, an festen Standorten sowie in nicht behördlichen ergänzenden und informativen Überwachungsanwendungen. https://cfpub.epa.gov/si/si_public_record_Report.cfm?dirEntryId=350785&Lab=CEMM, EPA/600/R-20/280 (2021).

US-EPA. Leistungstestprotokolle, Metriken und Zielwerte für Ozon-Luftsensoren: Verwendung in Umgebungs-, Außen-, ortsfesten, nicht behördlichen und Informationsüberwachungsanwendungen. https://cfpub.epa.gov/si/si_public_record_Report.cfm?dirEntryId=350784&Lab=CEMM, doi: EPA/600/R-20/279 (2021).

Pedregosa, F. et al. Scikit-learn: Maschinelles Lernen in Python Um diese Version zu zitieren: Scikit-learn: Maschinelles Lernen in Python. Journal of Machine Learning Research 12 (2011).

Ke, G. et al. LightGBM: Ein hocheffizienter Entscheidungsbaum zur Gradientenverstärkung. in der 31. Konferenz über neuronale Informationsverarbeitungssysteme (NIPS 2017) (2017).

Kim, J., Shusterman, AA, Lieschke, KJ, Newman, C. & Cohen, RC Das Berkeley Atmospheric CO2 Observation Network: Feldkalibrierung und Bewertung kostengünstiger Luftqualitätssensoren. Atmos Meas Tech 11, 1937–1946 (2018).

Artikel CAS Google Scholar

Alphasense. Alphasense NO2-A43F Stickstoffdioxid-Sensor – 4-Elektroden – Technische Spezifikationen Version 1.0. https://www.alphasense.com/wp-content/uploads/2022/09/Alphasense_NO2-A43F_datasheet.pdf.

Sousan, S., Koehler, K., Hallett, L. & Peters, TM Bewertung des optischen Partikelzählers Alphasense (OPC-N2) und des tragbaren Aerosolspektrometers Grimm (PAS-1.108). Aerosol Science and Technology 50, 1352–1365 (2016).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Wang, A. et al. Offene Datensätze für hyperlokale städtische Umweltdaten in globalen Städten. Zenodo https://doi.org/10.5281/zenodo.7961851 (2023).

Referenzen herunterladen

Die Studie wurde vom MIT Senseable City Lab Consortium (LandWey, Consiglio per la Ricerca in Agricoltura e l'Analisi dell'Economia Agraria, Volkswagen Group America, FAE Technology, Samoo Architects & Engineers, Shell, GoAigua, ENEL Foundation, University of) finanziert Tokio, Weizmann Institute of Science, Universidad Autónoma de Occidente, Instituto Politecnico Nacional, Imperial College London, Università di Pisa, KTH Royal Institute of Technology, AMS Institute, Helsingborg, Laval, Stockholm, Amsterdam). Wir danken Sarah Johnson vom New York City Department of Health, Prof. Issam Lakkis und Prof. Nareg Karaoghlanian von der American University Beirut für die Bereitstellung ergänzender Datenquellen, die Erleichterung von Datenerfassungskampagnen und ihre lokalen Wissensbeiträge, ohne die diese Arbeit nicht abgeschlossen werden kann.

Senseable City Lab, Abteilung für Stadtstudien und Planung, Massachusetts Institute of Technology, Cambridge, USA

An Wang, Simone Mora, Yuki Machida, Sanjana Paul, Oluwatobi Oyinlola, Fabio Duarte und Carlo Ratti

Fakultät für Informatik, Norwegische Universität für Wissenschaft und Technologie, Trondheim, Norwegen

Simone Mora

Abteilung für Stadt- und Regionalplanung, University of Colorado Denver, Denver, USA

Priyanka DeSouza

Sie können diesen Autor auch in PubMed Google Scholar suchen

An Wang: Konzeptualisierung, Schreiben, Methodik, Datenerfassung. Simone Mora: Konzeptualisierung, Schreiben, Methodik, Datenerfassung, Supervision, Projektmanagement. Yuki Machida: Methodik, Datenerfassung. Priyanka deSouza: Methodik, Datenerfassung. Sanjana Paul: Datenerfassung. Oluwatobi Oyinlola: Methodik, Datenerfassung. Fábio Duarte: Methodik, Betreuung, Redaktion, Projektmanagement. Carlo Ratti: Betreuung, Finanzierungseinwerbung.

Korrespondenz mit Simone Mora.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Anmerkung des Herausgebers Springer Nature bleibt hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten neutral.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht durch gesetzliche Vorschriften zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Wang, A., Mora, S., Machida, Y. et al. Hyperlokale Umweltdaten mit einer mobilen Plattform in städtischen Umgebungen. Sci Data 10, 524 (2023). https://doi.org/10.1038/s41597-023-02425-3

Zitat herunterladen

Eingegangen: 30. März 2023

Angenommen: 28. Juli 2023

Veröffentlicht: 05. August 2023

DOI: https://doi.org/10.1038/s41597-023-02425-3

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein gemeinsam nutzbarer Link verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt