مجموعه داده‌های جمعیت شبکه‌ای، جمعیت را در دانه‌بندی مکانی و زمانی نسبتاً بالا با تخصیص مجدد داده‌های جمعیت رسمی از واحدهای اداری نامنظم به شبکه‌های منظم (مثلاً سلول‌های شبکه ۱ کیلومتری) مدل‌سازی می‌کنند. چنین داده های جمعیتی برای درک روابط انسان و محیط زیست و پاسخ به بسیاری از مشکلات اجتماعی-اقتصادی و زیست محیطی حیاتی هستند. ما یک لایه جمعیتی شبکه‌بندی شده (GHS-POP) را که به طور گسترده مورد استفاده قرار می‌گیرد، برای ارزیابی ظرفیت آن برای ثبت توزیع شمارش جمعیت در چندین منطقه شهری، در سراسر مناطق اصلی جهان، تحلیل کردیم. این تحلیل برای ارزیابی مناسب بودن آن برای مدل‌سازی جمعیت جهانی انجام شد. ما دقیق ترین داده های جمعیت محلی موجود برای چندین شهر را به دست آوردیم و آن را با لایه GHS-POP مقایسه کردیم. نتایج بسته به بافت جغرافیایی، میزان خطا و درجات مختلفی را نشان داد. به طور کلی، شهرهای کشورهای با درآمد بالا (HIC) و کشورهای با درآمد متوسط ​​بالا (UMIC) خطاهای مدل کمتری در مقایسه با شهرهای کشورهای با درآمد پایین و متوسط ​​(LMIC) داشتند. به طور متوسط ​​جهانی، 75 درصد از کل فضاهای شهری به اشتباه برآورد شده است. عموماً در نواحی مختلط مرکزی یا غیرمسکونی، جمعیت بیش از حد برآورد می‌شد، در حالی که در مناطق مسکونی با تراکم بالا (مثلاً مناطق غیررسمی و مناطق مرتفع)، جمعیت کمتر برآورد می‌شد. علاوه بر این، عدم قطعیت های مدل بالا در حومه شهرها با تراکم کم یا کم جمعیت یافت شد. این الگوهای جغرافیایی خطاها باید هنگام استفاده از مدل‌های جمعیتی به عنوان ورودی برای مدل‌های رشد شهری به خوبی درک شوند، زیرا سوگیری‌های جغرافیایی را معرفی می‌کنند. شهرهای کشورهای با درآمد بالا (HIC) و کشورهای با درآمد متوسط ​​بالا (UMIC) خطاهای مدل کمتری در مقایسه با شهرهای کشورهای با درآمد پایین و متوسط ​​(LMIC) داشتند. به طور متوسط ​​جهانی، 75 درصد از کل فضاهای شهری به اشتباه برآورد شده است. عموماً در نواحی مختلط مرکزی یا غیرمسکونی، جمعیت بیش از حد برآورد می‌شد، در حالی که در مناطق مسکونی با تراکم بالا (مثلاً مناطق غیررسمی و مناطق مرتفع)، جمعیت کمتر برآورد می‌شد. علاوه بر این، عدم قطعیت های مدل بالا در حومه شهرها با تراکم کم یا کم جمعیت یافت شد. این الگوهای جغرافیایی خطاها باید هنگام استفاده از مدل‌های جمعیتی به عنوان ورودی برای مدل‌های رشد شهری به خوبی درک شوند، زیرا سوگیری‌های جغرافیایی را معرفی می‌کنند. شهرهای کشورهای با درآمد بالا (HIC) و کشورهای با درآمد متوسط ​​بالا (UMIC) خطاهای مدل کمتری در مقایسه با شهرهای کشورهای با درآمد پایین و متوسط ​​(LMIC) داشتند. به طور متوسط ​​جهانی، 75 درصد از کل فضاهای شهری به اشتباه برآورد شده است. عموماً در نواحی مختلط مرکزی یا غیرمسکونی، جمعیت بیش از حد تخمین زده می‌شود، در حالی که در مناطق مسکونی با تراکم بالا (مثلاً مناطق غیررسمی و مناطق مرتفع)، جمعیت کمتر برآورد شده است. علاوه بر این، عدم قطعیت های مدل بالا در حومه شهرها با تراکم کم یا کم جمعیت یافت شد. این الگوهای جغرافیایی خطاها باید هنگام استفاده از مدل‌های جمعیتی به عنوان ورودی برای مدل‌های رشد شهری به خوبی درک شوند، زیرا سوگیری‌های جغرافیایی را معرفی می‌کنند. در مناطق مختلط مرکزی یا غیر مسکونی، جمعیت بیش از حد برآورد شد، در حالی که در مناطق مسکونی با تراکم بالا (به عنوان مثال، مناطق غیررسمی و مناطق مرتفع)، جمعیت کمتر برآورد شد. علاوه بر این، عدم قطعیت های مدل بالا در حومه شهرها با تراکم کم یا کم جمعیت یافت شد. این الگوهای جغرافیایی خطاها باید هنگام استفاده از مدل‌های جمعیتی به عنوان ورودی برای مدل‌های رشد شهری به خوبی درک شوند، زیرا سوگیری‌های جغرافیایی را معرفی می‌کنند. در مناطق مختلط مرکزی یا غیر مسکونی، جمعیت بیش از حد برآورد شد، در حالی که در مناطق مسکونی با تراکم بالا (به عنوان مثال، مناطق غیررسمی و مناطق مرتفع)، جمعیت کمتر برآورد شد. علاوه بر این، عدم قطعیت های مدل بالا در حومه شهرها با تراکم کم یا کم جمعیت یافت شد. این الگوهای جغرافیایی خطاها باید هنگام استفاده از مدل‌های جمعیتی به عنوان ورودی برای مدل‌های رشد شهری به خوبی درک شوند، زیرا سوگیری‌های جغرافیایی را معرفی می‌کنند.

کلید واژه ها:

مدل های جمعیت جهانی ; عدم قطعیت ها ؛ دقت ها GHS-POP ; مدل های شهری

 

چکیده گرافیکی

1. مقدمه

جمعیت جهانی انسان در حال حاضر 7.9 میلیارد نفر تخمین زده می شود و پیش بینی می شود که در سال 2050 به 9.7 میلیارد نفر افزایش یابد [ 1 ]. با این حال، عدم قطعیت های زیادی در مورد تعداد کل و همچنین در الگوهای جغرافیایی جمعیت در مقیاس کشور، منطقه و شهر وجود دارد [ 2 ، 3 ، 4 ]. در حال حاضر، اکثریت جمعیت جهان در شهرها زندگی می کنند و برای بسیاری از اهداف سیاست محلی و جهانی (به عنوان مثال، اهداف توسعه پایدار (SDGs))، اطلاعات جغرافیایی قابل اعتماد در مورد توزیع جمعیت مورد نیاز است [ 5 ، 6 ].]. به طور کلی، مجموعه داده های جمعیتی اجزای حیاتی برای اندازه گیری و درک روابط متقابل انسان و محیط زیست هستند. آنها به طور گسترده در مدل‌های اقتصادی، تحقیقات بهداشت عمومی، برنامه‌ریزی سکونتگاه‌های انسانی، آماده‌سازی انتخابات، ارزیابی خطر و آمادگی و واکنش در برابر بلایا استفاده می‌شوند [ 7 ، 8 ، 9 ، 10 ]. بنابراین، همه این برنامه ها به داده های جمعیتی قابل اعتماد نیاز دارند. چنین مجموعه های داده ای به طور فزاینده ای در دسترس هستند، اما درک نقاط قوت و ضعف آنها برای یک زمینه برنامه خاص برای کاربران دشوار است [ 11 ]. در این مقاله، ما مثالی از یک مجموعه داده رایج جمعیتی، GHS-POP [ 12]، برای ارزیابی علل هرگونه عدم قطعیت هنگام استفاده از آن به عنوان ورودی برای مدل‌های شهری.
مدل‌های رشد شهری معمولاً روش‌هایی برای نظارت و برنامه‌ریزی برای توسعه شهری پایدار هستند [ 13 ، 14 ، 15 ]. چنین مدل هایی به داده های دقیق جمعیت جهانی نیاز دارند. یکی از متداول‌ترین مدل‌های جمعیتی، پیش‌بینی جمعیت جهانی چندزمانی کمیسیون اروپا، مجموعه داده GHS-POP است. 12 ] است.]. بنابراین، هدف کلی این مطالعه به دست آوردن بینشی در مورد علل تخصیص اشتباه داده‌های GHS-POP (در داخل شهرها) با تجزیه و تحلیل روابط بین داده‌های GHS-POP و داده‌های جمعیت محلی و ارتباط عدم قطعیت‌ها به زمین‌های مختلف بود. از انواع استفاده کنید ابتدا، ما GHS-POP را با داده‌های جمعیت محلی مقایسه کردیم تا هرگونه تخمین بیش‌ازحد یا دست‌کم‌گرفته را در مقیاس درون شهری شناسایی کنیم. دوم، ما خطاهای تخمین را با کاربری‌های زمین مقایسه کردیم تا دلایل تخمین بیش‌ازحد یا دست کم‌گرفتن را بهتر درک کنیم. این مطالعه به سوالات زیر می پردازد:
  • ارتباط GHS-POP و داده های جمعیت محلی در پایین ترین سطح اداری موجود چیست؟
  • چه رابطه ای بین الگوی فضایی مناطق بیش از حد و کم برآورد شده و انواع کاربری اراضی وجود دارد؟
  • پیامدهای استفاده از داده های جمعیتی موجود در مدل های رشد شهری چیست؟

2. مدل های جمعیت شبکه ای – نقاط قوت و محدودیت های آنها

به طور سنتی، داده های جمعیت از طریق سرشماری – شمارش رسمی همه افراد در یک کشور به دست می آید. داده های سرشماری در فواصل طولانی، معمولا هر ده سال یکبار جمع آوری می شود. با این حال، در بسیاری از کشورهای با درآمد کم و متوسط ​​(LMIC) سرشماری قطع شده، به تعویق افتاده یا برنامه‌ریزی نشده است [ 16 ]، با علل رایج درگیری‌ها و همچنین اخیراً همه‌گیری COVID-19. به عنوان مثال، جمهوری دموکراتیک کنگو 30 سال است که سرشماری نداشته است و برزیل اخیراً سرشماری سال 2020 خود را به تعویق انداخته است. علاوه بر این، چارچوب جمع‌آوری داده‌های سرشماری ممکن است دارای سوگیری‌هایی باشد، مانند حذف گروه‌های حاشیه‌نشین (مانند زاغه‌ها، سکونتگاه‌های موقت) [ 17 ، 18 ]]. علاوه بر این، واحدهای اداری در طول زمان تغییر می کنند و واحدهای تجمع بزرگ می توانند ناهمگونی را در منطقه پنهان کنند (معروف به مشکل واحد منطقه قابل تغییر [ 19 ]).
رویکردهای نقشه‌برداری جمعیت شبکه‌بندی‌شده جهانی در دهه 1990 آغاز شد، زمانی که داده‌های جمعیت از قالب‌های برداری نامنظم به سلول‌های شبکه استاندارد شده تبدیل شدند [ 10 ، 20 ]. مجموعه داده‌های جمعیت شبکه‌بندی شده جهانی از یک چارچوب مدل سازگار (مثلاً WorldPop) استفاده می‌کنند که تعداد جمعیت با وضوح بالا (مثلا سلول‌های شبکه 100 متری) را ارائه می‌دهد. بیشتر مجموعه‌های داده شبکه‌بندی‌شده از مدل‌های داسیمتری برای تخمین توزیع مکانی داده‌های جمعیت، با استفاده از داده‌های سرشماری موجود در ترکیب با سایر داده‌های مکانی (مثلاً پوشش زمین) برای تفکیک تعداد جمعیت در سلول‌های شبکه استفاده می‌کنند. آنها به رویکردهای بالا به پایین و پایین به بالا تقسیم می شوند. بیشتر مجموعه داده‌های جمعیت جهانی از رویکردهای شبکه‌ای از بالا به پایین مشتق شده‌اند (به پیوست A مراجعه کنید) آنها تعداد جمعیت را به سلول های شبکه کوچک (مانند GHS-POP) تقسیم می کنند. رویکردهای ساده از بالا به پایین توزیع یکنواخت جمعیت را در واحدهای اداری فرض می‌کنند (به عنوان مثال، GPWv4 [ 21 ])، در حالی که رویکردهای پیچیده‌تر داده‌های جانبی را برای تولید وزن‌ها (مثلاً پوشش زمین، چراغ‌های شبانه) برای تخصیص جمعیت ترکیب می‌کنند [ 8 ] . رویکردهای شبکه‌بندی شده از پایین به بالا معمولاً مبتنی بر نمونه‌های ریز سرشماری هستند و روابط جغرافیایی آماری بین تراکم جمعیت (ریز سرشماری) و محیط ساخته شده برای پیش‌بینی تعداد جمعیت در سلول‌های شبکه مناطق نمونه‌برداری نشده ایجاد می‌کنند (واردروپ و همکاران، 2018) به عنوان مثال، LandScan-HD یا GRID3).
بسیاری از مجموعه داده‌های جمعیت شبکه‌ای در حال حاضر در دسترس هستند که با انقلاب داده‌ها ظهور کرده‌اند و بسیاری از آنها دسترسی باز هستند. با این حال، این تنوع زیاد مدل‌ها باعث می‌شود که کاربران اغلب در مورد مزایا و محدودیت‌های مجموعه داده‌های فردی بسیار نامطمئن باشند. داده‌های ورودی در این مدل‌ها متنوع هستند و مفروضات اساسی و رویکردهای مدل‌سازی بر نتیجه مجموعه داده‌های جمعیت شبکه‌بندی شده تأثیر می‌گذارند. به عنوان مثال، اندازه های شبکه متفاوت است، از 30 متر تا 10 کیلومتر. سلول های شبکه بزرگ، دانه بندی کم داده های سرشماری موجود (به عنوان ورودی استفاده می شود) را بهتر منعکس می کنند، اما در انعکاس تنوع فضایی جمعیت ها محدود هستند [ 11 ]]. به طور کلی، مجموعه داده های شبکه ای، به جز LandScan، جمعیت شبانه را اندازه گیری می کنند. برای شهرهای بزرگ، می تواند چندین میلیون تفاوت بین جمعیت روز و شب وجود داشته باشد، زیرا مردم برای کار، تحصیل و غیره به شهرها رفت و آمد می کنند.
مدل های جمعیت شبکه بندی شده جهانی که معمولاً مورد استفاده قرار می گیرند در ضمیمه A خلاصه شده اند. اکثر این مدل ها از GPW به عنوان ورودی استفاده می کنند که اکنون در نسخه چهارم خود (GPWv4) قرار دارد. GPWv4 بر اساس دقیق ترین داده های سرشماری تفکیک مکانی جمع آوری شده بین سال های 2005 و 2014 است. برای مثال، GHS-POP از لایه سکونت انسانی جهانی (GHSL) و GPWv4 استفاده می کند [ 22 ]. WorldPOP شامل چندین متغیر کمکی (به عنوان مثال، چراغ های شبانه) برای مدل سازی توزیع جمعیت با استفاده از رویکرد یادگیری ماشین تصادفی مبتنی بر جنگل است [ 8 ]]. Grid3 یک مجموعه داده نوظهور است که در حال حاضر داده های جمعیتی چندین کشور آفریقایی را به عنوان یک مدل از پایین به بالا ارائه می دهد. مدل تاریخی هاید، بر اساس چشم انداز جمعیت جهان سازمان ملل متحد و تخمین های تاریخی از ادبیات [23 ، 24 ]، یک سری زمانی از جمعیت انسانی را با وضوح مکانی 10 کیلومتر ارائه می دهد. این مدل‌های جمعیتی از انواع داده‌های جانبی استفاده می‌کنند (مانند ماسک‌های ساخته شده، پوشش زمین، کاربری زمین، جاده‌ها، زیرساخت‌ها، خدمات، چراغ‌های شبانه، توپوگرافی و نقاط مورد علاقه [ 7 ، 9 ، 25 ]) که به توزیع فضایی جمعیت [ 8 ، 25 ، 26]. به طور کلی، وضوح داده های جانبی بر پیش بینی پذیری مدل تأثیر می گذارد. در بیشتر موارد، داده‌های با وضوح بالا تخمین‌های قابل اعتمادتری نسبت به داده‌های با وضوح درشت ارائه می‌دهند. با این حال، تنها چند مجموعه داده با وضوح بالا پوشش جهانی دارند و لایه‌ها ممکن است دارای شکاف باشند (مثلاً در مناطق روستایی) [ 25 ، 27 ]. داده‌های جانبی که معمولاً مورد استفاده قرار می‌گیرند شامل نقشه‌های پوشش زمین/استفاده از زمین از تصاویر ماهواره‌ای، به عنوان مثال، لایه سکونت انسانی جهانی یا ردپای جهانی شهری [ 26 ] است. به طور معمول، ادغام چندین مجموعه داده جانبی، دقت مدل جمعیت را بهبود می بخشد [ 28 ].
درک رویکردهای مدلسازی یک گام اساسی در درک نقاط قوت و ضعف هر مجموعه داده است. همانطور که رویکرد توزیع جمعیت داده‌های سرشماری را به شبکه‌ها تقسیم می‌کند، عدم قطعیت داده‌های ورودی در مدل منتشر می‌شود. علاوه بر این، روش‌های مدل‌سازی به کار گرفته شده با اخطارهایی همراه هستند. به عنوان مثال، چندین مدل جمعیت (به عنوان مثال، LandScan، GHS-POP) از مدل های مبتنی بر رگرسیون استفاده می کنند [ 29 ]. این مدل ها یک رابطه پایدار بین تراکم جمعیت و متغیرهای کمکی را فرض می کنند. با این حال، این فرض نادرست است، و روابط غیر خطی گرفته نشده است [ 30 ]. مدل‌های یادگیری ماشین به طور فزاینده‌ای برای مدل‌سازی جمعیت استفاده می‌شوند (مثلاً WorldPOP). جنگل تصادفی (RF) [ 31]، برای مثال، می تواند با مجموعه داده های با ابعاد بالا سروکار داشته باشد و می تواند روابط پیچیده غیرخطی را مدل کند. بنابراین، علاوه بر سرشماری، داده‌های ورودی مختلف و رویکردهای مدل‌سازی مورد استفاده نیز می‌توانند بر دقت مدل تأثیر بگذارند. ما نقاط قوت، ضعف و وابستگی آنها را بر اساس ادبیات خلاصه کرده ایم ( جدول 1 ). علاوه بر رویکرد مدل‌سازی، عامل اصلی که بر دقت رویکردهای بالا به پایین تأثیر می‌گذارد، داده‌های سرشماری است (به عنوان مثال، مقیاس تجمیع آن). هرچه این داده های ورودی از نظر مکانی بیشتر تفکیک شده باشند (یعنی هر چه وضوح بالاتر باشد)، تخصیص در سلول های شبکه دقیق تر است [ 32]. رویکرد مدل‌سازی بر تفکیک/تخصیص جمعیت در سلول شبکه تأثیر می‌گذارد. بسیاری از مدل‌های جمعیتی (به عنوان مثال GHS-POP، GRUMP) کاربری مسکونی را از سایر کاربری‌های زمین مانند تجاری و صنعتی متمایز نمی‌کنند و بنابراین، جمعیت را به مناطق غیرمسکونی تخصیص می‌دهند. اکثر مجموعه داده ها (به عنوان مثال، WorldPOP، GHS-POP) جمعیت شبانه (سرشماری) را مدل می کنند، در حالی که LandScan جمعیت محیط را ارائه می دهد [ 33 ]. به طور کلی، مدل ها عملکرد ضعیفی را در مناطق شهری با تراکم بالا نشان می دهند (به عنوان مثال، مناطق غیررسمی) [ 34 ، 35 ]. این نتیجه اکثر روش‌های فضایی‌سازی است که جمعیت سرشماری را در مناطق مسکونی، از جمله مناطق غیر مسکونی توزیع می‌کند [ 11 ].]. برای مقابله با این محدودیت‌ها، اخیراً رویکردهای پایین به بالا توسعه داده شده‌اند که مستقیماً جمعیت را در سلول‌های شبکه نمونه‌گیری نشده پیش‌بینی می‌کنند یا هر دو رویکرد مدل‌سازی را ادغام می‌کنند (به عنوان مثال، GRID3) [ 2 ].
با توجه به در دسترس بودن روزافزون مجموعه داده های جمعیت، مهم است که بدانیم این مجموعه داده ها چقدر دقیق هستند. رویکرد رایج اعتبارسنجی، مقایسه برآوردهای مدل با داده‌های معتبر جمعیت است. با این حال، مجموعه داده‌های سرشماری با وضوح خوب به آسانی در مقیاس جهانی در دسترس نیستند [ 39 ]، و همچنین روش قابل قبولی برای اندازه‌گیری سطح خطاها در برآوردهای جمعیت وجود ندارد [ 4 ، 33 ]. روش های رایج مورد استفاده عبارتند از ریشه میانگین مربعات خطا (RMSE)، میانگین خطای مطلق (MAE) و میانگین درصد مطلق خطا (MAPE) [ 9 ، 39 ]. جدول 2 پنج علت رایج خطاها را خلاصه می کند: ناهمگونی فضایی محیط(به عنوان مثال، تغییرات در تراکم جمعیت) [ 23 ، 40 ]; کیفیت داده های سرشماری (به عنوان مثال، تفکیک زمانی و مکانی) [ 32 ، 41 ]; کیفیت داده های کمکی [ 42 ] (به عنوان مثال، تکیه بر داده های نور شبانه با وضوح درشت). اثر مقیاس و عدم تطابق زمانی عدم قطعیت را افزایش می دهد (به عنوان مثال، تفاوت در دسترس بودن داده ها) [ 8 ]. و تفاوت در ویژگی های منطقه ای و محلی(به عنوان مثال، تفاوت در نرخ شهرنشینی). اکثر کشورهای HIC دارای نرخ نسبتاً آهسته رشد جمعیت و الگوی سکونتگاهی پایدارتر از LMICها هستند که تحت تأثیر شهرنشینی کنترل نشده (مثلاً زاغه ها) قرار دارند. همه مجموعه داده های جمعیتی طبقه بندی شده جهانی، جمعیت محله های فقیر نشین [ 34 ] را دست کم می گیرند.

3. مواد و روشها

برای ارزیابی عدم قطعیت های مدل در تخصیص جمعیت لایه GHS-POP، هفت شهر انتخاب شدند. این شهرها به دو دلیل عمده انتخاب شدند. اول، آنها یک نمونه جهانی تعمیم یافته را تحت بخش هفت منطقه بانک جهانی نشان می دهند. دوم، آنها بر اساس در دسترس بودن جمعیت محلی ریزدانه فضایی و مجموعه داده های کاربری زمین انتخاب شدند. شکل 1یک نمای کلی از رویکرد مورد استفاده برای تجزیه و تحلیل مجموعه داده های سطح شهر را نشان می دهد. ابتدا مجموعه داده های جمع آوری شده بازرسی، تمیز و برای تجزیه و تحلیل آماده شدند. مجموعه داده‌های سطح شهر به یک سیستم ارجاع جغرافیایی مشترک نیاز داشتند و در محدوده اداری پوشانده شدند (زیرا بیشتر مجموعه داده‌های جمعیت محلی فقط برای این وسعت در دسترس هستند و نه برای یک منطقه ساخته‌شده از نظر مورفولوژیکی). سپس، داده‌های جمعیت محلی و مجموعه داده‌های GHS-POP در سلول‌های شبکه‌ای 1 کیلومتری جمع‌آوری شدند، که این یک وضوح رایج است که برای مدل‌های رشد شهری جهانی استفاده می‌شود (به عنوان مثال، [ 43 ]). برای داده‌های جمعیت محلی و داده‌های GHS-POP، ما همچنین سلول‌هایی با مقادیر جمعیت صفر را در تجزیه و تحلیل قرار دادیم تا از نتایج مغرضانه جلوگیری کنیم.
برای تخمین خطا، از معیارهای خطای مختلف استفاده کردیم (برای جزئیات، رجوع کنید به بخش 3.1 مراجعه کنید.) و الگوهای فضایی عدم قطعیت های مدل را تحلیل کرد. ارزیابی کامل هر مطالعه موردی با ارتباط تخمین جمعیت و معیارهای خطای اکتسابی با کاربری زمین انجام شد. داده‌های کاربری اراضی موجود برای هر شهر به سه طبقه، به عنوان مثال، غیرمسکونی ساخته‌شده، مسکونی ساخته‌شده و غیرساخت‌شده طبقه‌بندی شد. این امر ضروری بود زیرا داده‌های کاربری زمین در دسترس برای شهرهای مختلف دارای سطوح مختلفی از جزئیات بود. به طور کلی، یک منطقه ساخته شده با وجود سازه ها و ساختمان های مرتفع تعریف می شود، در حالی که مناطق غیر ساخته شده عمدتاً فاقد چنین ساختارهایی هستند (به عنوان مثال، مناطق کشاورزی، پارک و جنگل) (پسارسی و همکاران، 2013). مناطق مسکونی تحت سلطه کاربری های مسکونی هستند، در حالی که مناطق مسکونی غیرمسکونی تحت سلطه کاربری های غیر مسکونی (مثلاً صنایع، زیرساخت های بزرگ) هستند.

3.1. رویکرد ارزیابی دقت

چهار معیار خطای رایج برای به دست آوردن بینشی در مورد دقت مطلق و نسبی استفاده شد. ریشه میانگین مربعات خطا (RMSE)، میانگین درصد مطلق خطا (MAPE) و R2 برای درک صحت کلی داده‌های GHS-POP در مقایسه با داده‌های جمعیت محلی (بای، وانگ، وانگ، گائو، و سان، 2018؛ خو، هو، نادبی، و او، 2020؛ کالکا و بیلکا، 2020). علاوه بر این، خطای تخمین نسبی (REE) در هر شبکه برای ارزیابی توزیع فضایی خطاها با استفاده از مقادیر میانگین جمعیت در هر سلول شبکه ماهی ( جدول 3 ) استفاده شد.
برای مقایسه دقیق دو شبکه جمعیت، REE به هفت کلاس خطا طبقه بندی شد، همانطور که در جدول 4 نشان داده شده است. تفاوت +/-10٪ در هر سلول به عنوان آستانه برای تعریف تخمین دقیق استفاده شد. REE برای نشان دادن الگوهای فضایی خطاها استفاده شد زیرا امکان مقایسه تفاوت بین داده‌های GHS-POP و جمعیت محلی را در سطح سلول شبکه فراهم می‌کند. در عین حال، سایر معیارهای جدول 3 آمار میانگین را در مقیاس شهر ارائه کردند.

3.2. انتخاب مطالعات موردی

برای پشتیبانی از یک ارزیابی جهانی برای هر یک از مناطق جهانی بانک جهانی، از یک شهر نمونه استفاده شده است ( جدول 5). این انتخاب به دلیل در دسترس بودن داده‌های جمعیت محلی نسبتاً تفکیک‌شده که نزدیک به یکی از سال‌های مرجع لایه GHS هستند (یعنی 1975، 1990، 2000 و 2015) انجام شد. شهرهای انتخاب شده شامل انواع مختلف (مورفولوژی های مختلف شهری)، به عنوان مثال، شهرهای ساحلی (به عنوان مثال، جاکارتا) و داخلی (به عنوان مثال، Enschede)، کلان شهرها (به عنوان مثال، سائوپائولو) و شهرهای ثانویه (کوماسی)، قطب های اقتصادی (به عنوان مثال، نیویورک). ) و شهرهای دارای تحولات غیررسمی (مانند کابل). در مواردی که داده‌های جمعیت محلی با سال مرجع دقیق GHS-POP مطابقت نداشت، داده‌های جمعیت محلی برای مقایسه با GHS-POP با استفاده از معادلات زیر پیش‌بینی شد: معادله (1) – نرخ رشد و معادله (2) – پیش بینی جمعیت

r=Lن (پتیپ0)تی
پتی=پ0×هrتی

که در آن t = مقدار در زمان GHS-POP، 0 مقدار در شروع، r نرخ رشد و t تعداد سال است.

داده های جمعیت محلی تجمیع شده در شبکه 1 کیلومتری لایه GHS-POP در نهایت با جمعیت مدل شده با استفاده از پنج معیار خطای انتخاب شده مقایسه شد ( بخش 3.1 ).

3.3. مقایسه مطالعات موردی: الگوهای فضایی عدم قطعیت

برای تجزیه و تحلیل الگوهای فضایی عدم قطعیت برای همه شهرها، نقشه‌های کاربری محلی به دست آمد. برای اهداف سازگاری، داده‌های کاربری زمین به مسکونی، غیرمسکونی ساخته‌شده و غیرساخت‌شده مجدداً طبقه‌بندی شدند. برای هر یک از این کلاس ها، REE محاسبه شد. این امکان را برای ارزیابی رابطه بین انواع کاربری زمین و عدم قطعیت فراهم کرد. در چهار شهر (کوماسی، جاکارتا، کابل و قاهره)، طبقه مسکونی بیشتر به رسمی و غیررسمی تقسیم شد تا عدم قطعیت‌های مختلف بررسی شود.

4. نتایج

نتایج به صورت مقایسه ای ارائه شده است. برای تجزیه و تحلیل الگوهای کلی خطاها و ویژگی های هر شهر.

4.1. برآورد خطای کلی در هر مطالعه موردی

برآورد خطای کلی در جدول 6 دو الگوی متمایز را نشان می دهد. اول از همه، شهرها در HIC ها تناسب مدل بهتری دارند، به عنوان مثال، مقادیر R 2 در مقایسه با شهرهای کشورهای با درآمد پایین و متوسط ​​(LMICs) بیشتر است. تنها استثنا در اینجا سائوپائولو بود، با R 2مقدار 0.86. برزیل سرشماری بسیار توسعه یافته ای دارد که به طور منظم انجام می شود. برای چهار شهر در LMICها، مدل برازش متوسط ​​تا ضعیف را نشان داد. دوم، در اکثر شهرها، جمعیت مدل شده (GHS-POP) داده های جمعیت محلی را دست کم گرفت. این بدان معناست که جمعیت مدل شده کمتر از جمعیت واقعی است. با این حال، دو شهر با این روند مخالفت کردند: در Enschede و کابل، جمعیت مدل‌سازی شده معمولاً خیلی زیاد بود. در Enschede، این امر عمدتاً در حومه منطقه شهری رخ می دهد، در حالی که در کابل بیشتر در مکان های مرکزی رخ می دهد.

4.2. الگوهای فضایی خطاها

برای مقایسه داده‌های جمعیت محلی با مدل GHS-POP، شکل 2 a-c الگوهای فضایی مقادیر جمعیت (در سلول‌های شبکه 1×1 کیلومتر) و خطاهای تخمین نسبی (REE) را نشان می‌دهد. این توزیع جمعیت را در سطح شبکه در سراسر شهرها نشان می دهد، و الگوهای مشابهی را بین مقادیر تخمینی و اندازه گیری نشان می دهد. به طور کلی، توزیع جمعیت GHS-POP از ویژگی های اصلی شهر پیروی می کند. در سراسر شهرها، حومه ها بیش از حد برآورد شد، در حالی که بخش های مرکزی بیشتر دست کم گرفته شدند. در چندین شهر، نواحی تجاری و صنعتی نیز بیش از حد قابل توجهی را نشان دادند که بیشتر در کابل و جاکارتا قابل مشاهده است. به عنوان مثال، در جاکارتا، منطقه بندر توسط GHS-POP بسیار بیش از حد برآورد شد.

4.3. استفاده از زمین و روابط توزیع جمعیت

برای تجزیه و تحلیل بیشتر رابطه بین خطاها و کاربری‌های زمین، REE برای انواع مختلف کاربری زمین در سطح شبکه سلولی محاسبه شد. نتایج ( شکل 3) نشان می دهد که مناطق ساخته شده غیرمسکونی بیش از حد برآورد می شوند. این یک نتیجه آشکار از عدم استفاده از لایه کاربری زمین به عنوان بخشی از رویکرد مدل‌سازی است. به طور کلی، مناطق تجاری، صنعتی و فعالیت های زیرساختی/حمل و نقلی (به عنوان مثال، بنادر) بیش از حد برآورد شده بودند. مناطق غیر ساخته شده نیز اغلب بیش از حد تخمین زده می شدند، زیرا ساختارهای کوچکی که توسط GHSL شناسایی می شدند، که در بسیاری از موارد مسکونی نیستند، یا سکونتگاه های پراکنده کوچک با تراکم جمعیت بسیار کمتر که توسط GHS-POP مدل سازی شده است. دو شهر نتایج متفاوتی را نشان دادند. در کابل و سائوپائولو، مناطق غیر ساخته شده دست کم گرفته می شوند. در هر دو شهر، تحولات پراکنده در حومه آنها به خوبی توسط لایه GHSL ثبت نشده است. در مورد سائوپائولو، اشتباهات ناشی از پوشش گیاهی متراکم بود. و در کابل با پیشرفت های غیررسمی در شیب های پلکانی (زمین سنگی با تضاد کمی بین ساختمان ها و صخره ها). برای شهرهایی با سکونتگاه‌های غیررسمی بزرگ (ما سائوپائولو را حذف کردیم زیرا بیشتر مناطق غیررسمی بسیار کوچکتر از 1 کیلومتر هستند.2 ) حوزه های غیررسمی حتی در این مقیاس تحلیل خشن معمولا دست کم گرفته می شوند. در مجموع می بینیم که به دلیل برآورد بیش از حد جمعیت در مناطق غیرمسکونی، مناطق مسکونی و به ویژه مناطق مسکونی پرتراکم (مانند مناطق غیررسمی) دست کم گرفته شدند.

5. بحث

5.1. مسائل رایج در همه مطالعات موردی چیست؟

برای الگوهای خطای عمومی ( جدول 7ما مشاهده کردیم که شهرهای کشورهای با درآمد متوسط ​​بالا (UMIC) و LMICها با سیستم‌های جمع‌آوری داده‌های سرشماری مکرر، باز و به خوبی تثبیت شده با داده‌های GHS-POP در مقایسه با شهرهایی با فراوانی‌های سرشماری پایین بهتر مدل‌سازی شدند. شهرهای پیچیده در LMICها که تحت تسلط توسعه‌های غیررسمی (زاغه‌نشین) در مقیاس بزرگ هستند، خطاهای تخمینی زیادی داشتند. مسائل مشترک مشاهده شده در همه مطالعات موردی مربوط به خطاهای تخمینی به دلیل مناطق بزرگ ساخته شده غیرمسکونی است که تخمین های جمعیتی آنها به اشتباه توسط لایه GHS-POP اختصاص داده شده است. علاوه بر این، مناطق با تراکم بالا (به عنوان مثال، سکونتگاه های غیررسمی) اغلب دست کم گرفته می شدند. عدم وجود یک نقشه اساسی کاربری زمین در رویکرد مدل سازی GHS-POP باعث ایجاد یک مشکل اساسی می شود، به عنوان مثال، بسیاری از جمعیت به مناطق مسکونی غیرمسکونی اختصاص داده شده است در حالی که جمعیت مناطق مسکونی با تراکم بالا دست کم گرفته شده است. به طور متوسط ​​جهانی، حدود 25 درصد از سلول های شبکه شهری دارای جمعیت تخمینی درستی (با 10+/-٪) بودند، در حالی که 75 درصد از سلول های شبکه شهری به اشتباه تخمین زده شدند. این اعداد نشان دهنده عدم قطعیت های عمیق در استفاده از چنین داده هایی به عنوان ورودی برای مدل های شهری است، زیرا 75 درصد مناطق شهری در این مطالعه به خوبی مدل سازی نشده اند.
به طور کلی، توسعه پراکنده در حاشیه شهرها بیش از حد و دست کم گرفتن را نشان می دهد ( شکل 4 ). مناطق کم تراکم کم در واحدهای سرشماری بزرگ، با فرض تراکم همگن و بدون در نظر گرفتن مکان‌های سکونت (در داده‌های سرشماری)، احاطه شده‌اند، در حالی که GHS-POP می‌تواند این تغییرات تراکم را بهتر ثبت کند. با این حال، وضوح لایه GHSL هنوز برای ثبت توسعه در مقیاس کوچک بسیار درشت است و تمایل دارد مناطق ساخته شده را بیش از حد پیش بینی کند [ 44 ].
یکی دیگر از مشکلات عمده مشاهده شده با داده های GHS-POP ( شکل 5 ) به تخمین بیش از حد مناطق غیر مسکونی (به عنوان مثال، زیرساخت های حمل و نقل بزرگ، مناطق صنعتی) مربوط می شود. این تخمین بیش از حد به دست کم گرفتن مناطق مسکونی با تراکم متوسط ​​تا زیاد کمک می کند. بسیاری از مناطق مسکونی با تراکم متوسط ​​تا زیاد دارای سازه های مرتفع هستند که توسط مدل GHS-POP گرفته نشده است.

5.2. توصیه هایی برای مدل سازان داخلی در هنگام استفاده از داده ها چیست؟

رشد شهری جهانی و مدل‌های ساخته‌شده به داده‌های جمعیتی به عنوان ورودی نیاز دارند. با این حال، ما نشان داده‌ایم که خطاهای موجود در چنین داده‌هایی بعد جغرافیایی دارند. به طور کلی، بر اساس این مطالعات موردی، مشاهده کردیم که شهرهای HIC و شهرهایی با داده‌های سرشماری خوب، به طور کلی، خطاهای مدل بسیار کمتری در مقایسه با شهرهای LMIC دارند. با این حال، به‌ویژه برای شهرهای LMIC، مدل‌های ساخته‌شده برای درک توسعه‌های شهری اغلب برنامه‌ریزی نشده و برای پیش‌بینی تحولات آینده بسیار مرتبط هستند ( شکل 6 ). با توجه به ماهیت مدل داسیمتری باینری ساده برای GHS-POP، این داده ها با اخطارهایی برای مدل های ساخته شده همراه هستند. GHS-POP تمایل دارد مناطق پر تراکم را دست کم بگیرد و مناطق کم جمعیت را بیش از حد برآورد کند [ 34]. نتیجه مشابهی برای داده های GHS-POP در لهستان و پرتغال مشاهده شده است [ 39 ]. بنابراین، سطح تراکم جمعیت شهری دارای تعصب است. یک مدل ساخته شده ممکن است به اشتباه تراکم نواحی مرکزی را پیش‌بینی کند، جایی که تراکم واقعی از قبل بسیار اشباع شده است، در حالی که جمعیت در حومه‌ها را فرض می‌کند، جایی که در واقع هیچ یا بسیار کمی توسعه روستایی پراکنده یافت می‌شود. همچنین ممکن است توسعه جدید را در مناطق اطراف که در واقع هیچ کس در حال حاضر زندگی نمی کند، پیش بینی کند.

5.3. توصیه هایی برای مدل سازان جمعیت برای بهبود مدل های خود چیست؟

به طور مطلوب، گنجاندن داده‌های کاربری زمین در حل بسیاری از مشکلات مشاهده‌شده در داده‌های GHS-POP مفید خواهد بود. این امر باعث کاهش خطاها در مناطق غیر مسکونی ساخته شده می شود. با این حال، مجموعه داده‌های کاربری زمین (هنوز) به آسانی برای بسیاری از نقاط جهان در دسترس نیستند، و در صورت وجود (به عنوان مثال، https://wri-datalab.earthengine.app/view/urbanlanduse (در 15 ژوئن 2022) آنها ممکن است به راحتی قابل مقایسه نباشند، ممکن است فاقد اعتبار باشند و ممکن است توسعه های غیررسمی را حذف یا به اندازه کافی ثبت نکنند. در اصل، داده های جهانی کاربری زمین در حال توسعه هستند که امکان پوشاندن مناطق ساخته شده غیرمسکونی (مانند مناطق صنعتی) را فراهم می کند. و همچنین لایه های جدیدی که تخمینی از ارتفاع ساختمان را ارائه می دهند (به عنوان مثال، [ 45 ، 46]).
برای مقابله با تنوع جهانی در دسترس بودن داده ها، ترکیبی از رویکردهای بالا به پایین و پایین به بالا ضروری خواهد بود. با این حال، با وجود افزایش مستمر در مدل‌سازی جمعیت، اکثر مدل‌ها از بالا به پایین هستند. به طور خاص، مدل‌های سبک از بالا به پایین (مانند GWP، GHS-POP و GRUMP) در مقیاس جهانی مناسب‌تر فرض می‌شوند، زیرا کمتر به داده‌های جانبی متکی هستند و بنابراین، وابستگی شدیدی به ورودی ندارند. کیفیت داده ها (در مقایسه با رویکردهای بسیار مدل شده، به عنوان مثال، WorldPop). با این حال، ما نشان داده‌ایم که حتی برای داده‌های جمعیت با مدل‌سازی سبک (یعنی GSH-POP)، تغییرات در داده‌های ورودی منجر به تغییرات خطای بزرگی می‌شود.
مدل‌های پایین به بالا به‌عنوان راه‌حلی برای مناطقی با سرشماری غایب یا نادر در نظر گرفته می‌شوند، زیرا چنین مدل‌هایی را می‌توان با استفاده از متغیرهای فضایی جهانی که به طور فزاینده‌ای در دسترس هستند (به عنوان مثال، بر اساس داده‌های زمین فضایی باز و رصد زمین) ایجاد کرد. با این حال، هر گونه فرضیات مدل باید با دقت انجام شود. به عنوان مثال، گنجاندن ردپاهای ساختمانی به طور فزاینده در دسترس (به عنوان مثال، ساختمان های باز Google) امیدوارکننده است، اما حذفیات در مقیاس بزرگ در این مجموعه داده ها مشاهده می شود، به ویژه برای مناطق غیررسمی با تراکم بالا. علاوه بر این، این فرض که چراغ‌های شبانه حضور سکونتگاه‌های انسانی را نشان می‌دهند نیز می‌تواند در مناطقی که به شبکه رسمی برق متصل نیستند گمراه‌کننده باشد. بنابراین، کیفیت متغیرهای کمکی در سراسر جهان متفاوت است و تعمیم‌پذیری هر تلاش مدل‌سازی جمعیت را تعیین می‌کند. در حال حاضر، در دسترس بودن داده ها و ثبات متغیرهای کمکی در حال بهبود است. اینها فرصت های جدیدی را برای مدل سازی جمعیت فراهم می کند. با این حال، اغلب داده های با کیفیت بالاتری در HIC ها نسبت به LMIC ها وجود دارد، جایی که داده ها اغلب در دسترس نیستند. مطالعات بیشتر می تواند عدم قطعیت مدل کلی را به گونه ای ارزیابی کند که توسط داده های سرشماری محدود نشود (به عنوان مثال، با استفاده از سرشماری های کوچک). برای درک اینکه چگونه خطاهای ذاتی در داده‌های جانبی مختلف بر فرآیند مدل‌سازی تأثیر می‌گذارند، تلاش‌هایی لازم است. علاوه بر این، داده‌های جمعیتی جدید در دسترس (به عنوان مثال، انتشار GHS-POP ژوئیه 2022 [ مطالعات بیشتر می تواند عدم قطعیت مدل کلی را به گونه ای ارزیابی کند که توسط داده های سرشماری محدود نشود (به عنوان مثال، با استفاده از سرشماری های کوچک). برای درک اینکه چگونه خطاهای ذاتی در داده‌های جانبی مختلف بر فرآیند مدل‌سازی تأثیر می‌گذارند، تلاش‌هایی لازم است. علاوه بر این، داده‌های جمعیتی جدید در دسترس (به عنوان مثال، انتشار GHS-POP ژوئیه 2022 [ مطالعات بیشتر می تواند عدم قطعیت مدل کلی را به گونه ای ارزیابی کند که توسط داده های سرشماری محدود نشود (به عنوان مثال، با استفاده از سرشماری های کوچک). برای درک اینکه چگونه خطاهای ذاتی در داده‌های جانبی مختلف بر فرآیند مدل‌سازی تأثیر می‌گذارند، تلاش‌هایی لازم است. علاوه بر این، داده‌های جمعیتی جدید در دسترس (به عنوان مثال، انتشار GHS-POP ژوئیه 2022 [47 ]) باید با سایر داده های جمعیتی حتی دقیق تر (مانند HRS) مقایسه شود.

6. نتیجه گیری

تجزیه و تحلیل ما از داده‌های GHS-POP برای چندین شهر که مناطق اصلی جهان را نشان می‌دهند، تفاوت‌های قابل‌توجهی را در برازش مدل و خطاهای تخمین نشان می‌دهد. به طور کلی، جمعیت در شهرهای HIC و UMIC بهتر برآورد شد (حدود 35٪ از سلول های شبکه شهری در 1 کیلومتر به درستی تخمین زده شدند) با برازش مدل بهتر ( R2بالاتر از 0.7) در مقایسه با شهرهای LMIC (حدود 15٪ از سلول های شبکه شهری در 1 کیلومتر به درستی تخمین زده شدند). در اکثر شهرهای LMIC، جمعیت در مناطق پر تراکم (اغلب مناطق غیررسمی) به خوبی جذب نشده بودند. علاوه بر این، در تمام شهرها، مدل تمایلی به تخصیص نادرست جمعیت به مناطق ساخته شده غیرمسکونی نشان داد. علاوه بر این، برای همه شهرها، جمعیت در مناطق مرتفع ساخته شده به خوبی ثبت نشده است، زیرا هیچ اطلاعات ارتفاع ساختمان (حجم ساختمان) در مدل استفاده نشده است. علاوه بر این، تخمین جمعیت GHS-POP با دقت نگاشت ساخته شده لایه GHSL محدود شد (به عنوان مثال، مشکلات بزرگی در مورد کابل مشاهده شد). بنابراین، برای بهبود لایه GHS-POP، استفاده از یک لایه اساسی که تخصیص به مناطق مسکونی را محدود می کند، مهم است.

پیوست اول

نام مجموعه داده مفهوم جمعیت مواد و روش ها وضوح منبع سال ها پوشش داده های جانبی خط مشی توزیع
Gridded of the World V4 شبانه وزنی مساحتی 1 کیلومتر دانشگاه کلمبیا – مرکز بین‌المللی شبکه اطلاعات علوم زمین (CIESIN) https://sedac.ciesin.columbia.edu/data/collection/gpw-v4 (دسترسی در 15 ژوئن 2022) 2000، 2005، 2010، 2015، 2020 جهانی ☑ *7،8 دسترسی آزاد
جمعیت جهانی سکونتگاه انسانی (GHS-POP) شبانه مدل داسیمتری باینری (با استفاده از GHSL ساخته شده و جمعیت سرشماری) 250 متر
1 کیلومتر
مرکز تحقیقات مشترک کمیسیون اروپا (JRC) و CIESIN-دانشگاه کلمبیا
https://ghsl.jrc.ec.europa.eu/ghs_pop.php (دسترسی در 15 ژوئن 2022)
1975، 1990، 2000، 2015 جهانی ☑ *2 دسترسی آزاد
پروژه جهانی نقشه برداری شهری روستایی (GRUMP) شبانه مدل داسیمتری باینری (با استفاده از چراغ‌های شبانه DMSP-OLS و داده‌های جمعیت سرشماری) 1 کیلومتر CIESIN; موسسه تحقیقات بین‌المللی سیاست غذایی (IFPRI)، بانک جهانی، مرکز بین‌المللی کشاورزی گرمسیری (CIAT) https://sedac.ciesin.columbia.edu/data/collection/grump-v1 (دسترسی در 15 ژوئن 2022) 1990، 1995، 2000 جهانی ☑ *4،7،8،9 دسترسی آزاد
پایگاه داده تاریخچه شبکه های جمعیتی محیط جهانی (HYDE)، نسخه 3.1 شبانه مدل داسیمتری صریح فضایی (با استفاده از آمار جمعیت تاریخی، اراضی زراعی و مرتع، اطلاعات ماهواره ای و الگوریتم تخصیص خاص) 10 کیلومتر آژانس ارزیابی زیست‌محیطی هلند (PBL) https://themasites.pbl.nl/tridion/en/themasites/hyde/download/index-2.html (دسترسی در 15 ژوئن 2022) 10000 قبل از میلاد تا 2015 جهانی ☑ *1 دسترسی آزاد
پایگاه داده جمعیت جهانی LandScan محیط مدل داسیمتری چند متغیره (با استفاده از داده های مکانی و تصاویر برای تخصیص جمعیت به هر کشور و منطقه) 1 کیلومتر آزمایشگاه ملی اوک ریج (ORNL) https://landscan.ornl.gov/ (دسترسی در 15 ژوئن 2022) 2000–2017 (انتشار سالانه) جهانی (100 متر برای 23 کشور موجود است) ☑ *1–9 پولی / رایگان برای هدف تحقیق
لایه حل با وضوح بالا (HRSL) شبانه داسیمتری باینری 30 متر فیس بوک، CIESIN، و بانک جهانی https://ciesin.columbia.edu/data/hrsl/ (دسترسی در 15 ژوئن 2022) 2015–2019 140 کشور ☑ *1،2،3،5،7،8 دسترسی آزاد
برآورد جمعیت جهان (WPE) شبانه توزیع مجدد داسیمتری (هوشمند) 150 متر
250 متر
موسسه تحقیقات سیستم محیطی (ESRI) https://sites.google.com/ciesin.columbia.edu/popgrid/find-data/esri (دسترسی در 15 ژوئن 2022) 2013، 2015 و 2016 (150 متر) جهانی ☑ *1،3،8،9 پرداخت شده
ورلد پاپ شبانه داسیمتریک جنگل تصادفی 100 متر WorldPop، دانشگاه ساوتهمپتون https://www.worldpop.org/ (دسترسی در 15 ژوئن 2022) 2000–2020 سالهای جهانی و خاص کشور ☑ *1–9 دسترسی آزاد
LandScan HD محیط 100 متر آزمایشگاه ملی اوک ریج https://landscan.ornl.gov/ (دسترسی در 15 ژوئن 2022) مشخص نیست (متغیر) 23 کشور ☑ *1–9 پولی / رایگان برای اهداف تحقیقاتی
*1 پوشش/کاربری زمین، *2 ساخته شده، *3 جاده، *4 چراغ شبانه، *5 زیرساخت، *6 داده محیطی/توپوگرافی، *7 منطقه حفاظت شده، *8 آب، *9 شهر یا منطقه شهری .

منابع

  1. سازمان ملل. آمار جمعیتی و اجتماعی. در دسترس آنلاین: https://unstats.un.org/unsd/demographic-social/census/document-resources/ (دسترسی در 14 دسامبر 2020).
  2. بو، جی. دارین، ای. Leasure, DR; دولی، کالیفرنیا؛ چمبرلین، منابع انسانی؛ Lázár، AN; تشیرهارت، ک. سینا، سی. هاف، NA; فولر، تی. و همکاران برآورد جمعیت با وضوح بالا با استفاده از داده‌های نظرسنجی خانوار و ردپای ساختمان. نات. اشتراک. 2022 ، 13 ، 1330. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  3. وبر، EM; سیمن، وی. استوارت، RN; پرنده، تی جی; تاتم، ای جی; مک کی، جی جی؛ بهادوری، BL; موهل، جی جی. Reith، نقشه برداری جمعیت مستقل از سرشماری AE در شمال نیجریه. سنسور از راه دور محیط. 2018 ، 204 ، 786-798. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  4. لیک، اس. Uhl، JH; بالک، دی. جونز، ب. ارزیابی دقت لایه‌های زمین ساخته‌شده چند زمانی در مسیرهای روستایی-شهری در ایالات متحده. سنسور از راه دور محیط. 2018 ، 204 ، 898-917. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  5. کاوادا، ا. مترنیخت، جی. کربلات، اف. موداو، ن. هالدورسون، ام. للداپارساد، س. فریدل، ال. برگزار شد، ا. Chuvieco، E. به سوی تحقق اهداف توسعه پایدار با استفاده از مشاهدات زمین. سنسور از راه دور محیط. 2020 , 247 , 111930. [ Google Scholar ] [ CrossRef ]
  6. بخش آمار سازمان ملل متحد گزارش اهداف توسعه پایدار 2018. در دسترس آنلاین: https://unstats.un.org/sdgs/report/2018/overview/ (دسترسی در 9 دسامبر 2019).
  7. انگستروم، آر. نیوهاوس، دی. Soundararajan, V. تخمین تراکم جمعیت منطقه کوچک با استفاده از داده های پیمایشی و تصاویر ماهواره ای: یک کاربرد در سریلانکا . بانک جهانی: واشنگتن، دی سی، ایالات متحده آمریکا، 2019. [ Google Scholar ]
  8. لوید، سی تی. چمبرلین، اچ. کر، دی. یتمن، جی. پیستولسی، ال. استیونز، FR; Gaughan، AE; نیوز، جی جی; هورنبی، جی. مک مانوس، ک. و همکاران مجموعه داده‌های جهانی هماهنگ مکانی-زمانی برای تولید مجموعه داده‌های توزیع جمعیت شبکه‌ای با وضوح بالا. داده های بزرگ زمین 2019 ، 3 ، 108-139. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  9. کیو، جی. بائو، ی. یانگ، ایکس. وانگ، سی. هنوز.؛ استین، ا. جیا، ص. نقشه برداری جمعیت محلی با استفاده از مدل جنگل تصادفی بر اساس داده های سنجش از راه دور و اجتماعی: مطالعه موردی در ژنگژو، چین. Remote Sens. 2020 , 12 , 1618. [ Google Scholar ] [ CrossRef ]
  10. تامسون، DR; استیونز، FR; Ruktanonchai، NW; تاتم، ای جی; Castro، MC GridSample: یک بسته R برای تولید واحدهای نمونه گیری اولیه نظرسنجی خانگی (PSUs) از داده های جمعیت شبکه ای. بین المللی J. Health Geogr. 2017 ، 16 ، 25. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  11. تامسون، DR; رودا، دی. تاتم، ای جی; کاسترو، MC نمونه‌گیری از نظر جمعیتی گریدد: بررسی محدوده سیستماتیک دستور کار تحقیقاتی میدانی و استراتژیک. بین المللی J. Health Geogr. 2020 ، 19 ، 34. [ Google Scholar ] [ CrossRef ]
  12. شیاوینا، م. فریره، اس. MacManus، K. GHS Population Grid Multitemporal (1975، 1990، 2000، 2015) R2019A ; کمیسیون اروپا، مرکز تحقیقات مشترک (JRC)، ویرایش. کمیسیون اروپا: بروکسل، بلژیک، 2019. [ Google Scholar ]
  13. Badmos, OS; رینو، ا. Callo-Concha، D. گریو، ک. یورگنز، سی. شبیه سازی رشد محله فقیر نشین در لاگوس: ادغام مدل مبتنی بر قانون و مبتنی بر تجربی. محاسبه کنید. محیط زیست سیستم شهری 2019 ، 77 ، 101369. [ Google Scholar ] [ CrossRef ]
  14. پرز-مولینا، ای. اسلیوزاس، آر. فلاک، جی. Jetten، V. توسعه یک مدل اتوماتای ​​سلولی رشد شهری برای اطلاع از سیاست فضایی برای کاهش سیل: مطالعه موردی در کامپالا، اوگاندا. محاسبه کنید. محیط زیست سیستم شهری 2017 ، 65 ، 53-65. [ Google Scholar ] [ CrossRef ]
  15. ندوویزو، جی. اسلیوزاس، آر. کوفر، ام. مدلسازی رشد شهری در شهر کیگالی رواندا. رواندا J. 2016 ، 1 ، 82-87. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  16. Wardrop، NA; Jochem، WC; پرنده، تی جی; چمبرلین، منابع انسانی؛ کلارک، دی. کر، دی. بنگتسسون، ال. جوران، اس. سیمن، وی. Tatem، AJ برآوردهای جمعیتی تفکیک مکانی در غیاب داده‌های سرشماری ملی نفوس و مسکن. Proc. Natl. آکادمی علمی USA 2018 , 115 , 3529. [ Google Scholar ] [ CrossRef ] [ PubMed ][ نسخه سبز ]
  17. Carr-Hill، R. میلیون ها نفر از دست رفته و اندازه گیری پیشرفت توسعه. توسعه دهنده جهانی 2013 ، 46 ، 30-44. [ Google Scholar ] [ CrossRef ]
  18. روی، دی. لیز، MH; پففر، ک. Sloot، P. مدل‌سازی تأثیر چرخه زندگی خانوار بر محله‌های فقیر نشین در بنگلور. محاسبه کنید. محیط زیست سیستم شهری 2017 ، 64 ، 275-287. [ Google Scholar ] [ CrossRef ]
  19. Openshaw, S. مسئله واحد مساحتی قابل تغییر . Geobooks: Norwich، UK، 1984. [ Google Scholar ]
  20. Balk، DL; دایچمن، یو. یتمن، جی. پوزی، اف. هی، SI; نلسون، الف. تعیین توزیع جهانی جمعیت: روش ها، کاربردها و داده ها. در پیشرفت در انگل شناسی ; Hay, SI, Graham, A., Rogers, DJ, Eds. مطبوعات دانشگاهی: کمبریج، MA، ایالات متحده آمریکا، 2006; جلد 62، ص 119–156. [ Google Scholar ]
  21. داکسی ویتفیلد، ای. مک مانوس، ک. آدامو، اس بی؛ پیستولسی، ال. اسکوایرز، جی. بورکوفسکا، او. باپتیستا، اس آر با بهره گیری از دسترسی بهبودیافته داده های سرشماری: اولین نگاه به جمعیت شبکه بندی شده جهان، نسخه 4. پاپ. Appl. Geogr. 2015 ، 1 ، 226-234. [ Google Scholar ] [ CrossRef ]
  22. فریره، اس. مکمانوس، ک. پسری، م. داکسی ویتفیلد، ای. میلز، جی. توسعه شبکه‌های جمعیت جهانی چندزمانی باز و رایگان جدید با وضوح 250 متر . داده های جغرافیایی در جهان در حال تغییر. انجمن آزمایشگاه های اطلاعات جغرافیایی در اروپا (AGILE) (سازمان دهنده); AGILE: هلسینکی، فنلاند، 2016. [ Google Scholar ]
  23. چن، آر. یان، اچ. لیو، اف. دو، دبلیو. یانگ، ی. مجموعه داده های چندگانه جمعیت جهانی: تفاوت ها و ویژگی های توزیع فضایی. ISPRS Int. J. Geo-Inf. 2020 ، 9 ، 637. [ Google Scholar ] [ CrossRef ]
  24. مک اودی، سی. جونز، R. اطلس تاریخ جمعیت جهان . Pengium Books Ltd.: New York, NY, USA; آلن لین: نیویورک، نیویورک، ایالات متحده آمریکا، 1979. [ Google Scholar ]
  25. هنوز.؛ ژائو، ن. یانگ، ایکس. اویانگ، ز. لیو، ایکس. چن، کیو. هو، ک. یو، دبلیو. چی، جی. لی، ز. و همکاران بهبود نقشه‌برداری جمعیت برای چین با استفاده از داده‌های سنجش از راه دور و نقاط مورد علاقه در یک مدل جنگل‌های تصادفی. علمی کل محیط. 2019 ، 658 ، 936–946. [ Google Scholar ] [ CrossRef ]
  26. استیونز، FR; Gaughan، AE; نیوز، جی جی; کینگ، آ. سوریچتا، ا. لینارد، سی. Tatem، AJ مقایسه دو مجموعه داده پوشش زمین منطقه ساخته شده جهانی در روش هایی برای تفکیک جمعیت انسانی در یازده کشور از جنوب جهانی. بین المللی جی دیجیت. زمین 2020 ، 13 ، 78-100. [ Google Scholar ] [ CrossRef ]
  27. کیت، او. لودکه، م. Reckien، D. تعریف چشم گاو: ارزیابی جمعیت زاغه‌نشینی به کمک تصاویر ماهواره‌ای در حیدرآباد، هند. جئوگر شهری. 2013 ، 34 ، 413-424. [ Google Scholar ] [ CrossRef ]
  28. شوارتز، ن. فلاک، جی. Sliuzas، RV مدل سازی اثرات ارتقاء شهری بر پویایی جمعیت. محیط زیست مدل. نرم افزار 2016 ، 78 ، 150-162. [ Google Scholar ] [ CrossRef ]
  29. وو، سی. موری، AT برآورد جمعیت با استفاده از تصاویر نقشه‌بردار موضوعی پیشرفته Landsat. Geogr. مقعدی 2007 ، 39 ، 26-43. [ Google Scholar ] [ CrossRef ]
  30. رونی، ر. Jia, P. یک رویکرد مدل‌سازی جمعیت بهینه با استفاده از رگرسیون وزن‌دار جغرافیایی بر اساس داده‌های سنجش از دور با وضوح بالا: مطالعه موردی در شهر داکا، بنگلادش. Remote Sens. 2020 , 12 , 1184. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  31. بریمن، ال. جنگل های تصادفی. ماخ فرا گرفتن. 2001 ، 45 ، 5-32. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  32. Gaughan، AE; استیونز، FR; هوانگ، ز. نیوز، جی جی; سوریچتا، ا. لای، اس. بله، X. لینارد، سی. هورنبی، جنرال موتورز؛ هی، SI; و همکاران الگوهای فضایی و زمانی جمعیت در سرزمین اصلی چین، 1990 تا 2010. علم. داده 2016 ، 3 ، 160005. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  33. لیک، اس. Gaughan، AE; آدامو، اس بی؛ د شربینین، ا. بالک، دی. فریره، اس. رز، ا. استیونز، FR; بلانکسپور، بی. فرای، سی. و همکاران تخصیص فضایی جمعیت: مروری بر محصولات داده‌های جمعیت شبکه‌ای در مقیاس بزرگ و تناسب آنها برای استفاده. سیستم زمین علمی داده 2019 ، 11 ، 1385-1409. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  34. تامسون، DR; Gaughan، AE; استیونز، FR; یتمن، جی. الیاس، پ. چن، آر. ارزیابی دقت برآوردهای جمعیت شبکه‌ای در زاغه‌ها: مطالعه موردی در نیجریه و کنیا. علوم شهری 2021 ، 5 ، 48. [ Google Scholar ] [ CrossRef ]
  35. کوفر، م. پرسلو، سی. پففر، ک. اسلیوزاس، آر. رائو، وی. آیا ما جمعیت جهان زاغه را دست کم می گیریم؟ در مجموعه مقالات رویداد مشترک سنجش از دور شهری 2019 (JURSE)، وان، فرانسه، 22 تا 24 مه 2019؛ صص 1-4. [ Google Scholar ]
  36. اسلیوزاس، آر. کوفر، م. کمپر، ​​تی. ارزیابی کیفیت محصولات لایه سکونت انسانی جهانی برای کامپالا، اوگاندا. در مجموعه مقالات رویداد مشترک سنجش از دور شهری 2017 (JURSE)، دبی، امارات متحده عربی، 6 تا 8 مارس 2017؛ صص 1-4. [ Google Scholar ]
  37. اوبرشت، سی. گوناسکرا، ر. اونگار، ج. Ishizawa، O. شناسایی جغرافیایی جهانی سازگار و در عین حال سازگار الگوهای شهری-روستایی: مدل iURBAN. سنسور از راه دور محیط. 2016 ، 187 ، 230-240. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  38. گوناسکرا، ر. ایشیزاوا، او. اوبرشت، سی. بلانکسپور، بی. موری، اس. پومونیس، ا. دانیل، جی. توسعه یک مدل مواجهه جهانی تطبیقی ​​برای پشتیبانی از تولید پروفایل‌های خطر بلایای کشور. Earth-Sci. Rev. 2015 , 150 , 594-608. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  39. کالکا، بی. Bielecka، E. ارزیابی دقت GHS-POP: مطالعه موردی لهستان و پرتغال. Remote Sens. 2020 , 12 , 1105. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  40. آذر، د. انگستروم، آر. گریسر، جی. Comenetz, J. تولید لایه‌های جمعیتی در مقیاس ریز با استفاده از تصاویر ماهواره‌ای با وضوح چندگانه و داده‌های مکانی. سنسور از راه دور محیط. 2013 ، 130 ، 219-232. [ Google Scholar ] [ CrossRef ]
  41. فریره، اس. شیاوینا، م. فلورچیک، ای جی؛ مک مانوس، ک. پسری، م. کوربن، سی. بورکوفسکا، او. میلز، جی. پیستولسی، ال. اسکوایرز، جی. و همکاران داده‌ها و روش‌های پیشرفته برای بهبود شبکه‌های جمعیتی آزاد و باز جهانی: عملی کردن «هیچ‌کس را پشت سر نگذارید». بین المللی جی دیجیت. زمین 2020 ، 13 ، 61-77. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  42. Uhl، JH; زورقین، ح. لیک، اس. بالک، دی. کوربن، سی. سیریس، وی. Florczyk، AJ افشای پیوستار شهری: مفاهیم و مقایسه متقابل از دیدگاه بین رشته‌ای. بین المللی جی دیجیت. زمین 2020 ، 13 ، 22-44. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  43. ون هویجیستی، جی. ون بمل، بی. بومن، ا. Van Rijn، F. Towards an Urban Preview: Modeling Future Urban Growth with 2UP ; آژانس ارزیابی زیست محیطی PBL هلند: لاهه، هلند، 2018. [ Google Scholar ]
  44. آگیلار، آر. Kuffer، M. محاسبات ابری با استفاده از تصاویر با وضوح بالا برای بهبود شاخص SDG در فضاهای باز. Remote Sens. 2020 , 12 , 1144. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  45. پسری، م. کوربن، سی. رن، سی. ادوارد، N. مولفه های عمودی تعمیم یافته مناطق ساخته شده از مدل های دیجیتال ارتفاعی جهانی با مدل سازی رگرسیون خطی چند مقیاسی. PLoS ONE 2021 , 16 , e0244478. [ Google Scholar ] [ CrossRef ]
  46. لی، ام. کوکس، ای. تاوبنبوک، اچ. van Vliet، J. نقشه برداری در مقیاس قاره و تجزیه و تحلیل ساختار سه بعدی ساختمان. سنسور از راه دور محیط. 2020 , 245 , 111859. [ Google Scholar ] [ CrossRef ]
  47. شیاوینا، م. فریره، اس. MacManus، K. GHS-POP R2022A-GHS Population Grid Multitemporal (1975-2030) ; کمیسیون اروپا، مرکز تحقیقات مشترک (JRC)، ویرایش. کمیسیون اروپا: بروکسل، بلژیک، 2022. [ Google Scholar ]
شکل 1. نمودار جریان روش.
شکل 2. میانگین تعداد جمعیت در توزیع شبکه ای 1×1 کیلومتر برای داده های محلی و GHS-POP و توزیع مکانی خطای تخمین نسبی (REE): ( الف ) شهرهای آفریقایی، ( ب ) شهرهای آسیایی، ( ج ) آمریکایی و اروپایی شهرها
شکل 3. نقشه های کاربری زمین و درصد هر محدوده REE در هر دسته کاربری.
شکل 4. سائوپائولو، نمونه ای از تخمین بیش از حد در یک منطقه با چگالی کم توسط GHS-POP.
شکل 5. نمونه هایی از مناطق بسیار بیش از حد و دست کم برآورد شده در Enschede.
شکل 6. نمونه هایی از مناطق بسیار بیش از حد و دست کم برآورد شده در کابل.

بدون دیدگاه

دیدگاهتان را بنویسید