1. معرفی
در سالهای اخیر، فناوری و کاربرد سنجش از دور نور در شب توجه گستردهای را به خود جلب کرده است [ 1 ، 2 ، 3 ، 4 ، 5 ، 6 ، 7 ، 8 ، 9 ، 10 ، 11 ، 12 ، 13 ، 14 ]. تصاویر نور شبانه (NTL) به دست آمده توسط فناوری سنجش از دور به طور مستقیم توزیع تشعشعات مصنوعی شبانه را نشان می دهند که یک شاخص مفید فزاینده در بررسی فعالیت های اجتماعی-اقتصادی انسان است [ 4 ، 5 ]., 6 , 7 , 8 , 9 , 10 , 11 , 12 , 13 , 14 ].
مطالعات متعدد نشان داده اند که دامنه و شدت NTL ارتباط نزدیکی با محصولات ناخالص منطقه ای (GRP) [ 6 ، 15 ، 16 ، 17 ]، اندازه و تراکم جمعیت [ 17 ، 18 ، 19 ]، شهرنشینی [ 2 ، 20 ، ] دارد. 21 ]، مصرف برق [ 1 ، 6 ، 22 ، 23 ، 24 ]، آلودگی نوری [ 25 ، 26 ، 27 ]، انتشار دی اکسید کربن (CO 2 ) 28،29 ] و بلایای انسانی و غیره [ 30 و 31 ].
مصرف برق (EPC) یک شاخص اساسی در اندازه گیری مصرف انرژی منطقه ای است که نه تنها می تواند به طور عینی وضعیت عملکرد اقتصادی را منعکس کند، بلکه تغییر ساختار صنعتی و سطح مصرف انرژی را نیز نشان می دهد. دستیابی به EPC دقیق و به موقع از اهمیت عملی زیادی در بهینه سازی تخصیص منابع توان و نظارت بر وضعیت عملکرد اقتصادی برخوردار است.
دو نوع داده NTL سنجش از راه دور، برنامه ماهواره هواشناسی دفاعی/سیستم لاین اسکن عملیاتی (DMSP/OLS) و مجموعه رادیومتر تصویربرداری مادون قرمز مرئی باند روز/شب (VIIRS DNB) روی ماهواره مشارکت قطبی ملی Suomi (SNPP) اغلب وجود داشت. برای تخمین EPC مبتنی بر سنجش از دور استفاده می شود [ 3 ، 5 ، 6 ].
داده های DMSP/OLS به دلیل پوشش زمانی طولانی آن، از سال 1992 تا 2013، به طور گسترده ای مورد استفاده قرار گرفته است، که برای تحقیقات اجتماعی و اقتصادی سری های زمانی طولانی مناسب بود [ 18 ، 23 ]. در مقایسه با دادههای DMSP/OLS، دادههای DNB VIIRS با وضوح فضایی بالاتر (15 ثانیه قوس در مقابل 30 ثانیه قوس DMSP/OLS)، فواصل زمانی کوتاهتر (ماهانه در مقابل سالانه DMSP/OLS) و رادیومتری وسیعتر برتر بود. محدوده تشخیص (عاری از مشکل اشباع)، که معمولاً نتایج تحقیقات قابل اعتمادتری را تولید می کند [ 5 ، 6 ].
الویدج و همکاران همبستگی بالایی بین DMSP/OLS NTL و EPC برای 21 کشور نشان داد [ 1 ]. چاند و همکاران تغییرات مکانی و زمانی EPC در هند طی سالهای 1993 تا 2002 با استفاده از DMSP/OLS [ 32 ] بررسی شد. او و همکاران مدلهای ساخته شده در تخمین EPC در سرزمین اصلی چین با استفاده از دادههای DMSP/OLS NTL تصحیح شده با اشباع با میانگین R تا 0.93 [ 33 ]. زی و همکاران تأثیر ثروت، شهرنشینی، فناوری، دما و الگوی NTL را بر روی رابطه بین دادههای EPC و DMSP/OLS NTL بررسی کرد و پیشنهاد کرد که EPC با تولید ناخالص داخلی سرانه بالاتر، نرخ شهرنشینی، صادرات فناوری بالا و توسعه کشاورزی کمتر افزایش یافته است. به طور کلی با دمای بالاتر و فعالیت های انسانی تراکم تر کاهش می یابد [34 ]. شی و همکاران الگوهای مکانی و زمانی مصرف برق شهری را در محدودههای فضایی مختلف، از جمله ناحیه اداری شهر، ناحیه شهر، مرکز شهری و منطقه ساختهشده شهری ارزیابی و مقایسه کرد [ 22 ].
شی و همکاران رگرسیون خطی بین EPC و 2 نوع داده NTL (DMSP/OLS و VIIRS DNB) را مقایسه کرد و ثابت کرد که مقدار R2 بالاتر با استفاده از داده های VIIRS DNB برای رگرسیون خطی به دست آمد [ 6 ]. فالچتا و همکاران اثربخشی تغییرات سالانه دادههای VIIRS DNB NTL را در پیشبینی تغییرات درون کشوری مصرف برق در کشورهای با درآمد متوسط پایین نشان داد [ 35 ].
مطالعات قبلی عمدتاً بر رابطه کمی بین دادههای NTL و متغیرهای آماری در مقیاسهای نسبتاً طولانی مدت (به ویژه یک سال) متمرکز شدهاند. با این حال، رابطه بین دادههای NTL و فعالیتهای اجتماعی-اقتصادی در مقیاسهای زمانی کوتاه، بهویژه به صورت ماهانه، به خوبی درک نشده است.
اگرچه بسیاری از محققان تحقیقات کاربردی متعددی از داده های VIIRS DNB انجام داده اند، استفاده از داده های VIIRS DNB برای تخمین EPC در مقیاس ماهانه گزارش نشده است. اگر بتوان EPC ماهانه را با استفاده از داده های سنجش از دور با دقت کافی تخمین زد، وضعیت عملکرد اقتصادی منطقه به سرعت به دست می آید و اقدامات متقابل مربوطه ممکن است برای اطمینان از توسعه پایدار اقتصاد اجتماعی اتخاذ شود. مطالعه حاضر تلاشی برای بررسی پاسخهای کمی سیگنالهای NTL مشتقشده از دادههای ماهانه VIIRS DNB به EPC در مقیاس ماهانه، با هدف ساخت مدلهایی برای تخمین EPC ماهانه با دقت بالا است.
2. مواد و روشها
2.1. منطقه و داده های مطالعه
2.1.1. منطقه مطالعه
کامپوزیتهای VIIRS DNB برای ماههای می، ژوئن، ژوئیه و آگوست حاوی پیکسلهای متعددی در مناطق با عرض جغرافیایی بالا در نیمکره شمالی بدون داده است، زیرا نور خورشید به طور جدی این مناطق را در ماههای تابستان آلوده میکند. چهارده استان جنوبی چین به عنوان موارد مطالعه در این مقاله با توجه به پوشش مکانی و زمانی دادههای VIIRS DNB ماهانه انتخاب شدند که شامل آنهویی، هوبی، هونان، جیانگ سو، جیانگشی، شانگهای، سیچوان، چونگ کینگ، یوننان، ژجیانگ، فوجیان، گوانگدونگ میشود. ، گوانگشی و گوئیژو. نمودار 1 پراکندگی استان ها در منطقه مورد مطالعه را نشان می دهد.
2.1.2. داده های نور شبانه
کامپوزیت های ماهانه بدون ابر تصاویر VIIRS NTL جمع آوری شده از دسامبر 2012 تا ژانویه 2019 در این مطالعه استفاده شد. این تصاویر از مراکز ملی اطلاعات محیطی اداره ملی اقیانوسی و جوی ( https://ngdc.noaa.gov/eog/viirs/index.html ، آخرین دسترسی در 1 آوریل 2019) بازیابی شده است. این دادهها برای حذف نورهای شفق قطبی، آتشسوزی، قایق و سایر نورهای موقت فیلتر نشدهاند. تنها دو سال از کامپوزیت های سالانه در وب سایت منتشر شد (2016 و 2017). تصاویر VIIRS مقادیر متوسط شبکهبندی شده تابش NTL انسانی (در واحدهای nW/(cm 2 ·sr) از این پس) با وضوح فضایی 15 ثانیه قوس (500 متر در خط استوا) ارائه میکنند.
دادههای NTL ژوئن 2018 بهصورت آنلاین در دسترس نبود، که با میانگین دادههای ماه مه و ژوئیه 2018 نشان داده شد. برای شناسایی بهتر، دادههای NTL بارگیریشده و دادههای NTL تخمینی ژوئن 2018 بهعنوان NTL اصلی یا NTL 0 از این پس شناسایی شدند .
2.1.3. داده های کمکی
دادههای EPC ماهانه 14 استان در منطقه مورد مطالعه از ژانویه 2013 تا دسامبر 2018 از وبسایت آماری هر دولت استان جمعآوری شده است. EPC شامل مصرف برق صنعتی و خانگی است که می تواند وضعیت اجتماعی و اقتصادی را منعکس کند.
دادههای برداری مناطق اداری استانی منطقه مورد مطالعه از وبسایت پایگاه دادههای مناطق اداری جهانی (GADM, https://gadm.org/ ) جمعآوری شده است و برای تجمیع منطقهای دادههای NTL استفاده میشود. طرح ریزی و مختصات داده های برداری با داده های DNB VIIRS مطابقت داشت.
2.2. مواد و روش ها
چهار روش اصلی برای تعیین رگرسیون بهینه بین NTL و EPC انجام شد: اول، پر کردن شکاف دادههای NTL دانلود شده. ثانیاً حذف نویز از NTL پر شده. سوم، فیلتر فضایی برای NTL حذف شده. چهارم، رگرسیون بین NTL و EPC برای هر ماه و ارزیابی رگرسیون ( شکل 2 ).
2.2.1. پر کردن شکاف داده های NTL
دادههای NTL با پوشش فضایی تقریباً کامل منطقه مورد مطالعه در تمام ماهها برای آزمایش انتخاب شدند. با این حال، هنوز مناطق بدون ارزش در شمالی ترین قسمت منطقه مورد مطالعه در ژوئن هر سال وجود داشت. این پیکسل های بدون ارزش با میانگین پیکسل های مشابه در ماه مه و جولای همان سال جایگزین شدند [ 36 ]. علاوه بر این، به دلیل عوامل مختلف، پیکسل هایی با مقادیر کمتر یا مساوی 0 nW/(cm 2 ·sr) ممکن است به طور پراکنده در تصاویر در تمام ماه ها ظاهر شوند که با مقادیر متوسط همان پیکسل ها در قبل و در گذشته جایگزین شده اند. ماه های بعدی بر اساس این فرض که نور شب باید به تدریج بین ماه های مجاور تغییر کند. داده های NTL ژوئن 2014 قبل و بعد از پر کردن شکاف به عنوان نمونه در شکل 3 نشان داده شده است.و شکل 4 به ترتیب. پس از پر کردن شکاف، پوشش داده ها و در دسترس بودن داده های NTL به طور قابل توجهی بهبود یافت. با این وجود، هنوز تعداد کمی پیکسل مساوی یا کمتر از 0 nW/(cm 2 ·sr) در تصویر وجود دارد که در فرآیند کاهش نویز بعدی مدیریت می شود.
داده های NTL پس از پر کردن شکاف برای پیکسل های کمتر یا مساوی 0 nW/(cm2 · sr) از این پس NTL g نامیده می شود .
2.2.2. حذف نویز NTL
چندین نوع پردازش بر روی دادههای NTL g اجرا شد ، از جمله حذف نویز، فیلتر متوسط، فیلتر میانه و فیلتر با مقدار متوسط.
نویز پسزمینه در دادههای VIIRS DNB وجود دارد که باید درمان شود. لی و همکاران یک داده NTL حذف شده را از طریق ضرب تصاویر NPP-VIIRS در ماسک تولید شده با تمام پیکسل های ارزش مثبت از تصاویر DMSP-OLS در سال 2010 [ 15 ] به دست آورد. ما و همکاران یک روش ساده و امکانپذیر برای حذف نویز با در نظر گرفتن میانگین درخشندگی نمونههای پیکسل دریاچه بهعنوان مقدار آستانه حذف نویز، که برابر با 0.3 nW/(cm2 · sr) است، پیشنهاد کرد [ 37 ]. با استفاده از روش پیشنهادی Ma و همکاران، دادههای NTL g با تنظیم پیکسلهای کمتر از 0.3 nW/(cm2 · sr) با 0 nW/(cm2 حذف sr)، که NTL حذفشده با آستانه نامیده میشوند، حذف نویز شدند. از 0.3 از این پس (یاNTL 1 ).
2.2.3. فیلتر فضایی
ممکن است چند پیکسل با مقدار غیرعادی بالا در دادههای NTL 1 وجود داشته باشد که به دلیل شعلههای گاز، آتشسوزی، میدانهای نفتی، آتشفشانها و غیره است. فیلترینگ به ترتیب بر روی NTL 1 اجرا شد.
فیلتر متوسط به این معنی است که مقدار پیکسل به مقدار متوسط n*n پیکسل مجاور بازنشانی می شود. نتایج میانگین فیلتر 3 × 3 و 5 × 5 به ترتیب NTL 2 و NTL 3 نامیده شد.
فیلتر میانه به این معنی است که مقدار پیکسل به مقدار میانه n * n پیکسل مجاور بازنشانی می شود. نتایج فیلتر میانه 3 × 3 و 5 × 5 به ترتیب NTL 4 و NTL 5 نامیده می شوند.
فیلتر کردن مقدار متوسط به این معنی است که مقدار پیکسل به میانگین حداکثر و حداقل مقدار n*n پیکسل مجاور بازنشانی میشود. نتایج فیلتر میان ارزش 3 × 3 و 5 × 5 به ترتیب NTL 6 و NTL 7 نامیده می شوند.
2.2.4. رگرسیون و ارزیابی
مجموع NTL هر منطقه استان برای هر نوع داده NTL ( NTL 0 – NTL 7 و NTL g ) با انباشت مقادیر تمام پیکسل ها در هر منطقه و هر ماه محاسبه شد.
دو مدل رگرسیون رایج، رگرسیون خطی و رگرسیون چند جملهای، به ترتیب بین هر مجموع دادههای NTL و EPC انجام شد.
میانگین خطای نسبی مطلق R-squared (MARE)، حداکثر خطای نسبی (MRE) و ریشه میانگین مربعات خطا (RMSE) برای نشان دادن قابلیت اطمینان رگرسیون مورد استفاده قرار گرفت که به شرح زیر است.
جایی که yمن�مننشان دهنده داده های EPC آماری نمونه اول است .yˆمن�^مننشان دهنده داده های محاسبه شده EPC از نمونه اول است . m نشان دهنده حجم نمونه هر ماه است که در این مطالعه برابر با 84 است.
برای ارزیابی کیفیت رگرسیون از مربع R و RMSE استفاده شد. هر چه R مربع بالاتر و RMSE کمتر باشد، رگرسیون قوی تر خواهد بود. MARE و MRE برای توصیف خطای تخمین مدلها مورد استفاده قرار گرفتند، که تنها به عنوان پارامترهای مرجع استفاده میشدند زیرا حداکثر R مربع، حداقل RMSE و حداقل MARE ممکن است لزوماً در همان زمان رخ ندهند.
3. نتایج
3.1. تجزیه و تحلیل کلی رگرسیون
دو نوع رگرسیون بین EPC ماهانه و نه نوع داده NTL ماهانه با تیمارهای مختلف انجام شد. در مجموع 216 معادله رگرسیون به مدت 12 ماه به دست آمد. تصمیم گیری در مورد اینکه کدام نوع رگرسیون قوی ترین و کدام نوع داده NTL در رگرسیون بهتر عمل می کند، ضروری بود تا در آینده به طور قابل اعتماد اعمال شود.
همانطور که در بالا ذکر شد، مربع R، MARE، MRE و RMSE برای توصیف کیفیت هر معادله رگرسیون استفاده شد. به منظور مقایسه پایداری این تحلیل های رگرسیون در 12 ماه از سال، میانگین پارامترهای رگرسیونی هر رگرسیون در 12 ماه محاسبه شد و در مجموع 18 گروه از مقادیر میانگین به دست آمد (در جدول 1 نشان داده شده است ).
با توجه به مقدار متوسط در جدول 1 ، تمام 18 فرمول رگرسیون به نتایج امیدوارکننده ای دست یافتند، با تمام مربع R از 0.8459 بیشتر شد و مقدار میانگین R مربع برابر با 0.8772 بود. رگرسیون خطی بین NTL 0 و EPC نسبتاً کمترین اعتماد را داشت که R مربع، MARE، MRE و RMSE به ترتیب 0.8459، 20.70، 100.64 و 486632.44 بودند. در همین حال، رگرسیون چند جمله ای بین NTL 0و EPC در 9 نوع رگرسیون چند جملهای کمترین اعتماد را نسبتاً پایینتر داشتند، که مربع R، MARE، MRE و RMSE به ترتیب 0.8607، 17.18، 92.30 و 462995.95 بودند. به عبارت دیگر، زمانی که رگرسیون خطی یا رگرسیون چند جملهای به ترتیب بین دادههای EPC و دادههای مختلف NTL انجام شد، استفاده از دادههای پردازششده NTL به طور مداوم قابل اعتمادتر از استفاده از دادههای NTL اصلی بود. این مقایسهها لزوم پردازش دادههای NTL را بهطور مناسب قبل از استفاده از آن برای تخمین EPC نشان داد، که ممکن است قابلیت اطمینان تخمین را بهبود بخشد.
همانطور که در جدول 1 نشان داده شده است ، رگرسیون چند جمله ای در قابلیت اطمینان برای رگرسیون بین هر نوع داده NTL و EPC نسبت به رگرسیون خطی برتر بود. میانگین مقادیر R مربع، MARE، MRE و RMSE نه رگرسیون خطی به ترتیب 0.8727، 18.96، 86.95 و 438650.23 بود. با این حال، میانگین مقادیر R مربع، MARE، MRE و RMSE نه رگرسیون چند جمله ای به ترتیب 0.8816، 16.38، 82.55 و 423048.08 بود. قابل توجه بود که میانگین مقدار MARE رگرسیون های چند جمله ای 13.60 درصد کمتر از رگرسیون های خطی بود. بنابراین، در مقایسه با رگرسیون خطی، رگرسیون چند جملهای میتواند نتایج دقیقتری را در تخمین EPC ماهانه بر اساس دادههای NTL به دست آورد.
در میان نه نوع داده NTL که در ساخت مدلهای رگرسیون مبتنی هستند، رگرسیون بین NTL 1 و EPC به طور پیوسته قویترین قابلیت اطمینان را در دو نوع رگرسیون نشان میدهد. میانگین مقدار R مربع رگرسیون بین NTL 1 و EPC به ترتیب در دو نوع رگرسیون به بالاترین مقدار رسید. در مقابل، سه نوع پردازش (فیلتر متوسط، فیلتر میانه، و فیلتر با مقدار متوسط) روی دادههای NTL 1 نتوانستند به طور موثر قابلیت اطمینان رگرسیون را بهبود بخشند.
بر اساس تجزیه و تحلیل فوق، رگرسیون چند جمله ای بین NTL 1 و EPC عمدتاً در بخش های زیر مورد توجه قرار می گیرد.
3.2. تجزیه و تحلیل رگرسیون ماهانه
با در نظر گرفتن NTL 1 به عنوان متغیر مستقل و EPC به عنوان متغیر وابسته، رگرسیون چند جمله ای به ترتیب 12 ماه ساخته شد و نتایج در شکل 5 نشان داده شد .
در هر نمودار، منحنی رگرسیون به طور قابل مشاهده ای روند توزیع نقاط پراکنده را منعکس می کند. اکثریت قریب به اتفاق نقاط نزدیک به منحنی های برازش بودند که خطاهای نسبی آنها کم بود. حتی در رگرسیون چند جملهای با مربع R نسبتاً کم ( شکل 5 e,j)، تنها چند نقطه نسبتاً دور از منحنیهای رگرسیون بودند، با خطاهای نسبی نسبتاً بالاتر.
معادلات رگرسیون چند جمله ای بین NTL 1 و EPC برای 12 ماه، همراه با R مربع، MARE، MRE و RMSE مربوطه، در جدول 2 فهرست شده است. در رگرسیون 12 ماهه، مربع R 5 ماه (ژان، مارس، ژوئیه، آگوست و دسامبر) بالاتر از 0.9 و MARE کمتر از 16٪ بود. علاوه بر این، مربع R 3 ماهه (آوریل، می و اکتبر) بین 0.82 و 0.85، همراه با MARE بین 19٪ و 20٪ بود. MARE قابلیت اطمینان کلی برآورد را تشریح کرد. با این حال، در مقایسه با MARE، MRE معمولاً نتایج برآورد نمونههای غیرعادی بسیار کمی را منعکس میکند، بنابراین رابطه هم جهت یا ناهم جهت قوی با مربع R ندارد.
با توجه به 12 معادله فهرست شده در جدول 2 ، 84 تخمین و خطای نسبی مطلق مربوطه را می توان در هر ماه به دست آورد. همه خطاهای نسبی مطلق از نظر آماری با توجه به 6 بازه ([0، 10%)، [10، 20%)، [20٪، 30٪، [30٪، 40٪، [40٪، 50٪] خلاصه شدند. و [50% +∞)) و نتایج در جدول 3 فهرست شده است.
به طور کلی، در بین تمام 1008 تخمین (84 در ماه، 12 ماه)، فراوانی وقوع خطای نسبی مطلق [0، 10٪، [10٪، 20٪)، [20٪، 30٪، [30] ٪، 40٪، [40٪، 50٪، و [50٪، +∞) به ترتیب 397، 321، 179، 55، 24، و 32 برابر بودند که 39.38٪، 31.85٪، 17.76٪ را تشکیل می دادند. به ترتیب 5.46٪، 2.38٪ و 3.17٪. برای نزدیک به 90٪ از نمونه ها، خطاهای نسبی مطلق بین EPC برآورد شده و مقادیر آماری کمتر از 30٪ بود که نشان می داد در اکثر موارد می توان به دقت تخمین بالایی دست یافت.
4. بحث
دلیل اینکه بسیاری از محققان تلاش کردند EPC را بر اساس تصاویر NTL تخمین بزنند این بود که فرآیند مصرف برق اغلب با انتشار نور همراه بود، مانند چراغ های خانه، چراغ های تجاری، لامپ های خیابان و غیره. با این حال، همه EPC چراغ تولید نمی کردند. مانند تهویه مطبوع، آبگرمکن، پنکه برقی و … اگرچه این وسایل الکتریکی مستقیماً نور تولید نمی کردند، اما ارتباط تنگاتنگی با فعالیت های انسانی داشتند. در جایی که تهویه مطبوع، آبگرمکن، پنکه برقی و سایر وسایل برقی وجود داشت، فعالیت های انسانی همراه با چراغ های خانگی، چراغ های تجاری، لامپ های خیابانی و غیره وجود داشت. علاوه بر این، برخی چیزهای دیگر به غیر از برق ممکن است با استفاده از بنزین یا مواد دیگر، مانند آتش بازی، چراغ ماشین و غیره، نور تولید کنند.
از منظر زمان، دادههای EPC شامل کل EPC در یک دوره زمانی کامل میشود، در حالی که دادههای NTL فقط اطلاعات نور بالاتر از روشنایی معین را در یک لحظه خاص ثبت میکنند، که نمیتواند اطلاعات بیشتر دورههای زمانی دیگر را ثبت کند. بنابراین، از نظر تئوری محاسبه دقیق EPC سالانه یا ماهانه با استفاده از داده های NTL غیرممکن است. ما فقط می توانیم مقادیر EPC را در یک دوره زمانی معین بر اساس داده های ترکیبی مقادیر NTL در چند لحظه تخمین بزنیم. دقت برآورد ممکن است تحت تأثیر ساختار صنعتی، ساختار مصرف انرژی، ساختار جمعیت و سایر عوامل در مناطق مختلف علاوه بر دقت دادههای NTL باشد.
زمان روگذر SNPP در حدود ساعت 01:30 به وقت خورشیدی محلی است که زمان اوج روشنایی در یک روز نیست. با تفسیر بصری بر روی تصاویر VIIRS DNB، هنوز نور زیادی بعد از نیمه شب وجود دارد، که احتمالا تا سحر ادامه دارد. با توجه به اینکه نتایج قابل اعتمادی در تعداد زیادی از مطالعات قبلی بر اساس این داده ها به دست آمده است، استفاده از چنین اطلاعات روشنایی می تواند به طور منطقی فعالیت های اجتماعی-اقتصادی را منعکس کند.
متغیرهای سطح محیطی ممکن است بر روشنایی شب تأثیر بگذارند. لوین دریافت که آلبیدو و پوشش برف تأثیرات مثبت آشکاری بر روشنایی شبانه VIIRS DNB دارند [ 38 ]. دقت برآورد فعالیتهای اجتماعی-اقتصادی با استفاده از دادههای VIIRS ممکن است افزایش یابد اگر بتوان بزرگی تأثیر را به طور منطقی تخمین زد و عملیات کالیبراسیون مربوطه را روی دادههای VIIRS انجام داد.
تاثیرات احتمالی زوایای رصد ماهواره ای در این مطالعه پوشش داده نشد. لی و همکاران تغییرات زوایای دید ماهواره SNPP را بررسی کرد و اثرات زاویه دید بر تابش نور مصنوعی را کمی سازی کرد [ 39 ]. دادههای VIIRS DNB میتوانند فعالیتهای اجتماعی-اقتصادی را با دقت بیشتری توصیف کنند اگر با حذف اثرات زاویهای بهبود یابند.
با وجود مشکلات فوق، یک همبستگی مثبت نزدیک بین داده های EPC و NTL وجود دارد که می تواند فعالیت های اجتماعی و اقتصادی انسان ها را در سطح زمین تا حد زیادی منعکس کند. استفاده از داده های NTL می تواند به یک سری زمانی طولانی، پوشش فضایی زیاد، نظارت سریع بر فعالیت های اجتماعی و اقتصادی دست یابد.
داده های DMSP/OLS به دلیل سری زمانی طولانی آن (1992-2013) پرکاربردترین داده NTL در تخمین EPC بود. علیرغم مزایای آن، داده های VIIRS DNB به دلیل سری زمانی کوتاه آن نسبتاً کمتر در تخمین EPC استفاده می شود. مطالعات قبلی نشان دادهاند که دادههای EPC سالانه را میتوان با استفاده از دادههای VIIRS DNB با دقت بالاتری نسبت به دادههای DMSP/OLS تخمین زد. به جز داده های سالانه، NOAA داده های ترکیبی ماهانه VIIRS DNB را از آوریل 2012 تا کنون منتشر کرد. متأسفانه، هیچ مطالعه ای در مورد تخمین EPC ماهانه با استفاده از داده های مرکب ماهانه VIIRS DNB گزارش نشده است. ما تجزیه و تحلیل رگرسیون را بین EPC ماهانه و دادههای ترکیبی ماهانه VIIRS DNB انجام دادیم و نتایج رضایتبخشی به دست آوردیم. این امکانسنجی تخمین EPC ماهانه با استفاده از دادههای مرکب ماهانه VIIRS DNB را نشان داد. علاوه بر این،
مدلهای رگرسیون خطی اغلب در تخمین EPC بر اساس دادههای NTL استفاده میشوند. برای هر ماه، مدل رگرسیون چند جملهای را با مدل رگرسیون خطی مقایسه کردیم و متوجه شدیم که دقت تخمین EPC با استفاده از مدل رگرسیون چند جملهای بالاتر از دیگری است. ما همچنین رگرسیون نمایی و رگرسیون لگاریتمی را بین EPC و NTL در آزمایش انجام دادیم، اما مقادیر مربع R بسیار کمتر از رگرسیون خطی و رگرسیون چند جملهای بود.
روش کاهش نویز پس زمینه در داده های NTL پیشنهاد شده توسط Ma و همکاران. در این مقاله استفاده شد، زیرا درک و انجام آن آسان بود. با وجود کاهش نویز، ممکن است منابع دیگری از تابش شبانه حسگر وجود داشته باشد که در مجموعه داده ها تصحیح نشده باقی بمانند، مانند پراکندگی برگشتی جو و تشعشعات منتشر [ 40 ].
هدف از انجام سه نوع فیلتر فضایی کاهش تأثیر امکان پذیر مقادیر بالای غیرعادی پیکسل بود. پنجره های فیلتر 3*3 و 5*5 به دلیل استفاده گسترده و پیچیدگی محاسباتی کم انتخاب شدند. با این حال، با توجه به نتایج رگرسیون، روابط بین EPC و دادههای NTL فیلتر شده فضایی بهبود نیافت. این ممکن است به دو دلیل باشد: (1) فیلتر فضایی تعداد کمی از نقاط پرت تأثیر کمی بر ارزش کل NTL استان داشت. (2) تعداد زیادی پیکسل در مناطق شهری و حومه شهر صاف شده است، ممکن است منجر به از دست دادن اطلاعات شود.
اگرچه ما مدل های تخمین EPC را بر اساس داده های VIIRS NTL به صورت ماهانه به دست آورده ایم، این مدل ها بر اساس تحلیل های آماری ساخته شده اند و توضیح معنای فیزیکی هر پارامتر از مدل ها دشوار است. این نقص ذاتی تحلیل آماری است. با این حال، قبل از اینکه مدل فیزیکی به طور موثر ایجاد شود، مدل آماری هنوز از ارزش و اهمیت عملی برخوردار است.
در این مقاله، مدل های رگرسیون ماهانه با داده های نمونه از 14 استان در جنوب چین ایجاد شده است. ممکن است پارامترهای این مدلها به دلیل استانداردهای آماری متفاوت مصرف برق، در جاهای دیگر مناسب نباشد. با این حال، ایجاد مدل های رگرسیون ماهانه برای هر منطقه با استفاده از مراحل و داده های شرح داده شده در این مقاله امکان پذیر است.
5. نتیجه گیری ها
این مقاله رابطه بین دادههای EPC و NTL را در مقیاس ماهانه، با استفاده از دادههای ترکیبی ماهانه VIIRS DNB NTL از ژانویه 2013 تا دسامبر 2018 و دادههای آماری ماهانه مربوطه EPC از 14 استان در جنوب چین بررسی کرد. دو نوع رگرسیون به منظور دستیابی به نتایج رگرسیون قابل اعتمادتر مقایسه شد. علاوه بر این، نه نوع NTL با تیمارهای مختلف، از جمله NTL اصلی ( NTL 0 )، NTL پر شده ( NTL g )، NTL حذف شده با آستانه 0.3 ( NTL 1 )، NTL 3*3 متوسط فیلتر شده ( NTL 2 )، 5* 5 NTL متوسط فیلتر شده ( NTL 3 )، 3*3 NTL فیلتر شده متوسط ( NTL 4NTL فیلتر شده میانه 5*5 ( NTL 5 )، 3*3 NTL فیلتر شده با مقدار متوسط ( NTL 6 ) و 5*5 NTL فیلتر شده با مقدار متوسط ( NTL 7 )، در ساخت فرمول های رگرسیون نقش داشتند. نتیجه گیری به شرح زیر است:
پایایی بالایی در تمام 18 فرمول رگرسیون (دو نوع رگرسیون بین EPC و 9 نوع NTL پردازش شده) به دست آمد، با تمام R مربع بیش از 0.8459 و مقدار میانگین R مربع برابر با 0.8772 بود. در مقایسه با رگرسیون خطی، رگرسیون چند جمله ای پایایی بالاتری به دست آورد که میانگین R مربع آن 0.8816 بود، بالاتر از 0.8727 رگرسیون خطی. رگرسیون بین NTL حذفشده با آستانه 0.3 ( NTL 1 ) و EPC به طور پیوسته قویترین قابلیت اطمینان را در بین 9 نوع داده NTL نشان داد که در ساخت دو نوع مدل رگرسیونی مبتنی است. سه نوع درمان (فیلتر متوسط، فیلتر میانه و فیلتر با ارزش متوسط) در NTL 1داده ها به طور موثر قابلیت اطمینان رگرسیون ها را بهبود نمی بخشد. این نوع پردازش داده ها در تخمین EPC بر اساس داده های NTL توصیه نمی شود.
برای 12 ماه رگرسیون چند جمله ای بین NTL 1 و EPC، میانگین مقدار مربع R 0.8906 و مقدار متوسط MARE 16.02٪ بود. برای نزدیک به 90٪ از 1008 برآورد (84 در ماه، 12 ماه)، خطاهای نسبی مطلق بین EPC تخمین زده شده و مقادیر آماری کمتر از 30٪ بود که نشان دهنده دقت تخمین بالا در بیشتر موارد بود.
بدون دیدگاه