محدود کردن مجموعه داده های حقیقت زمین برای استفاده از زمین و نقشه های پوشش زمین با الگوریتم های یادگیری ماشین

نقشه های طبقه بندی کاربری و پوشش زمین (LULC) به درک وضعیت و روند تولید کشاورزی کمک می کند و بینش هایی را برای کاربردها در نظارت بر محیط زیست ارائه می دهد. یکی از اشکالات عمده تکنیک LULC ذاتاً به نیاز آن به داده های حقیقت زمینی برای اعتبارسنجی متقابل نقشه ها مرتبط است. هدف این مقاله ارزیابی کارایی یادگیری ماشین (ML) در محدود کردن استفاده از داده‌های حقیقت زمین برای نقشه‌های LULC است. این کار با (1) استخراج اطلاعات LULC قابل اعتماد از تصاویر Sentinel-2 و Landsat-8، (2) تولید شاخص‌های سنجش از راه دور مورد استفاده برای آموزش الگوریتم‌های ML، و (3) مقایسه نتایج با داده‌های حقیقت زمینی انجام شد. شاخص‌های سنجش از دور که مورد آزمایش قرار گرفتند عبارتند از: شاخص تفاوت پوشش گیاهی (DVI)، شاخص گیاهی تفاوت نرمال شده (NDVI)، شاخص عادی ساخته شده (NDBI)، شاخص شهری (UI)، و شاخص زمین برهنه نرمال شده (NBLI). شاخص‌های پوشش گیاهی استخراج‌شده بر روی سه الگوریتم ML، یعنی جنگل تصادفی (RF)، k-نزدیک‌ترین همسایه (K-NN) و k بعدی درخت (KD-Tree) مورد ارزیابی قرار گرفت. دقت این الگوریتم ها با معیارهای آماری استاندارد و داده های حقیقت زمینی به طور تصادفی در جزیره پرنس ادوارد، کانادا جمع آوری شد. نتایج نشان داد که مقادیر ضریب کاپا بالا توسط K-NN (82٪ و 74٪)، KD-Tree (80٪ و 78٪)، و RF (83٪ و 73٪) برای تصاویر Sentinel-2A و Landsat-8 به دست آمد. ، به ترتیب. RF طبقه بندی بهتری نسبت به K-NN و KD-Tree بود و بالاترین دقت کلی را با تصاویر ماهواره ای Sentinel-2A (92٪) داشت. این رویکرد مبنایی را برای محدود کردن مجموعه داده های حقیقت زمینی فراهم می کند .

کلید واژه ها:

شاخص های سنجش از دور ; یادگیری ماشینی ؛ داده های حقیقت پایه ؛ نقشه برداری LULC ; تصویربرداری ماهواره ای

1. مقدمه

طبقه‌بندی کاربری و پوشش زمین (LULC) گسترده‌ترین موضوع مورد تحقیق در زمینه سنجش از دور است زیرا اطلاعات ارزشمندی را برای برنامه‌ریزی شهری، مدیریت منابع، نظارت بر محیط‌زیست و نقشه‌برداری کشاورزی فراهم می‌کند [ 1 ]. طبقه بندی LULC می تواند برای برجسته کردن روندهای تاریخی یا ارائه ابزارهای مبتنی بر شواهد در تصمیم گیری برای مدیریت منابع استفاده شود [ 2 ]. چندین سال است که تصاویر ماهواره ای در طبقه بندی LULC در انواع روش های آماری و تجربی مورد استفاده قرار گرفته است. متأسفانه، این روش‌ها دارای محدودیت‌های متعددی در ارزیابی دقت هستند، زیرا هر ماهواره دارای وضوح طیفی، زمانی و رادیومتری متفاوتی است [ 3 ]]. اخیراً، علوم داده و جوامع سنجش از دور به دلیل راه اندازی صورت فلکی ماهواره ای جدید و الگوریتم های یادگیری ماشینی (ML) با موفقیت به دقت بالاتری دست یافته اند [ 4 ]. علاوه بر این، دسترسی رایگان به داده‌های ماهواره‌های رصد زمین، از جمله Sentinel-2 و Landsat-8، رقابتی را در میان دانشمندان داده‌های بزرگ برای افزایش دقت طبقه‌بندی با رویکردهای الگوریتم طبقه‌بندی جدید ایجاد کرده است.
به گفته شوقی و همکاران. [ 5 ]، رشد جمعیت یک عامل محرک اصلی برای تبدیل LULC است. با افزایش جمعیت یک منطقه، تقاضا برای فضای ساخته شده و غذا افزایش می یابد، در حالی که سایر انواع پوشش زمین مانند زمین بایر، کشاورزی و جنگل کاهش می یابد. مصرف مواد غذایی به دلیل افزایش بیش از دو برابری جمعیت جهان بین سال‌های 1961 و 2016 در حال افزایش است .]. زمین های زراعی حدود یک سوم زمین را پوشش می دهند، در حالی که مراتع و مراتع دو سوم باقی مانده را پوشش می دهند. سرانه سطح زمین کشاورزی به طور قابل ملاحظه ای از 0.45 هکتار در سال 1961 به 0.21 هکتار در سال 2016 کاهش یافته است. مناطق شهری زمانی که انواع پوشش های کشاورزی و طبیعی زمین به مناطق توسعه یافته تبدیل می شوند، به سمت خارج گسترش می یابند. شهرنشینی سریع باعث رشد سریع اقتصادی و تغییرات کاربری زمین شد و تقاضا برای مدیریت کارآمد منابع طبیعی را افزایش داد [ 7 ]. افزایش جمعیت باعث شهرنشینی سریع شد و رشد اقتصادی و تغییرات کاربری زمین باعث افزایش تقاضا برای مدیریت کارآمد منابع طبیعی شد [ 8 ]]. اگر تغییرات پوشش زمین به طور مداوم با افزایش جمعیت نظارت نشود، ممکن است بر محیط زیست و مدیریت منابع منطقه تأثیر منفی بگذارد [ 9 ]. یک روش به روز و مقرون به صرفه برای تهیه نقشه LULC برای مدیریت منابع و برنامه ریزی آن مورد نیاز است و برای پاسخگویی به افزایش تقاضای غذا مفید است.
نقشه‌های ملی و منطقه‌ای LULC مانند فهرست سالانه محصولات کشاورزی و کشاورزی و مواد غذایی کانادا (AAFC) سالانه تولید می‌شوند و به درک وضعیت و روند تولید کشاورزی در کانادا کمک می‌کنند. روشی که معمولاً برای تهیه این نقشه ها استفاده می شود شامل جمع آوری داده های حقیقت زمین و آموزش یک طبقه بندی [ 10 ] است. اگرچه این تکنیک می تواند بسیار دقیق باشد، فرآیند جمع آوری داده های مرجع نیاز به برنامه ریزی گسترده، زمان و منابع مالی مهم دارد [ 11 ]]. علاوه بر این، اگر به دلیل رویدادهای غیرقابل پیش بینی نتوان به مدت یک سال داده های حقیقت زمینی را جمع آوری کرد، ایجاد نقشه های LULC می تواند به خطر بیفتد و شکافی در داده ها ایجاد کند. این وضعیت در سال 2020 زمانی رخ داد که فهرست سالانه محصول AAFC به دلیل محدودیت‌های سفر COVID-19 در نوا اسکوشیا تکمیل نشد. این محدودیت‌ها از جمع‌آوری داده‌های زمینی جلوگیری می‌کرد و تعریف برخی از طبقات کشاورزی را غیرممکن می‌کرد [ 12 ]. اگرچه داده های حقیقت زمینی برای اعتبار سنجی نقشه های LULC ضروری هستند، این وضعیت اهمیت توسعه روش های جدیدی را برجسته می کند که میزان داده های حقیقت زمینی را برای تولید نقشه های LULC محدود می کند.
کمیت داده های آموزشی و اعتبار سنجی عامل دیگری است که می تواند بر دقت طبقه بندی الگوریتم های ML تأثیر بگذارد [ 13 ]. به عنوان مثال، الگوریتم های ML با مجموعه داده های آموزشی بزرگتر نسبت به مجموعه داده های کوچکتر عمل می کنند [ 14 ]. حداقل تعداد نمونه های آموزشی باید 10 برابر تعداد متغیرها باشد، طبق یک “قاعده سرانگشتی” طولانی مدت در ML [ 15 ]. متأسفانه، به نظر می رسد که هیچ راهنمایی قابل مقایسه در ادبیات مربوط به حداقل تعداد نمونه های مورد نیاز برای طبقه بندی ML وجود ندارد. طبق [ 16روش طبقه‌بندی، تعداد متغیرهای ورودی و اندازه و ناهمگنی فضایی منطقه نقشه‌برداری شده، هر کدام می‌توانند بر تعداد نمونه‌های آموزشی مورد نیاز در طبقه‌بندی تأثیر بگذارند. با توجه به نتیجه گیری کلی [ 17 ] مجموعه داده های آموزشی بزرگ و دقیق مورد نیاز است. با این حال، در حوزه سنجش از دور کاربردی، داده‌های آموزش و اعتبارسنجی هم پرهزینه و هم کمیاب بودند [ 18 ]. در نتیجه، اکثر مطالعات سنجش از دور از یک مجموعه داده ثابت برای آزمایش دقت الگوریتم‌های ML استفاده کردند [ 19 ، 20 ].
چندین الگوریتم نظارت شده و بدون نظارت برای پردازش تصاویر ماهواره ای برای طبقه بندی LULC توسعه یافته اند. الگوریتم های طبقه بندی بدون نظارت از الگوریتم های آماری خودکار برای جداسازی کلاس های LULC بدون داده های آموزشی استفاده می کنند. ویشوانات و همکاران [ 21 ] از یک الگوریتم بدون نظارت برای تشخیص ویژگی های پوشش زمین در تصاویر سنجش از دور استفاده کرد. آنها از الگوریتم خوشه‌ای K-means برای طبقه‌بندی مؤثر کلاس‌های LULC استفاده کردند. در مطالعه دیگری، Shivakumar و Rajashekararadhya [ 22 ] طبقه بندی کننده حداکثر احتمال را برای نگاشت کلاس های LULC تحت سناریوهای مختلف آزمایش کردند.
الگوریتم های طبقه بندی نظارت شده در نگاشت ویژگی های LULC بسیار کارآمد هستند. روش طبقه‌بندی نظارت شده شامل نمونه‌های نماینده از هر کلاس از پیش تعریف‌شده، و به دنبال آن آموزش الگوریتم‌ها برای یادگیری در مورد کلاس‌های LULC برای طبقه‌بندی کارآمد است. کارهای مرتبط توسط Mather و Tso و عباس و جابر [ 23 ، 24 ] مستند کردند که الگوریتم های طبقه بندی نظارت شده احتمالا بهتر از الگوریتم های طبقه بندی بدون نظارت عمل می کنند.
نقشه های LULC به یک الگوریتم طبقه بندی مناسب برای حل مسائل دنیای واقعی با دقت بالا نیاز دارند [ 25 ]. چندین مطالعه پتانسیل ML و الگوریتم های آماری را در طبقه بندی LULC نشان داده اند. برای مثال، Desai و Umrikar [ 25 ] دو طبقه‌بندی‌کننده نظارت‌شده، یعنی حداکثر احتمال و حداقل فاصله را برای طبقه‌بندی LULC با استفاده از تصاویر Landsat آزمایش کردند. طبقه‌بندی حداکثر احتمال داده‌های لندست از دقت بالاتری نسبت به روش حداقل فاصله برخوردار بود. نگوین و همکاران [ 26 ] از داده های حقیقت زمینی برای آموزش الگوریتم های ML برای طبقه بندی LULC استفاده کرد. مطالعات دیگر توسط جیا و همکاران. [ 27] یک ماشین بردار پشتیبانی (SVM) و الگوریتم‌های حداکثر احتمال را روی تصاویر Landsat-8 آزمایش کرد. نتایج طبقه‌بندی‌کننده حداکثر احتمال دقیق‌تر از نتایج SVM بود. با گذشت زمان، الگوریتم های پیشرفته تری در طبقه بندی LULC استفاده شده است، از جمله درخت تصمیم (DT) و جنگل تصادفی (RF). Thanh Noi و Kappas [ 28 ] RF، k-نزدیکترین همسایه (K-NN) و SVM را با استفاده از اندازه های نمونه آموزشی تولید شده از تصاویر Sentinel آزمایش کردند. نتایج حاصل از مطالعه نشان داد که SVM بالاترین دقت و کمترین حساسیت را نسبت به حجم نمونه آموزشی دارد. با این حال، طبقه‌بندی‌کننده‌های K-NN و RF در مقایسه با SVM به دقت بالاتری با اندازه آموزشی بزرگ دست یافتند.
ادبیات همچنین نشان می‌دهد که هر روش طبقه‌بندی بسته به نوع ماهواره‌هایی که برای گرفتن تصاویر استفاده می‌شوند، عملکرد متفاوتی دارد. به عنوان مثال، جیا و همکاران. [ 27 ] Landsat-7 و Landsat-8 را با استفاده از الگوریتم های مشابه مقایسه کردند و دریافتند که دومی دقت بالاتری نسبت به ماهواره قبلی نشان می دهد. به همین ترتیب، علی و همکاران. [ 29 ] دقت بالاتری را در باندهای قطبش دوگانه ALOS-2 نسبت به داده‌های تصاویر نوری Landsat-8 با طبقه‌بندی حداکثر احتمال ثبت کرد. Clerici و همکاران [ 30] تصاویر ماهواره ای Sentinel-1 و Sentinel-2 را برای افزایش دقت نقشه برداری آزمایش کرد و دقت بالاتری را برای داده های Sentinel-2 نسبت به داده های Sentinel-1 در ارتباط با الگوریتم SVM یافت. نتایج ذکر شده در بالا ثابت کرد که دقت نقشه های LULC به انتخاب ماهواره و الگوریتم های طبقه بندی مورد استفاده بستگی دارد.
با توجه به هزینه بالای مربوط به جمع آوری نقاط حقیقت زمین و افزایش تقاضا برای مدیریت کارآمد منابع طبیعی، هدف این مطالعه ارزیابی کارایی الگوریتم های ML در محدود کردن استفاده از داده های حقیقت زمین برای نقشه های LULC بود. این امر با استخراج اطلاعات LULC از تصاویر ماهواره ای Sentinel-2 و Landsat-8 و با تولید شاخص های سنجش از راه دور مورد استفاده برای آموزش الگوریتم های ML انجام خواهد شد. نتایج این مقاله به سه بخش تقسیم می شود. ابتدا، نتایج حاصل از الگوریتم‌های ML در برابر داده‌های حقیقت زمینی مورد ارزیابی قرار گرفت. دوم، معیارهای آماری استاندارد برای ارزیابی عملکرد هر الگوریتم ML استفاده شد. سوم، الگوریتم ها برای درک بهتر عملکرد آنها با یکدیگر مقایسه شدند.
مقاله به دو بخش اصلی یعنی بخش مواد و روش ها و بخش نتایج و بحث تقسیم شده است. مواد مورد استفاده در این تحقیق و جزئیات پردازش آنها در بخش مواد و روش ها ذکر شده است. دقت الگوریتم ML در بخش نتایج و بحث با یافته های مطالعات قبلی بررسی و مقایسه شده است.

2. مواد و روشها

2.1. منطقه مطالعه

منطقه مورد مطالعه شامل جزیره پرنس ادوارد (PEI)، یکی از کوچکترین استان های کانادا با مساحت تقریباً 5669 کیلومتر مربع است ( شکل 1 ). در سال 2019، این استان 157262 نفر جمعیت داشت که کمتر از 0.5٪ از کل جمعیت کانادا را نشان می دهد [ 31 ]. آب و هوای جزیره معتدل است و به شدت تحت تأثیر آبهای گرم خلیج سنت لارنس [ 32 ] است. PEI دارای طیف گسترده ای از کاربردهای چشم انداز، از جمله جنگل ها، کشاورزی، مراتع، آب، تالاب ها و مناطق شهری است.

2.2. اکتساب داده ها

دو نوع از تصاویر ماهواره ای مورد ارزیابی قرار گرفتند، زیرا ادبیات نشان می دهد که روش های طبقه بندی بر روی انواع مختلف تصاویر ماهواره ای متفاوت عمل می کنند [ 33 ]. از 7 جولای تا 28 جولای 2019 در مجموع هفت صحنه ماهواره ای از وب سایت USGS به دست آمد ( جدول 1 ).
ماهواره های سنتینل یک صورت فلکی است که از دو ماهواره دوقلو Sentinel-2A و Sentinel-2B تشکیل شده است. هنگامی که این ماهواره ها به طور همزمان از یک مدار، به صورت فازی در 180 درجه نسبت به یکدیگر کار می کنند، می توانند تغییرپذیری در شرایط سطح زمین را هر 5 روز یکبار بررسی کنند [ 34 ]. ماهواره های Sentinel-2 تصاویر نوری را با وضوح بین 10 تا 60 متر بسته به باندهای طیفی بدست می آورند. محدودیت های پوشش ماهواره ای بین 56 درجه عرض جغرافیایی جنوبی و 84 درجه طول شمالی با عرض نوار 290 کیلومتر است.
ماهواره Landsat-8 همچنین یک ماهواره رصدی زمین است که مجهز به دو محموله است که 11 باند طیفی با قدرت تفکیک مکانی بین 30 تا 100 متر را جمع آوری می کند. Landsat-8 به دلیل افزایش نقشه موضوعی آن در محدوده باندهای قابل مشاهده در مقایسه با سایر ماهواره های Landsat [ 27 ] انتخاب شد. Landsat-8 به دلیل افزودن باندهای طیفی جدید در طیف آبی، استفاده از دو باند حرارتی جدید و چرخه کاری پیشرفته که ظرفیت جمع آوری تصاویر روزانه ماهواره را افزایش داده است، نسبت به نسل قبلی توانایی های خود را بهبود بخشیده است [ 35 ]. ].
صحنه های ماهواره Landsat-8 با کمترین پوشش ابری موجود برای کاهش پراکندگی و جذب نور در جو انتخاب شدند ( جدول 1 ). علاوه بر این، صحنه های ماهواره ای از مجموعه 1 سطح 1 گرفته شده است که قبلاً از نظر هندسی و رادیومتری تصحیح شده بود.

2.3. آماده سازی داده ها

تصاویر Sentinel-2A و Landsat-8 با استفاده از جعبه ابزار Sentinel Application نسخه 8.0.0 (SNAP) پردازش شدند. تمام باندهای تصویر ماهواره ای Sentinel-2A و Landsat-8 در SNAP با استفاده از روش نزدیکترین همسایه به ترتیب به وضوح 20 و 30 متر نمونه برداری شدند. تصاویر نمونه برداری مجدد برای پوشش مرز استانی PEI با استفاده از ابزار موزاییک شطرنجی داخلی SNFAP موزاییک شدند. سه صحنه Landsat-8 موزاییک شده بود تا کل جزیره را پوشش دهد. دو مورد از این صحنه‌ها در 26 جولای 2019 جمع‌آوری شد و دیگری در 19 جولای 2019 به دست آمد. تصاویر ماهواره‌ای به یک سیستم مختصات محلی بازپخش شدند، در ArcGIS Pro وارد شدند و برای ایجاد داده‌های آموزشی برای نقشه‌های LULC استفاده شدند.

2.4. شاخص های سنجش از راه دور و کلاس های LULC

شاخص‌های پوشش گیاهی مانند شاخص گیاهی تفاوت نرمال شده (NDVI) یا شاخص گیاهی تعدیل‌شده با خاک (SAVI) را می‌توان از داده‌های سنجش از دور بدست آورد. تولید شاخص‌های پوشش گیاهی از تصاویر ماهواره‌ای چندطیفی و الگوریتم‌های موثر برای ارزیابی کمی و کیفی پوشش گیاهی ساده است. به طور مشابه، یک شاخص شهری، مانند یک شاخص ساخته شده نرمال شده (NDBI)، می تواند برای شناسایی ویژگی های شهری در تصاویر ماهواره ای استفاده شود. در دست تحلیلگران زمین فضایی آموزش دیده، شاخص های سنجش از دور می توانند انواع مختلف پوشش زمین را برجسته کنند و می توانند به ویژه برای طبقه بندی کننده های آموزشی مورد استفاده در نقشه های LULC مفید باشند.
در این مطالعه از شاخص تفاوت پوشش گیاهی (DVI) و NDVI برای شناسایی پوشش گیاهی استفاده شد [ 7 ]. از آنجایی که کشاورزی و جنگل در هر دو شاخص دارای مقادیر مشابهی هستند، زمین های بایر با استفاده از شاخص نرمال شده زمین برهنه (NBLI) برای غلبه بر این مسئله شناسایی شدند ( شکل 2 A1-A5، B1-B5). شاخص NBLI در برجسته کردن ترکیب خاک موثر است و برای متمایز کردن کشاورزی از مناطق جنگلی مفید است . شکل 2 A5,B5 [ 11 ]. ویژگی های شهری با NDBI و شاخص ساخته شده (UI) شناسایی شدند. این شاخص ها به دلیل تمایز زمین بایر از ویژگی های شهری استفاده شدند [ 11 ]. نتایج شاخص NDBI در شکل 2 ارائه شده استA3,B3 نشان داد که برخی از پیکسل‌های نشان‌دهنده مناطق شهری در تصاویر Landsat-8 و Sentinel با ویژگی‌های زمین برهنه ترکیب شده‌اند. این مشکل با استفاده از شاخص UI حل شد، زیرا ویژگی های شهری را می توان با دقت بیشتری در شکل 2 A4,B4 شناسایی کرد. حداقل و حداکثر مقادیر شاخص های پوشش گیاهی بین 0 و 1 در افسانه در شکل 2 نشان داده شده است . برای ساختن نمونه های آموزشی برای نگاشت LULC از پیکسل های حداکثر در هر شاخص استفاده شد.
شاخص های سنجش از دور ارائه شده در جدول 2 برای تعیین کلاس های LULC استفاده شد. چهار کلاس LULC، یعنی کشاورزی، شهری، زمین بایر و جنگل، در منطقه مورد مطالعه شناسایی شدند ( جدول 3 ). این شاخص ها برای استخراج نمونه های آموزشی برای طبقه بندی LULC در ArcGIS Pro استفاده شد. در مجموع 2000 نمونه آموزشی، 500 نمونه برای هر کلاس، برای آموزش طبقه بندی کننده ایجاد شد. اندازه نمونه به اندازه کافی بزرگ تعیین شد زیرا به اندازه کافی کل منطقه مورد مطالعه را پوشش می دهد بدون اینکه قدرت محاسباتی طبقه بندی کننده را تمام کند.

2.5. الگوریتم یادگیری ماشین

2.5.1. طبقه بندی جنگل تصادفی

RF ترکیبی از پیش‌بینی‌کننده‌های درختی با هر درخت بسته به یک مقدار بردار تصادفی نمونه‌برداری شده مستقل با توزیع مشابه در همه درختان است ( شکل 3 ) [ 40 ]. تقویت و بسته بندی دو روش مجموعه ای هستند که می توانند دقت پیش بینی اضافی را از الگوریتم های طبقه بندی خارج کنند. الگوریتم های بسته بندی برای کاهش پیچیدگی مدل هایی که بیش از حد با داده های آموزشی مطابقت دارند، استفاده می شود، در حالی که الگوریتم تقویت، پیچیدگی مدل ها را افزایش می دهد. نمونه‌های آموزشی که در نمونه آموزشی استفاده نمی‌شوند، در ارزیابی گنجانده شدند و به‌عنوان نمونه‌های «خارج از کیف» نام‌گذاری شدند [ 4 ]]. علاوه بر این، استفاده از طبقه‌بندی‌کننده RF آسان است زیرا فقط از دو پارامتر (به عنوان مثال، تعداد متغیرها در هر گره و تعداد درخت‌ها) استفاده می‌کند که به مقدار پارامتر حساس نیست [ 41 ]. تعداد درختان و پیش بینی کننده ها در طبقه بندی RF پارامترهای حیاتی برای دستیابی به بالاترین دقت ممکن هستند. برای ارزیابی دقت خروجی RF فعلی، این پارامترها برای تعداد درختان 50 و حداکثر عمق درخت و نمونه در هر کلاس به ترتیب 30 و 500 تعیین شد.

2.5.2. K-نزدیکترین همسایه

K-NN یک الگوریتم ML نظارت شده است که می تواند برای حل مسائل طبقه بندی و رگرسیون استفاده شود. اولین بار در یک گزارش منتشر نشده توسط [ 42 ] مورد بحث قرار گرفت و به دنبال آن قوانین K-NN با جزئیات بیشتر توسط [ 43 ] منتشر شد. این اشیاء را بر اساس کلاس نزدیکترین همسایه دسته بندی می کند. عامل اصلی تعیین کننده در کار طبقه بندی، تعداد همسایگان (k) مورد استفاده برای طبقه بندی یک شی است ( شکل 4 ). مقادیر k کوچک نشان دهنده نتایج نسبتاً نادرست است، در حالی که مقادیر k بالاتر نشان دهنده نتیجه معتبرتر است [ 44 ]. از طریق آزمون و خطا، مقدار k بهینه پیدا شد و روی k = 20 تنظیم شد.
2.5.3. K بعدی-درخت
KD-Tree رایج ترین الگوریتم باینری است که برای خانواده الگوریتم نزدیکترین همسایه استفاده می شود. در طبقه بندی کننده های KD-Tree، خوشه ها بر اساس میانه محورهای x و y توسعه می یابند ( شکل 5 ). KD-Tree نقاط را بر اساس پیش بینی ها در ابعاد پایین دسته بندی می کند [ 45 ]. برای مجموعه داده‌های با ابعاد پایین‌تر، KD-Tree برای عملکرد بهتر در مقایسه با الگوریتم‌های دیگر مانند درخت توپ طراحی شده است [ 46 ]. برای مقایسه دقیق KD-Tree در هر دو ماهواره، تعداد نمونه های آموزشی 2000 و تعداد همسایه ها 20 تعیین شد. مشابه مقدار k در الگوریتم K-NN، تعداد بهینه همسایه ها به دست آمد. از طریق آزمون و خطا تعیین می شود.

2.6. داده های حقیقت پایه برای اعتبارسنجی و معیارهای ارزیابی مدل

پنج سایت در PEI برای جمع آوری داده های حقیقت پایه انتخاب شدند. با استفاده از یک جی پی اس کینماتیک واقعی (RTK) با دقت زیر متر، در مجموع 200 نقطه اعتبار سنجی در هر سایت جمع آوری شد. این امتیازها به طور مساوی در هر کلاس توزیع شده است، به این معنی که در هر کلاس 50 امتیاز در هر سایت جمع آوری می شود. از همان داده های حقیقت زمینی برای اعتبارسنجی نقشه های LULC تولید شده با تصاویر Sentinel-2A و Landsat-8 استفاده شد.

برای ارزیابی دقت مدل ها از چندین شاخص آماری استفاده شد. دقت کلی مدل ها برای توصیف نسبت صحیح پیکسل های نقشه برداری شده استفاده شد. دقت کلی در نظر می گیرد که 100٪ از تمام سایت های مرجع طبقه بندی شده به طور دقیق نقشه برداری شده اند [ 47 ]. دقت کلی با استفاده از فرمول زیر محاسبه شد:

کلی دقت (%)=عدد از به درستی طبقه بندی شده پیکسل هاجمع عدد از ارجاع داده شد سایت پیکسل ها×100

به طور مشابه، دقت هر کلاس LULC با استفاده از دقت سازنده/کاربر تعیین شد. دقت تولیدکننده/کاربر ویژگی واقعی روی سطح زمین را که به درستی در نقشه طبقه بندی شده نشان داده شده است، تعیین می کند [ 47 ]. دقت تولید کننده و کاربر با استفاده از فرمول زیر محاسبه شد:

تهیه کننده/کاربر دقت (%)=به درستی طبقه بندی شده پیکسل ها که در یکی دسته بندی جمع طبقه بندی شده پیکسل ها که در همه دسته بندی ها×100

ضریب کاپا یکی دیگر از شاخص های آماری برای ارزیابی دقت طبقه بندی است. کاپا ارزیابی می کند که طبقه بندی در مقایسه با مقدار تخصیص تصادفی چقدر خوب عمل کرده است. مقادیر آن از 1- تا 1 متغیر است، با کمترین مقدار نشان می دهد که طبقه بندی بهتر از یک طبقه بندی تصادفی نیست، در حالی که مقدار نزدیک به مثبت نشان می دهد که طبقه بندی به طور قابل توجهی بهتر از طبقه بندی تصادفی است [ 48 ]. ضریب کاپا با استفاده از فرمول زیر محاسبه شد:

کاپا ضریب=(تیاس-تیسیاس)-∑(سیoلتومترn تیoتیآل∗آرow تیoتیآل) تیاس2-∑(سیoلتومترn تیoتیآل∗آرow تیoتیآل) ×100

که در آن TS تعداد کل نمونه ها، TCS تعداد کل نمونه های طبقه بندی شده است، و مجموع ستون ها و مجموع ردیف ها به ترتیب تعداد کل پیکسل های طبقه بندی شده برای هر کلاس در هر ستون و ردیف را نشان می دهند.

3. نتایج

3.1. نتایج نقشه برداری کاربری و پوشش زمین

در نقشه های تهیه شده LULC ( شکل 6 )، رنگ زرد نشان دهنده منطقه کشاورزی، رنگ سبز نشان دهنده منطقه جنگلی، خاکستری رزمناو نشان دهنده زمین بایر و قرمز نشان دهنده منطقه شهری است.
از تصاویر Landsat-8، طبقه‌بندی‌کننده KD-Tree نکات مثبت واقعی را برای کلاس کشاورزی شناسایی کرد، به عنوان مثال، 45 از 50 با دقت کاربر 90٪ و دقت تولید کننده 79٪ ( شکل 7 A و جدول 4 ). برای تصاویر Sentinel-2A، بالاترین موارد مثبت واقعی توسط الگوریتم K-NN طبقه بندی شد، به عنوان مثال، 47 از 50 برای کلاس کشاورزی. RF و K-NN در Landsat-8 و KD-Tree و RF در Sentinel-2A موارد مثبت واقعی را برای کلاس های کشاورزی در محدوده 38-45 از 50 ثبت کردند ( شکل 7 A,D). جالب توجه است که بیشترین و کمترین موارد مثبت واقعی برای کلاس کشاورزی توسط الگوریتم K-NN ثبت شد. این نشان می دهد که عملکرد طبقه بندی ممکن است با استفاده از وضوح بهتر و تصاویر دقیق تر بهبود یابد [49 ، 50 ].
برای طبقه زمین بایر، بالاترین موارد مثبت واقعی توسط طبقه‌بندی کننده KD-Tree با تصاویر Sentinel-2A ثبت شد، یعنی 49 از 50 [ 51 ] با دقت کاربر 98% و دقت تولید کننده 80% ( شکل 7 D و جدول 4 ). با این حال، عملکرد طبقه‌بندی‌کننده KD-Tree با تصاویر Landsat-8 برای طبقه زمین‌های بایر مثبت‌های واقعی نسبتاً پایین‌تری را ثبت کرد، به عنوان مثال، 42 از 50. به طور مشابه، بالاترین مثبت واقعی برای کلاس جنگل شهری توسط جنگل تصادفی ثبت شد. طبقه بندی کننده با تصاویر Sentinel-2A. با این حال، تعداد نسبتاً کمتری از موارد مثبت واقعی برای کلاس جنگل با تصاویر Landsat-8 ثبت شد، به عنوان مثال، 32، 39، و 36 برای طبقه‌بندی‌کننده‌های KD-Tree، RF و K-NN، به ترتیب ( شکل 7).A-C). برای طبقه شهری، بالاترین میانگین مثبت واقعی برای هر دو تصویر ماهواره ای ثبت شد. برای کلاس شهری، الگوریتم RF با ماهواره Sentinel-2A به بالاترین دقت کاربر ممکن (100%) در مقایسه با سایر مقایسه‌های ماهواره-الگوریتم ( جدول 4 ) دست یافت. این نتایج با یافته های گزارش شده در ادبیات مطابقت دارد که ذکر می کند وضوح، ویژگی های تصویر، الگوریتم های طبقه بندی و نیاز کاربر بر دقت طبقه بندی نقشه برداری LULC تأثیر می گذارد [ 49 ، 51 ].

3.2. مقایسه دقت ماهواره

برای تصاویر Landsat-8، ضریب کاپا الگوریتم برای KD-Tree، RF و K-NN به ترتیب 78، 80 و 74 درصد ثبت شد ( شکل 8 ). برای تصاویر Sentinel-2A، همان الگوریتم‌ها مقادیر ضریب کاپا را به‌طور قابل‌توجهی افزایش دادند، یعنی به ترتیب برای الگوریتم‌های KD-Tree، RF و K-NN به ترتیب 2.5، 10 و 10.8 درصد. به طور مشابه، میانگین ضریب کاپا برای Sentinel-2A 83.3٪ بود، در حالی که میانگین برای Landsat-8 77.3٪ بود.
دقت کلی طبقه‌بندی‌کننده تصادفی جنگل برای ماهواره‌های Sentinel-2A و Landsat-8 به ترتیب 92 و 85 درصد ثبت شد ( شکل 9 ). میانگین دقت طبقه‌بندی‌کننده KD-Tree برای هر دو ماهواره 84.5 درصد ثبت شد. K-NN به ترتیب 86 و 81 درصد دقت کلی را برای ماهواره های Sentinel-2A و Landsat-8 به دست آورد. میانگین دقت کلی کمی کمتر از 83.5% برای الگوریتم K-NN در مقایسه با طبقه بندی کننده KD-Tree ثبت شد ( شکل 9 ).

4. بحث

Sentinel-2A و Landsat-8 در حال حاضر با وضوح متوسط ​​در 10، 20 و 30 متر کار می کنند. وضوح این دو باند ماهواره ای متفاوت است. قبل از پردازش بیشتر، همه باندهای Landsat-8 به وضوح 30 متر نمونه برداری شدند، در حالی که باندهای Sentinel-2A به وضوح 20 متر نمونه برداری شدند. این مطالعه پتانسیل شاخص‌های مختلف سنجش از دور را برای ایجاد نمونه‌های آموزشی برای نقشه‌برداری LULC در PEI در ارتباط با سه الگوریتم ML ارائه کرد. جمعیت جزیره در حال افزایش است و طبقات عمده پوشش زمین مانند جنگل، کشاورزی، زمین بایر و شهری تحت تأثیر قرار خواهند گرفت. این تغییرات سریع نیازمند روش‌های مؤثرتری برای نقشه‌برداری تغییرات پوشش زمین و انجام تحلیل‌های مدیریت منابع است.
شاخص‌های سنجش از دور، از جمله DVI، NDVI، NDBI، UI و NBLI، برای برجسته کردن کشاورزی، جنگل، زمین بایر و منطقه شهری انتخاب شدند. این رویکرد برای تهیه نقشه‌های LULC بسیار ارزان‌تر و سریع‌تر از سایر روش‌های طبقه‌بندی سنتی است. اگرچه، برای برخی از کلاس های LULC، یافتن شاخص های سنجش از راه دور مناسب دشوار است. به عنوان مثال، تمایز بین جنگل و کشاورزی با استفاده از شاخص های سنجش از دور دشوار است. NBLI برای غلبه بر این مشکل استفاده شد زیرا [ 6 ] مستند کرد که NBLI می تواند ترکیب خاک را در سطح پیکسل برجسته کند، که به تمایز بین کشاورزی و جنگل کمک می کند ( شکل 2 ). نتایج حاصل از آزمایش نیز اعتبار این روش پیشنهادی را تأیید کرد.
در مرحله آخر، از همان شرایط پردازش الگوریتم‌ها (مجموعه‌های آموزش و اعتبارسنجی یکسان) برای مقایسه مجموعه داده‌های بهینه Landsat-8 و Sentinel-2A برای نقشه‌برداری LULC استفاده کردیم. نتایج مقایسه نشان داد که دقت کلی هر الگوریتم به شدت به داده های ورودی نتایج بستگی دارد. به عنوان مثال، بالاترین دقت کلی RF 92٪ نشان داد که RF بهترین نتایج طبقه بندی را برای Sentinel-2A ارائه می دهد، در حالی که دقت کلی KD-Tree و K-NN اندکی کاهش یافته است. جالب توجه است، RF همچنین بالاترین دقت کلی 85٪ را برای Landsat-8 ارائه می دهد. به همین ترتیب، دقت کلی KD-Tree و K-NN در مقایسه با RF کمی کاهش یافت. تمام نتایج ذکر شده در بالا ثابت کردند که نتایج هر طبقه بندی کننده به مجموعه داده های ورودی بستگی دارد. نتایج ثابت کرد که RF یک الگوریتم ML مناسب در مقایسه با KD-Tree و K-NN برای طبقه بندی پوشش زمین بدون در نظر گرفتن مجموعه داده های ورودی است. بنابراین، مقایسه نتایج به‌دست‌آمده با ادبیات پژوهشی ضروری است زیرا دیدی واقع‌بینانه از نتایج این مطالعه ارائه می‌کند.
برای مثال، Lowe و Kulkarni [ 52 ] از طبقه‌بندی کننده حداکثر احتمال RF، SVM برای تهیه نقشه LULC استفاده کردند و به ترتیب به دقت کلی 87، 83 و 77 درصد دست یافتند. مطالعه دیگری از فرانکو لوپز و همکاران. [ 53 ] نقشه های LULC را با 13 کلاس با استفاده از الگوریتم K-NN تهیه کرد و به دقت کلی 63 درصد دست یافت. این نتایج متفاوت نشان می‌دهد که هیچ قواعد روشنی برای دقت قابل قبول برای هر نوع پوشش زمین وجود ندارد، اما بستگی به روش استفاده‌کننده و اتخاذ شده دارد. در هر طبقه بندی LULC، خطاها به صورت تخمین و پیش بینی وجود دارند [ 54 ]. تاکنون هیچ قانون روشنی در محدوده دقت قابل قبول تعریف نشده است زیرا کاربران مختلف نگرانی های متفاوتی در مورد دقت طبقه بندی دارند [55 ]. علاوه بر این، عوامل متعددی بر دقت طبقه‌بندی تأثیر می‌گذارند، مانند کیفیت تصویر، طبقه‌بندی کننده، تعداد کلاس‌ها و تعداد حجم نمونه [ 51 ]. یک مطالعه [ 51 ] که از داده‌های Sentinel-2 استفاده کرد، برای نقشه‌برداری LULC در ویتنام با الگوریتم‌های RF، K-NN و SVM بود و زمانی که اندازه بردار آموزشی برای پوشش منطقه مورد مطالعه مناسب بود، بالاترین دقت را توسط RF گزارش کرد. RF با استفاده از داده های Sentinel-1 آمازون برزیلی [ 56 ] به دقت بالاتری نسبت به SVM دست یافت . این نتایج نشان می دهد که داده های Sentinel-2A و Landsat-8 عملکرد رضایت بخشی در نقشه برداری LULC داشتند. در [ 51]، RF برای طبقه بندی LULC به دلیل سهولت در انتخاب پارامتر در RF توصیه شد. نتایج این مطالعه با یافته های [ 51 ] مطابقت دارد.

5. نتیجه گیری ها

این مطالعه با استفاده از سه الگوریتم ML (KD-Tree، RF و K-NN) و دو ماهواره (Landsat-8 و Sentinel-2A) روشی را برای تولید نقشه‌های LULC با هزینه کمتر و به روشی سریع پیشنهاد کرد. نقشه‌های به‌روز شده به‌موقع می‌توانند به مقامات محلی در مدیریت بهتر منابع و تصمیم‌گیری‌های سیاست کاربری زمین کمک کنند. روش پیشنهادی برای توسعه نقشه‌های LULC با شاخص‌های سنجش از دور می‌تواند توسط محققان برای تعیین تغییرات مکانی-زمانی LULC به دلیل فعالیت‌های انسانی مورد استفاده قرار گیرد. نتایج این مطالعه پتانسیل شاخص های سنجش از دور را برای محدود کردن نیاز به داده های حقیقت زمینی برای نقشه برداری LULC نشان داد. این امر هزینه کار، زمان و منابع مورد نیاز برای تولید نقشه های LULC را کاهش می دهد.
در این تحقیق، نمونه های آموزشی برای چهار کلاس جنگل، کشاورزی، شهری و زمین بایر به نمایندگی از شاخص ها ایجاد شد و این نمونه های آموزشی همراه با الگوریتم های ML برای نقشه برداری LULC استفاده شد. نقشه‌های LULC تهیه‌شده بر اساس این روش پیشنهادی نتایج امیدوارکننده‌ای را هنگامی که با داده‌های حقیقت زمینی اعتبارسنجی شدند نشان دادند. شش نقشه LULC که با اجرای سه الگوریتم ML با استفاده از داده‌های آموزشی مشابه برای دو منبع تصویر تولید شده‌اند، برای تعیین اثربخشی الگوریتم‌های ML مورد ارزیابی دقت قرار گرفتند.
نتایج حاصل از مطالعه نشان داد که K-NN به ترتیب ضرایب کاپا 82 و 74 درصد و دقت کلی بالای 86 و 81 درصد را برای Sentinel-2A و Landsat-8 به دست آورد. در مقایسه، KD-Tree دارای ضرایب کاپا متوسط ​​80 و 78 درصد و دقت کلی 85 و 84 درصد برای Sentinel-2A و Landsat-8 بود. جنگل تصادفی بالاترین میانگین ضرایب کاپا را با 83.3 و 73.3 درصد و بالاترین دقت کلی را با 92 و 85 درصد به دست آورد. برای داده های Sentinel-2A و Landsat-8، به ترتیب، در مقایسه با K-NN و KD-Tree.
تحقیقات بیشتر باید در دو وظیفه انجام شود: (1) ارزیابی این روش بر روی تصاویر ماهواره‌ای با وضوح بالاتر و همچنین پالایش داده‌ها با نمونه‌های آموزشی برای زیر کلاس‌های محصولاتی مانند سیب‌زمینی، گندم، برنج، ذرت، و چمن و (2) کمیت و کیفیت نمونه های آموزشی بر طبقه بندی پوشش زمین تأثیر دارد. با تضمین کیفیت و افزایش حجم نمونه آموزشی، می توان دقت طبقه بندی را افزایش داد. ترکیب ایده آل حجم نمونه آموزشی نیز در آینده مورد تحقیق قرار خواهد گرفت.

منابع

  1. نگوین، HTT؛ Doan، TM; Radeloff, V. اعمال طبقه‌بندی تصادفی جنگل برای نقشه کاربری زمین/پوشش زمین با استفاده از Landsat 8 OLI. بین المللی قوس. فتوگرام حسگر از راه دور اسپات. Inf. علمی 2018 ، 42 ، 363-367. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  2. بورکهارد، بی. کرول، اف. ندکوف، اس. مولر، اف. نقشه عرضه، تقاضا و بودجه خدمات اکوسیستم. Ecol. اندیک. 2012 ، 21 ، 17-29. [ Google Scholar ] [ CrossRef ]
  3. فیری، دی. مورگنروث، جی. تحولات در روش های طبقه بندی پوشش زمین لندست: مروری. Remote Sens. 2017 , 9 , 967. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  4. عملکرد عبدی، AM پوشش زمین و طبقه‌بندی کاربری اراضی الگوریتم‌های یادگیری ماشین در یک منظره شمالی با استفاده از داده‌های Sentinel-2. GISci. Remote Sens. 2020 , 57 , 1-20. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  5. شوقی، آی. رشید، من. رومشو، SA دینامیک پوشش زمین کاربری اراضی به عنوان تابعی از تغییر جمعیت شناسی و هیدرولوژی. ژئوژورنال 2014 ، 79 ، 297-307. [ Google Scholar ] [ CrossRef ]
  6. وزارت امور اقتصادی و اجتماعی سازمان ملل متحد – بخش جمعیت. رشد جمعیت جهانی و توسعه پایدار ; وزارت امور اقتصادی و اجتماعی سازمان ملل متحد – بخش جمعیت: نیویورک، نیویورک، ایالات متحده آمریکا، 2021؛ ISBN 9789211483505. [ Google Scholar ]
  7. لی، پی. ماه، WM طبقه‌بندی پوشش زمین با استفاده از داده‌های شبیه‌ساز هوابرد MODIS–ASTER (MASTER) و NDVI: مطالعه موردی منطقه کوچانگ، کره. می توان. J. Remote Sens. 2004 ، 30 ، 123-136. [ Google Scholar ] [ CrossRef ]
  8. وجدا، س. Santosh، KC طبقه‌بندی‌کننده سریع K-نزدیک‌ترین همسایه با استفاده از خوشه‌بندی بدون نظارت. در مجموعه مقالات ارتباطات در علوم کامپیوتر و اطلاعات، استانبول، ترکیه، 17-18 دسامبر 2017. جلد 709، ص 185–193. [ Google Scholar ]
  9. موهان، م. Pathan, SK; نارندراردی، ک. کاندیا، ا. پاندی، اس. پویایی شهرسازی و تأثیر آن بر کاربری زمین/پوشش زمین: مطالعه موردی کلان شهر دهلی. جی. محیط زیست. Prot. 2011 ، 2 ، 1274-1283. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  10. سرا، پ. بیشتر، G. Pons, X. پیامدهای دقت موضوعی در غنی‌سازی پوشش زمین کاداستر از یک پیکسل و از منظر چندضلعی. فتوگرام مهندس Remote Sens. 2009 ، 75 ، 1441-1449. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  11. لی، اچ. وانگ، سی. ژونگ، سی. ژانگ، ز. لیو، کیو. نقشه برداری LULC شهری معمولی از تصاویر Landsat بدون نمونه های آموزشی یا پارامترهای خود تعریف شده. Remote Sens. 2017 , 9 , 700. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  12. فیست، تی. دیویدسون، ا. دانشفر، ب. رولین، پی. علی، ز. کمپبل، L. فهرست سالانه محصولات مبتنی بر فضا برای کانادا: 2009-2014. در مجموعه مقالات سمپوزیوم IEEE Geoscience and Remote Sensing 2014، شهر کبک، QC، کانادا، 13 تا 18 ژوئیه 2014. ص 5095–5098. [ Google Scholar ] [ CrossRef ]
  13. فودی، جنرال موتورز; ماتور، ا. سانچز-هرناندز، سی. الزامات اندازه مجموعه آموزشی Boyd، DS برای طبقه بندی یک کلاس خاص. سنسور از راه دور محیط. 2006 ، 104 ، 1-14. [ Google Scholar ] [ CrossRef ]
  14. لو، دی. Weng, Q. بررسی روش‌ها و تکنیک‌های طبقه‌بندی تصویر برای بهبود عملکرد طبقه‌بندی. بین المللی J. Remote Sens. 2007 , 28 , 823-870. [ Google Scholar ] [ CrossRef ]
  15. پایپر، جی. تغییرپذیری و تعصب در میزان خطای طبقه‌بندی‌کننده تجربی اندازه‌گیری شده. تشخیص الگو Lett. 1992 ، 13 ، 685-692. [ Google Scholar ] [ CrossRef ]
  16. حیدری، س.س. Mountrakis، G. اثر انتخاب طبقه‌بندی‌کننده، حجم نمونه مرجع، توزیع کلاس مرجع و ناهمگونی صحنه در دقت طبقه‌بندی در هر پیکسل با استفاده از ۲۶ سایت Landsat. سنسور از راه دور محیط. 2018 ، 204 ، 648-658. [ Google Scholar ] [ CrossRef ]
  17. هوانگ، سی. دیویس، LS; Townshend، JRG ارزیابی ماشین‌های بردار پشتیبان برای طبقه‌بندی پوشش زمین. بین المللی J. Remote Sens. 2002 ، 23 ، 725-749. [ Google Scholar ] [ CrossRef ]
  18. رمضان، کالیفرنیا; وارنر، TA; ماکسول، AE; قیمت، تأثیرات BS اندازه مجموعه آموزشی بر طبقه‌بندی پوشش زمینی یادگیری ماشینی نظارت شده از داده‌های سنجش از راه دور با وضوح بالا. Remote Sens. 2021 , 13 , 368. [ Google Scholar ] [ CrossRef ]
  19. ماکسول، AE; وارنر، TA; Fang, F. پیاده‌سازی طبقه‌بندی یادگیری ماشینی در سنجش از دور: یک بررسی کاربردی. بین المللی J. Remote Sens. 2018 , 39 , 2784–2817. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  20. جمالی، ع. ارزیابی و مقایسه هشت مدل یادگیری ماشین در نقشه‌برداری کاربری زمین/پوشش زمین با استفاده از Landsat 8 OLI: مطالعه موردی منطقه شمال ایران. SN Appl. علمی 2019 ، 1 ، 1448. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  21. ویشوانات، ن. رامش، ب. Sreenivasa Rao, P. طبقه بندی بدون نظارت تصاویر سنجش از دور با استفاده از الگوریتم K-Means. بین المللی J. آخرین روندها Eng. تکنولوژی 2016 ، 7 ، 548-552. [ Google Scholar ] [ CrossRef ]
  22. شیواکومار، BR; Rajashekararadhya، SV بررسی قابلیت نقشه‌برداری پوشش زمین طبقه‌بندی‌کننده حداکثر احتمال: مطالعه موردی در کانارای شمالی، هند. Procedia Comput. علمی 2018 ، 143 ، 579-586. [ Google Scholar ] [ CrossRef ]
  23. مادر، پ. Tso، B. روش‌های طبقه‌بندی برای داده‌های سنجش از راه دور . CRC Press: Boca Raton، FL، USA، 2016; ISBN 9780429192029. [ Google Scholar ]
  24. عباس، ز. جابر، ارزیابی دقت HS روش‌های طبقه‌بندی نظارت شده برای استخراج نقشه‌های کاربری اراضی با استفاده از تکنیک‌های سنجش از دور و GIS. IOP Conf. سر. ماتر علمی مهندس 2020 , 745 , 012166. [ Google Scholar ] [ CrossRef ]
  25. دسای، سی. Umrikar، B. ابزار طبقه‌بندی تصویر برای تحلیل پوشش زمین کاربری: مطالعه مقایسه‌ای روش حداکثر احتمال و حداقل فاصله. بین المللی جی. جئول. محیط زمین. علمی 2012 ، 2 ، 189-196. [ Google Scholar ]
  26. نگوین، کلاه؛ سوفیا، تی. Gheewala، SH; راتاناکوم، آر. آریروب، تی. Prueksakorn، K. ادغام سنجش از دور و یادگیری ماشین در پایش محیطی و ارزیابی تغییر کاربری زمین. حفظ کنید. تولید مصرف کنید. 2021 ، 27 ، 1239-1254. [ Google Scholar ] [ CrossRef ]
  27. جیا، ک. وی، ایکس. گو، ایکس. یائو، ی. Xie، X. Li، B. طبقه‌بندی پوشش زمین با استفاده از داده‌های تصویرگر زمین عملیاتی Landsat 8 در پکن، چین. Geocarto Int. 2014 ، 29 ، 941-951. [ Google Scholar ] [ CrossRef ]
  28. Thanh Noi، P. کاپاس، ام. مقایسه طبقه‌بندی‌کننده‌های جنگل تصادفی، k-نزدیک‌ترین همسایه و ماشین بردار پشتیبان برای طبقه‌بندی پوشش زمین با استفاده از تصاویر Sentinel-2. سنسورها 2017 ، 18 ، 18. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  29. علی، م.ز. قاضی، و. Aslam, N. A مطالعه مقایسه ای تصاویر ALOS-2 PALSAR و Landsat-8 برای طبقه بندی پوشش زمین با استفاده از طبقه بندی کننده حداکثر احتمال. مصر. J. Remote Sens. Space Sci. 2018 ، 21 ، 29-35. [ Google Scholar ] [ CrossRef ]
  30. کلریسی، ن. والبوئنا کالدرون، کالیفرنیا؛ Posada، JM Fusion داده های Sentinel-1a و Sentinel-2A برای نقشه برداری پوشش زمین: مطالعه موردی در منطقه ماگدالنا پایین، کلمبیا. J. Maps 2017 ، 13 , 718–726. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  31. دولت جزیره پرنس ادوارد گزارش جمعیت جزیره پرنس ادوارد 2020 ; دولت جزیره پرنس ادوارد: شارلوت تاون، PE، کانادا، 2020.
  32. اداره محیط زیست، E. و CA ما در حال تغییر اقلیم. در دسترس آنلاین: https://www.princeedwardisland.ca/en/information/environment-energy-and-climate-action/our-changing-climate (در 27 ژوئیه 2021 قابل دسترسی است).
  33. آسوکان، ع. آنیتا، جی. چیوبانو، ام. گابور، ا. نااجی، ع. Hemanth، DJ Image Processing Techniques for Analysis of Satellite Images for Historical Maps Classification-An Overview. Appl. علمی 2020 ، 10 ، 4207. [ Google Scholar ] [ CrossRef ]
  34. دروش، ام. دل بلو، U. کارلیر، اس. کالین، او. فرناندز، وی. گاسکون، اف. هورش، بی. ایزولا، سی. لابرینتی، پ. مارتیمورت، پی. و همکاران Sentinel-2: ماموریت نوری با وضوح بالا ESA برای خدمات عملیاتی GMES. سنسور از راه دور محیط. 2012 ، 120 ، 25-36. [ Google Scholar ] [ CrossRef ]
  35. روی، DP; Wulder، MA; لاولند، TR; Woodcock، CE; آلن، آر جی. اندرسون، ام سی؛ هلدر، دی. آیرونز، جی آر. جانسون، دی.م. کندی، آر. و همکاران Landsat-8: علم و چشم انداز محصول برای تحقیقات تغییرات جهانی زمینی. سنسور از راه دور محیط. 2014 ، 145 ، 154-172. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  36. ریچاردسون، ای جی; Everitt, JH با استفاده از شاخص‌های پوشش گیاهی طیفی برای تخمین بهره‌وری مرتع. Geocarto Int. 1992 ، 7 ، 63-69. [ Google Scholar ] [ CrossRef ]
  37. Tucker، CJ Red و ترکیبات خطی مادون قرمز عکاسی برای نظارت بر پوشش گیاهی. سنسور از راه دور محیط. 1979 ، 8 ، 127-150. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  38. ژا، ی. گائو، جی. Ni, S. استفاده از شاخص ایجاد شده با تفاوت عادی در نقشه برداری خودکار مناطق شهری از تصاویر TM. بین المللی J. Remote Sens. 2003 , 24 , 583-594. [ Google Scholar ] [ CrossRef ]
  39. لی، اچ. وانگ، سی. ژونگ، سی. سو، آ. شیونگ، سی. وانگ، جی. لیو، جی. نقشه برداری زمین برهنه شهری به صورت خودکار از تصاویر Landsat با یک شاخص ساده. Remote Sens. 2017 , 9 , 249. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  40. بریمن، ال. جنگل های تصادفی. ماخ فرا گرفتن. 2001 ، 45 ، 5-32. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  41. لیاو، ا. وینر، ام. طبقه بندی و رگرسیون توسط RandomForest. R News 2002 , 2 , 18-22. [ Google Scholar ]
  42. فیکس، ای. تجزیه و تحلیل تبعیض آمیز: تبعیض ناپارامتری، ویژگی های سازگاری . موسسه بین المللی آمار: Voorburg، هلند، 1951. [ Google Scholar ]
  43. پوشش، TM; هارت، PE طبقه بندی الگوی نزدیکترین همسایه. IEEE Trans. Inf. نظریه 1967 ، 13 ، 21-27. [ Google Scholar ] [ CrossRef ]
  44. Karegowda، AG; Jayaram، MA; Manjunath، AS Cascading K-Means Clustering و K-Nearest Neighbor Classifier برای طبقه بندی بیماران دیابتی. بین المللی J. Eng. Adv. تکنولوژی 2012 ، 1 ، 147-151. [ Google Scholar ]
  45. ناراسیمهلو، ی. سوتر، ا. پاسونوری، ر. China Venkaiah، V. Ckd-Tree: An Improved Kd-Tree Construction الگوریتم. CEUR Workshop Proc. 2021 ، 2786 ، 211-218. [ Google Scholar ]
  46. دولتشاه، م. هادیان، ع. مینایی-بیدگلی، ب. توپ*-درخت: نمایه سازی فضایی کارآمد برای جستجوی محدود نزدیکترین همسایه در فضاهای متریک. arXiv 2015 ، arXiv:1511.00628. [ Google Scholar ]
  47. داستان، م. کنگالتون، سنجش از دور RG ارزیابی مختصر دقت: دیدگاه کاربر. فتوگرام مهندس Remote Sens. 1986 ، 52 , 397-399. [ Google Scholar ]
  48. مک‌هو، درس‌های ام‌ال در آمار زیستی قابلیت اعتماد بین‌سنجی: آمار کاپا. بیوشیمی. پزشکی 2012 ، 22 ، 276-282. [ Google Scholar ] [ CrossRef ]
  49. چن، دی. استو، دی. گونگ، پی. بررسی اثر تفکیک فضایی و اندازه پنجره بافت بر دقت طبقه‌بندی: یک مورد محیط شهری. بین المللی J. Remote Sens. 2004 ، 25 ، 2177-2192. [ Google Scholar ] [ CrossRef ]
  50. رائو، پی. ژو، دبلیو. بهاتارای، ن. سریواستاوا، AK; سینگ، بی. پونیا، اس. لوبل، دی بی؛ Jain، M. استفاده از Sentinel-1، Sentinel-2، و تصاویر سیاره برای نقشه برداری از نوع محصول مزارع کوچک. Remote Sens. 2021 ، 13 ، 1870. [ Google Scholar ] [ CrossRef ]
  51. نگوین، HTT؛ Doan، TM; تومپو، ای. McRoberts، RE استفاده از زمین/نقشه‌برداری پوشش زمین با استفاده از تصاویر چندزمانی Sentinel-2 و چهار روش طبقه‌بندی – مطالعه موردی از Dak Nong، ویتنام. Remote Sens. 2020 , 12 , 1367. [ Google Scholar ] [ CrossRef ]
  52. لو، بی. Kulkarni، A. تجزیه و تحلیل تصویر چندطیفی با استفاده از جنگل تصادفی. بین المللی J. Soft Comput. 2015 ، 6 ، 1-14. [ Google Scholar ] [ CrossRef ]
  53. فرانکو لوپز، اچ. Ek، AR; تخمین بائر، ME و نقشه برداری از تراکم، حجم و نوع پوشش جنگلی با استفاده از روش k-نزدیکترین همسایگان. سنسور از راه دور محیط. 2001 ، 77 ، 251-274. [ Google Scholar ] [ CrossRef ]
  54. سالوآرا، کی جی. تسلر، اس. مالک، RN; Tuomisto، H. طبقه‌بندی پوشش گیاهی جنگل‌های بارانی اولیه آمازون با استفاده از تصاویر ماهواره‌ای Landsat ETM+. سنسور از راه دور محیط. 2005 ، 97 ، 39-51. [ Google Scholar ] [ CrossRef ]
  55. اولوفسون، پی. فودی، جنرال موتورز; هرولد، ام. Stehman، SV; Woodcock، CE; Wulder، MA اقدامات خوب برای تخمین مساحت و ارزیابی دقت تغییر زمین. سنسور از راه دور محیط. 2014 ، 148 ، 42-57. [ Google Scholar ] [ CrossRef ]
  56. Chaves، MED; پیکولی، MCA؛ Sanches، ID آخرین کاربردهای Landsat 8/OLI و Sentinel-2/MSI برای استفاده از زمین و نقشه برداری پوشش زمین: یک بررسی سیستماتیک. Remote Sens. 2020 , 12 , 3062. [ Google Scholar ] [ CrossRef ]
شکل 1. جزیره پرنس ادوارد، کانادا.
شکل 2. شاخص های Sentinel-2A و Landsat-8 برای طبقه بندی پوشش زمین های کشاورزی، شهری، جنگلی و بایر استفاده می شوند. قسمت سمت راست ( A1 – A5 ) و ( B1 – B5 ) هر شکل جزئیات قسمت انتخاب شده را نشان می دهد. حداقل و حداکثر مقادیر شاخص های پوشش گیاهی از 0 تا 1 متغیر است.
شکل 3. نمای تصویری از اصل کار تصادفی جنگل.
شکل 4. نمای تصویری از اصل کار k-نزدیکترین همسایه.
شکل 5. یک نمای تصویری از اصل کار با ابعاد k.
شکل 6. نقشه LULC مبتنی بر شاخص های سنجش از دور بر اساس داده های دو ماهواره تهیه شده است. تخصیص زمین به چهار طبقه کشاورزی، شهری، جنگلی و زمین بایر تقسیم شد.
شکل 7. ماتریس خطا که بردارهای آموزشی صحیح و نادرست نمونه های ارزیابی را با هر الگوریتم ML نشان می دهد. ماتریس های خطا برای داده های Landsat-8 در شکل های ( A – C ) نشان داده شده است. ماتریس های خطا برای داده های Sentinel-2A در شکل های ( D – F ) نشان داده شده است. جدول 4 دقت سازنده و کاربر محاسبه شده بر اساس ماتریس های خطا را نشان می دهد.
شکل 8. مقایسه ضریب کاپا دو ماهواره با استفاده از طبقه بندی کننده های مختلف.
شکل 9. مقایسه دقت کلی دو ماهواره با استفاده از طبقه بندی کننده های مختلف.

بدون دیدگاه

دیدگاهتان را بنویسید