خلاصه

الگوریتم های درخت تصمیم (DT) ابزارهای ناپارامتریک مهمی هستند که برای طبقه بندی پوشش زمین استفاده می شوند. در حالی که DT های مختلف برای طبقه بندی پوشش زمین Landsat اعمال شده اند، دقت طبقه بندی فردی و عملکرد آنها مقایسه نشده است، به ویژه در مورد اثربخشی آنها برای ایجاد آستانه های دقیق برای توسعه قوانین برای طبقه بندی پوشش زمین مبتنی بر شی. در اینجا، تمرکز بر مقایسه عملکرد پنج الگوریتم DT بود: Tree، C5.0، Rpart، Ipred و Party. این الگوریتم‌های DT برای طبقه‌بندی ده طبقه پوشش زمین با استفاده از تصاویر Landsat 8 در استان Copperbelt زامبیا استفاده شدند. طبقه بندی با استفاده از تجزیه و تحلیل تصویر مبتنی بر شی (OBIA) از طریق توسعه مجموعه قوانین با آستانه های تعریف شده توسط DT ها انجام شد. عملکرد الگوریتم‌های DT بر اساس موارد زیر ارزیابی شد: (1) دقت DT از طریق اعتبارسنجی متقابل. (2) دقت طبقه بندی پوشش زمین نقشه های موضوعی. و (3) خصوصیات ساختاری دیگر مانند اندازه نمودارهای درختی و توانایی های انتخاب متغیر. نتایج نشان می‌دهد که تنها مجموعه‌های قوانین توسعه‌یافته از الگوریتم‌های DT با ساختارهای ساده و حداقل تعداد متغیرها، دقت طبقه‌بندی پوشش زمین بالایی را تولید می‌کنند (دقت کلی > 88٪). بنابراین، الگوریتم‌هایی مانند Tree و Rpart نتایج طبقه‌بندی بالاتری را در مقایسه با الگوریتم‌های C5.0 و Party DT تولید کردند که متغیرهای زیادی را در طبقه‌بندی شامل می‌شوند. این دقت بالا به توانایی به حداقل رساندن بیش از حد برازش و ظرفیت رسیدگی به نویز در داده ها در طول آموزش توسط Tree و Rpart DT نسبت داده شده است. این مطالعه بینش جدیدی در مورد انتخاب رسمی الگوریتم‌های DT برای توسعه مجموعه قوانین OBIA ایجاد کرد. بنابراین، الگوریتم‌های Tree و Rpart می‌توانند برای توسعه قواعد مورد استفاده قرار گیرند، زیرا آنها دقت طبقه‌بندی پوشش زمین بالایی را تولید می‌کنند و ساختار ساده‌ای دارند. به عنوان راهی برای مطالعات آینده، عملکرد الگوریتم‌های DT را می‌توان با طبقه‌بندی‌کننده‌های یادگیری ماشینی معاصر (مانند جنگل تصادفی و ماشین بردار پشتیبان) مقایسه کرد.

کلید واژه ها:

کاربری زمین ؛ سنجش از دور ؛ تجزیه و تحلیل مخلوط طیفی ; تشخیص تغییر ؛ تصاویر نوری ؛ آفریقا

 

چکیده گرافیکی

1. معرفی

تجزیه و تحلیل تصویر مبتنی بر شی (OBIA) به روشی مؤثر برای طبقه بندی پوشش زمین داده های سنجش از دور تبدیل شده است [ 1 ، 2 ]. برخلاف تجزیه و تحلیل سنتی مبتنی بر پیکسل، OBIA فرصتی را برای توسعه اشیاء گسسته ای ارائه می دهد که از طریق تقسیم بندی تصویر به اشیاء دنیای واقعی مربوط می شوند [ 3 ، 4 ]. فرآیند تقسیم بندی تغییرات طیفی در کلاس را کاهش می دهد و فرصتی را برای افزایش دقت طبقه بندی ارائه می دهد، به ویژه زمانی که در مقیاس مناسب انجام شود [ 5 ، 6 ].
توانایی ترکیب بافت، تراکم و سایر اطلاعات مربوط به شی با اطلاعات طیفی، OBIA را از سایر روش‌های طبقه‌بندی مانند رویکردهای پیکسلی و زیرپیکسلی متمایز کرده است. در مقایسه با تجزیه و تحلیل تصویر مبتنی بر پیکسل، OBIA در کاهش اثرات نمک و فلفل بر روی نقشه های موضوعی موثر است [ 7 ، 8 ]. در حال حاضر تعدادی الگوریتم تقسیم بندی در eCognition Developer موجود است. با این حال، تقسیم بندی چند تفکیک پذیری رایج ترین روش مورد استفاده در طبقه بندی پوشش زمین است [ 1 ، 4 ، 9 ].
جدا از تقسیم بندی، یکی دیگر از مؤلفه های مهم OBIA طبقه بندی واقعی اشیاء قطعه بندی شده است [ 1 ، 2 ]. ماینت و همکاران [ 10 ] توضیح داد که دو راه برای تخصیص کلاس ها به اشیاء تقسیم شده وجود دارد: (1) به کارگیری دانش متخصص از طریق مجموعه قوانین. و (2) با استفاده از طبقه بندی خودکار. تحت دانش تخصصی، طبقه بندی با توسعه قواعد که بر اساس آستانه اطلاعات مربوط به شی مختلف است، انجام می شود. تحت رویکرد طبقه‌بندی خودکار، اشیاء بر اساس طبقه‌بندی‌کننده‌های یادگیری ماشینی معاصر مانند Nearest Neighbor (NN)، جنگل تصادفی (RF)، ماشین بردار پشتیبان (SVM)، و طبقه‌بندی و درخت رگرسیون (CART) طبقه‌بندی می‌شوند. در eCognition Developer 9.1 [2 ، 11 ]. با این حال، تمرین توسعه قواعد با استفاده از آستانه‌های اطلاعات مرتبط با شی‌های مختلف، یک روش معمول در طبقه‌بندی پوشش زمین OBIA است [ 1 ، 12 ].
راه‌های زیادی برای ایجاد آستانه‌ها در طول توسعه مجموعه قوانین وجود دارد، مانند استفاده از دانش تخصصی، آزمون و خطا، و استفاده از درخت‌های تصمیم بازگشتی باینری (DTs) [ 10 ]. اگرچه یک روش معمول نیست، اجرای DT ها در ایجاد آستانه ها و توسعه نهایی قوانین مؤثر رسمی تر به نظر می رسد [ 2 ، 3 ، 13 ]. در اینجا، توجه به این نکته مهم است که بسته های آماری که برای توسعه قواعد استفاده شده اند به عنوان الگوریتم های DT نامیده می شوند [ 14 ].]. این الگوریتم‌ها معمولاً به عنوان «جعبه سیاه» یا «جعبه سفید» شناخته می‌شوند که بستگی به این دارد که مترجم چقدر می‌تواند فرآیند را دنبال کند. الگوریتم های جعبه سیاه، مانند RF، به طور گسترده در طبقه بندی پوشش زمین، به ویژه با پیشرفت در تکنیک های یادگیری ماشین استفاده شده است [ 15 ]. از سوی دیگر، الگوریتم‌های یادگیری ماشین ساده DT مانند Rpart، C5.0 و Tree نیز برای طبقه‌بندی پوشش زمین و ایجاد آستانه‌ها در هنگام توسعه قواعد استفاده شده‌اند [ 13 ].
DTهای ساده ابزارهای مفیدی برای ایجاد آستانه‌هایی برای توسعه قوانین تصمیم‌گیری برای طبقه‌بندی پوشش زمین داده‌های سنجش از دور هستند، زیرا آنها غیر پارامتری هستند و تفسیر آنها آسان است [ 10 ، 16 ]. در طول طبقه‌بندی، متغیرهای زیادی بر اساس اطلاعات طیفی و بافتی مرتبط با شی تولید می‌شوند که در صورت اعمال تکنیک‌های مناسب مانند DTs، می‌توانند برای توسعه مجموعه‌های قوانین مؤثر مورد استفاده قرار گیرند. بلژیک و همکاران [ 17 ] پیشنهاد کرد که DTها می توانند برای انتخاب تأثیرگذارترین متغیر و شناسایی آستانه برای کلاس های مختلف پوشش زمین مفید باشند، زیرا آنها ناپارامتریک هستند و بنابراین برای اکثر مناظر ایده آل هستند.
در حالی که الگوریتم‌های درخت تصمیم در مناطق مختلف مرتبط با طبقه‌بندی پوشش زمین مورد استفاده قرار گرفته‌اند، این الگوریتم‌ها به‌طور جداگانه بر اثربخشی آن‌ها در ایجاد آستانه‌هایی برای توسعه قوانین برای طبقه‌بندی پوشش زمین OBIA ارزیابی نشده‌اند. هدف اصلی این مطالعه انجام یک ارزیابی چند معیاره از پنج الگوریتم یادگیری ماشین مختلف DT بر اساس عملکرد آنها هنگام طبقه‌بندی تصاویر Landsat 8 بود. مقایسه عملکرد بر اثربخشی این پنج الگوریتم در مدیریت اندازه‌های مختلف داده‌ها و تفسیر ساده هر الگوریتم متمرکز بود.

2. مواد و روشها

2.1. سایت مطالعه

این مطالعه در استان کمربند مس زامبیا ( شکل 1 ) که در قسمت شمالی کشور واقع شده است (عرض جغرافیایی: 12.82 درجه جنوبی، طول جغرافیایی: 28.21 درجه شرقی) انجام شد. این منطقه سالانه بین 1000 تا 1200 میلی‌متر بارندگی دریافت می‌کند و دمایی بین 7 تا 35 درجه سانتی‌گراد را تجربه می‌کند [ 18 ، 19 ]. معدن و کشاورزی عمده ترین فعالیت های اقتصادی در این حوزه است. این منطقه به شدت شهری است و دارای تراکم جمعیت (62.5 نفر در کیلومتر مربع) است [ 18 ، 20 ]]. در نتیجه عدم بهره وری معادن، اکثر مردم به کشت جابجایی در مقیاس کوچک اقدام می کنند که باعث تغییر سریع پوشش زمین، به ویژه تبدیل مناطق جنگلی به کشاورزی و سکونتگاه ها می شود. استان مس کمربند همچنین دارای بیشترین نسبت مزارع جنگلی در زامبیا است که متعلق به یک شرکت نیمه دولتی به نام شرکت جنگل و جنگل زامبیا (ZAFFICO) است [ 18 ].

2.2. مجموعه داده ها

تصاویر Landsat 8، همچنین به نام تصاویر Landsat مشاهده زمین (OLI) [ 21 ]، به دست آمده از وب سایت سازمان زمین شناسی ایالات متحده (USGS) ( https://glovis.usgs.gov ) در این مطالعه استفاده شد. تصاویر در سال 2016 گرفته شده اند و تصاویر سپتامبر انتخاب شده اند زیرا در این مدت منطقه مورد مطالعه فصل خشکی را تجربه می کند (یعنی بدون باران) و از این رو پوشش ابری کمتری دارد. لندست 8 دارای وضوح مکانی 30 متر، وضوح طیفی 11 باند، وضوح زمانی 16 روز و وضوح رادیومتری 12 بیت است. علاوه بر این، تصاویر Landsat 8 دارای نوار پانکروماتیک با وضوح فضایی 15 متر هستند [ 22 ، 23]. در این مطالعه از شش باند که از مرئی تا مادون قرمز متغیر است استفاده شد. جدای از تصاویر لندست، مدل‌های ارتفاعی دیجیتالی ماموریت توپوگرافی رادار شاتل (SRTM) با وضوح فضایی 30 متر، برای پیش پردازش و به عنوان داده کمکی برای طبقه‌بندی استفاده شد.
در مجموع، 2600 نقطه تصادفی به طور تصادفی روی تصاویر Landsat با استفاده از بسته نرم افزاری ArcGIS 10.4 قرار گرفتند [ 24 ]. برای تخصیص کلاس ها به هر یک از 2600 نقطه، از دانش بصری و کارشناسی قبلی از طبقات مختلف پوشش زمین استفاده شد. به 2600 نقطه تصادفی یکی از 10 نوع پوشش زمین شناسایی شده در زمین اختصاص داده شد ( جدول 1 و جدول S1 ). این داده ها به آموزش DT (1000 نقطه نمونه)، طبقه بندی پوشش زمین (1000 نقطه نمونه) و نمونه ارزیابی دقت برای هر دو الگوریتم DT و نقشه پوشش زمین (600 نقطه نمونه) تفکیک شد. مجموعه داده به هر طبقه پوشش زمین با توجه به درصد مساحت تحت پوشش هر طبقه توزیع شد ( جدول 1 را ببینید ).

2.3. مواد و روش ها

2.3.1. پیش پردازش

پیش پردازش شامل تصحیح تصاویر از اثرات جوی و تغییرات توپوگرافی بود. این فرآیند اعداد دیجیتال (DN) را به مقادیر بازتاب زمین تبدیل می کند که برای تجزیه و تحلیل تصویر مفیدتر هستند. برای اطمینان از ثبات در طول تجزیه و تحلیل، همه تصاویر به سیستم پیش‌بینی جهانی عرضی Mercator (UTM) Zone 35S و World Geodetic System 84 (WGS 84) نمایش داده شدند. ATCOR 3 خودکار موجود در PCI Geomatics (PCI Geomatics، انتاریو، کانادا)، برای حذف مه، تصحیح جو و تصحیح توپوگرافی با ترکیب یک مدل ارتفاع دیجیتال 30 متری استفاده شد.

2.3.2. تقسیم بندی تصویر

تقسیم بندی اشیاء طیفی همگن ایجاد می کند که می تواند به اشیاء واقعی روی زمین مرتبط شود [ 25 ، 26 ]. تحقیقات گذشته چالش‌ها را در ایجاد پارامترهای تقسیم‌بندی بهینه [ 2 ، 5 ] شناسایی کردند. بنابراین، پارامترهای تقسیم‌بندی که مقیاس (Sc)، شکل (Sh) و فشرده‌سازی (Cm) هستند معمولاً با استفاده از روش‌های آزمون و خطا ایجاد می‌شوند [ 4 ، 25 ، 27 ]. Drǎguţ و همکاران. [ 5] یک روش رسمی برای ایجاد سطوح بهینه عوامل مقیاس با استفاده از ابزار تخمین پارامتر مقیاس (ESP) پیشنهاد کرد. برای این مطالعه، ابزار ESP برای Sc 12، برای Sh 0.2 و برای Cm 0.8 نشان داد. با این پارامترهای مقیاس، الگوریتم چند وضوح در eCognition Developer 9.1 (Trimble Navigation Ltd., Sunnyvale, California) برای تقسیم‌بندی تصاویر به اشیاء همگن طیفی استفاده شد.

2.3.3. انتخاب نمونه و استخراج ویژگی

پس از تقسیم بندی، مرحله بعدی انتخاب نمونه اشیاء با استفاده از 1000 نقطه آموزشی تصادفی و استخراج اطلاعات مربوط به شی بود. چندین مقدار ویژگی مرتبط با شی بر اساس شاخص های طیفی توسعه داده شد ( جدول 2)، مقادیر DEM، مقادیر طیفی هر باند، و ماتریس سطح خاکستری (GLCM). این فرآیند در eCognition Developer 9.1 با استفاده از ابزارهای «تخصیص کلاس بر اساس لایه موضوعی» و «تصویر طبقه‌بندی شده به نمونه» انجام شد. نمونه ها و اطلاعات مربوط به شی استخراج شده سپس به یک صفحه گسترده صادر شدند. برای ارزیابی عملکرد الگوریتم‌های DT در طبقه‌بندی پوشش زمین، دقت DTها و دقت طبقه‌بندی نقشه‌های موضوعی نهایی در نظر گرفته شد. توجه به این نکته ضروری است که ما به دقت حاصل از اعتبارسنجی متقاطع DT ها پس از آموزش به عنوان دقت DT اشاره می کنیم در حالی که دقت نهایی نقشه های موضوعی که از ارزیابی دقت به دست آمده است، به عنوان دقت طبقه بندی پوشش زمین یا نقشه موضوعی نامیده می شود. دقت.

2.3.4. الگوریتم های درخت تصمیم

DTها در طبقه بندی مبتنی بر تصویر استفاده شده اند، زیرا آنها غیر پارامتری هستند و به راحتی قابل تفسیر هستند [ 13 ، 14 ، 46 ]. در OBIA، ایجاد قوانین تصمیم گام مهمی در جهت طبقه بندی پوشش زمین است. با این حال، این مرحله نیاز به آستانه های مربوط به کلاس ها دارد که می توان با استفاده از روش های مبتنی بر دانش یا DT های ساده آن را ایجاد کرد. رویکرد مبتنی بر دانش می تواند پیچیده باشد، به ویژه زمانی که بسیاری از پوشش های زمین و متغیرهای تصمیم درگیر باشند. در اینجا، تمرکز بر روی DTهای بازگشتی باینری بود، که از متغیرهای پاسخ برای تقسیم درختان استفاده می کنند تا زمانی که امکان تقسیم بیشتر وجود نداشته باشد. عملکرد پنج الگوریتم DT ( جدول 3)، Rpart، Tree، Party، C5.0 و Ipred، در این مطالعه با استفاده از رویکرد چند معیاره [ 47 ] ارزیابی شد. ارزیابی شامل سه جزء بود: (1) ارزیابی دقت DTs دقت در خوشه بندی داده های آموزشی. (2) ارزیابی دقت طبقه بندی پوشش زمین. و (3) بررسی سادگی (مثلاً نمودار درختی و تعداد متغیرها) ساختار DTها.

2.3.5. ارزیابی دقت DT

الگوریتم های DT با استفاده از نمونه اطلاعات استخراج شده از نمونه ها آموزش داده شدند. پس از آموزش الگوریتم‌های DT، یک مجموعه داده مستقل (600 امتیاز) برای اعتبارسنجی متقابل DTهایی که در طول آموزش تولید شده‌اند استفاده شد. مقایسه با استفاده از نتایج پیش‌بینی‌شده از DTs و داده‌های مستقل که به عنوان داده‌های مرجع استفاده شد، انجام شد. دقت بر حسب درصد از مقایسه برای هر پنج الگوریتم DT به دست آمد. هنگامی که از اندازه های مختلف نمونه برای آموزش الگوریتم های DT استفاده شد، مقایسه ای در مورد دقت DT ها انجام شد. نمونه ها (یعنی 1000 نقطه نمونه) به ده نمونه در مضرب 100 تقسیم شدند. بنابراین، کوچکترین حجم نمونه 100 و بزرگترین حجم نمونه 1000 بود ( جدول 4).). این نمونه ها با تصادفی سازی و انتخاب تعداد مشخصی از نمونه ها ایجاد شدند. سپس از نمونه‌های مستقل برای ارزیابی دقت DTها نسبت به افزایش حجم نمونه استفاده شد. سپس از یک آزمون ناپارامتریک کروسکال-والیس برای ارزیابی تفاوت معنی‌دار بین دقت DT پنج الگوریتم به دلیل تلاش‌های محدود طبقه‌بندی و غیرعادی بودن داده‌ها استفاده شد که توسط لی و همکاران پیشنهاد شده است. [ 2 ].
پس از انجام 10 طبقه بندی بر اساس حجم نمونه برای هر DT، بهترین نتیجه برای هر الگوریتم DT در تدوین قوانین برای طبقه بندی پوشش زمین استفاده شد. مجموعه قوانین از خلاصه‌های خروجی و نمودارهای DT توسعه داده شد. سپس مجموعه قوانین در درخت فرآیند 9.1 توسعه‌دهنده eCognition برای طبقه‌بندی پوشش زمین برای تولید نقشه‌های موضوعی برای پنج DT پیاده‌سازی شدند.

2.3.6. ارزیابی دقت نقشه موضوعی

طبقه بندی پوشش زمین تنها پس از انجام ارزیابی دقیق بر روی نقشه های موضوعی کامل می شود [ 1 ، 48 ، 49 ]. نمونه مستقل از 600 نقطه اعتبار سنجی تصادفی برای ساخت ماتریس های سردرگمی با مقایسه نقاط پوشش زمین طبقه بندی شده و مرجع استفاده شد. ماتریس های سردرگمی برای محاسبه دقت کاربران، تولیدکنندگان و کلی استفاده شد ( شکل 2 ). مناسب بودن پنج خروجی طبقه بندی پوشش زمین با استفاده از دقت کاربر و تولیدکننده مقایسه شد. دقت کلی نقشه های موضوعی با استفاده از دقت کلی انجام شد.

3. نتایج

3.1. دقت DT

الگوریتم‌های DT با استفاده از نتایج پیش‌بینی‌شده در برابر یک نمونه مستقل از طریق اعتبارسنجی متقاطع آزمایش شدند. دقت DT از این ارزیابی نشان داد که C5.0 بالاترین (83٪) میانگین دقت DT را داشت، در حالی که حزب دارای کمترین دقت (77٪) بود ( شکل 3 ). با این حال، این تفاوت ها هنگام آزمایش با استفاده از آزمون ناپارامتریک Kruskal-Wallis ( p -value > 0.05) [ 50 ] از نظر آماری معنی دار نبودند.
نتایج حاصل از عملکرد الگوریتم‌های DT با حجم نمونه‌های مختلف نشان می‌دهد که دقت فردی با افزایش حجم نمونه افزایش می‌یابد. شکل 4 نشان می دهد که C5.0 بالاترین دقت DT 88٪ را در هنگام استفاده از بزرگترین حجم نمونه 1000 داشت، در حالی که Rpart کمترین دقت 63٪ را در هنگام استفاده از کوچکترین حجم نمونه داشت.

3.2. دقت نقشه موضوعی

3.2.1. تعداد متغیرها و دقت طبقه بندی

کارایی الگوریتم های DT نیز با مقایسه متغیرهای مورد استفاده و دقت نقشه موضوعی نهایی ارزیابی شد. در این مطالعه 197 متغیر اولیه برای آموزش DTها در نظر گرفته شد. Rpart کمترین متغیرها را داشت (8)، در حالی که C5.0 از 35 متغیر برای ساخت یک DT استفاده کرد ( شکل 5 ). Tree و Ipred همچنین متغیرهای کمتری داشتند (کمتر از 15) و دقت طبقه‌بندی پوشش زمین بالای 85% را حفظ کردند. ساختار DT.

3.2.2. دقت طبقه بندی نقشه موضوعی

دقت کلی و ضریب کاپا، محاسبه‌شده از ماتریس‌های سردرگمی، برای مقایسه دقت طبقه‌بندی OBIA حاصل از پنج الگوریتم DT استفاده شد. دقت تولید کننده (PA) و کاربر (UA) برای تعیین دقت طبقه بندی هر طبقه پوشش زمین در نظر گرفته شد. نقشه های موضوعی تغییراتی را در نتایج تولید شده نشان داد. الگوریتم‌های C5.0 و Part دارای اجزای کوچک پوشش زمین، به‌ویژه در زمین‌های بایر بودند، در حالی که نقشه‌های موضوعی برای Rpart، Tree و Ipred بخش‌های پیوسته را برای زمین‌های برهنه نشان دادند ( شکل 6 ).
نتایج نشان می دهد که نقشه موضوعی تولید شده با استفاده از الگوریتم درختی دارای بالاترین دقت کلی 89 درصد است، در حالی که نقشه موضوعی الگوریتم حزب کمترین دقت کلی را با 73 درصد دارد ( جدول 5 و شکل 6).). Rpart، Ipred و C5.0 به ترتیب دارای دقت کلی 88، 85، و 74 درصد بودند. طبقه‌بندی توسط الگوریتم‌های DT با دقت کلی نسبتاً پایین، C5.0 و Party، دارای PA و UAهای بسیار پایین‌تری (59-43٪) برای کلاس‌هایی مانند زمین‌های بایر و تالاب‌ها بود. زمین برهنه کمترین PA و UA، به ترتیب 74 و 62 درصد، برای الگوریتم Rpart و جنگل های اولیه کمترین PA را با 66 درصد داشتند در حالی که دقت UA 96 درصد بود. جنگل‌های اولیه و ثانویه کمترین دقت کاربری و تولیدکننده (به ترتیب 39 و 37 درصد) را داشتند که نشان‌دهنده چالش‌های موجود در جداسازی دو پوشش زمین است.

3.2.3. سایر ویژگی های DT

ساختار هر الگوریتم نیز از نظر خروجی گرافیکی، خلاصه های مفید و توانایی تولید مجموعه قوانین به عنوان بخشی از خروجی در نظر گرفته شد. Rpart، Tree، C5.0 و Party دارای نمودارهای درختی به عنوان بخشی از خروجی خود هستند. برخلاف الگوریتم‌های Rpart و Tree، C5.0 و Party نمودارهای درختی بزرگی تولید کردند که تفسیر آنها دشوار است. این به دلیل توانایی آنها در گنجاندن متغیرهای زیادی هنگام ساخت DT است. از سوی دیگر، Ipred با توسعه بسیاری از DT و بهبود دقت آنها، در صدد بهبود نتایج طبقه بندی است. تولید یک نمودار درختی منفرد دشوار است زیرا الگوریتم Ipred روی بسیاری از DTها به طور همزمان تمرکز می کند [ 51]. همه الگوریتم‌های DT خلاصه‌هایی را تولید می‌کنند که برای توسعه مجموعه قوانین مفید هستند. با این حال، C5.0 و Rpart قوانین جامعی را برای هر گره پایانه تولید می کنند.

4. بحث

4.1. دقت DT

مقایسه پنج الگوریتم DT نشان داد که دقت DT در بین این الگوریتم‌ها تفاوت معنی‌داری ندارد. با این حال، C5.0 میانگین دقت DT بالایی را در اندازه‌های مختلف نمونه نشان داد. این یافته ها با یافته های پاورز و همکاران همخوانی دارد. [ 13 ]، که بیش از 88٪ دقت DT را با استفاده از الگوریتم C5.0 به دست آوردند. این را می توان به توانایی C5.0 در ادغام متغیرهای تصمیم بیشتر در توسعه یک DT از طریق تقویت و بسته بندی نسبت داد [ 52 ، 53 ]. بوستینگ با فرمول‌بندی مداوم درخت‌های مستقل که برای تصحیح خطاها در مدل‌های نهایی استفاده می‌شوند، طبقه‌بندی را بهبود می‌بخشد، در حالی که در کیسه‌بندی، چندین درخت فرموله می‌شوند و درخت نهایی با رأی دادن به دقیق‌ترین متغیرها و تقسیم‌بندی ایجاد می‌شود [ 46 ]., 47 , 53 ]. به غیر از C5.0، الگوریتم‌های DT مانند Ipred و جنگل تصادفی نیز از کیسه‌بندی برای بهبود دقت طبقه‌بندی استفاده می‌کنند [ 51 ، 54 ، 55 ].
در ارزیابی عملکرد الگوریتم‌های DT، استفاده از رویکرد چند معیاره مهم است. دفریز و همکاران [ 47 ] از یک رویکرد معیار چندگانه در ارزیابی عملکرد DT با در نظر گرفتن دقت، توانایی مدیریت نویز در داده‌ها، زمان محاسبه و ساختار الگوریتم‌ها استفاده کرد. در حالی که الگوریتم‌ها دقت DT پنج الگوریتم تفاوت معنی‌داری نداشتند، C5.0 میانگین دقت DT نسبتاً بالاتری نسبت به چهار DT دیگر داشت. با این حال، الگوریتم C5.0 به نویز در داده ها بسیار حساس است و ساختار بزرگتری دارند [ 55 ]. در مطالعه حاضر از 35 متغیر استفاده شد و 105 گره برای یک C5.0 DT در مقایسه با الگوریتم های دیگر مانند Rpart که دارای 10 متغیر و 12 گره بود، توسعه یافت.
الگوریتم DTها مانند Rpart و Tree که ساختارهای ساده ای دارند در انتخاب و کاهش تعداد متغیرهای پیش بینی کننده موثر هستند [ 46 ]. رودریگز-گالیانو و همکاران. [ 50 ] گزارش داد که دقت در بین الگوریتم های مختلف DT در نقشه برداری پوشش زمین در منطقه مدیترانه تفاوتی ندارد. با این حال، عملکرد این DT ها به نویز روی داده ها و اندازه نمونه حساس بود. بنابراین، عملکرد الگوریتم نباید تنها بر اساس دقت آماری انتخاب شود، بلکه باید بر اساس معیارهای متعددی که شامل چندین ملاحظات و دقت طبقه‌بندی نهایی نقشه‌های موضوعی است، انتخاب شود.

4.2. دقت طبقه بندی نقشه موضوعی

این مطالعه نشان داده است که الگوریتم‌های DT ابزار مؤثری در توسعه قواعد تصمیم‌گیری برای نقشه‌های موضوعی پوشش زمین هستند. DTها در طبقه بندی پوشش زمین استفاده شده اند زیرا ماهیت آنها ناپارامتریک است و می تواند با تعدادی از داده های کمکی مانند مدل های رقومی ارتفاع (DEM)، شاخص های طیفی و داده های مکانی استفاده شود [ 56 ، 57 ]. به عنوان مثال، Im et al. [ 58 ] از داده‌های تشخیص نور و محدوده (LiDAR) و OBIA در طبقه‌بندی پوشش زمین با استفاده از الگوریتم C5.0 DT استفاده کرد.
با استفاده از این DT ها می توان به دقت طبقه بندی نقشه موضوعی بالا دست یافت. با این حال، دقت از الگوریتمی به الگوریتم دیگر متفاوت است. به دلیل شباهت های طیفی بین برخی از طبقات مانند جنگل های اولیه و ثانویه، دقت آنها به اندازه سایر طبقات پوشش زمین (به عنوان مثال، جنگل های آب و مزرعه) بالا نبود. فیری [ 19 ] چالش های مشابهی را هنگام انجام طبقه بندی پوشش زمین در زامبیا گزارش کرد. شارما و همکاران [ 56] گزارش داد که دقت طبقه‌بندی پوشش زمین با استفاده از الگوریتم‌های CART (بیش از 88 درصد) نسبت به روش‌های طبقه‌بندی سنتی مانند حداکثر احتمال و ISODATA، که دقت کلی کمتر از 72 درصد را به دست آوردند، بهتر بود. با این حال، اکثر مطالعات گزارش کرده‌اند که سایر الگوریتم‌های یادگیری ماشینی مانند ماشین‌های بردار پشتیبان، جنگل‌های تصادفی و شبکه‌های عصبی دقت طبقه‌بندی بالاتری نسبت به DT‌های مورد استفاده در این مطالعه ایجاد کرده‌اند [ 52 ، 56 ، 57 ]. جدای از الگوریتم C5.0، الگوریتم های مبتنی بر CART، مانند Rpart و Tree، متداول ترین الگوریتم هایی هستند که به دلیل سادگی و قابلیت انتخاب و کاهش متغیرها برای طبقه بندی [ 16 ، 57 ] استفاده می شوند.
دقت بالای DT ناشی از اعتبارسنجی متقاطع ممکن است به دقت طبقه‌بندی پوشش زمین منجر نشود به دلیل: (1) بیش از حد و اشباع بودن الگوریتم. (2) توانایی مدیریت نویز روی داده ها؛ و (3) اندازه و ساختار الگوریتم [ 47 ]. برای مثال، C5.0 دارای میانگین دقت DT بالا مشابه سایر الگوریتم‌ها بود. با این حال، دقت طبقه بندی پوشش زمین نسبتاً پایینی داشت ( جدول 2 ). این بزرگ است زیرا الگوریتم C5.0 مستعد ابتلا به نویز در داده ها است زیرا این الگوریتم توانایی قوی برای رسیدگی به موارد دورافتاده ندارد و بیشتر مستعد تطبیق بیش از حد است [ 47 , 55 ]]. DT های بزرگ باید هرس شوند تا اثرات بیش از حد برازش کاهش یابد. با این حال، هرس ممکن است بر دقت طبقه بندی تاثیر بگذارد [ 13 ].
در این مطالعه، دقت طبقه‌بندی پوشش زمین برای الگوریتم‌های DT مانند Rpart و Tree بالا بود. این DTها همچنین دارای ساختار ساده، توانایی مقابله با نویز در داده ها و دقت پیش بینی آماری بالا بودند. الگوریتم‌های ساده‌ای که از حداقل تعداد متغیرهای تصمیم استفاده می‌کنند، ساختار ساده‌ای دارند، کمتر اشباع می‌شوند و از این رو به راحتی قابل تفسیر هستند [ 56 ، 57 ]. در بین این الگوریتم‌های DT، Rpart و C5.0 معمولاً در طبقه‌بندی پوشش زمین استفاده می‌شوند و معمولاً دقت طبقه‌بندی بالایی را ایجاد می‌کنند. پاورز و همکاران [ 13] هنگامی که از C5.0 برای ترسیم اختلالات صنعتی در مقیاس خوب استفاده شد، 88٪ دقت کلی را گزارش کرد. یکی دیگر از الگوریتم های DT که ساده و دارای دقت طبقه بندی بالایی است الگوریتم درخت است. با این حال، Rpart به Tree ارجحیت دارد زیرا انعطاف پذیرتر است و بسته های حمایتی زیادی در حال حاضر در نرم افزار آماری R موجود است [ 55 ]. هنگام کار با الگوریتم‌های DT برای طبقه‌بندی پوشش زمین، تعیین اثرات پارامترهای مختلف تنظیم مانند تعداد متغیرها، تعداد شکاف‌ها، اندازه درخت و خطای مجاز مهم است زیرا می‌توانند بر نتایج طبقه‌بندی تأثیر بگذارند [ 6 ، 50 ].]. مطالعات آینده می‌تواند بیشتر بر تأثیر پارامترهای تنظیم مختلف بر دقت طبقه‌بندی مناظر مختلف و داده‌های سنجش از دور مختلف تمرکز کند.

4.3. انتخاب بهترین DT برای توسعه مجموعه قوانین

انتخاب الگوریتم DT ایده آل برای استفاده برای طبقه بندی پوشش زمین باید مهمترین هدف هنگام استفاده از این الگوریتم های DT برای ایجاد قوانین تصمیم گیری در طبقه بندی پوشش زمین OBIA باشد. مهم است که تمام ویژگی‌های الگوریتم‌های DT مانند دقت مدل، سادگی، توانایی مدیریت تعداد متغیرهای مختلف و اندازه مجموعه داده‌ها را در نظر بگیریم ( جدول 6 ). این را می توان با استفاده از یک رویکرد ارزیابی چند معیاره که توسط DeFries و همکاران پیشنهاد شده است، به دست آورد. [ 47 ]. تمرکز در این ارزیابی باید بر روی الگوریتم‌های DT باشد که دارای دقت طبقه‌بندی بالا و ساختار ساده هستند و در برابر نویز در داده‌ها حساس نیستند و به راحتی قابل تفسیر هستند.
در این مطالعه، الگوریتم‌های Tree و Rpart برای توسعه قواعد تصمیم‌گیری توصیه می‌شوند، به‌ویژه زمانی که تعداد بیشتری از متغیرها درگیر هستند، زیرا این الگوریتم‌ها توانایی انتخاب تعداد کمی از متغیرهای تأثیرگذار برای طبقه‌بندی و در نتیجه دستیابی به سادگی و دقت طبقه‌بندی بالا را دارند [ 47 ، 56 ]. الگوریتم Ipred با Rpart و Tree در بیشتر عملکردهایش تفاوتی ندارد. با این حال، این الگوریتم بر اساس اصل بسته بندی ساخته شده است که دستیابی به سادگی و استخراج قوانین تصمیم گیری دشوار است زیرا چندین درخت تصمیم را تولید می کند. برای استفاده موفقیت آمیز از Ipred، یک تابع (nbagg = 1) که تولید یک DT را مشخص می کند می تواند استفاده شود [ 51]. C5.0 و Party باید زمانی استفاده شوند که هدف شامل متغیرهای پیش بینی کننده بیشتر و ایجاد دقت DT بالا در طول اعتبارسنجی متقابل باشد.
اگرچه دقت کلی به‌دست‌آمده در این مطالعه بالا بود، اما دقت کاربر و تولیدکننده برای کلاس‌های مشابه طیفی مانند جنگل اولیه و ثانویه پایین بود. بنابراین نیاز به تعریف کلاس ها به گونه ای است که از نظر طیفی مشابه باشند. علاوه بر این، روش‌های دیگری مانند طبقه‌بندی‌کننده‌های یادگیری ماشینی ناپارامتری، به عنوان مثال، جنگل تصادفی [ 15 ، 19 ، 59 ] و ماشین بردار پشتیبان [ 60 ، 61 ]، که ثابت کرده‌اند مؤثرتر هستند، می‌توانند در طی طبقه‌بندی به ترتیب استفاده شوند. برای دستیابی به دقت بالاتر
مطالعه حاضر تنها یک مکان دارد و این پتانسیل را دارد که بر قابلیت انتقال و تعمیم نتایج تأثیر بگذارد. این می تواند چالشی برای مطالعات آینده باشد و نتایج حاصل از این مطالعه می تواند تعمیم با سطوحی از عدم قطعیت باشد. توجه به این نکته ضروری است که تعمیم، قابلیت انتقال و تکرارپذیری نتایج تا حد زیادی تحت تأثیر نوع DT مورد استفاده، حجم نمونه و نوع ویژگی های ورودی است.

5. نتیجه گیری ها

در این مقاله، مقایسه ای سیستماتیک از عملکرد پنج الگوریتم DT در طبقه بندی پوشش زمین با استفاده از Landsat 8 ارائه شده است. تمرکز اصلی بر انتخاب الگوریتم‌های DT بود که دارای دقت طبقه‌بندی بالا، ساختار ساده و تفسیر آسان هستند، با استفاده از رویکرد معیارهای چندگانه پیشنهاد شده توسط DeFries و همکاران. [ 47]. در حالی که همه الگوریتم‌ها دارای میانگین دقت DT بالایی بودند، مشخص شد که الگوریتم‌های Tree و Rpart ساده، آسان برای تفسیر هستند و تحت تأثیر نویز مجموعه داده‌ها قرار نمی‌گیرند. نتایج حاصل از الگوریتم های Tree و Rpart DT دقت کلی بالای بیش از 86% را ایجاد می کند. الگوریتم‌های C5.0 و Party با توجه به دقت کلی به همان اندازه خوب بودند. با این حال، آنها تعداد زیادی از متغیرهای تصمیم گیری را در خروجی ترکیب می کنند که اجرای آنها می تواند دشوار باشد و اثرات اضافه برازش و اشباع را نشان دهند. تجزیه و تحلیل بیشتر نشان داد که Rpart و Tree می توانند حداقل تعداد متغیرها را انتخاب کنند و از این رو قوانین ساده اما دقیق را حفظ کنند. بر اساس DT و دقت پوشش زمین و سایر جنبه های مهم مانند تعداد متغیر و سادگی ساختار DT، می توان استفاده از Rpart یا Tree را در ایجاد مجموعه قوانین برای طبقه بندی پوشش زمین OBIA از تصاویر Landsat 8 توصیه کرد. در آینده، مطالعات آینده می‌توانند عملکرد این DTهای ساده را با طبقه‌بندی‌کننده‌های یادگیری ماشینی معاصر مانند RF و SVM در مکان‌های جغرافیایی مختلف در دوره‌های زمانی مختلف مقایسه کنند.

منابع

  1. کومار، آر. نندی، اس. آگاروال، آر. کوشواها، تحلیل دینامیک پوشش جنگل SPS و مدل‌سازی پیش‌بینی با استفاده از مدل رگرسیون لجستیک. Ecol. اندیک. 2014 ، 45 ، 444-455. [ Google Scholar ] [ CrossRef ]
  2. لی، ام. ما، ال. بلاشکه، تی. چنگ، ال. Tiede، D. مقایسه سیستماتیک تکنیک های مختلف طبقه بندی مبتنی بر شی با استفاده از تصاویر با وضوح فضایی بالا در محیط های کشاورزی. بین المللی J. Appl. زمین Obs. Geoinf. 2016 ، 49 ، 87-98. [ Google Scholar ] [ CrossRef ]
  3. پنا-باراگان، جی.ام. Ngugi، MK; کارخانه، RE; شش، J. شناسایی محصول مبتنی بر شی با استفاده از شاخص‌های چندگانه پوشش گیاهی، ویژگی‌های بافتی و فنولوژی محصول. سنسور از راه دور محیط. 2011 ، 115 ، 1301-1316. [ Google Scholar ] [ CrossRef ]
  4. کیندو، م. اشنایدر، تی. تکتای، دی. Knoke، T. تحلیل تغییر کاربری/پوشش زمین با استفاده از رویکرد طبقه‌بندی مبتنی بر شی در چشم‌انداز مونسا-ششمنی ارتفاعات اتیوپی. Remote Sens. 2013 , 5 , 2411–2435. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  5. Drǎguţ، L. تاید، دی. Levick، SR ESP: ابزاری برای تخمین پارامتر مقیاس برای تقسیم‌بندی تصویر با وضوح چندگانه داده‌های سنجش از راه دور. بین المللی جی. جئوگر. Inf. علمی 2010 ، 24 ، 859-871. [ Google Scholar ] [ CrossRef ]
  6. فیری، دی. مورگنروث، جی. Xu, C. چهار دهه مطالعه پوشش زمین و اتصال جنگل در زامبیا – یک رویکرد تجزیه و تحلیل تصویر مبتنی بر شی. بین المللی J. Appl. زمین Obs. Geoinf. 2019 ، 79 ، 97-109. [ Google Scholar ] [ CrossRef ]
  7. کلی، م. بلانچارد، SD; کرستن، ای. Koy، K. تصاویر سنجش از دور زمینی در حمایت از سلامت عمومی: راه های جدید تحقیق با استفاده از تجزیه و تحلیل تصویر مبتنی بر شی. Remote Sens. 2011 , 3 , 2321–2345. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  8. فیری، دی. مورگنروث، جی. خو، سی. Hermosilla, T. اثرات روش‌های پیش پردازش بر طبقه‌بندی پوشش اراضی Landsat OLI-8 با استفاده از OBIA و طبقه‌بندی جنگل‌های تصادفی. بین المللی J. Appl. زمین Obs. Geoinf. 2018 ، 73 ، 170-178. [ Google Scholar ] [ CrossRef ]
  9. لی، ام. زنگ، س. وو، سی. دنگ، ی. تجزیه و تحلیل مخلوط طیفی مبتنی بر تقسیم بندی و مبتنی بر قانون برای تخمین نفوذناپذیری شهری. Adv. Space Res. 2015 ، 55 ، 1307-1315. [ Google Scholar ] [ CrossRef ]
  10. Myint، SW; گوبر، پ. برازل، ا. گروسمن کلارک، اس. Weng، Q. طبقه‌بندی بر پیکسل در مقابل شیء مبتنی بر استخراج پوشش زمین شهری با استفاده از تصاویر با وضوح فضایی بالا. سنسور از راه دور محیط. 2011 ، 115 ، 1145-1161. [ Google Scholar ] [ CrossRef ]
  11. فیری، دی. سیمواندا، م. Nyirenda، V. نقشه برداری از اثرات طوفان Idai در موزامبیک با استفاده از Sentinel-2 و رویکرد OBIA. اس افر. جی. جئوگر. 2020 . [ Google Scholar ] [ CrossRef ]
  12. لو، دی. Weng, Q. بررسی روش ها و تکنیک های طبقه بندی تصویر برای بهبود عملکرد طبقه بندی. بین المللی J. Remote Sens. 2007 , 28 , 823-870. [ Google Scholar ] [ CrossRef ]
  13. قدرت، RP; هرموسیلا، تی. Coops، NC; چن، جی. سنجش از دور و تکنیک‌های مبتنی بر شی برای نقشه‌برداری آشفتگی‌های صنعتی در مقیاس خوب. بین المللی J. Appl. زمین Obs. Geoinf. 2015 ، 34 ، 51-57. [ Google Scholar ] [ CrossRef ]
  14. فیری، دی. مورگنروث، جی. Xu, C. تغییر طولانی مدت پوشش زمین در زامبیا: ارزیابی عوامل محرک. علمی کل محیط. 2019 ، 134206. [ Google Scholar ] [ CrossRef ]
  15. پوسانت، ا. روژیر، اس. Stumpf, A. نقشه برداری شی گرا از درختان شهری با استفاده از طبقه بندی جنگل تصادفی. بین المللی J. Appl. زمین Obs. Geoinf. 2014 ، 26 ، 235-245. [ Google Scholar ] [ CrossRef ]
  16. فروند، ی. میسون، ال. الگوریتم یادگیری درخت تصمیم متناوب. در مجموعه مقالات ICML، شانزدهمین کنفرانس بین المللی یادگیری ماشین، بلد، اسلوونی، 27 تا 30 ژوئن 1999. صص 124-133. [ Google Scholar ]
  17. بلژیک، م. Drăguţ، L. جنگل تصادفی در سنجش از دور: بررسی برنامه‌ها و جهت‌های آینده. ISPRS J. Photogramm. Remote Sens. 2016 ، 114 ، 24–31. [ Google Scholar ] [ CrossRef ]
  18. فیری، دی. فیری، ای. کاسوبیکا، ر. زولو، دی. Lwali، C. مفهوم استفاده از یک فاکتور فرم ثابت در مناطق تحت شرایط بارندگی و خاک مختلف برای Pinus kesiya در زامبیا. جنوب. برای. جی. برای. علمی 2016 ، 78 ، 35-39. [ Google Scholar ] [ CrossRef ]
  19. فیری، دی. پایش دینامیک پوشش زمین برای زامبیا با استفاده از سنجش از دور: 1972-2016. دکتری پایان نامه، دانشگاه کانتربری، کرایست چرچ، نیوزلند، 2019. [ Google Scholar ]
  20. کالابا، FK; کوین، CH; داگیل، ای جی؛ Vinya، R. ترکیب گل‌شناسی، تنوع گونه‌ها و ذخیره‌سازی کربن در زغال‌سنگ و آیش‌های کشاورزی و پیامدهای مدیریتی در جنگل‌های Miombo زامبیا. برای. Ecol. مدیریت 2013 ، 304 ، 99-109. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  21. فیری، دی. Morgenroth، J. تحولات در روش های طبقه بندی پوشش زمین Landsat: یک بررسی. Remote Sens. 2017 , 9 , 967. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  22. Wulder، MA; سفید، JC; لاولند، TR; Woodcock، CE; بلوارد، ع. کوهن، WB; Fosnight، EA؛ شاو، جی. ماسک، جی جی. روی، DP آرشیو جهانی لندست: وضعیت، تثبیت و جهت. سنسور از راه دور محیط. 2016 ، 185 ، 271-283. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  23. پورسانیدیس، د. کریسولاکیس، ن. Mitraka, Z. Landsat 8 در مقابل Landsat 5: مقایسه ای بر اساس نقشه برداری پوشش زمین شهری و حومه شهری. بین المللی J. Appl. زمین Obs. Geoinf. 2015 ، 35 Pt B ، 259–269. [ Google Scholar ] [ CrossRef ]
  24. ESRI. ArcGIS دسکتاپ. انتشار 10.4 ; موسسه تحقیقات سیستم محیطی: Relands، CA، ایالات متحده آمریکا، 2016. [ Google Scholar ]
  25. حسین، م. چن، دی. چنگ، ا. وی، اچ. Stanley, D. تغییر تشخیص از تصاویر سنجش از راه دور: از رویکردهای مبتنی بر پیکسل به رویکردهای مبتنی بر شی. ISPRS J. Photogramm. Remote Sens. 2013 ، 80 ، 91-106. [ Google Scholar ] [ CrossRef ]
  26. رسولی، ع. نقدی فر، ر. رسولی، م. پایش تغییرات خط ساحلی دریای خزر با استفاده از تکنیک های شی گرا. Procedia Environ. علمی 2010 ، 2 ، 416-426. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  27. ژاکین، ا. میساکووا، ال. Gay, M. یک رویکرد طبقه بندی مبتنی بر شی ترکیبی برای نقشه برداری پراکندگی شهری در محیط پیرامون شهری. Landsc. طرح شهری. 2008 ، 84 ، 152-165. [ Google Scholar ] [ CrossRef ]
  28. لیائو، LM؛ آهنگ، جی ال. وانگ، جی دی. شیائو، ZQ؛ روش Wang, J. Bayesian برای ساخت مجموعه داده های NDVI مکرر مشابه Landsat با ادغام MODIS و Landsat NDVI. Remote Sens. 2016 ، 8 ، 452. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  29. Zhu، XL; لیو، دی اس بهبود تخمین زیست توده بالای زمینی جنگل با استفاده از سری زمانی فصلی Landsat NDVI. ISPRS J. Photogramm. Remote Sens. 2015 ، 102 ، 222-231. [ Google Scholar ] [ CrossRef ]
  30. هیوت، ا. دیدان، ک. میورا، تی. رودریگز، EP; گائو، ایکس. Ferreira، LG مروری بر عملکرد رادیومتری و بیوفیزیکی شاخص‌های پوشش گیاهی MODIS. سنسور از راه دور محیط. 2002 ، 83 ، 195-213. [ Google Scholar ] [ CrossRef ]
  31. Gitelson، AA; مرزلیاک، MN سنجش از دور غلظت کلروفیل در برگ های گیاه بالاتر. Adv. Space Res. 1998 ، 22 ، 689-692. [ Google Scholar ] [ CrossRef ]
  32. Sripada، RP; هاینیگر، RW; سفید، JG; عکسبرداری رنگی مادون قرمز هوایی Meijer، AD برای تعیین نیازهای نیتروژن اولیه در ذرت. آگرون. J. 2006 ، 98 ، 968-977. [ Google Scholar ] [ CrossRef ]
  33. آتزبرگر، سی. درویش زاده، ر. ایمیتزر، ام. شلرف، ام. اسکیدمور، آ. Le Maire, G. تجزیه و تحلیل مقایسه ای روش های مختلف بازیابی برای نقشه برداری شاخص سطح برگ مرتع با استفاده از طیف سنجی تصویربرداری هوابرد. بین المللی J. Appl. زمین Obs. Geoinf. 2015 ، 43 ، 19-31. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  34. تولد، GS; McVey, GR اندازه گیری رنگ چمن در حال رشد با اسپکتروفتومتر بازتابی. آگرون. J. 1968 , 60 , 640-643. [ Google Scholar ] [ CrossRef ]
  35. گوئل، NS; Qin، W. تأثیرات معماری تاج پوشش بر روابط بین شاخص های مختلف پوشش گیاهی و LAI و FPAR: یک شبیه سازی کامپیوتری. Remote Sens. Rev. 1994 , 10 , 309-347. [ Google Scholar ] [ CrossRef ]
  36. روندو، جی. استیون، ام. Baret, F. بهینه سازی شاخص های پوشش گیاهی با خاک. سنسور از راه دور محیط. 1996 ، 55 ، 95-107. [ Google Scholar ] [ CrossRef ]
  37. Huete، AR یک شاخص پوشش گیاهی با خاک (SAVI). سنسور از راه دور محیط. 1988 ، 25 ، 295-309. [ Google Scholar ] [ CrossRef ]
  38. Roujean, J.-L.; بریون، F.-M. برآورد PAR جذب شده توسط پوشش گیاهی از اندازه‌گیری‌های بازتاب دو طرفه. سنسور از راه دور محیط. 1995 ، 51 ، 375-384. [ Google Scholar ] [ CrossRef ]
  39. کلید، سی. Benson، N. ارزیابی چشم‌انداز: سنجش از دور شدت، نسبت سوختگی نرمال شده و اندازه‌گیری شدت شدت، شاخص سوختگی مرکب. در FIREMON: Fire Effects Monitoring and Inventory System Ogden، یوتا: USDA Forest Service، Rocky Mountain Res. ایستگاه ؛ خدمات جنگلی USDA، ایستگاه تحقیقاتی کوه راکی: Ogden، UT، ایالات متحده آمریکا، 2005. [ Google Scholar ]
  40. گارسیا، ام ال. Caselles، V. نقشه برداری سوختگی ها و احیای جنگل های طبیعی با استفاده از داده های Thematic Mapper. Geocarto Int. 1991 ، 6 ، 31-37. [ Google Scholar ] [ CrossRef ]
  41. Segal, D. مبانی نظری برای تمایز مواد معدنی حاوی آهن آهن با استفاده از داده های Landsat MSS. در مجموعه مقالات سمپوزیوم بین المللی سنجش از دور محیط زیست، دومین کنفرانس موضوعی، سنجش از دور برای زمین شناسی اکتشافی 1982، Ft. Worth, TX, USA, 6-10 دسامبر 1982; جلد دوم، ص 949–951. [ Google Scholar ]
  42. ژا، ی. گائو، جی. Ni، S. استفاده از شاخص ایجاد تفاوت نرمال شده در نقشه برداری خودکار مناطق شهری از تصاویر TM. بین المللی J. Remote Sens. 2003 , 24 , 583-594. [ Google Scholar ] [ CrossRef ]
  43. سالومونسون، وی. Appel, I. برآورد پوشش کسری برف از MODIS با استفاده از شاخص تفاوت نرمال شده برف. سنسور از راه دور محیط. 2004 ، 89 ، 351-360. [ Google Scholar ] [ CrossRef ]
  44. Silleos، NG; الکساندریدیس، TK; گیتاس، IZ; پراکیس، K. شاخص های گیاهی: پیشرفت های انجام شده در تخمین زیست توده و پایش پوشش گیاهی در 30 سال گذشته. Geocarto Int. 2006 ، 21 ، 21-28. [ Google Scholar ] [ CrossRef ]
  45. گائو، B.-C. NDWI – یک شاخص تفاوت نرمال شده آب برای سنجش از راه دور آب مایع گیاهی از فضا. سنسور از راه دور محیط. 1996 ، 58 ، 257-266. [ Google Scholar ] [ CrossRef ]
  46. پونیا، م. جوشی، پ. Porwal، M. طبقه بندی درخت تصمیم از پوشش زمین کاربری برای دهلی، هند با استفاده از داده های IRS-P6 AWiFS. سیستم خبره Appl. 2011 ، 38 ، 5577-5583. [ Google Scholar ] [ CrossRef ]
  47. DeFries، RS; چان، JC-W. معیارهای چندگانه برای ارزیابی الگوریتم های یادگیری ماشین برای طبقه بندی پوشش زمین از داده های ماهواره ای. سنسور از راه دور محیط. 2000 ، 74 ، 503-515. [ Google Scholar ] [ CrossRef ]
  48. Congalton، RG; گرین، ک. ارزیابی دقت داده‌های سنجش از راه دور: اصول و روش‌ها . CRC Press/Taylor & Francis: Boca Raton, FL, USA, 2009; جلد 2. [ Google Scholar ]
  49. اولوفسون، پی. فودی، جنرال موتورز; هرولد، ام. Stehman، SV; Woodcock، CE; Wulder، MA شیوه های خوب برای تخمین مساحت و ارزیابی دقت تغییر زمین. سنسور از راه دور محیط. 2014 ، 148 ، 42-57. [ Google Scholar ] [ CrossRef ]
  50. رودریگز-گالیانو، وی اف. Chica-Rivas، M. ارزیابی روش‌های مختلف یادگیری ماشین برای نقشه‌برداری پوشش زمین از یک منطقه مدیترانه با استفاده از تصاویر چند فصلی Landsat و مدل‌های زمین دیجیتال. بین المللی جی دیجیت. زمین 2014 ، 7 ، 492-509. [ Google Scholar ] [ CrossRef ]
  51. پیترز، آ. هاثورن، تی. Ipred: پیش بینی کننده های بهبود یافته. بسته R نسخه 0.9-6. 2017. در دسترس آنلاین: https://CRAN.R-project.org/package=ipred (در 6 ژوئن 2017 قابل دسترسی است).
  52. چان، JC-W. هوانگ، سی. DeFries، R. بهبود عملکرد الگوریتم برای طبقه بندی پوشش زمین از داده های سنجش از راه دور با استفاده از بسته بندی و تقویت. IEEE Trans. Geosci. Remote Sens. 2001 , 39 , 693-695. [ Google Scholar ]
  53. کوهن، م. استیو، دبلیو. Coulter, N. C50: C5.0 Decision Trees and Rule-based Models. بسته R نسخه 0.1.0-24. 2015. در دسترس آنلاین: https://CRAN.R-project.org/package=C50 (در 6 ژوئن 2017 قابل دسترسی است).
  54. دورو، دی سی؛ فرانکلین، SE; Dubé، MG مقایسه تحلیل تصویر مبتنی بر پیکسل و شی با الگوریتم‌های یادگیری ماشین انتخاب شده برای طبقه‌بندی مناظر کشاورزی با استفاده از تصاویر SPOT-5 HRG. سنسور از راه دور محیط. 2012 ، 118 ، 259-272. [ Google Scholar ] [ CrossRef ]
  55. Lantz, B. Machine Learning with R , 1st ed.; Packt Publishing: بیرمنگام، بریتانیا، 2013. [ Google Scholar ]
  56. شارما، آر. قوش، ع. Joshi, P. رویکرد درخت تصمیم برای طبقه بندی داده های ماهواره ای سنجش از دور با استفاده از پشتیبانی منبع باز. J. Earth Syst. علمی 2013 ، 122 ، 1237-1247. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  57. شائو، ی. Lunetta، RS مقایسه ماشین بردار پشتیبان، شبکه عصبی و الگوریتم‌های CART برای طبقه‌بندی پوشش زمین با استفاده از نقاط داده آموزشی محدود. ISPRS J. Photogramm. Remote Sens. 2012 ، 70 ، 78-87. [ Google Scholar ] [ CrossRef ]
  58. من، جی. جنسن، جی آر. هاجسون، ME طبقه‌بندی پوشش زمین مبتنی بر شی با استفاده از داده‌های LiDAR با چگالی بالا. GIScience Remote Sens. 2008 ، 45 ، 209-228. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  59. رودریگز-گالیانو، وی اف. قیمیر، بی. روگان، جی. چیکا اولمو، م. Rigol-Sanchez، JP ارزیابی اثربخشی طبقه‌بندی‌کننده تصادفی جنگل برای طبقه‌بندی پوشش زمین. ISPRS J. Photogramm. Remote Sens. 2012 ، 67 ، 93-104. [ Google Scholar ] [ CrossRef ]
  60. کرانچیچ، ن. مداک، د. ژوپان، آر. Rezo، MJRS بردار پشتیبان ارزیابی دقت ماشین برای استخراج مناطق سبز شهری در شهرها. Remote Sens. 2019 , 11 , 655. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  61. هوانگ، سی. دیویس، LS; Townshend، JRG ارزیابی ماشین‌های بردار پشتیبان برای طبقه‌بندی پوشش زمین. بین المللی J. Remote Sens. 2002 ، 23 ، 725-749. [ Google Scholar ] [ CrossRef ]
شکل 1. مرزهای اداری استان مس کمربند زامبیا شامل رودخانه ها و شهرهای اصلی.
شکل 2. نمودار جریان مراحل استفاده شده در مطالعه.
شکل 3. میانگین دقت DT پنج درخت تصمیم با استفاده از اعتبارسنجی متقاطع.
شکل 4. دقت الگوریتم های DT با افزایش حجم نمونه.
شکل 5. دقت طبقه بندی نقشه موضوعی (%) و تعداد متغیرهای مورد استفاده در طول طبقه بندی.
شکل 6. نقشه های طبقه بندی پوشش زمین با استفاده از مجموعه قوانین توسعه یافته از پنج الگوریتم DT.

بدون دیدگاه

دیدگاهتان را بنویسید