نقشه برداری خاک بر اساس درختان تصمیم گیری بهینه جهانی و تقلید دیجیتالی از رویکردهای سنتی

خلاصه

بیشتر رویکردهای نقشه برداری دیجیتال خاک (DSM) استخراج مدل آماری کامل را هدف قرار می دهند. ارزش قوانین صریح ترسیم خاک که توسط کارشناسان نقشه برداری خاک تدوین شده است اغلب دست کم گرفته می شود. این قوانین را می توان برای آزمایش تخصصی سازگاری تصوری نقشه های خاک، پیش بینی روند خاک، بررسی های جغرافیایی خاک و سایر کاربردها استفاده کرد. ما رویکردی را پیشنهاد می‌کنیم که نقشه‌برداری سنتی خاک را با ساخت درخت‌های تصمیم‌گیری بهینه جهانی فشرده (EVTREE) برای متغیرهای کمکی نقشه‌های فاکتور تشکیل خاک که به‌طور سنتی استفاده می‌شود، تقلید می‌کند.
دوره-آموزش-حرفه-ای-gis
ما رویکرد خود را با نقشه برداری خاک در مقیاس منطقه ای در یک سایت آزمایشی در منطقه بلگورود روسیه ارزیابی کردیم. سازگاری و فشردگی تصوری درخت‌های تصمیم ایجاد شده توسط EVTREE برای تجزیه و تحلیل و بهبود مبتنی بر متخصص مناسب است. با یک مجموعه نمونه بزرگ، دقت پیش‌بینی‌ها برای EVTREE (59٪) کمی کمتر از CART (67٪) و بسیار کمتر از جنگل تصادفی (87٪) بود. با مجموعه‌های نمونه کوچک‌تر از 1785 و 1000 امتیاز، EVTREE پیش‌بینی‌های قابل مقایسه یا دقیق‌تری و مدل‌های بسیار دقیق‌تر از جغرافیای خاک نسبت به CART یا Random Forest تولید کرد.

کلید واژه ها:

نقشه برداری دیجیتال خاک ; نقشه برداری سنتی خاک ; یادگیری ماشینی ؛ EVTREE ; منطقه بلگورود

1. معرفی

پروژه های نقشه جهانی خاک مربوط به به دست آوردن اطلاعات فضایی خاک نیازمند تکنیک های جدیدی برای ساختن نقشه های خاک است که می تواند از داده های قدیمی در نقشه برداری دیجیتالی خاک استفاده کند [ 1 ، 2 ، 3 ]. نقشه برداری دیجیتالی خاک، فرآیند ایجاد و جمع آوری پایگاه های اطلاعاتی خاک با ارجاع جغرافیایی است که در وضوح های خاص از طریق روش های مشاهدات صحرایی و آزمایشگاهی همراه با داده های محیطی از طریق روابط کمی تولید می شود [4 ] . این پارادایم نقشه برداری خاک مبتنی بر استفاده از روش های مدل سازی برای ایجاد روابط خاک- منظر مورد نیاز برای تخمین احتمال وقوع خاک یا خواص آن است که توسط داده های محیطی یا سنجش از دورتوصیف شده است 5 ، 7 ، 8 ، 9 ، 10 ].
پارادایم نقشه برداری دیجیتال خاک به تدریج جایگزین الگوی سنتی نقشه برداری خاک می شود. با این حال، آرشیوهای عظیمی از نقشه های سنتی خاک وجود دارد و توسط نقشه برداران خبره خاک مطابق با پارادایم کیفی ایجاد شده است [ 5 ]. برای استفاده کامل از این آرشیوها، رویکردهای نقشه برداری دیجیتال خاک باید ماهیت کیفی این فرآیندهای سنتی نقشه برداری خاک را در نظر بگیرند. هنگام استفاده از نقشه‌های خاک میراث، استفاده از روش‌های آماری که دانش خاک‌شناسی را به شکلی نزدیک به اشکال سنتی ارائه می‌کند، سودمندتر است [ 11 ]. همچنین باید امکان استخراج و بهره برداری از دانش کیفی سنتی در مورد تکثیر فضایی خاک در مدل های آماری به شکل عینی وجود داشته باشد [ 12 , 13 .]. همچنین در نقشه‌برداری دیجیتالی خاک، اتخاذ ایده‌ها و تکنیک‌های «زیبای خفته» از فرآیندهای سنتی نقشه‌برداری خاک اهمیت دارد [ 14 ].
در نقشه برداری سنتی خاک، ارزش سایر محصولات علاوه بر نقشه خاک اغلب دست کم گرفته می شود. این محصول شامل قوانین صریح برای تعیین واحدهای طبقه خاک یا خواص خاک است. این قوانین صریح توسط کارشناسان نقشه برداری خاک تدوین شده و به ندرت به صورت کامل بیان شده است. این قوانین توسط کارشناسان برای تعیین سازگاری تصوری آنها مورد ارزیابی قرار گرفت و برای پیش بینی روند خاک و بررسی جغرافیای خاک و بسیاری از کاربردهای دیگر مورد استفاده قرار گرفت. برای نقشه‌برداری دیجیتالی خاک، دانش کیفی را می‌توان در مدل‌های کمی خاک گنجاند تا نقشه‌های خاک دقیق‌تر در جغرافیای خاک ارائه شود. به عنوان مثال، خاک های آبرفتی با دشت های سیلابی رودخانه ها مرتبط هستند، در حالی که خاک های آلی با باتلاق ها و مرداب ها مرتبط هستند. علاوه بر این مدل ها،15 ].
چارچوب‌های نقشه‌برداری خاک زیادی وجود دارد که بر اساس روش‌های آماری هستند و نتایج پیش‌بینی رضایت‌بخشی را ارائه می‌کنند: درختان طبقه‌بندی مجدد DSMART [ 16 ]. SoilGRIDs – جنگل تصادفی، رگرسیون خطی چندگانه، و روش‌های مجموعه [ 7 ]. و DoSoReMi-Random Forest [ 17 ]، در میان دیگران. اگر یک مجموعه نمونه کامل برای مدل‌سازی استفاده شود، روش‌های مجموعه، مانند جنگل تصادفی، بالاترین دقت پیش‌بینی را به دست می‌آورند [ 18 ، 19 ، 20 ]. با این حال، چندین محدودیت اساسی برای به دست آوردن مدل های آماری دقیق بر اساس رویکردهای آماری کمی «محص» بدون استفاده از دانش کیفی اضافی وجود دارد [ 21]]. علاوه بر این، مسائل برون یابی به دلیل وابستگی به کیفیت نمونه برداری فضایی و برازش بیش از حد [ 20 ] وجود دارد.
پیشرفت‌های کمی در نقشه‌برداری دیجیتالی خاک، قوانین نقشه‌برداری خاک را به شکل صریح نشان می‌دهند. یکی از این رویکردها از فناوری SoLIM (حالت استنتاج زمین خاک) استفاده می کند که مبتنی بر منطق فازی است [ 22 ، 23 ]. این رویکرد با روش سنتی تدوین قوانین نقشه برداری خاک متفاوت است. در سال 2003، Qi و Zhu رویکرد دیگری را برای فرمول بندی قوانین مبتنی بر درخت مانند نقشه برداری سنتی خاک با استفاده از الگوریتم See5 توسعه دادند [ 11 ]. متعاقبا، این الگوریتم با رویکرد آماری منطق فازی [ 24 ] ادغام شد. بنابراین، چارچوب SoLIM بسیاری از روش‌های سنتی را برای نقشه‌برداری خاک ادغام می‌کند و امکان توسعه نقشه‌های خاک از نظر خاک شناسی را فراهم می‌کند.
اکثر چارچوب های موجود فقط برخی از روش های سنتی را برای نقشه برداری خاک ادغام می کنند. با این حال، فرآیند سنتی تهیه نقشه خاک را می توان با استفاده از دستاوردهای نقشه برداری دیجیتالی خاک تقلید کرد. اگر کل فرآیند کاری یک نقشه‌بردار سنتی خاک تقلید شود، می‌توان بسیاری از نتایج مفید را به دست آورد، از جمله فرآیند تهیه نقشه خاک از طریق روش‌های نقشه‌برداری مورد استفاده برای تجزیه و تحلیل متغیرهای کمکی [25 ] . علاوه بر این، رویکردهایی برای ترکیب دانش خبره در مدل‌های ایجاد شده خودکار، و همچنین استخراج و انتقال دانش صریح وجود دارد [ 26 ، 27 ، 28 ].
رویکردهای جدید ترکیبی از دانش مبتنی بر متخصص و مدل‌سازی ریاضی را قادر می‌سازد تا توصیفات کمی و کیفی روابط بین خاک و عوامل تشکیل خاک را ترکیب کند. مدل‌سازی معادلات ساختاری (SEM) یک رویکرد معاصر است که ادغام دانش در مورد خاک را در یک مدل آماری تسهیل می‌کند و فرصتی برای ارزیابی روابط متقابل خصوصیات مختلف خاک در طول مدل‌سازی فراهم می‌کند [21 ] . به گفته نویسندگان، «شکاف بین روش‌های تجربی و مکانیکی برای مدل‌سازی خاک-منظر پل می‌کند و ابزاری است که می‌تواند به تولید نقشه‌های خاک‌شناسی سالم کمک کند». 12] .]. با این حال، رویکرد SEM بیشتر با هدف ترکیب دانش متخصص است تا استخراج دانش از داده‌های قدیمی. علاوه بر این، مدل‌های نظری کامل SEM در حال حاضر پیچیده‌تر از ارائه قوانین عملی برای ترسیم خاک در فرآیند نقشه‌برداری سنتی خاک هستند.
یکی دیگر از روش‌های استخراج رابطه خاک – منظر، استفاده از روش‌های مبتنی بر طبقه‌بندی و الگوریتم‌های درخت رگرسیون است. بازنمایی با درختان تصمیم شامل استفاده از قوانین عملی است که توسط کارشناسان نقشه برداری خاک برای نقشه برداری خاک در نظر گرفته شده است. فیلیپ لاگاچری یکی از پرکاربردترین روش ها یعنی الگوریتم درخت طبقه بندی و رگرسیون را برای نقشه برداری خاک در سال 1992 اجرا کرد [ 29 ]. Feng Qi و A-Xing Zhu یک بررسی گسترده در مورد استفاده از الگوریتم See5 برای کسب دانش برای نقشه برداری خاک نوشتند [ 11 ]. اکثر الگوریتم‌های درخت طبقه‌بندی و رگرسیون از معیارهای تقسیم بهینه محلی مانند Gini یا آنتروپی برای پارتیشن‌بندی گام به گام بازگشتی استفاده می‌کنند. 30]. هدف این روش‌ها به دست آوردن دقت پیش‌بینی رضایت‌بخش است، اما نه توسعه یک مدل بهینه. این منجر به یادگیری بیش از حد قابل توجهی از یک درخت می شود. چنین درختی می‌تواند بزرگ باشد و برای برخی از قوانین سازگاری تصوری ضعیفی داشته باشد و در عین حال دقت پیش‌بینی رضایت‌بخشی را برای سایت کلید به همراه داشته باشد. این روش‌های بهینه محلی عبارتند از CART (درخت طبقه‌بندی و رگرسیون)، CTREE (درخت استنتاج شرطی)، CHAID (تشخیص خودکار تعامل خودکار Chi-square)، See5، و CUBIST (مدل‌سازی رگرسیون مبتنی بر قانون و نمونه)، همراه با بسیاری دیگر [ 31 ]. الگوریتم‌های درخت طبقه‌بندی و رگرسیون از نوع جدیدی پیشنهاد شده‌اند و با هدف یافتن بهینه‌ترین و معنی‌دارترین درخت‌های طبقه‌بندی، به عنوان مثال، درختان تکامل [ 31 ]، درختان تصمیم عصبی [31] 32] هستند.]، و درختان تصمیم عصبی عمیق [ 33 ]. چنین روش های بهینه جهانی به طور بالقوه اجازه می دهد تا دانش بسیار معنی داری در مورد روابط بین خاک و عوامل تشکیل خاک به دست آید.
ذاتاً، روش‌های استخراج روابط خاک-چشم‌انداز ممکن است تنها زمانی مدل‌های قابل اعتماد ارائه دهند که داده‌های ورودی برای مدل‌سازی با کیفیت خوب در دسترس باشند. در نقشه برداری سنتی خاک، نقشه برداران خاک از تعداد محدودی از مهم ترین نقشه های فاکتور تشکیل خاک برای تدوین قوانین فشرده و جامع برای ترسیم خاک استفاده می کنند. همان استراتژی استفاده از تنها متغیرهای کمکی معنی دار اساس رویکرد ما را تشکیل می دهد که ما برای ساخت مدل های آماری معنی دار پیشنهاد می کنیم که به راحتی توسط متخصصان قابل تجزیه و تحلیل باشد [ 15,25 , ]]. در این مطالعه، ما چارچوبی را برای ساخت نقشه‌های خاک منطقه‌ای بر اساس تقلید دیجیتالی از نقشه‌برداری سنتی خاک پیشنهاد و ارزیابی می‌کنیم و این رویکرد را در سایتی در منطقه بلگورود روسیه آزمایش می‌کنیم.
دوره-آموزش-حرفه-ای-gis

2. مواد و روشها

2.1. سایت تست

محل آزمایش در منطقه بلگورود روسیه واقع شده است ( شکل 1 ). اندازه مربع محل آزمایش 1560 کیلومتر مربع بود . مختصات گوشه های منطقه مورد مطالعه 50 درجه و 10 دقیقه شمالی، 37 درجه و 46 دقیقه شرقی، 50 درجه و 58 دقیقه و 38 درجه و 12 دقیقه شرقی است. زمین یک دشت تپه‌ای صاف و مواج است که به‌شدت تشریح شده است. مواد اولیه شامل لوم و رس لس، رسوبات گچ، ماسه های آبرفتی و رودخانه ای و لوم های شنی است. آب و هوای آن قاره ای با تابستان گرم و زمستان نسبتا سرد است. پوشش گیاهی طبیعی با جنگل های بلوط و کاج جدا شده، مراتع در دره های خشک و دشت های سیلابی، و پوشش گیاهی کلسیفیت در دامنه های شیب دار نشان داده شده است. با این حال، زمین های زراعی غالب هستند.
نقشه‌های خاک در مقیاس بزرگ ایجاد شده با استفاده از افسانه طبقه‌بندی خاک‌های روسی 1977—RCS1977 [ 35 ]، به عنوان مبنایی برای مدل‌سازی استفاده شد. علاوه بر این، ترجمه‌ها به طبقه‌بندی مدرن روسی خاک‌ها 2004-RCS2004 [ 36 ] و پایگاه مرجع جهانی برای منابع خاک 2006-WRB2006 [ 37 ] اضافه شدند.
روابط اصلی بین خاک و عوامل تشکیل خاک در جدول 1 نشان داده شده است .
برای محل آزمایش، یک مجموعه نمونه با فاصله متوسط ​​120 متر بین نقاط کلیدی با استفاده از نقشه های خاک در مقیاس بزرگ ساخته شد. در برنامه سیستم یکپارچه اطلاعات زمین و آب (ILWIS)، نقاط به صورت تصادفی تعیین شد و طبقات خاک از نقشه سنتی خاک در مقیاس بزرگ به آنها اختصاص یافت. اندازه مجموعه نمونه 5001 نقطه، بخش مرکزی منطقه مورد مطالعه را پوشش می دهد و تمام خاک ها را نشان می دهد ( شکل 1 ). فاصله 120 متری بین نقاط برای حاشیه انتخاب شد با در نظر گرفتن اینکه یک نقطه خاک باید به کوچکترین چندضلعی خاک ممکن به ابعاد 2 میلی متر در 2 میلی متر در یک نقشه خاک سنتی در مقیاس متوسط ​​1:200000 مربوط باشد [ 38 , 39 , 40]. دقت موقعیت‌یابی مرزی در این مقیاس نزدیک‌ترین به وضوح 90 متری متغیرهای کمکی است [ 41 ]. کل رویکرد ساخت مجموعه نمونه بر اساس روش کلاسیک برای تهیه نقشه های خاک در مقیاس متوسط ​​بود. کوچکترین چندضلعی روی نقشه باید با استفاده از یک گودال خاک یا با استفاده از اطلاعات جمع آوری شده از نقشه خاک در مقیاس بزرگ تنظیم شود.

2.2. رویکرد پیشنهادی برای نقشه برداری خاک

استراتژی اصلی رویکرد پیشنهادی استفاده از روش‌های آماری و داده‌های سنجش از دور برای تقلید از روش‌های سنتی نقشه‌برداری خاک برای تهیه نقشه خاک در مقیاس منطقه‌ای است. الگوریتم های طبقه بندی و رگرسیون درخت برای شناسایی روابط بین خاک و عوامل تشکیل خاک در قالب یک مدل درخت تصمیم صریح استفاده شد. این مدل در سایت های کلیدی در منطقه خاک آموزش داده شد و سپس به منطقه ای از منطقه که در آن اطلاعات کمی در مورد خاک وجود داشت تعمیم داده شد. مدل درخت تصمیم به دست آمده را می توان به صورت دستی ردیابی و تصحیح کرد. یک روش آماری مناسب برای یافتن درخت تصمیم بهینه انتخاب شد. روش انتخاب شده بر اساس مراحل فرآیند سنتی نقشه برداری خاک در چارچوب نقشه برداری خاک دیجیتال ادغام شد.جدول 2 ).
مدلی برای ترسیم خاک ها برای هر منطقه خاکی منطقه آزمایش ایجاد شد که در آن روابط زمین-منظر بین زمین و عوامل تشکیل خاک یکسان در نظر گرفته شد. این استراتژی در نقشه برداری سنتی خاک (TSM) برای ویژگی های خاک استفاده شد [ 11 ، 38 ، 42 ]. منطقه خاک به عنوان یک منطقه سنگ شناسی-ژئومورفولوژیکی با سابقه زمین شناسی یکسان تعریف می شود. منطقه بندی بر اساس شکل زمین یا ترسیم حوضه رودخانه [ 42 ] به دست آمد.
برای توسعه مدل، نقشه‌هایی از عوامل تشکیل‌دهنده خاک (متغیرهای کمکی) که همان موارد مورد استفاده در نقشه‌برداری سنتی خاک ( شکل 2 ) هستند به متغیرهای کمکی اضافه شدند. این متغیرهای کمکی بر اساس مدل رقومی ارتفاع SRTM [ 43 ] – فاصله تا نزدیک‌ترین رودخانه وزن‌دار با شیب‌ها و تغییرات عمودی زمین [ 25 ] و شاخص تجمع جریان [ 44] است.]. استفاده از فاصله وزنی تا نزدیک‌ترین رودخانه، ما را قادر به تقلید از تحلیل متخصص سنتی فرکانس ایزولین (کانتور) کرد، و فاصله تا رودخانه‌ها از نقشه‌های توپوگرافی کاغذی برای ترسیم واحدهای ژئومورفولوژیکی به‌عنوان دشت‌های سیلابی رودخانه، تراس‌ها و دامنه‌های رودخانه، و حوزه‌های آبخیز استفاده شد. در مقایسه با شاخص رطوبت توپوگرافی که به طور گسترده استفاده می شود [ 45 ]، فاصله وزنی کمتر به نویز در مدل های ارتفاعی دیجیتال وابسته است. نقشه های مشتق بر اساس مدل رقومی ارتفاع (شیب و جهت جریان) با استفاده از مدل ارتفاع فیلتر شده میانه محاسبه شد. یک نقشه پوشش گیاهی با استفاده از طبقه بندی تصاویر ماهواره ای از طریق روش جنگل تصادفی برای یک مجموعه نمونه یادگیری به صورت دستی تهیه شد ( جدول 3)). به طور کلی، دقت تولید کننده و کاربر از تعیین طبقه پوشش گیاهی بیش از 99.5٪ است. متغیرهای کمکی زیر برای مدل سازی تهیه شد ( جدول 3 ).
مدل های پیشنهادی برای نقشه برداری خاک به عنوان درخت تصمیم نشان داده شد. مزیت اصلی استفاده از درختان تصمیم، امکان تصحیح دستی بصری است. همچنین می توان یک نهال درخت با شاخه هایی ساخت که نشان دهنده دانش تخصصی در مورد خاک باشد ( شکل 3).). چنین شاخه هایی را می توان برای ترسیم گروه های طبقه بندی بزرگ خاک ها و ویژگی های خاص خاک ایجاد کرد. همه روابط ناشناخته را می توان به طور خودکار از طریق الگوریتم های درخت طبقه بندی و رگرسیون استخراج کرد، مانند از طریق یادگیری تکاملی یک درخت بهینه جهانی. الگوریتم های درخت طبقه بندی و رگرسیون باید یک مدل قابل تفسیر به دست آورند. در نتیجه، این مدل باید فشرده و پایدار باشد. پس از آن، درخت تصمیم کامل شامل تمام اطلاعات مورد نیاز برای ساخت نقشه خاک خواهد بود ( شکل 3). چنین درختان طبقه بندی را می توان برای مناطق مختلف خاک ساخت و در یک پایگاه داده گنجانید تا دانش مربوطه از خاک ها را به شکل فشرده و صریح ذخیره کند. درخت‌های تصمیم به‌دست‌آمده نیز می‌توانند به ویژگی‌های تشخیصی خاک در سیستم‌های طبقه‌بندی خاک برای بهبود سیستم‌های طبقه‌بندی خاک یا خود درخت‌های تصمیم مرتبط شوند. بنابراین، ما دو منبع داده خاک را در نظر گرفتیم: دانش آماری به شکل قابل تفسیر از درختان تصمیم استخراج شده از نقشه‌های خاک میراث و دانش تخصصی از تصحیح کارشناسان دستی درختان.
اجرای یادگیری تکاملی طبقه بندی بهینه جهانی و الگوریتم درخت رگرسیون از بسته EVTREE در R برای ساخت درختان طبقه بندی و رگرسیون [ 31] انتخاب شد.]. هدف الگوریتم EVTREE یافتن درخت تصمیم بهینه به جای یکی از درخت‌های تصمیم ممکن است. این در هنگام تلاش برای استخراج قوانین معنی دار خاک شناسی برای نقشه برداری خاک از نقشه های خاک قدیمی یا نقاط نمونه به دست آمده در طول بررسی خاک اهمیت دارد. این الگوریتم مبتنی بر مفاهیمی مانند وراثت، جهش و انتخاب طبیعی است. این مفاهیم مبتنی بر جمعیت هستند، و مجموعه کاملی از راه‌حل‌های کاندید – درخت‌ها در این مورد – به‌طور همزمان پردازش می‌شوند و به‌طور مکرر توسط عملگرهای تغییر (یعنی جهش (به کار گرفته شده برای راه‌حل‌های منفرد) و متقاطع (ادغام چندین راه‌حل) اصلاح می‌شوند. در نهایت، یک فرآیند انتخاب بازمانده استفاده می‌شود و راه‌حل‌هایی را ترجیح می‌دهد که طبق یک معیار کیفیت مشخص، که معمولاً تابع ارزیابی نامیده می‌شود، به خوبی عمل کنند. در این فرآیند تکاملی، کیفیت متوسط ​​جمعیت در طول زمان افزایش می یابد. یک تفاوت قابل توجه با الگوریتم های قابل مقایسه مکانیسم انتخاب بازمانده در اینجا است که با آن اجتناب از همگرایی زودرس ضروری است [31 ].

برای اکثر برنامه‌ها، الگوریتم‌های بهینه جهانی، برخلاف الگوریتم‌های بهینه محلی، پوشش بسیار کامل‌تری از فضای پارامتر را به شرح زیر ممکن می‌سازند:

Θ=(v1، س1، …، vم-1، سم-1)،

جایی که vrمتغیرهای تقسیم را نشان می دهد، سrنشان دهنده قوانین تقسیم مرتبط برای گره های داخلی r و M نشان دهنده تعداد گره های پایانی است.

معادله (2) به دنبال درخت است Θ^که ضرر طبقه‌بندی نادرست را تحت معاوضه معیار اطلاعات بیزی (BIC) با تعداد گره‌های پایانه به حداقل می‌رساند:

Θ^= آرگمینΘ∈Θ  لoسس{Y، f(ایکس، Θ)}+جoمترپ(Θ)،

که در آن loss(·,·) یک تابع ضرر مناسب است. X بردار متغیر پیش بینی کننده; Y بردار متغیر پاسخ است. comp(·) یک تابع پیچیدگی است که به طور یکنواخت و بر اساس تعداد گره های انتهایی M درخت کاهش نمی یابد.Θاز جانب Θم; و فضای پارامتر کلی است Θ= ∪م=1ممترآایکسΘم; Θم، فضای درختان قابل تصور با گره های ترمینال M.

برای EVTREE، کیفیت درخت طبقه‌بندی معمولاً به عنوان تابعی از نرخ طبقه‌بندی اشتباه آن (MC) اندازه‌گیری می‌شود و پیچیدگی یک درخت با تابعی از تعداد گره‌های پایانی M تعیین می‌شود :

لoسس(Y، f(ایکس،Θ))=2ن·مسی(Y، f(ایکس،Θ))=2·∑n=1نمن(Yn≠ f(ایکسn،Θ))،جoمترپ(Θ)= α·م·لog (ن)،

که در آن N تعداد مقادیر متمایز متغیرهای پیش بینی است، comp تابع پیچیدگی یک درخت را توصیف می کند، و α یک پارامتر مشخص شده توسط کاربر است (مقدار پیش فرض α = 1). قابل توجه است که مقادیر منطقی دیگری از α [ 15 ] وجود دارد .

با استفاده از EVTREE به عنوان روشی برای یافتن روابط بین عوامل تشکیل خاک و خاک، ما رویکرد خود را برای تقلید از فرآیند نقشه برداری سنتی خاک در بسته های نرم افزاری R پیاده سازی کردیم (شکل 4 ) . بسته اصلی، “imsoil” به عنوان یک نسخه آزمایشی کار توسعه داده شد. توسعه بسته R برای تصحیح دستی تعاملی مدل های درخت تصمیم “constparty” از بسته “partykit” نیز مورد نیاز بود [ 46 ]. ما از فرم مدل “constparty” استفاده کردیم زیرا به طور گسترده در بسته های آماری مختلف استفاده می شود و می تواند به راحتی به فرمت کلاسیک “.pmml” تبدیل شود.
برای ارزیابی عملکرد واقعی EVTREE در زمینه رویکرد پیشنهادی، درختان ایجاد شده توسط EVTREE با درختان ایجاد شده توسط الگوریتم کلاسیک بهینه محلی، CART [ 47 ] مقایسه شدند. در حال حاضر، روش‌های گروهی به دلیل عملکرد پیش‌بینی بالایی که دارند، رایج‌ترین رویکردها برای نقشه‌برداری دیجیتالی خاک هستند. از این رو، مقایسه ای با Random Forest نیز ارائه شده است. جنگل تصادفی به عنوان یکی از بهترین روش ها از نظر دقت پیش بینی انتخاب شد [ 20 ].
درختان تولید شده توسط CART به کوچکترین مقادیر پارامترهای پیچیدگی آنها (CPs) هرس شدند. تعداد حداقل موارد در تقسیم برای سبد خرید برابر با 10 بود. برای سبد خرید از معیار تقسیم جینی استفاده شد. برای مدل‌سازی EVTREE، از پارامترهای زیر استفاده کردیم: minbucket = 10، minsplit = 20، niterations = 2000، ntrees = 50، alpha = 1، و maxdepth = 10. احتمالات قبلی برای شاخه‌های درخت تصمیم CART و EVTREE از طریق محاسبه شد. روش اعتبارسنجی متقابل 10 برابری سپس تجزیه و تحلیل Random Forest با تنظیمات پیش فرض از بسته randomForest انجام شد.
مجموعه نمونه ای که ما استفاده کردیم شامل 5001 امتیاز بود، همانطور که در بالا توضیح داده شد. نسخه هایی از مجموعه نمونه با تعداد نقاط نمونه کاهش یافته نیز برای مقایسه عملکرد روش ها برای اندازه های مختلف مجموعه نمونه ایجاد شد.
معیارهای زیر برای ارزیابی کیفیت مدل‌های رابطه خاک – منظر استفاده شد:
  • پایداری: از طریق تجزیه و تحلیل پراکندگی تعداد شاخه ها و از طریق تجزیه و تحلیل متخصص برای 10 اجرای یک الگوریتم تعیین می شود.
  • پیچیدگی: تعداد شرایط موجود در درختان.
  • سازگاری مفهومی: تفسیر مبتنی بر متخصص از یک درخت از هر الگوریتم.
  • میانگین و حداقل احتمالات قبلی طبقه‌بندی مناسب به‌عنوان میانگین و حداقل تعداد نقاط طبقه‌بندی مناسب یک کلاس از مجموعه نمونه آموزشی در هر گره پایانه درخت تقسیم بر تعداد کل نقاط طبقه‌بندی مناسب و نامناسب در همان گره محاسبه شد.
  • عدم قطعیت فضایی در پیکسل: میانگین احتمال محتمل ترین کلاس برای 10 اجرای یک الگوریتم.
  • ارزیابی دقت نقشه: به طور کلی، دقت سازنده، کاربر و کاپا [ 48]. دقت کلی تعداد پیکسل های مشابه تصویر شده در نقشه های پیش بینی شده و مرجع ضرب در تعداد کل پیکسل ها را نشان می دهد. دقت سازنده نشان دهنده تعداد پیکسل هایی است که به عنوان بخشی از همان کلاس در تعداد کل پیکسل های آن کلاس در نقشه مرجع ضرب شده است. دقت کاربر تعداد پیکسل هایی است که در کلاس مشابه به تصویر کشیده شده اند اما در تعداد کل پیکسل های آن کلاس در نقشه پیش بینی شده ضرب شده است. دقت تولید کننده با خطای طبقه بندی اشتباه همراه است و دقت کاربر به خطای طبقه بندی بیش از حد اختصاص دارد. شاخص کاپا کوهن نشان دهنده دقت کلی با توجه به احتمال وقوع توافق است: κ≡پo-په1-په، که در آن o توافق نسبی مشاهده شده بین ارزیاب ها است (یکسان با دقت کلی)، و e احتمال فرضی توافق تصادفی است که از داده های مشاهده شده برای محاسبه احتمالات هر ناظری که به طور تصادفی هر دسته را می بیند استفاده می کند. برای دسته‌های k ، N مشاهدات برای دسته‌بندی و ki تعداد دفعات رتبه‌دهنده که دسته k را پیش‌بینی کردم : په=1ن2∑کnک1nک2.
سپس ده درخت تصمیم به‌دست‌آمده به‌طور ماهرانه مورد تجزیه و تحلیل قرار گرفتند و توصیف‌های کیفی روابط بین خاک و عوامل تشکیل خاک از دیدگاه جغرافیای خاک از درختان استخراج شد. سپس درختان تصمیم گیری کیفی به صورت دستی ایجاد شدند و درختان تصمیم گیری کمی آماری در آنها بسته بندی شدند. این ترکیبی از توصیف‌های کیفی و قوانین کمی باعث بهبود بیشتر دقت پیش‌بینی و سازگاری تصوری نقشه‌برداری خاک شد. این امر با بهبود فهرست متغیرهای کمکی مورد استفاده برای مدل‌سازی و اصلاح دستی قوانین کمی مطابق با اطلاعات کیفی در جغرافیای خاک انجام شد. دانش در قالب درخت های تصمیم را می توان به طور انعطاف پذیر توسط پارامترها و ساختارهای فردی تغییر داد.

3. نتایج

درختان تصمیم گیری با قوانینی برای ترسیم خاک از طریق روش های EVTREE و CART ایجاد شدند ( شکل 5 ). همه درختانی که توسط EVTREE تولید شدند اندازه یکسانی داشتند. درختانی که توسط CART تولید می شدند نیز اندازه مشابهی داشتند و درختانی که توسط EVTREE تولید می شدند فشرده تر از درختان CART بودند. علاوه بر این، درخت‌های تصمیم‌گیری که توسط EVTREE ایجاد شده‌اند، توالی‌های متفاوتی از قوانین مشابه برای ترسیم کلاس خاک داشتند ( شکل 5).). همه درختان EVTREE، با وجود ساختارهای رسمی متفاوت، روابط مشابهی را ارائه کردند. درخت‌های تصمیم ایجاد شده توسط CART قوانین مشابهی برای ترسیم کلاس خاک و دنباله‌های مشابه در قسمت بالایی داشتند اما قوانین متفاوتی در قسمت پایین و در نتیجه مجموعه‌های متفاوتی از قوانین برای ترسیم کلاس خاک داشتند.
مثال بعدی قوانین برای ترسیم خاک به صورت متنی به شرح زیر بیان می شود:
3_G23—جنگل خاکستری و خاکستری تیره/فائومس آلبیک خاکستری:
EVTREE_№5: (1) DEM_md15 < 203 m ^ RIVDIST >= 454505 m ^ DEM >= 171 m ^ LNDCVR = 45_Foret ^ DEM_md15 >= 203 m ^ 3_G23 (احتمال: 3_G21) (2) DEM_md15 >= 203 متر ^ RIVDIST >= 333451 متر ^ RIVDIST >= 371027 متر ^ LNDCVR = 3_آب، 4_جنگل_برگ ^ 3_G23 (احتمال: 47/58).
CART_№2: DEM < 171 m ^ RIVDIST < 337000 m ^ LNDCVR = 1_Grass, 2_Build_up_soils, 3_Water, 5_Conifous_Forest ^ DEM_md15 < 203 m ^ (1) m 353D ^ (1) RIV39 (2) DEM_ < 208 متر ^ 3_G23 (احتمال: 19/24); (3) DEM ->= 208 متر ^ FLOWDIR = 2_E, 3_SE, 7_NW ^ 3_G23 (احتمال: 4/10).
توضیحات: EVTREE شاخه هایی را برای ترسیم Phaeozem در جنگل های دور از دشت های سیلابی ایجاد کرد، جایی که فقط جنگل های برگ وجود دارد ( شکل 6 ). CART شاخه های بسیاری را با مشتقات ارتفاعی مختلف از جمله ارتفاعات، شیب ها و جهت جریان ایجاد کرد. از این رو، قوانین تعیین فیوزم توسط CART بیش از حد آموخته شد.
نمونه دیگری از قوانین ترسیم خاک به صورت متنی به شرح زیر بیان می شود:
21_AL—Alluvial Meadow/Umbric Fluvisols Oxyaquic:
EVTREE_№5: DEM < 203 متر ^ RIVDIST < 454,505 متر ^ (1) LNDCVR = هر به جز 2_خاک های ساختمانی یا 5_جنگل_مخروطی ^ DEM_md15 < 160 متر ^ RIVDIST < 23,9/229 m ; (2) LNDCVR = هر کدام به جز 2_خاک های ایجاد شده و 5_جنگل_مخروطی ^ DEM_md15 >= 160 متر ^ FLOWAC < 380 پیکسل ^ 21_AL (احتمال: 33/64); (3) LNDCVR = 2_خاک های ایجاد شده یا 5_جنگل_مخروطی ^ ^ RIVDIST < 8398 متر ^ 21_AL (احتمال: 19/21).
CART_№2: DEM < 171 m ^ RIVDIST < 9305 m ^ 21_AL (احتمال: 190/200); (2) DEM < 171 متر ^ RIVDIST >= 9305 متر ^ LNDCVR <> 1_Grass, 45_Mixed_Forest, 3_Water, 4_Leaf_Forest ^ FLOWAC >= 68 ^ FLOWDIR = 2_E, 8__m FLOWDIR = 2_E, 8__m FLOWDIR = 2_E, 8__m FLOWDIR = 2_E, 8__5, FLOWDIR, 8__5, , < 212000 متر ^ DEM_md15 > 120 متر ^ 21_AL (احتمال: 3/10). شش مجموعه قوانین دیگر برای ترسیم Fluvisols (21_AL) به دلیل اندازه بزرگ آنها (بیش از هشت شاخه) در متن گنجانده نشده است. این مجموعه ها در مجموع 61 امتیاز آزمون اعمال شد.
توضیحات: EVTREE بیشتر Fluvisol ها را مستقیماً بر اساس ارتفاعات و فواصل آنها تا رودخانه های وزن دار با شیب مشخص کرد. اینها قوانین صحیح برای تعیین فلوویزول هستند. الگوریتم CART مجموعه قوانین بیش از حد آموخته شده زیادی را ایجاد کرد که منجر به ایجاد مناطق وسیعی از Fluvisols در تراس های رودخانه شد ( شکل 6 ). ترسیم‌های جنگل تصادفی درست نبود، زیرا مناطق وسیعی از Fluvisols در تراس‌های رودخانه به جای دشت‌های سیلابی شناسایی شدند ( شکل 6 ). قوانین برای تعیین Fluvisols به دست آمده توسط EVTREE بسیار مستقیم تر از قوانین به دست آمده توسط CART بود.
درخت‌های تصمیمی که با استفاده از یادگیری تکاملی درختان بهینه جهانی (EVTREE) ایجاد شده‌اند، سازگاری مفهومی بسیار بالاتری نسبت به درخت‌های ایجاد شده با استفاده از الگوریتم درخت طبقه‌بندی و رگرسیون (CART) داشتند.
درختان منطقه مورد مطالعه که توسط EVTREE تولید شدند دارای 20-29 شرایط در مقایسه با 142-162 شرایط برای درختانی بودند که توسط CART تولید شدند ( جدول 4 ). میانگین و حداقل احتمالات قبلی برای هر دو روش مشابه بود ( جدول 4 ). حداقل احتمالات قبلی مربوط به خاک معمولی چرنوزم در هر دو روش EVTREE و CART بود. بنابراین، مدل های EVTREE بسیار فشرده تر هستند، که تفسیر آنها را تسهیل می کند.
نقشه های خاک به طور کلی مشابه بودند اما برخی از تفاوت های محلی را نشان دادند ( شکل 7 ). Fluvisolها تنها با استفاده از EVTREE به درستی نقشه‌برداری شدند، زیرا همیشه با دشت‌های سیلابی رودخانه‌ها مرتبط بودند و نه تراس‌ها یا حوزه‌های آبخیز رودخانه‌ها. EVTREE ساده ترین قوانین را برای Fluvisols انتخاب کرد که بهترین دقت را ارائه می کرد. برای خاک هایی با روابط پیچیده خاک و منظر، EVTREE دقت کمتری نسبت به CART ارائه می دهد. با این حال، روش آن برای انتخاب ساده‌ترین قوانین بسیار به رویکرد سنتی نزدیک‌تر است.
دقت کلی نقشه خاک ایجاد شده از طریق جنگل تصادفی با استفاده از مجموعه نمونه کامل 87 درصد بود ( جدول 5 ). احتمالاً می توان بخشی از 13 درصد باقیمانده را با استفاده از اطلاعات مربوط به عوامل تشکیل خاک قبلی ترسیم کرد (عوامل تشکیل خاک مانند پوشش گیاهی و آب و هوای موجود در هزار سال پیش می تواند به طور قابل توجهی بر خواص خاک تأثیر بگذارد اما در حال حاضر با متغیرهای کمکی در خاک نشان داده نمی شود. نقشه برداری دیجیتال خاک). نقشه احتمال ایجاد شده از طریق الگوریتم جنگل تصادفی کیفیت متوسطی را نشان داد، زیرا میانگین احتمال 60/0 بود ( شکل 8)). علیرغم کیفیت متوسط ​​مدل، Random Forest به درستی 87 درصد از مجموعه نمونه آزمون مستقل را پیش‌بینی کرد. نقشه احتمال CART میانگین احتمال بالای 80 درصد را برای مناطق بزرگ نشان داد، در حالی که دقت پیش‌بینی واقعی تنها 67 درصد بود. همانند سایر مطالعات، مدل جنگل تصادفی بهترین دقت پیش‌بینی را برای مجموعه نمونه کامل نشان داد [ 20 ].
نقشه احتمال EVTREE دقت متوسط ​​و بالایی را برای مناطق حوضه آبخیز و دشت های سیلابی به همراه داشت، جایی که ترسیم خاک ها آسان تر بود. کمترین احتمال برای EVTREE برای دامنه‌های حوضه مشاهده شد، جایی که ترسیم خاک‌های چرنوزم مشخص نبود. برای رویکرد جنگل تصادفی، دقت پایین در نقشه احتمال با دقت پیش‌بینی گهگاهی رضایت‌بخش مطابقت دارد، همانطور که توسط مجموعه تست اندازه‌گیری می‌شود، علی‌رغم استفاده از نقاط تست بسیاری (تقریباً 2000 امتیاز). بنابراین، تنها نقشه احتمال ایجاد شده توسط EVTREE کافی بود. قابل ذکر است، تعداد محدود متغیرهای کمکی مزیتی برای EVTREE ایجاد کرد، در حالی که رویکرد با استفاده از محاسبه تصادفی نقشه احتمال بهینه نبود.
پس از کاهش اندازه مجموعه نمونه آموزشی از 5001 به 3304 امتیاز با کاهش مساحت های مربع با نقاط نمونه (2 کیلومتر مربع ) ، دقت برای روش های CART و EVTREE یکسان باقی ماند، اما برای جنگل تصادفی، دقت به میزان قابل توجهی کاهش یافت. 20-30٪ ( جدول 6). پس از افزایش میانگین فاصله بین نقاط با کاهش تعداد نقاط از 5001 به 1785، دقت هر سه روش به نسبت کاهش یافت. هنگام افزایش میانگین فاصله بین نقاط با کاهش اندازه مجموعه نمونه به 1000 امتیاز، الگوریتم جنگل تصادفی اجرا نشد و EVTREE و CART دقتی مشابه با دقت مورد استفاده برای 1785 امتیاز به دست آوردند. برای مجموعه نمونه کوچک، EVTREE و CART نسبت به Random Forest مزیت دارند زیرا می توانند با تعداد کمی از موارد برخورد کنند.
درخت‌های تصمیم به‌دست‌آمده با قوانین کمی نقشه‌برداری ترسیم واحد خاک برای استخراج روابط کیفی جغرافیایی واقعی بین عوامل تشکیل‌دهنده خاک و خاک، مانند مواردی که از طریق نقشه‌برداری سنتی خاک فرموله شده بودند، تجزیه و تحلیل شدند (شکل 9 ) .
درخت تصمیم کیفی به‌دست‌آمده در قالب زنجیره‌های قاعده مجزا برای هر خاک نشان داده شد. زنجیره های قانون نیز به طاقچه های محیطی تقسیم شدند ( شکل 10 ).
تجزیه و تحلیل ترسیم خاک نشان داد که کمپلکس‌های Fluvisols (21_AL) و Gully (22_GC) به درستی نقشه‌برداری نشده‌اند. این به دلیل نقشه رودخانه بیش از حد ساده شده بود که منجر به نقشه مسافت رودخانه ناهموار شد. کیفیت پیش بینی خاک را می توان با اصلاح نقشه های عوامل تشکیل خاک بهبود بخشید. در نتیجه تصمیم گرفتیم نقشه فاصله رودخانه را بازسازی کنیم. نقشه های مسافت رودخانه و رودخانه را با استفاده از پارامتر طول رودخانه برابر با 100 متر به جای 1000 متر بازسازی کردیم. این پارامتر نشان دهنده حداقل طول یک رودخانه در نقشه است. سپس الگوریتم EVTREE را با نقشه فاصله رودخانه ورودی جدید دوباره اجرا کردیم. در نقشه خاک به دست آمده، تفاوت بصری بین Fluvisols (21_AL) و مجموعه گالی(22_GC) خاک عالی بود. در درخت بازسازی شده اطلاعاتی در مورد خاکهای آهکی چرنوزمس (10_CHrc) اضافه شد. در نقشه های بزرگ مقیاس خاک، این خاک ها در مناطق رخنمون نقشه برداری شدند. این مناطق با استفاده از تصاویر ماهواره‌ای لندست و الگوریتم طبقه‌بندی نظارت شده با روش حداکثر احتمال شناسایی شدند. برای آموزش، از مجموعه نمونه اولیه خاک فقط برای مناطق رخنمون استفاده شد. سپس قانون ترسیم دقیق خاکهای آهکی چرنوزمس (10_CHrc) در نواحی رخنمون به درخت طبقه بندی اضافه شد ( شکل 11 ).
بنابراین، حداقل چهار راه برای اصلاح نقشه خاک وجود داشت:
  • افزودن نقشه های کمکی دقیق تر به تجزیه و تحلیل.
  • تصحیح درخت دستی؛
    • تغییر در قوانین کیفی؛
    • تغییر در قوانین کمی؛
  • تصحیح واحد نقشه خاک به صورت دستی
یک ارزیابی دقت برای نقشه خاک اصلاح شده با استفاده از مجموعه نمونه مستقل دیگری از 1269 گودال خاک ارائه شد. دقت کلی قبل از تصحیح دستی 65٪، با دقت 76٪ بعد از اصلاح بود. بنابراین، بر اساس دانش جغرافیای خاک، متغیرهای کمکی برای مدل‌سازی و مدل‌های کمی توسط یک متخصص تصحیح شد تا دقت و ثبات تصوری بالاتری در نقشه‌های خاک ارائه شود.
دوره-آموزش-حرفه-ای-gis

4. بحث

ما نقشه های دقیق خاک را به صورت خودکار بدست آوردیم و آنها را به صورت دستی بسیار دقیق تر کردیم. دقت نقشه خاک اصلاح شده به صورت دستی می تواند به صد در صد برسد، اما این نیاز به کار پرزحمت دارد. چارچوب توسعه‌یافته به ما این امکان را می‌دهد که کار یک نقشه‌بردار سنتی خاک را با استفاده از روش آماری درختان تکاملی و نمایش قابل درک قوانین نقشه‌برداری خاک اجرا کنیم. این روش آماری ابتدا برای نقشه برداری رقومی خاک مورد استفاده قرار گرفت. از مزایای این روش نسبت به روش CART می توان به فشردگی و منطقی بودن مدل اشاره کرد. نمایش آسان روابط خاک – منظر – به عنوان درخت تصمیم و زنجیره‌ای از قوانین – مزیت رویکرد پیشنهادی در مقایسه با مدل‌سازی معادلات ساختاری است [ 12 ، 21]]. با این حال، برای ترسیم ویژگی‌های خاک پیوسته، می‌توان از این دو رویکرد با هم استفاده کرد. این فرآیند شامل نقشه برداری از واحدهای خاک با درختان طبقه بندی و سپس تقسیم آنها به نقشه های پیوسته خواص خاک ( شکل 12 ) است.
این چارچوب با SoLIM متفاوت است زیرا هدف آن توسعه رویکردهایی است که به طور کامل از کار یک نقشه‌بردار سنتی خاک تقلید می‌کنند. بنابراین، نمایش درختان طبقه بندی و زنجیره های قانون از نزدیک مورد بررسی قرار گرفت. در روش شناسی خود، ما عمدتاً از نقشه های سنتی فاکتور تشکیل خاک، مانند مواد اولیه زمین شناسی و مشتقات ساده مدل رقومی ارتفاع، به جای شاخص های دشوار استفاده کردیم. ما همچنین به جای رویکرد منطق فازی از یک شکل سنتی نماینده واحدهای خاک استفاده کردیم. چارچوب ما و بسته‌ای که توسعه داده‌ایم، جایگزین نقشه‌برداری سنتی خاک برای SoLIM [ 22 ، 23] است]. تحقق این چارچوب به شدت مبتنی بر تکنیک‌های یادگیری ماشین و مزایای زبان آماری R بود که آن را با چارچوب SoilGRIDs مطابقت می‌دهد [ 7 ].
به نظر می رسد اشکال پیشنهادی روابط بین عوامل تشکیل خاک و خاک، درختان طبقه بندی و زنجیره های قانون برای تفسیر بسیار راحت باشد. توصیف کیفی قواعد کمی نیز ساده بود، علیرغم برخی عوامل ذهنی به دلیل ماهیت تخصصی تحلیل. استفاده از نقشه های فاکتور تشکیل خاک عمدتاً سنتی به ما کمک کرد تا مدل کمی را تفسیر کنیم و مدل کیفی را به راحتی بدست آوریم. درخت طبقه‌بندی کیفی به‌دست‌آمده به ما این امکان را می‌دهد تا روابط پیچیده زیست‌محیطی را برای منطقه مورد مطالعه به شکلی تجسم کنیم که برای دانشمندان سنتی، خاک‌شناسان، زمین‌شناسان، بوم‌شناسان، محیط‌بانان و دیگران قابل درک باشد. این فرم برای تجزیه و تحلیل محیطی مفید است، مانند تعیین دلایل تغییر خاک در طول زمان و تعریف وضعیت زیست محیطی منطقه مورد مطالعه. این یک نوع تحلیل سنتی است که در بسیاری از روش‌های دیگر DSM نادیده گرفته می‌شود. زنجیره های نقشه برداری خاک فرم قاعده برای تهیه نقشه خاک مناسب بود و به صورت دستی اصلاح شد. این شکل ساده را می توان برای تهیه نقشه خاک در اکثر برنامه های GIS برنامه ریزی کرد. تازگی (مرتبط با زنجیره قوانین) روش شناسی ما در مقایسه با SoLIM این است که روش ما از گروه هایی بر اساس سوله های محیطی استفاده می کند که برای بررسی دلایل زمینه ای برای جغرافیای خاک مهم هستند. یک مشکل قابل توجه در چارچوب ما، کار پرزحمت مرتبط با فرآیند ترجمه روابط از شکل درختان طبقه بندی به زنجیره های قانون است. این روند اما
در زیر مشکلاتی را که با چارچوب پیشنهادی حل می‌کنیم، خلاصه می‌کنیم.
  • کار دستی پر زحمت همراه با تولید دو شکل از قوانین خاک به عنوان یک درخت طبقه بندی کلی و زنجیره قاعده خاص خاک است. یک راه حل ممکن استفاده از بسته ای با رابطی است که به فرد اجازه می دهد تا حد امکان تنظیمات را به آسانی انجام دهد. علاوه بر این، این روش باید تبدیل خودکار بین درخت‌های طبقه‌بندی و زنجیره‌ای از قوانین را فراهم کند.
  • تغییرات قابل توجه در درختان طبقه بندی هنگام استفاده از نقشه های کمکی به روز شده. با استفاده از روش‌های آماری پیچیده‌تر برای یافتن قوانین طبقه‌بندی و ترکیب دانش قبلی خاک در جستجوی قوانین می‌توان بر این امر غلبه کرد.
  • نقشه برداری از طبقات خاک زمانی که ما نیاز به ترسیم خواص مداوم خاک یا توابع خاک داریم. انطباق با روش های دیگر راه حلی برای این مشکل فراهم می کند. در آن صورت، چارچوب پیشنهادی یک رابط با نقشه‌های خاک میراث ارائه می‌کند.
  • بهبودهای آماری دقت الگوریتم درخت طبقه بندی.

5. نتیجه گیری ها

  • دقت کلی نقشه های خاک در منطقه مورد مطالعه برای EVTREE، CART و Random Forest به ترتیب 59، 67 و 87 درصد بود. دقت پیش‌بینی EVTREE برای منطقه مورد مطالعه کمی کمتر از آن برای CART و به طور قابل‌توجهی کمتر از آن برای جنگل تصادفی بود. پس از کاهش اندازه مجموعه نمونه از 5001 به 1785 امتیاز، دقت برای EVTREE (59٪) یکسان باقی ماند، برای CART (61٪) کاهش یافت، و به طور قابل توجهی برای Random Forest (62٪) کاهش یافت. با مجموعه نمونه 1000 امتیازی، الگوریتم جنگل تصادفی اجرا نشد و EVTREE و CART به دقتی مشابه با 1785 امتیاز پی بردند. مجموعه‌های نمونه کاهش‌یافته همه خاک‌ها و بیشتر ویژگی‌های فاکتور تشکیل خاک کل مجموعه نمونه اصلی را پوشش می‌دهند. بنابراین، کیفیت طبقه بندی خاک تحت EVTREE بسیار کمتر به اندازه مجموعه نمونه وابسته بود.
  • میانگین اندازه درختان در منطقه مورد مطالعه ساخته شده توسط EVTREE شامل 24 شرایط بود، در مقایسه با 154 شرایط برای درختان ساخته شده توسط CART. درخت‌های تصمیم فشرده که توسط EVTREE ساخته شدند هم برای ارزیابی کمی کیفیت و هم برای ردیابی تصوری مبتنی بر متخصص مناسب بودند.
  • نقشه‌های خاکی که با استفاده از EVTREE ایجاد شده‌اند، سازگاری تصوری بسیار بالاتری نسبت به نقشه‌های ایجاد شده با استفاده از CART داشتند. قوانین فرموله شده توسط EVTREE برای تعیین Fluvisols و Phaeozems بسیار مستقیم تر از قوانین فرموله شده توسط CART بود. مدل های مستقیم ساخته شده توسط EVTREE برای نقشه برداری خاک برای برون یابی کامل یا جزئی به مناطق دوردست در جهان با شرایط محیطی مشابه مناسب هستند.
  • بسته R برای اصلاحات مدل درخت تصمیم دستی “constparty” لازم است، که می تواند شرایط و برچسب ها را اصلاح کند. ویژگی های انتخاب شاخه های درخت و پیوند درخت با نقشه خاک مرتبط برای نظارت آنلاین تغییرات مفید خواهد بود.
  • ما یک چارچوب نقشه برداری دیجیتالی خاک را توسعه دادیم که از فرآیند نقشه برداری سنتی خاک تقلید می کند و دانش کیفی در مورد جغرافیای خاک را در قوانین کمی برای ترسیم خاک ترکیب می کند. این مدل در قالب یک درخت تصمیم را می توان به صورت ماهرانه تحلیل کرد و می توان در لیست متغیرهای کمکی و سازگاری تصوری مدل بهبودهایی ایجاد کرد.
  • چالش‌ها عبارتند از توسعه یک ویرایشگر درخت بصری با کاربری آسان و سریع، تبدیل خودکار درختان طبقه‌بندی به زنجیره‌های قانون خاص خاک، ادغام خودکار آماری دانش قبلی خاک در فرآیند درخت‌سازی و انطباق با روش‌های دیگر برای نگاشت خواص مستمر خاک و توابع خاک

منابع

  1. Arrouays، D.; مک براتنی، AB; میناسنی، بی. Hempel، JW; Heuvelink، GBM؛ مک میلان، RA; McKenzie، NJ مشخصات پروژه GlobalSoilMap. در GlobalSoilMap: اساس سیستم اطلاعات فضایی جهانی خاک . CRC Press: Boca Raton، FL، USA، 2014. [ Google Scholar ]
  2. Arrouays، D.; Richer-de-Forges، AC; مک براتنی، AB; هارتمینک، AE; میناسنی، بی. ساوین، آی. Lagacherie, P. پروژه نقشه جهانی خاک: نمونه های گذشته، حال، آینده و ملی از فرانسه. گاو نر خاکی دوکوچایف. 2018 ، 95 ، 3-23. [ Google Scholar ] [ CrossRef ]
  3. Arrouays، D.; ساوین، آی. لینارز، جی. McBratney, AB (Eds.) GlobalSoilMap—نقشه دیجیتالی خاک از کشور تا جهان ; CRC Press: لندن، بریتانیا، 2017. [ Google Scholar ]
  4. لاگاچری، پ. مک براتنی، AB فصل 1. سیستم‌های اطلاعاتی خاک و سیستم‌های استنتاج فضایی خاک: دیدگاه‌هایی برای نقشه‌برداری دیجیتالی خاک: مقاله مروری. نقشه برداری دیجیتال خاک یک دیدگاه مقدماتی توسعه دهنده علم خاک 2007 ، 31 ، 137-150. [ Google Scholar ]
  5. Arrouays، D.; Leenaars، JG; Richer-de-Forges، AC; ادیکاری، ک. بالابیو، سی. گریو، ام. Heuvelink، G. نجات داده های میراث خاک از طریق GlobalSoilMap و سایر ابتکارات بین المللی و ملی. GeoResJ 2017 ، 14 ، 1-19. [ Google Scholar ] [ CrossRef ]
  6. گرونوالد، اس. تامپسون، جی. Boettinger، JL نقشه برداری و مدل سازی خاک دیجیتال در مقیاس قاره: یافتن راه حل برای مسائل جهانی. علم خاک Soc. صبح. J. 2011 ، 75 ، 1201-1213. [ Google Scholar ] [ CrossRef ]
  7. هنگل، تی. de Jesus, JM; Heuvelink، GB; گونزالس، ام آر. کلیبردا، م. بلاگوتیچ، آ. گوارا، MA SoilGrids250m: اطلاعات خاک شبکه بندی شده جهانی بر اساس یادگیری ماشین. PLoS ONE 2017 , 12 , e0169748. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  8. Lagacherie, P. نقشه برداری خاک دیجیتال: به پیشرفته ترین. در نقشه برداری خاک دیجیتال با داده های محدود . Springer: Dordrecht، هلند، 2008; صص 3-14. [ Google Scholar ]
  9. مک براتنی، AB; د گرویتر، جی. Bryce, A. Pedometrics Timeline. Geoderma 2019 ، 338 ، 568-575. [ Google Scholar ] [ CrossRef ]
  10. مولدر، وی.ال. دی بروین، اس. Schaepman، ME; Mayr، TR استفاده از سنجش از دور در نقشه برداری خاک و زمین – یک بررسی. ژئودرما 2011 ، 162 ، 1-19. [ Google Scholar ] [ CrossRef ]
  11. چی، اف. Zhu، AX کشف دانش از نقشه های خاک با استفاده از یادگیری استقرایی. بین المللی جی. جئوگر. Inf. علمی 2003 ، 17 ، 771-795. [ Google Scholar ] [ CrossRef ]
  12. آنجلینی، من؛ Heuvelink، GBM؛ کمپن، بی. موراس، HJM نقشه‌برداری از خاک‌های منطقه پامپاس آرژانتین با استفاده از مدل‌سازی معادلات ساختاری. ژئودرما 2016 ، 281 ، 102-118. [ Google Scholar ] [ CrossRef ]
  13. Bui، EN; هندرسون، BL; Viergever، K. کشف دانش از مدل های ویژگی های خاک که از طریق داده کاوی توسعه یافته است. Ecol. مدلسازی 2006 ، 191 ، 431-446. [ Google Scholar ] [ CrossRef ]
  14. مک براتنی، AB; سانتوس، ام.ام. Minasny, B. در مورد نقشه برداری خاک دیجیتال. ژئودرما 2003 ، 117 ، 3-52. [ Google Scholar ] [ CrossRef ]
  15. Zhogolev، AV مقایسه ای از خاک گریدها با نقشه خاک تفکیک شده روسیه. در GlobalSoilMap—نقشه دیجیتالی خاک از کشور به کره زمین ؛ مطبوعات CRC: لندن، انگلستان، 2017؛ ص 49-52. [ Google Scholar ]
  16. Odgers، NP; سان، دبلیو. مک براتنی، AB; میناسنی، بی. کلیفورد، دی. تفکیک و هماهنگ کردن واحدهای نقشه خاک از طریق درختان طبقه بندی مجدد نمونه. ژئودرما 2014 ، 214 ، 91-100. [ Google Scholar ] [ CrossRef ]
  17. پاستور، ال. Laborczi، A.; تاکاچ، ک. Szatmári، G. باکاچی، ز. Szabó، J. DOSoReMI به عنوان اجرای ملی نقشه جهانی خاک برای قلمرو مجارستان. در GlobalSoilMap—نقشه دیجیتالی خاک از کشور به کره زمین ؛ CRC Press: لندن، انگلستان، 2017; صص 17-22. [ Google Scholar ]
  18. Caubet، M. Dobarco, MR; Arrouays، D.; میناسنی، بی. سابی، کشور ادغام NPA، پیش‌بینی‌های قاره‌ای و جهانی بافت خاک: درس‌هایی از مدل‌سازی گروهی در فرانسه. Geoderma 2019 ، 337 ، 99-110. [ Google Scholar ] [ CrossRef ]
  19. چینیلین، AV؛ Savin, IY نقشه‌برداری دیجیتالی کربن آلی خاک با استفاده از الگوریتم‌های یادگیری ماشین. گاو نر خاکی دوکوچایف. 2018 ، 91 ، 46-62. [ Google Scholar ] [ CrossRef ]
  20. هنگل، تی. نوسبام، م. رایت، MN; Heuvelink، GBM؛ Gräler، B. Random Forest به عنوان یک چارچوب عمومی برای مدل‌سازی پیش‌بینی متغیرهای مکانی و مکانی-زمانی. PeerJ 2018 , 6 , e5518. [ Google Scholar ] [ CrossRef ] [ PubMed ][ نسخه سبز ]
  21. آنجلینی، من؛ Heuvelink، GBM؛ Kempen، B. نقشه برداری چند متغیره خاک با مدل سازی معادلات ساختاری. یورو J. Soil Sci. 2017 ، 68 ، 575-591. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  22. زو، ا. چنگ ژی، کیو. پنگ، ال. فی، دی. نقشه برداری دیجیتالی خاک برای کشاورزی هوشمند: روش SoLIM و پلتفرم های نرم افزاری. رودن جی. آگرون. انیمیشن. Ind. 2018 , 13 , 317–335. [ Google Scholar ] [ CrossRef ]
  23. زو، تبر; باند، LE; داتون، بی. Nimlos، TJ استنتاج خودکار خاک تحت منطق فازی. Ecol. مدلسازی 1996 ، 90 ، 123-145. [ Google Scholar ] [ CrossRef ]
  24. چی، اف. Zhu، AX مقایسه سه روش برای مدل‌سازی عدم قطعیت در کشف دانش از نقشه‌های خاک کلاس منطقه. محاسبه کنید. Geosci. 2011 ، 37 ، 1425-1436. [ Google Scholar ] [ CrossRef ]
  25. ژوگولف، ای وی. Savin, IY به روز رسانی خودکار نقشه های خاک در مقیاس متوسط. علم خاک اوراسیا 2016 ، 49 ، 1241-1249. [ Google Scholar ] [ CrossRef ]
  26. Bui، EN علم منطقه بحرانی مبتنی بر داده: یک پارادایم جدید. علمی کل محیط. 2016 ، 568 ، 587-593. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  27. ما، YX; میناسنی، بی. مالون، BP; مک براتنی، AB پدولوژی و نقشه برداری دیجیتال خاک (DSM). یورو J. Soil Sci. 2019 ، 70 ، 216-235. [ Google Scholar ] [ CrossRef ]
  28. پاداریان، ج. موریس، جی. میناسنی، بی. مک براتنی، AB توابع انتقال و سیستم های استنتاج خاک ؛ Springer: برلین/هایدلبرگ، آلمان، 2018; صص 195-220. [ Google Scholar ]
  29. Lagacherie, P. Formalization des Lois de Distribution des Sols Pour Automatiser la Cartographie Pédologique à Partir d’un Secteur Pris Comme Reference. پایان نامه کارشناسی ارشد، Université de Montpellier، Institut National de la Recherche Agronomique، Montpellier، فرانسه، 1992. [ Google Scholar ]
  30. ترنو، TM; اتکینسون، EJ مقدمه ای بر پارتیشن بندی بازگشتی با استفاده از روال های RPART. 2018. در دسترس آنلاین: https://cran.r-project.org/web/packages/rpart/vignettes/longintro.pdf (در 28 فوریه 2019 قابل دسترسی است).
  31. گرابینگر، تی. زیلیس، ع. فایفر، KP Evtree: یادگیری تکاملی طبقه‌بندی بهینه جهانی و درختان رگرسیون در R. J. Stat. نرم افزار 2014 ، 61 ، 1-29. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  32. بالستریرو، آر. بارانیوک، آر. تئوری اسپلاین یادگیری عمیق. در مجموعه مقالات سی و پنجمین کنفرانس بین المللی یادگیری ماشین، استکهلم، سوئد، 10 تا 15 ژوئیه 2018؛ جلد 80، ص 374–383. [ Google Scholar ]
  33. چیماتاپو، آر. هاگراس، اچ. استارکی، ا. اووسو، جی. هوش مصنوعی قابل توضیح و سیستم‌های منطق فازی. در کنفرانس بین المللی تئوری و عمل محاسبات طبیعی ; Springer: برلین/هایدلبرگ، آلمان، 2018; صص 3-20. [ Google Scholar ]
  34. Savin، IY تقلید مبتنی بر کامپیوتر از نقشه برداری خاک. نقشه برداری دیجیتالی خاک: بررسی های نظری و تجربی . موسسه علوم خاک VV Dokuchaev: مسکو، روسیه، 2012; ص 26-34. (به روسی) [ Google Scholar ]
  35. اگوروف، وی وی. فریدلند، VM; ایوانوا، EN; Rozov، NN طبقه بندی و تشخیص خاک های اتحاد جماهیر شوروی . کولوس: مسکو، روسیه، 1977. (به زبان روسی) [ Google Scholar ]
  36. Shishov، LL; Tonkonogov، VD; لبدوا، دوم؛ گراسیموا، ششم (ویرایشگاه) طبقه بندی و سیستم تشخیصی خاک های روسیه ; Oikumena: اسمولنسک، روسیه، 2004. (به زبان روسی) [ Google Scholar ]
  37. گروه کاری IUSS WRB. پایگاه مرجع جهانی منابع خاک 2006 ; گزارش منابع خاک جهان 103; فائو: رم، ایتالیا، 2006. [ Google Scholar ]
  38. Ilyina، LP; میهایلووا، آر.پی. سیماکووا، ام اس؛ Shubina، IG گردآوری نقشه های خاک در مقیاس متوسط ​​منطقه ای با نمایش الگوهای پوشش خاک . موسسه علوم خاک VV Dokuchaev: مسکو، روسیه، 1990. [ Google Scholar ]
  39. کارکنان بررسی خاک طبقه‌بندی خاک: سیستم پایه طبقه‌بندی خاک برای ساخت و تفسیر بررسی‌های خاک ، ویرایش دوم. کتاب راهنمای کشاورزی، 436; خدمات حفاظت از منابع طبیعی: واشنگتن، دی سی، ایالات متحده; وزارت کشاورزی ایالات متحده: واشنگتن، دی سی، ایالات متحده آمریکا، 1999.
  40. روی، JA فیزیوگرافی و خاک. در دوره های خاک سنجی. موسسه بین المللی هوافضا و علوم زمین ITC: Enschede، هلند، 1988. [ Google Scholar ]
  41. Hengl, T. پیدا کردن اندازه پیکسل مناسب. محاسبه کنید. Geosci. 2006 ، 32 ، 1283-1298. [ Google Scholar ] [ CrossRef ]
  42. Xiong، LY; زو، تبر; ژانگ، ال. روش مبتنی بر شی حوضه زهکشی تانگ، GA برای طبقه‌بندی شکل زمین در مقیاس منطقه‌ای: مطالعه موردی منطقه لس در چین. فیزیک Geogr. 2018 ، 39 ، 523-541. [ Google Scholar ] [ CrossRef ]
  43. جارویس، ا. رویتر، HI; نلسون، ا. Guevara, E. Hole-filled SRTM for the Globe نسخه 4. در دسترس آنلاین: https://srtm.csi.cgiar.org (در 28 فوریه 2019 قابل دسترسی است).
  44. Qin، CZ; زو، تبر; پی، تی. Li، BL; شولتن، تی. بهرنز، تی. Zhou، CH رویکردی برای محاسبه شاخص رطوبت توپوگرافی بر اساس حداکثر شیب پایین شیب. دقیق کشاورزی 2011 ، 12 ، 32-43. [ Google Scholar ] [ CrossRef ]
  45. هنگل، تی. Maathuis، BHP; وانگ، L. ژئومورفومتری در ILWIS. توسعه دهنده علم خاک 2009 ، 33 ، 309-331. [ Google Scholar ]
  46. هاثورن، تی. Zeileis, A. Partykit: یک جعبه ابزار مدولار برای پارتی‌بندی بازگشتی در R. J. Mach. فرا گرفتن. Res. 2015 ، 16 ، 3905-3909. [ Google Scholar ]
  47. بریمن، ال. فریدمن، جی. اولشن، ر. سنگ، ج. طبقه بندی و رگرسیون درختان. Wadsworth Int. گروه 1984 ، 37 ، 237-251. [ Google Scholar ]
  48. Rossiter، DG; زنگ، آر. Zhang، GL حسابداری فاصله طبقه بندی در ارزیابی دقت پیش بینی کلاس خاک. Geoderma 2017 ، 292 ، 118-127. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
شکل 1. منطقه مطالعه Novy Oskol.
شکل 2. متغیرهای کمکی از روش سنتی نقشه برداری خاک با نقشه های اضافی از مشتقات مدل ارتفاعی (*-نقشه های مورد استفاده اختیاری و **-اطلاعات تاریخی در مورد خاک هایی که برای ترسیم خط تک معنایی صحیح خاک از طریق رویکرد عامل تشکیل خاک مورد نیاز هستند).
شکل 3. تکمیل درخت تصمیم گیری از دانش تخصصی مطمئن با شاخه های اضافی از طریق یادگیری ماشین (بسته evtree). فاصله-فاصله تا نزدیکترین رودخانه با وزن شیبها، ارتفاع-ارتفاع، آبرفت- رسوبات آبرفتی در دشتهای سیلابی، و نمای تاریخی- ظاهر افق خاک تاریخی با مواد آلی (دقت: 90% به دقت تشخیص سطوح آلی خاک بر اساس در تصاویر ماهواره ای لندست).
شکل 4. ساختار بسته های R در حال انجام ما با اجرای رویکرد تقلید نقشه برداری خاک سنتی.
شکل 5. ظاهر درختانی که از طریق EVTREE و CART ایجاد شده اند.
شکل 6. درخت تصمیم کمی EVTREE №5 برای منطقه خاک Chernozems در منطقه بلگورود (انواع خاک: 3_G23—Greyic Phaeozems Albic, 5_CHv—Voronic Chernozems Pachic, 6_CHt—Voronic Chernozems-ChernozemskHerctic, 6_CHt—Voronic Chernozems, ChernozemskHerc, 6_CHt—Voronic Chernozems,ChernozemskHerc,ChnozemskL,Chnozems,CH Pachic، 21_AL-Umbric Fluvisols Oxyaquic، 22_GC-Gully Complex، 25_SAL-Haplic Fluvisols، N: تعداد نقاط با خاک، Err: نرخ طبقه بندی اشتباه).
شکل 7. مجموعه نمونه و نقشه خاک که با استفاده از سه روش EVTREE، CART و Random Forest ایجاد شده است.
شکل 8. نقشه های احتمال محتمل ترین کلاس خاک ایجاد شده با استفاده از سه روش: EVTREE (تصادفی)، CART (تصادفی)، و جنگل تصادفی.
شکل 9. درخت تصمیم کیفی با تعداد قوانین از درخت تصمیم گیری کمی (در مربع – بخشی از درخت که به طرز ماهرانه ای تصحیح شد).
شکل 10. بسته بندی قوانین نقشه کشی کمی ترسیم واحد خاک با قوانین کیفی.
شکل 11. درخت طبقه‌بندی تصحیح‌شده با استفاده از سه روش: مدل‌سازی با نقشه‌های عاملی بازسازی‌شده، افزودن دستی قوانین خبره، و تصحیح متخصص با استفاده از تشخیص مستقیم داده‌های سنجش از دور.
شکل 12. مثالی از انطباق درختان طبقه بندی و SEM.

بدون دیدگاه

دیدگاهتان را بنویسید