چکیده

هدف این مطالعه ادغام داده‌های چند منبعی برای مدل‌سازی رطوبت نسبی خاک (RSM) بر روی فلات لس چین در سال 2017 توسط رگرسیون چند خطی گام به گام (SMLR) به منظور بهبود پوشش فضایی RSM قبلا منتشر شده ما است. ابتدا، 34 متغیر کاندید (12 متغیر کمی و 22 متغیر ساختگی) از طیف‌سنجی تصویربرداری با وضوح متوسط ​​(MODIS) و داده‌های توپوگرافی، خواص خاک و هواشناسی پیش پردازش شدند. سپس، SMLR برای متغیرهای بدون همخطی چند خطی برای انتخاب معنی دار آماری اعمال شد ( ص-value < 0.05) متغیرها. پس از ارزیابی دقت، الگوهای مکانی ماهانه، فصلی و سالانه RSM در وضوح 500 متر نقشه برداری و مورد ارزیابی قرار گرفت. نتایج نشان می دهد که پتانسیل بالایی از SMLR برای مدل سازی RSM با دقت مطلوب (بهترین تناسب مدل با پیرسون r = 0.969، ریشه میانگین مربع خطا = 0.761٪ و میانگین خطای مطلق = 0.576٪) نسبت به لس چینی وجود دارد. فلات. متغیرهای ارتفاع (0-500 متر و 2000-2500 متر)، بارش، بافت خاک لوم، و دمای سطح زمین در شب می توانند به طور مداوم در مدل های رگرسیون برای تمام فصول استفاده شوند. گنجاندن متغیرهای ساختگی، تناسب مدل را هم در کالیبراسیون و هم در اعتبارسنجی بهبود بخشید. علاوه بر این، RSM مدل‌سازی‌شده با SMLR تقریباً برای همه دوره‌ها به پوشش فضایی بهتری نسبت به RSM مرجع دست یافت.

1. مقدمه

رطوبت خاک (SM) به طور گسترده ای به عنوان یک متغیر حیاتی سطح زمین شناخته می شود که با تعامل زمین و جو [ 1 ، 2 ]، فرآیندهای بارش-رواناب [ 3 ]، تعادل آب-انرژی [ 4 ] و تغییرات آب و هوا [ 5 ] مرتبط است. توصیف دقیق SM برای کاربردهایی مانند مدل‌سازی آب و هوا و آب و هوا، مدیریت کشاورزی و منابع آب در گستره‌های فضایی بزرگ‌تر مفید است [ 6 ]. برآورد دقیق و به موقع SM در مقیاس مکانی و زمانی مربوط، یک استراتژی مناسب برای پیش‌بینی خشکسالی/سیل [ 7 ، 8 ] و برنامه‌ریزی آبیاری است [ 9 ، 10 ]] برای پایداری و بهره وری کشاورزی، به ویژه در مناطق خشک و نیمه خشک مانند فلات لس چین (CLP).
داده‌های سنجش از راه دور مختلف، که تقریباً تمام مناطق طیف الکترومغناطیسی از باندهای مایکروویو تا مرئی را در بر می‌گیرد، از دهه 1970 برای بازیابی SM استفاده شده است [ 11 ، 12 ، 13 ، 14 ]. به منظور به دست آوردن نقشه های مکانی-زمانی SM، انواع روش ها و تکنیک های تخمین SM نیز پیشنهاد شده است [ 6 ]. با این حال، حسگرهای مایکروویو (فعال و غیرفعال) به دلیل قدرت تفکیک فضایی درشت خود (چند ده کیلومتر) نمی توانند SM را به خوبی در مقیاس محلی و منطقه ای نظارت کنند [ 12 ، 15 ، 16 ]]. سیستم‌های رادار دیافراگم مصنوعی (SAR) وضوح فضایی بهتری را برای بازیابی SM ارائه می‌دهند اما با زمان بازبینی طولانی. علاوه بر این، بازیابی SM از SAR و حسگرهای مایکروویو تا حد زیادی تحت تأثیر زبری سطح خاک، پوشش گیاهی و سایر عوامل مرتبط است [ 17 ]. شبیه‌سازی‌های عددی، شامل استفاده از ویژگی‌های سطح زمین بازیابی شده توسط نوارهای مرئی/نزدیک مادون قرمز/مادون قرمز حرارتی (به عنوان مثال، پوشش گیاهی، دمای سطح زمین (LST) و albedo سطح)، مدت‌هاست که روش‌های اولیه برای به دست آوردن مقیاس بزرگ بوده‌اند. اس ام این روش ها بر اساس داده های طیف رادیومتر تصویربرداری با وضوح متوسط ​​(MODIS) و مدل های سطح زمین [ 2 ، 18 ، 19 ] هستند.]. با این حال، مشکل اصلی مرتبط با این روش این است که حسگرهای نوری نمی توانند به ابرها و پوشش گیاهی نفوذ کنند، که به شدت بر کیفیت نتایج تخمین SM تأثیر می گذارد [ 18 ، 20 ].
یک رویکرد برای به دست آوردن تخمین های دقیق SM با وضوح بالا، تفکیک SM مشتق شده از مایکروویو با استفاده از داده های تفکیک شده با وضوح بالا مانند داده های حرارتی مادون قرمز و مرئی/نزدیک به فروسرخ است [ 15 ، 21 ، 22 ، 23 ]. موضوع این نوع روش کاهش مقیاس به دلیل تأثیر عدم قطعیت در داده‌های ورودی و کمیاب بودن داده‌های زمینی، روش ارزیابی و اعتبارسنجی است [ 24 ]. جدای از هم افزایی داده های مختلف [ 25 ، 26 ، 27 ، 28 ]، رویکرد دیگر ترکیب روش های تخمین مختلف برای بازیابی SM است [ 11 ، 29 ]30 , 31 ]. اگرچه یوان و همکاران. برآورد SM بهبود یافته در مورد پوشش مکانی – زمانی برای CLP با استفاده از اینرسی حرارتی ظاهری مشتق از MODIS (ATI) و شاخص خشکی گیاهی دما (TVDI)، پیکسل‌های خاصی دارای مقادیر SM نیستند. این منجر به نمایش نقشه های SM ناقص در مقیاس ماهانه [ 32 ] شد.
علاوه بر این، تنوع SM تحت تأثیر عوامل مختلف محیطی قرار می گیرد: ویژگی های خاک (به عنوان مثال، بافت خاک و مواد آلی) [ 33 ، 34 ] در مقیاس قطعه، توپوگرافی [ 35 ] و پوشش زمین [ 36 ، 37 ] در سطح محلی. مقیاس، و بارش، تبخیر و تعرق [ 38 ، 39 ]، رطوبت نسبی، و دما [ 40 ] به دست آمده از داده های هواشناسی در مقیاس منطقه ای [ 41 ، 42 ]]. یک رویکرد موثر برای مدل‌سازی SM با دقت و تفکیک فضایی بالا باید اطلاعات سطح سنجش از دور، داده‌های هواشناسی منطقه‌ای، داده‌های توپوگرافی و داده‌های ویژگی‌های خاک را یکپارچه کند [ 18 ]. روش‌های مبتنی بر داده برای تخمین SM شامل تحلیل‌های چند متغیره، شبیه‌سازی داده‌ها و تکنیک‌های یادگیری ماشینی است [ 43 ، 44 ، 45 ]. یک طرح جذب داده‌های SM برای شبیه‌سازی SM دینامیک در مقیاس‌های مکانی-زمانی با استفاده از پارامترهای تخمینی خاک و فشار هوا بر اساس یک مدل هیدرولوژیکی است [ 46 ، 47 ]. تکنیک یادگیری ماشین از نظر محاسباتی فشرده است (به عنوان مثال، جنگل تصادفی (RF) [ 48 ، 49]، شبکه عصبی مصنوعی (ANN) [ 50 ، 51 ، 52 ، 53 ]، رگرسیون برداری پشتیبانی (SVR) [ 54 ، 55 ، 56 ]، و درختان رگرسیون (RT) [ 57 ، 58 ]) و برای ساخت مدل های ریاضی استفاده می شود. بر اساس مجموعه های آموزشی و متغیرهای کمکی برای استخراج اطلاعات SM از داده های موجود [ 59 ، 60 ].
تجزیه و تحلیل های چند متغیره، به ویژه تحلیل رگرسیون (رگرسیون چند خطی (MLR) [ 61 ]، رگرسیون چند خطی گام به گام (SMLR) [ 53 ، 62 ]، رگرسیون فرآیند گاوسی [ 63 ، 64 ]، رگرسیون مربع های خطی جزئی [ 65 ] رگرسیون چند خطی، و [ 66 ]) به طور گسترده برای مدل سازی SM استفاده می شود. در میان این روش ها، MLR، اساسی ترین شکل رگرسیون خطی، یک متغیر وابسته منفرد را از چندین متغیر مستقل پیش بینی می کند. یانگ و همکاران [ 67 ] یک مدل MLR برای تخمین SM بر اساس متغیرهای محیطی مشاهده شده (یعنی کاربری زمین، توپوگرافی و هواشناسی) در حوضه آبریز دانانگو (3.5 کیلومتر مربع) انجام داد .) از CLP. نویسندگان از متغیر کاربری زمین و شاخص های زمین به عنوان متغیرهای ساختگی (یعنی یک متغیر عددی که داده های طبقه بندی شده را نشان می دهد) برای ساخت مدل استفاده کردند [ 68 ]، و به این نتیجه رسیدند که مدل SMLR موثرترین و مقرون به صرفه ترین در بین مدل ها بود [ 69 ] . SMLR، که اساساً MLR را بارها تکرار می‌کند، روشی است برای رگرسیون چندین متغیر در حالی که آن‌هایی را که مهم نیستند حذف می‌کند [ 70 ]. متغیرهایی از جمله روز سال، ارتفاع تاج پوشش، و NDVI با SMLR و ANN کالیبره شدند تا رطوبت سوخت در چمنزار علف بلند [ 53 ] برآورد شود. علاوه بر این، متغیرهای طبقه بندی شده مانند پوشش زمین [ 36 ]، ارتفاع [ 18 ، 35 ]]، شیب شیب، جنبه شیب، و بافت خاک [ 18 ، 34 ، 37 ، 40 ] نیز برای مدل سازی SM اعمال می شود. روش SMLR همچنین برای پیش‌بینی نفوذ آب خاک در دشت سیل‌آبی خشک شرق ایران [ 71 ]، برای تخمین محتوای آب موجود گیاه در خاک غیراشباع استفاده شد [ 70 ]. هنگامی که متغیر ریز تخلخل برای تخمین در دسترس بودن آب در خاک گنجانده شد، SMLR (که دارای راندمان محاسباتی و سهولت تفسیر است) در مقایسه با ANN و RT ساده تر بود [ 58 ].
با این حال، از منظر تحلیل آماری، اگر حجم نمونه برای اعمال مدل SMLR کافی نباشد، مشکل چالش برانگیزتر است [ 72 ، 73 ]. بنابراین، مشاهدات پراکنده SM درجا (به عنوان مثال، تنها 49 مشاهدات SM سالانه موجود) برای در نظر گرفتن SM مرجع برای کل CLP (640000 کیلومتر مربع) مناسب نیستند [ 32 ] . نقشه‌های SM مرجع ناقص از قبلاً منتشر شده ما، تا حدی، هنوز برای برنامه‌های خاص در دسترس نبودند. بنابراین، استفاده از روش SMLR بر روی CLP برای تخمین SM، بهترین استفاده ممکن را از همه داده‌های جانبی (ترجمه داده‌های موجود به داده‌های مورد نیاز)، به‌ویژه داده‌هایی که نسبتاً ارزان و به راحتی قابل دسترسی هستند، می‌کند [ 58 ]].
هدف از این مطالعه ادغام داده‌های چندمنبعی (MODIS و توپوگرافی، ویژگی‌های خاک و داده‌های هواشناسی) برای مدل‌سازی رطوبت نسبی خاک (RSM) در تفکیک مکانی 500 متر بر روی فلات لس چین در سال 2017 با رگرسیون چند خطی گام به گام است. SMLR) به منظور بهبود پوشش فضایی RSM قبلا منتشر شده ما. RSM منتشر شده قبلی با استفاده از ATI و TVDI مشتق از MODIS تولید شد و به عنوان داده های RSM مرجع در مطالعه حاضر در نظر گرفته شد. توضیحات مفصل برای تولید RSM مرجع در بخش 3 ارائه شده است. ابتدا 34 متغیر کاندید (12 متغیر کمی و 22 متغیر ساختگی) پیش پردازش شدند. سپس، SMLR برای متغیرهای بدون همخطی چند خطی برای انتخاب معنی دار آماری اعمال شد ( ص-value < 0.05) متغیرها. مدل‌های رگرسیون و دقت RSM مدل‌سازی‌شده در مقیاس‌های ماهانه، فصلی و سالانه مورد ارزیابی قرار گرفتند. در نهایت، RSM مدل‌سازی‌شده برای درک بهتر ویژگی‌های مکانی و زمانی RSM مورد تجزیه و تحلیل قرار گرفت.

2. منطقه مطالعه

این منطقه مورد مطالعه فلات CLP-Chinese Loess Plateau (100°54′-114°33′ شرقی و 33°43′-41°16′ شمالی)، شمال غربی چین است که مساحتی به وسعت تقریباً 640000 کیلومتر مربع را در بر می گیرد و هفت استان را در بر می گیرد. ( شکل 1 الف). این چشم انداز به شدت توسط فرسایش بادی-آبی شکل گرفته و دارای شکل زمینی بسیار شکسته از خندق ها است [ 74 ]. میانگین سالانه دما و بارندگی به تدریج از جنوب شرقی (14 درجه سانتی گراد و 750 میلی متر) به سمت شمال غربی (4 درجه سانتی گراد و 200 میلی متر) کاهش می یابد [ 75 ]. CLP به دلیل خاک سست و فرسایش پذیر آن به عنوان جدی ترین منظره فرسایش یافته در جهان طبقه بندی شده است [ 76 , 77 ]]. بارندگی کم و متمرکز (میانگین بارندگی سالانه 420 میلی متر است و 55 تا 78 درصد در فصل مرطوب از جولای تا سپتامبر کاهش می یابد) CLP را به ویژه در برابر خشکسالی آسیب پذیر می کند [ 78 ]. علاوه بر این، SM بیش از CLP تغییرات فضایی قابل توجهی را به دلیل ویژگی های آب و هوایی و توپوگرافی تکه تکه نشان می دهد [ 36 ، 79 ]. بنابراین، برآوردهای کمی SM بیش از CLP از سایر مناطق مهمتر است.
در مطالعه حاضر، برای اطمینان از توزیع یکنواخت نمونه‌های کالیبراسیون و اعتبارسنجی (بدون همپوشانی)، هر دو 7814 نمونه کالیبراسیون (نقاط قرمز کوچک در شکل 1 ب) و 7824 نمونه اعتبارسنجی (نقاط آبی کوچک در شکل 1 ب) انتخاب شدند. فواصل 10 کیلومتری در حالی که فاصله بین نمونه های کالیبراسیون و اعتبار سنجی مجاور 5 کیلومتر بود. در مجموع 298 ایستگاه هواشناسی خودکار چینی (نقاط قرمز بزرگ در شکل 1 ب) داده های مشاهده بارش ساعتی و رطوبت نسبی هوا را بر روی CLP ارائه کردند.

3. مواد و روشها

3.1. داده های رطوبت خاک

رطوبت نسبی خاک (RSM) نشان دهنده درصد SM است که ظرفیت ذخیره رطوبت را به حساب می آورد و برای توصیف سطوح SM در مطالعه حاضر استفاده شد. نقشه‌های ماهانه، فصلی و سالانه RSM CLP در سال 2017 (که قبلاً منتشر شده بود [ 32 ]) استفاده شد و به عنوان RSM مرجع برای مدل‌سازی در این مطالعه در نظر گرفته شد. RSM منتشر شده قبلی از طریق نقشه های RSM 8 روزه تولید شده است. RSM کلی 8 روزه با وضوح 500 متر توسط RSM زیرمنطقه ای مربوطه ترکیب شد که با سه گروه از آستانه های NDVI بهینه انتخاب شده با استفاده از ATI مشتق شده از MODIS (اینرسی حرارتی ظاهری) و TVDI (شاخص خشکی پوشش گیاهی دما) و میانگین ATI و TVDI در برابر مشاهدات RSM در عمق 20 سانتی متر [ 32]. در اینجا، بسیاری از مطالعات اشاره کردند که TVDI و ATI می توانند به اندازه کافی تغییرات RSM را در عمق 20 سانتی متری منعکس کنند [ 11 ، 80 ، 81 ، 82 ]. از نظر تخمین RSM با استفاده از مدل مبتنی بر ATI، اینرسی حرارتی خاک (TI) به عنوان یک ویژگی حرارتی خاک توصیف می‌شود که مقاومت آن در برابر تغییرات دما را مشخص می‌کند و برای بازیابی SM نزدیک به سطح استفاده شده است [ 11 ، 83 ]. ATI، برای ساده کردن TI، با آلبدو سطح طیفی و محدوده دمای روزانه سطح زمین (LST) محاسبه می‌شود [ 31 ، 84]. روش ATI برای پایش RSM برای خاک لخت یا مناطق با پوشش گیاهی کم استفاده شده است. علاوه بر این، به عنوان یک روش موثر بر اساس فضای ویژگی NDVI-LST، مدل مبتنی بر TVDI پوشش گیاهی را در تخمین RSM در نظر می‌گیرد و به طور گسترده در مناطق پوشش گیاهی اعمال شده است. برای تخمین RSM زیرمنطقه‌ای 8 روزه، CLP کلی به سه زیر منطقه (زیر منطقه ATI، زیر منطقه TVDI و زیر منطقه ATI/TVDI) با توجه به NDVI پیکسل‌ها تقسیم شد. مدل مبتنی بر ATI، مدل مبتنی بر TVDI، و مدل مشترک ATI/TVDI به ترتیب در زیرمنطقه ATI، زیر منطقه TVDI و زیر منطقه ATI/TVDI استفاده شد و داده‌های RSM زیرمنطقه‌ای مربوطه به‌دست آمد. بنابراین از معادلات به صورت زیر استفاده شد:

آراسمovهrآلل={آراسمآتیمن=آآتیمن×آتیمن+بآتیمننDVمن∈[0،نDVمنآتیمن]آراسمآتیمن/تیVDمن=آآتیمن/تیVDمن×آتیمن+تیVDمن2+بآتیمن/تیVDمننDVمن∈(نDVمنآتیمن،نDVمنتیVDمن]آراسمتیVDمن=آتیVDمن×تیVDمن+بتیVDمننDVمن∈(نDVمنتیVDمن،1]

جایی که آراسمovهrآللنشان دهنده RSM کلی است و با سه RSM زیر منطقه ای ترکیب شده است ( آراسمآتیمن، آراسمآتیمن/تیVDمن،و آراسمتیVDمن). آراسمآتیمنو آراسمتیVDمنRSM به ترتیب توسط مدل های مبتنی بر ATI و مبتنی بر TVDI تخمین زده می شود و آراسمآتیمن/تیVDمنRSM برآورد شده توسط مدل مشترک ATI/TVDI است. آآتیمنو بآتیمنضرایبی از برازش مقادیر ATI و مشاهدات RSM درجا در زیر منطقه ATI هستند. آتیVDمنو بتیVDمنضرایبی از برازش مقادیر TVDI و مشاهدات RSM درجا در زیر منطقه TVDI هستند. آآتیمن/تیVDمنو بآتیمن/تیVDمنضرایبی از برازش مقدار متوسط ​​ATI و TVDI و مشاهدات RSM درجا در زیر منطقه ATI/TVDI هستند.  نDVمنآتیمن و نDVمنتیVDمنآستانه های بهینه انتخاب شده برای تولید زیرمنطقه ها هستند.

سه آستانه NDVI بهینه (NDVI 0 برای محاسبه TVDI استفاده شد، و هر دو NDVI ATI و NDVI TVDI برای تقسیم کل CLP) با بهترین نتایج اعتبارسنجی زیرمنطقه‌ها برای دوره‌های 8 روزه شناسایی شدند. برای ارزیابی عملکرد مدل‌ها بر روی CLP، r پیرسون و میانگین خطای مطلق (MAE) RSM مرجع در برابر مشاهدات RSM درجا (در مقیاس‌های ماهانه، فصلی و سالانه) محاسبه شد. r و MAE به ترتیب از 0.47 در اکتبر تا 0.68 در ژانویه و از 3.02% در مارس تا 4.97% در اکتبر در مقیاس ماهانه متغیر بود ( جدول A1 ) [ 32]. از آنجایی که r RSM مرجع و مشاهدات RSM درجا دارای ضریب همبستگی متوسطی بود (73/0 = r برای مقیاس سالانه) [ 85 ]، RSM مرجع به عنوان RSM واقعی با پوشش فضایی بزرگتر از مشاهدات RSM درجا در نظر گرفته شد. RSM مرجع روند بهتری را با RSM مشاهده شده در محل در مقیاس ایستگاه حفظ کرد. مساحت RSM مرجع طی پنج ماه (آوریل، می، جولای، آگوست و اکتبر) کمتر از نیمی از کل منطقه مورد مطالعه (~32 × 10 km2 ) بود ( جدول A1 ). بنابراین، روش SMLR برای بهبود پوشش فضایی RSM قبلا منتشر شده ما بر اساس RSM مرجع و داده‌های چند منبعی استفاده شد.

3.2. متغیرهای کاندید

در مجموع 17 ویژگی (12 متغیر کمی و پنج متغیر طبقه‌بندی)، از جمله ویژگی‌های مشتق شده از MODIS، ویژگی‌های توپوگرافی، ویژگی‌های خاک، و ویژگی‌های هواشناسی، به عنوان متغیرهای کاندید برای مدل‌سازی RSM با استفاده از SMLR انتخاب شدند. این متغیرهای کاندید در مطالعه ما برای تخمین RSM در مطالعات قبلی [ 18 ، 34 ، 39 ، 40 ] استفاده شد. برای دقیق تر بودن، 12 متغیر کمی شامل LST در روز (DL) [ 18 ، 40 ]، LST شبانه (NL)، تفاوت های روزانه در LST (DIL)، تبخیر و تعرق (ET) [ 18 ، 38 ، 39 ] بود.]، شاخص پوشش گیاهی افزایش یافته (EVI)، شاخص پوشش گیاهی تفاوت (DVI)، شاخص نسبت پوشش گیاهی (RVI)، شاخص گیاهی تفاوت نرمال شده (NDVI) [ 34 ]، شاخص پوشش گیاهی افزایش یافته 2 (EVI2)، شاخص پوشش گیاهی اصلاح شده با خاک (MSAVI) )، بارش (PRE) [ 38 ، 39 ]، و رطوبت نسبی (RH) [ 86 ]. علاوه بر این، متغیرهای طبقه بندی شامل پوشش زمین (LC) [ 36 ]، ارتفاع (DEM) [ 18 ، 35 ]، شیب شیب (SG)، جنبه شیب (SA)، و بافت خاک (ST) [ 18 ، 34 ، 37 ، 40] که به عنوان متغیرهای ساختگی در معادلات رگرسیون اعلام شدند. متغیرهای مورد استفاده در این مطالعه در جدول 1 توضیح داده شده است ( برای محاسبه شاخص های پوشش گیاهی به جدول A2 مراجعه کنید).
متغیر ساختگی یک متغیر مصنوعی است که برای نشان دادن یک ویژگی با دو یا چند سطح/رده مجزا ایجاد می‌شود [ 87 ، 88 ]. برای جلوگیری از دام متغیر ساختگی (سناریویی که در آن متغیرهای مستقل همخط هستند)، یک متغیر ساختگی کمتر (n-1) نسبت به مقادیر طبقه‌بندی (n) استفاده شد [ 89 ]. بنابراین متغیرهای ساختگی شامل ارتفاع (هفت دسته و شش متغیر ساختگی)، پوشش زمین (سه دسته و دو متغیر ساختگی)، جنبه شیب (چهار دسته و سه متغیر ساختگی)، شیب شیب (شش دسته و پنج متغیر ساختگی) و در این تحقیق از بافت خاک (هفت دسته و شش متغیر ساختگی) استفاده شد. الگوی فضایی RSM مرجع سالانه و 17 ویژگی در شکل 2 نشان داده شده است. پیش پردازش دقیق از ویژگی ها به متغیرهای کاندید در بخش بعدی آورده شده است.

3.2.1. داده های MODIS

شاخص‌های LST و پوشش گیاهی دو پارامتر مهم هستند که با RSM مرتبط هستند و اغلب در تخمین‌های RSM استفاده می‌شوند [ 90 ]. محصول LST ترکیبی 8 روزه 1 کیلومتری (MOD11A2)، محصول 8 روزه تبخیر و تعرق 500 متری (ET) (MOD16A2)، محصول انعکاس سطحی 500 متری 8 روزه (MOD09A1) و محصول سالانه پوشش زمین 500 متری ( MCD12Q1. Type2) سال 2017 برای توسعه متغیرهای DL، NL، ET، LC و شش شاخص پوشش گیاهی استفاده شد. داده های MODIS استفاده شده از وب سایت سطح 1 و بایگانی و سیستم توزیع جو (LAADS) مرکز بایگانی توزیع شده (DAAC) [ 91 ] دانلود شد.]. به منظور تسهیل استفاده از محصولات MODIS، همه پیکسل ها برای تضمین کیفیت بر اساس محدوده معتبر قبل از محاسبات بیشتر پردازش شدند. محصولات LST، از جمله DL و NL، به وضوح 500 متر (رزولوشن RSM مرجع) نمونه برداری شدند و برای محاسبه تفاوت های روزانه در LST (DIL = DL – NL) [ 18 ، 40 ] انتخاب شدند. هنگامی که DL کمتر از 0 درجه سانتیگراد بود، پیکسل ها پوشانده شدند که نشان دهنده پوشش برف یا خاک یخ زده در آن زمان و مکان است. روابط مثبت قوی بین RSM و شاخص پوشش گیاهی (به عنوان مثال، NDVI) برای استرالیا [ 92 ]، چمنزارهای علف بلند در ایالات متحده [ 93 ، 94 ]، زمین های زراعی در شمال چین [ 95 ] و شرق آفریقا [ 96 ] یافت شد.]. محصولات بازتاب سطحی (شامل هفت باند) برای محاسبه پنج شاخص پوشش گیاهی انتخاب شدند: EVI، DVI، RVI، NDVI، EVI2 و MSAVI [ 34 ]. داده های ماهانه، فصلی و سالانه اعمال شده برای مدل سازی توسط این محصولات کامپوزیت 8 روزه ترکیب شدند.
تأثیرات پوشش زمین بر RSM پیچیده است [ 36 ، 37 ]. طبق MCD12Q1. نوع 2 از طرح طبقه بندی پوشش زمین دانشگاه مریلند (UMD) (با 16 نوع پوشش مختلف) [ 97 ]، داده های پوشش زمین در اینجا به سه دسته، یعنی زمین های زراعی، جنگلی، و بوته زارها و همچنین سایر پوشش های زمین در منطقه مورد مطالعه ( جدول 2 ). با توجه به متغیر پوشش زمین (متغیر طبقه ای)، با سایر پوشش های زمین به عنوان مرجع (ردیف در زمینه رنگ نارنجی در جدول 2 )، دو نوع پوشش زمین باقی مانده (LC1 و LC2، ردیف هایی در زمینه سبز رنگ در جدول 2) به عنوان متغیرهای ساختگی در روش مدل سازی ادغام شدند (فقط با دو مقدار؛ 0 و 1) [ 98 ، 99 ].
3.2.2. داده های توپوگرافی
داده‌های مدل رقومی ارتفاع (DEM) استفاده شد زیرا توزیع RSM و سایر ویژگی‌ها مستقیماً با ارتفاعات مرتبط هستند [ 18 ، 100 ]. مجموعه داده‌های DEM، SG و SA با وضوح فضایی 90 متری ماموریت توپوگرافی رادار شاتل (SRTM) برای منطقه مورد مطالعه از بستر داده‌های مکانی (GDC) ( https://www.gscloud.cn/ ) دانلود شد.، در 11 اکتبر 2020 مشاهده شد) و سپس به وضوح فضایی 500 متر نمونه برداری شدند. این سه ویژگی انتخاب شده به عنوان متغیرهای ساختگی در این مطالعه استفاده شد. DEM در فواصل 500 متری به هفت دسته طبقه بندی شد. با ارتفاعات بیش از 3000 متر به عنوان مرجع، شش دسته ارتفاع باقی مانده به عنوان متغیرهای ساختگی (DEM1، DEM2، DEM3، DEM4، DEM5، و DEM6) در روش مدل سازی ادغام شدند ( جدول 3 ). در مجموع 52% از CLP در رده های ارتفاعی از 1000 تا 1500 متر قرار داشت. شیب شیب، از 0 درجه تا 64.85 درجه نسبت به CLP ( شکل 2 n)، به شش دسته در فواصل 5 درجه طبقه بندی شد. با SG بیش از 25 درجه به عنوان مرجع، پنج دسته SG باقی مانده نیز به عنوان متغیرهای ساختگی (SG1، SG2، SG3، SG4، و SG5) در روش مدل‌سازی ادغام شدند.جدول 3 ).
جنبه شیب (SA) نقش مهمی در توزیع RSM در دامنه تپه ایفا کرد و باید هنگام تلاش برای مشخص کردن تنوع RSM در مناطق آبکندی در نظر گرفته شود [ 101 ]. در اینجا SA به چهار دسته تقسیم شد (نیمه سایه، نیمه آفتابی، سایه و آفتابی، همانطور که در شکل A1 نشان داده شده است ). با استفاده از مقوله آفتابی به عنوان مرجع، سه دسته باقی مانده به عنوان متغیرهای ساختگی (SA1، SA2، و SA3) در روش مدل سازی ادغام شدند ( جدول 4 ).
3.2.3. داده های خواص خاک
RSM به شدت تحت تأثیر بافت خاک (ST) بود [ 102 ، 103 ]. نقشه‌های محتوای ماسه، خاک رس و گل و لای برای منطقه مورد مطالعه توسط مرکز داده‌ها برای منابع و علوم محیطی، آکادمی علوم چین (RESDC، https://www.resdc.cn/ ، قابل دسترسی در 20 اوت 2020) ارائه شده است. ( شکل 3 ). درصد بالای شن و ماسه در منطقه شمال غربی CLP خوشه‌بندی شد، و درصد شن و ماسه کم و درصد سیلت بالا، CLP جنوبی را پوشش داد.
بافت خاک با استفاده از سیستم طبقه بندی بافت خاک وزارت کشاورزی ایالات متحده (USDA) به 12 نوع طبقه بندی شد ( شکل A2 و جدول 5 ). در مجموع هفت طبقه بافتی در CLP شناسایی شد و بیش از نیمی از CLP (51.493٪) توسط لوم شنی پوشانده شد. طبقات بافتی به عنوان متغیرهای ساختگی (ST1، ST2، ST3، ST4، ST5 و ST6) با استفاده از کلاس لوم شنی به عنوان گروه مرجع در روش مدل‌سازی ادغام شدند ( جدول 5 ).
3.2.4. داده های هواشناسی
بارش (PRE)، هم مقدار و هم شدت، محرک اصلی دینامیک SM است [ 104 ، 105 ، 106 ]. PRE و رطوبت نسبی (RH) نیز برای تخمین RSM اعمال شد [ 86 ]. شبکه ایستگاه‌های هواشناسی خودکار در محل مرکز خدمات داده‌های هواشناسی چین (CMDC) ورودی‌های هواشناسی مورد نیاز مدل را ارائه می‌کند: RH و PRE (هر دو به عنوان متغیرهای کمی عمل می‌کنند). RH ساعتی (٪) و PRE (mm) در 298 ایستگاه خودکار هواشناسی ( شکل 1 ) بیش از CLP در سال 2017 ثبت شد [ 107 ]]. در مورد RH، برای یک تطابق زمانی دقیق بین داده‌های مشاهده درجا و RSM مرجع ماهانه (تولید شده با میانگین RSM 8 روزه مربوطه)، زمان کسب روزانه گرانول محصولات MOD09GA به‌عنوان مرجع برای انتخاب مشاهدات RH درجا مربوطه به‌دست آمد. . مقدار RH ماهانه در محل در هر ایستگاه هواشناسی با میانگین RH روزانه محاسبه شد. سپس، روش وزن‌دهی معکوس فاصله‌ای (IDW) برای بیان الگوهای فضایی RH در وضوح 500 متر استفاده شد [ 108 ]. همین روش برای نقشه های فصلی و سالانه RH انجام شد ( شکل 2 ج). میانگین RH سالانه بیش از CLP در سال 2017 از 34.15٪ تا 66.88٪ بود.
با توجه به PRE، PRE روزانه با مقادیر تجمعی نیز به قطعنامه های زمانی ماهانه، فصلی و سالانه تغییر مقیاس داده شد. پس از درونیابی با وزن دهی معکوس فاصله، نقشه های PRE ماهانه، فصلی و سالانه تولید شد [ 18 ، 109 ]. حداکثر و حداقل کل PRE سالانه در سال 2017 به ترتیب 1020.15 میلی متر و 99.80 میلی متر بود ( شکل 2 ب). به نظر می رسد هر دو PRE و RH به تدریج از جنوب شرقی به شمال غربی در حال کاهش هستند و سال 2017 یک سال معمولی از دیدگاه آب و هوا بود [ 110 ، 111 ].

3.3. مدلسازی رگرسیون چند خطی گام به گام

نمونه های کالیبراسیون برای هر دوره ابتدا برای ساخت مدل های رگرسیون چند خطی گام به گام (SMLR) استفاده شد. همانطور که در شکل 1 ارائه کردیم ، 7814 نمونه کالیبراسیون و 7824 نمونه اعتبار سنجی در فواصل 10 کیلومتری انتخاب شدند در حالی که فاصله بین نمونه های کالیبراسیون و اعتبار سنجی مجاور 5 کیلومتر بود. جدول 6 نمونه های مختلف مورد استفاده برای کالیبراسیون و اعتبار سنجی را با توجه به مناطق RSM مختلف برای هر دوره نشان می دهد. مرحله بعدی تعیین مجموعه واقعی متغیرهای مورد استفاده از 34 متغیر کاندید (12 متغیر کمی و 22 متغیر ساختگی) در رگرسیون نهایی است. SMLR به طور معمول برای یافتن متغیرهای مهم استفاده می شود در حالی که چند خطی بودن بین متغیرها اغلب عملکرد آن را تضعیف می کند [ 98 ,112 ]. برای انتخاب متغیرهای بدون چند خطی، ابتدا مدل کلی MLR با استفاده از نمونه های کالیبراسیون با 34 متغیر مستقل برای هر دوره (داده های ماهانه، فصلی و سالانه) استفاده شد ( شکل 4 ). مدل MLR شامل یک سری از ضرایب تصحیح تک عاملی است و در این مطالعه، تعاملات (به استثنای متغیرهای تبدیل شده) را بین متغیرها در نظر نمی گیرد. یک MLR را می توان به صورت زیر نشان داد:

γ=β0+∑من=1نβمنایکسمن+ε

جایی که γنشان دهنده متغیر وابسته (RSM مرجع)، و β0و βمننشان دهنده ثابت افست و ضرایب رگرسیون متغیرهای توضیحی مربوطه است ایکسمن، به ترتیب. انحراف بین خروجی های مدل و RSM مرجع نشان دهنده سوگیری مدل است ε.

از آنجایی که احتمالاً همخطی در بین 34 متغیر کاندید وجود دارد، برای بررسی آن از عامل تورم تغییر (VIF) [ 98 ] استفاده شد:

VIF=11-آرمن2

جایی که آرمننشان دهنده ضریب همبستگی بین منمتغیر پیش بینی کننده و بقیه متغیرهای پیش بینی کننده. اگر VIF کمتر از 3 باشد، چند خطی وجود ندارد [ 109 ، 113 ].

اگر VIF از 3 بیشتر شد (که نشان دهنده چند خطی بودن است)، متغیر با بالاترین VIF حذف شد و مدل دوباره ارزیابی شد. سپس متغیرهای کاندید با VIF کمتر از 3 برای مدلسازی SMLR آماده شدند. در تجزیه و تحلیل SMLR، مهم‌ترین یا کم‌اهمیت‌ترین متغیر به طور مکرر به مدل MLR بر اساس اهمیت آماری آن اضافه یا از آن حذف می‌شود [ 98 ]. متغیرهای معنی دار آماری از طریق تکرارهای رگرسیون مستمر در معادله رگرسیون خطی شناسایی شدند ( 05/ 0p < در این مطالعه اعمال شد). این روش می تواند به طور موثر ویژگی های قدرتمندی را برای ساخت یک مدل پیش بینی خوب انتخاب کند و به طور گسترده در زمینه های مختلف استفاده شده است [ 89 , 98 , 99، 114 ]، از جمله تخمین SM [ 34 ، 62 ]. علاوه بر این، اگرچه استراتژی‌های مختلف زیادی برای انتخاب متغیرها برای مدل رگرسیونی وجود دارد، اما اگر بیش از پانزده متغیر کاندید وجود نداشته باشد و SMLR می‌تواند برای بیش از پانزده متغیر کاندید استفاده شود، باید از تمام روش‌های رگرسیون ممکن استفاده شود . به این ترتیب، SMLR برای ساخت مدل‌های RSM در این مطالعه مناسب‌تر در نظر گرفته شد.

3.4. ارزیابی دقت

نمونه های اعتبارسنجی (ارائه شده در شکل 1 ب) برای هر دوره برای ارزیابی دقت مدل های SMLR ساخته شده استفاده شد. معیارهای آماری، از جمله ریشه میانگین مربعات خطا (RMSE)، پیرسون r (r)، Adjusted R2 ( Adj. R2 ) ، MAE، و انحراف استاندارد (STD) برای ارزیابی عملکرد شبیه‌سازی محاسبه شد [ 11 ، 116 ] . توافق و درجه پراکندگی بین RSM مدل شده از طریق SMLR و RSM مرجع در اینجا بر اساس این پنج معیار آماری کلاسیک برای هر دوره مورد تجزیه و تحلیل قرار گرفت. معادلات در جدول A3 ارائه شده است. داده‌های RSM مدل‌سازی‌شده، که از داده‌های چند منبعی از طریق روش SMLR در مقیاس‌های ماهانه، فصلی و سالانه استفاده می‌کردند، ارزیابی و با RSM مرجع مقایسه شدند.

4. نتایج

4.1. مدل رگرسیون چند خطی گام به گام

مدل های SMLR با استفاده از متغیرهای انتخاب شده برای شبیه سازی RSM ایجاد شدند. نتایج اجرای SMLR برای ساخت مدل های RSM در جدول 7 ارائه شده است. برای مدل های SMLR، تناسب مدل به طور کلی توسط Adj آن ارزیابی شد. R 2 . در این مورد، مدل‌هایی که برای تخمین RSM توسعه داده شده‌اند، بهترین برازش را با بالاترین Adj دارند. R 2 از 0.912 (یعنی 91.2٪ از تغییرات متغیر وابسته RSM را می توان با تغییر در متغیرهای مستقل توضیح داد) و کمترین RMSE 0.798٪ در زمستان در بین هر چهار فصل در سال 2017. همچنین بهترین برازش مدل نتایج در ماه دسامبر (Adj. R 2 = 0.938 و RMSE = 0.753٪) در بین ماه ها به دست آمد ( جدول A4). معادله رگرسیون خطی کمترین Adj را داشت. R 2 از 0.091 و بالاترین RMSE 4.182٪ در اکتبر. با تمرکز بر رهگیری مدل ها، جدول 7 نشان می دهد که هم رهگیری منفی (در زمستان و پاییز) و هم مثبت (در بهار و تابستان) وجود دارد و مدل رگرسیون سالانه با رهگیری های مثبت (231/125) شناسایی می شود.
واضح است که متغیرهای انتخاب شده و تعداد متغیرهای انتخاب شده برای هر مدل رگرسیون با دوره های ارزیابی شده متفاوت است. جهت ضرایب رگرسیون برای متغیرها در مدل های SMLR ( جدول 7 ) همبستگی مثبت یا منفی بین RSM و متغیرها را نشان می دهد. متغیرهای انتخاب شده با جهت ضرایب رگرسیون در مدل ها در مقیاس های ماهانه، فصلی و سالانه در شکل 5 و شکل A3 نشان داده شده است. در مجموع، 12 متغیر کمی و پنج متغیر طبقه‌ای (با 22 متغیر ساختگی) در این مطالعه استفاده شد. از بین این 34 متغیر کاندید، 27 متغیر برای مدل های ماهانه انتخاب شدند.
جالب توجه است که جهت ضرایب رگرسیون برای یک متغیر فردی ثابت نبود. به عنوان مثال، متغیر PRE (در شکل A3 با ستاره های آبی نشان داده شده است). یک همبستگی مثبت با RSM در ماه های مارس، ژوئن، اوت و نوامبر، اما جهت منفی ضرایب رگرسیون در جولای، سپتامبر، اکتبر و دسامبر یافت شد. علاوه بر این، متغیرهای انتخابی ST1، ST3 و DIL نیز در مدل‌های رگرسیونی برای دوره‌ها جهت یکسانی را حفظ کردند.
تعداد متغیرهای انتخاب شده برای مدل‌سازی در مقیاس‌های فصلی و سالانه (23 متغیر منتخب) اندکی کمتر از مقیاس ماهانه (27 متغیر منتخب) بود. متغیرهای PRE با ضرایب رگرسیون مثبت (به جز در فصل زمستان)، DEM1 (ارتفاع 0-500 متر با ضرایب رگرسیون مثبت) برای شبیه‌سازی RSM در مدل‌های رگرسیون فصلی و سالانه استفاده شد. با تمرکز بر مدل رگرسیون سالانه، 17 متغیر منتخب DVI، PRE، DEM1، DEM2، DEM4، DEM5، DEM6، LC1، LC2، SG3، SG4، ST1 و ST3 همبستگی مثبت و DL، NL، ST4، ST5، همبستگی مثبت داشتند. همبستگی منفی داشتند و برای شبیه سازی RSM استفاده شدند. از میان پنج متغیر طبقه بندی شده (ارتفاع، شیب شیب، جهت شیب، پوشش زمین و بافت خاک)،
برای شناسایی سهم متغیرهای ساختگی در مدل های SMLR، SMLR بدون متغیرهای ساختگی در مقیاس های فصلی و سالانه انجام شد و جدول 8 نتایج مقایسه را نشان می دهد. همانطور که انتظار می رفت، شامل متغیرهای ساختگی، تناسب مدل را در کالیبراسیون و همچنین در اعتبار سنجی بهبود بخشید، زیرا تقریباً همه دوره‌ها (به جز تابستان) Adj. R2 با متغیرهای ساختگی بالاتر از آنهایی بود که متغیرهای ساختگی نداشتند. این ممکن است به دقت پایین RSM مرجع در آن زمان کمک کند. همچنین ممکن است که سایر متغیرهای عددی انتخاب شده، مانند بارش، اثرات قابل توجهی بر تغییرات RSM داشته باشند، در حالی که به نظر می رسد متغیرهای ساختگی در کل تأثیر نسبتاً ضعیفی دارند.

4.2. ارزیابی دقت

شکل 6 نتایج ارزیابی مدل های RSM را در مقیاس های زمانی فصلی و سالانه نشان می دهد. بالاترین r 0.955 و Adj. R2 از 0.912 و کمترین STD 0.770٪، RMSE 0.809 ٪ و MAE 0.622٪ در زمستان یافت شد ( شکل 6 a). نتیجه اعتبار سنجی سالانه با یک ضریب همبستگی نسبتاً بالا (r > 0.75) و خطای کم (RMSE = 1.725٪) در زیر مجموعه در نظر گرفته شده از 7493 نمونه مشخص شد ( شکل 6 e).
اعتبار سنجی مدل با مجموعه داده های نمونه موجود در مقیاس ماهانه در شکل A4 ارائه شده است . لازم به ذکر است که شش ماه (دسامبر، ژانویه، فوریه، آوریل، می و نوامبر) با Adj. R 2 بیش از 0.800 در سال 2017 و خطاهای نسبتاً کم (RMSE) مدل ها در طول فصل زمستان (دسامبر، ژانویه و فوریه)، از 0.761٪ تا 1.050٪. نکته مهم این است که تمام برازش‌ها و شیب‌های برازش خطی به RSM مدل‌سازی شده بین 0 و 1 بودند که نشان‌دهنده تخمین بیش از حد مدل در منطقه RSM پایین و دست‌کم گرفتن مدل در منطقه RSM بالاتر است.

4.3. رطوبت خاک مدل شده

شکل 7 الگوهای فضایی RSM فصلی و سالانه را بر روی CLP نشان می دهد. رنگ های متفاوت از قرمز تا آبی نشان دهنده تغییر RSM از پایین ترین (یعنی خشک ترین خاک) به بالاترین (یعنی مرطوب ترین خاک) است. به طور کلی، توزیع مکانی و زمانی RSM مدل‌سازی شده از طریق مدل SMLR همان الگوی RSM مرجع بود. RSM به تدریج از جنوب شرقی به شمال غربی کاهش یافت و نشان دهنده یک الگوی توزیع فضایی کلی “مرطوب در جنوب و جنوب شرق، خشک در شمال غرب” بود. چنین تغییراتی در نقشه‌های سالانه PRE، RH، NL و ET نیز نمایش داده شد ( شکل 2)). مناطق با RSM پایین (یعنی زیر 10٪) عمدتاً در منطقه شمال غربی CLP قرار گرفتند. این مناطق دارای آب و هوای معتدل قاره ای، با بارندگی کم، RH کم، نور شدید روز، نسبت بالایی از محتوای شن و ET کم به دلیل پوشش گیاهی کم هستند. RSM در منطقه غربی CLP (با بالاترین ارتفاع) در بهار و تابستان بالاتر بود. میانگین RSM مدل شده بیشترین (899/13 درصد) در پاییز و کمترین (276/10 درصد) در زمستان بود ( شکل 7 ). میانگین سالانه مدل RSM (12.158٪) ( شکل 7 e)، مدل سازی شده از طریق مدل SMLR، بالاتر از RSM مرجع (10.160٪) بود.
نقشه های ماهانه RSM از داده های چندمنبعی مدل سازی شده از طریق مدل های SMLR در شکل A5 نشان داده شده است. در مقایسه با RSM مرجع ماهانه، بهبود قابل توجهی در پوشش فضایی RSM مدل‌سازی شده از طریق مدل SMLR حاصل شد. مساحت RSM مدل شده 10 ماهه (به استثنای ژانویه و فوریه) بزرگتر از RSM مرجع در سال 2017 بود. برای دقیق تر، مساحت RSM مدل سازی شده در طول پنج ماه بیش از دو برابر افزایش یافت (آوریل: 142.082%). می: 113.209٪، جولای: 149.955٪، آگوست: 115.120٪، و اکتبر: 243.008٪ و مساحت افزایش یافته RSM مدل شده از 1.020 × 10 4 کیلومتر مربع در دسامبر تا 44.519 × 10 4 کیلومتر مربع در اکتبر متغیر بود.

5. بحث

با توجه به نتایج برازش مدل، بالاترین Adj. R2 از 0.912 ، هم در کالیبراسیون و هم در اعتبار، در زمستان پیدا شد. بر این اساس، مدل‌های رگرسیون در دسامبر، ژانویه و فوریه عملکرد بسیار بهتری را در مقایسه با ماه‌های دیگر نشان دادند (Adj. R 2 از 0.853 تا 0.939 در اعتبارسنجی متغیر بود). این نتایج بهتر از نتایج بدست آمده توسط لی و همکاران بود. [ 57 ] که از MLR برای کره جنوبی استفاده کردند (که در آن R 2 از 0.17 تا 0.63 متغیر بود). معادله رگرسیون خطی کمترین Adj را داشت. R 2 از 0.091 در اکتبر (Adj. R 2از 0.073 در اعتبار) که عمدتاً نتیجه کیفیت پایین RSM مرجع با کمترین r 0.47 در برابر مشاهدات RSM درجا در بین ماه‌ها بود [ 32]. به طور مشابه، نتایج اعتبارسنجی برای پاییز (زمستان) به طور قابل توجهی کمتر (بالاتر) از سایرین بود. نتایج مدل‌سازی‌شده با استفاده از SMLR بسیار با کیفیت داده‌های ورودی، به‌ویژه RSM مرجعی که قبلا منتشر کردیم، مرتبط بود. RSM مرجع در پاییز بیشترین خطا را داشت و بالاترین r پیرسون را در زمستان در بین چهار فصل داشت. این ممکن است دلیلی برای نتایج اعتبارسنجی مشابه در مطالعه فعلی در نظر گرفته شود. برای کشف دلیل یا تخمین دقیق SM، می توان مدل بهتری را از طریق کارهای آینده توسعه داد. بنابراین، عملکرد مدل SMLR به کیفیت داده‌های مرجع حساس بود.
برای متغیرهای فردی، جهت ضرایب رگرسیون در معادلات رگرسیون بین دوره‌ها متفاوت است. از نظر تئوری، متغیرهای بارش و RSM باید یک همبستگی مثبت داشته باشند زمانی که فقط بارش به عنوان یک متغیر مستقل در نظر گرفته شود. با این حال، در یک منطقه خشک، RSM اغلب پس از یک باران شدیدتر به بالاترین مقدار خود می رسد. اگر چند رویداد کوچک باران به جای آن اتفاق بیفتد، RSM در عمق 20 سانتی متری افزایش نمی یابد و حتی کاهش می یابد، زیرا تحت تأثیر متغیرهای دیگر (مثلاً دما) در پوشش های زمینی خاص قرار می گیرد [ 37 ]]. علاوه بر این، متغیرهای زیادی در مدل‌های رگرسیونی انتخاب شدند که تأثیرات تغییر بارش بر RSM (حتی تأثیر منفی) را در مقایسه با متغیرهای با تأثیر مثبت قوی تضعیف کردند. با این حال، تفسیر هر متغیر در مدل‌ها پیچیده است و روابط خاص بین متغیرها و RSM در این مطالعه بررسی نشده است، اما تأثیر آنها مستحق مطالعه بیشتر است. از مدل‌سازی، شایان ذکر است که متغیرهایی مانند ST1، ST3 و DIL، جهت‌های یکسانی را در مدل‌های رگرسیون در طول دوره حفظ کردند. این نشان می‌دهد که این متغیرها یک همبستگی پایدار با RSM نشان می‌دهند و حتی زمانی که متغیرهای دیگر تغییر می‌کنند، تأثیر خود را حفظ می‌کنند [ 70 ].
متغیرهای ساختگی مانند LC1 (11 ماه به جز مرداد) و ST5 (9 ماه) در مدل های رگرسیون در بین ماه ها فراوانی کاربرد بالایی داشتند. این نشان می دهد که پس از در نظر گرفتن اثرات سایر متغیرها، این متغیرهای ساختگی می توانند بیشتر یا کمتر (به ترتیب نشان دهنده اثر مثبت یا منفی، با توجه به جهت های ضریب متناظر در مدل ها) از متغیر وابسته RSM باشند. به طور خاص، پوشش اراضی زمین‌های زراعی در مدل رگرسیون سالانه ( جدول 7 ) در مدل‌سازی RSM، 0.632 امتیاز بالاتر از گروه‌های مرجع (یعنی سایر پوشش‌های زمین) کسب کرد. به طور کلی، متغیرهای کمی یا طبقه‌ای در مدل‌های رگرسیون اغلب اثرات متقابلی با یکدیگر داشتند [ 89 ]]. در مطالعه حاضر، مدل‌های رگرسیون امکان وقوع تعامل بین متغیرها را فراهم نمی‌کنند (هیچ عبارت تعاملی در مدل‌های رگرسیونی وجود ندارد). بنابراین، ضریب رگرسیون برای هر متغیر می تواند به صورت جداگانه به عنوان یک متغیر وابسته (RSM) معنی دار آماری ( p -value <0.05) تفسیر شود. چندین محقق گزارش کردند که تعداد و موقعیت متغیرهای ساختگی بر میزان برازش و دقت تخمین مدل های حاصل تأثیر می گذارد [ 68 ، 117 ، 118 ]. چن و همکاران دریافت که مدل متغیر ساختگی در توانایی تخمین زیست توده منطقه ای تفاوتی ندارد [ 119 ].
الگوی فضایی کلی RSM مدل شده (با RSM بالا در مناطق جنوبی و RSM پایین در مناطق شمال غربی CLP در طول دوره) از طریق SMLR با مطالعات قبلی مطابقت خوبی داشت [ 11 ، 32 ، 120 ]. در مورد میانگین RSM، میانگین RSM مدل شده 12 ماهه 13.114٪ بود که کمی بیشتر از RSM مرجع (12.155٪) [ 32 ] بود.]. با توجه به تخمین بیش از حد منطقه خشک و دست کم برآورد منطقه مرطوب، این ممکن است تا حدی به تخمین بیش از حد یا دست کم گرفتن برخی از متغیرهای انتخاب شده نسبت داده شود. مطالعه حاضر چنین عدم قطعیت پارامتری را در نظر نگرفت که به عنوان محدودیت این مطالعه در نظر گرفته شد. علاوه بر این، مساحت RSM مدل‌سازی‌شده در ژانویه و فوریه کوچک‌تر (برای سایر دوره‌ها بزرگ‌تر) از RSM مرجع بود. هر یک از متغیرهای انتخاب شده در مدل های رگرسیونی (یعنی مقدار و توزیع) مورد تجزیه و تحلیل قرار گرفت که نشان داد این متغیر با متغیر انتخابی ET مرتبط است. مناطق کوچکتر RSM مدل شده در ژانویه و فوریه توسط نقشه های ET ایجاد شد که در آن زمان هنوز ناقص بودند. با در نظر گرفتن ژانویه به عنوان مثال، مناطق ET و RSM مدل شده 43.236 × 10 4 بود.کیلومتر 2 و 42.695 × 10 4 کیلومتر مربع ، به ترتیب ( شکل 8 ). ناحیه با RSM مدل‌سازی شده، همانطور که در شکل 8c نشان داده شده است ، دارای مقدار ET نیز بود و مساحت 0.541 × 10 4 کیلومتر مربع با ET اما بدون مقدار RSM باید با سایر متغیرهای غیرقابل دسترس (مثلاً DL) در آن زمان مرتبط باشد. . پیکسل‌های با DL زیر 0 درجه سانتیگراد برای جلوگیری از یخ زدگی در زمستان حذف شدند [ 104 ]. بنابراین، محدودیت مدل SMLR، تا حدی ممکن است این واقعیت باشد که در دسترس بودن متغیرهای مستقل به طور مستقیم بر پوشش RSM مدل‌سازی شده تأثیر می‌گذارد.
با توجه به نتایج اعتبارسنجی، به مدت شش ماه (دسامبر، ژانویه، فوریه، آوریل، می و نوامبر)، Adj. R 2 در سال 2017 از 0.800 فراتر رفت. این نتایج اثربخشی روش SMLR را در طول سال در منطقه مورد مطالعه ثابت کرد [ 67 ، 69 ]. این نشان می دهد که روش SMLR یک رویکرد امیدوارکننده برای تخمین RSM است. برای بازیابی RSM در هر ناحیه و دوره با استفاده از روش SMLR، متغیرها و ضرایب انتخابی این متغیرها تنها نیاز به به روز رسانی دارند. از نقطه نظر عملی، این یک یافته قابل توجه است، زیرا از استفاده از داده های چند منبعی برای تکمیل و/یا جایگزینی تصاویر ماهواره ای با وضوح درشت در شبیه سازی RSM پشتیبانی می کند.
با این حال، روش های مورد استفاده در مطالعه حاضر باعث عدم قطعیت می شود. تنها 17 ویژگی به دلیل محدودیت‌های داده‌ها و پارامترهای هیدرولوژیکی (مانند رواناب و فعالیت‌های آبیاری)، و سایر ویژگی‌های خاک (به عنوان مثال، تخلخل خاک، چگالی ظاهری و مواد آلی خاک) نادیده گرفته شدند، زیرا به‌دست آوردن آنها دشوار بود. هیچ تضمینی وجود ندارد که اگر متغیرهای بیشتری جمع‌آوری شوند، نتایج مدل‌سازی بهتر می‌شوند. هنگامی که یک متغیر جدید اضافه می شود، به دلیل مسئله چند خطی بودن و سطح معنی داری، می توان متغیرهای خاصی را حذف کرد. برای مناطقی که در دسترس بودن متغیرهای ورودی محدود است، ساده ترین مدل، که شامل بافت خاک و کربن آلی است، ممکن است جایگزینی برای تخمین میزان دسترسی به آب در خاک باشد [ 58 ].]. علاوه بر این، از آنجایی که عملکرد مدل SMLR به کیفیت داده های مرجع و همچنین داده های ورودی حساس بود، مطالعه با دقت RSM مرجع استفاده شده محدود شد. علاوه بر این، کیفیت خوب هر پیکسل برای ورودی ها، دقت RSM مدل شده را بهبود می بخشد. ورودی‌های MODIS (به جز پوشش زمین) داده‌های ترکیبی در هر دوره 8 روزه بودند و می‌توانستند تحت تأثیر ابرها یا تداخل جوی قرار گیرند. علاوه بر اطمینان از هر پیکسل در محدوده معتبر، روش های کنترل کیفیت باید برای هر مجموعه داده با استفاده از پرچم های کیفیت در مطالعات آینده انجام شود [ 121 ، 122 ].

6. نتیجه گیری

بر اساس RSM مرجع (رطوبت نسبی خاک (به دست آمده در مطالعه قبلی))، 34 متغیر کاندید (12 متغیر کمی و 22 متغیر ساختگی) از داده‌های چند منبعی، از جمله طیف‌سنجی تصویربرداری با وضوح متوسط ​​(MODIS) و داده‌های توپوگرافی، داده‌های خصوصیات خاک، و داده‌های هواشناسی از طریق رگرسیون چند خطی گام به گام (SMLR) پردازش و مدل‌سازی شدند. پس از ارزیابی دقت، الگوهای فضایی ماهانه، فصلی و سالانه RSM مدل‌سازی شده در سال 2017 بر روی فلات لس چین (CLP) نقشه‌برداری و ارزیابی شدند. یافته‌های کلیدی و نتیجه‌گیری‌های اصلی در موارد زیر خلاصه می‌شوند:
  • SMLR می تواند RSM را با دقت مورد نظر (r = 0.969، RMSE = 0.761٪، MAE = 0.576٪ در دسامبر) در وضوح 500 متر بر روی CLP مدل کند. علاوه بر این، استفاده از داده‌های چند منبعی برای تکمیل و/یا جایگزینی داده‌های ماهواره‌ای با وضوح درشت در مدل‌سازی RSM می‌تواند در نظر گرفته شود.
  • متغیرهای ارتفاع (0-500 متر و 2000-2500 متر)، بارش، بافت خاک لوم، و دمای سطح زمین در شب می توانند به طور مداوم در مدل های رگرسیونی برای تمام فصول سال 2017 استفاده شوند.
  • گنجاندن متغیرهای ساختگی برازش مدل را هم در کالیبراسیون و هم در اعتبارسنجی بهبود می بخشد، زیرا Adj. R 2 با متغیرهای ساختگی بالاتر از بدون بود.
  • RSM مدل‌سازی شده با SMLR تقریباً برای همه دوره‌ها به جز ژانویه و فوریه (به دلیل در دسترس نبودن داده‌های ET در آن زمان) پوشش فضایی بهتری نسبت به RSM مرجع به دست آورد. بنابراین، در دسترس بودن متغیرهای انتخاب شده به طور مستقیم بر پوشش RSM مدل شده تأثیر می گذارد.
RSM مدل‌سازی‌شده با SMLR با موفقیت تغییرپذیری مکانی – زمانی RSM را مشخص کرد و به خوبی با RSM مرجع مطابقت داشت. نقشه های RSM مدل سازی شده تولید شده در این مطالعه برای مطالعه بیشتر امکان پذیر است و می تواند به عنوان داده های SM درجا در نظر گرفته شود. مطالعات بیشتر و اعتبارسنجی مدل‌های SMLR ارائه‌شده توصیه می‌شود، که می‌توان با گسترش تحقیقات به سایر مجموعه‌های داده، حوزه‌های آزمایشی و دوره‌های داده به دست آورد.

پیوست اول

شکل A1. نمودار شماتیک چهار جهت جنبه های شیب (اقتباس از [ 123 ]). با توجه به شدت تابش خورشیدی، جنبه های شیب (0°-360°) در نیمکره شمالی به سایه (0°-45° و 315°-360°)، نیمه سایه (45°-90°) تقسیم شدند. جهت 270°-315°، آفتابی (135°-225°) و نیمه آفتابی (90°-135° و 225°-270°).
شکل A2. نمودار طبقه‌بندی مثلثی بافت خاک که برای طبقه‌بندی ویژگی‌های خاک استفاده می‌شود (اقتباس از شکل ارائه‌شده توسط وزارت کشاورزی ایالات متحده (USDA) در https://www.usda.gov/ ، مشاهده شده در 21 سپتامبر 2020). خواص خاک از طریق ترکیب خاک (یعنی درصد شن، سیلت و رس) تعیین می شود. مجموع درصد شن، سیلت و رس برابر با 100 درصد است. گوشه های مثلث نشان دهنده 100٪ از هر ترکیب است و 12 طبقه بافتی خاک در داخل مثلث با استفاده از خطوط ضخیم به عنوان جداسازی بین طبقات مشخص شده است. بافت‌های خاک روی CLP به رنگ سیاه پررنگ (هفت کلاس بافتی) فرم‌بندی می‌شوند و بافت‌های خاک که با خاکستری پررنگ نشان داده شده‌اند در منطقه مورد مطالعه ظاهر نمی‌شوند.
شکل A3. متغیرهای انتخاب شده برای مدل سازی در مقیاس ماهانه. برچسب های بالا و پایین 0 به ترتیب نشان دهنده جهت های مثبت و منفی ضرایب رگرسیون برای متغیرهای انتخاب شده در مدل های رگرسیونی است.
شکل A4. اعتبارسنجی مدل (مدل سازی RSM توسط SMLR در مقایسه با RSM مرجع) در زیر مجموعه انتخاب شده در مقیاس زمانی ماهانه. امتیازات (ضریب همبستگی پیرسون (r)، R2 تعدیل شده ( Adj. R2 ) ، انحراف معیار (STD)، ریشه میانگین مربعات خطا (RMSE) و میانگین خطای مطلق (MAE)) با استفاده از داده های موجود در طرح فرعی مربوطه محاسبه شد. مرز N تعداد نمونه های RSM موجود برای هر ماه را نشان می دهد. مقادیر p مرتبط (در نمودارهای فرعی) با ضرایب همبستگی همه <0.001 هستند. رنگ های RSM مدل شده و تناسب خطی صورتی، سبز روشن، سبز تیره و نارنجی هستند که به ترتیب زمستان، بهار، تابستان و پاییز را نشان می دهند.
شکل A5. الگوی فضایی RSM ماهانه با استفاده از SMLR بر روی CLP در سال 2017 مدل‌سازی شد. مساحت RSM مدل‌سازی شده و میانگین RSM برای هر ماه محاسبه شد. رنگ سفید برای هر نقشه ماهانه RSM به معنای عدم تخمین مقدار RSM از طریق روش SMLR است (عدد داخل پرانتز مناطق RSM را بر حسب درصد در برابر کل منطقه برای هر زیرشکل نشان می دهد).

بدون دیدگاه

دیدگاهتان را بنویسید