1. مقدمه
رطوبت خاک (SM) به طور گسترده ای به عنوان یک متغیر حیاتی سطح زمین شناخته می شود که با تعامل زمین و جو [
1 ،
2 ]، فرآیندهای بارش-رواناب [
3 ]، تعادل آب-انرژی [
4 ] و تغییرات آب و هوا [
5 ] مرتبط است. توصیف دقیق SM برای کاربردهایی مانند مدلسازی آب و هوا و آب و هوا، مدیریت کشاورزی و منابع آب در گسترههای فضایی بزرگتر مفید است [
6 ]. برآورد دقیق و به موقع SM در مقیاس مکانی و زمانی مربوط، یک استراتژی مناسب برای پیشبینی خشکسالی/سیل [
7 ،
8 ] و برنامهریزی آبیاری است [
9 ،
10 ]] برای پایداری و بهره وری کشاورزی، به ویژه در مناطق خشک و نیمه خشک مانند فلات لس چین (CLP).
دادههای سنجش از راه دور مختلف، که تقریباً تمام مناطق طیف الکترومغناطیسی از باندهای مایکروویو تا مرئی را در بر میگیرد، از دهه 1970 برای بازیابی SM استفاده شده است [
11 ،
12 ،
13 ،
14 ]. به منظور به دست آوردن نقشه های مکانی-زمانی SM، انواع روش ها و تکنیک های تخمین SM نیز پیشنهاد شده است [
6 ]. با این حال، حسگرهای مایکروویو (فعال و غیرفعال) به دلیل قدرت تفکیک فضایی درشت خود (چند ده کیلومتر) نمی توانند SM را به خوبی در مقیاس محلی و منطقه ای نظارت کنند [
12 ،
15 ،
16 ]]. سیستمهای رادار دیافراگم مصنوعی (SAR) وضوح فضایی بهتری را برای بازیابی SM ارائه میدهند اما با زمان بازبینی طولانی. علاوه بر این، بازیابی SM از SAR و حسگرهای مایکروویو تا حد زیادی تحت تأثیر زبری سطح خاک، پوشش گیاهی و سایر عوامل مرتبط است [
17 ]. شبیهسازیهای عددی، شامل استفاده از ویژگیهای سطح زمین بازیابی شده توسط نوارهای مرئی/نزدیک مادون قرمز/مادون قرمز حرارتی (به عنوان مثال، پوشش گیاهی، دمای سطح زمین (LST) و albedo سطح)، مدتهاست که روشهای اولیه برای به دست آوردن مقیاس بزرگ بودهاند. اس ام این روش ها بر اساس داده های طیف رادیومتر تصویربرداری با وضوح متوسط (MODIS) و مدل های سطح زمین [
2 ،
18 ،
19 ] هستند.]. با این حال، مشکل اصلی مرتبط با این روش این است که حسگرهای نوری نمی توانند به ابرها و پوشش گیاهی نفوذ کنند، که به شدت بر کیفیت نتایج تخمین SM تأثیر می گذارد [
18 ،
20 ].
یک رویکرد برای به دست آوردن تخمین های دقیق SM با وضوح بالا، تفکیک SM مشتق شده از مایکروویو با استفاده از داده های تفکیک شده با وضوح بالا مانند داده های حرارتی مادون قرمز و مرئی/نزدیک به فروسرخ است [
15 ،
21 ،
22 ،
23 ]. موضوع این نوع روش کاهش مقیاس به دلیل تأثیر عدم قطعیت در دادههای ورودی و کمیاب بودن دادههای زمینی، روش ارزیابی و اعتبارسنجی است [
24 ]. جدای از هم افزایی داده های مختلف [
25 ،
26 ،
27 ،
28 ]، رویکرد دیگر ترکیب روش های تخمین مختلف برای بازیابی SM است [
11 ،
29 ],
30 ,
31 ]. اگرچه یوان و همکاران. برآورد SM بهبود یافته در مورد پوشش مکانی – زمانی برای CLP با استفاده از اینرسی حرارتی ظاهری مشتق از MODIS (ATI) و شاخص خشکی گیاهی دما (TVDI)، پیکسلهای خاصی دارای مقادیر SM نیستند. این منجر به نمایش نقشه های SM ناقص در مقیاس ماهانه [
32 ] شد.
علاوه بر این، تنوع SM تحت تأثیر عوامل مختلف محیطی قرار می گیرد: ویژگی های خاک (به عنوان مثال، بافت خاک و مواد آلی) [
33 ،
34 ] در مقیاس قطعه، توپوگرافی [
35 ] و پوشش زمین [
36 ،
37 ] در سطح محلی. مقیاس، و بارش، تبخیر و تعرق [
38 ،
39 ]، رطوبت نسبی، و دما [
40 ] به دست آمده از داده های هواشناسی در مقیاس منطقه ای [
41 ،
42 ]]. یک رویکرد موثر برای مدلسازی SM با دقت و تفکیک فضایی بالا باید اطلاعات سطح سنجش از دور، دادههای هواشناسی منطقهای، دادههای توپوگرافی و دادههای ویژگیهای خاک را یکپارچه کند [
18 ]. روشهای مبتنی بر داده برای تخمین SM شامل تحلیلهای چند متغیره، شبیهسازی دادهها و تکنیکهای یادگیری ماشینی است [
43 ،
44 ،
45 ]. یک طرح جذب دادههای SM برای شبیهسازی SM دینامیک در مقیاسهای مکانی-زمانی با استفاده از پارامترهای تخمینی خاک و فشار هوا بر اساس یک مدل هیدرولوژیکی است [
46 ،
47 ]. تکنیک یادگیری ماشین از نظر محاسباتی فشرده است (به عنوان مثال، جنگل تصادفی (RF) [
48 ،
49]، شبکه عصبی مصنوعی (ANN) [
50 ،
51 ،
52 ،
53 ]، رگرسیون برداری پشتیبانی (SVR) [
54 ،
55 ،
56 ]، و درختان رگرسیون (RT) [
57 ،
58 ]) و برای ساخت مدل های ریاضی استفاده می شود. بر اساس مجموعه های آموزشی و متغیرهای کمکی برای استخراج اطلاعات SM از داده های موجود [
59 ،
60 ].
تجزیه و تحلیل های چند متغیره، به ویژه تحلیل رگرسیون (رگرسیون چند خطی (MLR) [
61 ]، رگرسیون چند خطی گام به گام (SMLR) [
53 ،
62 ]، رگرسیون فرآیند گاوسی [
63 ،
64 ]، رگرسیون مربع های خطی جزئی [
65 ] رگرسیون چند خطی، و [
66 ]) به طور گسترده برای مدل سازی SM استفاده می شود. در میان این روش ها، MLR، اساسی ترین شکل رگرسیون خطی، یک متغیر وابسته منفرد را از چندین متغیر مستقل پیش بینی می کند. یانگ و همکاران [
67 ] یک مدل MLR برای تخمین SM بر اساس متغیرهای محیطی مشاهده شده (یعنی کاربری زمین، توپوگرافی و هواشناسی) در حوضه آبریز دانانگو (3.5 کیلومتر مربع) انجام داد
.) از CLP. نویسندگان از متغیر کاربری زمین و شاخص های زمین به عنوان متغیرهای ساختگی (یعنی یک متغیر عددی که داده های طبقه بندی شده را نشان می دهد) برای ساخت مدل استفاده کردند [
68 ]، و به این نتیجه رسیدند که مدل SMLR موثرترین و مقرون به صرفه ترین در بین مدل ها بود [
69 ] . SMLR، که اساساً MLR را بارها تکرار میکند، روشی است برای رگرسیون چندین متغیر در حالی که آنهایی را که مهم نیستند حذف میکند [
70 ]. متغیرهایی از جمله روز سال، ارتفاع تاج پوشش، و NDVI با SMLR و ANN کالیبره شدند تا رطوبت سوخت در چمنزار علف بلند [
53 ] برآورد شود. علاوه بر این، متغیرهای طبقه بندی شده مانند پوشش زمین [
36 ]، ارتفاع [
18 ،
35 ]]، شیب شیب، جنبه شیب، و بافت خاک [
18 ،
34 ،
37 ،
40 ] نیز برای مدل سازی SM اعمال می شود. روش SMLR همچنین برای پیشبینی نفوذ آب خاک در دشت سیلآبی خشک شرق ایران [
71 ]، برای تخمین محتوای آب موجود گیاه در خاک غیراشباع استفاده شد [
70 ]. هنگامی که متغیر ریز تخلخل برای تخمین در دسترس بودن آب در خاک گنجانده شد، SMLR (که دارای راندمان محاسباتی و سهولت تفسیر است) در مقایسه با ANN و RT ساده تر بود [
58 ].
با این حال، از منظر تحلیل آماری، اگر حجم نمونه برای اعمال مدل SMLR کافی نباشد، مشکل چالش برانگیزتر است [
72 ،
73 ]. بنابراین، مشاهدات پراکنده SM درجا (به عنوان مثال، تنها 49 مشاهدات SM سالانه موجود) برای در نظر گرفتن SM مرجع برای کل CLP (640000 کیلومتر مربع) مناسب نیستند
[ 32
] . نقشههای SM مرجع ناقص از قبلاً منتشر شده ما، تا حدی، هنوز برای برنامههای خاص در دسترس نبودند. بنابراین، استفاده از روش SMLR بر روی CLP برای تخمین SM، بهترین استفاده ممکن را از همه دادههای جانبی (ترجمه دادههای موجود به دادههای مورد نیاز)، بهویژه دادههایی که نسبتاً ارزان و به راحتی قابل دسترسی هستند، میکند [
58 ]].
هدف از این مطالعه ادغام دادههای چندمنبعی (MODIS و توپوگرافی، ویژگیهای خاک و دادههای هواشناسی) برای مدلسازی رطوبت نسبی خاک (RSM) در تفکیک مکانی 500 متر بر روی فلات لس چین در سال 2017 با رگرسیون چند خطی گام به گام است. SMLR) به منظور بهبود پوشش فضایی RSM قبلا منتشر شده ما. RSM منتشر شده قبلی با استفاده از ATI و TVDI مشتق از MODIS تولید شد و به عنوان داده های RSM مرجع در مطالعه حاضر در نظر گرفته شد. توضیحات مفصل برای تولید RSM مرجع در
بخش 3 ارائه شده است. ابتدا 34 متغیر کاندید (12 متغیر کمی و 22 متغیر ساختگی) پیش پردازش شدند. سپس، SMLR برای متغیرهای بدون همخطی چند خطی برای انتخاب معنی دار آماری اعمال شد (
ص-value < 0.05) متغیرها. مدلهای رگرسیون و دقت RSM مدلسازیشده در مقیاسهای ماهانه، فصلی و سالانه مورد ارزیابی قرار گرفتند. در نهایت، RSM مدلسازیشده برای درک بهتر ویژگیهای مکانی و زمانی RSM مورد تجزیه و تحلیل قرار گرفت.
2. منطقه مطالعه
این منطقه مورد مطالعه فلات CLP-Chinese Loess Plateau (100°54′-114°33′ شرقی و 33°43′-41°16′ شمالی)، شمال غربی چین است که مساحتی به وسعت تقریباً 640000 کیلومتر مربع را
در بر می گیرد و هفت استان را در بر می گیرد. (
شکل 1 الف). این چشم انداز به شدت توسط فرسایش بادی-آبی شکل گرفته و دارای شکل زمینی بسیار شکسته از خندق ها است [
74 ]. میانگین سالانه دما و بارندگی به تدریج از جنوب شرقی (14 درجه سانتی گراد و 750 میلی متر) به سمت شمال غربی (4 درجه سانتی گراد و 200 میلی متر) کاهش می یابد [
75 ]. CLP به دلیل خاک سست و فرسایش پذیر آن به عنوان جدی ترین منظره فرسایش یافته در جهان طبقه بندی شده است [
76 ,
77 ]]. بارندگی کم و متمرکز (میانگین بارندگی سالانه 420 میلی متر است و 55 تا 78 درصد در فصل مرطوب از جولای تا سپتامبر کاهش می یابد) CLP را به ویژه در برابر خشکسالی آسیب پذیر می کند [
78 ]. علاوه بر این، SM بیش از CLP تغییرات فضایی قابل توجهی را به دلیل ویژگی های آب و هوایی و توپوگرافی تکه تکه نشان می دهد [
36 ،
79 ]. بنابراین، برآوردهای کمی SM بیش از CLP از سایر مناطق مهمتر است.
در مطالعه حاضر، برای اطمینان از توزیع یکنواخت نمونههای کالیبراسیون و اعتبارسنجی (بدون همپوشانی)، هر دو 7814 نمونه کالیبراسیون (نقاط قرمز کوچک در
شکل 1 ب) و 7824 نمونه اعتبارسنجی (نقاط آبی کوچک در
شکل 1 ب) انتخاب شدند. فواصل 10 کیلومتری در حالی که فاصله بین نمونه های کالیبراسیون و اعتبار سنجی مجاور 5 کیلومتر بود. در مجموع 298 ایستگاه هواشناسی خودکار چینی (نقاط قرمز بزرگ در
شکل 1 ب) داده های مشاهده بارش ساعتی و رطوبت نسبی هوا را بر روی CLP ارائه کردند.
5. بحث
با توجه به نتایج برازش مدل، بالاترین Adj. R2 از
0.912 ، هم در کالیبراسیون و هم در اعتبار، در زمستان پیدا شد. بر این اساس، مدلهای رگرسیون در دسامبر، ژانویه و فوریه عملکرد بسیار بهتری را در مقایسه با ماههای دیگر نشان دادند (Adj. R
2 از 0.853 تا 0.939 در اعتبارسنجی متغیر بود). این نتایج بهتر از نتایج بدست آمده توسط لی و همکاران بود. [
57 ] که از MLR برای کره جنوبی استفاده کردند (که در آن R
2 از 0.17 تا 0.63 متغیر بود). معادله رگرسیون خطی کمترین Adj را داشت. R
2 از 0.091 در اکتبر (Adj. R
2از 0.073 در اعتبار) که عمدتاً نتیجه کیفیت پایین RSM مرجع با کمترین r 0.47 در برابر مشاهدات RSM درجا در بین ماهها بود [
32]. به طور مشابه، نتایج اعتبارسنجی برای پاییز (زمستان) به طور قابل توجهی کمتر (بالاتر) از سایرین بود. نتایج مدلسازیشده با استفاده از SMLR بسیار با کیفیت دادههای ورودی، بهویژه RSM مرجعی که قبلا منتشر کردیم، مرتبط بود. RSM مرجع در پاییز بیشترین خطا را داشت و بالاترین r پیرسون را در زمستان در بین چهار فصل داشت. این ممکن است دلیلی برای نتایج اعتبارسنجی مشابه در مطالعه فعلی در نظر گرفته شود. برای کشف دلیل یا تخمین دقیق SM، می توان مدل بهتری را از طریق کارهای آینده توسعه داد. بنابراین، عملکرد مدل SMLR به کیفیت دادههای مرجع حساس بود.
برای متغیرهای فردی، جهت ضرایب رگرسیون در معادلات رگرسیون بین دورهها متفاوت است. از نظر تئوری، متغیرهای بارش و RSM باید یک همبستگی مثبت داشته باشند زمانی که فقط بارش به عنوان یک متغیر مستقل در نظر گرفته شود. با این حال، در یک منطقه خشک، RSM اغلب پس از یک باران شدیدتر به بالاترین مقدار خود می رسد. اگر چند رویداد کوچک باران به جای آن اتفاق بیفتد، RSM در عمق 20 سانتی متری افزایش نمی یابد و حتی کاهش می یابد، زیرا تحت تأثیر متغیرهای دیگر (مثلاً دما) در پوشش های زمینی خاص قرار می گیرد [
37 ]]. علاوه بر این، متغیرهای زیادی در مدلهای رگرسیونی انتخاب شدند که تأثیرات تغییر بارش بر RSM (حتی تأثیر منفی) را در مقایسه با متغیرهای با تأثیر مثبت قوی تضعیف کردند. با این حال، تفسیر هر متغیر در مدلها پیچیده است و روابط خاص بین متغیرها و RSM در این مطالعه بررسی نشده است، اما تأثیر آنها مستحق مطالعه بیشتر است. از مدلسازی، شایان ذکر است که متغیرهایی مانند ST1، ST3 و DIL، جهتهای یکسانی را در مدلهای رگرسیون در طول دوره حفظ کردند. این نشان میدهد که این متغیرها یک همبستگی پایدار با RSM نشان میدهند و حتی زمانی که متغیرهای دیگر تغییر میکنند، تأثیر خود را حفظ میکنند [
70 ].
متغیرهای ساختگی مانند LC1 (11 ماه به جز مرداد) و ST5 (9 ماه) در مدل های رگرسیون در بین ماه ها فراوانی کاربرد بالایی داشتند. این نشان می دهد که پس از در نظر گرفتن اثرات سایر متغیرها، این متغیرهای ساختگی می توانند بیشتر یا کمتر (به ترتیب نشان دهنده اثر مثبت یا منفی، با توجه به جهت های ضریب متناظر در مدل ها) از متغیر وابسته RSM باشند.
به طور خاص، پوشش اراضی زمینهای زراعی در مدل رگرسیون سالانه ( جدول 7 ) در مدلسازی RSM، 0.632 امتیاز بالاتر از گروههای مرجع (یعنی سایر پوششهای زمین) کسب کرد. به طور کلی، متغیرهای کمی یا طبقهای در مدلهای رگرسیون اغلب اثرات متقابلی با یکدیگر داشتند [
89 ]]. در مطالعه حاضر، مدلهای رگرسیون امکان وقوع تعامل بین متغیرها را فراهم نمیکنند (هیچ عبارت تعاملی در مدلهای رگرسیونی وجود ندارد). بنابراین، ضریب رگرسیون برای هر متغیر می تواند به صورت جداگانه به عنوان یک متغیر وابسته (RSM) معنی دار آماری (
p -value <0.05) تفسیر شود. چندین محقق گزارش کردند که تعداد و موقعیت متغیرهای ساختگی بر میزان برازش و دقت تخمین مدل های حاصل تأثیر می گذارد [
68 ،
117 ،
118 ]. چن و همکاران دریافت که مدل متغیر ساختگی در توانایی تخمین زیست توده منطقه ای تفاوتی ندارد [
119 ].
الگوی فضایی کلی RSM مدل شده (با RSM بالا در مناطق جنوبی و RSM پایین در مناطق شمال غربی CLP در طول دوره) از طریق SMLR با مطالعات قبلی مطابقت خوبی داشت [
11 ،
32 ،
120 ]. در مورد میانگین RSM، میانگین RSM مدل شده 12 ماهه 13.114٪ بود که کمی بیشتر از RSM مرجع (12.155٪) [
32 ] بود.]. با توجه به تخمین بیش از حد منطقه خشک و دست کم برآورد منطقه مرطوب، این ممکن است تا حدی به تخمین بیش از حد یا دست کم گرفتن برخی از متغیرهای انتخاب شده نسبت داده شود. مطالعه حاضر چنین عدم قطعیت پارامتری را در نظر نگرفت که به عنوان محدودیت این مطالعه در نظر گرفته شد. علاوه بر این، مساحت RSM مدلسازیشده در ژانویه و فوریه کوچکتر (برای سایر دورهها بزرگتر) از RSM مرجع بود. هر یک از متغیرهای انتخاب شده در مدل های رگرسیونی (یعنی مقدار و توزیع) مورد تجزیه و تحلیل قرار گرفت که نشان داد این متغیر با متغیر انتخابی ET مرتبط است. مناطق کوچکتر RSM مدل شده در ژانویه و فوریه توسط نقشه های ET ایجاد شد که در آن زمان هنوز ناقص بودند. با در نظر گرفتن ژانویه به عنوان مثال، مناطق ET و RSM مدل شده 43.236 × 10
4 بود.کیلومتر
2 و 42.695 × 10
4 کیلومتر مربع
، به ترتیب (
شکل 8 ). ناحیه با RSM مدلسازی شده، همانطور که در
شکل 8c نشان داده شده است ، دارای مقدار ET نیز بود و مساحت 0.541 × 10
4 کیلومتر مربع
با ET اما بدون مقدار RSM باید با سایر متغیرهای غیرقابل دسترس (مثلاً DL) در آن زمان مرتبط باشد. . پیکسلهای با DL زیر 0 درجه سانتیگراد برای جلوگیری از یخ زدگی در زمستان حذف شدند [
104 ]. بنابراین، محدودیت مدل SMLR، تا حدی ممکن است این واقعیت باشد که در دسترس بودن متغیرهای مستقل به طور مستقیم بر پوشش RSM مدلسازی شده تأثیر میگذارد.
با توجه به نتایج اعتبارسنجی، به مدت شش ماه (دسامبر، ژانویه، فوریه، آوریل، می و نوامبر)، Adj. R
2 در سال 2017 از 0.800 فراتر رفت. این نتایج اثربخشی روش SMLR را در طول سال در منطقه مورد مطالعه ثابت کرد [
67 ،
69 ]. این نشان می دهد که روش SMLR یک رویکرد امیدوارکننده برای تخمین RSM است. برای بازیابی RSM در هر ناحیه و دوره با استفاده از روش SMLR، متغیرها و ضرایب انتخابی این متغیرها تنها نیاز به به روز رسانی دارند. از نقطه نظر عملی، این یک یافته قابل توجه است، زیرا از استفاده از داده های چند منبعی برای تکمیل و/یا جایگزینی تصاویر ماهواره ای با وضوح درشت در شبیه سازی RSM پشتیبانی می کند.
با این حال، روش های مورد استفاده در مطالعه حاضر باعث عدم قطعیت می شود. تنها 17 ویژگی به دلیل محدودیتهای دادهها و پارامترهای هیدرولوژیکی (مانند رواناب و فعالیتهای آبیاری)، و سایر ویژگیهای خاک (به عنوان مثال، تخلخل خاک، چگالی ظاهری و مواد آلی خاک) نادیده گرفته شدند، زیرا بهدست آوردن آنها دشوار بود. هیچ تضمینی وجود ندارد که اگر متغیرهای بیشتری جمعآوری شوند، نتایج مدلسازی بهتر میشوند. هنگامی که یک متغیر جدید اضافه می شود، به دلیل مسئله چند خطی بودن و سطح معنی داری، می توان متغیرهای خاصی را حذف کرد. برای مناطقی که در دسترس بودن متغیرهای ورودی محدود است، ساده ترین مدل، که شامل بافت خاک و کربن آلی است، ممکن است جایگزینی برای تخمین میزان دسترسی به آب در خاک باشد [
58 ].]. علاوه بر این، از آنجایی که عملکرد مدل SMLR به کیفیت داده های مرجع و همچنین داده های ورودی حساس بود، مطالعه با دقت RSM مرجع استفاده شده محدود شد. علاوه بر این، کیفیت خوب هر پیکسل برای ورودی ها، دقت RSM مدل شده را بهبود می بخشد. ورودیهای MODIS (به جز پوشش زمین) دادههای ترکیبی در هر دوره 8 روزه بودند و میتوانستند تحت تأثیر ابرها یا تداخل جوی قرار گیرند. علاوه بر اطمینان از هر پیکسل در محدوده معتبر، روش های کنترل کیفیت باید برای هر مجموعه داده با استفاده از پرچم های کیفیت در مطالعات آینده انجام شود [
121 ،
122 ].
بدون دیدگاه