ارزیابی دقت و تحلیل مقایسه ای IDW، Spline و Kriging در درونیابی فضایی شکل زمین (توپوگرافی): یک مطالعه تجربی

دستیابی به اطلاعات مکانی-زمانی هر پدیده پیوسته معین در هر نقطه از یک منطقه جغرافیایی معین عملا غیرممکن و غیر ضروری است. عملی ترین رویکرد همیشه به دست آوردن اطلاعات در مورد پدیده تا حد امکان در بسیاری از نقاط نمونه در محدوده جغرافیایی معین و تخمین مقادیر نقاط مشاهده نشده از مقادیر نقاط مشاهده شده از طریق درونیابی فضایی بوده است. با این حال، مهم است که کاربران درک کنند که روش‌های درونیابی مختلف نقاط قوت و ضعف خود را در مجموعه داده‌های مختلف دارند. تعمیم اینکه یک روش درونیابی معین (مثلاً کریجینگ، وزن دهی با فاصله معکوس (IDW)، Spline و غیره) بدون در نظر گرفتن شناخت، نوع و ماهیت مجموعه داده و پدیده درگیر، بهتر از روش دیگر عمل می کند، صحیح نیست. در این صفحه، ما از نظر تئوری، ریاضی و تجربی عملکرد روش‌های درونیابی کریجینگ، IDW و Spline را به ترتیب در تخمین مقادیر ارتفاع مشاهده نشده و مدل‌سازی شکل زمین ارزیابی می‌کنیم.
دوره-آموزش-حرفه-ای-gis
این مقاله تجزیه و تحلیل مقایسه ای را بر اساس میانگین خطای پیش بینی، ریشه میانگین مربعات خطای پیش بینی و خروجی های اعتبار متقاطع این روش های درونیابی انجام می دهد. نتایج تجربی برای هر یک از روش‌ها بر روی داده‌های بایاس و نرمال نشان می‌دهد که Spline درون‌یابی بهتر و دقیق‌تری را در فضای نمونه نسبت به روش‌های IDW و Kriging ارائه می‌دهد. انتخاب روش درونیابی باید به پدیده و ساختار مجموعه داده وابسته باشد. روش های درون یابی IDW و Spline به ترتیب در تخمین مقادیر ارتفاعی مشاهده نشده و مدل سازی شکل زمین. این مقاله تجزیه و تحلیل مقایسه ای را بر اساس میانگین خطای پیش بینی، ریشه میانگین مربعات خطای پیش بینی و خروجی های اعتبار متقاطع این روش های درونیابی انجام می دهد. نتایج تجربی برای هر یک از روش‌ها بر روی داده‌های بایاس و نرمال نشان می‌دهد که Spline درون‌یابی بهتر و دقیق‌تری را در فضای نمونه نسبت به روش‌های IDW و Kriging ارائه می‌دهد. انتخاب روش درونیابی باید به پدیده و ساختار مجموعه داده وابسته باشد. روش های درون یابی IDW و Spline به ترتیب در تخمین مقادیر ارتفاعی مشاهده نشده و مدل سازی شکل زمین. این مقاله تجزیه و تحلیل مقایسه ای را بر اساس میانگین خطای پیش بینی، ریشه میانگین مربعات خطای پیش بینی و خروجی های اعتبار متقاطع این روش های درونیابی انجام می دهد. نتایج تجربی برای هر یک از روش‌ها بر روی داده‌های بایاس و نرمال نشان می‌دهد که Spline درون‌یابی بهتر و دقیق‌تری را در فضای نمونه نسبت به روش‌های IDW و Kriging ارائه می‌دهد. انتخاب روش درونیابی باید به پدیده و ساختار مجموعه داده وابسته باشد. نتایج تجربی برای هر یک از روش‌ها بر روی داده‌های بایاس و نرمال نشان می‌دهد که Spline درون‌یابی بهتر و دقیق‌تری را در فضای نمونه نسبت به روش‌های IDW و Kriging ارائه می‌دهد. انتخاب روش درونیابی باید به پدیده و ساختار مجموعه داده وابسته باشد. نتایج تجربی برای هر یک از روش‌ها بر روی داده‌های بایاس و نرمال نشان می‌دهد که Spline درون‌یابی بهتر و دقیق‌تری را در فضای نمونه نسبت به روش‌های IDW و Kriging ارائه می‌دهد. انتخاب روش درونیابی باید به پدیده و ساختار مجموعه داده وابسته باشد.

کلید واژه ها

درونیابی فضایی ، IDW ، کریجینگ ، اسپلاین و مدلسازی ارتفاع

 

1. مقدمه

هدف درونیابی یافتن مقادیر یک تابع برای یک بین مقادیر مختلف است که در آن مقادیر داده شده است. مقادیر داده شده

(1)

را می توان از یک تابع ریاضی یا از یک تابع تجربی مدل سازی شده از مشاهدات یا آزمایشات بدست آورد [ 1 ]. بنابراین درونیابی فضایی به منظور تخمین مقادیر یک پدیده یا تابع فضایی (دما، ارتفاع و غیره) در نقاط مشاهده نشده/تخمین زده شده، مقادیر داده شده پدیده در نقاط مشاهده شده/برآورد شده است.

درونیابی فضایی همچنان ابزار مهمی برای تخمین متغیرهای محیطی فضایی پیوسته برای تصمیم‌گیری مؤثر است. بسیاری از ابزارهای مدل سازی از جمله سیستم اطلاعات جغرافیایی به دانشمندان زمین و محیط زیست توانایی انجام درونیابی فضایی به طور معمول برای تولید داده های پیوسته فضایی مفید برای انواع تحلیل ها را ارائه می دهند [ 2 ]. درون یابی در سناریوهایی که وضوح، جهت یا اندازه سلول یک سطح گسسته شده با آنچه مورد نیاز است متفاوت است، بسیار مفید و ضروری است. همچنین زمانی به کار می رود که سطح پیوسته با یک مدل داده متفاوت از آنچه مورد نظر است نشان داده شود، و زمانی که پراکندگی داده ها منطقه مورد نظر را به طور کامل پوشش نمی دهد [ 3 ]] . روش های درونیابی فضایی ابزاری برای پیش بینی مقادیر یک پارامتر محیطی در مکان اندازه گیری نشده با استفاده از داده های اندازه گیری های نقطه ای در فضای نمونه می دهد [ 4 ]. در یک وضعیت ایده آل، مجموعه محدودی از ورودی ها تغییراتی را در یک پارامتر محیطی ایجاد می کنند و دقیقاً با یک قانون فیزیکی تثبیت شده مطابقت دارند. در صورت برقراری رابطه، می توان مقادیر پارامتر مورد نظر را به درستی تخمین زد. رابطه بین متغیر هدف و محیط فیزیکی را نمی توان دقیقاً به دلیل پیچیدگی آن مدل سازی کرد [ 5] . این به دلیل عدم آگاهی کافی از موارد زیر است: (الف) فهرست کامل ورودی‌های مدل (ب) رابطه مورد نیاز برای تعیین خروجی از این ورودی‌ها و (ج) اهمیت بخش تصادفی سیستم. تخمین مدل با استفاده از اندازه گیری میدانی پارامتر مورد نظر تنها راه می شود [ 6 ].

برای نمونه ای از یک متغیر هدف ، که به صورت مکان موقعیت مکانی است، مختصات در فضای جغرافیایی هستند و تعداد مشاهدات است)، نشان داده می شود، دامنه جغرافیایی مورد علاقه را می توان به عنوان A نشان داد. توجه تنها به نمونه هایی داده می شود که متوجه می شوند. یک فرآیند [ 6 ].

به گفته میتاس و میتاسووا [ 7 ]، انتخاب روش های درونیابی مناسب برای پدیده ها و مجموعه داده های مختلف، مشکلات زیادی را به همراه دارد. پیچیدگی میدان‌های مدل‌سازی‌شده، داده‌های فضایی متنوع نمونه‌برداری غیربهینه، وجود ناپیوستگی‌های قابل‌توجه، و نویزها چالش‌های رایج هستند. علاوه بر این، مجموعه داده‌های به‌دست‌آمده از منابع مختلف با دقت‌های متفاوت معمولاً بسیار بزرگ هستند. روش‌های درونیابی قابل اعتماد مناسب برای کاربردهای GIS باید برخی از الزامات ضروری مانند دقت و قدرت پیش‌بینی، فرمول‌بندی ابعادی، تخمین مستقیم مشتقات، قابلیت کاربرد در مجموعه داده‌های بزرگ، راندمان محاسباتی 3+ و سهولت استفاده را برآورده کنند.

در حال حاضر، یافتن روشی که تمام الزامات ذکر شده در بالا را برای طیف گسترده ای از داده های جغرافیایی ارجاع داده شده برآورده کند، دشوار است. بنابراین، انتخاب صحیح مناسب ترین روش با پارامترهای مناسب برای کاربردها در اولویت قرار دارد. روش های مختلف نمایش های فضایی متفاوتی را در مجموعه داده های مختلف تولید می کنند. همچنین، دانش عمیق پدیده مورد بحث برای ارزیابی اینکه کدام یک از روش های درونیابی نتایج نزدیک به واقعیت را ایجاد می کند ضروری است. استفاده از یک روش نامناسب یا پارامترهای نامناسب می تواند منجر به مدل تحریف شده توزیع فضایی شود که منجر به تصمیمات بالقوه اشتباه بر اساس اطلاعات مکانی گمراه کننده می شود. نتایج درونیابی اشتباه زمانی بسیار حیاتی می شود که برآوردها ورودی برای شبیه سازی باشند.7 ] .

در حالی که عوامل خارجی مانند تراکم داده ها، توزیع مکانی داده های نمونه، نوع سطح، اندازه نمونه و طرح نمونه گیری و غیره [ 4 ] ممکن است بر عملکرد یک روش درونیابی تأثیر بگذارد، درک فرمول ریاضی این روش ها اطلاعاتی را در مورد مناسب بودن آنها برای مدلسازی زمین

در این مقاله سعی شده است دقت روش های درون یابی فضایی در مدل سازی شکل زمین (توپوگرافی) در رابطه با فرمول ریاضی آنها بررسی شود. مطالعه تجربی این کار از یک منطقه شامل یک شیب و یک دشت به عنوان منطقه آزمایشی سازگاری با فرم زمین استفاده می‌کند و بر تحلیل مقایسه‌ای سه روش درونیابی متداول کریجینگ، اسپلاین و وزن‌دهی با فاصله معکوس، IDW تمرکز دارد. بخش زیر پایه های نظری و ریاضی روش های مختلف درونیابی شناخته شده از جمله سه روش درونیابی مورد بحث را خلاصه می کند. بخش 3 روش های تجزیه و تحلیل دقت مورد استفاده در این مقاله را معرفی می کند در حالی که بخش 4 تجزیه و تحلیل تجربی را ارائه می دهد. بخش 5 نتایج را مورد بحث قرار می دهد و بخش 6 نتیجه گیری می کند.

دوره-آموزش-حرفه-ای-gis

2. مفهوم ریاضی و نظری IDW، Spline و Kriging

روش‌های درون‌یابی فضایی مختلف در حوزه‌های مختلف برای کاربردهای مختلف توسعه یافته‌اند. با توجه به [ 6 ]، بسیاری از مدل های خطی استاندارد، موارد خاصی از یک مدل پیش بینی عمومی تر هستند. قانون اول جغرافیای توبلر، همه چیز با هر چیز دیگری مرتبط است، اما چیزهای نزدیک بیشتر از چیزهای دور مرتبط هستند [ 8 ] اصل کلی بسیاری از روش های درونیابی را تشکیل می دهد. برخی از روش‌ها فقط برای فیلدهای داده پیوسته مناسب هستند که توزیع نرمال مجموعه داده را فرض می‌کنند. روش های درون یابی فضایی را می توان به دو گروه عمده طبقه بندی کرد:

الف) روشهای مکانیکی / قطعی / غیر زمین آماری. از جمله روش‌های دیگر، وزن‌دهی با فاصله معکوس (IDW) و Splines.

ب) روش های خطی آماری/ تصادفی/ زمین آماری. که شامل کریجینگ در میان دیگران است [ 4 ]، [ 6 ].

2.1. وزن معکوس فاصله (IDW)

این روش فرض می کند که مقدار در یک مکان ناشناخته را می توان به عنوان میانگین وزنی مقادیر در نقاطی در یک فاصله قطع مشخص یا از تعداد معینی از نزدیکترین نقاط (معمولاً 10 تا 30) تقریب زد. وزن ها معمولاً با توان فاصله [ 9 ] نسبت معکوس دارند که در یک مکان نمونه s غیرنمونه ای به تخمینگر منتهی می شود که در رابطه (2) زیر آمده است.

(2)

که در آن p یک پارامتر است (معمولاً 2 =) [ 7 ] . IDW روشی است که استفاده از آن آسان است و به راحتی در دسترس است. غالباً شکل محلی را که توسط داده ها نشان داده شده است تولید نمی کند و در نقاط داده، اکسترم های محلی تولید می کند [ 7 ]. برخی از تغییرات باعث ایجاد یک کلاس از سطوح و حجم های IDW ترکیبی چند متغیره شده است [ 9 ]. فرض IDW این است که نقاط اندازه‌گیری شده نزدیک‌تر به نقطه مجهول شبیه‌تر از نقاطی هستند که از نظر مقادیر دورتر هستند. وزن به صورت زیر داده می شود:

(3)

که در آن فاصله بین و ، p پارامتر توان است، و n تعداد نقاط اندازه گیری شده مورد استفاده برای تخمین است. عامل اصلی موثر بر دقت IDW مقدار پارامتر توان [ 10 ] است. با افزایش فاصله، وزن‌ها کاهش می‌یابد، به‌ویژه زمانی که مقدار پارامتر توان افزایش می‌یابد، بنابراین نمونه‌های نزدیک وزن سنگین‌تری دارند و تأثیر بیشتری بر تخمین دارند، و درون‌یابی فضایی حاصل محلی است [ 10 ]. انتخاب پارامتر قدرت و اندازه محله دلخواه است [ 11] . محبوب ترین انتخاب p 2 است و روش حاصل اغلب فاصله معکوس مربع یا مجذور فاصله معکوس (IDS) نامیده می شود. پارامتر توان همچنین می تواند بر اساس اندازه گیری خطا انتخاب شود (به عنوان مثال، حداقل میانگین خطای مطلق)، که منجر به IDW بهینه می شود [ 2 ]. صافی سطح تخمین زده شده مستقیماً با پارامتر توان تغییر می کند، و مشخص شد که نتایج برآورد شده زمانی که p 1 و 2 است در مقایسه با زمانی که pis 4 است کمتر رضایت بخش می شود [ 12 ]. IDW به‌عنوان «میانگین متحرک» وقتی پیس صفر [ 13 ]، «درون یابی خطی» در پی 1 و «میانگین متحرک وزنی» زمانی که پی با 1 برابر نیست [ 3 ] نامیده می‌شود.

2.2. اسپلاین

Splines متعلق به گروهی از interpolators به ​​نام توابع پایه شعاعی (RBF) است. روش‌های این گروه عبارتند از Spline با صفحه نازک (TPS)، Spline منظم با کشش، و Inverse Multi-Quadratic Spline [ 14 ]. این مدل ها از توابع ریاضی برای اتصال نقاط داده نمونه برداری شده استفاده می کنند. آنها سطوح مستمر ارتفاع و درجه را تولید می کنند در حالی که خمش سطح تولید شده را به حداقل محدود می کنند. مدل‌های RBF به بهترین وجه در سطوح صافی که اندازه داده‌های نمونه موجود برای آن‌ها بزرگ است، استفاده می‌شوند، زیرا عملکرد آنها برای سطوحی با تغییرات قابل‌ملاحظه در محدوده‌های کوتاه کمتر از حد مطلوب است. در IDW [ 14] . توابع Spline معادل های ریاضی نقشه نگاران خط کش انعطاف پذیر هستند که به آنها spline می گویند تا منحنی های صاف را در چندین نقطه ثابت قرار دهند. این یک چند جمله ای تکه تکه متشکل از چندین بخش است که هر یک از آنها به تعداد کمی از نقاط برازش داده می شود به گونه ای که هر یک از بخش ها در نقاطی که به آنها نقاط شکست می گویند به هم می پیوندند. این مزیت سازگاری با تنظیمات محلی را دارد، اگر در یک نقطه تغییری در مقدار داده وجود داشته باشد، و به یک درونیابی چند جمله ای ساده ترجیح داده می شود زیرا پارامترهای بیشتری را می توان تعریف کرد، از جمله میزان هموارسازی [ 3 ].] . Splines معمولاً با استفاده از چند جمله‌ای‌های مرتبه پایین (یعنی مرتبه دوم یا سوم) محدود شده برای پیوستن به بالا برازش می‌شوند. آنها ممکن است دو بعدی (به عنوان مثال هنگام صاف کردن یک خط کانتور) یا سه بعدی (هنگام مدل سازی یک سطح) باشند. تابع spline هموارسازی نیز وجود یک خطای اندازه گیری را در داده ها فرض می کند که باید به صورت محلی هموار شوند [ 3 ]. در میان بسیاری از نسخه ها و اصلاحات درون یابی اسپلاین، پرکاربردترین تکنیک، اسپلاین های صفحه نازک [ 15 ] و همچنین اسپلاین منظم با کشش و صاف کردن [ 7 ] است.

2.2.1. اسپلاین منظم با کشش

برای اسپلاین منظم با کشش و هموارسازی، پیش‌بینی توسط:

(4)

که در آن a 1 یک ثابت است و R(v i ) تابع پایه شعاعی است که توسط:

(5)

و

(6)

که در آن تابع انتگرال نمایی است، ثابت اویلر است، پارامتر کشش تعمیم یافته است و جدایی بین نقطه جدید و درونیابی است. ضرایب و با حل سیستم به دست می آیند،

(7)

(8)

عوامل وزنی مثبت برای پارامتر هموارسازی در هر مکان کجا هستند [ 7 ]. پارامتر کشش فاصله ای را تعیین می کند که نقاط داده شده بر روی سطح حاصل تأثیر می گذارد، در حالی که پارامتر هموارسازی انحراف عمودی سطح از مکان های نمونه را کنترل می کند. استفاده از ترکیب مناسب کشش و صاف کردن سطحی را ایجاد می کند که به درستی با دانش تجربی در مورد تغییرات مورد انتظار مطابقت دارد [ 7 ].

2.2.2. Spline صفحه نازک

وهبا و وندلبرگر [ 16 ] خطوط صفحه نازک (TPS) را که قبلاً خطوط صاف کننده لاپلاسی نامیده می شد، برای مدل سازی داده های اقلیمی فرموله کردند [ 4 ]. یک راه حل اساسی برای معادله دو هارمونیک، شکل دارد

(9)

جایی که r فاصله بین نقاط نمونه و مکان های نمونه برداری نشده است [ 17 ].

رابطه زیر سطحی را با حداقل خمش تقریبی می کند

(10)

در جایی که عبارات قسمت خطی سطح را که یک دشت مسطح را که به بهترین وجه با تمام نقاط کنترل مطابقت دارد با استفاده از حداقل مربع ها مدل می کنند، آخرین عبارت نیروهای خمشی ناشی از m نقاط نمونه برداری شده را مدل می کند، ضرایب نقاط کنترل است و جدایی نقطه نمونه برداری و مکان است . . مجهولات و با استفاده از رابطه ارزیابی می شوند

(11)

جایی که

(12)

و V بردار ارتفاع نقطه است. K ماتریسی از فاصله بین نقاط نمونه برداری شده و P ماتریسی از مختصات نقاط نمونه برداری است. با محاسبه معکوس L یا حل معادله 11 با V جایگزین شده با ماتریس ارتفاع نقاط نمونه برداری شده H با صفر به دست می آید [ 18 ]. هنگامی که مجهولات ارزیابی شدند، می توان EQ.10 را برای تعیین ارتفاع نقاط مجهول محاسبه کرد. TPS با محدود کردن تابع اعتبار سنجی متقابل تعمیم یافته، GVC، یک عامل هموارسازی را محاسبه می کند، و یک مدل نسبتاً محکم را ایجاد می کند زیرا محدود کردن GVC دقت تخمین ها را بهبود می بخشد. و کمتر به دقت خود مدل متکی است. TPS تعیین دقت مکانی را ارائه می دهد [ 7 ].

2.2.3. اسپلاین چند درجه دوم معکوس

رابطه زیر تابع spline چند درجه دوم معکوس را نشان می دهد

(13)

فاصله اقلیدسی بین نقاط کنترل و نقطه مجهول کجاست [ 15 ] . سطح توسط تابع مدل شده است

(14)

که در آن وزن ها برای اطمینان از برآورد دقیق در هر نقطه داده انتخاب می شوند به طوری که

(15)

و توسط رابطه محاسبه می شود

(16)

در جایی که z با بردار مقادیر داده های نمونه گیری شده جایگزین می شود، F یک ماتریس تابع مربعی است که توسط،

(17)

تابع تخمین تولید شده با این وزن ها در نقاط داده نمونه برداری شده صاف و دقیق است [ 19 ].

Splines به طور گسترده ای به عنوان بسیار مناسب برای برآورد ارتفاعات متراکم نمونه برداری شده و متغیرهای آب و هوایی [ 7 ]، [ 15 ] دیده می شود. از جمله معایب آن، ناتوانی در ادغام مقادیر بیشتری از نقشه های کمکی در مدل سازی بخش قطعی تغییر و همچنین انتخاب دلخواه پارامترهای هموارسازی و کشش به طور گسترده مورد انتقاد قرار گرفته است [ 7 ]. بنابراین پیش‌بینی‌های به‌دست‌آمده از splines تا حد زیادی به تصمیم‌هایی مانند ترتیب چندجمله‌ای مورد استفاده، تعداد نقاط شکست و غیره که توسط کاربر گرفته می‌شود وابسته است. Splines همچنین ممکن است برای جلوگیری از تولید مقادیر بیش از حد بالا یا پایین که در برخی از splineهای دقیق معمول است مدل سازی شوند [ 3 ]] . برخلاف روش‌های IDW، مقادیر پیش‌بینی‌شده توسط RBF‌ها به محدوده مقادیر اندازه‌گیری شده محدود نمی‌شوند، به عنوان مثال، مقادیر پیش‌بینی‌شده می‌توانند بالاتر از حداکثر یا کمتر از حداقل مقدار اندازه‌گیری‌شده [ 14 ] باشند.

دوره-آموزش-حرفه-ای-gis

2.3. کریجینگ

کریجینگ، مترادف با درونیابی زمین آماری، در صنعت معدن به عنوان وسیله ای برای بهبود تخمین ذخایر سنگ معدن در اوایل دهه 1950 آغاز شد [ 6 ]. مهندس معدن DG Krige و آماردان HS Sichel آن را فرموله کردند. پس از تقریبا یک دهه، ریاضیدان فرانسوی G. Matheron فرمولها را استخراج کرد و کل زمینه زمین آمار خطی را ایجاد کرد [ 11 ]. کریجینگ بر اساس مفهومی از توابع تصادفی با سطح یا حجم فرض شده یک تحقق تابع تصادفی با کوواریانس فضایی شناخته شده است [ 7 ].

نظریه متغیر منطقه ای شده فرض می کند که تغییرات مکانی هر متغیر را می توان به صورت مجموع سه جزء زیر بیان کرد:

الف) یک جزء ساختاری با میانگین یا روند ثابت.

ب) یک متغیر منطقه ای، که جزء تصادفی اما همبسته مکانی است.

ج) یک نویز تصادفی اما از نظر مکانی نامرتبط یا جزء باقیمانده.

د) از نظر ریاضی، برای یک متغیر تصادفی z در x، عبارت است

(18)

جایی که یک تابع ساختاری است که مؤلفه ساختاری را مدل‌سازی می‌کند، باقیمانده تصادفی همبسته فضایی (متغیر منطقه‌ای) است و نویز تصادفی است که معمولاً با میانگین صفر و واریانس توزیع می‌شود [ 3 ].

کریجینگ معمولی

کریجینگ معمولی (OK) نسخه استاندارد کریجینگ است که در آن پیش‌بینی‌ها بر اساس مدل است.

(19)

که در آن تابع ثابت ثابت یا میانگین جهانی است، و بخش تصادفی اما همبسته فضایی تغییرات است. پیش بینی ها به صورت انجام می شود

(20)

که در آن بردار وزن های کریجینگ ( ) و z بردار n نمونه در مکان های اولیه است. کریجینگ، به نوعی، بهبود درون یابی فاصله معکوس است که در آن مشکل کلیدی درون یابی فاصله معکوس (تعیین میزان اهمیت داده شده به هر همسایه) به گونه ای مورد توجه قرار می گیرد که وزن های تخمین زده شده برای فضای واقعی محاسبه شود. ساختار خودهمبستگی تازگی کریجینگ در تجزیه و تحلیل داده های نقطه ای، استخراج و ترسیم تفاوت های نیمه واریانس بین مقادیر همسایه است [ 6 ].

با فرض ثابت بودن، می توان یک نیمه متغیر ، برای داده ها را تخمین زد که به صورت تعریف شده است

(21)

که در آن h فاصله بین نقطه و [ 21 ] است. این مربوط به کوواریانس فضایی توسط،

(22)

که در آن مقدار نیمه واریوگرام در بی نهایت (آستانه) [ 7 ] است. وزن‌های کریجینگ معمولی (OK) با ضرب کوواریانس‌ها ارزیابی می‌شوند.

(23)

که در آن C ماتریس کوواریانس به دست آمده برای یک ماتریس نمونه nxn با یک سطر و ستون اضافی اضافه شده برای اطمینان از مجموع وزن ها برابر با یک است و بردار کوواریانس ها در یک مکان جدید است [ 6 ]. کوواریانس در فاصله صفر طبق تعریف میانگین خطای باقیمانده [ 6 ] است. واریوگرام های تجربی معمولاً دارای برخی ویژگی های مشخصه هستند که از جمله آنها می توان به موارد زیر اشاره کرد:

1) مقادیر پایین h دارای واریانس کوچک با افزایش واریانس به نسبت مستقیم با h هستند و در یک نقطه معین تراز می شوند تا آستانه را تشکیل دهند.

2) در فواصل کمتر از محدوده (فاصله‌ای که سطح واریانس کاهش می‌یابد)، نقاط نزدیک‌تر به هم به احتمال زیاد مقادیر مشابهی نسبت به نقاط دورتر از هم دارند، در حالی که در فواصل بزرگ‌تر از محدوده، نقاط تأثیری بر خودشان ندارند. بنابراین، این محدوده ایده ای از بزرگی شعاع جستجو برای درونیابی وزنی از راه دور به دست می دهد.

3) نیمه واریانس زمانی که h صفر است دارای یک مقدار مثبت است که به عنوان قطعه نامیده می شود و میزان نویز خودهمبسته غیرمکانی را نشان می دهد [ 3 ].

نیمه واریانس نمایش داده شده در واریوگرام تجربی با یک تابع ریاضی بسته به شکل واریوگرام تجربی مدل می شود. زمانی که واریوگرام شکل کلاسیک داشته باشد از مدل کروی استفاده می شود و زمانی که نزدیک شدن به آستانه تدریجی باشد از مدل نمایی استفاده می شود. مدل گاوسی زمانی که قطعه کوچک است و تغییرات بسیار صاف است و از مدل خطی زمانی که آستانه وجود ندارد استفاده می شود. واریوگرام حاوی روندی که باید به طور جداگانه مدل شود، به طور فزاینده ای شیب دار با مقادیر بزرگتر h است. اگر واریانس قطعه بزرگ باشد و واریوگرام تمایلی به ناپدید شدن تدریجی با مقادیر کوچکتر h نشان ندهد، یا فاصله بین مشاهدات بزرگتر از محدوده باشد (یعنی نقاط نمونه خیلی از هم دور باشند تا بر یکدیگر تأثیر بگذارند)، در این صورت درون یابی منطقی نیست. و بهترین برآورد میانگین کلی مشاهدات است. واریوگرام پر از نویز که الگوی خاصی را نشان نمی دهد ممکن است به این معنی باشد که مشاهدات بسیار کم هستند. یک واریوگرام که در فواصل بزرگتر از محدوده برای ایجاد یک اثر حفره فرو می رود، نشان می دهد که فضای نمونه ممکن است برای منعکس کردن برخی تغییرات طول موج طولانی در داده ها بسیار کوچک باشد.3 ] . سطح درون یابی با استفاده از شرایط آماری بی طرفی و حداقل واریانس [ 7 ] ساخته شده است. سه شرط مهم برای کریجینگ معمولی عبارتند از:

(i) تابع روند ثابت است

(ii) واریوگرام در کل ناحیه مورد نظر ثابت است

(iii) متغیر هدف (تقریبا) به طور معمول توزیع شده است.

این الزامات اغلب برآورده نمی شوند و یک نقطه ضعف جدی برای کریجینگ معمولی هستند [ 6 ]. با این حال، یک مزیت عمده اشکال مختلف کریجینگ (و سایر روش‌های درونیابی تصادفی) این است که تخمین‌های خطاهای پیش‌بینی مدل را می‌توان محاسبه کرد، در تحلیل گنجاند و همراه با سطح پیش‌بینی‌شده رسم کرد. چنین اطلاعات خطای ابزار مهمی در فرآیند تصمیم گیری مکانی است [ 14 ].

3. روش ارزیابی دقت

شاخص‌های ارزیابی دقت که معمولاً مورد استفاده قرار می‌گیرند عبارتند از، میانگین خطا (ME)، میانگین خطای مطلق (MAE)، میانگین مربعات خطا (MSE) و خطای میانگین مربعات ریشه (RMSE). برای n مشاهدات، p مقدار پیش بینی شده و o مقدار مشاهده شده، این شاخص ها با استفاده از عبارات فهرست شده در زیر ارزیابی می شوند:

(24)

(25)

(26)

(27) [ 4 ]

ME برای تعیین درجه سوگیری در برآوردهایی که اغلب به عنوان سوگیری [ 10 ] نامیده می شود استفاده می شود. از آنجایی که تخمین‌های مثبت و منفی یکدیگر را خنثی می‌کنند، ME حاصل از خطای واقعی کمتر است و در استفاده از آن به‌عنوان شاخص دقت، احتیاط را برمی‌انگیزد [ 4 ]. RMSE اندازه‌گیری اندازه خطا را ارائه می‌کند، اما نسبت به موارد پرت حساس است، زیرا وزن زیادی بر روی خطاهای بزرگ می‌گذارد [ 4 ]. MSE از همان اشکالات RMSE رنج می برد. در حالی که MAE نسبت به مقادیر شدید [ 20 ] حساسیت کمتری دارد و نشان می‌دهد که تخمین تا چه حد ممکن است در خطا باشد [ 21 ]] . استدلال می‌شود که MAE و RMSE معیارهای مشابهی هستند و میانگین خطا را تخمین می‌زنند، اما اطلاعاتی در مورد اندازه نسبی تفاوت میانگین و ماهیت تفاوت‌های شامل آنها ارائه نمی‌دهند [ 20 ]. البته اعتبار متقاطع همراه با این اندازه‌گیری‌ها برای ارزیابی عملکرد روش‌های درون‌یابی استفاده می‌شود [ 4 ]. در این مقاله از ME و RMSE (موجود بر روی نرم افزار مورد استفاده) برای ارزیابی عملکرد روش های درون یابی IDW، Spline و Kriging در بخش تحلیل تجربی این مطالعه استفاده می شود. اعتبار سنجی متقاطع به عنوان آزمایش بیشتر دقت پیش بینی انجام می شود.

دوره-آموزش-حرفه-ای-gis

4. تجزیه و تحلیل تجربی

منطقه مورد مطالعه همانطور که در شکل 1 و شکل 2 توضیح داده شده است، گستره ای از زمین به وسعت حدود بیست و یک (21) هکتار است که در طول و عرض جغرافیایی Ikot Ukapon در قسمت شمال شرقی ایالت Akwa Ibom نیجریه قرار دارد. این منطقه عمدتاً تپه ای است و دشتی حدود بیست (20%) از کل مساحت آن را پوشش می دهد. داده‌های ارتفاع ارتومتری، به‌دست‌آمده از دفتر نقشه‌بردار کل ایالتی، شامل چهارصد و شصت و دو (462) نقطه نمونه‌برداری تصادفی در سراسر منطقه است که از طریق بررسی میدانی با استفاده از GPS دیفرانسیل سری Kolida K9-T جمع‌آوری شده است.

داده های به دست آمده از نمونه های میدانی در قالب Microsoft Excel .xls بود. پایین ترین ارتفاع منطقه 27.018 متر و بالاترین ارتفاع 98.719 متر از سطح متوسط ​​دریا است. کاوش اولیه داده ها با استفاده از ArcGIS ESRI (نسخه 9.3) نشان می دهد که داده ها به طور معمول توزیع نشده اند، همانطور که توسط پارامترهای توزیع در جدول 1 نشان داده شده است .

شکل 1 . نقشه منطقه مورد مطالعه که توزیع نقاط داده را در منطقه مورد مطالعه نشان می دهد.

شکل 2 . نقشه کانتور منطقه مورد مطالعه.

4.1. روش IDW

سطح پر کنتور زیر که در شکل 3 نشان داده شده است، برای درون یابی IDW با توان، p از 2، ضریب هموارسازی 0.5 و اندازه همسایگی 15 برای داده های بایاس ایجاد شده است.

4.2. روش اسپلاین

درون یابی Spline منظم، که به عنوان تابع پایه شعاعی (RBF) پیاده سازی شده است، با نظم 2، نقشه پر شدن کانتور را در شکل 4 برای توان = 2، ضریب هموارسازی = 0.5 و اندازه محله = 15 نشان می دهد.

4.3. کریجینگ

کریجینگ با این فرض کار می کند که مجموعه داده نرمال شده است، بنابراین، قبل از اجرای درونیابی کریجینگ، نرمال سازی Box-Cox را روی داده ها انجام دادیم.

شکل 3 . نقشه پر کنتور IDW.

شکل 4 . نقشه پر کردن کانتور Spline منظم.

داده ها با استفاده از ابزار Geostatistical Analyst در ArcGIS به زیر مجموعه های آموزشی و آزمایشی به نسبت 80:20 تقسیم شدند و مقادیر پارامتر بهینه (تولید شده توسط ArcGIS و تعیین بهترین مقدار ممکن برای هر پارامتر) برای پیش بینی در زیر مجموعه آموزشی استفاده شد. سپس زیر مجموعه آزمون با این پارامترهای بهینه برای اعتبارسنجی استفاده شد. پارامترهای توزیع داده‌ها پس از نرمال‌سازی باکس-کاکس مطابق جدول 2 است.

نقشه های پر کانتور با استفاده از کریجینگ با مدل گاوسی و

مدل کروی به ترتیب برای مقادیر محاسبه شده خودکار برای قطعه، آستانه، محدوده متوسط، اندازه تاخیر 54.401 و عدد تاخیر = 12 مانند شکل 5 (الف) و شکل 5 (ب) نشان داده شده است.

نقشه های IDW، Spline و Kriging پس از اعتبارسنجی بهینه داده ها در شکل 6(a)-(c) نشان داده شده است.

5. نتیجه و بحث

از خطاهای پیش‌بینی جدول‌بندی‌شده در جدول 3 و جدول 4 ، سطح سوگیری در برآورد برای Kriging کمترین و برای IDW بالاترین است، همانطور که توسط ME مربوطه نشان داده شده است. این وجود سوگیری انتظار می‌رود، زیرا داده‌های قد تصادفی نبودند که در جدول 1 نشان داده شده است. نرمال سازی Box-Cox داده ها نیز منجر به توزیع نرمال نشد ( جدول 2 را ببینید، این بدان معنی است که داده ها بسیار مغرضانه بودند. این سناریو اغلب در عمل با آن مواجه می‌شویم، زیرا مجموعه میدانی داده‌های ارتفاع معمولاً به جای تصادفی بودن، بر ثبت تغییرات درک شده در ارتفاع متمرکز است. با این حال، سوگیری برای داده‌های تایید شده، برای کریجینگ بالاترین و برای Spline کمترین است، احتمالاً به دلیل کاهش تعداد نمونه‌های مورد استفاده برای اعتبارسنجی. معیار بهتری از خطا در پیش‌بینی، RMSE، برای Spline کمترین و برای Kriging برای پیش‌بینی و اعتبار نشان داده شده در جدول 3 و جدول 4 بالاترین است.. این نشان‌دهنده یک مدل ارتفاعی است که به آنچه روی زمین برای Splines است نزدیک‌تر است. با این حال، در خارج از مناطقی که داده های درون یابی به دست آمده است، Spline پیش بینی های غیر قابل اعتمادی را تولید می کند. بنابراین برای مواردی که داده های خارج از منطقه گرفته شده مورد نظر است (برون یابی) مناسب نیست. IDW مدلی تولید می کند که بهتر از کریجینگ است اما به خوبی مدل Spline نیست. پیش بینی های آن در خارج از منطقه ضبط شده نیز بهتر از کریجینگ و اسپلاین است. این بدان معنا نیست که Kriging برای مدل‌سازی زمین مناسب نیست یا بهتر از IDW و Spline عمل نمی‌کند. کریجینگ توزیع نرمال داده ها را فرض می کند و توزیع فضایی یک رویداد جغرافیایی را به عنوان تحقق تابعی که تصادفی است مدل می کند. بنابراین پیش‌بینی‌های آن وابسته به داده‌هایی است که معیارهای آماری بی‌طرفی و حداقل واریانس را برآورده می‌کنند. فرمول ریاضی آن را برای داده هایی که نامناسب می کند

(الف)(ب)

شکل 5 . (الف) و (ب) نقشه پر کردن کانتور کریجینگ را پس از نرمال‌سازی باکس کاکس که به ترتیب با مدل گاوسی و با مدل کروی ایجاد شده است، نشان می‌دهد.

(الف)(ب)(ج)

شکل 6 . (الف) نقشه پیش بینی با وزن معکوس فاصله (IDW). (ب) Spline; (ج) نقشه پیش‌بینی کریجینگ معمولی.

GoogleTranslate

Can’t translate this page

Go to original page

جدول 3 . خطاهای پیش بینی برای سه روش درونیابی در پارامترهای بهینه.

ME میانگین خطای پیش‌بینی و RMSE ریشه میانگین مربع خطای استاندارد پیش‌بینی است.

ME میانگین خطای پیش‌بینی و RMSE ریشه میانگین مربع خطای استاندارد پیش‌بینی است.

به طور معمول توزیع نمی شود یا عادی سازی آن دشوار است. از سوی دیگر، Splines از یک مدل فیزیکی استفاده می‌کند که مطابق با تغییر در خواص کشسانی تابع تخمین تغییر می‌کند. با مدل‌سازی پدیده‌های فیزیکی مانند زمین، به خوبی عمل می‌کند. IDW از ترکیب خطی مقادیر در مکان‌های رویداد ضبط‌شده استفاده می‌کند، وزن‌ها را با تابعی معکوس از جدایی بین مکان رویدادی که باید تخمین زده شود و نقاط گرفته شده برای تخمین مقادیر مکان ناشناخته اختصاص می‌دهد. اگرچه وزن‌ها به‌طور دلخواه مشخص می‌شوند، نرم‌افزار ArcGIS یک تابع مدیریت وزن بهینه را ارائه می‌کند که وزنی را که برای نقاط درون مجموعه داده‌های گرفته شده مناسب‌تر است، اختصاص می‌دهد. پیش‌بینی‌ها تحت تأثیر این تخصیص وزن هستند، اما از نظر خطا نسبت به آنچه با استفاده از کریجینگ به‌دست می‌آیند قابل اعتمادتر هستند. پذیرفته شده است که کریجینگ با داده های کمکی مانند داده های دما بسیار خوب عمل می کند، اما داده ها باید تا حد امکان به صورت تصادفی گرفته شوند. این اغلب به دست نمی آید. دانش خوب از داده های مورد استفاده و همچنین نقاط قوت و ضعف روش های درون یابی موجود در تصمیم گیری در مورد روشی برای استفاده برای درونیابی برای یک هدف معین ضروری است.

6. نتیجه گیری

در این مطالعه، Spline مدل و نتیجه دقیق‌تری را برای داده‌های ارتفاعی به‌دست‌آمده مستقیماً از بررسی میدانی ارائه می‌کند که به‌طور تصادفی همگن و نرمال‌سازی نشده بودند. از نتیجه درون یابی که به دست آوردیم، روش Spline در خارج از ناحیه داده نیز مجدداً تأیید می کند که پیش بینی های RBFs به محدوده مقادیر اندازه گیری شده محدود نمی شوند، به عنوان مثال، مقادیر پیش بینی شده می توانند بالاتر از حداکثر یا کمتر از حداقل مقدار اندازه گیری شده باشند. تان و خو [ 22] از آزمایش خود بر روی مدل‌سازی زمین با استفاده از داده‌های یک نقشه دیجیتالی به این نتیجه رسیدند که IDW از نظر دقت مدل بهتری نسبت به Spline یا Kriging ارائه کرده است. این به احتمال زیاد به دلیل ابزارهایی است که داده های آزمون از آن به دست آمده اند. داده‌های آزمایشی آن‌ها از یک نقشه کانتور دیجیتالی شد و به طور همگن توزیع شد. بنابراین دانش منبع داده ها ممکن است در انتخاب روش درونیابی اهمیت داشته باشد.

 

منابع

 

[ 1 ] کریزیگ، ای. (2003) ریاضیات مهندسی پیشرفته. نسخه هشتم، جان وایلی و پسران (آسیا) Pte., Ltd.، سنگاپور.
[ 2 ] Collins, FC and Bolstad, PV (1996) مقایسه ای از تکنیک های درون یابی فضایی در تخمین دما. مجموعه مقالات سومین کنفرانس/کارگاه بین المللی یکپارچه سازی GIS و مدلسازی محیطی، مرکز ملی اطلاعات و تحلیل جغرافیایی، سانتا باربارا، سانتافه، NM; سانتا باربارا، کالیفرنیا
[ 3 ] Burrough, PA and McDonnell, RA (1998) اصول سیستم های اطلاعات جغرافیایی. انتشارات دانشگاه آکسفورد، آکسفورد.
[ 4 ] لی، جی و هیپ، AD (2008) مروری بر روش های درون یابی فضایی برای دانشمندان محیط زیست. Geoscience Australia، رکورد 2008/23، 137.
[ 5 ] Heuvelink، GBM و Webster، R. (2001) مدلسازی تغییرات خاک: گذشته، حال و آینده. Geoderma, 100, 269-301.
https://doi.org/10.1016/S0016-7061(01)00025-8
[ 6 ] Hengl, T. (2009) راهنمای عملی برای نقشه برداری زمین آماری.
https://spatial-analyst.net/book/
[ 7 ] Mitas, L. and Mitasova, H. (2005) درون یابی فضایی. در: Longley, PA, Goodchild, MF, Maguire, DJ and Rhind, DW, Eds., Geographic Information Systems: Principles, Techniques, Management and Applications, 2nd Edition, Vol. 1، قسمت 2، فصل 34.
www.geos.ed.ac.uk/~gisteac/gis_book_abridged/
[ 8 ] Tobler، WR (1970) شبیه سازی مدل کامپیوتری رشد شهری در منطقه دیترویت. جغرافیای اقتصادی، 46، 234-240.
https://doi.org/10.2307/143141
[ 9 ] Watson, DF (1992) Contouring: راهنمای تجزیه و تحلیل و نمایش داده های مکانی. پرگامون، آکسفورد
[ 10 ] Isaaks, EH and Srivastava, RM (1989) زمین آمار کاربردی. انتشارات دانشگاه آکسفورد، نیویورک.
[ 11 ] Webster, R. and Oliver, M. (2001) زمین آمار برای دانشمندان محیطی. جان وایلی و پسران، آموزشی ویبولیتین، چیچستر، 271.
[ 12 ] Ripley, BD (1981) آمار فضایی. جان وایلی و پسران، نیویورک، 252.
https://doi.org/10.1002/0471725218
[ 13 ] بروس، دی جی و همکاران (1996) عملکرد روش های درون یابی فضایی و نقشه های کروپلث برای تخمین خواص در نقاط: مطالعه موردی بررسی خاک. محیط سنجی، 7، 1-16.
https://doi.org/10.1002/(SICI)1099-095X(199601)7:1<1::AID-ENV157>3.0.CO;2-Y
[ 14 ] آژانس حفاظت از محیط زیست ایالات متحده (EPA) (2004) در حال توسعه سطوح درون یابی فضایی و تخمین عدم قطعیت. EPA-454/R-04-004، انتشارات EPA، NC.
[ 15 ] هاچینسون، MF (1995) درونیابی میانگین بارندگی با استفاده از خطوط صاف کننده صفحه نازک. مجله بین المللی سیستم های اطلاعات جغرافیایی، 9، 385-403.
https://doi.org/10.1080/02693799508902045
[ 16 ] Wahba, G. and Wendelberger, J. (1980) برخی از روشهای جدید ریاضی برای تحلیل هدف متغیر با استفاده از Splines و Cross-Validation. بررسی ماهانه آب و هوا، 108، 1122-1145.
https://doi.org/10.1175/1520-0493(1980)108<1122:SNMMFV>2.0.CO;2
[ 17 ] Belongie, S. (2016) Thin Plate Spline. بازیابی آنلاین از MathWorld—A Wolfram Web Resource، ایجاد شده توسط Eric W. Weiststein.
https://mathworld.wolfram.com/ThinPlateSpline.html
[ 18 ] Lombaert, H. (2006) ثبت دستی با صفحات نازک.
https://step.polymtl.ca/~rv101/thinplates/
[ 19 ] اسمیت، TE (2016) نوت بوک در تجزیه و تحلیل داده های مکانی.
https://www.seas.upenn.edu/~ese502/#notebook
[ 20 ] Willmott، CJ (1982) برخی از نظرات در مورد ارزیابی عملکرد مدل. بولتن انجمن هواشناسی آمریکا، 63، 1039-1313.
https://doi.org/10.1175/1520-0477(1982)063<1309:scoteo>2.0.co;2
[ 21 ] نالدر، IA و وین، RW (1998) درون یابی فضایی نرمال های اقلیمی: آزمون یک روش جدید در جنگل شمالی کانادا. هواشناسی کشاورزی و جنگل، 92، 211-225.
https://doi.org/10.1016/S0168-1923(98)00102-6
[ 22 ] Tan, Q. and Xu, X. (2014) تحلیل مقایسه ای روش های درونیابی فضایی. حسگرها و مبدل ها، 165، 155-163.

بدون دیدگاه

دیدگاهتان را بنویسید