درون یابی کریجینگ :بهترین و دقیق ترین پیش بینی های ممکن …
درون یابی کریجینگ :بهترین و دقیق ترین پیش بینی های ممکن …:یک مدل پیش بینی افسانه ای با کریجینگ مجسمه سازی کنید.زمان آن فرا رسیده است که یک مدل پیش بینی از اعصار را برای خودمان بسازیم. پیش بینی در کریجینگ قوی است .در سفر خود برای ایجاد یک سطح پیشبینی خوب، قبل از اینکه وارد کریجینگ شوید، باید برخی از مفاهیم کلیدی را درک کنید.
این مفاهیم چیست؟
زیر را بخوانید تا گام به گام دانش اصلی کریجینگ را به دست آورید.
بیایید با برخی از اصول اولیه شروع کنیم
برای درک واقعی کریجینگ، باید بدانید درون یابی چیست. مانند تمام درون یابی ها، ما مقادیر ناشناخته را در مکان های دیگر پیش بینی می کنیم.
با روش درون یابی مانند وزن دهی معکوس فاصله ، شما بدون اینکه بگویید چقدر مطمئن هستید، پیش بینی می کنید.
در اینجا یک مثال است:
ما نقطه بنفش را با گرفتن فاصله وزنی معکوس از نزدیکترین سه نقطه ورودی (مقادیر 12، 10 و 10) پیش بینی می کنیم. بر اساس فاصله، فاصله هر نقطه ورودی را محاسبه می کنیم و مقدار 11.1 را به دست می آوریم.
((12/350) + (10/750) + (10/850)) / ((1/350) + (1/750) + (1/850)) = 11.1
این دقیقاً همان روشی است که درون یابی قطعی کار می کند. به سادگی، از یک تابع از پیش تعریف شده استفاده می کند و همان چیزی است که هست .
اما به شما نمی گوید که چقدر مطمئن هستید.
درون یابی کریجینگ چیست؟
اگر هواشناسی پیش بینی کند که فردا باران خواهد بارید، چقدر مطمئن هستید که باران خواهد بارید؟
به عبارت دیگر:
کریجینگ به جای اینکه بگوییم چقدر بارندگی در مکان های خاص چقدر است، احتمال بارش در یک مکان خاص را نیز به شما می گوید .
شما از دادههای ورودی خود برای ساختن یک تابع ریاضی با نیمواریوگرام، ایجاد یک سطح پیشبینی و سپس اعتبارسنجی مدل خود با اعتبارسنجی متقاطع استفاده میکنید.
زمینآمار نه تنها سطح پیشبینی بهینه را فراهم میکند، بلکه معیاری از اطمینان از میزان احتمال درست بودن آن پیشبینی را نیز ارائه میدهد.
در همین حال، کریجینگ میتواند سطوح و سطوح پیشبینی را ایجاد کند که نشان میدهد مدل شما چقدر خوب پیشبینی میکند:
PREDICTION : این سطح مستقیم مقادیر متغیر شما را که کریج می کنید پیش بینی می کند.
ERROR OF PREDICTION : خطای استاندارد را نشان می دهد. هنگامی که داده های ورودی به اندازه کافی وجود ندارد، “استاندارد خطا” بالاتری دریافت می کنید.
احتمال : سطح احتمال زمانی برجسته می شود که از یک آستانه فراتر رود.
QUANTILE : این سطح بهترین یا بدترین سناریوها را به عنوان صدک 99 نشان می دهد.
کلید کریجینگ Semivariogram است
کریجینگ بر نیمه واریوگرام متکی است. به زبان ساده، نیم متغیره ها همبستگی خودکار را کمیت می کنند زیرا واریانس همه جفت داده ها را بر اساس فاصله نمودار می کند.
این احتمال وجود دارد که چیزهای نزدیک تر به هم مرتبط باشند و نیمه واریانس کوچکی داشته باشند. در حالی که چیزهای دور کمتر مرتبط هستند و نیمه واریانس بالایی دارند.
اما در یک فاصله (محدوده) مشخص ، خودهمبستگی مستقل می شود. در جایی که این تنوع کاهش یابد، به آن (آستانه) می گویند . این بدان معنی است که دیگر هیچ همبستگی یا رابطه مکانی بین نزدیکی نقاط داده شما وجود ندارد. این مفهوم اولین قانون جغرافیایی توبلر است .
باز هم، هدف در اینجا تناسب سطحی مانند یک چند جمله ای است که روند کلی مقیاس بزرگ را مدل می کند. سپس، حول آن روند، با باقیمانده هایی که کریجینگ وارد می شود، تغییرپذیری داریم.
بر اساس نتایج نیمه واریوگرام خود ، می توانید نیم متغیری را انتخاب کنید که کروی، دایره ای، نمایی، گاوسی یا خطی باشد. از طرف دیگر، اگر بتوانید یک توجیه فکری برای یک مدل ریاضی ایجاد کنید، آن مدل را انتخاب کنید.
حتی قبل از شروع، داده های خود را بررسی کنید
حتی قبل از شروع کریجینگ، داده های شما باید قبل از کریجینگ معمولی با این معیارها مطابقت داشته باشند .
اگر دادههای شما معیارهای خاصی را داشته باشند، کریجینگ تکنیک درونیابی بهینه است. اما اگر آن معیارها را برآورده نمی کنند، می توانید آن را ماساژ دهید یا کلا یک تکنیک درون یابی متفاوت را انتخاب کنید.
- داده های شما باید توزیع نرمال داشته باشند
- داده ها باید ثابت باشند
- داده های شما نمی توانند هیچ روندی داشته باشند
مراحل زیر روش هایی برای بررسی داده های شما برای بررسی اینکه آیا با این معیار مطابقت دارند یا خیر است. ابتدا پیشنهاد می کنیم نقاط خود را ترسیم کنید و آنها را از پایین به بالا نمادین کنید. در مثال ما از نمونه های رطوبت خاک گرفته شده در یک زمینه کشاورزی استفاده می کنیم:
فرض 1. داده های شما دارای توزیع نرمال است
در حالی که ما در حال بررسی ویژگیهای فضایی در این آزمایش نیستیم، فقط بررسی میکنیم که مقادیر نسبتاً عادی توزیع شده باشند. به عبارت دیگر، آیا مقادیر داده های شما با شکل منحنی زنگی مطابقت دارند؟
یکی از راههای کشف این موضوع استفاده از هیستوگرام است. در ArcGIS، روی تجزیه و تحلیل زمین آماری > کاوش داده ها > هیستوگرام کلیک کنید .
در این مرحله، میتوانید هیستوگرام را از نظر هر گونه پرت و اینکه چقدر شبیه یک منحنی زنگی است، بررسی کنید. در مورد ما، به نظر می رسد که توزیع نرمال نسبتا خوبی دارد.
از طرف دیگر، می توانید داده های خود را با یک طرح QQ معمولی بررسی کنید . یک نمودار QQ معمولی نحوه هماهنگی داده های شما با داده های توزیع شده معمولی را مقایسه می کند. اگر همه نقاط دارای توزیع کاملاً نرمال باشند، تمام نقاط شما روی خط 45 درجه قرار می گیرند. در مورد ما، داده ها از یک خط مستقیم پیروی می کنند.
اگر داده های شما توزیع معمولی نداشته باشد چه؟
در این حالت باید تبدیلی مانند Log یا Arcsin را اعمال کنید تا زمانی که عادی شود. به جای انتخاب تغییر شکل خود، می توانید یک تبدیل نمره عادی انجام دهید که تقریباً کار زیادی را برای شما انجام می دهد. تبدیل نمره عادی آنقدر قدرتمند است که اکنون روش پیش فرض به عنوان کریجینگ ساده در ArcGIS است. در زیر این موضوع را با جزئیات بیشتر توضیح می دهیم.
فرض 2. داده های شما ثابت است
این که داده های شما باید ثابت باشند به چه معناست؟
این بدان معنی است که تغییرات محلی در مناطق مختلف نقشه تغییر نمی کند. به عنوان مثال، 2 نقطه داده با فاصله 5 متر از هم در مکان های مختلف باید تفاوت های مشابهی در مقدار اندازه گیری شما داشته باشند. واریانس در مناطق مختلف نقشه نسبتاً ثابت است. کریجینگ برای تغییرات ناگهانی و خطوط شکست بهینه نیست.
می توانید ثابت بودن داده های خود را با یک نقشه voronoi که نماد آنتروپی (تغییر بین همسایگان) یا انحراف استاندارد است بررسی کنید و به دنبال تصادفی بودن باشید. در ArcGIS، روی تجزیه و تحلیل زمین آماری > کاوش داده ها > نقشه Voronoi کلیک کنید .
در مورد ما، مقدار کمی از خوشهبندی را میبینیم. به طور کلی، برای آنتروپی و انحراف معیار، نقشه های Voronoi نشان می دهد که مجموعه داده ها به اندازه کافی ثابت به نظر می رسند.
اگر اطلاعات شما ثابت نباشد چه کار می کنید؟
بیزی کریجینگ تجربی (EBK) می تواند با درمان واریانس محلی به طور جداگانه کمک کند. به جای اینکه واریانس تا حد زیادی مشابه باشد، EBK کریجینگ را به عنوان یک فرآیند زیربنایی جداگانه در مناطق مختلف انجام می دهد. هنوز هم کریجینگ انجام می دهد، اما به صورت محلی انجام می شود.
فرض 3. داده های شما روندی ندارند
روندها تغییر سیستماتیک داده ها در کل منطقه مورد مطالعه است . ما می توانیم تحلیل روند را با ابزار ESDA بررسی کنیم. در ArcGIS، روی تجزیه و تحلیل زمین آماری > کاوش داده ها > تحلیل روند کلیک کنید .
خط سبز روند را در جهت شرق به غرب نشان می دهد و خط آبی روند را در جهت شمال به جنوب نشان می دهد. به طور کلی، ما در مرکز مقادیر رطوبت خاک بالاتری داریم. اما روند کافی در داده های ما وجود ندارد که نیاز به حذف داشته باشد.
اگر داده های شما دارای روندهای سیستماتیک باشد چه؟
اگرچه وجود روندهای بزرگ در کل منطقه مطالعه شما ممکن است دلیلی برای تغییر روش های درون یابی به طور کلی باشد، ابزار حذف روند می تواند کمک کند تا تحلیل زیر تحت تأثیر آن روند در داده های شما قرار نگیرد.
مثال Kriging در ArcGIS
پس از بررسی داده های خود برای معیارهای بالا، می توانید روی تجزیه و تحلیل زمین آمار > جادوگر زمین آمار کلیک کنید .
… و اکنون سرگرمی واقعاً شروع می شود، با کنایه گفته می شود.
مرحله 1. یا Kriging/Co-Kriging را انتخاب کنید
اکنون که جادوگر زمین آماری را باز کرده اید، کریجینگ تحت روش های زمین آماری است. همانطور که قبلا ذکر شد، این به این دلیل است که شما سطح پیشبینی بهینه خود را با نیمواریوگرام میسازید و میتوانید معیاری از اطمینان از میزان احتمال درست بودن آن پیشبینی را تخمین بزنید.
توجه کنید که اگر یک ورودی واحد را انتخاب کنید، به سادگی کریجینگ می شود. اما وقتی یک متغیر دوم را اضافه می کنید، ناگهان تبدیل به co-kriging می شود .
اگر 2 یا چند متغیر دارید که به نحوه تغییر بارندگی در مناطق کوهستانی مربوط می شود، می توانید داده های ارتفاع را به عنوان متغیر کمکی به مقادیر بارندگی اضافه کنید. در این صورت می توانید با اطلاعات ثانویه پیش بینی را بهبود ببخشید.
مرحله 2. نوع Kriging را انتخاب کنید
حالا بیایید یک قدم به عقب برگردیم تا بفهمیم همه گزینه ها به چه معنا هستند. در این مرحله چیزهای زیادی برای جذب وجود دارد.
کریجینگ معمولی پیش فرض در ArcGIS 10.0 بود. اکنون به دلیل تبدیل نمره عادی، کریجینگ ساده پیشفرض است. به طور خاص، کریجینگ ساده از یک تبدیل نمره نرمال استفاده می کند که داده های شما را به یک توزیع نرمال استاندارد تبدیل می کند.
همانطور که قبلا ذکر شد، این یکی از معیارهای ضروری برای انجام کریجینگ است. برای کاربران اصلی، بهترین گزینه استفاده از رویکرد ساده کریجینگ است. اما انواع دیگر کریجینگ پیچیده تر وجود دارد:
UNIVERSAL KRIGING
تجزیه و تحلیل سطح روند (رانش) را با کریجینگ معمولی با محاسبه روندها ترکیب می کند.
احتمال کریجینگ از داده های باینری (مشابه کریجینگ نشانگر) استفاده می کند و نقاط ناشناخته را برای یک سری از برش ها تخمین می زند.
در نهایت، می توانید به صورت دستی نوع تبدیل و حذف روند خود را در این مرحله تنظیم کنید. به عنوان مثال، اگر می خواهید تبدیل خود را به log تغییر دهید، این زمانی است که می توانید این تغییر را انجام دهید.
مرحله 3. مدل سازی داده ها با نیمه واریوگرام
در این مثال، ما از کریجینگ معمولی برای اهداف نمایشی استفاده می کنیم. جادوگر زمین آماری نیم متغیری با صلیب های آبی ایجاد می کند که میانگین تغییرات را برای هر جفت نقطه نشان می دهد.
اندازه تاخیر اندازه یک کلاس فاصله است که در آن جفت مکان ها گروه بندی می شوند. به عنوان یک قاعده کلی، می توانید اندازه تاخیر را در تعداد تاخیرهای آن ضرب کنید تا برابر با نیمی از بزرگترین فاصله در بین تمام نقاط باشد. اگر نقاط شما خوشهبندی نشدهاند، میتوانید ابزار «میانگین نزدیکترین همسایه» را اجرا کنید که میانگین فاصله بین نقاط را به شما میگوید.
ArcMap قابلیت بهینه سازی تمام این پارامترها را برای شما اضافه کرده است. وقتی روی دکمه بهینهسازی کلیک میکنید، مقداری را برای هر پارامتری که منجر به کوچکترین خطای ریشه میانگین مربع میشود، پیدا میکند. این آزمون و خطای زیادی برای کاربر برای آزمایش هر سناریو خواهد بود. در نهایت، معمولاً بهتر است با مدل نیمهواریوگرامای که نرمافزار آن را بهترین است، استفاده کنید.
برای منطقه مورد مطالعه ما، در اینجا نیمواریوگرام به نظر میرسد:
مرحله 4. نقشه مدل با وزن کریجینگ
پس از اینکه از نیمه واریوگرام نصب شده خود راضی شدید، جادوگر یک سطح پیش نمایش با پارامترهای حتی بیشتر برای سفارشی کردن خروجی ارائه می دهد. کاری که کریجینگ انجام می دهد پیش بینی پاسخ ها در هر مکان با استفاده از میانگین وزنی با نزدیک ترین همسایگان است. اما ابتدا باید تعداد نقاط (حداکثر و حداقل) را برای استفاده در شعاع جستجوی خود تنظیم کنید .
علیرغم صحبتهای زیاد در مورد اهمیت نیمواریوگرامها در کریجینگ، این مرحله به شدت بر خروجی نقشه شما تأثیر میگذارد. اگر هر یک از این پارامترها را تغییر دهید، واقعاً می تواند ظاهر و احساس سطح را تغییر دهد.
اگر یکی از نوع بخش برش را انتخاب کنید ، این تضمین می کند که در هر یک از آن برش ها امتیازهایی برای تخمین وجود دارد. به عنوان مثال، اگر از یک پای چهار برشی استفاده کنید و همسایگان خود را روی 5 تنظیم کنید، هر برش از 5 امتیاز (در مجموع 20) برای تخمین های محلی استفاده می کند. از آنجایی که هیچ فرمول مجموعه کاملی وجود ندارد، نکته کلیدی این است که مقادیر پیشبینیشده را بررسی کنید تا احساس کنید خروجی چگونه باید باشد.
مرحله 5. نتایج تأیید متقابل را بررسی کنید
مرحله اعتبارسنجی متقابل برای کریجینگ یکی از نقاط داده ورودی شما را می گیرد و آن را از مجموعه داده خارج می کند. با استفاده از تمام نقاط باقی مانده، پیش بینی را به آن مکان برمی گرداند. مجدداً، می دانید که مقدار واقعی چیست، این فرآیند از تمام باقیمانده برای پیش بینی آن مقدار استفاده می کند.
برای اعتبارسنجی متقاطع، در تمام نقاط ورودی شما تکرار می شود تا زمانی که کامل شود. سپس، این جدول خلاصه از باقیمانده ها را ایجاد می کند که مقادیر واقعی را با مقادیر پیش بینی شده مدل شما مقایسه می کند. آنچه این جدول نشان می دهد این است که مدل شما واقعاً چقدر قوی است.
بنابراین مقادیر واقعی چقدر به مقادیر پیش بینی شده نزدیک هستند؟ به عبارت دیگر، مدل شما چقدر با داده ها مطابقت دارد؟ برای در نظر گرفتن همه این موارد، ریشه میانگین مربعات استاندارد شده خود را بررسی کنید ، زیرا باید نزدیک به 1 باشد. علاوه بر این، ریشه میانگین مربعات خطا باید تا حد امکان کوچک باشد.
لایه زمین آماری پویا
از آنجایی که خروجی یک لایه زمین آماری است، پویا است، به این معنی که می توانید نوع خروجی آن را به صورت پیش بینی، خطاهای پیش بینی، احتمال یا چندک تغییر دهید. یا حتی می توانید به لایه زمین آماری برگردید و اگر خروجی بهینه شده را دوست ندارید، پارامترها را تغییر دهید.
کریجینگ علم و هنر دارد.
نه تنها نحوه انتخاب مدل خود از نیمواریوگرام، بلکه نحوه تنظیم تعداد سطلها و سایر تنظیمات نیز مهم است. این هنر کریجینگ است.
وقتی سطح کریجینگ خود را نشان میدهید، مانند انتخاب تعداد فواصل، میتواند تأثیر متفاوتی بر نتایج داشته باشد. در حالی که کلاسهای بیشتر جزئیات بیشتری را ارائه میدهند، روش طبقهبندی دادهها (مانند چندک یا فاصله مساوی) دادههای شما را متفاوت ترتیب میدهد.
پیشبینی در کریجینگ قوی است
پیشبینی فضایی شامل برخی مؤلفههای تصادفی است. هنگامی که شما در حال استنباط بر روی یک مجموعه داده هستید، این در مورد زمین آمار بسیار مهم است.
وزن کریجینگ شما از روی واریوگرام تخمین زده می شود. به طور خاص، از مدلی که انتخاب میکنید مشتق شده است. کیفیت سطح تخمین زده شده در کیفیت وزن ها منعکس می شود. شما وزنه هایی می خواهید که پیش بینی بی طرفانه و کوچکترین واریانس را داشته باشند.
به عبارت دیگر کریجینگ الگوی فضایی را پیدا می کند. سپس مقادیر ناشناخته را بر اساس آن الگوی فضایی پیش بینی می کند. با این پیشبینیها، کریجینگ معیاری از خطا یا عدم قطعیت ایجاد میکند. این بدان معنی است که شما می توانید اطمینان را در سطح پیش بینی تخمین بزنید که آنها درست هستند نه به دلیل شانس تصادفی.
زیرا نه تنها تابع ریاضی خود را برای ساختن یک تابع سفارشی می کنید، بلکه از قدرت تجزیه و تحلیل آماری نیز استفاده می کنید – یعنی نیمه متغیر.
کریجینگ یک روش زمین آماری است که مقدار را در یک منطقه جغرافیایی با مجموعه ای از اندازه گیری ها پیش بینی می کند. این در معدن، خاک، زمین شناسی و علوم محیطی استفاده می شود.
هیچ روش واحدی برای همه افراد کار نمی کند. از آنجایی که به دادههای شما مربوط میشود، فقط شما میتوانید تصمیم بگیرید که این تنظیمات چه هستند و چگونه میتوانید سطح پیشبینی را ایجاد کنید.
11 نظرات