رگرسیون خطی

آمارفضایی-جلد-یک


روش کريجينگ[1]

اين روش،که در عمل رايج­ترين روش درونيابي محسوب مي­شود، به افتخار دي جي کريگ[2] از دانشمندان علم زمين­آمار نامگذاري شده است. معادله عمومي کريجينگ به­صورت زير است:

https://gisland.org/

(5-2)

که  مقدار مجهول در نقطه ،  وزن نقطه معلوم  در محاسبه مقدار مجهول،  مقدار معلوم در نقطه معلوم  و  پارامتري موسوم به خطاي تصادفي مي­باشد. معادله عمومي کريجينگ با دو تفاوت، شبيه به معادله  مي­باشد:

الف) فرآيند محاسبه  متفاوت از روش  است و علاوه بر رابطه مکاني بين نقطه مجهول و نقاط معلوم، روابط مکاني حاکم بر نقاط معلوم (خودهمبستگي مکاني) نيز در محاسبه آن دخالت دارد.

ب) محاسبه مقدار مجهول با يک خطاي تصادفي همراه مي­باشد، چرا که روش کريجينگ يک روش جبري (قطعي) نيست و يک روش آماري مي­باشد.

 

5-3-3-1-1 مراحل درونيابي به روش کريجينگ

هر چند که درونيابي کريجينگ تقريباً پيچيده مي­باشد و روش­هاي مختلفي براي اجراي آن ابداع شده است، اما در اين کتاب سعي شده به طور ساده به شرح مراحل اين روش پرداخته شود:

 

  • آزمون توزيع داده­ها

چون کريجينگ يک روش زمين­آماري است و مبتني بر تصادفي بودن متغير مورد بررسي است، لذا روش­هاي زمين­آماري همچون کريجينگ معمولاً در شرايطي که داده­ها از توزيع نرمال تبعيت کنند، با کمترين خطا مقدار يا مقادير مجهول را درونيابي مي­کنند. براي تعيين نرمال بودن يا نبودن توزيع داده­ها روش­هاي مختلفي وجود دارد که از مهمترين آن­ها عبارتند از:

– ترسيم نمودار توزيع فراواني داده­ها:

مي­دانيد در صورتي­که داده­ها توزيع نرمال داشته باشند، نمودار توزيع فراواني آن­ها حالت
زنگوله­اي شکل خواهد داشت و شبيه به شکل زير است. در اين حالت 50 درصد داده­ها پايين­تر از ميانه و 50 درصد داده­ها بالاتر از ميانه قرار مي­گيرند. در صورت انحراف از نرمال بودن توزيع داده­ها با چوليـدگي مواجه خواهد بود. اين چوليـدگي ممـکن است مثبت يا منفـي باشد (شکل 5-14).

https://gisland.org/

شکل 5-14: نمودار توزيع نرمال فراواني

– ترسيم نمودار چندک-چندک :

برای هر مقدار داده نمودار  مقدار مشاهده شده (محور ) و مقدار مورد انتظار (حالتی که داده­های نمونه دارای توزیع نرمال است) (محور ) را نشان می دهد. اگر داده­ها توزیع نرمال داشته باشند نقاط باید اطراف یک خط صاف جمع شوند در غير اين­صورت نسبت به خط صاف داراي انحراف هستند (شکل 5-15).

– محاسبه ضريب چوليدگي:

مقدار اين ضريب که براي نمونه­هاي آماري با رابطه زير محاسبه مي­شود، در توزيع نرمال برابر با صفر است. ضريب منفي نشاندهنده چوليدگي منفي و ضريب مثبت نشان دهنده چوليدگي مثبت مي­باشد.

https://gisland.org/

(5-3)

که  ضريب چوليدگي،  مقدار متغير،  ميانگين مقادير و  تعداد داده­ها مي­باشد.

https://gisland.org/

شکل 5-15:  نمودارهاي فراواني و  براي انواع مختلف توزيع

 

– محاسبه ضريب کشيدگي[3]:

مقدار اين ضريب که براي نمونه­هاي آماري با رابطه زير محاسبه مي­شود، در توزيع نرمال برابر با 3 مي­باشد. اين ضريب براي نمونه­هاي پخ­تر از نرمال بيشتر از 3، و براي توزيع­هاي کشيده­تر کمتر از 3 مي­باشد (شکل 16.5).

https://gisland.org/

(5-4)

که  ضريب پخي،  مقدار متغير،  ميانگين مقادير و  تعداد داده­ها مي­باشد.

https://gisland.org/

شکل 5-16:  مقايسه انواع کشيدگي در توزيع فراواني داده­ها

 

  • نرمال­سازي داده­ها

در صورتي­که داده­هاي مربوط به نقاط معلوم فاقد توزيع نرمال باشند، لازم است يا:

الف) داده­ها را با روش­هاي موجود نرمال­سازي کرد. اين فرآيند زماني انجام مي­شود که تغيير داده­ها و نرمال کردن آن­ها از نظر پژوهشگر تأثيري بر نتيجه نهايي پژوهش نداشته باشد.

ب) براي درونيابي مقادير معلوم و تخمين مقدار يا مقادير مجهول از روش کريجينگ استفاده نکرد. متأسفانه در تعداد زيادي از مقاله­ها و نوشتارهاي علمي در کشور بدون در نظر گرفتن پيش­فرض نرمال بودن داده­ها، از روش­هاي مختلف کريجينگ استفاده شده است.

روش­هاي متعددي براي نرمال کردن داده­ها وجود دارد که از مهمترين آن­ها عبارت است از:

– تبديل باکس-کاکس[4]:

اين تبديل بر اساس معادله زير انجام مي­شود:

https://gisland.org/

(5-5)

که  مقدار متغير پس از نرمال­سازي،  مقدار متغير قبل از نرمال­سازي مي­باشد. اگر باشد، فرض مي­شود که مقادير معلوم ترکيبي از چند پديده مي­باشند. براي اين نوع
داده­ها واريانس­ها به ميانگين وابسته است. براي مثال اگر توزيع متغير يکنواختي مکاني نداشته باشد، در قسمتي از ناحيه مورد مطالعه، که تعداد نمونه­هاي کمتري برداشت شده، واريانس نمونه­ها کمتر از قسمتي مي­شود که نمونه­هاي بيشتري وجود دارد. بنابراين اين تبديل به افزايش يکنواختي واريانس نمونه­ها کمک مي­کند (قهرودي و بابايي، 1393).

– تبديل لگاريتمي[5]:

وقتي باشد، تبديل باکس-کاکس کاربردي نداشته و از تبديل لگاريتمي استفادهمي­شود:

https://gisland.org/

(5-6)

که  مقدار متغير پس از نرمال­سازي و  مقدار متغير قبل از نرمال­سازي مي­باشد. وقتي باشد،  لگاريتم طبيعي است. تبديل لگاريتمي براي توزيعي به­کار مي­رود که داراي چوليدگي کم و تعداد نمونه­ها بزرگ باشد يا نمونه­ها در قسمتي متمرکز باشند. در اين صورت اين تبديل مي­تواند توزيع واريانس را يکنواخت و داده­ها را به توزيع نرمال نزديک کند (قهرودي و بابايي، 1393).

– تبديل آرک­سين[6]:

اين تبديل در شرايطي به­کار مي­رود که  بين صفر و يک باشد؛ به عبارتي مقادير معلوم ب­صورت کسري يا درصد باشند. اين تبديل نيز توزيع واريانس داده­ها را يکنواخت مي­سازد.

https://gisland.org/

(5-7)

که  مقدار متغير پس از نرمال­سازي،  مقدار متغير قبل از نرمال­سازي مي­باشد.

 

  • تشخيص و حذف روندهاي عمومي در داده­ها

در صورتي­که وجود يک عامل فيزيکي در منطقه مورد مطالعه، باعث ايجاد تغييري جهت­دار (روند عمومي) در مقادير داده­ها شود، مي­توان با روابط رياضياتي (براي نمونه روابط رگرسيوني) روند مزبور را شناسايي و حذف کرد. براي نمونه در شکل زير روند کلي تغييرات آلودگي هوا که تحت تأثير باد غالب قرار گرفته نشان داده شده است. تغييرات آلودگي در جهت شرق به غرب کمتر از جهت شمال به جنوب است، زيرا جهت شرقي-غربي موازي باد غالب است، اما جهت شمالي-جنوبی عمود بر جهت باد است. در اين­جا روند کلي تحت تأثير يک عامل فيزيکي است (در اين جا باد غالب) و توسط معادله­هاي رياضياتي مدلسازي مي­شود. به عنوان مثال در شکل 5-18، غلظت کلرايد اندازه­گيري شده در برخي از چاه­هاي يک منطقه­ در استان فارس (محور ) در برابر مقادير x و  جغرافيايي پياده­ شده است. مطابق با اين شکل در جهت x يک روند عمومي درجه 3 و در جهت  يک روند عمومي درجه 2 وجود دارد که به واقع شدن يک گنبد نمکي در مرکز منطقه نسبت داده مي­شود.

https://gisland.org/

شکل5-17: روند کلي آلودگي هوا توسط باد غالب

https://gisland.org/

شکل 5-18: روند عمومي درجه 3 و درجه 2 در داده­هاي کلر اندازه­گيري شده در چاه­هاي یکي از مناطق استان فارس

 

  • محاسبه نيم واريوگرام تجربي[7]

همان­طور که گفته شد، کريجينگ مانند بيشتري فنون زمين­آماري، تحت اين فرض انجام
مي­شود که چيزهايي که نزديک به يکديگر قرار دارند، از چيزهايي که از هم دور هستند، به­هم شبيه­تر هستند (خودهمبستگي مکاني). نيم­واريوگرام تجربي نموداري براي کشف اين ارتباط است. در اين نمودار محور  نشان دهنده فاصله زوج نقاط معلوم و محور  نشان­دهنده
نيم­واريانس بين زوج نقاط معلوم مي­باشد. فاصله بين دو نقطه معلوم  و  به صورت فاصله خط مستقيم (فاصله اقليدسي) و با رابطه زير محاسبه مي­شود:

https://gisland.org/

(5-8)

که  فاصله زوج نقطه و  و  مختصات مکاني هر کدام از نقاط مي­باشد. نيم­واريانس بين دو نقطه  و  نيز از رابطه ساده زير به­دست مي­آيد:

https://gisland.org/

(5-9)

که  نيم­واريانس بين دو نقطه معلوم  و  و و مقدار متغير در دو نقطه معلوم  و  مي­باشد. در شکل 5-19 يک نيم­واريوگرام تجربي مربوط به نقاط نمونه­برداري و اندازه­گيري غلظت نيتروژن خاک در اراضي کشاورزي در يک منطقه از استان گلستان نشان داده شده است (کاظمي و همکاران، 1390). محورهاي افقي و عمودي اين نمودار به ترتيب نشاندهنده  فاصله و نيم­واريانس بين زوج نقاط  و  مي­باشند. هر نقطه در اين نمودار بيانگر يک زوج نقطه معلوم مي­باشد. با دقت در اين نمودار مي­توان متوجه شد که با افزايش فاصله زوج نقاط معلوم از يکديگر، ميزان شباهت آن­ها کاهش مي­يابد. به عبارت ديگر با افزايش فاصله، مقدار نيم­واريانس زوج نقاط معلوم، که نشاندهنده تفاوت بين دو نقطه معلوم است، افزايش مي­يابد. اين موضوع دال بر خودهمبستگي مکاني داده­هاي جغرافيايي و تبعيت آن­ها از قانون توبلر مي­باشد.

https://gisland.org/

شکل 5-19: نيم­واريوگرام تجربي مربوط به مقادير نيتروژن خاک در يک منطقه از استان گلستان (کاظمي و همکاران، 1390)

  • برازش مدل کريجينگ به نيم­واريوگرام تجربي

آن چه در نيم­واريوگرام تجربي ديده مي­شود، ساخته دست طبيعت است و هيچ گونه مدلسازي خاصي در تهيه آن انجام نشده است. براي اين­که معادله رياضياتي بين مقادير  و  محاسبه شده و با استفاده از اين معادله بتوان مقدار را در نقطه مجهول تخمين زد، مدل­هاي مختلف کريجينگ ابداع شده است که شرح کامل آن­ها خارج از بحث اين نوشتار مي­باشد. به طور مثال اگر با عبور يک خط برازش بين نقاط واريوگرام معادله ساده زير حاصل شود:

https://gisland.org/

(5-10)

 

براي محاسبه (مقدار در نقطه مجهول  کافي است فاصله اين نقطه را تا يکي از نقاط معلوم محاسبه کرده و عدد حاصل را در معادله گذاشت و مقدار  (نيم­ريانس بين نقطه مجهول و يکي از نقاط معلوم) را به­دست آورد. سپس با توجه به معادله نيم­واريانس  و معلوم بودن  مي­توان را به دست آورد.

با برازش دادن يک مدل به نقاط موجود در نيم­واريوگرام تجربي، واريوگرام جديدي با عنوان “واريوگرام مدل[8]” به دست مي­آيد. در صورتي که فقط عامل فاصله باعث ايجاد خودهمبستگي مکاني بين مقادير معلوم شود و جهت قرارگيري نقاط معلوم تأثيري در اين خودهمبستگي نداشته باشد، نيم­واريوگرام را “همسانگرد[9]“مي­نامند. شکل و شمايل کلي نيم­واريوگرام­هاي همسانگرد در شکل (5-20) نشان داده شده است. مهمترين بخش­هاي اين واريوگرام­ها عبارتنداز:

https://gisland.org/

شکل 5-20: اجزاي نيم واريوگرام همسانگرد

الف) سقف نيم­واريوگرام[10]

با افزايش فاصله زوج نقاط معلوم نسبت به يکديگر (که در نيم­واريوگرام­هاي مدل با  نشان داده مي­شود)، مقدار نيم­واريانس از مقادير کم شروع شده و سپس به يک مقدار ثابت مي­رسد و بعد از آن با افزايش فاصله، مقدار نيم­واريانس تغيير نمي­کند. به اين مقدار نسبتاً ثابت که تغييرات آن تصادفي است، سقف نيم­واريوگرام گويند. در درونيابي به روش کريجينگ در صورتي که
نيم­واريانس زوج نقاط معلوم بيشتر از سقف نيم­واريوگرام شود، درونيابي با خطا مواجه خواهد شد (حسني­پاک، 1377).

ب) جداره نيم­واريوگرام[11]

قسمت شيب­دار نيم­واريوگرام است و نشان­دهنده وجود خودهمبستگي فضايي بين مقادير متغير در نقاط معلوم مي­باشد.

 

ج) قطعه نيم­واريانس[12]

معمولاً نيم­واريوگرام مدل از مبدأ مختصات شروع نمي­شود و يک اثر قطعه­اي بر روي مقادير نيم­واريانس وجود دارد. اين قطعه نيم­واريانس نشان مي­دهد که حتي اگر فاصله دو نقطه معلوم صفر باشد، مقدار آن­ها لزوماً برابر نيست. اين موضوع نشان دهنده تصادفي بودن فرآيند
نمونه­برداري مي­باشد به عبارتي ديگر در يک عمليات نمونه­برداري مقدار هيچ دو مقدار معلومي با هم برابر نيست.

 

د) دامنه تأثير[13]

فاصله­اي است که بعد از آن، مقادير در نقاط معلوم با يکديگر داراي خودهمبستگي فضايي نيستند، زيرا توزيع يک متغير جغرافيايي با ساختار فضايي به گونه­اي است که تشابه آن­ها براي نقاط نزديک به هم نسبت به نقاط دور بيشتر است. بديهي است که دامنه تأثير بزرگتر دلالت بر ساختار فضايي گسترده­تر دارد (حسني­پاک، 1377).

در نيم­واريوگرام­هاي ناهمسانگرد که خودهمبستگي فضايي بين نقاط معلوم در جهت­هاي مختلف آن؛ متفاوت است، سقف نيم­واريوگرام در تمامي جهت­ها با يکديگر برابر است اما مقادير دامنه­ها متفاوت مي­باشند (شکل 5-21).

https://gisland.org/

شکل 5-21: نيم­واريوگرام ناهمسانگرد

مدل­هاي کريجينگ متنوعي ابداع شده است که از مهمترين آن­ها مي­توان به کريجينگ ساده[14]، کريجينگ معمولي[15] و کريجينگ عمومي[16] اشاره کرد. شرح جزييات مدل­هاي مزبور خارج از بحث اين کتاب است و خوانندگان مي­توانند به منابعي چون قهرودي و بابايي (1393) و (کيتانيديس[17]، 1997) مراجعه کنند.

[1] Kriging

[2] D.G Krig

[3] Kurtosis

[4] Box-Cox Transformation

[5] Log Transformation

[6] Arcsine Transformation

[7] Empirical Semivariogram

[8] Model Semivariogram

[9] Isotropic

[10] Sill

[11] Partial Sill

[12] Nugget

[13] Range

[14] Simple

[15] Ordinary

[16] Universal

[17] Kitanidis

برگرفته از : کتاب آمار فضایی (تحلیل داده های مکانی)

نویسندگان: سعید جوی زاده, ساره حدادی, محمد صادق درانی نژاد

انتشارات آکادمیک تهران

تلفن تماس سفارش کتاب:  09382252774

وبسایت آموزشی:  www.gisland.org

لینک سفارش کتاب:   https://ketabpage.ir/shop/

زمین آمار

آشنایی با مفاهیم کواریانسآمار فضاییآمار کلاسیکآموزش آمار فضاییآموزش امار فضاییآموزش زمین آمارآموزش زمین آمار در آرک جی آی اسآموزش زمین آمار در جی آی اسآموزش زمین آمار در نرم افزار ArcGISآموزش زمین آمار در نرم افزار GISآموزش زمین آمار در نرم افزار جی آی اساندازه گیری توزیع جغرافیاییبسته آموزشی زمین آمار در gisبهترین دوره آموزش زمین آمار در gisبهترین دوره آموزش زمین آمار در جی ای استحلیل اکتشافی داد هاتحلیل الگوهاتحلیل خوشه و ناخوشهتحلیل لکه های داغتدریس خصوصی امار فضاییتهیه نقشه های خوشه هاتوزیع جهتجامع ترین بسته آموزشی زمین آمارجزوه آمار فضاییجوی زادهخود مبستگی فضاییخوشه های زیاد /کمخوشه های فضایی چند جمله ایداده های آمار فضاییداده های امار فضاییدوره آمار فضاییدوره امار فضاییدوره زمین آمار در gisدوره زمین آمار در جی آی اسرابطه فضاییرگرسیون وزنی جغرافیاییروابط فضایی و همبستگیروش معکوس فاصلهزمین آمارزمین آمار در arcgisزمین آمار در gisزمین آمار در جی آی اسزمین آمار در نرم افزار ArcGISسعید جوی زادهشیرازعارضه مرکزیعکوس فاصلهفاصله استاندارفاصله اقلیدسیفاصله منهتنفیلم آمار فضاییفیلم آموزشی زمین آمار در gisفیلم آموزشی زمین آمار در جی آی اسکاربرد آمار فضایی در آبشناسیکاربرد آمار فضایی در اقتصادکاربرد آمار فضایی در اقلیم شناسیکاربرد آمار فضایی در برنامه ریزی شهریکاربرد آمار فضایی در بهداشتکاربرد آمار فضایی در تکتونیککاربرد آمار فضایی در جغرافیاکاربرد آمار فضایی در زمین شناسیکاربرد آمار فضایی در کشاورزیکاربرد آمار فضایی در محیط زیستکاربرد آمار فضایی در معدنکارگاهکارگاه آمار فضاییکتاب آمار فضاییکلاس آمار فضاییکلاس زمین آمار در gisکلاس زمین آمار در جی آی اسمدرس دوره آموزش زمین آمار در GISمدلسازی فضاییموسسه چشم اندازموسسه چشم انداز شیرازموسسه علمی تحقیقاتیمیانگین جهت خطوطمیانگین مرکزینرم افزار آمار فضاییهمبستگی و رگرسیونویدئو آموزش زمین آمار در GISویدئو آموزش زمین آمار در جی آی اس

115 نظرات

دیدگاهتان را بنویسید