آماره I موران-موسسه چشم انداز هزاره سوم ملل-آموزش کاربردی GIS و RS

اين آماره که با عنوان “خودهمبستگی فضایی” نيز معروف است، یکی از کاربردی ترین ابزارهای تحلیلی داده های فضایی است. با استفاده از اين آماره می توان درجه پراکندگي یا متمرکز بودن عوارض یا داده های فضایی را در فضا اندازه گیری کرد (آران ، 2013). گارس و توماکو (2013)، معتقد است که در طبقه بندي الگوهاي فضايي، خواه خوشه اي باشد يا پراکنده و تصادفي، می‌توان بر چگونگي نظم و ترتيب قرارگيري واحدهاي ناحيه اي متمرکز شده و مشابهت و عدم مشابهت هر جفت از واحدهاي ناحيه اي مجاور را اندازه گرفت. وقـتي که اين مشابهت و عدم مشابهت ها براي الگـوهـاي فضـايي خلاصه شوند، نوعي خودهمبستگي فضايي شکل مي گيرد.
به عبارتی دیگر خود همبستگي فضايي ابزاري ارزشمند در مطالعاتي است که چگونگي تغيير الگوهاي فضايي را در طول زمان مد نظر قرار مي دهند. خود همبستگی وقتی قوی معرفی می شود که مقادیر یک متغیر که از نظر جغرافیایی به هم نزدیک هستند با هم مرتبط باشند (اگر عوارض و یا مقادیر متغیر های مربوط به آن ها به طور تصادفی در فضا توزیع شده باشند، ظاهراً ارتباطی بین آن ها وجود ندارد). به عبارت دیگر خود همبستگی فضایی به رابطه بین مقادیر خطا در طول خط رگرسیون مربوط می شود. در صورتی که مقادیر خطا با هم در ارتباط باشند خود همبستگی قوی است (عسکری، 1390). به شکل زیر توجه کنید.

فرضیاتی که در ارتباط با آماره I موران به کار مي روند عبارتند از:

– فرضیه صفر: هیچ نوع خوشه بندی فضایی در مقادیر خصیصه مورد مطالعه برای عوارض وجود ندارد.
– فرضیه مقابل: الگوی فضایی در مقادیر خصیصه مورد مطالعه برای عوارض وجود دارد.
مقدار I موران از رابطه زير محاسبه مي شود:

در رابطه فوق وزن فضایی بین عارضه i و j می باشد، n تعداد کل عوارض جغرافیایی موجود در منطقه مورد مطالعه، yi و yj به ترتیب مقدار مشاهده شده متغیر مورد نظر در منطقه i و j است و y ̅ میانگین مقادیر مشاهده شده مي باشد.

مقادیر نزدیک 1+ نشان دهنده الگوی خوشه ای و مقادیر 1- نشاندهنده یک الگوی پراکنده است. سرانجام، مقادیر نزدیک صفر نشان دهنده عدم وجود الگوی فضایی هستند (موران ، 1948). در عین حال، باید به خاطر داشت که دامنه تغییرات آماره I موران دقیقاً متناسب با [1، 1-] نیست و با ضریب همبستگی معمولی متفاوت است.

علاوه بر این تفسیر توصیفی، یک چارچوب آماری نيز وجود دارد که امکان تشخیص انحراف معنادار از الگوی تصادفی را به وجود آورده است. در یک آزمون تقریبی مي توان فرض کرد که وقتی تعداد پهنه ها (n) به اندازه کافی بزرگ باشد (بزرگتر از 30)، I داراي یک توزیع نرمال با میانگین و واریانس زیر است:

که در اين جا:

همچنين مقدار (V(I را از رابطه زير نيز مي توان محاسبه کرد:

حال زمانی که مقدار P-Value بسیار کوچک و مقدار Z محاسبه شده (قدرمطلق آن) بسیار بزرگ باشد (خارج از محدوده ی اطمینان قرار گیرد)، می توان فرضیه صفر را رد کرد. روابط اشاره شده در بالا (روابط 9-13 و 9-14) با فرض نرمال بودن داده ها نگاشته شده اند.

تحلیل خودهمبستگی فضایی موران الگوی توزیع عوارض در فضا را با ملاحظه هم زمان موقعیت مکانی و عارضه مورد مطالعه، مورد ارزیابی قرار می دهد.

آماره C جییری

آماره C جییری (1954)، که “نسبت وابستگیِ گری” هم نامیده می شود، یک آماره پرکاربرد برای اندازه گیری میزان خودهمبستگی فضایی است و به صورت زير تعريف مي شود:

مقدار این آماره تقریباً بین 0 و 2 تغییر می کند. وقتی خود همبستگی فضایی مثبت وجود داشته باشد، پهنه هايي که نزدیک به هم هستند، مقادیر مشابه دارند و C جییری به عدد صفر نزديک مي شود. همچنين وقتی خود همبستگی فضایی منفی وجود داشته باشد، پهنه هاي نزدیک به هم مقادیر کاملاً متفاوت داشته و C جییری به عدد 2 نزدیک می شود. صرف نظر از تعداد واحدهای فضایی (پهنه ها) در یک منطقه مورد مطالعه؛ مقدار پیش بینی شده آماره C جییری براساس فرضیه صفرِ عدم وجود الگوی فضایی، برابر با عدد یک است، يعني:است. با فرض نرمال بودن، مقدار واریانس عبارت است (جانوس ، 2015):

به طور کلی آماره I موران در قیاس با آماره C جییری قدرت آماری بالاتری داشته و بهتر می تواند خودهمبستگی فضایی را در صورت وجود شناسایی نماید (کليف و اُرد ، 1981؛ هاينينگ ، 1990).

پرسش 2)
اگر در يک محدوده مطالعاتي مشتمل بر 6 پهنه تفکيک شده، مشاهداتي (نمونه برداري) به شرح جدول زير انجام شده باشد

الف) مقدار آماره I موران را محاسبه کرده و وضعيت خودهمبستگي فضايي را مشخص کنيد.
ب) مقدار آماره C جییري را محاسبه کرده و بر اين اساس وضعيت خود همبستگي فضايي را مشخص کنيد.

جواب:
مثال ساده بالا شامل 6 پهنه است. بنابراین یک ماتریس وزنی پیوستگی دودوئی برای 6 پهنه وجود دارد. در اینجا اگر پهنه هاي i و j مجاور باشند،و در غیر اینصورتاست. با در نظر گرفتن

الف) تعيين آماره I موران:

 

و مقدار I موران عبارت است از:

بنابراين مقداری خودهمبستگی فضایی مثبت است ولی این خودهمبستگی قوی نمی باشد.

ب) محاسبه آماره C جییري:

چون مقدار حاصل بین 0 و 1 است، خودهمبستگی فضایی مثبت در الگوی فضایی مشاهدات وجود دارد.

آماره عمومي گتيس و اُرد

آماره عمومي گتيس و اُرد زماني به کار مي رود که وجود الگوی خوشه ای در نقاط برداشت داده ها محرز است اما پژوهشگر مي خواهد بداند که مقادیر زیاد موجب الگوی خوشه بندی شده یا مقادیرکم خوشه ها را ايجاد کرده است (بوتس و همکاران، 1988).
فرضیه روش خوشه بندی زیاد یا کم به صورت زیر تعریف می شود:

– فرضیه صفر: هیچ نوع خوشه بندی فضایی در مقادیر متغير مورد نظر برای عوارض موجود در منطقه مورد مطالعه وجود ندارد.

– فرضیه مقابل: الگوی خوشه بندی فضایی زیاد (مثبت) یا کم (منفي) در مقادیر متغير مورد نظر برای عوارض موجود در منطقه مورد مطالعه وجود دارد.

هدف از استفاده شاخص آماره عمومی G تشخیص وجود و یا عدم وجود خوشه بندی زیاد و یا کم در داده های فضایی است (برنهام ، 2002). اين شاخص با استفاده از رابطه زير قابل محاسبه مي باشد:

که در اینجا m تعداد پهنه ها و (ωij(d وزن براساس مجاورت فضایی میان مناطق i و j است. این آماره، وابستگی فضایی را با استفاده از همه جفت مقادیر موقعیتی (yi,yj) اندازه می گیرد به طوري که موقعیت های i و j در فاصله d از یکدیگر قرار مي گيرند (گتیس و همکاران، 1995). نمره استاندارد شاخص آماره عمومی G به صورت زیر اندازه گیری می شود:

در یک الگوي فضايي که موقعيت جغرافيايي مقادیر بالا، نزدیک به موقعيت ساير مقادیر بالا مي باشد، آماره ZG مثبت نشان داده می شود؛ و در صورتی که خوشه بندی بر اساس مقادیر پایین به وجود آمده باشد، آماره ZG مقدار منفی دارد. گتيس و اُرد میانگین، واریانس (با توجه به فرض نرمال بودن) و آماره را به صورت زیر ارائه می دهند:

اجزاي رابطه فوق با استفاده از روابط زير قابل محاسبه مي باشند:

در خودهمبستگی فضایی موران و در خوشه بندی زیاد یا کم خصیصه مورد مطالعه حتماً باید دارای مقادیر مثبت باشد و از پراکندگی قابل قبولی برخوردار باشد. به عبارت دیگر برای همه پدیده های مورد مطالعه مقادیر یکسان نداشته باشد.

آماره Ipopاُدن

در بررسی موضوعاتي چون سلامت، جنایت و … که با پدیده های جمعیتی سروکار است، معمولاً انتظار مي رود مناطقی با جمعیت های کوچک، تغییرپذیری بالاتری را نشان دهند (والر ، 2004). اٌدن (1995) با تعريف آماره Ipop به شکل زیر، این تغییر درون منطقه ای را صراحتاً مورد توجه قرار می دهد:

که در اینجا ri و pi به ترتیب نسبت های مشاهده شده و پیش بینی شده همه مقاديري که در پهنه i قرار می گیرند. بنابراین، m منطقه، n رویداد و یک جمعیت پایه کل x وجود دارد. نسبت عارضه مورد بررسی به جمعیت پایه نيز به صورت b ̅=n⁄x نشان داده می شود، بنابراین:

که در اینجا:

اُدن (1995) پیشنهاد می کند که معناداری آماری از طریق یک توزیع نرمال با میانگین و واریانس زیر ارزیابی شود:

که در اینجا A با رابطه 9-39 محاسبه شده و:

پرسش 3)
براي منطقه مورد مطالعه مشخص شده در پرسش2، با اين فرضکه جمعیت پهنه هاي 1، 2، 3 و 6 برابر با 100 نفر و جمعیت پهنه هاي 4 و 5 برابر با 300 نفر است و تعداد موارد پیش بینی شده در هر پهنه متناسب با جمعیت است، و با در نظر گرفتن تغییرات درون منطقه ای، ماتریس پیوستگی دودوئی پرسش 2 را در اختيار بگيريد. سپس براي ساده شدن کاررا اتخاذ کرده و برای سهولت:

در نظر بگيريد.
الف) مقدار آماره Ipop اُدن را به دست آوريد.
ب) آيا الگوي فضايي مشخصي در داده ها وجود دارد؟

جواب:
الف)
– تشکيل جدول محاسبه مشابه جدول زير:

– ستون اول و دوم اين جدول مشابه با جدول مربوط به پرسش 2 مي باشند و ستون سوم نيز نشان دهنده جمعيت هر کدام از پهنه هاي نمونه برداري است
– ستون چهارم (نسبت هاي مشاهده اي) از تقسيم ستون دوم (تعداد مشاهدات) بر تعداد کل مشاهدات (120= n) به دست مي آيد.
– ستون پنجم (نسبت هاي پيش بيني شده) از تقسيم ستون سوم بر جمعيت کل (1000 = x) به دست مي آيد.

– ستون ششم نيز از کم کردن ستون پنجماز ستون چهارم (ri) محاسبه مي شود.
– در اینجا،واست وبه دست مي آيد. چونواست،ومحاسبه می شود.

همچنين:

لذا آماره Ipop اُدن به صورت زير به دست مي آيد:

ب)
– مقدار مورد انتظار و واریانس مربوطه به ترتیب عبارتند از:

– چون نمره استاندارد مشاهده شده براي اين مقدار از Ipop برابر با 0/839- مي باشد، الگوی مشاهده شده فاقد هرگونه الگوی فضايي معنادار است.

آماره تانگو

تانگو (1995)، آماره عمومی زیر را برای شناسایی الگوهاي فضايي پیشنهاد کرده است:

شکل ماتريسي رابطه فوق به صورت زير است:

که در اینجا r و p بردارهای m * 1 با مولفه هایی شامل نسبت های مشاهده شده و پیش بینی شده در منطقه مورد مطالعه هستند. W نيز ماتریسی شامل مولفه های ωij است که نزدیکی (پیوستگی) میان پهنه هاي i و j را اندازه گیری می کند.
برای آزمون این فرضیه صفر که الگوی عارضه مورد بررسی تصادفی است، تانگو ابتدا مقدار و واریانس پیش بینی شده آماره را به شکل زیر ارائه می دهد:

که در اینجا N تعداد کل موارد مشاهده شده است، (.)Tr ترانهاده ماتریسی است که به شکل مجموع مولفه های قطری تعریف می شود و:

که ∆p به شکل یک ماتریس قطری m×m تعریف می شود و شامل مولفه های p روی قطر است. آماره آزمون نيز به صورت زیر تعریف می شود:

که دارای یک توزیع کای اسکوئر تقریبی با v درجه آزادی است:

در واقع آماره تانگو، میانگین وزنی تغییرات همزمان انحرافات میان مشاهده شده و پیش بینی شده برای همه جفت نقاط نمونه برداري شده مي باشد.

آماره کاي اسکوئر فضايي

اين آماره توسط روگرسون (1999) توسعه داده و می تواند به عنوان یک آزمون عمومی مورد استفاده قرار گیرد. آماره کاي اسکوئر فضايي به شکل زیر تعریف می شود:

همچنين می توان اين آماره را به شکل ترکیبی با آماره I موران نيز به صورت زير به کار برد:

وقتی میان مقادیر مشاهده شده و پیش بینی شده در منطقه مورد مطالعه، انحرافات بزرگي وجود داشته باشد یا وقتی جفت پهنه هاي مجاور دارای انحرافات مشابه باشند، مقدار آماره R بزرگ خواهد بود (بیساگ و همکاران، 1991).

تحلیل خوشه ­ای فضایی چندفاصله­ ای

این تحليل در مواقعي به کار گرفتـه مي شود که هـدف، مشخص کردن وضعیت خوشـه بندی پدیده ها در فواصـل مختلف جغرافیایی است (بیلی و همکاران، 1995). به عبارت دیگر پاسخ به اين سوال که “اگر پديده مورد بررسی در یک محدوده کوچکتر دارای الگوی مشخصی باشد آيا در محدوده بزرگتر نیز همان الگو را داراست يا خير؟” هدف اصلي تحليل خوشه اي چندفاصله اي مي باشد. با استفاده از نمودار نشان داده شده در شکل 9-6 بهتر مي توان مفهوم خوشه بندي چندفاصله اي را متوجه شد.
در اين نمودار محور افقي، نشان دهنده فواصل عوارض (نقاط نمونه برداري شده) از يکديگر مي باشد. خط مورب پررنگ بیانگر الگوی فضايي پيش بيني شده براي پدیده مورد بررسی است و خطوط خط چین که در قسمت بالا و پایین الگوی تصادفی مشخص شده نيز نشان دهنده سطوح اطمینان بالا و پایین برای الگوی تصادفی مي باشند. به عبارت دیگر الگوی تصادفی در سطح اطمینان تعیین شده (که معمولاً 0/95 است.) بین کران پایین و کران بالا قرار خواهد گرفت. منحنی اي که در قسمت بالای خط مورب قرار دارد نشان می دهد که در این فواصل الگوی عوارض مورد بررسی به صورت خوشه ای است. منحنی پایین خط مورب نیز نشان دهنده این است که در این فواصل الگوی پراکنده در عوارض وجود دارد. در تحلیل خوشه ای چندفاصله ای الگوها معمولاً از فاصله ای به فاصله دیگر تغییر می کنند بنابراین تعیین محدوده فاصله ها اهمیت زیادی دارد (سیمونسون ، 2003). اين تحلیل را مي توان برای عوارض نقطه اي، خطی و سطحی به کار برد اما استفاده از آن براي عوارض نقطه اي مرسوم تر است.

در تحلیل خوشه ای چندفاصله ای از توابع مختلفی مي توان بهره برد که يکي از آن ها تابع (L(d مي باشد:

در رابطه فوق، d فاصله عوارض (نقاط نمونه برداري) از يکديگر، n تعداد عوارض، A مساحت منطقه مورد مطالعه و (k(i,j يک پارامتر وزني است.
برای نمونه، مدتی قبل در استان هاي اصفهان و چهارمحال بختیاری بیماری اسهال شیگلوز شیوع پیدا کرد و برای بسیاری از پژوهشگران و پزشکان دانستن نحوه انتشار بیماری در مناطق مختلف این دو استان و مشخص کردن تأثير اقدامات وزارت بهداشت در مقابله با اين بيماري اهمیت يافت. با روش خوشه ای چندفاصله ای مي توان مشخص کرد که آيا با فاصله گرفتن از اين دو استان الگوي خوشه اي موجود دچار تغيير قابل ملاحظه مي شود يا خير.
تحلیل خوشه ای چندفاصله ای که به تابع K ریپلی نیز مشهور است، نسبت به اندازه محدوده مورد مطالعه بسیار حساس است. ممکن است با تغییر اندازه محدوده مورد مطالعه نوع الگو تغییر کند (گریفث،2003).

9 نظرات

دیدگاهتان را بنویسید