تشخیص الگوی جغرافیایی

تشخیص الگوی جغرافیایی-موسسه چشم انداز هزاره سوم ملل-آموزش کاربردی GIS و RS

مقدمه

در آمار فضایی (تحلیل داده های مکانی)، شناخت الگوها و کشف روند های موجود در داده های فضایی از اهمیت زیادی برخوردار است (توني، 2016)؛ چرا که پیش از هرگونه تحلیل و تهیه نقشه بايستي این پیش داوری صورت گیرد که داده ها چگونه در فضا توزیع شده اند و توزیع آنها در فضا از چه الگو و قاعده ای پیروی می کند (ایلان و همکاران، 1971). در ذهن یک پژوهشگر معمولاً این سوالات مطرح است که آیا عارضه هایی که در فضا قرار دارند از الگوی خاصی تبعیت می کنند؟ آیا نحوه قرار گرفتن این عارضه ها در فضا تصادفی است؟ احتمال این که این عارضه ها در اثر تصادف رخ داده باشند چقدر است؟ یافتن پاسخ این سوالات معمولاً به پژوهشگران کمک می کند که تصمیم های سازنده ای برای پیشرفت جامعه و رفاه و امنیت و سلامت و … مردم اتخاذ کنند. با استفاده از آماره هاي توزيع فضايي مي توان وجود يا عدم وجود الگوهاي فضايي را مشخص نمود.

آماره به عددی گویند که یک توزیع نمونه‌برداری را خلاصه ‌سازی یا توصیف می‌کند. آماره فضایی عمومی، میزان انحراف یک الگوی فضایی مشاهده شده از یک فرضیه صفر مشخص را معرفی می کند. مقادیر مشاهده شده آماره عمومی با توزیع آماره مورد انتظار براساس فرضیه صفر مقایسه شده و این مقایسه منجر به پذیرش یا رد فرضیه صفر می شود. البته آماره هاي عمومی از این که نشانه مستقیمی از اندازه و جایگاه مناطق غیرمنطبق با فرضیه صفر ارائه نمی دهند، به صورت محدود معرفی می شود. در این فصل، تعدادي از آماره هاي عمومی فضایی مشتمل بر نزدیک ترین همسایه (نقطه مجاور)، چارک، موران، ادن، جییری، آماره عمومی تانگو و آماره کای اسکوئر (خی دو) فضایی معرفی شده و مورد بحث قرار گرفته است. در پایان این فصل نیز، به معرفی تحلیل خوشه ای فضایی چندفاصله ای که یک دید بصری برای شناسایی الگو در سراسر محدوده مطالعه می دهد پرداخته می شود.

مفهوم الگوی فضایی

نحوه استقرار عارضه ها نشان دهنده یک فرآیند پنهان است یا به عبارتی عواملی موثر وجود دارد که باعث شکل گیری این نحوه توزیع شده اند. برای نمونه در صورتی که استقرار کتابخانه ها در یک شهر تصادفی باشد به نظر می رسد که هیچ فرآیندی در نحوه قرارگیری آن تأثیر نداشته است اما اگر دارای الگوی خوشه ای یا منظمی باشد به نظر می رسد که عواملی منجر به ایجاد این توزیع در آن مکان شده اند. استقرار دانشگاه های مختلف در نزدیک یکدیگر می تواند عاملی برای این نحوه توزیع کتابخانه ها باشد. الگوی توزیع عارضه های نقطه ای بر روی زمین می تواند به شکل های تصادفی، خوشه ای و یا پراکنده باشد (ریپلی، 1977).

سه الگوي اصلي را مي توان در مورد عوارض مشاهده کرد: الگوي تصادفي (نامنظم)، الگوي خوشه اي و الگوي غيرتصادفي (منظم).

آماره میانگین نزدیکترین فواصل همسایگی

اين آماره با هدف کاربرد توزیع جغرافیایی و توسط پژوهشگراني چون اسکلام (1952)، کلارک و ايوانز توسعه داده شده است. در روش میانگین نزدیک ترین فواصل همسایگی، فرض صفر (H0) و فرض مقابل (H1) به صورت زیر تعریف می شود:

– فرضیه صفر (H0): توزیع داده ها در فضا از الگوی خاصی تبعیت نمی کند. به عبارت دیگر توزیع داده ها به صورت تصادفی است.

– فرضیه مقابل (H1): توزیع داده ها در فضا از الگوی خاصی تبعیت می کند. به عبارت دیگر توزیع داده ها به صورت خوشه ای یا پراکنده مشاهده می شود.

روش نزدیک ترین فواصل همسایگی در سه مرحله به صورت زیر انجام می شود.

مرحله اول

در اين مرحله ابتدا فاصله عوارض از يکديگر (فاصله اقليدسي، يا منهتن) محاسبه شده و سپس فاصله نزديکترين عارضه به هر کدام از عوارض مشخص مي شود. سپس پارامتري با عنوان “ميانگين نزدیکترین فواصـل” D ̅o برای کل محدودۀ مطالعه مطابق با رابطه زير محاسبه مي شود:

در رابطه فوق d1 تا dn فاصله هر عارضه تا نزديکترين عارضه و n تعداد عوارض مي باشد.

مرحله دوم

با فرض اين که توزيع داده ها به صورت تصادفي است، در این مرحله تعيين مي شود که میانگین فاصله بین عوارض و نزدیک ترین همسایگانش D ̅E (فاصله پيش بيني شده) در کجا قرار گرفته است:

در رابطه فوق n تعداد عارضه مورد بررسی و A مساحت منطقه مورد بررسی مي باشد.

مرحله سوم

در اين مرحله پارامتري با عنوان”نسبت نزديکترين همسايه” (ANN) به دست مي آيد:

سپس توزيع پديده ها در فضا مشخص مي شود. بدين ترتيب که اگر D ̅O<D ̅E (نسبت حاصله کمتر از 1)، توزیع پدیده مورد بررسی در فضا به صورت خوشه ای است؛ اگر D ̅O>D ̅E (نسبت حاصله بزرگتر از1)، توزیع عوارض مورد بررسی در فضا به صورت پراکنده؛ و اگرD ̅O=D ̅E. (نسبت حاصله برابر با 1)، توزيع عوارض به صورت تصادفي است (کلارک و همکاران، 1954).

در نهايت نمره استاندارد اين روش(ZANN) با رابطه زير محاسبه مي شود:

که SE از رابطه زير قابل محاسبه است:

در رابطه فوق n تعداد عارضه مورد بررسی و A مساحت منطقه مورد بررسی مي باشد. با استفاده از نمره استاندارد و SE مي توان راجع به فرضیات قضاوت نمود (کرسی، 2011).

پرسش 1)

فواصل نزدیکترین همسایه برای 10 نقطه واقع در یک منطقه مربعی شکل، با مساحت برابر با 1واحد به صورت زير مي باشد:

آيا داده هاي فوق در سطح معني دار 0/95، از توزيع فضايي خاصي پيروي مي کنند (مقدار p-Value این آزمون برابر با 0/014 می باشد).

جواب:

– محاسبه میانگین فاصله تا نزدیکترین همسایه ها:

– محاسبه فاصله پيش بيني شده:

– محاسبه نسبت نزدیکترین همسایه:

مقدار برابر با 0/361 نشان دهنده تمایل نقاط به خوشه بندی است زیرا این نسبت کمتر از 1 است.

– محاسبه مقدارSE:

– محاسبه نمره استاندارد:

از آن جا که سطح معنی داری آزمون در مقایسه با مقدارکوچک تر است فرض صفر رد می شود. به عبارتی دیگر توزیع داده ها در فضا از الگوی خاصی تبعیت می کند. با توجه به نسبت نزدیکترین همسایگی که برابر با 0/631 است، توزیع داده ها دارای توزیع خوشه ای می باشد.

آماره نزدیکترین فواصل همسایگي، تحت تأثير مرزهاي منطقه مورد مطالعه است. به عبارت ديگر ممکن است نزدیکترین همسایه یک نقطه، خارج از محدوده همسايگي قرار داشته باشد و از محاسبات خارج شود. در شکل 9-4 اگر محدوده سفيد رنگ داخلي به عنوان محدوده همسايگي در نظر گرفته شود، نقطه b به عنوان نزديک ترين همسايه نقطه a، تعريف شده و نقطه c که نزديکترين همسايه واقعي نقطه a مي باشد از محاسبات خارج مي شود. براي رفع اين مشکل معمولاً يک حريم در اطراف محدوده همسايگي در نظر گرفته شده و عوارض واقع در آن حريم نيز وارد محاسبات مي شوند (محدوده خاکستري رنگ در شکل 1.8). چون آماره ميانگين نزدیک ترین فواصل همسایگي، از نقاط همسايگي استفاده مي کند و فاصله تا سایر نقاط نادیده گرفته می شود، اثربخشی این روش در شناسایی انحرافات از تصادفی بودن فضایی، محدود به موقعیت هایی است که در آن ها خوشه بندی در مقیاس های فضایی نسبتاً کوچک رخ می دهد (فوترینگتون و همکاران، 2000). همچنين اين آماره را مي توان براي تمامي عوارض اعم از عوارض نقطه اي، خطي و سطحی به کاربرد؛ هرچند که استفاده از آن براي عوارض نقطه اي عموميت بيشتري دارد.

آماره چارک فضايي

اين آماره که براي شناسایی انحرافات عمومی از تصادفی بودن به کار مي رود، بر مبنای شبکه بندی در سراسر منطقه مورد مطالعه استوار است. در محاسبه آماره چارک فضايي، يک مقایسه کلي بين شمارش های مشاهده شده و شمارش هاي پیش بینی شده در هر سلول از شبکه انجام مي شود (روگرسون، 2006). فرضيه ها در رابطه با آماره چارک فضايي به صورت زير تعریف می شود:

– فرضیه صفر: مقادیر مشاهده شده Oi و مقادیر پیش بینی شده Ei با هم برابرند.

– فرضیه مقابل: مقادیر مشاهده شده Oi و مقادیر پیش بینی شده Ei با هم برابر نیستند.

آماره مزبور را مي توان به دو روش شرطي (مشخص) و غيرشرطي (نامشخص) به دست آورد. در روش اول تعداد نقاط مورد بررسي در محدوده مورد مطالعه، مشخص و در روش دوم تعداد نقاط نامشخص مي باشد.

روش غيرشرطي

اين روش را با ذکر يک مثال بهتر مي توان متوجه شد. با فرض وجود یک شبکه 4 ×4 در منطقه مورد مطالعه، و مجموعه شمارش ها در هر سلول از شبکه به صورت زير:

ابتدا جدولي مشابه با جدول 1.8 تهيه مي شود که ستون اول آن (از راست به چپ) تعداد شمارش ها در هر سلول از شبکه را نشان مي دهد (… 0،1،2،3). براي به دست آوردن ستون دوم (احتمال يا نسبت پيش بيني شده)، مي توان از توزيع پواسون استفاده کرد. در اين مثال میانگین شمارش مشاهده شده (λ) در هر سلول معادل با عدد 2 است (یعنی تعداد کل نقاط 32، تقسیم بر تعداد سلول ها که برابر با عدد 16 است)؛ این عدد برآوردی از شدت فرآیند در مقیاس يک سلول مي باشد. مطابق با توزيع پواسون:

مقادير ستون دوم جدول به صورت زير قابل محاسبه است:

ستون سوم جدول 1.8که نشاندهنده تعداد پيش بيني شده سلول ها با يک شمارش خاص (Ei ) است، برابر با حاصل ضرب مقادير ستون دوم در تعداد کل سلول ها (عدد 16) مي باشد. ستون چهارم (تعداد مشاهده شده سلول ها، Oi) اين جدول نيز از روي اعداد ماتريس (شبکه) قابل خوانش است. برای مقایسه تعداد مشاهده شده و تعداد پیش بینی شده در هر سلول، مي توان با استفاده از آماره χ2 ارزیابی معناداری آماری انجام داد:

که در اینـجا Oi و Ei به ترتیب شمارش های مشـاهده شده و پیش بینی شـده سلول ها در گروه i و k تعداد گروه هـا مي باشد.

قاعده متداول این است که شمارش های پیش بینی شده در هر گروه باید معادل یا بیشتر از 5 باشد؛ اما ريچارد، (2012) نشان داد که اين قاعده چندان درست نيست. در مثال فوق، اگر دو گروه آخر با هم ترکیب شوند، به طوری که شمارش های پیش بینی شده برابر با 28/2 (28/2= 84/0 +44/1) و شمارش های مشاهده شده برابر با 4 (4= 4+0) باشد، مقداربه دست مي آيد. این آماره باید با یک مقدار بحرانیبا درجه آزادی k-1 مقایسه شود. در اين مثال اگر از 0/05= α استفاده شود، مقدار بحرانیبه دست می آید. چوناست، دلیلی بر رد فرضیه صفر وجود ندارد و نتیجه اين که اگر شمارش های تصادفی (که میانگین آن ها 2 است) به هر سلول اختصاص داده شود، انحراف داده ها از آن چه انتظار مي رود، معنادار نمی باشد.

روش شرطي

روش شرطی این دیدگاه را اتخاذ می کند که در نمونه برداری مکرر، تعداد کل نقاط همیشه معادل با n است و شبیه سازهای فرضیه صفر مشروط بر آن که تعداد کل n باشد، قابل اجرا مي باشند (هاینینگ ، 2003). در اين روش فرض می شود که n نقطه به شکل تصادفی در میان m سلول توزیع می شوند. این آرايش در تضاد با روش غیرشرطی است که در آن تعداد کل نقاط از یک تحقق به تحقق بعدی، متفاوت است. در اين روش براي آزمون کردن انحراف از تصادفی بودن فضايي، از نسبت واریانس- میانگین (VMR) استفاده مي شود.
اگر فرضیه صفر تصادفی بودن درست باشد، کمیتدارای یک توزیعبا درجات آزادی معادل با m – 1 خواهد بود که در اینجا m تعداد پهنه هاي موجود در منطقه مورد مطالعه است.