رگرسیون وزن جغرافیایی

تجزیه و تحلیل رگرسیون مرسوم معادله رگرسیون واحد را برای نشان دادن رابطه بین یک متغیر وابسته و تعدادی متغیر مستقل بر اساس این فرض که رابطه ثابت و سازگار در کل منطقه مورد مطالعه است، ایجاد می‌کند. به عبارت دیگر، یک معادله رگرسیون ساده یا چندگانه معمولی یک مدل جهانی است که در آن ضرایب رگرسیون در فضا ثابت در نظر گرفته می‌شود. با این حال، در تجزیه و تحلیل محیطی، این پارامترها ممکن است خود تابعی از موقعیت جغرافیایی باشند، زیرا شکل و قدرت روابط بین متغیرهای محیطی می‌تواند در سراسر فضا متفاوت باشد. نتایج رگرسیون معمولی ماهیت واقعی روابط متغیر مکانی بین یک پدیده محیطی و عوامل تأثیرگذار را نشان نخواهد داد. GWR رگرسیون چندگانه «جهانی» را با تولید مجموعه‌ای از تخمین‌های پارامتر محلی برای هر رابطه در هر نقطه داده در یک منطقه گسترش می‌دهد.

اساساً معادله رگرسیون خطی را در هر مکان داده با ضرایب رگرسیون متفاوت تخمین می‌زند. معادله رگرسیون محلی GWR را می‌توان به صورت زیر نوشت :

که در آن k تعداد متغیرهای مستقل است، y مقدار پیش بینی شده متغیر وابسته y در مکان i، ai و {bij | j =1, 2, . . . , k} ضرایب رگرسیون در مکان i و xij مقدار مشاهده شده متغیر مستقل j در مکان i است. بنابراین، معادله رگرسیون مختص محل نقطه داده i است.

یک معادله رگرسیون محلی در محل i از طریق وزن دهی به تمام مشاهدات اطراف بر اساس تابعی از فاصله i محل برآورد می‌شود – یعنی به هر مشاهده وزنی اختصاص داده می‌شود که نشان دهنده تأثیر مقدار مشاهده شده بر روی مقدار i است که باید برآورد شود. مشاهدات نزدیک به محل من وزن بیشتری نسبت به دورتر می‌گیرم. وزن‌ها را می‌توان با چندین روش تعیین کرد. ساده ترین راه این است که وزن‌ها را به صورت زیر تعریف کنید :

که در آن wil وزنی است که به مشاهده یا نقطه نمونه l برای تخمین معادله رگرسیون در مکان i نسبت داده می‌شود، dil نشان دهنده فاصله مکان i تا نقطه نمونه l است و d مقدار آستانه فاصله است.

با روش وزن دهی فوق، هر گونه مشاهده بیشتر از فاصله d از محل i هیچ تاثیری بر مکان i ندارد و از برآورد معادله رگرسیونی برای مکان i خارج می‌شود. همه مشاهدات درون d از محل من دارای وزن مساوی هستند. با این حال، این روش از مشکل ناپیوستگی رنج می‌برد. ضرایب رگرسیون در مکانهای مختلف ممکن است بطور قابل توجهی تغییر کند، به ویژه هنگامی که تراکم نقاط نمونه در آن مکانها بسیار متفاوت باشد. یکی از راه‌های حل این مشکل این است که وزن‌ها را با استفاده از یک تابع وزنی پیوسته dil، که به عنوان هسته شناخته می‌شود، تعریف کنیم. تابع هسته معمولی (که به عنوان هسته شعاع ثابت در ArcGIS استفاده می‌شود) عبارت است از :

که در آن h کمیتی است که به عنوان پهنای باند شناخته می‌شود. این تابع یک منحنی گاوسی را نشان می‌دهد. وزن در مکان i 1 است، که در آن i  برابر با 1 و dil   برابر با صفر است. وزن سایر نقاط داده طبق منحنی گاوسی با افزایش فاصله بین i و l کاهش می‌یابد. هنگامی که دیل به فاصله معینی افزایش می‌یابد، وزن‌ها تقریباً صفر می‌شوند و این مشاهدات را از تخمین ضرایب رگرسیون برای مکان i حذف می‌کند. پهنای باند در هسته در واحدهای مشابه مختصات مورد استفاده در داده‌ها بیان می‌شود. وقتی پهنای باند بسیار بزرگی انتخاب می‌شود ، وزن‌ها به 1 می‌رسند و مدل GWR محلی به یک مدل رگرسیون جهانی معمولی تبدیل می‌شود.

پهنای باند در هسته با واحدهای مشابه مختصات استفاده شده در داده‌ها بیان می‌شود. هنگامی که پهنای باند بسیار بزرگ انتخاب می‌شود، وزن‌ها به 1 نزدیک می‌شوند و مدل GWR محلی به یک مدل رگرسیون جهانی معمولی تبدیل می‌شود. هسته گاوسی بیان شده در معادله 5-44 از پهنای باند ثابت h استفاده می‌کند. برای استفاده زمانی مناسب است که نقاط نمونه به طور معقول و منظم در منطقه مورد مطالعه قرار گرفته باشند. با این حال، زمانی که نقاط نمونه به طور منظم فاصله ندارند، انتظار می‌رود که از پهنای باند نسبتاً کوچک در مناطقی که نقاط نمونه به طور متراکم توزیع شده‌اند استفاده شود، و از پهنای باند نسبتاً بزرگ در جایی که نقاط نمونه به طور پراکنده توزیع شده‌اند استفاده شود. یکی از راه‌های پیاده‌سازی این رویکرد پهنای باند تطبیقی این است که دقیقاً همان تعداد نقاط نمونه در پهنای باند محلی یک هسته برای تخمین در هر مکان گنجانده شود. تابع وزن دهی زیر چنین هسته تطبیقی است که به آن هسته بیسکوئر می‌گویند (که به عنوان یک هسته تطبیقی در ArcGIS استفاده می‌شود):

که در آن hi پهنای باندی است که شامل p مشاهدات نزدیک به مکان i است، با فرض اینکه p تعداد مشخصی از نقاط نمونه است که باید گنجانده شود. پهنای باند را با به حداقل رساندن مجموع اعتبار متقاطع خطاهای مربعی که به صورت زیر مشخص می‌شود بهینه سازی می‌نمایند :

که در آن yi مقدار مشاهده شده y در مکان i است، و   مقدار پیش بینی شده y در مکانی است که با استفاده از مقدار خاصی از h زمانی که مشاهده i در تخمین استفاده نمی‌شود، ساخته شده است (برانسسدون و همکاران، 1998). مشاهده i از محاسبات حذف می‌شود تا در ناحیه مشاهدات پراکنده، مدل صرفاً بر اساس مشاهده i کالیبره نشود.

روش دیگر برای انتخاب پهنای باند مطلوب، به حداقل رساندن معیارهای تصحیح اطلاعات Akaike (AICc) است (هورویچ و همکاران 1998). شکل ریاضی آن برای GWR پیچیده است، بنابراین ما بر تفسیر آن تمرکز می‌کنیم. AICc اساساً یک معیار انتخاب مدل است. این اندازه گیری از کیفیت نسبی مدل، در اینجا معادله رگرسیون، برای مجموعه اطلاعات ارائه شده را ارائه می‌دهد. مدل با مقدار AICc کوچکتر بهتر است – یعنی با داده‌های مشاهده شده تناسب بهتری را فراهم می‌کند. در اینجا، پهنای باند با کمترین AICc مقدار بهینه است.

هسته‌هایی غیر از موارد ذکر شده در بالا می‌توانند در GWR استفاده شوند و در بسته‌های نرم افزاری مختلف پیاده سازی شده اند. هنگامی که هسته یا تابع وزنی انتخاب شد و پهنای باند بهینه به دست آمد، همه مشاهدات نسبت به مکان i وزن داده می‌شوند و سپس از مشاهدات وزنی برای تخمین رگرسیون خطی در مکان بر اساس اصل حداقل مربعات استفاده می‌شود و سپس واضح است که تخمین‌های ضریب رگرسیون می‌تواند براساس مکان‌ها متفاوت باشد و ناهمگونی مکانی را منعکس کند. برای جزئیات بیشتر به ( فودرینگ هام و همکاران، 2002) مراجعه کنید. کادر 5-10 نحوه پیاده سازی GWR و تفسیر نتایج را در ArcGIS نشان می‌دهد. کادر 5-11 نمونه ای از استفاده از GWR برای مدل سازی روابط پشه‌های نابالغ و تراکم انسان با بروز دنگی در تایوان را ارائه می‌دهد.

برگرفته از کتاب کاربرد GISدر محیط زیست

ترجمه:سعید جوی زاده،شهناز تیموری،فاطمه حسین پور فرزانه

درخواست مشاوره رایگان و شرکت در دوره

برخی از تالیفات دکتر سعید جوی زاده

دوره های پربازید و کاربردی

بدون دیدگاه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.