زائد بودن برخی نمونه های واقع در فضای جستجو-موسسه چشم انداز-آموزش کاربردی GIS و RS
پس از آن که امتداد، شکل و اندازۀ محدودۀ جستجو تبین و تعیین گردید، امکان زائد بودن برخی نمونه های واقع در محدودۀ جستجو بایستی مورد توجه و بررسی قرار گیرد. عموماً زائد بودن برخی از نمونه ها، ناشی از الگوی مجتمع و خوشه ای نمونه ها است. خوشبختانه، تخمینگر کریجینگ، امکان زائد بودن نمونه ها را به خوبی در نظر دارد و مشکل مربوط را در حین محاسبات و حل سیستم معادلات، مرتفع می سازد.
در تخمین گرهای مبتنی بر معکوس فاصله، به به کارگیری رویکردهای مناسب جستجو، اثرات نمونه های مجتمع و افزونگی نمونه ها را می توان تعدیل نمود و باعث بهبود تخمین گردید. لازم به یادآوری است که حذف نمونه های اضافی و زائد، علاوه بر ارتقای تخمین، باعث کاهش چشمگیر حجم و زمان محاسبات می گردد.
فضای جستجو چهارگوش
یکی از راهکارهای موثر و رایج در مقابله با مشکل نمونه های زاید و اضافی (ناشی از نمونه برداری های مجتمع)، استفاده از محدوده های جستجوی چهارگوش است. چگونگی انتخاب نمونه های واقع در فضاهای جستجوی چهارگوش در شکل زیر نشان داده شده است. همان گونه که ملاحظه می شود، محدودۀ جستجو (همسایگی) به 4 بخش تقسیم شده است. ربع بالا سمت راست، در برگیرندۀ تعداد بیشتری نمونه است که برخی از آنها به دلیل فاصلۀ اندک با یکدیگر زائد می باشند. با معدود ساختن تعداد نمونه های واقع در بخش های چهارگانه (مثلاً به دو و یا سه نمونه)، که در فرآیند تخمین بایستی به کار گرفته شوند، اثرات مجتمع بودن نمونه ها را می توان تعدیل کرد. بنابراین، در راهکار جستجوی چهار گوش، می بایستی حداکث تعداد نمونۀ مورد استفاده در هر کدام از بخش های چهارگانه مشخص گردد. چنانچه در بخش معینی (ربع)، تعداد نمونه، کمتر از حداکثر تعداد نمونۀ تعریف شده باشد؛ در این صورت، تمامی نمونه های موجود در آن بخش مورد استفاده قرار می گیرند. از سوی دیگر، هر گاه تعداد نمونه ها بیشتر از حد تعیین شده باشند؛ اقدام به انتخاب نزدیک ترین نمونه به محل تخمین می گردد.
شکل 8-2: چگونگی انتخاب نمونه ها در فضای جستجوی چهار گوش. نمونه های واقع در تصویر (الف)، به ویژه در بخش های شمالی، شدیداً مجتمع می باشند. محتوای هر ربع فضای جستجو، به سه نمونه (ب) و یا دو نمونه (ج) محدود گردیده است.
اثرات رویکرد جستجوی چهارگوش بر خطاهای تخمین حاصل از تخمینگر کریجینگ معمولی و معکوس فاصله، در شرایط محدود ساختن نمونه ها به حداکثر 4 نمونه و عدم به کارگیری رویکرد جستجوی چهارگوش، در جدول زیر نشان داده شده اند. همان گونه که ملاحظه می شود، راهکار جستجوی چهار گوش، باعث بهبود براوردهای حاصل از تخمینگر مربع معکوس فاصله شده است؛ اما بر کریجینگ معمولی، تقریباً بدون تاثیر بوده است.
مهم ترین اثر راهکار جستجو در تخمینگر معکوس فاصله، عبارت از کاهش 25 درصدی اریب است. بدین ترتیب، راهکار جستجوی چهارگوش را می توان به عنوان شیوه ای جهت غیر مجتمع سازی نمونه ها و کاهش اثرات آن بر تخمین های حاصل از تخمین گرهایی دانست که فاقد رویکرد و راه حل معین و مناسب، جهت حل مشکل مجتمع بودن نمونه ها هستند. در چنین شرایطی، برترید و مزیت کریجینگ معمولی بر تخمین گرهای معکوس فاصله، کاهش می یابد.
مرتبط بودن نمونه های واقع در فضای جستجو و مدل ایستایی
فرض اساسی در تخمین، صرف نظر از نوع تخمین گر، مرتبط بودن نمونه های مورد استفاده در تخمین و یکسانی جمعیت آماری تخمین ها و مشاهدات است. گاهی اوقات، فرض مزبور برقرار نمی باشد و لذا قابلیت اعتماد تخمین، مورد خدشه قرار می گیرد. مفهوم مرتبط بودن مشاهدات در فرآیند تخمین، به صورت شماتیک در شکل زیر نشان داده شده است. مقادیر نمونه ها بیانگر غلظت سرب (پی پی ام) در لایۀ سطحی خاک های اطراف یک مجتمع صنعتی هستند. به کارگیری تخمین گرهای مختلف (از جمله چندضلعی تیسن و روش مثلثی) جهت تخمین غلظت سرب در نقطۀ تعیین شده، مستلزم استفاده از نمونه ای است که دارای مقدار 10400 پی پی ام است. چنین غلظت بالایی می تواند ناشی از خطاهای اندازه گیری و یا ثبت داده ها باشد. لذا، به عنوان دادۀ مشکوک و یا پرت بایستی با آن برخورد کرد. از سوی دیگر، مشاهدۀ مزبور می تواند ناشی از نمونه برداری از یک لکۀ داغ، مانند انباشت موضعی آلاینده باشد؛ و لذا ارتباطی با پخش و انتشار سرب توسط کارخانۀ مربوط ندارد. بنابراین، اگر هدف، تخمین آلودگی سرب ناشی از فعالیت های مجتمع صنعتی مربوط باشد، لحاظ کردن این نقطۀ خاص، اشتباه است و موجب برآورد نادرست از سهم فعالیت صنعتی مورد نظر در آلودگی خاک منطقه می گردد. بدیهی است در شرایطی که هدفف مطالعۀ بررسی غلظت سرب در خاک های منطقه، صرف نظر از منشأ و منبع آلودگی باشد، به کارگیری مشاهدۀ مزبور ( مشروط به این که دادۀ پرت و خطاآمیز نباشد) ضروری است.
تصمیم گیری در این مورد که یک نمونۀ معین واقع در الگوی توزیع داده ها می تواند به عنوان پیشامد و نتیجۀ ممکن از مدل تابع تصادفی ایستا محسوب گردد و یا خیر، با موضوع تعلق نمونه ها به جمعیت هدف مرتبط است. متأسفانه، بازبینی و آزمون کمی و آماری این دو موضوع، بسیار دشوار و عملاً غیر ممکن است. نتایج تصمیم گیری در مورد آنها می تواند نه صحیح و نه غلط باشد، لذا اثبات درجۀ اعتبار آنها ناممکن است. آن چه که می توان مورد قضاوت قرار داد، مناسب بودن و یا نا مناسب بودن تصمیم های اخذ شده است. چنین قضاوتی بایستی با در نظر گرفتن اهداف مطالعه، شناخت داده ها و به کارگیری تجارب و اطلاعات کیفی و کمکی در دسترس صورت گیرد.
هزینه و بهای انتخاب و به کارگیری یک مدل نامناسب، آن است که خصوصیات و ویژگی های آماری مقادیر واقعی با آن چه که از طریق مدل به دست می آید. تفاوت بسیار زیادی با یکدیگر خواهند داشت. بدیهی است که صرف به کارگیری تخمین گرهای ترکیب خطی وزن دار و قید مساوی صفر بودن حاصل جمع اوزان آماری، تضمین کنندۀ تخمین های نااریب نمی باشند. بایستی به خاطر داشت که اریب در درک و پیش بینی واقعیت یک پدیده، وابسته به عوامل زیادی، از جمله تناسب مدل تابع تصادفی ایستا است.
به طور خلاصه، به کارگیری بهترین تخمین گرها به صورت کورکورانه و بدون توجه به مرتبط بودن مشاهدات واقع در همسایگی محل تخمین با یکدیگر و همچنین با نقطۀ مورد تخمین، ممکن است در مقایسه با تخمین گرهایی که جهت تخمین از حداقل داده ها استفاده می کنند، به نتایج نادرستی منجر گردد (محمدی، 1386).
1 نظر