هدف یادگیری
- هدف این بخش تعیین انواع مختلف خطاهای ذاتی در مجموعه داده های مکانی است.
همه داده های مکانی به یک اندازه ایجاد نمی شوند. کیفیت داده به توانایی یک مجموعه داده معین برای برآوردن هدفی که برای آن ایجاد شده است اشاره دارد. با حجم عظیمی از دادههای مکانی که ایجاد میشود و به جامعه نقشهکشی ارائه میشود، کاربران سیستم اطلاعات جغرافیایی (GIS) باید مراقب باشند تا اطمینان حاصل شود که دادههای به کار رفته برای پروژهشان برای کار مورد نظر مناسب است.
دو ویژگی اصلی کیفیت داده ها را مشخص می کند. دقت توصیف می کند که اندازه گیری چقدر به مقدار واقعی خود نزدیک است و اغلب به صورت احتمال بیان می شود (به عنوان مثال، 80 درصد از همه نقاط در 5+/-5 متر از مکان واقعی خود هستند). دقت به واریانس یک مقدار در هنگام اندازه گیری های مکرر اشاره دارد. ساعت ممکن است 1/1000 ثانیه (دقیق) درست باشد ، اما ممکن است 30 دقیقه کند باشد (دقیق نیست). همانطور که در شکل 5.12 “دقت و دقت” می بینید ، دارت های آبی هم دقیق و هم دقیق هستند، در حالی که دارت های قرمز دقیق اما نادرست هستند.
شکل 5.12 دقت و دقت
هنگامی که الزامات دقت و/یا دقت در هنگام جمعآوری و ایجاد داده برآورده نمیشوند، میتوانند چندین نوع خطا ایجاد شوند. دقت موقعیتی احتمال این است که یک ویژگی در محدوده +/- واحد موقعیت واقعی خود روی زمین (دقت موقعیتی مطلق) یا مکان آن نسبت به سایر ویژگی های نقشه برداری شده (دقت موقعیتی نسبی) باشد. به عنوان مثال، می توان گفت که یک تلاش نقشه برداری خاص ممکن است منجر به 95 درصد از درختان شود که در 5+/-5 فوت برای مکان واقعی خود (مطلق) نقشه برداری شوند، یا 95 درصد از درختان در 5+/-5 فوت نقشه برداری شوند. مکان آنها همانطور که روی یک چهارگوش ربع ارتو دیجیتال (نسبی) مشاهده شده است.
صحبت در مورد خطای موقعیت مطلق این سوال را ایجاد می کند که دقیقاً مکان واقعی یک شی چیست؟ همانطور که در فصل 2 “آناتومی نقشه” بحث شد ، تصورات متفاوت از شکل زمین منجر به انبوهی از پیش بینی ها، نقاط داده و کروی ها شده است، که هر کدام تلاش می کنند تا خطاهای موقعیتی را برای مکان های خاص روی زمین روشن کنند. برای شروع پرداختن به این سوال بی پاسخ، استاندارد ملی دقت نقشه ایالات متحده (یا NMAS) پیشنهاد می کند که برای برآوردن الزامات دقت افقی، انتظار می رود که نقشه کاغذی بیش از 10 درصد از نقاط قابل اندازه گیری خارج از محدوده مقادیر دقت نشان داده شده در شکل 5.13 نباشد. “رابطه بین خطای موقعیت و مقیاس”. به طور مشابه، دقت عمودی بیش از 10 درصد ارتفاعات روی نقشه کانتور باید بیش از نیمی از فاصله کانتور خطا داشته باشد. هر نقشه ای که این استانداردهای دقت افقی و عمودی را رعایت نکند، برای انتشار غیرقابل قبول تلقی می شود.
شکل 5.13 رابطه بین خطای موقعیت و مقیاس
خطاهای موقعیتی از طریق منابع متعدد به وجود می آیند. فرآیند دیجیتالی کردن نقشه های کاغذی معمولاً چنین نادرستی هایی را معرفی می کند. هنگام ثبت نقشه بر روی تابلوی دیجیتالی، ممکن است خطاهایی ایجاد شود. یک نقشه کاغذی می تواند در طول زمان کوچک، کشیده یا پاره شود و ابعاد صحنه را تغییر دهد. خطاهای ورودی ایجاد شده از نقاط دیجیتالی عجولانه رایج هستند. در نهایت، تبدیل بین سیستم های مختصات و تبدیل بین نقاط داده نیز ممکن است باعث ایجاد خطا در مجموعه داده شود.
خطای ریشه میانگین مربع (RMS) اغلب برای ارزیابی میزان عدم دقت در یک نقشه دیجیتالی استفاده می شود. این آمار انحراف بین مکان های واقعی (واقعی) و تخمینی (دیجیتال) نقاط کنترل را اندازه گیری می کند. شکل 5.14 “خطای دیجیتالی بالقوه” نادرستی خطوطی را نشان می دهد که انواع خاک را نشان می دهد که ناشی از خطاهای مکان نقطه کنترل ورودی است. با اعمال یک محاسبه خطای RMS به مجموعه داده، می توان دقت نقشه دیجیتالی شده را تعیین کرد و بنابراین مناسب بودن آن را برای گنجاندن در یک مطالعه مشخص تعیین کرد.
شکل 5.14 خطای دیجیتالی بالقوه
هنگامی که ویژگی هایی که قرار است نقشه برداری شوند ذاتا مبهم هستند، ممکن است خطاهای موقعیتی نیز ایجاد شوند. یک تالاب را مثال بزنید ( شکل 5.15 “تعریف مرز تالاب”). چه چیزی مرز تالاب را مشخص می کند؟ تالاب ها با ترکیبی از عوامل هیدرولوژیکی، رویشی و ادافیک تعیین می شوند. اگرچه در حال حاضر مسئولیت تعیین مرز تالاب ها در سراسر کشور بر عهده سپاه مهندسین ارتش ایالات متحده است، اما این کار آنقدرها هم که به نظر می رسد ساده نیست. به ویژه، تفاوتهای منطقهای در ویژگیهای یک تالاب، تعیین این ویژگیها را بهویژه مشکلساز میکند. به عنوان مثال، تعریف مرز تالاب برای تالاب های رودخانه ای در شرق ایالات متحده، که در آن آب فراوان است، اغلب هنگام ترسیم انواع مشابه از تالاب ها در بیابان جنوب غربی ایالات متحده بی فایده است. در واقع، پیچیدگی و سردرگمی مرتبط با مفهوم «تالاب» ممکن است منجر به مشکلاتی در تعریف ویژگی در این زمینه شود.
شکل 5.15 تعریف مرز تالاب
علاوه بر دقت موقعیتی، دقت را نسبت دهیدیک منبع خطای رایج در GIS است. هنگامی که مقدار نادرستی در فیلد مشخصه ثبت می شود یا زمانی که یک فیلد مقداری را از دست می دهد، خطاهای مشخصه ممکن است رخ دهد. کلمات غلط املایی و سایر اشتباهات تایپی نیز رایج هستند. به طور مشابه، زمانی که توسعهدهندگان مقدار “0” را در یک فیلد مشخصه وارد میکنند، زمانی که مقدار در واقع “تهی” است، یک اشتباه رایج رخ میدهد. این در دادههای شمارشی رایج است که در آن «0» نشاندهنده صفر است، در حالی که «تهی» محلی را نشان میدهد که در آن هیچ تلاشی برای جمعآوری دادهها انجام نشده است. در مورد مقادیر طبقه بندی شده، گاهی اوقات هنگامی که ویژگی ها به اشتباه برچسب گذاری می شوند، نادرستی رخ می دهد. به عنوان مثال، یک نقشه کاربری زمین/پوشش زمین ممکن است یک چند ضلعی را به عنوان “کشاورزی” درج کند، زمانی که در واقع “مسکونی” باشد. این به ویژه اگر مجموعه داده قدیمی باشد، صادق است، که ما را به منبع خطای بعدی هدایت می کند.
دقت زمانیبه سن یا به موقع بودن یک مجموعه داده می پردازد. هیچ مجموعه داده ای هرگز به طور کامل جاری نیست. در مدت زمانی که برای ایجاد مجموعه داده نیاز است، قبلاً قدیمی شده است. صرف نظر از این، چندین تاریخ وجود دارد که باید هنگام استفاده از یک مجموعه داده از آنها آگاه بود. این تاریخ ها را باید در فراداده ها یافت. تاریخ انتشار به شما می گوید که چه زمانی مجموعه داده ایجاد و/یا منتشر شده است. تاریخ فیلد مربوط به تاریخ و زمان جمع آوری داده ها است. اگر مجموعه داده حاوی هر گونه پیش بینی آینده باشد، باید یک دوره و/یا تاریخ پیش بینی نیز وجود داشته باشد. برای پرداختن به دقت زمانی، بسیاری از مجموعه های داده تحت یک رژیم به روز رسانی داده ها قرار می گیرند. برای مثال، دپارتمان ماهی و بازی کالیفرنیا پایگاه دادههای گونههای حساس خود را تقریباً ماهانه بهروزرسانی میکند، زیرا یافتههای جدید به طور مداوم در حال انجام است. مهم است که اطمینان حاصل شود که به عنوان یک کاربر نهایی،
نوع چهارم دقت در GIS، سازگاری منطقی است . سازگاری منطقی مستلزم آن است که داده ها از نظر توپولوژیکی صحیح باشند. به عنوان مثال، آیا یک قطعه جریان از یک شکل فایل خطی در دشت سیلابی شکل فایل چند ضلعی مربوطه قرار می گیرد؟ آیا جاده ها در گره ها به هم متصل می شوند؟ آیا تمام اتصالات و جریان ها در یک شبکه در جهت درستی هستند؟ در رابطه با آخرین سوال، نویسنده اخیراً از یک برنامه تلفن هوشمند ناشناس برای پیمایش در یک جاده شهری شلوغ استفاده می کرد و دو بار به او گفته شد که جهت اشتباه را در خیابان های یک طرفه بپیچد. بنابراین مراقب باشید، اشتباهات در سازگاری منطقی ممکن است منجر به تخلفات رانندگی یا بدتر از آن شود!
نوع نهایی دقت، کامل بودن داده ها است . گنجاندن جامع همه ویژگی ها در پایگاه داده GIS برای اطمینان از نتایج دقیق نقشه برداری مورد نیاز است. به زبان ساده، برای اینکه یک مجموعه داده دقیق باشد، تمام داده ها باید وجود داشته باشند. آیا همه شهرستان های ایالت دارای نمایندگی هستند؟ آیا تمام بخشهای جریان در شبکه رودخانه گنجانده شده است؟ آیا هر فروشگاه رفاهی در پایگاه داده فهرست شده است؟ آیا فقط انواع خاصی از فروشگاه های رفاه در پایگاه داده فهرست شده اند؟ در واقع، داده های ناقص به ناچار منجر به تجزیه و تحلیل ناقص یا ناکافی می شود.
خوراکی های کلیدی
- همه داده های مکانی دارای خطا هستند.
- دقت نشاندهنده نزدیکی یک اندازهگیری به مقدار واقعی آن است، در حالی که دقت به واریانس یک مقدار هنگام اندازهگیریهای مکرر اشاره دارد.
- پنج نوع خطا در یک مجموعه داده مکانی به دقت موقعیتی، صحت ویژگی، دقت زمانی، ثبات منطقی و کامل بودن داده ها مربوط می شود.
تمرینات
- پنج نوع خطای صحت/دقت مرتبط با اطلاعات جغرافیایی چیست؟ یک مثال از هر نوع خطا ارائه دهید.
- با توجه به توصیف دقت موقعیتی مرزهای تالاب، یک ویژگی نقشه را مورد بحث قرار دهید که مرزهای آن ذاتا مبهم و دشوار است.
8 نظرات