نحوه تولید داده های مکانی با کیفیت برای GIS

نحوه تولید داده های مکانی با کیفیت برای GIS
مفهوم کیفیت چیزی است که همه ما فکر می کنیم درک می کنیم، اما اغلب در تعریف دقیق آن ناتوان هستیم. در مورد داده های مکانی نیز همین اتفاق می افتد. به همین دلیل، از Geograma این مقاله را برای شما باقی میگذاریم که در آن آن را روشن میکنیم، و همچنین بر جنبههای اصلی مربوط به تولید اطلاعات جغرافیایی با استانداردهای با کیفیت بالا و ارتباط آن در شرایط فعلی تأکید میکنیم.
کیفیت داده های مکانی چیست؟
ما کیفیت داده های مکانی را به عنوان توانایی آنها برای برآوردن الزامات و مشخصات تعریف شده که برای برآوردن نیازهای کاربران و تولیدکنندگان در نظر گرفته شده است، درک می کنیم.
برای دقیق تر، می توان به تعریف ارائه شده توسط ISO 19101 – اطلاعات جغرافیایی اشاره کرد. مدل مرجع بر اساس کدام کیفیت است:
“مجموعه ویژگی های یک محصول که بر توانایی آن در برآوردن نیازهای اعلام شده و ضمنی تاثیر می گذارد.”
در کیفیت داده های مکانی، باید به خطاهای موجود در داده ها توجه ویژه ای داشته باشیم. باید در نظر داشت که همه داده های جغرافیایی همیشه دارای یک خطا هستند، بنابراین نمی توانیم آنها را به طور کامل حذف کنیم. بنابراین، دادههای جغرافیایی با کیفیت، دادهای است که حاشیه خطا را به شیوهای صحیح ایجاد و اعلام میکند و دادهها را متناسب با اهداف مورد استفاده قرار میدهد.
چرا به داده های مکانی با کیفیت در GIS نیاز داریم؟
داده ها مبنایی هستند که سایر داده ها از طریق پردازش آنها در سیستم های اطلاعات جغرافیایی (GIS) تولید می شوند. این امر ما را آگاه می کند که اگر نقطه شروع ما اشتباه باشد، هرگز به مقصد مورد نظر خود نخواهیم رسید. همه اینها با وجود سرمایه گذاری منابع ارزشمند زیادی برای انجام این کار.
این موضوع در زمانی که رشد حجم دادههای مکانی محسوس است، اهمیت بیشتری پیدا میکند. این اطلاعات به طور فزاینده ای در هنگام تصمیم گیری های کلیدی مدیریت، هم در شرکت های خصوصی و هم در ادارات دولتی مورد توجه قرار می گیرد .
ما فقط در مورد حجم داده های جغرافیایی صحبت نمی کنیم، بلکه در مورد تنوع داده ها نیز صحبت می کنیم. در اینجا ما در مورد تصاویر ماهواره ای، تصاویر حسگر، دستگاه های تلفن همراه، فناوری نقشه برداری موبایل و بسیاری از منابع دیگر صحبت می کنیم.

نحوه تولید داده های مکانی با کیفیت برای GIS
ویژگی های کیفیت داده های مکانی را در نظر بگیرید
اول از همه، برای شکل دادن به کیفیت داده های جغرافیایی، باید بدانیم 7 مؤلفه ای که کیفیت را تعریف می کنند، چیستند که عبارتند از:
- دقت موقعیت: دقت مرجع جغرافیایی مرتبط با هر داده. یعنی مختصاتش.
- دقت ویژگی: به صحت مقادیر مرتبط با یک عنصر در یک موقعیت معین اشاره دارد. به عنوان مثال، تراکم جمعیت یک منطقه توسط یک سلول روی نقشه مشخص می شود.
- سازگاری منطقی: روابط موجود بین داده های مکانی مختلف باید ثبت شود.
- سازگاری توپولوژیکی: این بدان معناست که مقادیر باید دارای مقداری در مقادیر مورد انتظار و در واحدهای مورد انتظار باشند.
- کامل بودن: باید معیارهای روشنی وجود داشته باشد که توضیح دهد چرا داده های خاص جمع آوری نمی شوند. به عنوان مثال، به دلیل اینکه آنها مفید نیستند یا به دلایل مقیاس.
- کیفیت زمانی: محیط قابل تغییر است، بنابراین اگر به دلیل گذشت زمان، واقعیت با آنچه در زمان ثبت آن منعکس شده است متفاوت باشد، ممکن است کیفیت داده های مکانی کاهش یابد .
- منشا داده ها: برای تعیین کیفیت داده ها و همچنین فرآیندهایی که منشأ آن داده اند، در صورتی که از داده های اولیه دیگر آمده باشد، باید مبدأ داده ها را دانست.
شناسایی خطاها و سنجش ارتباط آنها
همانطور که قبلاً در بالا بحث کردیم، اساس کیفیت داده های مکانی در خطای مربوط به داده های مکانی، ماهیت، بزرگی و این واقعیت است که برای استفاده مورد نظر از اطلاعات جغرافیایی مناسب است .
در مورد خطاها باید نوع و بزرگی آنها را بشناسیم و به درستی مدیریت کنیم. در میان انواع خطاهای مرتبط با یک داده مکانی، ما داریم:
- خطای مفهومی و مدل: این با تکنیک مورد استفاده برای نمایش اطلاعات، مانند شطرنجی و برداری، مرتبط است. برای رسیدن به هدف خود باید کسی را انتخاب کنیم که خطاهایش قابل قبول تر است.
- خطاهای منبع داده: به عنوان مثال، هنگام پردازش داده های اولیه که صحیح نیستند، رخ می دهد. در اینجا می توانیم از یک نقشه اشتباه یا اندازه گیری از یک سنسور با کالیبره ضعیف صحبت کنیم.
- خطاهای ایجاد نقشه: این خطاها، در میان دیگر منشأها، می توانند هنگام انتقال داده های برچسب از یک نقشه فیزیکی به نقشه دیجیتال توسط یک اپراتور یا هنگام تبدیل داده ها از فرمت برداری به فرمت شطرنجی و بالعکس ایجاد شوند.
- خطاهای تجزیه و تحلیل: این خطاها زمانی به وجود می آیند که داده ها از تجزیه و تحلیل داده های اصلی دیگری که به درستی انجام نشده است به دست می آیند.
با در نظر گرفتن تمام این پارامترها و همچنین پیروی از مجموعه ای از دستورالعمل های فنی خاص برای هر مورد، داده های جغرافیایی مورد نیاز خود را با کیفیت مناسب به دست خواهیم آورد. یک فرآیند کلیدی برای کار صحیح با GIS و ارائه نتایجی به ذینفعان که به آنها در بهبود مدیریت منابع در پروژه های مربوطه کمک می کند.
سه راه برای بهبود کیفیت داده ها در GIS

در تمام زندگی ام برای مدیریت وزنم تلاش کرده ام. من احتمالاً 1000 پوند در زندگی ام کم کرده ام، اما مشکل این است که 1050 پوند اضافه کرده ام. اگر واقعاً میخواستم برای همیشه وزن کم کنم، عادتهای بد غذایی قدیمیام را برای همیشه کنار میگذاشتم، نه اینکه آنها را برای مدتی در طول رژیم به حالت تعلیق درآورم و به محض اینکه به اندازه کافی وزن کم کردم دوباره آنها را برگردانم. برای دگرگونی واقعی، عادات قدیمی و منفی باید بمیرند.
ما در مورد تحول دیجیتال زیاد شنیده ایم. واقعاً دو، شاید سه عنصر تحول دیجیتال وجود دارد. اولین عنصر بستر فناوری مناسب است. دوم تغییر در رفتار است، شاید حتی یک تغییر اساسی. گاهی اوقات، مورد سوم یک اختلال کامل در کسب و کار است. UBER، iPhone، Netflix و Airbnb روش استفاده از تاکسی، برقراری ارتباط، تماشای فیلم و اقامت در هتل ها را تغییر داده اند. این دگرگونی ها شامل تحولی در رفتار است. دلیل اینکه نمی توانم وزنم را کنترل کنم این است که رفتارم را با موفقیت تغییر نداده ام.
تاسیسات برق در حال تغییر هستند. مشتریان سیستم های خورشیدی را به صورت دسته جمعی نصب می کنند. مردم باتری ها را در گاراژ خود آویزان می کنند. ریزشبکه ها در همه جا ظاهر می شوند. شرکت های برق در حال جداسازی اجزای سازنده خود هستند: تولید، انتقال، توزیع و خدمات خرده فروشی.
برای بقای سودآور، شرکتهای انتقال و توزیع (T&D) باید عادات و آیینهای قدیمی را که از زمان توماس ادیسون کامل کردهاند، از بین ببرند. این راز نیست که بسیاری از صنایع آینده نگر مبتنی بر داده ها هستند. برای زنده ماندن در تحول دیجیتال، آنها باید تغییر کنند.
فقدان سرمایه گذاری در مدیریت، پردازش و نگهداری داده های خوب یکی از عادت های بسیار بد شرکت ها است. آنها باید این عادت را از بین ببرند. داده های خوب یک نیاز اساسی برای کارایی عملیاتی و مالی است. اکثر شرکت های برق دارای GIS هستند. با این حال، مطالعه پس از مطالعه و مصاحبه پس از مصاحبه نشان میدهد که شرکتها به کیفیت دادههای GIS خود اعتماد ندارند. اکثر آنها سابقه کاملی از امکانات T&D خود در GIS ندارند. آنها اطلاعات پست را در CAD نگه می دارند. سپس آنها به ندرت داده های پست خود را برای انعکاس موقعیت های ساخته شده به روز می کنند. آنها به ندرت سازه های زیرزمینی را مدل سازی می کنند. اکثر آنها فرآیندهایی برای اطمینان از به موقع بودن داده ها ندارند. و در بسیاری از موارد، مکان تاسیسات حتی به GPS دقیق نزدیک نیست. در یک مطالعه چندین سال پیش، Esri از شرکتهای برق پرسید که چه مدت طول میکشد تا اطلاعات از میدان وارد GIS شوند. در برخی موارد، زمان را بر حسب هفته اندازه گیری می کنند، نه دقیقه، ساعت یا حتی روز. بهای این عدم دقت، به موقع و کامل بودن صرفاً عدم کارایی است که به هزینه های بالاتر تبدیل می شود. خدمات مشتری و قابلیت اطمینان ضعیف؛ و در برخی موارد تصادفات. در حالی که اکنون اکثریت موافقند که GIS یک جزء اساسی در مجموعه فناوری اطلاعات هر ابزار T&D است، وجود ساده GIS کافی نیست.
چگونه بسیاری از شرکت های خدمات شهری با اطلاعات ناقص، نادرست یا قدیمی برخورد می کنند؟ آسان. آنها فقط از مردم می خواهند به داخل وسایل نقلیه بپرند و از مردم بخواهند که بررسی کنند تا ببینند آیا اطلاعات موجود در سوابق آنها واقعاً صحیح است یا خیر. این یک عادت بد پرهزینه و وقت گیر است. Utilities این کار را بسیار انجام می دهند.
داده ها باید درست باشند.دلیل اینکه بسیاری از شرکت ها مجموعه کاملی از داده ها را ندارند، البته هزینه مهاجرت، جمع آوری و نگهداری داده ها است. ابزار T&D دارای نیروی کار پیر، زیرساخت قدیمی، قرار گرفتن در معرض هزینه بیشتر، حاشیه سود کمتر و افزایش انتظارات مشتری است. بنابراین آنها بر این باورند که پولی برای انجام کار بهتر برای تکمیل انتقال داده ها و گرفتن دارایی های دشوارتر مانند تاسیسات زیرزمینی، پست ها یا خدمات ثانویه باقی نمانده است. با این حال امروزه، اطلاعات بیشتر تصمیمات تجاری مدرن را هدایت می کند، از جمله نحوه اولویت بندی سرمایه گذاری در تسهیلات. فرآیندها به داده های خوب وابسته هستند. نوسازی شبکه ایجاب می کند.
سه راه برای بهبود کیفیت داده ها در GIS
1. به GIS به عنوان یک پلتفرم فکر کنید
GIS ماشین تهیه نقشه نیست. پلتفرم ArcGIS Esri زمانی در بهترین حالت خود قرار دارد که به عنوان وسیله ای برای استخراج اطلاعات از منابع مختلف داده، چه در داخل و چه در خارج از شرکت عمل می کند. این شامل هوش تجاری، داده های اولین پاسخ دهندگان، از منابع شهر هوشمند، اطلاعات مشتری، مواد، مدیریت کار، مدیریت دارایی، SCADA، ADMS، AMI و سیستم های تجزیه و تحلیل شبکه است. نیازی نیست که Utilities تمام داده ها را در GIS ذخیره و نگهداری کنند. از قضا، ابزارهای برق اغلب اطلاعات زیادی را در GIS ضبط می کنند.
GIS به چه چیزی نیاز دارد؟
- موجودی کامل دارایی های تسهیلات
- محل آن دارایی ها،
- روابط فضایی دارایی ها با یکدیگر و با دنیای اطرافشان.
آنها اطلاعات زیادی در یک مکان دارند و در جایی که به آن نیاز دارند کافی نیستند. اگر شرکتها بخواهند اطلاعات جمعیتی را روی نقشه ببینند، میتوانند آن را از وب بیرون بکشند. دارایی ها را همانطور که واقعا هستند مدل کنید.
Utilities سفر GIS خود را با تکرار کاغذ قدیمی، نقشه های توزیع و انتقال آغاز کردند. آنها می خواستند نسخه دیجیتال دقیقاً شبیه نقشه های کاغذی قدیمی باشد. این یک انتقال دیجیتال بود، زیرا رفتار کارگران واقعاً تغییر چندانی نکرده بود. این بدان معناست که چیزها واقعاً آنطور که وجود دارند از گروه الگوبرداری نشده بودند. با ابزار جدید ArcGIS Utility Network Management Extension، اکنون می توانید بهترین ها را از هر دو دنیا دریافت کنید. آنها می توانند استفاده از نقشه ها را آسان کنند و عناصر شبکه را با تمام ویژگی ها، مانند پایانه ها، پیکربندی زمین و فناوری بانکی داخلی نشان دهند.
2. گرفتن شبکه کامل در GIS
این ایده که GIS تنها منبع حقیقت است، دروغ است. خب امروز دروغه این باید تنها درگاه حقیقت باشد. اطلاعات مربوط به پستها، طرحهای انتقال، سیستمهای رله، سازههای زیرزمینی و مجموعهای از امکانات دیگر در جای دیگری ذخیره میشوند. GIS می تواند یک مدل کامل از سیستم T&D را ذخیره کند که گاهی اوقات در GIS یک دوقلو دیجیتال نامیده می شود. داشتن تمام امکانات داده در یک مکان، از تکرار، داده های غیر همگام و فرآیندهای پیچیده جلوگیری می کند – همه عادات بد!
3. داده ها را در دستان همه قرار دهید
باور کنید یا نه، شرکتهای خدمات شهری هنوز نقشههایی را برای کارگران میدانی خود چاپ میکنند. این باعث ایجاد مشکل در ارتباطات، همکاری و هماهنگی می شود – سه c مدیریت خوب داده ها. با استفاده از پلتفرم ArcGIS، هنگامی که اتفاقی در میدان رخ می دهد و در دستگاه تلفن همراه کارگر میدانی به روز می شود، همه در هر دستگاهی، در هر مکان و در هر زمان در مورد آن می دانند. پلتفرم ArcGIS سرنخ از پلتفرم های رسانه های اجتماعی است. توییت ها فوری هستند. همچنین، هنگامی که کارگران میدانی داده های خود را در دستگاه تلفن همراه به روز می کنند، همه می دانند. کاغذ فرآیندها را به پایین می کشاند. این فقط سرعت کارها را تا حد خزیدن کند می کند.
با پلتفرم ArcGIS، سفر طولانی از میدان تا بخش GIS وجود ندارد
اگر روزی بخواهم وزن کم کنم، عادات غذایی قدیمی من باید از بین برود. به همین ترتیب، اگر ابزارهای T&D بخواهند تغییر کنند، عادات داده قدیمی آنها باید از بین بروند. دیگر نیازی به پیشفرض بررسیهای میدانی برای صحت دادهها نیست. دیگر به GIS به عنوان یک ماشین نقشهسازی دیگر تکیه نمیکنیم. دیگر نیازی به نگهداری داده ها در کابینت فایل نیست. در عوض، شرکت ها باید ادغام با سیستم های شرکتی را بهبود بخشند و در فرآیندهای مدرن حاکمیت داده سرمایه گذاری کنند. این چیزی است که یک پلت فرم موقعیت مکانی واقعی فراهم می کند.
کیفیت داده مهم است
برای انجام تجزیه و تحلیل مکانی دقیق و ایجاد محصولات اطلاعاتی با کیفیت بالا، دادههای منبع شما باید سطح مشخصی از کیفیت را داشته باشند. دادههای با کیفیت ناشناخته ارزش کار شما را کاهش میدهند و ممکن است بر تصمیمگیری یا سایر عملیات تجاری که بر نتایج تحلیل دقیق متکی هستند تأثیر منفی بگذارد.
ArcGIS Data Reviewer ، توسعهای برای ArcGIS، این خطر را با پیادهسازی جریانهای کاری که دادههایی را که نیازهای کیفیت شما را برآورده نمیکنند برجسته میکند، کاهش میدهد و منجر به افزایش اعتماد به دادههای شما، افزایش بهرهوری و کاهش هزینهها میشود. با ارائه مجموعهای از قابلیتها که از شناسایی، مدیریت و گزارش خطاها در دادههای شما پشتیبانی میکند، هزینههای مدیریت داده را کاهش میدهد. بهره وری را با خودکار کردن تشخیص خطاهای رایج در داده های GIS و گردش کار ساده برای شناسایی داده های با کیفیت پایین که به روشی خودکار قابل شناسایی نیستند، افزایش می دهد. با شناسایی و رسیدگی به خطاهایی که بر تصمیم گیری تأثیر می گذارد، اعتماد کلی به محصولات و خدمات اطلاعاتی افزایش می یابد.
ما با ArcGIS Data Reviewer بسیار بیشتر به داده های خود اطمینان داریم. میتوانیم وارد اتاق شویم و از مکالمه با کسی احساس خوبی داشته باشیم، زیرا دقیقاً میدانیم اطلاعات ما در کجا قرار دارند و برای رفع آن چه کاری باید انجام دهیم.
_______________________________________
تری بانتینگ، اداره آب توسان

تشخیص داده های بی کیفیت را خودکار کنید
بررسی خودکار داده ها قابلیتی است که کیفیت یک ویژگی را بدون دخالت انسان ارزیابی می کند. برای تیمهای محدود به منابع، اتوماسیون شما را قادر میسازد تا ارزیابی کیفیت دادهها را با کمترین تأثیر بر کارکنان و در عین حال بهبود کیفیت داده اجرا کنید. برای سازمانهای بزرگ، اتوماسیون ثبات در تولید دادهها را در تیمهای متعدد امکانپذیر میکند و مدیریت دانش را با ادغام الزامات کیفیت در گردشهای کاری تکرارپذیر افزایش میدهد.
Data Reviewer کتابخانه ای از چک ها را برای اعتبارسنجی داده ها بر اساس الزامات کیفیت منحصر به فرد شما فراهم می کند. بررسیها برای ارزیابی جنبههای مختلف کیفیت یک ویژگی، از جمله انتساب، یکپارچگی یا رابطه فضایی آن با سایر ویژگیها طراحی شدهاند. برای مثال، شرکتهای برق باید موقعیت دقیق داراییهای خود را حفظ کنند، زیرا اطلاعات نادرست میتواند بر تکمیل پروژههای ساخت و ساز یا تعمیر و اعلانهای خروجی به مشتریان تأثیر بگذارد.
چکهای خودکار بازبین یک قابلیت تنظیمپذیر/بدون کد است که برای پیادهسازی به مهارتهای برنامهنویسی تخصصی نیاز ندارد. در بسیاری از موارد، متخصصان GIS با درک خوبی از الزامات کیفی سازمان خود می توانند گردش کار بررسی خودکار را با استفاده از Data Reviewer با حداقل آموزش پیاده سازی کنند.

بررسی خودکار را می توان به روش های مختلفی ادغام کرد:
- ارزیابی کیفیت یک ویژگی در هنگام ایجاد یا اصلاح در هنگام ویرایش. این امر از ایجاد ویژگی هایی که الزامات کیفی را برآورده نمی کنند جلوگیری می کند و نیاز به کار مجدد را کاهش می دهد.
- ارزیابی کیفیت یک ویژگی پس از ایجاد آن. این می تواند زمانی مفید باشد که داده های موجود از کیفیت ناشناخته ای برخوردار باشند و یک ارزیابی پایه برای شناسایی تلاش مورد نیاز برای دستیابی به الزامات کیفیت مورد نیاز باشد.
درباره بررسی خودکار داده ها با استفاده از این منابع بیشتر بیاموزید:
- شناسایی الزامات کیفیت داده ها (اسناد)
- طراحی قانون بازبین (اسناد)
- اجرای کنترل کیفیت خودکار (آموزش)
- افزایش تضمین کیفیت در حین ویرایش (آموزش)

اجرای یک بررسی جامع کیفیت
همه خطاهای موجود در داده های شما را نمی توان با استفاده از روش های خودکار شناسایی کرد. بررسی نیمه خودکار کیفیت داده ها را با استفاده از تعامل و ورودی انسانی ارزیابی می کند. بررسی بصری رایجترین شکل بررسی نیمه خودکار است و برای ارزیابی کیفیت به روشهایی استفاده میشود که روشهای خودکار ممکن است از آن پشتیبانی نکنند. این شامل یافتن ویژگیهای گمشده، نامناسب یا کدگذاری اشتباه میشود.
این نوع خطاها به طور معمول توسط کارشناسان موضوع و سایر مصرف کنندگان داده که از داده های GIS در کار روزانه خود استفاده می کنند، پیدا می شود. با استفاده از گردش کار Data Reviewer برای مهار این بازخورد، میتوانید کیفیت دادههایی را که تولید و به اشتراک میگذارید بهبود بخشید.
درباره ادغام بازخورد از کارشناسان موضوع و سایر مصرف کنندگان داده با استفاده از این منابع بیشتر بیاموزید:
- شناسایی خطاها در ویژگی های موجود (اسناد)
- شناسایی ویژگی های گمشده (اسناد)
پیگیری و گزارش پیشرفت در مورد اهداف کیفیت داده ها
Data Reviewer مدیریت و ردیابی خطاها را از طریق چرخه عمر تعریف شده امکان پذیر می کند. این گردش کار شامل ردیابی خطاهای شناسایی شده با استفاده از بررسی های خودکار و همچنین خطاهای گزارش شده توسط مصرف کنندگان داده است. اطلاعات جمع آوری شده در طول بررسی داده ها شامل منبع و شرح خطا، مکان آن، افرادی که خطا را پیدا کرده اند و شدت آن است.
این اطلاعات می تواند برای جوامع متعددی که داده های GIS را مدیریت و استفاده می کنند مفید باشد. برای ویرایشگرهای داده، این اطلاعات به آنها کمک میکند کار خود را سریعتر انجام دهند و از تکرار تلاشها در زمانی که چندین تیم برای بهبود کیفیت کار میکنند، جلوگیری میکند. برای مصرفکنندگان داده، این اطلاعات میتواند به شناسایی خطراتی که بر تصمیمگیریهایی که به دادههای باکیفیت بستگی دارد تأثیر میگذارد کمک کند.
مرورگر داده همچنین جزئیات مربوط به اینکه چه کسی، چه زمانی و چگونه خطاها تصحیح می شوند و اینکه آیا تصحیح به عنوان قابل قبول تأیید شده است را ردیابی می کند. این اطلاعات اضافی شما را قادر می سازد تا پیشرفت در اهداف کیفیت داده ها را گزارش دهید و پیش بینی کنید که چه زمانی به اهداف کیفیت دست می یابد.
خطاهای شناسایی شده در طول فرآیند بررسی داده ها از طریق یک چرخه عمر تعریف شده که از سه مرحله (بازبینی، تصحیح و تأیید) تشکیل شده است، ردیابی می شوند.

الزامات کیفیت داده را شناسایی کنید
با مجوز Data Reviewer موجود است.
یکی از چالشهای پیادهسازی فرآیندهای کنترل کیفیت دادهها، شناسایی الزامات کیفی دادههای فنی برای سازمان است. مهم است که قبل از تبدیل آنها به الزامات فنی که داده های با کیفیت خوب را تعریف می کنند، الزامات تجاری برای داده های خود را شناسایی و درک کنید.
یک فرآیند کنترل کیفیت داده موثر بر اساس درک نحوه استفاده از داده ها و محصولات اطلاعاتی در داخل و خارج سازمان است. هر سازمان کیفیت را متفاوت تعریف می کند و این تعریف را بر اساس هدف و استفاده مورد نظر از داده ها استوار می کند. نمودار زیر منابع مختلفی را برای الزامات کیفی نشان می دهد که ممکن است برای سازمان شما قابل اجرا باشد.

عناصر کیفیت داده
عناصر کیفیت داده جنبه خاصی را که برای استفاده و دقیق بودن یک مجموعه داده لازم است توصیف می کند. داده های GIS دارای مولفه های متفاوتی برای کیفیت آن هستند. همانطور که توسط سازمان بین المللی استاندارد (ISO) تعریف شده است، این اجزا شامل موارد زیر است:
- کامل بودن
- سازگاری منطقی
- دقت فضایی
- دقت موضوعی
- کیفیت زمانی
- قابلیت استفاده از داده ها
کامل بودن
وجود یا عدم وجود ویژگی ها، ویژگی ها و روابط آنها در یک مدل داده.

سازگاری منطقی
درجه ای از پایبندی به قوانین از پیش تعیین شده ساختار، اسناد و روابط یک مدل داده که توسط یک سازمان یا صنعت تعریف شده است. بسیاری از صنایع از استانداردهایی پیروی میکنند که در مدل دادههای مکانی بهعنوان حوزههای ارزش، قالبهای داده و سازگاری توپولوژیکی نحوه ذخیره دادهها منعکس میشوند.

دقت فضایی
دقت موقعیت ویژگی ها نسبت به زمین.

دقت موضوعی
دقت صفات درون ویژگی ها و روابط مناسب آنها.

کیفیت زمانی
کیفیت ویژگی های زمانی و رابطه زمانی ویژگی ها.


قابلیت استفاده از داده ها
پایبندی یک مجموعه داده به مجموعه خاصی از الزامات مربوط به یک مورد استفاده.


اسناد مورد نیاز کیفیت
طرح تضمین کیفیت (QA) سندی است که استانداردهای کیفیت مرتبط با یک پروژه و روش های دستیابی به آنها را مشخص می کند. طرح QA یک سند زنده است که با شناسایی الزامات کیفی جدید توسط سازمان تغییر می کند و همچنین به عنوان فرصتی برای گرد هم آوردن سهامداران کلیدی برای ایجاد تصویری مشترک از آنچه که داده های با کیفیت خوب را تشکیل می دهد و فرآیندهای تجاری که این الزامات را ایجاد می کند، تغییر می کند. .
در زیر تکنیکها و استانداردهای مستندسازی وجود دارد که میتوانند هنگام شناسایی الزامات کیفیت داده مفید باشند:
- ISO/TC 211 اطلاعات جغرافیایی/ژئوماتیک – مجموعه استانداردهای سازمان بین المللی استاندارد (ISO) برای اطلاعات جغرافیایی برای تعریف روش ها، ابزارها و خدمات مدیریت داده ها برای به دست آوردن، پردازش، تجزیه و تحلیل، دسترسی، ارائه و انتقال این گونه داده ها به صورت دیجیتال. در میان کاربران، سیستم ها و مکان ها شکل می گیرد.
- ماتریس ردیابی الزامات – سندی است که برای مدیریت و ردیابی الزامات تجاری ایجاد می شود تا اطمینان حاصل شود که آنها در طول اجرای پروژه برآورده می شوند. این سند الزامات تجاری جمع آوری شده برای پروژه و قابلیت های یک محصول نرم افزاری را به هم مرتبط می کند.
ستون Requirement Category در جدول زیر نمونه ای از الزامات جمع آوری شده را نشان می دهد که به برخی از عناصر کیفیت داده اشاره شده در بالا اشاره می کند. گام بعدی پس از سازماندهی و طبقه بندی نیازمندی های شما، مرتبط کردن الزامات کیفیت داده با قابلیت های مربوطه موجود در ArcGIS خواهد بود.
شناسه | مورد نیاز | شماره مورد نیاز | دسته مورد نیاز | قابلیت محصول |
---|---|---|---|---|
1 |
امکان اجرای پرس و جوها بر اساس تعدادی از بخش های ویرایش شده توسط یک کاربر جداگانه |
F001 |
نیاز عملکردی |
|
2 |
توانایی اطمینان از مطابقت مدل داده های تولید با استاندارد طرح صنعت |
D001 |
نیاز داده ها – سازگاری منطقی |
|
3 |
به عنوان مدیر پایگاه جغرافیایی، توانایی محدود کردن امتیازات POST به نسخه پیش فرض مجموعه کوچکی از کاربران مدیریت |
F002 |
نیاز عملکردی |
|
4 |
امکان تولید گزارش های موردی که نشان دهنده شکاف در داده ها برای هر ویژگی انتخاب شده است |
F003 |
نیاز عملکردی |
|
5 |
توانایی اطمینان از انتقال داده های منبع به پایگاه داده تولید و داشتن دامنه ها و روابط مناسب |
D002 |
نیاز داده ها – سازگاری منطقی |
|
6 |
امکان اطمینان از صحت داده های منبع طبق استانداردهای تعریف شده |
D003 |
داده مورد نیاز – دقت مکانی |
|
7 |
توانایی اطمینان از اینکه تولید داده برای جمعآوران سیار است و ویژگیها دقیق است |
D004 |
داده مورد نیاز – دقت موضوعی |
|
8 |
امکان اطمینان از عدم همپوشانی بین اقدامات رویداد در طول دوره پروژه 2010-2020 |
D005 |
داده مورد نیاز – کیفیت زمانی |
|
9 |
امکان پیوند یک خطای اعتبارسنجی با یک قانون تجاری نقض شده و ارائه توضیحات |
F004 |
نیاز عملکردی |
|
10 |
امکان شناسایی تعداد سلول هایی که پر نشده اند (NULL) برای هر فیلد ویژگی مورد نیاز |
D006 |
داده مورد نیاز – دقت موضوعی |
|
11 |
امکان شناسایی بسته هایی که هیچ ویژگی ردپای ساختمانی روی هم ندارند |
D007 |
نیاز داده ها – سازگاری منطقی |
|
12 |
امکان ایجاد گزارش خطا، تولید فایل های اکسل و ذخیره آنها در یک درایو محلی |
F005 |
نیاز عملکردی |
|
13 |
امکان اعتبارسنجی یک ویژگی شناسه منحصر به فرد که یک بسته را به ویژگی های ردپای ساختمان منطبق می دهد |
D008 |
نیاز داده ها – سازگاری منطقی |
|
14 |
امکان تایید همه ویژگی ها با استانداردهای ابرداده مطابقت دارد |
D009 |
نیاز به داده – کامل بودن داده |
|
15 |
امکان شناسایی ویژگی های موجود به عنوان یک خطا |
F006 |
داده مورد نیاز – دقت موضوعی |
|
16 |
امکان نشان دادن مکان ویژگی های از دست رفته به عنوان خطا |
F007 |
نیاز به داده – کامل بودن داده |
5.1 کیفیت داده های مکانی: اعتبار، دقت و دقت
5.1.1 اعتبار
داده ها برابر ایجاد نمی شوند. داده ها در کیفیت آنها متفاوت است . کیفیت داده مفهومی با چندین مؤلفه است که شامل ایدههایی در مورد دقت و صحت دادهها میشود، بنابراین تمرکز بر این است که آیا دادهها به اندازه کافی خاص هستند و چقدر خطا دارند. کیفیت داده ها همچنین شامل ارتباط داده ها می شود که تعیین می کند آیا داده ها برای یک برنامه خاص مناسب هستند یا خیر. جنبههای کیفیت داده اغلب به عنوان «مناسب برای استفاده» توصیف میشوند. میزان مناسب بودن دادهها برای یک برنامه میتواند تحت تأثیر تعدادی از ویژگیها باشد، از تناقضات و ناهماهنگی در قالببندی دادهها گرفته تا دادهها از نوع اشتباه یا خطاهای بسیار زیاد.
تصور کنید شما یکی از محیط بانان علاقه مند هستید که خرس های گریزلی را از طریق پناهگاه حیات وحش ردیابی می کند تا مناطقی را که مردم ممکن است با حیوانات در تماس باشند شناسایی کنند. قلادههای رادیویی که خرسها میپوشند، هر پنج دقیقه یک بار دادههای مکان جدیدی ارسال میکنند و با هر بهروزرسانی، الگوهای فعالیت خرسها آشکار میشود. در این مثال، هیچ مشکلی با اعتبار داده ها وجود ندارد: شما به موقعیت های خرس ها علاقه مند هستید، و این دقیقاً داده هایی است که تجهیزات ردیابی شما دریافت می کنند.
از آنجایی که این داده های ردیابی خیالی و بدون خطا کاملاً با مشکل مورد نظر مرتبط هستند، نیازی به بررسی داده های جایگزین وجود ندارد. کیفیت داده به وضوح به اندازه کافی برای هدف مورد نظر بالا است.
داده هایی با این کیفیت بالا در رابطه با هدف، هنجار نیستند و همیشه مورد نیاز نیستند. اغلب، ما باید تصمیمات بسیار دقیقی در مورد اینکه کدام داده استفاده کنیم و چرا یک مجموعه از داده ها ممکن است بهتر از دیگری باشد، بگیریم. به جای دانستن مکان دقیق هر خرس در پناهگاه، سناریوی بسیار محتملتری شامل تکاوران تکیه بر یک یا چند پایگاه داده دیگری است که ممکن است داشته باشند. پایگاه داده های موجود آنها ممکن است شامل موارد زیر باشد: سوابق تله گذاری، مشاهده خرس گزارش شده توسط مهمانان، سیاهههای مربوط به دامپزشکی، و فروش از مرکز بازدیدکنندگان.
اگرچه سوابق فروش از مرکز بازدیدکنندگان را می توان نادیده گرفت که برای هدف مورد نظر مناسب نیستند، سایر داده ها همگی به طور بالقوه مرتبط هستند. در این مورد، محیط بانان باید تصمیم بگیرند که کدام پایگاه داده، یا ترکیبی از پایگاه های داده، برای شناسایی مکان های پارک که در آن محدودیت هایی برای دسترسی عمومی برای جلوگیری از برخورد نزدیک با خرس ها لازم است، بهترین مناسب است.
این سناریو نشان می دهد که کیفیت داده ها نه تنها به داده ها بلکه به برنامه مورد نظر نیز بستگی دارد. داده هایی که ممکن است برای یک هدف مناسب و معتبر نباشند ممکن است برای دیگری بسیار مناسب باشند. دادههای مکانی که فقط در نزدیکترین کیلومتر مشخص است، ممکن است از کیفیت کافی برخوردار باشند تا محیطبانان بتوانند تعداد خرسهای پناهگاه را تعیین کنند. احتمالاً یک سیستم دفاع موشکی با سنسورهای موقعیت یابی که پتانسیل خطای مشابهی دارند، از کیفیت کافی برای استفاده در نظر گرفته نمی شوند.
5.1.2 دقت و دقت
موقعیت ها محصول اندازه گیری ها هستند. تمام اندازه گیری ها دارای درجاتی از خطا هستند. با داده های جغرافیایی، خطاها در عمل اصلی اندازه گیری مکان ها در سطح زمین معرفی می شوند. هنگامی که داده های نسل دوم و سوم تولید می شوند، به عنوان مثال، هنگام اسکن نقشه کاغذی برای تبدیل آن به نسخه دیجیتال یا هنگام جمع آوری ویژگی ها در فرآیند تعمیم نقشه، خطاها نیز معرفی می شوند.
به طور کلی سه منبع خطا در اندازه گیری وجود دارد: انسان، محیطی که در آن کار می کند و ابزار اندازه گیری که استفاده می کند.
خطاهای انسانی شامل اشتباهاتی مانند خواندن نادرست ابزار و قضاوت های نادرست است. قضاوت زمانی به عاملی تبدیل میشود که پدیدهای که اندازهگیری میشود مستقیماً جمعآوری نشده باشد (مانند نمونه آب)، یا دارای مرزهای مبهم باشد (مانند محدوده خانه یک خرس گریزلی).
ویژگی های محیطی مانند تغییرات دما، گرانش و انحراف مغناطیسی در طول زمان نیز منجر به خطاهای اندازه گیری می شود.
خطاهای ابزار از این واقعیت است که فضا پیوسته است. هیچ محدودیتی برای تعیین دقیق یک موقعیت وجود ندارد. با این حال، اندازهگیریها فقط میتوانند به اندازه قابلیتهای ابزار دقیق باشند. مهم نیست چه ابزاری وجود دارد، همیشه محدودیتی برای تشخیص کوچک بودن تفاوت وجود دارد. به آن محدودیت رزولوشن می گویند .
نمودار در شکل 5.1 همان موقعیت (نقطه در مرکز bullseye) را نشان می دهد که توسط دو ابزار اندازه گیری شده است. دو الگوی شبکه ای کوچکترین اجسامی را نشان می دهند که می توانند توسط ابزار شناسایی شوند. الگوی سمت چپ نشان دهنده ابزاری با وضوح بالاتر است.
وضوح یک ابزار بر دقت یا درجه دقت اندازه گیری های انجام شده با آن تأثیر می گذارد. خوانش دما از نمونه آب را در نظر بگیرید. ابزاری که قادر به ثبت اندازه گیری 17 درجه سانتیگراد باشد به اندازه ابزاری که می تواند 17.032 درجه سانتیگراد را ثبت کند دقیق نیست. همانطور که در شکل 5.2 مشاهده می شود، دقت در داده های مکانی نیز مهم است. اندازه گیری در سمت چپ با ابزاری با وضوح بالاتر گرفته شده است و دقیق تر از اندازه گیری در سمت راست است.
دقت اغلب با دقت اشتباه گرفته می شود ، اما این دو اصطلاح به معنای چیزهای بسیار متفاوتی هستند. در حالی که دقت به وضوح و تنوع مربوط می شود، دقت فقط به میزان نزدیک بودن اندازه گیری به مقدار واقعی اشاره دارد و این دو ویژگی به یکدیگر وابسته نیستند (شکل 5.4).
شکل 5.4: دقت و دقت مستقل هستند.
وقتی خطاهایی که بر دقت یا دقت تأثیر می گذارند رخ می دهند، می توانند خطاهای سیستمی یا تصادفی باشند .
خطاهای سیستمی به طور کلی از یک روند پیروی می کنند و ثبات در بزرگی، جهت یا برخی ویژگی های دیگر را نشان می دهند . از آنجایی که خطاهای سیستمیک از یک روند پیروی می کنند، اغلب می توان آنها را با تنظیم اندازه گیری ها با یک عامل ثابت اصلاح کرد. به عنوان مثال، اگر خوانش دما به طور مداوم 17 درجه سانتیگراد بیش از حد بالا باشد ، با کم کردن 17 درجه سانتیگراد از مقادیر اندازه گیری شده، خوانش ها به سطوح دقیق باز می گردند. به این نوع تصحیح، تصحیح افزودنی می گویند. گاهی اوقات به تنظیمات پیچیده تری نیاز است و ممکن است مقادیر با معادله ای که پس از بررسی روند خطاها تعیین شده است، مقیاس شوند. این به عنوان تصحیح متناسب نامیده می شود .
خطاهای تصادفی از یک روند سازمان یافته پیروی نمی کنند و می توانند هم از نظر بزرگی و هم در جهت متفاوت باشند. بدون سازگاری قابل پیش بینی، شناسایی و تصحیح خطاهای تصادفی دشوارتر است. در صورت وجود خطاهای مکان یابی تصادفی، دقت را اغلب می توان با گرفتن میانگین نقاط داده از اندازه گیری های متعدد برای یک ویژگی بهبود بخشید. مقدار دادههای حاصل احتمالاً دقیقتر از هر یک از اندازهگیریهای پایه فردی است.
قبل از سال 2000، سیگنال های GPS به دلایل امنیت ملی عمدا برای استفاده غیرنظامی تخریب می شدند. فرآیند مورد استفاده، دسترسی انتخابی (SA) نامیده میشود ، که عمداً خطا را برای کاهش عملکرد اندازهگیریهای GPS در سطح مصرفکننده معرفی میکند. تصمیم برای خاموش کردن SA در سال 2000 باعث شد که GPS بلافاصله برای استفاده غیرنظامی قابل استفاده باشد و از آن زمان شاهد افزایش چشمگیری در فناوری مصرف کننده مجهز به GPS بوده ایم. برای اطلاعات بیشتر در مورد دسترسی انتخابی، به GPS.gov مراجعه کنید.
بدون دیدگاه