نحوه تولید داده های مکانی با کیفیت برای GIS

GEOGRAMA - نحوه تولید داده های مکانی با کیفیت برای GIS

نحوه تولید داده های مکانی با کیفیت برای GIS

مفهوم کیفیت چیزی است که همه ما فکر می کنیم درک می کنیم، اما اغلب در تعریف دقیق آن ناتوان هستیم. در مورد داده های مکانی نیز همین اتفاق می افتد. به همین دلیل، از Geograma این مقاله را برای شما باقی می‌گذاریم که در آن آن را روشن می‌کنیم، و همچنین بر جنبه‌های اصلی مربوط به تولید اطلاعات جغرافیایی با استانداردهای با کیفیت بالا و ارتباط آن در شرایط فعلی تأکید می‌کنیم.

 

کیفیت داده های مکانی چیست؟

ما کیفیت داده های مکانی را به عنوان توانایی آنها برای برآوردن الزامات و مشخصات تعریف شده که برای برآوردن نیازهای کاربران و تولیدکنندگان در نظر گرفته شده است، درک می کنیم.

برای دقیق تر، می توان به تعریف ارائه شده توسط ISO 19101 – اطلاعات جغرافیایی اشاره کرد. مدل مرجع بر اساس کدام کیفیت است:

“مجموعه ویژگی های یک محصول که بر توانایی آن در برآوردن نیازهای اعلام شده و ضمنی تاثیر می گذارد.”

در کیفیت داده های مکانی، باید به خطاهای موجود در داده ها توجه ویژه ای داشته باشیم. باید در نظر داشت که همه داده های جغرافیایی همیشه دارای یک خطا هستند، بنابراین نمی توانیم آنها را به طور کامل حذف کنیم. بنابراین، داده‌های جغرافیایی با کیفیت، داده‌ای است که حاشیه خطا را به شیوه‌ای صحیح ایجاد و اعلام می‌کند و داده‌ها را متناسب با اهداف مورد استفاده قرار می‌دهد.

چرا به داده های مکانی با کیفیت در GIS نیاز داریم؟

داده ها مبنایی هستند که سایر داده ها از طریق پردازش آنها در سیستم های اطلاعات جغرافیایی (GIS) تولید می شوند. این امر ما را آگاه می کند که اگر نقطه شروع ما اشتباه باشد، هرگز به مقصد مورد نظر خود نخواهیم رسید. همه اینها با وجود سرمایه گذاری منابع ارزشمند زیادی برای انجام این کار.

این موضوع در زمانی که رشد حجم داده‌های مکانی محسوس است، اهمیت بیشتری پیدا می‌کند. این اطلاعات به طور فزاینده ای در هنگام تصمیم گیری های کلیدی مدیریت، هم در شرکت های خصوصی و هم در ادارات دولتی مورد توجه قرار می گیرد .

ما فقط در مورد حجم داده های جغرافیایی صحبت نمی کنیم، بلکه در مورد تنوع داده ها نیز صحبت می کنیم. در اینجا ما در مورد تصاویر ماهواره ای، تصاویر حسگر، دستگاه های تلفن همراه، فناوری نقشه برداری موبایل و بسیاری از منابع دیگر صحبت می کنیم.

GEOGRAMA - داده های مکانی با کیفیت برای GIS

نحوه تولید داده های مکانی با کیفیت برای GIS

ویژگی های کیفیت داده های مکانی را در نظر بگیرید

اول از همه، برای شکل دادن به کیفیت داده های جغرافیایی، باید بدانیم 7 مؤلفه ای که کیفیت را تعریف می کنند، چیستند که عبارتند از:

  1. دقت موقعیت: دقت مرجع جغرافیایی مرتبط با هر داده. یعنی مختصاتش.
  2. دقت ویژگی: به صحت مقادیر مرتبط با یک عنصر در یک موقعیت معین اشاره دارد. به عنوان مثال، تراکم جمعیت یک منطقه توسط یک سلول روی نقشه مشخص می شود.
  3. سازگاری منطقی: روابط موجود بین داده های مکانی مختلف باید ثبت شود.
  4. سازگاری توپولوژیکی: این بدان معناست که مقادیر باید دارای مقداری در مقادیر مورد انتظار و در واحدهای مورد انتظار باشند.
  5. کامل بودن: باید معیارهای روشنی وجود داشته باشد که توضیح دهد چرا داده های خاص جمع آوری نمی شوند. به عنوان مثال، به دلیل اینکه آنها مفید نیستند یا به دلایل مقیاس.
  6. کیفیت زمانی: محیط قابل تغییر است، بنابراین اگر به دلیل گذشت زمان، واقعیت با آنچه در زمان ثبت آن منعکس شده است متفاوت باشد، ممکن است کیفیت داده های مکانی کاهش یابد .
  7. منشا داده ها: برای تعیین کیفیت داده ها و همچنین فرآیندهایی که منشأ آن داده اند، در صورتی که از داده های اولیه دیگر آمده باشد، باید مبدأ داده ها را دانست.

شناسایی خطاها و سنجش ارتباط آنها

همانطور که قبلاً در بالا بحث کردیم، اساس کیفیت داده های مکانی در خطای مربوط به داده های مکانی، ماهیت، بزرگی و این واقعیت است که برای استفاده مورد نظر از اطلاعات جغرافیایی مناسب است .

در مورد خطاها باید نوع و بزرگی آنها را بشناسیم و به درستی مدیریت کنیم. در میان انواع خطاهای مرتبط با یک داده مکانی، ما داریم:

  • خطای مفهومی و مدل: این با تکنیک مورد استفاده برای نمایش اطلاعات، مانند شطرنجی و برداری، مرتبط است. برای رسیدن به هدف خود باید کسی را انتخاب کنیم که خطاهایش قابل قبول تر است.
  • خطاهای منبع داده: به عنوان مثال، هنگام پردازش داده های اولیه که صحیح نیستند، رخ می دهد. در اینجا می توانیم از یک نقشه اشتباه یا اندازه گیری از یک سنسور با کالیبره ضعیف صحبت کنیم.
  • خطاهای ایجاد نقشه: این خطاها، در میان دیگر منشأها، می توانند هنگام انتقال داده های برچسب از یک نقشه فیزیکی به نقشه دیجیتال توسط یک اپراتور یا هنگام تبدیل داده ها از فرمت برداری به فرمت شطرنجی و بالعکس ایجاد شوند.
  • خطاهای تجزیه و تحلیل: این خطاها زمانی به وجود می آیند که داده ها از تجزیه و تحلیل داده های اصلی دیگری که به درستی انجام نشده است به دست می آیند.

با در نظر گرفتن تمام این پارامترها و همچنین پیروی از مجموعه ای از دستورالعمل های فنی خاص برای هر مورد، داده های جغرافیایی مورد نیاز خود را با کیفیت مناسب به دست خواهیم آورد. یک فرآیند کلیدی برای کار صحیح با GIS و ارائه نتایجی به ذینفعان که به آنها در بهبود مدیریت منابع در پروژه های مربوطه کمک می کند.

سه راه برای بهبود کیفیت داده ها در GIS

در تمام زندگی ام برای مدیریت وزنم تلاش کرده ام. من احتمالاً 1000 پوند در زندگی ام کم کرده ام، اما مشکل این است که 1050 پوند اضافه کرده ام. اگر واقعاً می‌خواستم برای همیشه وزن کم کنم، عادت‌های بد غذایی قدیمی‌ام را برای همیشه کنار می‌گذاشتم، نه اینکه آنها را برای مدتی در طول رژیم به حالت تعلیق درآورم و به محض اینکه به اندازه کافی وزن کم کردم دوباره آنها را برگردانم. برای دگرگونی واقعی، عادات قدیمی و منفی باید بمیرند.

ما در مورد تحول دیجیتال زیاد شنیده ایم. واقعاً دو، شاید سه عنصر تحول دیجیتال وجود دارد. اولین عنصر بستر فناوری مناسب است. دوم تغییر در رفتار است، شاید حتی یک تغییر اساسی. گاهی اوقات، مورد سوم یک اختلال کامل در کسب و کار است. UBER، iPhone، Netflix و Airbnb روش استفاده از تاکسی، برقراری ارتباط، تماشای فیلم و اقامت در هتل ها را تغییر داده اند. این دگرگونی ها شامل تحولی در رفتار است. دلیل اینکه نمی توانم وزنم را کنترل کنم این است که رفتارم را با موفقیت تغییر نداده ام.

تاسیسات برق در حال تغییر هستند. مشتریان سیستم های خورشیدی را به صورت دسته جمعی نصب می کنند. مردم باتری ها را در گاراژ خود آویزان می کنند. ریزشبکه ها در همه جا ظاهر می شوند. شرکت های برق در حال جداسازی اجزای سازنده خود هستند: تولید، انتقال، توزیع و خدمات خرده فروشی.

برای بقای سودآور، شرکت‌های انتقال و توزیع (T&D) باید عادات و آیین‌های قدیمی را که از زمان توماس ادیسون کامل کرده‌اند، از بین ببرند. این راز نیست که بسیاری از صنایع آینده نگر مبتنی بر داده ها هستند. برای زنده ماندن در تحول دیجیتال، آنها باید تغییر کنند.

فقدان سرمایه گذاری در مدیریت، پردازش و نگهداری داده های خوب یکی از عادت های بسیار بد شرکت ها است. آنها باید این عادت را از بین ببرند. داده های خوب یک نیاز اساسی برای کارایی عملیاتی و مالی است. اکثر شرکت های برق دارای GIS هستند. با این حال، مطالعه پس از مطالعه و مصاحبه پس از مصاحبه نشان می‌دهد که شرکت‌ها به کیفیت داده‌های GIS خود اعتماد ندارند. اکثر آنها سابقه کاملی از امکانات T&D خود در GIS ندارند. آنها اطلاعات پست را در CAD نگه می دارند. سپس آنها به ندرت داده های پست خود را برای انعکاس موقعیت های ساخته شده به روز می کنند. آنها به ندرت سازه های زیرزمینی را مدل سازی می کنند. اکثر آنها فرآیندهایی برای اطمینان از به موقع بودن داده ها ندارند. و در بسیاری از موارد، مکان تاسیسات حتی به GPS دقیق نزدیک نیست. در یک مطالعه چندین سال پیش، Esri از شرکت‌های برق پرسید که چه مدت طول می‌کشد تا اطلاعات از میدان وارد GIS شوند. در برخی موارد، زمان را بر حسب هفته اندازه گیری می کنند، نه دقیقه، ساعت یا حتی روز. بهای این عدم دقت، به موقع و کامل بودن صرفاً عدم کارایی است که به هزینه های بالاتر تبدیل می شود. خدمات مشتری و قابلیت اطمینان ضعیف؛ و در برخی موارد تصادفات. در حالی که اکنون اکثریت موافقند که GIS یک جزء اساسی در مجموعه فناوری اطلاعات هر ابزار T&D است، وجود ساده GIS کافی نیست.

چگونه بسیاری از شرکت های خدمات شهری با اطلاعات ناقص، نادرست یا قدیمی برخورد می کنند؟ آسان. آنها فقط از مردم می خواهند به داخل وسایل نقلیه بپرند و از مردم بخواهند که بررسی کنند تا ببینند آیا اطلاعات موجود در سوابق آنها واقعاً صحیح است یا خیر. این یک عادت بد پرهزینه و وقت گیر است. Utilities این کار را بسیار انجام می دهند.

داده ها باید درست باشند.دلیل اینکه بسیاری از شرکت ها مجموعه کاملی از داده ها را ندارند، البته هزینه مهاجرت، جمع آوری و نگهداری داده ها است. ابزار T&D دارای نیروی کار پیر، زیرساخت قدیمی، قرار گرفتن در معرض هزینه بیشتر، حاشیه سود کمتر و افزایش انتظارات مشتری است. بنابراین آنها بر این باورند که پولی برای انجام کار بهتر برای تکمیل انتقال داده ها و گرفتن دارایی های دشوارتر مانند تاسیسات زیرزمینی، پست ها یا خدمات ثانویه باقی نمانده است. با این حال امروزه، اطلاعات بیشتر تصمیمات تجاری مدرن را هدایت می کند، از جمله نحوه اولویت بندی سرمایه گذاری در تسهیلات. فرآیندها به داده های خوب وابسته هستند. نوسازی شبکه ایجاب می کند.

سه راه برای بهبود کیفیت داده ها در GIS

1. به GIS به عنوان یک پلتفرم فکر کنید

GIS ماشین تهیه نقشه نیست. پلتفرم ArcGIS Esri زمانی در بهترین حالت خود قرار دارد که به عنوان وسیله ای برای استخراج اطلاعات از منابع مختلف داده، چه در داخل و چه در خارج از شرکت عمل می کند. این شامل هوش تجاری، داده های اولین پاسخ دهندگان، از منابع شهر هوشمند، اطلاعات مشتری، مواد، مدیریت کار، مدیریت دارایی، SCADA، ADMS، AMI و سیستم های تجزیه و تحلیل شبکه است. نیازی نیست که Utilities تمام داده ها را در GIS ذخیره و نگهداری کنند. از قضا، ابزارهای برق اغلب اطلاعات زیادی را در GIS ضبط می کنند.

GIS به چه چیزی نیاز دارد؟

  • موجودی کامل دارایی های تسهیلات
  • محل آن دارایی ها،
  • روابط فضایی دارایی ها با یکدیگر و با دنیای اطرافشان.

آنها اطلاعات زیادی در یک مکان دارند و در جایی که به آن نیاز دارند کافی نیستند. اگر شرکت‌ها بخواهند اطلاعات جمعیتی را روی نقشه ببینند، می‌توانند آن را از وب بیرون بکشند. دارایی ها را همانطور که واقعا هستند مدل کنید.

Utilities سفر GIS خود را با تکرار کاغذ قدیمی، نقشه های توزیع و انتقال آغاز کردند. آنها می خواستند نسخه دیجیتال دقیقاً شبیه نقشه های کاغذی قدیمی باشد. این یک انتقال دیجیتال بود، زیرا رفتار کارگران واقعاً تغییر چندانی نکرده بود. این بدان معناست که چیزها واقعاً آنطور که وجود دارند از گروه الگوبرداری نشده بودند. با ابزار جدید ArcGIS Utility Network Management Extension، اکنون می توانید بهترین ها را از هر دو دنیا دریافت کنید. آنها می توانند استفاده از نقشه ها را آسان کنند و عناصر شبکه را با تمام ویژگی ها، مانند پایانه ها، پیکربندی زمین و فناوری بانکی داخلی نشان دهند.

2. گرفتن شبکه کامل در GIS

این ایده که GIS تنها منبع حقیقت است، دروغ است. خب امروز دروغه این باید تنها درگاه حقیقت باشد. اطلاعات مربوط به پست‌ها، طرح‌های انتقال، سیستم‌های رله، سازه‌های زیرزمینی و مجموعه‌ای از امکانات دیگر در جای دیگری ذخیره می‌شوند. GIS می تواند یک مدل کامل از سیستم T&D را ذخیره کند که گاهی اوقات در GIS یک دوقلو دیجیتال نامیده می شود. داشتن تمام امکانات داده در یک مکان، از تکرار، داده های غیر همگام و فرآیندهای پیچیده جلوگیری می کند – همه عادات بد!

3. داده ها را در دستان همه قرار دهید

باور کنید یا نه، شرکت‌های خدمات شهری هنوز نقشه‌هایی را برای کارگران میدانی خود چاپ می‌کنند. این باعث ایجاد مشکل در ارتباطات، همکاری و هماهنگی می شود – سه c مدیریت خوب داده ها. با استفاده از پلتفرم ArcGIS، هنگامی که اتفاقی در میدان رخ می دهد و در دستگاه تلفن همراه کارگر میدانی به روز می شود، همه در هر دستگاهی، در هر مکان و در هر زمان در مورد آن می دانند. پلتفرم ArcGIS سرنخ از پلتفرم های رسانه های اجتماعی است. توییت ها فوری هستند. همچنین، هنگامی که کارگران میدانی داده های خود را در دستگاه تلفن همراه به روز می کنند، همه می دانند. کاغذ فرآیندها را به پایین می کشاند. این فقط سرعت کارها را تا حد خزیدن کند می کند.

با پلتفرم ArcGIS، سفر طولانی از میدان تا بخش GIS وجود ندارد

اگر روزی بخواهم وزن کم کنم، عادات غذایی قدیمی من باید از بین برود. به همین ترتیب، اگر ابزارهای T&D بخواهند تغییر کنند، عادات داده قدیمی آنها باید از بین بروند. دیگر نیازی به پیش‌فرض بررسی‌های میدانی برای صحت داده‌ها نیست. دیگر به GIS به عنوان یک ماشین نقشه‌سازی دیگر تکیه نمی‌کنیم. دیگر نیازی به نگهداری داده ها در کابینت فایل نیست. در عوض، شرکت ها باید ادغام با سیستم های شرکتی را بهبود بخشند و در فرآیندهای مدرن حاکمیت داده سرمایه گذاری کنند. این چیزی است که یک پلت فرم موقعیت مکانی واقعی فراهم می کند.

 

کیفیت داده مهم است

 

برای انجام تجزیه و تحلیل مکانی دقیق و ایجاد محصولات اطلاعاتی با کیفیت بالا، داده‌های منبع شما باید سطح مشخصی از کیفیت را داشته باشند. داده‌های با کیفیت ناشناخته ارزش کار شما را کاهش می‌دهند و ممکن است بر تصمیم‌گیری یا سایر عملیات تجاری که بر نتایج تحلیل دقیق متکی هستند تأثیر منفی بگذارد.

ArcGIS Data Reviewer ، توسعه‌ای برای ArcGIS، این خطر را با پیاده‌سازی جریان‌های کاری که داده‌هایی را که نیازهای کیفیت شما را برآورده نمی‌کنند برجسته می‌کند، کاهش می‌دهد و منجر به افزایش اعتماد به داده‌های شما، افزایش بهره‌وری و کاهش هزینه‌ها می‌شود. با ارائه مجموعه‌ای از قابلیت‌ها که از شناسایی، مدیریت و گزارش خطاها در داده‌های شما پشتیبانی می‌کند، هزینه‌های مدیریت داده را کاهش می‌دهد. بهره وری را با خودکار کردن تشخیص خطاهای رایج در داده های GIS و گردش کار ساده برای شناسایی داده های با کیفیت پایین که به روشی خودکار قابل شناسایی نیستند، افزایش می دهد. با شناسایی و رسیدگی به خطاهایی که بر تصمیم گیری تأثیر می گذارد، اعتماد کلی به محصولات و خدمات اطلاعاتی افزایش می یابد.

ما با ArcGIS Data Reviewer بسیار بیشتر به داده های خود اطمینان داریم. می‌توانیم وارد اتاق شویم و از مکالمه با کسی احساس خوبی داشته باشیم، زیرا دقیقاً می‌دانیم اطلاعات ما در کجا قرار دارند و برای رفع آن چه کاری باید انجام دهیم.
_______________________________________
تری بانتینگ، اداره آب توسان

پیاده سازی گردش کار خودکار و نیمه خودکار که کیفیت داده ها را بهبود می بخشد.
گردش‌های کاری تکراری که داده‌های با کیفیت پایین را شناسایی و گزارش می‌کنند

تشخیص داده های بی کیفیت را خودکار کنید

بررسی خودکار داده ها قابلیتی است که کیفیت یک ویژگی را بدون دخالت انسان ارزیابی می کند. برای تیم‌های محدود به منابع، اتوماسیون شما را قادر می‌سازد تا ارزیابی کیفیت داده‌ها را با کمترین تأثیر بر کارکنان و در عین حال بهبود کیفیت داده اجرا کنید. برای سازمان‌های بزرگ، اتوماسیون ثبات در تولید داده‌ها را در تیم‌های متعدد امکان‌پذیر می‌کند و مدیریت دانش را با ادغام الزامات کیفیت در گردش‌های کاری تکرارپذیر افزایش می‌دهد.

Data Reviewer کتابخانه ای از چک ها را برای اعتبارسنجی داده ها بر اساس الزامات کیفیت منحصر به فرد شما فراهم می کند. بررسی‌ها برای ارزیابی جنبه‌های مختلف کیفیت یک ویژگی، از جمله انتساب، یکپارچگی یا رابطه فضایی آن با سایر ویژگی‌ها طراحی شده‌اند. برای مثال، شرکت‌های برق باید موقعیت دقیق دارایی‌های خود را حفظ کنند، زیرا اطلاعات نادرست می‌تواند بر تکمیل پروژه‌های ساخت و ساز یا تعمیر و اعلان‌های خروجی به مشتریان تأثیر بگذارد.

چک‌های خودکار بازبین یک قابلیت تنظیم‌پذیر/بدون کد است که برای پیاده‌سازی به مهارت‌های برنامه‌نویسی تخصصی نیاز ندارد. در بسیاری از موارد، متخصصان GIS با درک خوبی از الزامات کیفی سازمان خود می توانند گردش کار بررسی خودکار را با استفاده از Data Reviewer با حداقل آموزش پیاده سازی کنند.

مرورگر داده، پوستری را که بررسی‌هایی را که بررسی خودکار داده‌ها را نشان می‌دهند، بررسی می‌کند
از پوستر ArcGIS Data Reviewer Checks به عنوان راهنمای بررسی خودکار داده ها استفاده کنید. برای دیدن پوستر کامل روی عکس بالا کلیک کنید.

بررسی خودکار را می توان به روش های مختلفی ادغام کرد:

  • ارزیابی کیفیت یک ویژگی در هنگام ایجاد یا اصلاح در هنگام ویرایش. این امر از ایجاد ویژگی هایی که الزامات کیفی را برآورده نمی کنند جلوگیری می کند و نیاز به کار مجدد را کاهش می دهد.
  • ارزیابی کیفیت یک ویژگی پس از ایجاد آن. این می تواند زمانی مفید باشد که داده های موجود از کیفیت ناشناخته ای برخوردار باشند و یک ارزیابی پایه برای شناسایی تلاش مورد نیاز برای دستیابی به الزامات کیفیت مورد نیاز باشد.

درباره بررسی خودکار داده ها با استفاده از این منابع بیشتر بیاموزید:

  • شناسایی الزامات کیفیت داده ها (اسناد)
  • طراحی قانون بازبین (اسناد)
  • اجرای کنترل کیفیت خودکار (آموزش)
  • افزایش تضمین کیفیت در حین ویرایش (آموزش)
بررسی بصری خطاها را در دقت و کامل بودن مکانی شناسایی می کند.
از ورودی کارشناسان موضوع داده برای بهبود گردش کار کنترل کیفیت خود استفاده کنید

اجرای یک بررسی جامع کیفیت

همه خطاهای موجود در داده های شما را نمی توان با استفاده از روش های خودکار شناسایی کرد. بررسی نیمه خودکار کیفیت داده ها را با استفاده از تعامل و ورودی انسانی ارزیابی می کند. بررسی بصری رایج‌ترین شکل بررسی نیمه خودکار است و برای ارزیابی کیفیت به روش‌هایی استفاده می‌شود که روش‌های خودکار ممکن است از آن پشتیبانی نکنند. این شامل یافتن ویژگی‌های گمشده، نامناسب یا کدگذاری اشتباه می‌شود.

این نوع خطاها به طور معمول توسط کارشناسان موضوع و سایر مصرف کنندگان داده که از داده های GIS در کار روزانه خود استفاده می کنند، پیدا می شود. با استفاده از گردش کار Data Reviewer برای مهار این بازخورد، می‌توانید کیفیت داده‌هایی را که تولید و به اشتراک می‌گذارید بهبود بخشید.

درباره ادغام بازخورد از کارشناسان موضوع و سایر مصرف کنندگان داده با استفاده از این منابع بیشتر بیاموزید:

  • شناسایی خطاها در ویژگی های موجود (اسناد)
  • شناسایی ویژگی های گمشده (اسناد)

پیگیری و گزارش پیشرفت در مورد اهداف کیفیت داده ها

Data Reviewer مدیریت و ردیابی خطاها را از طریق چرخه عمر تعریف شده امکان پذیر می کند. این گردش کار شامل ردیابی خطاهای شناسایی شده با استفاده از بررسی های خودکار و همچنین خطاهای گزارش شده توسط مصرف کنندگان داده است. اطلاعات جمع آوری شده در طول بررسی داده ها شامل منبع و شرح خطا، مکان آن، افرادی که خطا را پیدا کرده اند و شدت آن است.

این اطلاعات می تواند برای جوامع متعددی که داده های GIS را مدیریت و استفاده می کنند مفید باشد. برای ویرایشگرهای داده، این اطلاعات به آن‌ها کمک می‌کند کار خود را سریع‌تر انجام دهند و از تکرار تلاش‌ها در زمانی که چندین تیم برای بهبود کیفیت کار می‌کنند، جلوگیری می‌کند. برای مصرف‌کنندگان داده، این اطلاعات می‌تواند به شناسایی خطراتی که بر تصمیم‌گیری‌هایی که به داده‌های باکیفیت بستگی دارد تأثیر می‌گذارد کمک کند.

مرورگر داده همچنین جزئیات مربوط به اینکه چه کسی، چه زمانی و چگونه خطاها تصحیح می شوند و اینکه آیا تصحیح به عنوان قابل قبول تأیید شده است را ردیابی می کند. این اطلاعات اضافی شما را قادر می سازد تا پیشرفت در اهداف کیفیت داده ها را گزارش دهید و پیش بینی کنید که چه زمانی به اهداف کیفیت دست می یابد.

خطاهای شناسایی شده در طول فرآیند بررسی داده ها از طریق یک چرخه عمر تعریف شده که از سه مرحله (بازبینی، تصحیح و تأیید) تشکیل شده است، ردیابی می شوند.

چرخه عمر خطای سه فاز مرورگر داده (بازبینی، تصحیح، تأیید)
پیشرفت سفر کیفیت داده خود را پیگیری و گزارش دهید

الزامات کیفیت داده را شناسایی کنید

 

با مجوز Data Reviewer موجود است.

یکی از چالش‌های پیاده‌سازی فرآیندهای کنترل کیفیت داده‌ها، شناسایی الزامات کیفی داده‌های فنی برای سازمان است. مهم است که قبل از تبدیل آنها به الزامات فنی که داده های با کیفیت خوب را تعریف می کنند، الزامات تجاری برای داده های خود را شناسایی و درک کنید.

یک فرآیند کنترل کیفیت داده موثر بر اساس درک نحوه استفاده از داده ها و محصولات اطلاعاتی در داخل و خارج سازمان است. هر سازمان کیفیت را متفاوت تعریف می کند و این تعریف را بر اساس هدف و استفاده مورد نظر از داده ها استوار می کند. نمودار زیر منابع مختلفی را برای الزامات کیفی نشان می دهد که ممکن است برای سازمان شما قابل اجرا باشد.

منابع و الزامات کیفیت داده ها

عناصر کیفیت داده

 

عناصر کیفیت داده جنبه خاصی را که برای استفاده و دقیق بودن یک مجموعه داده لازم است توصیف می کند. داده های GIS دارای مولفه های متفاوتی برای کیفیت آن هستند. همانطور که توسط سازمان بین المللی استاندارد (ISO) تعریف شده است، این اجزا شامل موارد زیر است:

  • کامل بودن
  • سازگاری منطقی
  • دقت فضایی
  • دقت موضوعی
  • کیفیت زمانی
  • قابلیت استفاده از داده ها

کامل بودن

وجود یا عدم وجود ویژگی ها، ویژگی ها و روابط آنها در یک مدل داده.

محله ای با ردپای ساختمان گمشده
محله ای با ردپای ساختمان گمشده.

سازگاری منطقی

درجه ای از پایبندی به قوانین از پیش تعیین شده ساختار، اسناد و روابط یک مدل داده که توسط یک سازمان یا صنعت تعریف شده است. بسیاری از صنایع از استانداردهایی پیروی می‌کنند که در مدل داده‌های مکانی به‌عنوان حوزه‌های ارزش، قالب‌های داده و سازگاری توپولوژیکی نحوه ذخیره داده‌ها منعکس می‌شوند.

 

بزرگراه با سنگریزه از نوع سطح جاده
بزرگراهی با سنگریزه از نوع سطح جاده.

دقت فضایی

دقت موقعیت ویژگی ها نسبت به زمین.

ویژگی دریاچه تغییر کرده است.
ویژگی دریاچه ای که تغییر کرده است.

دقت موضوعی

دقت صفات درون ویژگی ها و روابط مناسب آنها.

استخر شنا به عنوان تالاب
یک استخر شنا به عنوان تالاب.

کیفیت زمانی

کیفیت ویژگی های زمانی و رابطه زمانی ویژگی ها.

نمودار منسوخ با باند باز
نمودار منسوخ با باند باز.
نمودار به روز شده با باند بسته
نمودار به روز شده با باند فرود بسته.

قابلیت استفاده از داده ها

پایبندی یک مجموعه داده به مجموعه خاصی از الزامات مربوط به یک مورد استفاده.

برای نقشه برداری از پارک های ملی استفاده می شود
این برای نقشه برداری پارک های ملی استفاده می شود.
برای مسیریابی وسایل نقلیه اضطراری استفاده می شود
این برای مسیریابی وسایل نقلیه اضطراری استفاده می شود.

اسناد مورد نیاز کیفیت

طرح تضمین کیفیت (QA) سندی است که استانداردهای کیفیت مرتبط با یک پروژه و روش های دستیابی به آنها را مشخص می کند. طرح QA یک سند زنده است که با شناسایی الزامات کیفی جدید توسط سازمان تغییر می کند و همچنین به عنوان فرصتی برای گرد هم آوردن سهامداران کلیدی برای ایجاد تصویری مشترک از آنچه که داده های با کیفیت خوب را تشکیل می دهد و فرآیندهای تجاری که این الزامات را ایجاد می کند، تغییر می کند. .

در زیر تکنیک‌ها و استانداردهای مستندسازی وجود دارد که می‌توانند هنگام شناسایی الزامات کیفیت داده مفید باشند:

  • ISO/TC 211 اطلاعات جغرافیایی/ژئوماتیک – مجموعه استانداردهای سازمان بین المللی استاندارد (ISO) برای اطلاعات جغرافیایی برای تعریف روش ها، ابزارها و خدمات مدیریت داده ها برای به دست آوردن، پردازش، تجزیه و تحلیل، دسترسی، ارائه و انتقال این گونه داده ها به صورت دیجیتال. در میان کاربران، سیستم ها و مکان ها شکل می گیرد.
  • ماتریس ردیابی الزامات – سندی است که برای مدیریت و ردیابی الزامات تجاری ایجاد می شود تا اطمینان حاصل شود که آنها در طول اجرای پروژه برآورده می شوند. این سند الزامات تجاری جمع آوری شده برای پروژه و قابلیت های یک محصول نرم افزاری را به هم مرتبط می کند.

ستون Requirement Category در جدول زیر نمونه ای از الزامات جمع آوری شده را نشان می دهد که به برخی از عناصر کیفیت داده اشاره شده در بالا اشاره می کند. گام بعدی پس از سازماندهی و طبقه بندی نیازمندی های شما، مرتبط کردن الزامات کیفیت داده با قابلیت های مربوطه موجود در ArcGIS خواهد بود.

شناسه مورد نیاز شماره مورد نیاز دسته مورد نیاز قابلیت محصول

1

امکان اجرای پرس و جوها بر اساس تعدادی از بخش های ویرایش شده توسط یک کاربر جداگانه

F001

نیاز عملکردی

2

توانایی اطمینان از مطابقت مدل داده های تولید با استاندارد طرح صنعت

D001

نیاز داده ها – سازگاری منطقی

3

به عنوان مدیر پایگاه جغرافیایی، توانایی محدود کردن امتیازات POST به نسخه پیش فرض مجموعه کوچکی از کاربران مدیریت

F002

نیاز عملکردی

4

امکان تولید گزارش های موردی که نشان دهنده شکاف در داده ها برای هر ویژگی انتخاب شده است

F003

نیاز عملکردی

5

توانایی اطمینان از انتقال داده های منبع به پایگاه داده تولید و داشتن دامنه ها و روابط مناسب

D002

نیاز داده ها – سازگاری منطقی

6

امکان اطمینان از صحت داده های منبع طبق استانداردهای تعریف شده

D003

داده مورد نیاز – دقت مکانی

7

توانایی اطمینان از اینکه تولید داده برای جمع‌آوران سیار است و ویژگی‌ها دقیق است

D004

داده مورد نیاز – دقت موضوعی

8

امکان اطمینان از عدم همپوشانی بین اقدامات رویداد در طول دوره پروژه 2010-2020

D005

داده مورد نیاز – کیفیت زمانی

9

امکان پیوند یک خطای اعتبارسنجی با یک قانون تجاری نقض شده و ارائه توضیحات

F004

نیاز عملکردی

10

امکان شناسایی تعداد سلول هایی که پر نشده اند (NULL) برای هر فیلد ویژگی مورد نیاز

D006

داده مورد نیاز – دقت موضوعی

11

امکان شناسایی بسته هایی که هیچ ویژگی ردپای ساختمانی روی هم ندارند

D007

نیاز داده ها – سازگاری منطقی

12

امکان ایجاد گزارش خطا، تولید فایل های اکسل و ذخیره آنها در یک درایو محلی

F005

نیاز عملکردی

13

امکان اعتبارسنجی یک ویژگی شناسه منحصر به فرد که یک بسته را به ویژگی های ردپای ساختمان منطبق می دهد

D008

نیاز داده ها – سازگاری منطقی

14

امکان تایید همه ویژگی ها با استانداردهای ابرداده مطابقت دارد

D009

نیاز به داده – کامل بودن داده

15

امکان شناسایی ویژگی های موجود به عنوان یک خطا

F006

داده مورد نیاز – دقت موضوعی

16

امکان نشان دادن مکان ویژگی های از دست رفته به عنوان خطا

F007

نیاز به داده – کامل بودن داده

نمونه مورد نیاز ماتریس ردیابی

5.1 کیفیت داده های مکانی: اعتبار، دقت و دقت

5.1.1 اعتبار

داده ها برابر ایجاد نمی شوند. داده ها در کیفیت آنها متفاوت است . کیفیت داده مفهومی با چندین مؤلفه است که شامل ایده‌هایی در مورد دقت و صحت داده‌ها می‌شود، بنابراین تمرکز بر این است که آیا داده‌ها به اندازه کافی خاص هستند و چقدر خطا دارند. کیفیت داده ها همچنین شامل ارتباط داده ها می شود که تعیین می کند آیا داده ها برای یک برنامه خاص مناسب هستند یا خیر. جنبه‌های کیفیت داده اغلب به عنوان «مناسب برای استفاده» توصیف می‌شوند. میزان مناسب بودن داده‌ها برای یک برنامه می‌تواند تحت تأثیر تعدادی از ویژگی‌ها باشد، از تناقضات و ناهماهنگی در قالب‌بندی داده‌ها گرفته تا داده‌ها از نوع اشتباه یا خطاهای بسیار زیاد.

تصور کنید شما یکی از محیط بانان علاقه مند هستید که خرس های گریزلی را از طریق پناهگاه حیات وحش ردیابی می کند تا مناطقی را که مردم ممکن است با حیوانات در تماس باشند شناسایی کنند. قلاده‌های رادیویی که خرس‌ها می‌پوشند، هر پنج دقیقه یک بار داده‌های مکان جدیدی ارسال می‌کنند و با هر به‌روزرسانی، الگوهای فعالیت خرس‌ها آشکار می‌شود. در این مثال، هیچ مشکلی با اعتبار داده ها وجود ندارد: شما به موقعیت های خرس ها علاقه مند هستید، و این دقیقاً داده هایی است که تجهیزات ردیابی شما دریافت می کنند.

از آنجایی که این داده های ردیابی خیالی و بدون خطا کاملاً با مشکل مورد نظر مرتبط هستند، نیازی به بررسی داده های جایگزین وجود ندارد. کیفیت داده به وضوح به اندازه کافی برای هدف مورد نظر بالا است.

داده هایی با این کیفیت بالا در رابطه با هدف، هنجار نیستند و همیشه مورد نیاز نیستند. اغلب، ما باید تصمیمات بسیار دقیقی در مورد اینکه کدام داده استفاده کنیم و چرا یک مجموعه از داده ها ممکن است بهتر از دیگری باشد، بگیریم. به جای دانستن مکان دقیق هر خرس در پناهگاه، سناریوی بسیار محتمل‌تری شامل تکاوران تکیه بر یک یا چند پایگاه داده دیگری است که ممکن است داشته باشند. پایگاه داده های موجود آنها ممکن است شامل موارد زیر باشد: سوابق تله گذاری، مشاهده خرس گزارش شده توسط مهمانان، سیاهههای مربوط به دامپزشکی، و فروش از مرکز بازدیدکنندگان.

اگرچه سوابق فروش از مرکز بازدیدکنندگان را می توان نادیده گرفت که برای هدف مورد نظر مناسب نیستند، سایر داده ها همگی به طور بالقوه مرتبط هستند. در این مورد، محیط بانان باید تصمیم بگیرند که کدام پایگاه داده، یا ترکیبی از پایگاه های داده، برای شناسایی مکان های پارک که در آن محدودیت هایی برای دسترسی عمومی برای جلوگیری از برخورد نزدیک با خرس ها لازم است، بهترین مناسب است.

این سناریو نشان می دهد که کیفیت داده ها نه تنها به داده ها بلکه به برنامه مورد نظر نیز بستگی دارد. داده هایی که ممکن است برای یک هدف مناسب و معتبر نباشند ممکن است برای دیگری بسیار مناسب باشند. داده‌های مکانی که فقط در نزدیک‌ترین کیلومتر مشخص است، ممکن است از کیفیت کافی برخوردار باشند تا محیط‌بانان بتوانند تعداد خرس‌های پناهگاه را تعیین کنند. احتمالاً یک سیستم دفاع موشکی با سنسورهای موقعیت یابی که پتانسیل خطای مشابهی دارند، از کیفیت کافی برای استفاده در نظر گرفته نمی شوند.

5.1.2 دقت و دقت

موقعیت ها محصول اندازه گیری ها هستند. تمام اندازه گیری ها دارای درجاتی از خطا هستند. با داده های جغرافیایی، خطاها در عمل اصلی اندازه گیری مکان ها در سطح زمین معرفی می شوند. هنگامی که داده های نسل دوم و سوم تولید می شوند، به عنوان مثال، هنگام اسکن نقشه کاغذی برای تبدیل آن به نسخه دیجیتال یا هنگام جمع آوری ویژگی ها در فرآیند تعمیم نقشه، خطاها نیز معرفی می شوند.

به طور کلی سه منبع خطا در اندازه گیری وجود دارد: انسان، محیطی که در آن کار می کند و ابزار اندازه گیری که استفاده می کند.

خطاهای انسانی شامل اشتباهاتی مانند خواندن نادرست ابزار و قضاوت های نادرست است. قضاوت زمانی به عاملی تبدیل می‌شود که پدیده‌ای که اندازه‌گیری می‌شود مستقیماً جمع‌آوری نشده باشد (مانند نمونه آب)، یا دارای مرزهای مبهم باشد (مانند محدوده خانه یک خرس گریزلی).

ویژگی های محیطی مانند تغییرات دما، گرانش و انحراف مغناطیسی در طول زمان نیز منجر به خطاهای اندازه گیری می شود.

خطاهای ابزار  از این واقعیت است که فضا پیوسته است. هیچ محدودیتی برای تعیین دقیق یک موقعیت وجود ندارد. با این حال، اندازه‌گیری‌ها فقط می‌توانند به اندازه قابلیت‌های ابزار دقیق باشند. مهم نیست چه ابزاری وجود دارد، همیشه محدودیتی برای تشخیص کوچک بودن تفاوت وجود دارد. به آن محدودیت رزولوشن می گویند .

نمودار در شکل 5.1 همان موقعیت (نقطه در مرکز bullseye) را نشان می دهد که توسط دو ابزار اندازه گیری شده است. دو الگوی شبکه ای کوچکترین اجسامی را نشان می دهند که می توانند توسط ابزار شناسایی شوند. الگوی سمت چپ نشان دهنده ابزاری با وضوح بالاتر است.

وضوح در داده های مکانی. بالا: فاصله شبکه کوچکتر. کم: فاصله شبکه بزرگتر. بیشتر در متن بالا

شکل 5.1: وضوح میزان جزئیات اندازه گیری شده توسط ابزارها یا نمایش داده شده در تصاویر، مانند نقشه ها و سایر گرافیک ها را نشان می دهد.
اعتبار: گروه جغرافیا، دانشگاه ایالتی پنسیلوانیا.

وضوح یک ابزار بر  دقت یا درجه دقت اندازه گیری های انجام شده با آن تأثیر می گذارد. خوانش دما از نمونه آب را در نظر بگیرید. ابزاری که قادر به ثبت اندازه گیری 17 درجه سانتیگراد باشد به اندازه ابزاری که می تواند 17.032 درجه سانتیگراد را ثبت کند دقیق نیست. همانطور که در شکل 5.2 مشاهده می شود، دقت در داده های مکانی نیز مهم است. اندازه گیری در سمت چپ با ابزاری با وضوح بالاتر گرفته شده است و دقیق تر از اندازه گیری در سمت راست است.

وضوح و دقت در داده های مکانی بالا: جعبه کوچک (دقیق تر)، کم: جعبه بزرگ (کمتر دقیق). بیشتر در متن بالا

شکل 5.2: ابزارهای با وضوح بالاتر (سمت چپ) می توانند اندازه گیری های دقیق تری را نسبت به ابزارهای با وضوح پایین (سمت راست) ثبت کنند.اعتبار: گروه جغرافیا، دانشگاه ایالتی پنسیلوانیا.
دقت زمانی که برای اشاره به تعدادی از اندازه‌گیری‌های مکرر استفاده می‌شود، معنای کمی متفاوتی پیدا می‌کند. در شکل 5.3، واریانس کمتری بین 9 اندازه گیری در سمت چپ نسبت به 9 اندازه گیری در سمت راست وجود دارد. گفته می شود مجموعه اندازه گیری در سمت چپ دقیق تر است.

روابط دقیق با تنوع بالا: شبکه جعبه با فاصله نزدیک. کم: شبکه جعبه با فاصله بیشتر. بیشتر در متن بالا

شکل 5.3: اندازه گیری های متعدد با تغییرات کم (سمت چپ) دقیق تر از اندازه گیری های با تنوع زیاد (سمت راست) است.
اعتبار: گروه جغرافیا، دانشگاه ایالتی پنسیلوانیا.

دقت اغلب با دقت اشتباه گرفته می شود ، اما این دو اصطلاح به معنای چیزهای بسیار متفاوتی هستند. در حالی که دقت به وضوح و تنوع مربوط می شود، دقت فقط به میزان نزدیک بودن اندازه گیری به مقدار واقعی اشاره دارد و این دو ویژگی به یکدیگر وابسته نیستند (شکل 5.4).

دقت و دقت مستقل هستند. جزئیات در توضیحات متن زیر.

شکل 5.4: دقت و دقت مستقل هستند.

برای توضیح متن شکل 5.4 کلیک کنید.
اعتبار: گروه جغرافیا، دانشگاه ایالتی پنسیلوانیا.

وقتی خطاهایی که بر دقت یا دقت تأثیر می گذارند رخ می دهند، می توانند خطاهای سیستمی یا تصادفی باشند .

خطاهای سیستمی به طور کلی از یک روند پیروی می کنند و ثبات در بزرگی، جهت یا برخی ویژگی های دیگر را نشان می دهند . از آنجایی که خطاهای سیستمیک از یک روند پیروی می کنند، اغلب می توان آنها را با تنظیم اندازه گیری ها با یک عامل ثابت اصلاح کرد. به عنوان مثال، اگر خوانش دما به طور مداوم 17 درجه سانتیگراد بیش از حد بالا باشد ، با کم کردن 17 درجه سانتیگراد از مقادیر اندازه گیری شده، خوانش ها به سطوح دقیق باز می گردند. به این نوع تصحیح، تصحیح افزودنی می گویند. گاهی اوقات به تنظیمات پیچیده تری نیاز است و ممکن است مقادیر با معادله ای که پس از بررسی روند خطاها تعیین شده است، مقیاس شوند. این به عنوان تصحیح متناسب نامیده می شود .

خطاهای تصادفی از یک روند سازمان یافته پیروی نمی کنند و می توانند هم از نظر بزرگی و هم در جهت متفاوت باشند. بدون سازگاری قابل پیش بینی، شناسایی و تصحیح خطاهای تصادفی دشوارتر است. در صورت وجود خطاهای مکان یابی تصادفی، دقت را اغلب می توان با گرفتن میانگین نقاط داده از اندازه گیری های متعدد برای یک ویژگی بهبود بخشید. مقدار داده‌های حاصل احتمالاً دقیق‌تر از هر یک از اندازه‌گیری‌های پایه فردی است.

قبل از سال 2000، سیگنال های GPS به دلایل امنیت ملی عمدا برای استفاده غیرنظامی تخریب می شدند. فرآیند مورد استفاده، دسترسی انتخابی (SA) نامیده می‌شود ، که عمداً خطا را برای کاهش عملکرد اندازه‌گیری‌های GPS در سطح مصرف‌کننده معرفی می‌کند. تصمیم برای خاموش کردن SA در سال 2000 باعث شد که GPS بلافاصله برای استفاده غیرنظامی قابل استفاده باشد و از آن زمان شاهد افزایش چشمگیری در فناوری مصرف کننده مجهز به GPS بوده ایم. برای اطلاعات بیشتر در مورد دسترسی انتخابی، به GPS.gov مراجعه کنید.

 

بدون دیدگاه

دیدگاهتان را بنویسید