کنترل کیفی داده های جغرافیایی، به ویژه از منظر توپولوژیکی و معنایی، برای مدیریت خوب و استفاده از آن ضروری است. با این حال، در حین به روز رسانی داده های مکانی، برخی از ناهنجاری ها به دلیل سهل انگاری یا عدم رعایت قوانین تجاری و توپولوژیکی بر آن تأثیر می گذارد. از این رو نیاز به راه حلی است که امکان تشخیص این ناهنجاری ها را فراهم کند. امروزه سیستم های اطلاعات جغرافیایی (GIS) برای تصمیم گیری در هر پروژه ای که داده های مکانی را مدیریت می کند ضروری شده است. قابلیت ها و ابزارهای GIS امکان تعریف توپولوژی داده های برداری را می دهد. با این وجود، توپولوژی به تنهایی به نیازها در مورد تعریف قوانین خاص برای هر شبکه تسهیلات پاسخ نمی دهد. این بدان معناست که ما می‌توانیم خطاهای توپولوژیکی را در پایگاه داده مکانی پیدا کنیم، اما با در نظر گرفتن قوانین تجاری، آنها صحیح هستند و بالعکس. هدف اصلی این مقاله ابتدا تعریف قوانین تجاری برای عناصر خطی یک شبکه است. ثانیاً الگوریتم هایی که نقض قوانین تعریف شده را تشخیص می دهند تا کنترل کیفی خوبی بر داده های جغرافیایی داشته باشند.

کلمات کلیدی:

GIS; شبکه ها، پایگاه ژئودیتابیس، توپولوژی، قانون تجارت

1. مقدمه

GIS همیشه در حال تکامل است و عملکردهای تحلیل پیچیده تری را ارائه می دهد. برای همگام شدن با این تکامل، داده های جغرافیایی باید قابل بهره برداری و با کیفیت باشند. اصطلاح کیفیت بر اساس استاندارد ISO 8402 [ 1 ] به عنوان «کل ویژگی ها و ویژگی های یک محصول یا خدماتی است که توانایی آن را برای برآوردن نیازهای اعلام شده یا ضمنی دارد» تعریف می شود. برای یک پایگاه داده جغرافیایی، جدا کردن محصول (پایگاه داده) از خدمات (به روز رسانی، استخراج موضوعات خاص، و تبدیل به فرمت داده های خاص) بسیار ظریف است [ 2 ].

بنابراین، این تعریف از کیفیت با حوزه خاص اطلاعات جغرافیایی تطبیق داده شده است، در حالی که کیفیت را به دو بخش تقسیم می کند:

• کیفیت کارآموزی که شامل اندازه گیری کفایت پایگاه داده با مشخصات آن می باشد.

• کیفیت خارجی که شامل اندازه گیری کفایت نیازهای کاربران است.

ایجاد یا به روز رسانی Geodatabase (GDB) ممکن است منشأ چندین ناهنجاری باشد که ناشی از حذف انسانی یا عدم رعایت قوانین توپولوژیکی یا تجاری است، از این رو علاقه به داشتن ابزاری برای کنترل کیفیت GDB است. در واقع، هر عملکرد پیشرفته GIS به یک GDB استاندارد بالا نیاز دارد. به عنوان مثال، برای تعیین مناطق ضربه در هنگام قطع برق و مداخله در سریع ترین زمان ممکن، شبکه برق باید کاملاً متصل باشد و قوانین توپولوژیکی و تجاری را رعایت کند. با این وجود، ممکن است داده‌هایی با خطاهای توپولوژیکی در GDB داشته باشیم، اما با در نظر گرفتن معیارهای تجاری، این داده‌ها صحیح هستند یا برعکس.

راستی آزمایی داده های جغرافیایی با پیروی از رویه های استاندارد ارائه شده توسط نرم افزار GIS، که به هر حال قوانین تجاری را در نظر نمی گیرد، محدود، تکراری و خسته کننده است. از این رو، نیاز به پیشنهاد الگوریتم‌ها، شناسایی خطاها و ناهنجاری‌ها، به‌ویژه موارد توپولوژیکی و تجاری است که بیشترین تکرار را در GDBها برای عناصر خطی در یک شبکه کاربردی دارند.

2. روش شناسی

کار حاضر بر اساس مجموعه داده ای از عناصر شبکه تاسیسات، یعنی: کانال سازی شبکه های آب آشامیدنی و فاضلاب، بخش های شبکه های ولتاژ بالا (HV) و فشار ضعیف (LV) است.

رویکرد روش‌شناختی ما اولاً شامل مطالعه روابط بین موجودیت‌های GDB خطی برای تعیین رایج‌ترین قوانین تجاری در شبکه خدمات شهری، و دوم توسعه الگوریتم‌هایی برای تشخیص ناهنجاری‌هایی بود که این قوانین را نقض می‌کنند.

به منظور تشخیص نقض یک قانون از پیش تعریف شده، تمام نهادهای مربوطه باید اسکن شوند. با این وجود، ما با مقادیر عظیمی از داده های جغرافیایی سروکار داریم و پرس و جوهای مکانی نسبتاً پیچیده هستند. بنابراین، اسکن خطی رکوردهای GDB برای تشخیص عدم انطباق با یک قانون زمان زیادی می برد. به همین دلیل است که ما روش کلی زیر را برای تسریع در تشخیص ناهنجاری ها و در نتیجه بهینه سازی زمان جستجو اتخاذ کردیم.

مرحله اول، که فیلتر کردن است، با هدف کنار گذاشتن همه موجودیت‌هایی که ویژگی‌های آنها با معیارهای قانون تجارت کنترل‌شده مطابقت ندارد، کنار گذاشته می‌شود، سپس تمام موجودیت‌های باقی‌مانده که به نهاد کنترل‌شده نزدیک نیستند، کنار گذاشته می‌شوند. مرحله بعدی پالایش است که در آن جستجوی دقیق برای تخلفات صورت می گیرد تا نهادهای موضوع ناهنجاری شناسایی شوند ( شکل 1 ).

شکل 1 . فرآیندهای فیلتر کردن و پالایش پرس و جوهای فضایی [ 3 ] .

3. نتایج

3.1. قوانین برای عناصر خطی

مطالعه دقیق روابط بین این نهادها در GDB به ما این امکان را می دهد که این قوانین تعمیم دهنده را تعریف کنیم:

3.1.1. قانون 1: باید متصل باشد

این قانون تضمین می کند که دو چند خط که انتهای آنها با فاصله “d” نزدیک است باید به هم متصل شوند. “d” حاشیه ای است که توسط کنترل کننده کیفیت در هنگام تعریف این قانون مشخص می شود ( شکل 2 ).

3.1.2. قانون 2: باید به آن متصل شود

در این قانون، دو چند خط از دو کلاس ویژگی متفاوت که انتهای آنها با فاصله “d” نزدیک است باید به هم متصل شوند. “d” حاشیه ای است که توسط کنترل کننده کیفیت در هنگام تعریف این قانون مشخص می شود. برای مثال؛ یک کابل برق فشار ضعیف باید به یک کابل از همان نوع یا با ولتاژ متوسط ​​و یک لوله فاضلاب ترکیبی باید به یک لوله فاضلاب طوفان وصل شود.

3.1.3. قانون 3: باید دو اندام را روی بدن داشته باشید

در این قانون دو سر یک چند خط باید روی چند خط دیگر باشد. مثلا؛ دو سر کابل برق باید بالای یک گره اتصال و هر دو سر کانال آب آشامیدنی که باید بالای یک گره باشد.

3.1.4. قانون 4: نباید انتهایی در نزدیکی قسمت داخلی داشته باشد

این قانون مستلزم آن است که انتهای یک پلی لاین نباید با فاصله “d” به داخل پلی لاین دیگر نزدیک باشد، همانطور که در مورد لوله آب آشامیدنی یا فاضلاب که هرگز نباید داخل لوله دیگری را لمس کند ( شکل 3 ).

3.1.5. قانون 5: نباید به آن وصل شود

این قانون تضمین می کند که انتهای یک چند خط نباید با انتهای چند خط دیگر منطبق باشد. این مورد در مورد لوله آب باران است که نباید به لوله فاضلاب متصل شود.

3.1.6. قانون 6: نباید همپوشانی داشته باشد

در این قاعده، پاره های یک خط نباید با پاره های خط متفاوت، محل یکسانی را اشغال کنند. این مورد در مورد لوله های آب آشامیدنی، فاضلاب یا کابل های برق تکراری است. یک عنصر باید حذف شود. به شرح زیر

شکل 2 . مثال ناهنجاری: یک سر یک خط برق فشار ضعیف 9 سانتی متر به انتهای خطوط برق دیگر نزدیک است اما متصل نیست.

شکل 4 ناهنجاری همپوشانی دو لوله آب آشامیدنی را نشان می‌دهد (که متوالی به رنگ آبی فیروزه‌ای انتخاب شده‌اند): دو دایره محل همپوشانی را نشان می‌دهند.

3.1.7. قانون 7: نباید با خود همپوشانی کرد

در این قانون، پاره‌های یک چندخط نباید با پاره‌های همان چندخط، مکان یکسانی را اشغال کنند. یک لوله آب آشامیدنی هرگز نباید روی خود همپوشانی داشته باشد.

3.1.8. قانون 8: نباید عبور کرد

این قانون مستلزم آن است که یک چند خط نباید از چند خط دیگر عبور کند. این برای بررسی سه کسب و کار (آب، فاضلاب و برق) است، در صورتی که فقط یک هشدار باشد و یک خطای سیستماتیک نباشد، زیرا برخی از لوله‌ها با ارتفاعات مختلف ممکن است متقاطع به نظر برسند. Z باید در الگوریتم تشخیص این قانون در نظر گرفته شود.

3.1.9. قانون 9: نباید از خود عبور کرد

در این قانون، یک پاره از یک چند خط نباید از پاره ای دیگر از همان چند خط عبور کند. این در لوله های آب آشامیدنی و فاضلاب قابل اجرا است ( شکل 5 ).

جدول 1 زیر تمام قوانین تجاری مورد مطالعه را خلاصه می کند.

3.2. الگوریتم های تشخیص ناهنجاری ها در عناصر خطی

در این بخش، الگوریتم‌های توسعه‌یافته برای یافتن نقض محدودیت‌های توپولوژیکی تعریف‌شده را به تفصیل شرح می‌دهیم. ما ترجیح دادیم از تقاطع پاکت های موجودیت های جغرافیایی به جای هندسه دقیق آنها استفاده کنیم زیرا این تابعی است که به طور ذاتی و مؤثر توسط GDB ها مدیریت می شود.

شکل 3 . مثال ناهنجاری: انتهای یک خط برق نزدیک به داخل یک خط برق دیگر است.

  

شکل 4 . مثال ناهنجاری: همپوشانی دو چند خط در فیروزه ای.

شکل 5 . مثال ناهنجاری: یک لوله آب آشامیدنی که خود عبور می کند.

جدول 1 . فهرست قوانین بین عناصر خطی

3.2.1. الگوریتم تشخیص قوانین 1 و 2

برای قانون “باید متصل شود”:

برای هر چند خطی که کلاس موجودیت آن در قانون تعریف شده است، یک دیسک بافر با شعاع “d” در اطراف انتهای اول آن ایجاد می کنیم. همانطور که در شکل 6 زیر نشان داده شده است، جستجو را به چند خطی محدود می کنیم که پاکت آن پوشش بافر را قطع می کند .

سپس سه مورد متمایز می شود:

1) پوشش یک چند خط، پاکت بافر را بدون اینکه هیچ یک از دو سر آن متعلق به بافر باشد، قطع می کند ( شکل 7 ).

® مورد رد شده.

2) پاکت چند خطی پاکت بافر را قطع می کند و یکی از انتهای آن در بافر قرار دارد در حالی که با انتهای چند خط کنترل شده منطبق است ( شکل 8 ).

® مورد رد شده (بدون ناهنجاری)

3) پاکت چند خطی پوشش بافر را قطع می کند و یکی از انتهای آن در داخل بافر قرار دارد بدون اینکه با انتهای اولین چند خط کنترل شده منطبق باشد ( شکل 9 ).

® مورد به عنوان ناهنجاری تشخیص داده شد.

همین رویه برای انتهای دوم چند خط (نقطه انتهایی) دنبال می شود. شناسایی انواع انتهای (پایان یا شروع) درگیر در ناهنجاری شناسایی شده برای تجسم و تصحیح ناهنجاری ضروری است.

برای قانون 2، الگوریتم تشخیص همانند قانون 1 است، با این تفاوت که در این مورد چند خطوط به یک کلاس از موجودیت ها تعلق ندارند.

3.2.2. الگوریتم تشخیص قانون 3

یک چندخط اگر یکی از دو انتهای آن (نقطه شروع یا پایان) بالای چند خط دیگر نباشد، مشکل محسوب می شود. برای تشخیص این ناهنجاری‌ها، ما از یک روش غیرمستقیم با حذف از گروه همه چند خطی پیروی کردیم، آنهایی که حداقل یک انتها روی چند خط دیگر دارند (که نشان می‌دهد در مقایسه با رویکرد مستقیم، زمان موثری دارد،

شکل 6 . پلی لاین کنترل شده صورتی و بافر ایجاد شده آن به رنگ قرمز.

شکل 7 . تصویر مورد اول.

شکل 8 . تصویر مورد دوم.

شکل 9 . تصویر مورد سوم.

آگاهانه: جستجوی چند خطوطی که نقطه شروع و پایان آنها هیچ چند خطی را قطع نمی کنند).

برای این کار ابتدا به گروهی از همه چند خطی که نقطه شروع آنها در بالای چند خط دیگر است نگاه می کنیم سپس گروه همه چند خطوط را با نقطه پایان بالای چند خط دیگر جستجو می کنیم. بنابراین منبع Polylines ناهنجاری کسانی هستند که نه به گروه اول و نه به گروه دوم تعلق دارند.

• روش یافتن گروه اول برای یافتن گروه اول چند خطوطی را جستجو می کنیم که نقطه شروع آنها بالای چند خط دیگر باشد. برای انجام این کار، ما برای هر چند خط فاصله “d” بین نقطه شروع و چند خط دیگر، از دسته دوم موجودیت ها، که پاکت آنها پوشش چند خط مورد نظر را قطع می کند، محاسبه می کنیم ( شکل 10 ).

بنابراین گروه اول مجموعه چند خطوط با فاصله d = 0 است.

• روش یافتن گروه دوم سپس به دنبال چند خطوطی می گردیم که نقطه پایانی آنها بالای چند خط دیگر باشد، مانند نقطه شروع. بنابراین گروه 2 مجموعه ای از چند خط با فاصله “d” صفر است. پلی خطوطی که به عنوان ناهنجاری در نظر گرفته می شوند، آنهایی هستند که به هیچ یک از دو گروه 1 یا 2 تعلق ندارند.

3.2.3. الگوریتم تشخیص قانون 4

ما یک دیسک بافر با شعاع “d” در اطراف انتهای چند خط ایجاد می کنیم تا کنترل قاعده شود. پس از آن، جستجو به چند خطی که با بافر تقاطع می کنند محدود می شود ( شکل 11 ).

موارد زیر برای خلاص شدن از شر است:

• انتهای چند خط مورد نظر با نتیجه چند خط دیگری از فیلتر اول، در داخل یا در انتهای آن تماس می گیرد.

• انتهای پلی لاین دیگر در بافر است، زیرا این مورد در تشخیص ناهنجاری اتصال متقابل درمان می شود.

3.2.4. الگوریتم تشخیص قانون 5

یک دیسک بافر با شعاع “d” در اطراف انتهای (نقطه شروع) چند خطی که باید بررسی شود ایجاد می کنیم. در مرحله بعد، بررسی می کنیم که آیا نقطه شروع با انتهای چند خط دیگر منطبق است یا خیر (ما علاقه مندیم چند خطوط با بافر از قبل ایجاد شده قطع شوند). چند خطی که به عنوان ناهنجاری در نظر گرفته می شود، خطوطی هستند که دارای “نقطه شروع” یا “نقطه پایان” هستند که با انتهای چند خط دیگر منطبق است.

3.2.5. قوانین 6 و 7 الگوریتم تشخیص

برای قاعده “نباید همپوشانی داشته باشد”، ما برای هر چندخط چندخط هایی را جستجو می کنیم که روی آن همپوشانی داشته باشند در میان آنهایی که پاکت آنها جالب است. برای قاعده “نباید خود همپوشانی داشته باشد”، همان الگوریتم قانون “نباید همپوشانی” اعمال می شود، با این تفاوت که در این مورد ما به رابطه چند خط یکسان علاقه مند هستیم.

شکل 10 . چند خط مورد نظر و پاکت آن قرمز است.

شکل 11 . پلی لاین کنترل شده صورتی و بافر ایجاد شده آن به رنگ قرمز.

3.2.6. قوانین 8 و 9 الگوریتم تشخیص

برای قاعده “نباید متقاطع” برای هر چند خط، ما به دنبال چندخط های متقاطع از خطوطی هستیم که پاکت با پاکت آن قطع می شود. برای قاعده “نباید از خود عبور کرد” ما همان الگوریتم قانون قبلی را اعمال می کنیم با این تفاوت که این در مورد همان چند خط است.

منابع

  1. ISO (1994) سازمان بین المللی استانداردسازی، هنجار بین المللی – مدیریت کیفیت و تضمین کیفیت – واژگان. ISO 8402:1994 (E/F/R)، نسخه 2ème.  [زمان(های استناد): 1]
  2. Bonin, O. (2002) Modèle d’erreurs dans une base de données géographiques et grandes deviations pour des sommes pondérées; برنامه à l’estimation d’erreurs sur un temps de parcours. These de doctorat, Université de Paris VI, 147.  [زمان(های استناد): 1]
  3. Papadopoulos, AN and Manolopoulos, Y. (2005) جستجوی نزدیکترین همسایه: دیدگاه پایگاه داده. سری در علوم کامپیوتر. اسپرینگر، 170.  [زمان(های استناد): 1]

بدون دیدگاه

دیدگاهتان را بنویسید