Kadaster، آژانس ملی ثبت زمین و نقشه برداری هلند، چندین سال است که به طور فعال ثبت پایگاه خود را به عنوان داده های مکانی مرتبط (باز) منتشر کرده است. تا به امروز، تعدادی از این رجیسترهای پایه و همچنین تعدادی از مجموعه داده های خارجی با موفقیت به عنوان داده های پیوندی منتشر شده اند و در دسترس عموم هستند. افزایش تقاضا برای محصولات داده‌های پیوندی و در دسترس بودن فناوری‌های داده‌های پیوندی جدید، نیاز به یک رویکرد جدید و نوآورانه برای انتشار داده‌های مرتبط در سازمان را به منظور کاهش زمان و هزینه‌های مرتبط با انتشار مذکور برجسته کرده است. رویکرد جدید برای انتشار داده‌های پیوندی هم در رویکردش به مدل‌سازی داده‌ها، تبدیل و معماری انتشار جدید است. در مدل سازی کل مجموعه داده ها، تمایز واضحی بین مدل اطلاعات و مدل دانش ایجاد می‌شود تا هم الزامات خاص سازمان را در بر بگیرد و هم استانداردهای خارجی جامعه را در فرآیند انتشار پشتیبانی کند. معماری انتشار شامل چندین مرحله است که در آن داده‌های نمونه از منبع خود به عنوان GML بارگیری می‌شوند و با استفاده از یک Enhancer تبدیل می‌شوند و در فروشگاه سه‌گانه منتشر می‌شوند. هر دو معماری مدل‌سازی و انتشار بخشی از دیدگاه بزرگ‌تر Kadaster برای توسعه نمودار دانش Kadaster از طریق ادغام مجموعه‌های داده مرتبط مختلف را تشکیل می‌دهند. معماری انتشار شامل چندین مرحله است که در آن داده‌های نمونه از منبع خود به عنوان GML بارگیری می‌شوند و با استفاده از یک Enhancer تبدیل می‌شوند و در فروشگاه سه‌گانه منتشر می‌شوند. هر دو معماری مدل‌سازی و انتشار بخشی از دیدگاه بزرگ‌تر Kadaster برای توسعه نمودار دانش Kadaster از طریق ادغام مجموعه‌های داده مرتبط مختلف را تشکیل می‌دهند. معماری انتشار شامل چندین مرحله است که در آن داده‌های نمونه از منبع خود به عنوان GML بارگیری می‌شوند و با استفاده از یک Enhancer تبدیل می‌شوند و در فروشگاه سه‌گانه منتشر می‌شوند. هر دو معماری مدل‌سازی و انتشار بخشی از دیدگاه بزرگ‌تر Kadaster برای توسعه نمودار دانش Kadaster از طریق ادغام مجموعه‌های داده مرتبط مختلف را تشکیل می‌دهند.

کلید واژه ها:

داده های مکانی مرتبط ؛ نمودار دانش ; فن آوری های معنایی ; قابلیت همکاری مدلسازی معنایی

1. مقدمه

آژانس کاداستر، ثبت زمین و نقشه برداری هلند، Kadaster ( www.kadaster.nl)، منبع معتبر اطلاعات مربوط به داده های اداری و مکانی پیرامون اموال و حقوق مالکیت در هلند است. Kadaster چندین ثبت بزرگ کلیدی دولت هلند را نگهداری می کند، از جمله ثبت پایه برای آدرس ها و ساختمان ها (مخفف هلندی: BAG)، ثبت پایه برای توپوگرافی (مخفف هلندی: BRT)، و ثبت پایه برای توپوگرافی در مقیاس بزرگ (مخفف هلندی). : BGT)؛ که همه آنها به عنوان داده باز در دسترس هستند. علاوه بر این، سازمان فعالانه این و سایر دارایی‌های جغرافیایی را به عنوان داده‌های مرتبط (باز) منتشر و نگهداری می‌کند و به عنوان بخشی از این تلاش، و با روحیه نوآوری مستمر، اکنون چندین مورد از این دارایی‌های مکانی به‌عنوان داده‌های باز مرتبط زیر منتشر شده است. یک رویکرد جدید همانطور که در این مقاله مورد بحث قرار گرفته است.1]، دو مورد از این دارایی های مکانی به عنوان داده های مرتبط منتشر شده بود. از اکتبر 2021، چهار رجیستر پایه و تعدادی از مجموعه داده های خارجی مرتبط با این ثبات ها در حین استفاده از این رویکرد جدید منتشر شده است: برجسته کردن کارایی و تکرارپذیری این رویکرد. فرمول‌بندی و اجرای این رویکرد جدید در Kadaster با انگیزه افزایش تقاضا برای محصولات داده‌های مرتبط، هم در داخل و هم در خارج، به روشی مقرون‌به‌صرفه ارائه می‌شود. در دسترس بودن و توسعه مداوم فن‌آوری‌ها و استانداردهای داده‌های پیوندی، ارائه یک رویکرد به روز و مقیاس‌پذیر برای انتشار داده‌های پیوندی برای پاسخگویی به این تقاضا را ممکن کرده است.بخش 6 این مقاله همچنین چشم انداز بزرگتر اجرای این رویکرد را در سازمان مورد بحث قرار خواهد داد. با در دسترس قرار دادن چندین مجموعه داده از طریق این رویکرد و با اولین اجرای نمودار دانش موجود در Kadaster، این مقاله همچنین ارزیابی و دیدگاهی از درس های آموخته شده را در مورد رویکرد ارائه شده در این مقاله ارائه می دهد.

2. زمینه مشکل

مجموعه داده‌های جغرافیایی دولتی هلند، که در بخش زیر به طور گسترده‌تر مورد بحث قرار می‌گیرند، به‌عنوان سیلوهای داده به نام ثبت‌های کلیدی سازماندهی شده‌اند. که ادغام آن نیز به طور کلی ضعیف است. کاربرانی که به دنبال ترکیب این سیلوها برای یک هدف معین هستند، اغلب باید به استفاده از ابزار خاصی متوسل شوند که از این ادغام پشتیبانی می کند یا دانلود مجموعه داده های کامل و انجام یکپارچه سازی کل مجموعه داده ها. به عنوان مثال، تلاش برای پاسخ به سوال نسبتاً ساده جغرافیایی “کدام کلیساها قبل از سال 1800 در شهر آمستردام ساخته شده اند؟” نیاز به ادغام ثبت کلید برای توپوگرافی (مخفف هلندی: BRT) که شامل انواع ساختمان ها و ثبت کلید آدرس ها و ساختمان ها است که شامل سال ساخت هر ساختمان است. برای انجام این ادغام، کاربر یا باید از ابزار خاص GIS (مثلا QGIS یا ArcGIS) استفاده کند یا کل ثبت کلید را دانلود کند و سپس این یکپارچه سازی را انجام دهد. این مشکل ادغام آسان‌تر کاربر از رجیسترهای پایه همان چیزی است که یکی از جدیدترین پروژه‌های انجام‌شده توسط Kadaster، پروژه راه‌حل کاربر یکپارچه (هلندی: Integrale Gebruiksoplossing (IGO)) را هدایت کرد.https://www.geobasisregistraties.nl/basisregistraties/doorontwikkeling-in-samenhang/inspirerend-gebruik ). یکی از راه‌حل‌های این مشکل یکپارچه‌سازی، و راه‌حلی که چندین سال در Kadaster پیاده‌سازی شده است، ارائه این سیلوهای داده به‌عنوان داده‌های باز مرتبط و انجام این یکپارچه‌سازی با استفاده از فناوری‌های مرتبط است.
اگرچه چندین مورد از دارایی های مکانی Kadaster به عنوان داده های مرتبط برای چندین سال در دسترس بوده اند و معماری پیرامون این نشریه در واقع به خوبی اجرا شده است [ 2 ]]، اثرات شبکه افزایش جذب در فناوری‌های داده‌های پیوندی، ایجاب کرده است که یک رویکرد به روز و مقیاس‌پذیر برای انتشار برای انتشار این مجموعه داده‌های مرتبط طراحی و اجرا شود. در واقع، تقاضای فزاینده ای برای خدمات داده های پیوندی هم در خود Kadaster و هم در خارج وجود دارد، و این تقاضا را برای در دسترس قرار دادن داده های پیوندی سریعتر و به بهترین شکل ممکن (به صرفه) به همراه دارد. این تقاضا، همراه با افزایش در دسترس بودن و توسعه مداوم فناوری‌ها و استانداردهای داده‌های مرتبط، نیروی محرکه پشت نوآوری انتشار داده‌های مرتبط در سازمان بوده است و با شروع پروژه‌هایی مانند راه‌حل کاربر یکپارچه تحریک شده است. رویکردی که در این مقاله بیان شده است این تقاضا را از طرق مختلف برآورده می کند.
اولاً، این رویکرد، در راستای اصول کلی معماری، از کتابخانه‌های موجود جامعه (به عنوان مثال، rdf-validate-shacl ( https://github.com/zazuko/rdf-validate-shacl ) و (hdt-cpp ( https ) استفاده می‌کند. ://github.com/rdfhdt/hdt-cpp ))، بر روی پروژه های منبع باز (به عنوان مثال، Comunica ( https://comunica.dev ) و ClioPatria ( https://cliopatria.swi-prolog.org ))) و بنابراین دور زدن نیاز به توسعه راه حل های سفارشی داخلی برای پاسخگویی به این تقاضا. به طور مشابه، این رویکرد از محصولات تجاری موجود در جایی که در دسترس هستند به نفع کاهش هزینه های نگهداری استفاده می کند. ثانیاً، این رویکرد یک اصل پیکربندی بیش از کد را اعمال می‌کند که تضمین می‌کند که خط لوله یکسان برای همه پروژه‌های انتشار داده‌های مرتبط اعمال می‌شود، تنها در صورت لزوم اجزا را پیکربندی می‌کند و این جنبه از معماری است که اجازه می‌دهد این رویکرد در چندین مورد تکرار شود. مجموعه های داده، انتقال آنها از منبع به انتشار در یک بازه زمانی کوتاه. در نهایت، اجرای تمامی اجزای مرتبط در این طرح با رویکرد جریان سازی انجام می شود. در عمل، این بدان معناست که همه مدل‌های داده پیوندی تا حد امکان به مدل منبع نزدیک هستند و منابع انتخاب شده قادر به پشتیبانی از عملکرد جریان به نفع تحویل بلادرنگ داده هستند. اگرچه این قابلیت جریان هنوز یک ویژگی کار در معماری توصیف شده نیست، این گنجاندن طراحی در چشم انداز تصویر بزرگتر برای این رویکرد مهم است همانطور که در مورد بحث قرار گرفت.بخش 6 .
به منظور تشریح دقیق محل اجرای این رویکرد نسبت به روش‌های موجود یا قبلی که برای انتشار داده‌های مرتبط در Kadaster استفاده می‌شد، پیشرفت‌های قابل‌اندازه‌گیری را شاهد بود، توجه به این نکته مهم است که ثبت‌های BAG و BGT با استفاده از این رویکرد جدید توسط یک تیم داخلی کوچک ارائه شدند. در Kadaster به ترتیب در 9 و 5 هفته. اینها مجموعه داده‌های پیوندی نسبتاً پیچیده‌ای هستند که هر کدام دارای یک مدل داده پیچیده هستند و از نظر اندازه بزرگ هستند. در واقع، هر مجموعه داده شامل 800 میلیون تا 1 میلیارد سه گانه است. در جایی که رویکردهای قبلی می توانست طولانی باشد، این رویکرد بهبود هزینه و اثربخشی منابع را برجسته می کند، و پرونده تجاری برای داده های مرتبط در سازمانی مانند Kadaster را تقویت می کند [ 3 ]]. بخش‌هایی که در ادامه می‌آیند، مفاهیم و معماری‌هایی را که از این رویکرد به‌روز شده برای انتشار داده‌های مرتبط در Kadaster پشتیبانی می‌کنند، شامل استانداردها، فن‌آوری‌ها و انتخاب‌های مرتبط با این موارد در طول انتشار مجموعه داده‌های جغرافیایی توسط Kadaster، نشان می‌دهند.

3. منابع داده های مکانی بومی

اولین مورد، ثبت کلید برای توپوگرافی در مقیاس بزرگ (مخفف هلندی: BGT) بود که در نوامبر 2020 تغییر شکل داده و منتشر شد و در هر سه ماهه سال 2021 به روز شده است. این دارایی یک نقشه دیجیتالی از هلند با اشیاء است. مانند ساختمان‌ها، جاده‌ها، آب‌ها و راه‌آهن‌ها. مدل‌سازی، به‌روزرسانی و نگهداری این مجموعه داده توسط قانون هلند تنظیم می‌شود. ثبت کلید برای آدرس‌ها و ساختمان‌ها (BAG) در فوریه 2021 تغییر شکل داد و منتشر شد. همانطور که از نام مجموعه داده پیداست، مجموعه داده شامل تمام ساختمان‌ها و آدرس‌ها در هلند و همچنین ویژگی‌های مرتبط با آن‌ها، از جمله شماره خانه، نام‌گذاری، و آدرس های اصلی و جانبی این مجموعه داده یک مجموعه داده مشابه دارد، یعنی آدرس های INSPIRE ( که در نوامبر 2020 تغییر شکل یافته و منتشر شده است و در هر سه ماهه سال 2021 به روز شده است. این دارایی نقشه دیجیتال هلند با اشیایی مانند ساختمان ها، جاده ها، بدنه های آبی و راه آهن است. مدل‌سازی، به‌روزرسانی و نگهداری این مجموعه داده توسط قانون هلند تنظیم می‌شود. ثبت کلید برای آدرس‌ها و ساختمان‌ها (BAG) در فوریه 2021 تغییر شکل داد و منتشر شد. همانطور که از نام مجموعه داده پیداست، مجموعه داده شامل تمام ساختمان‌ها و آدرس‌ها در هلند و همچنین ویژگی‌های مرتبط با آن‌ها، از جمله شماره خانه، نام‌گذاری، و آدرس های اصلی و جانبی این مجموعه داده یک مجموعه داده مشابه دارد، یعنی آدرس های INSPIRE ( که در نوامبر 2020 تغییر شکل یافته و منتشر شده است و در هر سه ماهه سال 2021 به روز شده است. این دارایی نقشه دیجیتال هلند با اشیایی مانند ساختمان ها، جاده ها، بدنه های آبی و راه آهن است. مدل‌سازی، به‌روزرسانی و نگهداری این مجموعه داده توسط قانون هلند تنظیم می‌شود. ثبت کلید برای آدرس‌ها و ساختمان‌ها (BAG) در فوریه 2021 تغییر شکل داد و منتشر شد. همانطور که از نام مجموعه داده پیداست، مجموعه داده شامل تمام ساختمان‌ها و آدرس‌ها در هلند و همچنین ویژگی‌های مرتبط با آن‌ها، از جمله شماره خانه، نام‌گذاری، و آدرس های اصلی و جانبی این مجموعه داده یک مجموعه داده مشابه دارد، یعنی آدرس های INSPIRE ( بدنه های آبی و راه آهن. مدل‌سازی، به‌روزرسانی و نگهداری این مجموعه داده توسط قانون هلند تنظیم می‌شود. ثبت کلید برای آدرس‌ها و ساختمان‌ها (BAG) در فوریه 2021 تغییر شکل داد و منتشر شد. همانطور که از نام مجموعه داده پیداست، مجموعه داده شامل تمام ساختمان‌ها و آدرس‌ها در هلند و همچنین ویژگی‌های مرتبط با آن‌ها، از جمله شماره خانه، نام‌گذاری، و آدرس های اصلی و جانبی این مجموعه داده یک مجموعه داده مشابه دارد، یعنی آدرس های INSPIRE ( بدنه های آبی و راه آهن. مدل‌سازی، به‌روزرسانی و نگهداری این مجموعه داده توسط قانون هلند تنظیم می‌شود. ثبت کلید برای آدرس‌ها و ساختمان‌ها (BAG) در فوریه 2021 تغییر شکل داد و منتشر شد. همانطور که از نام مجموعه داده پیداست، مجموعه داده شامل تمام ساختمان‌ها و آدرس‌ها در هلند و همچنین ویژگی‌های مرتبط با آن‌ها، از جمله شماره خانه، نام‌گذاری، و آدرس های اصلی و جانبی این مجموعه داده یک مجموعه داده مشابه دارد، یعنی آدرس های INSPIRE ( از جمله شماره خانه، نامگذاری، و آدرس اصلی و جانبی. این مجموعه داده یک مجموعه داده مشابه دارد، یعنی آدرس های INSPIRE ( از جمله شماره خانه، نامگذاری، و آدرس اصلی و جانبی. این مجموعه داده یک مجموعه داده مشابه دارد، یعنی آدرس های INSPIRE (https://www.pdok.nl/introductie/-/article/adressen-inspire-geharmoniseerd-) که بر اساس الزامات انطباق INSPIRE منتشر شده است. در میان مجموعه داده‌های دیگری که با استفاده از این رویکرد منتشر شده‌اند، دفتر مرکزی آمار در هلند (مخفف هلندی: CBS) ارقام کلیدی مجموعه داده‌های ناحیه و محله (مخفف هلندی: KWB) است. این نقشه از مرزهای شهرداری تعریف شده در ثبت کلید برای ثبت زمین (مخفف هلندی: BRK) استفاده می کند و آمار کلیدی کل محله ها و مناطق در هلند را به همراه آماری در مورد نزدیک بودن آمار در هر منطقه ارائه می دهد. چهارمین ثبت کلیدی که تا به امروز تبدیل شده است، ثبت کلید برای توپوگرافی (مخفف هلندی: BRT) است. همه مجموعه داده ها، از جمله اطلاعات مربوط به در دسترس بودن API و احتمالات جستجو، در فروشگاه سه گانه مدیریت شده توسط تیم علم داده Kadaster در دسترس هستند (https://data.labs.kadaster.nl ).

4. مدل دانش در مقابل مدل اطلاعات

اولین مورد اضافه شده جدید به انتشار داده های مرتبط توسط Kadaster، تمایز صریح بین مدل دانش و مدل اطلاعات است، که هر دو مدل داده های مرتبط بزرگتر را برای هر مجموعه داده تشکیل می دهند. این جداسازی نشان‌دهنده این واقعیت است که یک مدل داده پیوندی باید بتواند با استفاده از مدل دانش، معنای داده‌ها را برای دنیای خارج توصیف کند، در حالی که جنبه‌های خاص سازمان را در مدل اطلاعاتی نیز توصیف می‌کند. این جداسازی به مدل اطلاعاتی اجازه می‌دهد تا در جهت نیازهای داخلی سازمان، از جمله مدل‌ها و فرآیندهای خاص مربوط به یک دارایی، بهینه‌سازی شود، در حالی که همچنان به مدل دانش مرتبط اجازه می‌دهد تا به‌منظور پشتیبانی مؤثر خارجی، بهینه شود.4 ]. از آنجایی که هر دو جنبه داخلی و خارجی برای تلاش‌های Kadaster در انتشار داده‌ها مهم هستند، این رویکرد جدید برای انتشار داده‌های پیوندی بهتر می‌تواند الزامات سازمانی را برای مجموعه داده‌های پیوندی پیاده‌سازی کند. در واقع، تعدادی از دلایل خاص در زمینه Kadaster وجود دارد که این انشعاب در طراحی رویکرد جدیدی برای انتشار ضروری بود.
اولاً، یک مدل اطلاعاتی برای یک دارایی معین حاوی اطلاعات خاص و داخلی مربوط به یک دارایی معین است. این اطلاعات شامل ویژگی‌های سیستم‌های اطلاعاتی فعلی است که در یک دارایی خاص و در مجاورت آن استفاده می‌شوند، قوانین خاص سازمان مربوط به یک دارایی و همچنین جزئیات فنی دارایی. به عنوان مثال، این واقعیت که نام شهرداری ها در هلند مجاز نیست بیش از 80 کاراکتر باشد در قوانین هلند به صراحت رمزگذاری نشده است، بلکه محدودیتی است که توسط سیستم های داخلی اعمال می شود که Kadaster برای ثبت این اطلاعات هنگام ثبت در یک کلید استفاده می کند. ثبت نام. گنجاندن این اطلاعات در مدل دانش نادرست است: این طول حداکثر بخشی از معنایی نام شهرداری ها نیست. با این حال، کنار گذاشتن این اطلاعات نیز نادرست است زیرا مدل داده های پیوندی قادر به حذف مقادیری که توسط سیستم های ثبت داخلی Kadaster پذیرفته نشده اند، نخواهد بود. به این ترتیب، این اطلاعات در مدل اطلاعاتی یک دارایی مشخص مدل‌سازی می‌شود و با استفاده از زبان محدودیت اشکال (SHACL) [5 ] که در خدمت محدود کردن یک مدل معین بر اساس قوانین و روابط تعریف شده داخلی برای یک دارایی است. چندین رویکرد فنی وجود دارد که می‌تواند برای رسمی کردن چنین محدودیت‌هایی در مدل اطلاعات استفاده شود، برای مثال طرحواره XML یا طرحواره JSON، اما SHACL برای داده‌های شکل گراف و داده‌های پیوندی بهینه‌سازی شده است. بنابراین SHACL به عنوان زبان نمایندگی در این پروژه انتخاب شد.
ثانیاً، یک مدل دانش برای همان دارایی، هر دانش عمومی و قابل تعویضی را تعریف می‌کند که حفظ آن در سازمان مهم است، اما باید با دیگران نیز به اشتراک گذاشته شود. این مدل دانش همچنین استفاده مجدد از مدل‌های داده‌های مرتبط خارجی را با زمینه‌های خاص سازمان آسان‌تر می‌کند. به عنوان مثال، ویژگی برچسب ترجیحی SKOS خارجی (skos:prefLabel) را می توان برای نشان دادن نام فضاهای عمومی (مدل دانش) استفاده کرد، در حالی که محدودیت کاراکترهای ذکر شده در بالا (مدل اطلاعات) را نیز رمزگذاری می کند. در پیاده‌سازی مدل دانش توسط Kadaster، همه مدل‌های داده پیوندی از RDF(S) [ 6 ]، OWL [ 7 ] و/یا SKOS [ 8 ] استفاده می‌کنند.] واژگان و هستی شناسی ها، در میان دیگران، که همواره به نفع قابلیت استفاده مجدد و قابلیت متقابل بودن مدل را با دنیای خارج مرتبط می کنند.
همانطور که در شکل 1 الف، ب نشان داده شده است، مدل های اطلاعات و دانش کاملاً مستقل از یکدیگر نیستند و در واقع هنگام تعریف و تبدیل مدل به یکدیگر نگاشت می شوند. به عنوان مثال، این فرآیند اشکال SHACL تعریف شده در مدل اطلاعات را به کلاس های OWL مربوطه یا RDF literals تعریف شده در مدل دانش نگاشت می کند. دو نوع برای این فرآیند نگاشت وجود دارد، یکی نگاشت ویژگی های شی در دو مدل ( شکل 1 الف) و دیگری نگاشت ویژگی های نوع داده در بین مدل ها ( شکل 1 ب). هر دو نوع باید در طول تبدیل مدل داده به داده های پیوندی تکمیل شوند.
در نوع اول ( شکل 1 الف)، فرآیند تقریباً یکسان است، به جز این واقعیت که گره‌های SHACL و شکل‌های ویژگی که برای ویژگی‌های شی در یک مدل داده معین تعریف شده‌اند، به کلاس‌های OWL مربوطه و ویژگی‌های شی تعریف شده در مدل دانش نگاشت می‌شوند. در نوع دوم ( شکل 1 B)، ویژگی‌های نوع داده در مدل داده با نگاشت گره SHACL و شکل‌های ویژگی مربوطه برای هر نوع داده به کلاس OWL مربوطه، ویژگی نوع داده و واژه RDFS تعریف شده در مدل دانش تعریف می‌شوند.
در تلاش برای حمایت از اعتبارسنجی بهتر مدل حاصل، یک مرحله اعتبار سنجی SHACL نیز در فرآیند مدل‌سازی اعمال شده است. این مرحله تضمین می‌کند که اشکال برای هر شی و ویژگی نوع داده در مدل داده کاملاً در برابر داده‌های نمونه اعتبارسنجی می‌شوند. این مرحله اعتبارسنجی شامل تعدادی از بهترین شیوه‌ها در رابطه با مدل‌سازی مدل اطلاعاتی با تمرکز بر استفاده از اشکال گره بسته است [ 9 ، 10 ]. این تضمین می‌کند که مدل به همان اندازه که لازم است برای اطمینان از اعتبار معنادار مدل وجود دارد و در عین حال اجازه می‌دهد نمونه‌های داده صحیح، اما نادر، اعتبارسنجی شوند، خاص است. میز 1مثال هایی از نحوه استفاده از مدل اطلاعات علاوه بر مدل دانش برای اجرای بهترین شیوه های خاص برای مدل داده و برای مثال داده ها ارائه می دهد. توجه داشته باشید که مدل دانش (ستون 3) معنای/معنای صحیح داده ها را مشخص می کند. مدل اطلاعات (ستون 2) معیارهای ساختاری اضافی را مشخص می کند که – به بیان دقیق – بخشی از معنای داده ها نیستند.

5. طراحی و توسعه معماری های پشتیبان

فرآیند تبدیل داده‌های رابطه‌ای برای یک دارایی مکانی داده‌شده به داده‌های مرتبط در چندین مرحله طی فرآیند استخراج، تبدیل و بارگذاری (ETL) تکمیل می‌شود. این فرآیند در طرح کلی معماری در شکل زیر ( شکل 2 ) نشان داده شده است و به شرح زیر توضیح داده شده است. در جزئیات معماری مورد استفاده در این رویکرد، بحث‌های کوتاه پیرامون اجرای فعلی و زمینه‌های بهبود به طور متناوب با دیدگاه ارائه دیدگاهی در مورد توسعه بیشتر این معماری گنجانده خواهد شد.
مرحله اول داده‌های رابطه‌ای را از منبع بارگیری می‌کند، در این مورد از پلتفرم هلندی برای دسترسی به خدمات زمین (PDOK)، به پایگاه داده PostgreSQL پس از مرحله نمایه‌سازی زبان نشانه‌گذاری جغرافیا (GML) [ 11 ]. یک GraphQL ( https://graphql.org/) سپس نقطه پایانی برای دسترسی به داده های تحویل داده شده از طریق یک API از پایگاه داده PostgreSQL پس از تحویل و اعتبارسنجی مدل داده از کاربر نهایی استفاده می شود. در عمل، این مرحله با گسترش typedefs به گونه‌ای انجام می‌شود که اشیاء در یک مدل داده به درستی در GraphQL توصیف شوند، حل‌کننده‌ها را گسترش می‌دهد تا به اشیاء اجازه داده شود با پارامترهای مناسب پرس و جو شوند و در نهایت، کوئری‌های SQL مورد نیاز را به حل‌کننده‌های مربوطه اضافه می‌کنند. . توجه داشته باشید که این رویکرد ذاتاً به منابع داده رابطه‌ای محدود نمی‌شود، زیرا یک نقطه پایانی GraphQL ممکن است بتواند از انواع دیگر منابع نیز ارائه کند. علاوه بر این، تمام نقاط پایانی GraphQL که برای هر سیلو داده در دسترس هستند، با استاندارد Apollo GraphQL مطابقت دارند. انطباق با این استاندارد، فدراسیون نقاط پایانی را آسان تر می کند و بنابراین در عمل،
در فرآیند بازیابی داده‌ها از منبع، داده‌ها تا حد امکان نزدیک به منبع در دسترس این خط لوله قرار می‌گیرند تا از هرگونه کپی غیرضروری از داده‌ها جلوگیری شود و اطمینان حاصل شود که موضوعیت داده‌ها تا حد امکان به داده‌های زمان واقعی نزدیک است. این رویکرد «نزدیک به منبع» تضمین می‌کند که در مدل‌سازی مدل‌های داده پیوندی برای هر مجموعه داده‌ای که باید تبدیل شود، هیچ تغییر غیرضروری یا مبهم برای مدل داده انجام نمی‌شود و به این ترتیب، مدل داده پیوندی کاملاً برای متخصصان دامنه قابل تشخیص است. . در پیاده‌سازی فعلی معماری برای هر مجموعه داده، Kadaster داده‌ها را برای تبدیل در درجات مختلف فاصله تا منبع صرفاً بر اساس روش فعلی تحویل که توسط خود منبع پیاده‌سازی شده است، بازیابی می‌کند. در واقع، این روش‌های تحویل از انتشارات GitHub در یک بازه زمانی خاص (BAG) تا دانلود یک نسخه از داده‌های تحویل‌شده در هر سه ماهه (BGT) و تا امکان دسترسی مستقیم به داده‌ها از خود مرکز (BRT) متغیر است. در کوتاه مدت، این احتمال وجود دارد که تحویل این منابع در یک مرکز اطلاعاتی متمرکز شود که از طریق آن این خط لوله بتواند به منبع دسترسی داشته باشد.
هنگامی که مدل به عنوان یک نقطه پایانی GraphQL در دسترس است، می توان آن را توسط Enhancer که یک مؤلفه داخلی توسعه یافته است که امکان جست و جوی JSON-LD بر اساس نقطه پایانی GraphQL را فراهم می کند، جستجو کرد. برای انجام این کار، مراحل زیر مورد نیاز است. اولاً، Enhancer دارای مجموعه ای از پرس و جوهای از پیش تعریف شده با پارامترهای زمان و/یا صفحه بندی خاص برای هر شی است، به طوری که شی به عنوان نقطه پایانی تحویل داده می شود که میکروسرویس می تواند برای تحویل JSON-LD به آن دسترسی داشته باشد [ 12 ].] نتایج. پیکربندی پرس و جوهای از پیش تعریف شده مورد استفاده در Enhancer در حال حاضر با افزودن یک پرس و جو GraphQL در زیر پوشه/query در Enhancer کار می کند. این پرس و جو داده های نمونه را بر اساس اشیاء تعریف شده در مدل داده برای یک مجموعه داده خاص برمی گرداند و می تواند در بارگذاری کامل یک مجموعه داده مانند داده های پیوندی استفاده شود. فرمت خاص این نقطه پایانی بر اساس یک هدر پذیرش از application/n-quads یا application/ld+json است. توجه داشته باشید که دسترسی به نقطه پایانی Enhancer با یک درخواست POST حاوی یک کوئری GraphQL نیز امکان پذیر است. ثانیاً، یک ارجاع به مکان مربوطه زمینه JSON-LD برای یک مجموعه داده خاص باید تعریف شود و این برای هر مجموعه داده جدیدی که از طریق فرآیند ETL می گذرد، انجام می شود. هر کلید در زمینه JSON-LD به ویژگی‌ها و/یا اشیاء در تایپ‌دف‌های GraphQL اشاره دارد که از Enhancer با تبدیل این ویژگی‌ها به قالب داده‌های پیوندی پشتیبانی می‌کنند. همانطور که از بخش قبل مشهود است، SHACL را می توان هم برای اعتبارسنجی مدل داده با استفاده از داده های مثال و هم برای اعتبار سنجی داده های نمونه تبدیل شده با استفاده از مدل داده استفاده کرد. در واقع، در این معماری، یک مرحله اعتبار سنجی SHACL مورد نیاز است تا اطمینان حاصل شود که داده های تحویل شده از Enhancer معتبر هستند. در نهایت، در خط لوله تبدیل یک تحویل GraphQL به داده های پیوندی، لازم است مجموعه ای از اشیاء را با استفاده از پرس و جوهای از پیش تعریف شده پرس و جو دسته ای کرد. این پرس و جوهای دسته ای در یک قطعه کد حداقلی به نام میکروسرویس همانطور که در نشان داده شده است قرار دارند همانطور که از بخش قبل مشهود است، SHACL را می توان هم برای اعتبارسنجی مدل داده با استفاده از داده های مثال و هم برای اعتبار سنجی داده های نمونه تبدیل شده با استفاده از مدل داده استفاده کرد. در واقع، در این معماری، یک مرحله اعتبار سنجی SHACL مورد نیاز است تا اطمینان حاصل شود که داده های تحویل شده از Enhancer معتبر هستند. در نهایت، در خط لوله تبدیل یک تحویل GraphQL به داده های پیوندی، لازم است مجموعه ای از اشیاء را با استفاده از پرس و جوهای از پیش تعریف شده پرس و جو دسته ای کرد. این پرس و جوهای دسته ای در یک قطعه کد حداقلی به نام میکروسرویس همانطور که در نشان داده شده است قرار دارند همانطور که از بخش قبل مشهود است، SHACL را می توان هم برای اعتبارسنجی مدل داده با استفاده از داده های مثال و هم برای اعتبار سنجی داده های نمونه تبدیل شده با استفاده از مدل داده استفاده کرد. در واقع، در این معماری، یک مرحله اعتبار سنجی SHACL مورد نیاز است تا اطمینان حاصل شود که داده های تحویل شده از Enhancer معتبر هستند. در نهایت، در خط لوله تبدیل یک تحویل GraphQL به داده های پیوندی، لازم است مجموعه ای از اشیاء را با استفاده از پرس و جوهای از پیش تعریف شده پرس و جو دسته ای کرد. این پرس و جوهای دسته ای در یک قطعه کد حداقلی به نام میکروسرویس همانطور که در نشان داده شده است قرار دارند یک مرحله اعتبار سنجی SHACL مورد نیاز است تا اطمینان حاصل شود که داده های تحویل داده شده از Enhancer معتبر هستند. در نهایت، در خط لوله تبدیل یک تحویل GraphQL به داده های پیوندی، لازم است مجموعه ای از اشیاء را با استفاده از پرس و جوهای از پیش تعریف شده پرس و جو دسته ای کرد. این پرس و جوهای دسته ای در یک قطعه کد حداقلی به نام میکروسرویس همانطور که در نشان داده شده است قرار دارند یک مرحله اعتبار سنجی SHACL مورد نیاز است تا اطمینان حاصل شود که داده های تحویل داده شده از Enhancer معتبر هستند. در نهایت، در خط لوله تبدیل یک تحویل GraphQL به داده های پیوندی، لازم است مجموعه ای از اشیاء را با استفاده از پرس و جوهای از پیش تعریف شده پرس و جو دسته ای کرد. این پرس و جوهای دسته ای در یک قطعه کد حداقلی به نام میکروسرویس همانطور که در نشان داده شده است قرار دارندشکل 2 .
کل فرآیند ETL از کمترین کد سفارشی استفاده می‌کند و بنابراین، این فرآیند از نرم‌افزار Apache Airflow ( https://airflow.apache.org/ ) به‌عنوان یک «هندلر» استفاده می‌کند که داده‌ها را از طریق کل فرآیند ETL همانطور که در شکل 2 نشان داده شده است، میکروسرویس داده ها را از تقویت کننده واکشی می کند و این فرآیند را تا زمانی که همه داده ها به صورت JSON-LD از نقطه پایانی اصلی GraphQL بازیابی شوند، تکرار می کند. در عمل، این میکروسرویس یک وظیفه در جریان هوا است که در آن Enhancer به صورت سریال با کد محدود آدرس‌دهی می‌شود و نتایج به‌عنوان داده‌های مرتبط جمع‌آوری می‌شوند. هنگامی که تمام داده ها اعتبارسنجی و در فروشگاه سه گانه بارگذاری می شوند، که در این مورد نمونه ای از TriplyDB است ( https://triplydb.com، خدمات مختلفی را می توان نمونه سازی کرد، از جمله ElasticSearch، یک مرورگر داده، یک نقطه پایانی SPARQL [ 13 ] برای استفاده در داستان های داده. اینها را می توان در رابط خود فروشگاه سه گانه مثال زد. به منظور دسترسی بهتر به مدل‌های داده پیوندی، مدل‌های داده برای هر ثبت کلید نیز با استفاده از ابزار Weaver ( https://kadaster.wvr.io/bag2-0/home ) تجسم می‌شوند.
اگرچه معماری فعلی هنوز شامل یک رویکرد جریانی برای انتشار داده های پیوندی نمی شود، خود معماری به گونه ای طراحی شده است که این رویکرد با گذشت زمان ممکن می شود. عامل مهم در ارائه این قابلیت جریان برای داده های پیوندی در Kadaster، افزایش در دسترس بودن این مجموعه داده ها در Datahub در ثبت زمین است. در واقع، از آنجایی که چشم انداز این است که این Datahub منبع مرکزی همه مجموعه داده های کاداستر باشد، Datahub باید با تعدادی از اصول از جمله ارائه داده ها در زمان واقعی مطابقت داشته باشد. به منظور ارائه این اصول در طراحی آن، احتمالاً یک API جریان برای هر مجموعه داده گنجانده شده است، که هم پرس و جوهای کششی و هم مبتنی بر اشتراک را امکان پذیر می کند.

6. چشم انداز یکپارچه سازی داده های مکانی

در حالی که پیشرفت‌ها در فن‌آوری‌ها و استانداردهای داده‌های مرتبط، و همچنین افزایش تقاضا برای این خدمات، نیاز به رویکردی به‌روز برای تحویل داده‌های مکانی مرتبط توسط Kadaster را آغاز کرد، این رویکرد اکنون در مرکز جاه‌طلبی Kadaster برای ارائه یک نمودار دانش قرار دارد. 14]. در معماری راه حل ارائه شده در بخش قبل، اولین گام به سمت این نمودار دانش در در دسترس قرار دادن رجیسترهای کلیدی مختلف به عنوان داده های مرتبط برداشته شده است. این مجموعه داده ها، در تلاش برای نگه داشتن مدل داده های پیوندی تا حد امکان به مدل داده منبع، هنوز مختص دامنه هستند. این مزیتی برای مجموعه داده‌های پیوندی siled دارد، زیرا مدل‌های داده برای متخصصان دامنه قابل تشخیص و در دسترس هستند و تکنیک حاکمیت در مدیریت این داده‌ها توسط مالک مجموعه مشخص است. عواملی که برای حاکمیت داخلی و مالکیت داده ها در قالب های مختلف در Kadaster مهم هستند.
با این حال، این رویکرد «نزدیک به منبع» برای انتشار داده‌های مرتبط هنگام تلاش برای دسترسی بیشتر به داده‌های موجود در ثبت‌های کلیدی برای کاربر غیرمتخصص مفید نیست، زیرا استفاده از این داده‌ها به دانش دامنه نیاز دارد. در عمل، کاربران غیرمتخصص چنین منابع داده ای بیشتر به اطلاعات مربوط به خانه یا محیط زندگی خود علاقه مند هستند و به دنبال تعامل با داده ها با عباراتی هستند که برای آنها بر اساس محیط اطرافشان آشنا است. به این ترتیب، در ارائه نمودار دانش در نتیجه ترکیب رجیسترهای کلیدی و سایر مجموعه داده‌های تبدیل شده با استفاده از معماری راه‌حل بالا، یک مدل داده کاربرپسند جدید برای نمودار دانش Kadaster استفاده می‌شود. محتویات نمودار دانش مجموعه داده های مرتبط برای هر ثبت کلید است، نقشه کاداستر دیجیتال و همچنین سایر مجموعه داده های مرتبط که حول موضوع یک ساختمان متمرکز شده اند. فرآیند فنی ترکیب مجموعه داده‌های سیلو شده برای تشکیل نمودار دانش در نشان داده شده استشکل 3 .
همانطور که در شکل 3نشان می‌دهد، نمودار دانش Kadaster با ایجاد یک لایه در بالای ثبت‌های کلیدی در فرم داده‌های پیوندی آن‌ها ارائه می‌شود. ترکیبی از این رجیستری های داده مرتبط در حال حاضر با تعریف یک مدل داده با استفاده از مشخصات schema.org مربوط به ساختمان ها انجام می شود. استفاده از schema.org در اولین انتشار نمودار دانش Kadaster به سه دلیل انجام شده است. اولاً، با معماری نمودار دانش به عنوان یک لایه در بالای مجموعه داده‌های پیوندی siled که نمودار را تشکیل می‌دهند، منشأ مجموعه داده‌های اصلی همچنان در صورت لزوم در دسترس کاربر نهایی نمودار دانش است. ثانیاً، استفاده از مشخصات schema.org به نفع استفاده مجدد از استانداردهای موجود جامعه و همچنین به نفع پشتیبانی از قابلیت کشف خارجی و قابلیت همکاری است. علاوه بر این، طرح واره مشخصات org مربوط به یک ساختمان به طور کلی به نحوه درک کاربران غیر متخصص از محیط خود بسیار نزدیکتر است. در واقع، زمانی که کاربر به دنبال اطلاعاتی درباره یک خانه است، ممکن است به کدپستی و شماره خانه فکر کند و نه تعیین شماره. به این ترتیب، مدل داده بسیار کاربرپسندتر از مدل های داده پیچیده است که ثبت های کلید را تعریف می کنند. دسترسی به نمودار دانش فعلی از طریق REST، GraphQL، GeoSPARQL [15 ]، و خدمات ElasticSearch که در آنها برنامه های شخص ثالث از آنها برای ارائه اطلاعات جغرافیایی به کاربر نهایی استفاده می کنند [ 16 ].
در حالی که استفاده از مشخصات schema.org در توسعه یک اثبات مفهوم برای نمودار دانش Kadaster مفید بوده است، بعید است که این مشخصات مشخصات نهایی مورد استفاده برای مدل داده باشد. این بیشتر به دلیل این واقعیت است که تکرار آتی نمودار دانش به احتمال زیاد فقط حاوی اطلاعاتی در مورد ساختمان ها نیست و مشخصات schema.org (هنوز) به اندازه کافی گسترده نیست که به طور مداوم همه اشیاء اطلاعات جغرافیایی مربوطه را مدل کند (مانند جاده ها، زیرساخت، ویژگی های توپوگرافی). در تکرارهای بعدی نمودار دانش،

7. ارزشیابی و درس های آموخته شده

در اجرای رویکرد مشخص شده در این مقاله، چالش‌های مختلفی در رابطه با انتشار داده‌های مرتبط در Kadaster مورد توجه قرار گرفت. در واقع، از آنجایی که رویکرد اولیه در زمینه کتابخانه‌ها و محصولات داده‌های پیوندی بسیار کمتر توسعه داده شد، اغلب لازم بود زیرساخت مورد نیاز برای انتشار داده‌های مرتبط در داخل توسعه داده شود. این مقدار قابل‌توجهی از زیرساخت‌های قدیمی را به‌وجود آورد که برای نگهداری آن نیاز به منابع زیادی داشت. با گذشت زمان، این زیرساخت همچنین تحولاتی را که در جامعه داده‌های مرتبط گسترده‌تر با توجه به کتابخانه‌ها و فن‌آوری‌ها اتخاذ شده بود، منعکس نکرد. همانطور که در سراسر مقاله اشاره شد، تقاضا برای یک رویکرد مقیاس پذیرتر به عنوان یک نتیجه از اثرات شبکه مربوط به در دسترس بودن بیشتر داده های پیوندی مستلزم این بود که فرآیند انتشار داده های مرتبط در Kadaster نوآوری شود. برای اطمینان از این مقیاس‌پذیری و کارایی منابع، رویکرد جدید به استانداردهای موجود جامعه و راه‌حل‌های فناوری تجاری برای توسعه جدول زمانی انتشار در راستای اصول کلی معماری که بر نیاز به ترکیب فناوری‌های موجود در هر جایی که ممکن است تأکید می‌کند، روی آورد.
همانطور که در زمینه مشکل اشاره شد، بازنگری رویکرد موجود به نفع رویکردی که در این مقاله مشخص شده است منجر به انتشار و نگهداری چندین مجموعه داده بزرگ و پیچیده توسط یک تیم داخلی نسبتاً کوچک در Kadaster شده است. این امر از طریق تأکید بیشتر بر استفاده مجدد اجتماعی و تجاری از استانداردها و محصولات حاصل می شود که میزان منابع صرف شده برای توسعه و نگهداری زیرساخت انتشار داده های مرتبط را کاهش می دهد. علاوه بر این، با افزودن اصولی مانند پیکربندی بیش از کد و همچنین انتشار مجموعه داده “نزدیکتر به منبع” با در نظر گرفتن رویکرد جریان، رویکرد جدید به طور قابل توجهی پیچیدگی و شدت منابع رویکردهای قبلی را کاهش می دهد. در واقع،
انتشار موفقیت‌آمیز ثبت‌های کلیدی مختلف و مجموعه داده‌های خارجی فرصتی برای تأمل در رویکرد اتخاذ شده توسط Kadaster همانطور که در این مقاله ذکر شده است، فراهم می‌کند. در اینجا، تعدادی از «درس های آموخته شده» را می توان شناسایی کرد، که هر یک را می توان به طور تقریبی در دو موضوع دسته بندی کرد. موضوع اول را می توان به عنوان نیاز به تناسب بهتر بین دیدگاه های تجاری و فنی در مورد داده های مرتبط خلاصه کرد و شامل دو درس آموخته شده است. در مرحله اول، رویکرد ارائه شده در این مقاله یک پیاده سازی فنی سبک، کم هزینه و کم کد (با استفاده از راه حل های نرم افزاری موجود) برای انتشار داده های مرتبط است. این با دیدگاه کسب و کار و اصول معماری که به طور کلی در سازمان ها دنبال می شود، تناسب بسیار بهتری دارد. مثلا، هزینه پایین پیاده سازی این واقعیت را تکمیل می کند که در حال حاضر استفاده نسبتاً محدودی از این خدمات توسط کاربران نهایی وجود دارد. علاوه بر این، استفاده از ابزارهای موجود در خط لوله انتشار، مکمل استفاده مجدد از راه‌حل‌های نرم‌افزاری موجود در سازمان‌ها بر اساس اصول کلی معماری «عمل خوب» است.
دومین درسی که باید در این موضوع آموخته شود به فقدان عمومی حاکمیتی مربوط می شود که رویکردهای موجود برای انتشار داده های مرتبط در سازمان ها را احاطه می کند. رویکرد ارائه‌شده در این مقاله تمایز واضحی بین انتشار مجموعه‌های داده‌های پیوندی siled، مجموعه‌های داده‌ای که تا حد امکان به مدل داده منبع مدل‌سازی و پیاده‌سازی شده‌اند، و چشم‌انداز اجرای نمودار دانش به‌عنوان یک لایه در بالا، ایجاد می‌کند. از این مجموعه داده ها این تمایز از منظر حاکمیتی به مالک مجموعه داده‌های سیلو شده اجازه می‌دهد تا مسئول نسخه داده‌های مرتبط سیلو خود باقی بماند، زیرا هیچ تغییر قابل توجهی در خود داده (مدل) ایجاد نشده است و این به نمودار دانش اجازه می‌دهد تحت یک مدل حاکمیتی متفاوت قرار گیرد.
موضوع دوم به موضوع مدل‌سازی داده‌های نمودارهای دانش در یک زمینه دولتی مربوط می‌شود. اولین پیاده سازی نمودار دانش در Kadaster با توسعه یک مدل داده بر اساس schema.org انجام شد. همانطور که در بخش قبل اشاره شد، این مدل داده دارای کاستی های مختلفی است و این امر منجر به اذعان به این امر شده است که این مدل داده یکپارچه ضروری است و باید توسط یک منبع معتبرتر مانند مرجع استاندارد مربوطه یا توسط Kadaster توسعه و نگهداری شود. خود مدل‌سازی داده‌ها در بافت دولتی به دلیل الزامات قانونی و حاکمیتی مختلف که یک مدل داده را احاطه می‌کند، می‌تواند تا حدودی پیچیده باشد. توسعه یک مدل داده جدید و یکپارچه برای نمودار دانش می تواند زمان بر باشد و این سوال که چه کسی باید مسئول توسعه، تحویل، و نگهداری مدل همچنان یک سوال باز است. به این ترتیب، بزرگترین مانع برای ارائه یک مدل داده یکپارچه در زمینه دولت ممکن است پیچیدگی فعالیت های مدل سازی داده باشد. مانعی که پتانسیل آن را دارد که کاربرد گسترده این نمودارها را برای سال های آینده به تاخیر بیندازد.

8. نتیجه گیری

Kadaster، ثبت ملی زمین هلند، اخیراً یک رویکرد به روز را برای انتشار داده های مرتبط دارایی های مکانی خود در پاسخ به تقاضای فزاینده برای خدمات داده های مرتبط و نیاز مبرم به نوآوری رویکردهای موجود برای برآورده کردن الزامات مقیاس پذیری، اجرا کرده است. Kadaster با تکیه بر تجربیات موجود در انتشار رجیستری های پایه خود به عنوان داده های مرتبط، از فناوری ها و استانداردهای موجود جامعه و همچنین محصولات تجاری موجود برای تعریف رویکردی استفاده کرده است که دارایی های داده مرتبط را به موقع، مقرون به صرفه و با افزایش قابلیت استفاده مجدد در پروژه ها این رویکرد بخشی از یک چشم انداز بزرگتر برای ارائه یک نمودار دانش متمرکز بر موضوع “ساختمان” است که در آن هم این چشم انداز بزرگتر و هم اصول اعمال شده در این رویکرد مرکزی برای تبدیل ثبت های پایه به نفع یکپارچه سازی داده های مکانی بهتر اجرا می شوند. قابلیت همکاری و کشف اگرچه نوآورانه است، اما تلاش Kadaster برای بهبود یافتن و پیوندپذیری مکانی به صورت مجزا انجام نشده است و نیاز کلی به قابلیت همکاری فضایی بهتر در سطح ملی را برجسته می‌کند.17 ، 18 ] و بین کشورهای (اروپایی) [ 19 ] و قابلیت استفاده مجدد از این داده ها در زمینه های مختلف [ 20 ].

منابع

  1. رولند، ا. فولمر، ای. بیک، دبلیو. Wenneker, R. قابلیت همکاری و یکپارچگی: یک رویکرد به روز شده برای انتشار داده های مرتبط در اداره ثبت زمین هلند. در مجموعه مقالات چهارمین کارگاه بین المللی در مورد داده های پیوندی جغرافیایی در EWSC، هرسونیسوس، یونان، 6 تا 10 ژوئن 2021. [ Google Scholar ]
  2. فولمر، ای. Beek، W. Kadaster Data Platform—Overview Architecture. در مجموعه مقالات کنفرانس نرم افزار رایگان و منبع باز برای زمین فضایی (FOSS4G)، بوستون، MA، ایالات متحده آمریکا، 14 تا 19 اوت 2017. جلد 17. [ Google Scholar ]
  3. فولمر، ای. رونژین، اس. ون هیلگرسبرگ، جی. بیک، دبلیو. Lemmens، R. منطق تجاری برای داده های مرتبط در دولت ها: مطالعه موردی در پلت فرم داده Kadaster هلند. IEEE 2020 ، 8 ، 70822–70835. [ Google Scholar ] [ CrossRef ]
  4. کنسرسیوم وب جهانی بهترین روش ها برای انتشار داده های پیوندی یادداشت گروه کاری W3C. 2014. در دسترس آنلاین: https://www.w3.org/TR/ld-bp/ (در 2 مارس 2021 قابل دسترسی است).
  5. کنسرسیوم وب جهانی زبان محدودیت اشکال (SHACL). توصیه W3C 2017. در دسترس آنلاین: https://www.w3.org/TR/shacl/ (در 3 مارس 2021 قابل دسترسی است).
  6. کنسرسیوم وب جهانی طرحواره RDF 1.1. توصیه W3C 2014. در دسترس آنلاین: https://www.w3.org/TR/rdf-schema/ (در 3 مارس 2021 قابل دسترسی است).
  7. کنسرسیوم وب جهانی OWL 2 Web Ontology Language Primer (نسخه دوم). توصیه W3C 2012. در دسترس آنلاین: https://www.w3.org/TR/owl2-primer/ (در 3 مارس 2021 قابل دسترسی است).
  8. کنسرسیوم وب جهانی پرایمر سیستم سازماندهی دانش ساده SKOS. یادداشت گروه کاری W3C. 2009. در دسترس آنلاین: https://www.w3.org/TR/skos-primer/ (در 3 مارس 2021 قابل دسترسی است).
  9. ون دن برینک، ال. برنقی، پ. تندی، جی. اتمزینگ، جی. اتکینسون، آر. کاکرین، بی. فتحی، ی. گارسیا کاسترو، آر. هالر، ا. هارث، آ. و همکاران بهترین روش ها برای انتشار، بازیابی و استفاده از داده های مکانی در وب. سمنت. وب 2018 ، 10 ، 95-114. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  10. تندی، جی. ون دن برینک، ال. برنقی، ص. داده های فضایی در وب بهترین شیوه ها. یادداشت گروه کاری W3C. 2017. در دسترس آنلاین: https://www.w3.org/TR/2017/NOTE-sdw-bp-20170928/ (دسترسی در 11 نوامبر 2021).
  11. ون دن برینک، ال. یانسن، پی. کواک، دبلیو. Stoter, J. پیوند داده های فضایی: تبدیل خودکار مدل های اطلاعات جغرافیایی و داده های GML به RDF. بین المللی جی. اسپات. زیرساخت داده Res. 2014 ، 9 ، 59-85. [ Google Scholar ]
  12. کنسرسیوم وب جهانی JSON-LD 1.1. توصیه W3C 2020. در دسترس آنلاین: https://www.w3.org/TR/json-ld11/ (در 3 مارس 2021 قابل دسترسی است).
  13. کنسرسیوم وب جهانی بررسی اجمالی SPARQL 1.1. توصیه W3C 2013. در دسترس آنلاین: https://www.w3.org/TR/sparql11-overview/ (در 3 مارس 2021 قابل دسترسی است).
  14. رونژین، اس. فولمر، ای. ماریا، پی. براتینگا، ام. بیک، دبلیو. لمنز، آر. van’t Heer, R. Kadaster Graph Knowledge: Beyond the Fifth Star of Open Data. اطلاعات 2019 ، 10 ، 310. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  15. کنسرسیوم فضایی باز GeoSPARQL – یک زبان پرس و جوی جغرافیایی برای داده های RDF. در دسترس آنلاین: https://www.ogc.org/standards/geosparql (در 3 مارس 2021 قابل دسترسی است).
  16. رولند، ا. فولمر، ای. Beek, W. Towards Self-Service GIS-ترکیب بهترین وب معنایی و GIS. ISPRS Int. J. Geo-Inf. 2020 ، 9 ، 753. [ Google Scholar ] [ CrossRef ]
  17. گودوین، جی. دولبر، سی. هارت، جی. داده های مرتبط جغرافیایی: جغرافیای اداری بریتانیای کبیر در وب معنایی. ترانس. GIS 2008 ، 12 ، 19-30. [ Google Scholar ] [ CrossRef ]
  18. دبروین، سی. میهن، ع. کلینتون، ای. مک نرنی، ال. ناوتیال، ا. لاوین، پ. O’Sullivan، D. داده های مرتبط جغرافیایی معتبر ایرلند. در وب معنایی-ISWC ; D’Amato, C., Fernandez, M., Tamma, V., Lecue, F., Cudré-Mauroux, P., Sequeda, J., Lange, C., Heflin, J., Eds. انتشارات بین المللی Springer: برلین/هایدلبرگ، آلمان، 2017; جلد 10588، ص 66–74. در دسترس آنلاین: https://link.springer.com/10.1007/978-3-319-68204-4_6 (در 12 مارس 2021 قابل دسترسی است).
  19. رونژین، اس. فولمر، ای. لمنز، آر. ملوم، آر. فون براش، TE; مارتین، ای. رومرو، EL; کیتو، اس. هیتانن، ای. Latvala، P. نسل بعدی زیرساخت داده های مکانی: درس هایی از پیاده سازی داده های مرتبط در سراسر اروپا. بین المللی جی. اسپات. زیرساخت داده Res. 2019 ، 14 ، 83-107. [ Google Scholar ]
  20. بوچر، بی. فولمر، ای. برنان، آر. بیک، دبلیو. هبیچ، ای. Würriehausen، F. رولند، ال. ماتورانا، RA; آلوارادو، ای. بویل، R. داده های پیوندی فضایی در اروپا: گزارش از جلسه داده های پیوندی فضایی در نمودار دانش در عمل. 2021. در دسترس به صورت آنلاین: https://www.eurosdr.net/sites/default/files/uploaded_files/eurosdr_publication_ndeg_73.pdf (دسترسی در 10 مارس 2021).
شکل 1. مدل نگاشت خصوصیات شی/نوع داده. طرح ها از قالب دیگری پیروی می کنند. ( الف ) این شکل نشان می دهد که چگونه نگاشت بین مدل اطلاعات و مدل دانش در عمل با توجه به جغد:ObjectProperty انجام می شود. ( B ) این شکل نشان می دهد که چگونه نگاشت بین مدل اطلاعات و مدل دانش در عمل با توجه به جغد:DatatypeProperty انجام می شود.
شکل 2. معماری که از فرآیند ETL پشتیبانی می کند که داده های مرتبط را ارائه می دهد.
شکل 3. چشم انداز Kadaster برای اجرای نمودار دانش.

بدون دیدگاه

دیدگاهتان را بنویسید