1. مقدمه
امروزه، با توسعه علم سرویسمحور و فناوری محاسبات ابری، دادههای جغرافیایی مشترک به تدریج با خدمات اطلاعات جغرافیایی مشترک جایگزین میشوند [ 1 ].
چنین پیشرفت های تکنولوژیکی نیازمند به روز رسانی استانداردهای فعلی است. به طور خاص، جایگزینی ISO (سازمان بینالمللی استاندارد) 19119: 2005 برای خدمات اطلاعات جغرافیایی با نسخه جدید ISO 19119: 2016 [ 2 ] و OGC (کنسرسیوم فضایی باز) WPS 1.0 با نسخه WPS 2.0 [ 3 ] . ISO 19119: 2016اکنون طبقهبندی GWS را ارائه میکند، عملکردهای آنها را دستهبندی میکند، و در نتیجه برای انتشار و کشف GWS پشتیبانی میکند. مشخصات WPS رابط یک سرویس وب را تعریف می کند که امکان توصیف جنبه های نحوی ویژگی های عملکردی را در قالبی باز و شناخته شده فراهم می کند. بنابراین، می توان از آن برای پشتیبانی از قابلیت همکاری نحوی استفاده کرد.
کشف سرویس فرآیند انتخاب یک یا چند سرویس است که نیازهای کاربر را برآورده می کند، با در نظر گرفتن ویژگی های عملکردی و غیر عملکردی. جستجو در دایرکتوری یا کاتالوگ خدمات در پاسخ به درخواست کاربر انجام می شود. با استفاده از معیارهای شباهت، عملیات تطبیق بین ویژگی های درخواست و ویژگی های ذخیره شده در توضیحات سرویس انجام می شود. کشف موثر متکی به موتورهای جستجو با تکنیکهای شاخصسازی و امتیازدهی دقیق است.
این تکنیک ها نمی توانند تنها بر جنبه های نحوی تکیه کنند: آنها همچنین به جنبه های معنایی ویژگی های عملکردی نیاز دارند. فقدان معنایی در توصیف سرویس با استفاده از استاندارد WPS از استفاده از چنین فرآیند تطبیقی جلوگیری می کند و بنابراین به عنوان یکی از محدودیت های اصلی کشف GWS در نظر گرفته می شود [ 4 ، 5 ، 6 ].
فرآیند افزودن اطلاعات معنایی ممکن است با استفاده از حاشیه نویسی مرتبط با واژگان رسمی مشخص شده انجام شود. واژگان در هستی شناسی ها تعریف می شوند تا معنای محتوا را دریافت کنند و امکان استدلال مبتنی بر منطق را فراهم کنند. با استفاده از یک موتور استدلال و یک معیار شباهت مناسب، میتوانیم پرسوجوهای معنایی را به طور دقیق با خدمات توصیفشده معنایی تطبیق دهیم و از دقت و یادآوری بیشتر نتایج جستجو اطمینان حاصل کنیم. علاوه بر این، انتخاب یک معیار تشابه معنایی مناسب برای اطمینان از عملکرد خوب از نظر دقت و نرخ یادآوری اهمیت زیادی دارد.
این مقاله ابتدا رویکردی را با یک پیشنهاد کاملاً عملیاتی برای بهبود استاندارد WPS 2.0 با یک اصل حاشیه نویسی با در نظر گرفتن جنبه های معنایی ویژگی های عملکردی و توصیف ویژگی های غیر کاربردی پیشنهاد می کند. ثانیاً، این رویکرد کشف سرویسهای وب جغرافیایی را با معیار تشابه معنایی جدید و فرآیند تطبیق مرتبط بهبود میبخشد.
ادامه این مقاله به شرح زیر سازماندهی شده است. بخش 2 مروری بر روشهای توصیف و کشف GWS میدهد. بعد، بخش 3 دو بخش از رویکرد پیشنهادی را تشریح می کند. بخش 3.1 یک متا مدل و روش نمونه سازی آن را برای بهبود استاندارد WPS 2.0 ارائه می کند. بخش 3.2 یک روش هماهنگ سازی ترکیبی و یک فرآیند تطبیق سه مرحله ای را ارائه می دهد. بخش 4 معماری و آزمایش رویکرد پیشنهادی را با ارائه آزمایشهایی، از جمله GWS، که در زمینه پروژه Choucas استفاده میشود، توصیف و بحث میکند ( https://choucas.ign.fr/، (دسترسی در 20 ژوئن 2021). این پروژه تحقیقاتی میان رشته ای شامل محققان علوم اطلاعات جغرافیایی، علوم کامپیوتر و پردازش خودکار زبان است. هدف این پروژه یکپارچه سازی داده های ناهمگن و استدلال فضایی برای بومی سازی قربانیان در منطقه کوهستانی است) [ 7 ] و مجموعه ای از خدمات متنوع دیگر. در نهایت، بخش 5 این مقاله را به پایان می رساند.
2. کارهای مرتبط
استانداردهای GWS تمایل دارند تعدادی مشخصات یا معیارهای خاص دیگر را ارائه دهند که به طور مداوم به عنوان یک قانون، راهنما یا تعریف مورد استفاده قرار گیرند. OGC و ISO به طور مشترک استاندارد ISO 19119: 2016 را توسعه داده اند [ 8 ]. این استاندارد یک طبقه بندی از GWS را ارائه می دهد و عملکردهای آنها را طبقه بندی می کند که یکی از اهداف آن تسهیل انتشار و کشف آنها است. متأسفانه، طبقه بندی پیشنهادی، فراتر از اینکه بیش از حد عمومی باقی بماند، به گونه ای طراحی نشده بود که به راحتی به طور خودکار پردازش شود. به طور همزمان، OGC WPS [ 3] استانداردی است که شرح فرآیندهای پردازش دادههای مکانی را در وب تسهیل میکند، مانند: ژئوکدینگ، محاسبه مسیر، نمایه ارتفاع و غیره. مشخصات WPS رابط یک سرویس وب را تعریف میکند که امکان توصیف نحوی مبتنی بر متن را فراهم میکند. عملکرد سرویس و نوع پارامترها در قالب باز و شناخته شده قابل خواندن توسط ماشین.
همانطور که قبلاً بیان شد، ISO 19119 : 2016 و OGC WPS 2.0 (یعنی جدیدترین نسخه های این استانداردها) هنوز امکان ارائه اطلاعات معنایی را در توضیحات خدمات خود لحاظ نمی کنند.
2.1. شرح معنایی خدمات
توصیف معنایی خدمات منشأ خود را در وب معنایی دارد [ 9]. نقش آن معنا بخشیدن به داده ها و خدمات، کمک به درک و استفاده صحیح از آنهاست. استفاده از فراداده رمزگذاری معنایی در داده ها و توضیحات خدمات را امکان پذیر می کند. فنآوریهایی مانند RDF (چارچوب توصیف منابع) و OWL (زبان هستیشناسی وب) میتوانند برای ساختار دادههای فراداده حاوی توصیف مفاهیم، روابط بین موجودیتها یا دستهبندی دادهها یا خدمات استفاده شوند. بر اساس چنین فناوریهایی، دو رویکرد اصلی در ادبیات برای توصیف ویژگیهای کاربردی معنایی سرویسهای وب ارائه شده است: رویکرد حاشیهنویسی معنایی و رویکرد زبان معنایی. در رویکرد قبلی، مهمترین استاندارد SAWSDL (یادداشتهای معنایی برای WSDL) است [ 10 ]]. نقاط توسعه را برای فراداده های سرویس وب سازگار با W3C که با WSDL (زبان شرح خدمات وب) کدگذاری شده اند، مشخص می کند. در رویکرد اخیر، OWL-S (زبان هستی شناسی وب برای خدمات) [ 11 ] و WSMO (هستی شناسی مدل سازی خدمات وب) [ 12 ] غالب هستند. OWL-S و WSMO هستی شناسی ها را به عنوان زبانی برای توصیف خدمات ارائه می کنند. دو رویکرد مختلف به طور مداوم در چندین کار [ 13 ، 14 ، 15 ، 16 ] که با توصیف معنایی GWS سروکار دارند، استفاده شده است. با این حال، این آثار صرفاً به جنبه های معنایی صرف خدمات علاقه مند هستند، همه استفاده از استاندارد WPS را برای جنبه های نحوی حذف کرده اند.
بنابراین، چالشی که هنوز برآورده نشده است، ادغام تکنیک های وب معنایی (هستی شناسی، حاشیه نویسی معنایی، و غیره) با استانداردهای فعلی جغرافیایی است. در [ 17 ]، نویسندگان با بخشی از این چالش روبرو می شوند: آنها ایده یک لایه فعال معنایی شفاف و ادغام آن با خدمات OGC را معرفی می کنند. این رویکرد علیرغم وضوح مفهومی خود، به دلیل عدم اجرا و ارزیابی راه حل پیشنهادی، بیان عینی پیدا نکرد.
2.2. تطبیق عملکردی
به منظور اطمینان از کشف GWS، چارچوبهای مبتنی بر معنایی [ 18 ، 19 ، 20 ] برای پرداختن به تطابق عملکردی پیشنهاد شدهاند. مهمترین مرحله در فرآیند تطبیق عملکردی محاسبه شباهت پارامترهای I/O بین سرویس ها و درخواست کاربر برای یافتن موارد منطبق است. در بیشتر موارد، پارامترهای ورودی/خروجی همه سرویسهای موجود در کاتالوگ به طور کامل با پارامترهای ورودی/خروجی درخواست کاربر مقایسه میشوند. سپس تطبیق پارامترهای ورودی/خروجی میتواند برای سرویسهایی که از نقطه نظر عملکرد بیربط هستند، انجام شود که زمانبر است. برای جلوگیری از کاوش خدمات نامربوط و در نتیجه کاهش زمان پاسخگویی، Refs. [ 19 ، 20 ، 21] عملکرد سرویس را به عنوان اولین معیار در فرآیند تطبیق اضافه کرد. بنابراین، آنها واژگان دامنه ای را برای طبقه بندی عملکردهای خدمات وب جغرافیایی تعریف کردند. خدمات با استفاده از این واژگان برچسبگذاری میشوند و به ما امکان میدهند اولین مرحله تطبیق را برای انتخاب سریع خدمات مرتبط انجام دهیم. سپس، مرحله تطبیق ورودی/خروجی را می توان روی سرویس های انتخابی اعمال کرد تا نتیجه را اصلاح کند. در [ 19 ، 20 ]، علیرغم اجرای روشهای تطبیق معنایی، معیارهای تشابه معنایی مورد استفاده ساده باقی می مانند و تنها پیشنهاد در [ 21 ]] از مکانیسم های خاص برای رویکردهای خواستگاری معنایی استفاده می کند. کارهای موجود در مورد همسان سازی معنایی را می توان به سه دسته اصلی دسته بندی کرد: رویکردهای مبتنی بر منطق، رویکردهای غیر منطقی و رویکردهای ترکیبی. رویکردهای مبتنی بر منطق [ 22 ، 23 ] از مفاهیم هستی شناسی و قوانین منطقی برای بررسی سازگاری بین درخواست و سرویس استفاده می کنند. آنها عمدتاً مبتنی بر فیلترهای تطبیق معنایی به نام فیلترهای DoM (مدل شیء سند) هستند. رویکردهای غیر منطقی [ 24] هدف کاهش پیچیدگی همسانی با تجزیه و تحلیل توضیحات خدمات بر اساس تکنیک های بازیابی اطلاعات، مانند پردازش زبان طبیعی، داده کاوی، تطبیق نمودار یا مکانیسم های محاسباتی، برای فاصله عددی بین مفاهیم در هستی شناسی های داده شده، مانند شباهت Wu و Palmer. اندازه گیری [ 25 ]. همتایان ترکیبی [ 26 ، 27 ، 28 ] مزایای تکنیک های غیر منطقی را با قابلیت های استدلال تکنیک های مبتنی بر منطق ترکیب می کنند. در [ 21]، نویسندگان یک رویکرد ترکیبی را اتخاذ کردهاند که یک تطابق قیاسی را با تعریف فیلترهای منطقی خاص ترکیب میکند و از سوی دیگر، تطبیق مبتنی بر شباهت عمدتاً بر اساس روابط با استفاده از اصول زبانی مترادف، هیپرونیمی، هیپونیمی و غیره. این یک رویکرد بسیار مناسب برای رفع عدم تطابق بین اصطلاحات یک کاربر غیرمتخصص و اصطلاحی است که توسط متخصصان برای برچسبگذاری خدمات استفاده میشود. بنابراین، ممکن است مفاهیمی وجود داشته باشند که از نظر معنایی نزدیک باشند بدون اینکه با هیچ یک از روابط فوق به هم مرتبط شوند، و بنابراین، ممکن است خدماتی را که ممکن است نیاز کاربر را برآورده کند، در نظر نگیرند. با این وجود، استفاده از این دسته از روابط بسیار مرتبط باقی می ماند، به خصوص اگر به صورت مکمل با سایر دسته های روابط استفاده شود.
2.3. تطبیق غیر عملکردی
در زمینه کشف GWS، به منظور اصلاح نتایج تطبیق عملکردی، تعدادی از مطالعات تحقیقاتی مکانی [ 29 ، 30 ، 31 ، 32 ]] مرحله تطبیق غیرعملکردی را که اغلب به عنوان رضایت محدودیت ها، رضایت اولویت ها یا همچنین مرحله توصیه خدمات نامیده می شود، در نظر بگیرید. مرحله تطبیق غیرعملکردی از ویژگیهای غیرعملکردی (در دسترس بودن، هزینه، کیفیت پایگاه داده روزنامه و غیره) استفاده میکند که اغلب ویژگیهای QoS (کیفیت خدمات) هستند. این مرحله برای کمک به کاربر در انتخاب خود استفاده می شود. اگر چندین سرویس را پیشنهاد کند که از نظر عملکردی مشابه هستند، از مرحله تطبیق عملکردی پیروی می کند. روشهای تطبیق غیرعملکردی متنوع هستند. آنها ارتباط نزدیکی با ویژگی های غیر عملکردی در نظر گرفته شده و مدل ارزیابی مورد استفاده دارند (اعداد واقعی، اعداد فاصله، بیان زبانی، مفاهیم هستی شناسی، و غیره). تا آن جایی که می دانیم،
بنابراین، اولین چالش، اجازه دادن به نسخه فعلی WPS برای ادغام جنبه های معنایی در توصیف عملکرد سرویس ها، به لطف فناوری های طراحی شده برای وب معنایی است.
چالش دوم بهبود فرآیند کشف خدمات با در نظر گرفتن پیشرفتها در مطابقت معنایی برای اطمینان از دقت بیشتر و یادآوری نتایج جستجو است.
در نهایت، علاوه بر ویژگیهای عملکردی، باید ویژگیهای غیرعملکردی را نیز در نظر گرفت تا فهرست سفارششدهای از مناسبترین خدمات به کاربر توصیه شود.
3. روش های پیشنهادی
به منظور بهبود توصیف GWS، ما یک متا مدل برگرفته از انتزاعی از توصیف معنایی GWS را پیشنهاد میکنیم. بهبود فرآیندهای کشف بر اساس تطبیق سه مرحلهای است که تطابق عملکرد معنایی، تطابق ورودی/خروجی معنایی و تطابق غیرعملکردی را ترکیب میکند.
متا مدل با اتخاذ همان فلسفه حاشیه نویسی SAWSDL طراحی شد. با این حال، پیشنهاد ما به حاشیه نویسی درشت توصیفات وب سرویس با مفاهیم هستی شناسی دامنه بدون مشخص کردن نقش این مفاهیم در توضیحات وب سرویس محدود نمی شود. به عنوان مثال، کدام مفهوم به دسته خدمات اشاره می کند، کدام مفهوم به معنای I/O است و کدام مفهوم نشان دهنده QoS است.
WPS 2.0 یک مدل فرآیند را برای ارائه یک توصیف تعاملی نحوی از توابع پردازش جغرافیایی تعریف می کند. طبق [ 3 ]:
یک فرآیند تابعی است که برای هر ورودی یک خروجی مربوطه را برمی گرداند. توصیف فرآیند یک مدل اطلاعاتی است که رابط یک فرآیند را مشخص می کند و برای ثبت سرویس در یک کاتالوگ به عنوان مدلی برای کشف خدمات مکانی استفاده می شود. و یک مدل فرآیند انتزاعی الزامات عمومی را برای توصیف فرآیند مشخص می کند. به عبارت دیگر انتزاعی از توصیف فرآیند را نشان می دهد.
بنابراین، تمرکز برای بهبود مکانیسم کشف خدمات جغرافیایی بر بهبود مدل فرآیند انتزاعی و توصیف فرآیند است .
مطابق با این بیانیه، اصطلاحات سرویس و فرآیند به روشی معادل برای اشاره به یک سرویس وب که یک عملیات پردازش جغرافیایی ساده یا پیچیده را ارائه میکند که ممکن است شامل چندین پارامتر ورودی و خروجی باشد، استفاده میشود.
3.1. SAWPS (یادداشت معنایی برای WPS)
روش توصیف GWS دو مرحله را دنبال میکند: بخش 3.1.1 یک متا مدل سبک وزن را طراحی میکند که از توصیف معنایی ویژگیهای عملکردی و توصیف ویژگیهای غیرعملکردی پشتیبانی میکند. بخش 3.1.2 پروتکل نمونه سازی متا مدل ما در WPS 2.0 را توضیح می دهد .
3.1.1. یک متا مدل سبک برای توصیف GWS
شکل 1 عناصر اصلی متا مدل را به عنوان نمودار کلاسی UML (زبان مدلسازی یکپارچه) نشان می دهد.
همانطور که در نمودار نشان داده شده است، هر شرح خدمات حاوی اطلاعاتی در مورد ویژگی های عملکردی و غیر عملکردی است. ویژگی های عملکردی عمدتاً به عملکرد سرویس و اطلاعات مربوط به پارامترهای ورودی/خروجی آن مربوط می شود. عملکرد سرویس از نظر معنایی با مفهوم هستی شناسی سرویس مشروح خواهد شد. این به ما این امکان را می دهد که از یک سو خدمات مختلف را به دانش مشترک مرتبط کنیم و از سوی دیگر فرآیند کشف را خودکار و سبک کنیم. برای فعال کردن کاربرد تطبیق I/O معنایی، I/O باید با مفهوم مقوله داده I/O بر اساس هستی شناسی داده، از نظر معنایی حاشیه نویسی شود. در چارچوب این کار، ما به طور انحصاری روابط فرعی بین مفاهیم هر هستیشناسی را در نظر میگیریم.
در نهایت، با توجه به اطلاعات ویژگی های غیر عملکردی ارائه شده در متا مدل، آنها به دو دسته تقسیم می شوند:
ویژگی های ذهنی : کیفیت سرویس را با توجه به سطوح رضایت کاربر نشان می دهد. در حال حاضر، ما دو یادداشت توصیه را در نظر می گیریم. اولین مورد یک یادداشت توصیه خدمات است که نظرات کاربران را در مورد این سرویس بیان می کند. دومی یک یادداشت پیشنهادی تأمینکننده است که بهطور خودکار از یادداشتهای پیشنهادی خدمات تمام خدمات ارائهشده توسط آن تأمینکننده محاسبه میشود.
ویژگی های هدف : کیفیت خدمات را با توجه به ویژگی های عمومی و ویژگی های مکانی نشان می دهد . اولین نشان دهنده QoS با توجه به انطباق با الزامات عمومی از نظر در دسترس بودن، قابلیت اطمینان و غیره است، در حالی که دومین نشان دهنده QoS با توجه به انطباق با الزامات مکانی است. آنها بر اساس دسته خدمات مورد بررسی متفاوت هستند. برخی از دسته های خدمات نیاز به ویژگی های غیر کاربردی خاصی دارند که باید در نظر گرفته شوند. به عنوان مثال، برای خدمات تجسم، کیفیت زوم اهمیت دارد، در حالی که خدمات کدگذاری جغرافیایی به کیفیت روزنامههای مورد استفاده برای کدگذاری جغرافیایی بستگی دارد. کار پیشنهادی در [ 33] ویژگی های غیر کاربردی برخی روزنامه ها را ارائه و مقادیر این ویژگی ها را محاسبه کرد. جدول 1 نمونه هایی از خواص الهام گرفته از این کار را ارائه می دهد.
3.1.2. WPS Instantiation
مدل فرآیند انتزاعی فعلی WPS فقط یک توصیف نحوی از پارامترهای سرویس و ورودی/خروجی را ارائه میکند ( شکل 2 را ببینید ). به عنوان بخشی از شرح خدمات، تلاشی توسط استاندارد برای ارائه یک مفهوم خدمات جدید ( مفهوم فرآیند ) انجام شده است.
مفهوم سرویس (مفهوم فرآیند ) یک شی است که به عنوان ابرداده سرویس ( فرآیند ) اضافه میشود که مستنداتی درباره گروهی از خدمات (فرآیندها) (پیوند به صفحه HTML (زبان نشانهگذاری فرامتن) یا قالبهای چندرسانهای مشابه ارائه میکند. با این حال، این یک توصیف نحوی از عملکرد سرویس در مقایسه با پیشنهاد ما باقی می ماند.
متا مدل پیشنهادی مدل فرآیند انتزاعی WPS 2.0 را گسترش می دهد . به این ترتیب، همانطور که در بالا ذکر شد، خدمات را می توان با ویژگی های عملکردی (عملکردی و I/O) و ویژگی های غیر عملکردی (عمومی و مکانی) توصیف کرد. یک رویکرد از طریق حاشیه نویسی برای نمونه سازی متا مدل در توضیحات WPS انتخاب شد. اجرای آن، عمدتاً بر اساس استفاده از برچسب رسمی فراداده ، انطباق با استاندارد را تضمین می کند. این تگ دارای دو ویژگی است: role و href ( شناسه نقش نشان دهنده نقش ابرداده و href است.به ابرداده با نوع مقدار HTTP (پروتکل انتقال ابرمتن) -URI (شناسه منبع یکسان) ارجاع می دهد. بنابراین، حاشیه نویسی در تگ ابرداده به صورت لینک های ساده با شناسه نقش مناسب ثبت می شود. جدول 2 (HTTP-URI ارائه شده در وب قابل دسترسی نیست. آنها به عنوان مثال برای اهداف تصویری ذکر شده اند) نقش های جدید تعریف شده و مورد استفاده مجدد را توضیح می دهد (خط اول در جدول).
برای ویژگیهای عملکردی، پیوندی به مفهوم مناسب هستیشناسی نمونهسازی میشود، در حالی که برای ویژگیهای غیرعملکردی، پیوند به یک نمونه XML (EXtensible Markup Language) حاوی اطلاعات (آخرین خط در جدول) اشاره میکند.
3.2. GWSD (کشف خدمات وب جغرافیایی)
شرح روش کشف GWS دو مرحله را دنبال می کند. ابتدا، بخش 3.2.1 یک روش همسان سازی ترکیبی را برای اندازه گیری شباهت معنایی GWS تعریف می کند. سپس، بخش 3.2.2 یک رویکرد تطبیق سه مرحله ای را برای GWSD (کشف خدمات وب مکانی جغرافیایی) تعریف می کند. این رویکرد یک تطابق عملکرد خدمات معنایی، تطابق پارامترهای ورودی/خروجی معنایی و تطابق غیرعملکردی را ترکیب میکند.
3.2.1. یک روش ترکیبی مطابقت
روش پیشنهادی به نام SimCalc، شباهت بین نیازهای مصرف کننده خدمات و توصیف نمونه های سرویس را با توجه به عملکرد و پارامترهای ورودی/خروجی با ترکیب یک روش غیر منطقی و یک روش منطقی محاسبه می کند.
برای توصیف خدمات وب جغرافیایی، از هستی شناسی های دامنه استفاده می کنیم. این ساختارها پیوندهایی را ارائه می دهند که اطلاعات معنایی حاصل از طول مسیر شبکه های دانش را نشان می دهند.
روش غیر منطقی سنجش تشابه مشترک وو و پالمر (SimWP)[ 25 ] به دلیل پذیرش آن در برخی از تحقیقات اخیر [ 34 ، 35 ] و کارایی و سادگی اجرای آن، در حالی که گویا باقی مانده است، انتخاب شده است.
در زمینه، از این معیار می توان برای محاسبه شباهت معنایی بین دو مفهوم در هستی شناسی بر اساس ساختار سلسله مراتبی هستی شناسی استفاده کرد. روش به شرح زیر تعریف شده است:
با توجه به هستی شناسی Ωتوسط مجموعه ای از مفاهیم و یک مفهوم ریشه ای R تشکیل شده است ، C1و C2دو مفهوم آن را نشان می دهد که بر اساس آنها شباهت محاسبه می شود. اصل محاسبات بر اساس فواصل است N0، N1و N2, جداسازی ریشه مفهوم R , concept C1و مفهوم سی2از نزدیکترین جد مشترک سیاس( شکل 3 را ببینید ). این اسمن W _پکه یک امتیاز می دهد ∈ [ 0 ,1 ]در معادله ( 1 ) تعریف شده است.
اندازه گیری به دست آمده با این روش تنها به عمق مفاهیم بستگی دارد. با توجه به اینکه بیشتر هستی شناسی ها عمق محدودی نسبت به تعداد مفاهیم دارند، می توان دریافت که روش در بازه زمانی قابل قبولی پردازش می شود. با این حال، این معیار نمی تواند مستقیماً برای مطابقت با سرویس های وب استفاده شود زیرا متقارن است (یعنی اسمن W _پ( سی1 ، سی2 ) = Sمن W _پ( سی2 ، سی1 )) انواع مفاهیم برای مطابقت باید با توجه به نقش مفهوم در شرح خدمات متمایز شوند. علاوه بر این، برای مقایسه پارامترهای سرویس، استفاده منفرد از چنین روشی ممکن است با تمایل آن به اولویت دادن به مفاهیم همسایه (مفاهیم دارای والد یکسان)، به جای مفاهیم متعلق به یک سلسله مراتب (یک کلاس مفهومی و فرعی آن) باعث سوگیری شود. -کلاس ها).
بنابراین، برای جلوگیری از این اثر، ترکیب این روش با یک روش تطبیق منطقی را پیشنهاد میکنیم.
روشهای منطقی (یعنی مطابقت مبتنی بر منطق) توسط چندین مطالعه تحقیقاتی برای بررسی اینکه آیا پارامترهای ورودی/خروجی یک سرویس با پارامترهای ورودی/خروجی یک درخواست سازگار هستند استفاده شده است [ 22 ]. یک رویکرد رایج برای همسان سازی مبتنی بر منطق، تعریف مجموعه ای از قوانین (فیلترها) است که دیکته می کند که چه نوع روابط منطقی بین پارامترهای I/O یک سرویس و پارامترهای I/O یک درخواست قابل قبول است [ 27 ].
این نوع تطبیق کل امضای ورودی/خروجی را در نظر می گیرد، بنابراین نمی توان میزان مطابقت بین یک سرویس و یک درخواست را محاسبه کرد. با توجه به [ 26 ]، یک رویکرد انعطاف پذیرتر مورد نیاز است تا بتوان میزان تطابق بین یک سرویس و یک درخواست را ارزیابی کرد.
در نتیجه، ما یک روش مطابقت مبتنی بر منطق را بر اساس پیوندهای فردی بین پارامترهای سرویس و درخواست پیشنهاد می کنیم. پیوندها برای اهداف کاربردی و کشف I/O استفاده خواهند شد. با توجه به مجموعه ای از مفاهیم در هستی شناسی Ω، پیوند منطقی L o gL i n k ( Sپ، آر پی)بین مفهوم پارامتر سرویس اسپو مفهوم پارامتر درخواست آر پیمی تواند به یکی از پنج دسته فیلتر که در جدول 3 توضیح داده شده است تعلق داشته باشد.
در نهایت به منظور محاسبه امتیاز تطابق بین a اسپپارامتر و الف آر پیپارامتر، ما یک روش ترکیبی را پیشنهاد می کنیم که دو روش قبلی (منطقی و غیر منطقی) را ترکیب می کند. تعریف می کنیم اسمن سی هستمa l c(به معادله ( 2 ) مراجعه کنید) به عنوان تابعی که نتیجه آن یک امتیاز است ∈ [ 0 ,1 ]پس از ارزیابی دو تابع دیگر ( L o gL i n kو اسمن W _پ) و با در نظر گرفتن نوع پارامتری که باید مطابقت داشته باشد ( من n p u t–من n p u t( من n–من ن )، o u t p u t–o u t p u t( یا تو _–یا تو ) _یا fu n c t i o n a l i t y–fu n c t i o n a l i t y( فu n c–fu n c )).
جایی که:
امتیازی که به یک ( یا تو _–یا تو ) _نوع پارامتر یا a ( فu n c–func)نوع بستگی به درخواست دارد. ما عملکردهای سرویس (و خروجی ها) را در نظر می گیریم که مشابه یا خاص تر از موارد ذکر شده در درخواست هستند. بنابراین، روش فقط می پذیرد exactو subsumesفیلترهایی برای مطابقت با این پارامترها. برعکس، از آنجایی که نمره اختصاص داده شده به (in−in)نوع پارامتر به سرویس بستگی دارد، ما ورودی های سرویس را در نظر می گیریم که مشابه یا عمومی تر از موارد ذکر شده در درخواست هستند. بنابراین، روش فقط می پذیرد exactو plug−inفیلترها
همانطور که قبلا ذکر شد، یک رویکرد تطبیق ترکیبی مزایای تطابق منطقی و غیر منطقی را فراهم می کند. رویکرد ترکیبی ارائه شده در [ 21] تطبیق شباهت غیر منطقی را بر اساس دسته خاصی از روابط معنایی در هستی شناسی ها و تطبیق منطقی با تعریف فیلترهای منطقی خاص (مجموعه ها، افزونه ها و غیره) ترکیب می کند. بنابراین، از دیدگاه روش شناختی، رویکرد مشابهی را در پیش گرفته ایم. تفاوت اساسی بین این دو رویکرد در ویژگی های هستی شناختی حفظ شده برای محاسبه شباهت نهفته است. در مورد مقاله فوق، تطبیق شباهت بر اساس روابط معنایی است که ممکن است بین اصطلاحات مورد استفاده برای شناسایی خدمات و اصطلاحات مورد استفاده توسط کاربران وجود داشته باشد. برای این منظور، نویسندگان از برخی اصول زبانی شناخته شده مانند مترادف، ابرنام، هیپونیمی و غیره استفاده کردند. بسته به روابط ارزیابی شده و ارتباط آنها با فرآیند تطبیق. در نسخه فعلی پیشنهاد ما، ما ترجیح دادهایم که ارزیابی شباهت را بر اساس روابط فرعی معنایی که در هستیشناسی وجود دارد، قرار دهیم. معیار تشابه وو و پالمر که ما استفاده می کنیم، یک امتیاز عددی را محاسبه می کند که شباهت معنایی بین دو مفهوم هستی شناسی را به عنوان تابعی از عمق مفاهیم نشان می دهد، که به آن توانایی محاسبه شباهت معنایی مفاهیم در یک وفادار را می دهد. روش، یعنی احترام به بازنمایی سلسله مراتبی دانش در هستی شناسی. بنابراین ما می توانیم شباهت بین دو مفهوم را محاسبه کنیم، حتی اگر هیچ رابطه معنایی آشکاری بین آنها به معنای [ تعریف نشده باشد. ما ترجیح دادهایم که ارزیابی شباهت را بر اساس روابط فرعی معنایی که در هستیشناسی وجود دارد، قرار دهیم. معیار تشابه وو و پالمر که ما استفاده می کنیم، یک امتیاز عددی را محاسبه می کند که شباهت معنایی بین دو مفهوم هستی شناسی را به عنوان تابعی از عمق مفاهیم نشان می دهد، که به آن توانایی محاسبه شباهت معنایی مفاهیم در یک وفادار را می دهد. روش، یعنی احترام به بازنمایی سلسله مراتبی دانش در هستی شناسی. بنابراین ما می توانیم شباهت بین دو مفهوم را محاسبه کنیم، حتی اگر هیچ رابطه معنایی آشکاری بین آنها به معنای [ تعریف نشده باشد. ما ترجیح دادهایم که ارزیابی شباهت را بر اساس روابط فرعی معنایی که در هستیشناسی وجود دارد، قرار دهیم. معیار تشابه وو و پالمر که ما استفاده می کنیم، یک امتیاز عددی را محاسبه می کند که شباهت معنایی بین دو مفهوم هستی شناسی را به عنوان تابعی از عمق مفاهیم نشان می دهد، که به آن توانایی محاسبه شباهت معنایی مفاهیم در یک وفادار را می دهد. روش، یعنی احترام به بازنمایی سلسله مراتبی دانش در هستی شناسی. بنابراین ما می توانیم شباهت بین دو مفهوم را محاسبه کنیم، حتی اگر هیچ رابطه معنایی آشکاری بین آنها به معنای [ تعریف نشده باشد. معیار تشابه وو و پالمر که ما استفاده می کنیم، یک امتیاز عددی را محاسبه می کند که شباهت معنایی بین دو مفهوم هستی شناسی را به عنوان تابعی از عمق مفاهیم نشان می دهد، که به آن توانایی محاسبه شباهت معنایی مفاهیم در یک وفادار را می دهد. روش، یعنی احترام به بازنمایی سلسله مراتبی دانش در هستی شناسی. بنابراین ما می توانیم شباهت بین دو مفهوم را محاسبه کنیم، حتی اگر هیچ رابطه معنایی آشکاری بین آنها به معنای [ تعریف نشده باشد. معیار تشابه وو و پالمر که ما استفاده می کنیم، یک امتیاز عددی را محاسبه می کند که شباهت معنایی بین دو مفهوم هستی شناسی را به عنوان تابعی از عمق مفاهیم نشان می دهد، که به آن توانایی محاسبه شباهت معنایی مفاهیم در یک وفادار را می دهد. روش، یعنی احترام به بازنمایی سلسله مراتبی دانش در هستی شناسی. بنابراین ما می توانیم شباهت بین دو مفهوم را محاسبه کنیم، حتی اگر هیچ رابطه معنایی آشکاری بین آنها به معنای [ تعریف نشده باشد.21 ]. به عنوان مثال، اجازه دهید “تحلیل زمینشناسی” را به عنوان بخشی از الزامات درخواستکننده از نظر دستهبندی خدمات مورد نظر و دو مفهوم نشاندهنده دو دسته از دستههای SWG در نظر بگیریم که توسط یک رابطه فرعی در هستیشناسی سرویس به هم مرتبط شدهاند، که عبارتند از: “سرویس_تحلیل_زمینی”. و “NERC_service” (NERC برای شناسایی و طبقه بندی موجودیت نامگذاری شده است) (شکل 7 را ببینید). با توجه به رویکرد ما، امتیاز شباهت 0.88 خواهد بود. در حالی که، از نقطه نظر اصطلاحی، به نظر می رسد به دست آوردن یکی از روابط معنایی به معنای [ 21 ] برای سرویس NERC بسیار پیچیده باشد.]، امتیاز باید نزدیک به 0 باشد. در واقع، این دو رویکرد مشکل یکسانی را حل نمی کنند و در دراز مدت بسیار جالب است که بتوانیم آنها را به همکاری وادار کنیم. از آنجایی که هر دو کار از روشهای یکسانی برای محاسبه شباهت بر روی عملکرد و پارامترهای ورودی/خروجی استفاده میکنند، مشاهدات یکسانی را میتوان هنگام در نظر گرفتن دو مفهوم از هستیشناسی دادهها، به عنوان مثال، مفاهیم “offset” و “DistanceCategory” انجام داد.
3.2.2. فرآیند تطبیق سه مرحله ای
مرحله اول تطبیق عملکرد معنایی نامیده می شود . هنگامی که یک درخواست ارسال می شود، نمونه های سرویس مطابق با مفهوم عملکرد درخواستی کشف می شوند. فقط خدماتی که امتیاز آنها برابر یا بیشتر از یک آستانه معین باشد θ ∈ [ 0 ,1 ]حفظ می شوند.
تطبیق بر اساس پیشنهاد است اسمن سی هستمa l cعملکرد با a fu n c–fu n cمحدودیت نوع به عنوان مثال، اگر مفهوم کدگذاری جغرافیایی درخواست شود، تمام نمونه های سرویس با مفهومی که دارای امتیاز منطبق است حاشیه نویسی می شود. ≥ θبا مفهوم ژئوکدینگ در این مرحله حفظ می شوند. ارزش θرا می توان از تعدادی از دسته بندی های منطبق انتخاب کرد (به عنوان مثال، برای θ = 1.0، متوسط برای θ = 0.5و فازی برای θ = 0.0). هدف تطبیق مبتنی بر عملکرد، حذف سریع مقادیر زیادی از خدمات نامرتبط است.
مرحله دوم که تطبیق I/O معنایی نام دارد، سپس برای اصلاح نتیجه اعمال می شود. توضیحات سرویس مرور می شود تا مشخص شود آیا ویژگی های I/O آنها با ویژگی های I/O تعریف شده توسط درخواست کننده سرویس مطابقت دارد یا خیر. ما روشی را پیشنهاد میکنیم که امکان تطبیق بهینه را با توجه به حداکثر امتیاز میدهد اسمن سی هستمa l cتابع و نوع پارامتر مانند مرحله قبل، فقط خدماتی که امتیاز آنها برابر یا بیشتر از یک آستانه معین باشد θ ∈ [ 0 , 1 ]حفظ می شوند. مقدار آستانه را می توان از تعدادی دسته بندی منطبق انتخاب کرد.
داده شده Ωیک هستی شناسی، S یک سرویس و R یک درخواست، و مناس، ای اسو منآر، ای آرمجموعه های محدودی از مفاهیم مرتبط پارامترهای ورودی و خروجی برای S و R ، به ترتیب، افu n Sc o r eتابع برای محاسبه امتیاز تطبیق I/O تعریف شده است (به معادله ( 3a ) مراجعه کنید).
امتیازی که به یک من n p u t–من n p u tتطبیق بر اساس تعداد ورودی های خدمات به جای ورودی های تقاضا است. اولویت در اینجا ارضای این مفهوم است که ورودی های مورد نیاز برای سرویس باید برآورده شوند. با این حال، اگر یکی از ورودی های مشخص شده توسط درخواست استفاده نشود، قابل قبول است. بنابراین، حداکثر امتیاز تطبیق برای هر ورودی سرویس جمع می شود و سپس بر تعداد پارامترهای ورودی مورد نیاز سرویس تقسیم می شود (به معادله ( 3b ) مراجعه کنید).
برعکس، امتیاز اختصاص داده شده به یک o u t p u t–o u t p u tتطبیق به تعداد خروجی های مشخص شده در درخواست بستگی دارد. اولویت در اینجا ارضای این مفهوم است که خروجی های مورد نیاز برای درخواست باید برآورده شوند. حتی در مواردی که سرویس برخی خروجی های اضافی تولید می کند، این مورد قابل قبول باقی می ماند. بنابراین، حداکثر امتیاز تطابق برای هر خروجی درخواست جمع می شود و سپس بر تعداد پارامترهای خروجی مورد نیاز درخواست تقسیم می شود (به معادله ( 3c ) مراجعه کنید).
مرحله سوم، که تطبیق غیر عملکردی نامیده می شود ، روند تطبیق GWS را گسترش داد و اطلاعات متنی (یعنی ویژگی های غیر عملکردی) را یکپارچه کرد. برای رسیدن به این هدف تعریف می کنیم نo n Fu n Sc o r eبه عنوان یک تابع تطبیق غیر عملکردی. این تابع در میان مجموعه توضیحات خدمات نامزد انتخاب شده در مراحل قبلی جستجو می کند و از ویژگی های غیر عملکردی پیشنهاد شده در متا مدل توصیف خدمات استفاده می کند (به بخش 3.1.1 مراجعه کنید ). معادله ( 4 ) ارزش امتیاز غیرعملکردی خدمات نامزد را محاسبه می کند. در این معادله از وزن استفاده می کنیم α ∈ [ 0 , 1 ]به منظور افزایش یا کاهش در نظر گرفتن ویژگی های عینی و ذهنی.
جایی که:
جایی که:
در نهایت، پس از سه مرحله تطبیق، ارزش ارزیابی نهایی خدمات تعیین می شود. در اینجا، ما به ارزیابی نهایی به عنوان امتیاز توصیه پایه اشاره می کنیم ( RecScore). محاسبه از RecScoreمقدار از هر دو نمره عملکردی استفاده می کند (نتیجه FunScoreتابع) و نمره غیر عملکردی (نتیجه NonFunScoreتابع) همانطور که در (معادله ( 5 )) توضیح داده شده است. در این معادله از وزن استفاده می کنیم β∈[0,1]به منظور افزایش یا کاهش توجه تطابق عملکردی. وزن به ما این امکان را می دهد که به کاربر امکان پارامترسازی امتیاز نهایی را بدهیم زیرا علاقه کاربران در مورد جنبه غیر عملکردی متفاوت است: برخی ترجیح می دهند آن را در نظر بگیرند و برخی دیگر نه.
جایی که:
با این وجود، در نظر گرفتن ویژگی های غیر کارکردی، حتی به صورت پایه، ارزش افزوده واقعی در پیشنهاد نهایی برای رتبه بندی (به ترتیب اولویت) خدمات کشف شده می دهد.
4. معماری و آزمایش
4.1. معماری
سهم این مقاله دو گونه است: (1) امکان ایجاد یک توصیف معنایی برای WPS با توجه به روش حاشیه نویسی پیشنهادی (SAWPS). (2) پشتیبانی از کشف یک سرویس وب جغرافیایی (GWSD) بر اساس توضیحات مشروح. معماری عملکردی رویکردهای پیشنهادی SAWPS و GWSD (نشان داده شده در شکل 4 ) از پنج ماژول تشکیل شده است:
-
حاشیه نویسی فایل WPS : نقاط ورودی این ماژول هستی شناسی های دامنه هستند، یک فایل WPS که به صورت نحوی ویژگی های عملکردی یک سرویس مکانی و اطلاعاتی در مورد ویژگی های غیر عملکردی (QoS) را توصیف می کند. این ماژول رویکرد حاشیه نویسی شرح داده شده در بخش 3.1 را اعمال می کند. متعاقباً امکان ایجاد فهرستی از توضیحات سرویس WPS مشروح را فراهم می کند.
-
تحلیلگر SAWPS : استخراج مفهوم حاشیه نویسی عملکرد و I/O مرتبط با توضیحات WPS مشروح معنایی را مدیریت می کند.
-
تطبیق معنایی : تطبیق معنایی بین درخواست کاربر و مجموعه خدمات WPS را با مقایسه مفاهیم مختلف با توجه به روش پیشنهادی انجام می دهد (به بخش 3 مراجعه کنید ). از هستی شناسی های دامنه و استدلال Jena API (Jena: https://jena.apache.org/ ، در 12 ژانویه 2020) برای استنتاج روابط بین مفاهیم استفاده می کند.
-
تجزیه و تحلیل فایل QoS : استخراج مقادیر ویژگی غیر عملکردی (QoS) را از فایل های توضیحات انجام می دهد.
-
محاسبه QoS : یک امتیاز غیر عملکردی (امتیاز QoS) برای هر سرویس کشف شده توسط ماژول تطبیق معنایی محاسبه می کند.
4.2. مجموعه خدمات SAWPS
تا جایی که ما می دانیم، نه مجموعه ای از GWS توصیف شده است و نه بستری برای آزمایش و ارزیابی روش های کشف معنایی GWS وجود دارد. بنابراین، برای آزمایش و بحث در مورد مشارکتهایمان، مجموعهای از 94 سرویس را تولید کردیم که طبق مدل توصیفی WPS 2.0 به عنوان فرآیندهای WPS توصیف شدهاند. سپس، این فرآیندها را به دنبال رویکرد حاشیه نویسی SAWPS به صورت معنایی توصیف کردیم.
برای به دست آوردن یک مجموعه متنوع، مجموعهای از خدمات را با ویژگیهای مختلف انتخاب کردیم: عملکردها، انواع پارامترهای ورودی/خروجی، تعداد پارامترهای ورودی/خروجی، و غیره. همه سرویسهای انتخابشده مربوط به حوزه جغرافیایی هستند. ابتدا، ما 4 سرویس را انتخاب کردیم که در پروژه PERDIDO توسعه یافته بودند (PERDIDO Geoservices: https://erig.univ-pau.fr/PERDIDO/api.jsp ، در 12 ژوئن 2021 مشاهده شد) و در چارچوب پروژه Choucas استفاده شده است. برای بازسازی برنامه سفر از یک متن، از جمله خدمات برای برچسب گذاری POS، برای شناسایی موجودیت های فضایی، برای geocoding و در نهایت یک سرویس برای تبدیل فرمت جغرافیایی. سپس، 2 سرویس پیشنهادی توسط IGN (موسسه ملی اطلاعات جغرافیایی و جنگلی) (IGN Geoservices) را انتخاب کردیم:https://geoservices.ign.fr/documentation/geoservices/ ، در 12 ژوئن 2021 قابل دسترسی است) که قابلیت هایی را برای تکمیل خودکار و محاسبه برنامه سفر بین دو نقطه ارائه می دهد. ما همچنین 4 سرویس را انتخاب کردیم که از 4 روزنامه مختلف ذکر شده در [ 33 ] استفاده می کنند. ما عملکردها و I/O این سرویس ها را تجزیه و تحلیل کردیم و سپس انواع این سرویس ها را با توجه به مدل توصیف نحوی WPS 2.0 توضیح دادیم (ما از یک برنامه 52 استفاده کردیم. ∘North/javaPS برای تولید خودکار فایل های توضیحات نحوی). برای غنیسازی مجموعه خود، 84 شرح فرآیند WPS منبع باز منتشر شده توسط 52 را بازیابی کردیم.∘پروژه شمال [ 36 ] (52 ∘فرآیندهای WPS شمال: https://github.com/52North/WPS/tree/dev/52n-wps-webapp/src/main/webapp/examples/localWPSFiles/xmlDescriptions ، در 12 ژوئن 2020 مشاهده شده است. آنها چندین عملکرد مرتبط با حوزه جغرافیایی، مانند محاسبه فاصله، درونیابی سطح، و غیره را پیشنهاد می کنند. ما این توضیحات را به نسخه فعلی 2.0 WPS به روز کردیم. در نهایت فرآیند حاشیه نویسی معنایی انجام شد. در این زمینه، رویکرد پیشنهادی در بخش 3.1امکان انعطاف پذیری در انتخاب هستی شناسی های مورد استفاده برای حاشیه نویسی عملکردها و I/O سرویس ها را فراهم می کند. برای انجام آزمایش خود، دو هستی شناسی دامنه، هستی شناسی سرویس و هستی شناسی داده را طراحی کردیم تا به صورت معنایی عملکرد سرویس و I/O یک سرویس را حاشیه نویسی کنیم. برای دو هستی شناسی طراحی شده، ما منحصراً روابط فرعی بین مفاهیم را در نظر گرفتیم. اصل دیگری که هنگام طراحی هستی شناسی سرویس اتخاذ شد، اطمینان از تعادل خوبی بین یک دسته بندی عمومی برای ترویج استفاده مجدد و یک دسته بندی خاص برای رفع نیازهای مختلف کسب و کار، از جمله نیازهای تجاری در پروژه Choucas بود. بنابراین، روش دنبال شده برای طراحی این هستی شناسی را می توان در دو مرحله اصلی خلاصه کرد:19119: بازبینی 2016. ثانیا، ما واژگان را با دسته های خدماتی خاص غنی کردیم و آنها را به دسته های عمومی مرتبط کردیم. در مورد هستی شناسی داده ها، پروژه Choucas با IGN، سازمان اداری دولتی دولتی فرانسه که اطلاعات جغرافیایی فرانسه را تولید و نگهداری می کند، مشارکت دارد. در این زمینه، در طول طراحی هسته هستی شناسی، ما از حداکثر مفاهیم پیشنهادی توسط شریکمان به منظور ترویج استفاده مجدد استفاده مجدد کردیم. سپس، هستی شناسی با مفاهیم دیگر مرتبط با خدمات مختلف مورد استفاده در آزمایش ما غنی شد.
در نهایت، ما همچنین به مجموعهای از آثار در ادبیات اشاره کردیم و از آنها الهام گرفتیم که واژگانی را تعریف میکنند که میتوان از آن برای توصیف معنایی I/O این خدمات استفاده کرد. به طور خاص، ما علاقه مند به کار پروژه Choucas هستیم، که واژگانی را بر اساس زبان توصیف TEI [ 37 ] تعریف و تخصصی می کند، و همچنین کارهای دیگر [ 38 ].] که فرمالیسم هستیشناختی قالب زبان نشانهگذاری جغرافیا (GML) را ارائه میکند. علاوه بر این، برای هر سرویس، یک حاشیه نویسی برای پیوند دادن سرویس به یک فایل XML که نشان دهنده ویژگی های غیر عملکردی است، ایجاد شد. مقادیر مربوط به ویژگیهای غیرعملکردی شبیهسازی شدند، زیرا این اطلاعات هنوز در دسترس نیست، بهجز سرویسهای کدگذاری جغرافیایی که از gazetteers استفاده میکنند. برای این خدمات، مجموعهای از مقادیر واقعی ویژگیهای هدف ویژه خدمات کدگذاری جغرافیایی در نظر گرفته شد ( جدول 1 را ببینید ). مقادیر از کار ارائه شده توسط [ 33 ] استخراج شد.
شکل 5 نمونه ای از توصیف معنایی یک سرویس کدگذاری جغرافیایی را نشان می دهد.
4.3. آزمایش و مشاهدات GWSD
4.3.1. آزمایش
به منظور بحث در مورد رویکرد کشف پیشنهادی، دو پیکربندی مختلف مورد آزمایش قرار گرفتند:
به منظور ارزیابی این دو پیکربندی، مجموعهای از آزمونها شامل 10 درخواست معنایی برای 8 عملکرد مختلف سرویس را بر روی مجموعه 94 سرویس اعمال کردیم. همچنین آستانه های پذیرش را تغییر می دهیم (به بخش 3.2.2 مراجعه کنید ):
هنگام ارائه نتایج برای تطبیق عملکرد، نتایج برای آستانه 0.0 به ما اجازه می دهد تا نادیده گرفتن این مرحله را قبل از مرحله تطبیق I/O شبیه سازی کنیم، در حالی که، برای تطبیق I/O، نتایج برای آستانه های <0.5 نشان داده نمی شوند زیرا ، زیر 0.5، مطالعه مرتبط نیست، زیرا خطر پایان دادن به تعداد زیادی از مثبت کاذب وجود دارد.
علاوه بر این، ما از معیارهای دقت و فراخوان و میانگین زمان پاسخگویی یک درخواست معین استفاده کردیم. در نهایت، پیکربندی دوم نیاز به محاسبه امتیاز غیر عملکردی (QoS) دارد.
در ادامه، جدول 4 شامل 2 درخواست از 10 درخواست معنایی مجموعه آزمون های ما و جدول 5 و جدول 6 نتایج مرتبط با آنها است.
درخواست اول ( R1 ) مربوط به جستجوی یک سرویس محاسبه فاصله است و درخواست دوم ( R2 ) مربوط به جستجوی یک سرویس ژئوکدینگ مستقیم است . به یاد داشته باشید که فقط سرویس geocoding دارای مقادیر واقعی برای ویژگی های غیر کاربردی است، به همین دلیل است که پرس و جو R2 در اینجا انتخاب شده است. پرس و جو R1 نشان دهنده وضعیتی است که در آن مقادیر ویژگی های غیرعملکردی شبیه سازی شده اند. در جداول مربوطه، سه ستون عملکرد و I/O سرویس مورد نیاز را نشان می دهد. این جداول با عصاره هایی از هستی شناسی سرویس همراه هستند ( شکل 6 و شکل 7 را ببینید) و استخراج هایی از هستی شناسی داده ها ( شکل 8 و شکل 9 را ببینید ) به منظور نشان دادن، برای درخواست های ارائه شده، مفاهیم مربوط به عملکردها و I/O. شکلها سلسله مراتب کلاس را در هستیشناسیهایی که با روابط بین کلاسها و کلاسهای فرعی توصیف شده نشان میدهند. رنگ نارنجی معادل دو کلاس را نشان می دهد. رنگ بنفش و سبز در فلش های رابطه به ترتیب کلاس فرزند و والدین یک کلاس انتخابی را نشان می دهد. کلاس انتخاب شده با یک حاشیه آبی احاطه شده ظاهر می شود.
پس از آن، ما نتایج مرتبط (به جدول 5 و جدول 6 را ببینید ) با نام خدمات، عملکردهای آنها، امتیاز تطبیق بین عملکرد مورد نیاز و ارائه شده، I/O و امتیازات تطبیق بین مورد نیاز و I/O ارائه شده است.
4.3.2. مشاهدات در مورد نتایج آزمایش
در پیکربندی با دو مرحله
ارزیابی بر اساس مجموعه آزمایشها نشان میدهد که رویکرد کشف بالاترین نرخهای دقت را ارائه میدهد. 90%، نرخ فراخوان (100٪) و زمان پاسخ (10 ثانیه) برای یک عملکرد و آستانه ورودی/خروجی 0.5.
بالاترین نرخ فراخوان (100%) برای تنظیمات آستانه {آستانه عملکرد = 0.5، آستانه ورودی/خروجی = 0.5} و {آستانه عملکرد = 0.0، آستانه ورودی/خروجی = 0.5} به دست میآید.
در مقابل، در مورد آستانه عملکرد = 0.0، که عدم در نظر گرفتن مرحله تطبیق عملکرد را شبیه سازی می کند، میزان دقت بهینه نیست (75٪) و زمان پاسخ به طور قابل توجهی افزایش می یابد (83 ثانیه). این نشاندهنده اهمیت اولین مرحله تطبیق معنایی ما است، که به سرعت تعداد زیادی از سرویسهای نامربوط را حذف میکند، همانطور که در نتایج درخواست مثال R2 نشان داده شده است ( جدول 6 را ببینید ) در مورد دو سرویس ConvPerdido و Autocompletion. بنابراین، این مرحله 15 درصد از مثبت کاذب را کاهش می دهد و زمان پاسخ را 73 ثانیه کاهش می دهد. بالاترین میزان دقت (90%) برای تنظیمات آستانه {آستانه عملکردی = 0.5، آستانه ورودی/خروجی = 0.5} و {آستانه عملکرد = 1.0، آستانه ورودی/خروجی = 0.5} به دست آمده است. با این حال، در مورد آستانه عملکرد = 1.0، که تطبیق معنایی دقیق عملکرد را شبیهسازی میکند، نرخ فراخوان کاهش مییابد (79٪). علاوه بر این، اگر تطابق دقیق I/O را اعمال کنیم (آستانه I/O = 1.0)، این منجر به کاهش نرخ فراخوانی می شود، همانطور که در نتایج درخواست مثال R1 نشان داده شده است ( جدول 5 را ببینید.). این یک نمای کلی از نقش مهم روش تطبیق معنایی ترکیبی پیشنهادی ارائه میدهد که به ما امکان میدهد امتیازهای تطبیق عددی را برای عملکرد و ورودی/خروجی محاسبه کنیم، در حالی که از اشکالاتی مانند اصل ترویج مفاهیم همسایه یا عدم امکان تمایز بین نوع پارامترهایی که باید مطابقت داده شوند با این حال، نرخ دقت شامل درصد پایینی از مثبت کاذب (10٪) است. با توجه به تجزیه و تحلیل ما از درخواستهای مختلف مورد استفاده در مجموعه آزمایشها، ممکن است در مواردی که همه ورودیهای مورد نیاز سرویس ارائه میشوند، اما تعداد زیادی از خروجیهای مورد نیاز درخواست توسط سرویس ارائه نمیشوند، مثبت کاذب رخ دهد. دلیل این امر به دلیل دادن وزن مشابه به امتیاز تطبیق معنایی ورودی ها و خروجی ها است (به معادله ( 3a مراجعه کنید))). در آینده، برای ارضای بهتر نیازهای کاربر، باید این امکان را داشته باشد که کاربر مقادیر وزنی را به منظور محاسبه امتیاز تطابق معنایی جهانی I/O تنظیم کند.
در پیکربندی با سه مرحله
ما قبلاً به مزیت رویکرد پیشنهادی برای محاسبه امتیاز تطبیق معنایی اشاره کردهایم که به ما امکان میدهد خدمات کشفشده را به ترتیب مرتبط رتبهبندی کنیم. با این حال، در برخی موارد، امتیازات (نمرات عملکردی محاسبه شده بر روی پارامترهای ورودی/خروجی) پس از دو مرحله اولیه مشابه است، که منجر به مجموعهای از خدمات معادل بدون ترتیب ترجیحی میشود. ما میتوانیم این را در جداول ارائهکننده نتایج درخواستهای R1 ( جدول 5 ) و R2 (نگاه کنید به جدول 6 ) مشاهده کنیم. در واقع، با در نظر گرفتن یک آستانه = 0.5 برای تطبیق عملکرد و تطبیق I/O، ما دو مجموعه از خدمات معادل برای R1 (امتیاز 0.97 و امتیاز 0.72) و یک مجموعه برای R2 مشاهده می کنیم.(امتیاز 1.0). در این زمینه، سومین مرحله تطبیق سعی میکند نتایج را اصلاح کرده و خدمات را با محاسبه یک امتیاز کلی، به نام «امتیاز توصیه»، بر اساس نمرات عملکردی و غیرکارکردی، طبقهبندی کند (به معادله ( 5 ) مراجعه کنید. برای محاسبه امتیازات غیرعملکردی، دو وزن دهی انجام می شود αو βدر نظر گرفته می شوند (به معادلات ( 4 ) و ( 5 ) مراجعه کنید). در این آزمایش، αتنظیم شد 1.0به منظور در نظر گرفتن تنها خواص عینی و βبه 0.5برای در نظر گرفتن یکسان نمرات عملکردی و غیر عملکردی. تنها ویژگی های عینی به دلیل نمایش کم ویژگی های ذهنی در مجموعه خدمات در نظر گرفته شد.
ویژگیهای هدف شامل ویژگیهای عمومی و ویژگیهای خدمات مکانی خاص است. مقادیر آنها در محدوده عددی [0، 1] بیان می شود، بر خلاف ویژگی های ذهنی، که در آن ما یک سیستم ستاره ای (از یک تا پنج ستاره) را انتخاب کردیم، که سپس یک نرمال سازی برای به دست آوردن امتیاز بین [ 0، 1]. به عنوان مثال، برای ویژگی جغرافیایی هدف “ارز”، که نشان دهنده میزان تغییرات منبع (تکرار به روز رسانی) است، می تواند پنج مقدار ممکن داشته باشد – هرگز، سالانه، ماهانه، هفتگی و روزانه – که مطابقت دارند. به مقادیر عددی 0، 0.25، 0.5، 0.75 و 1. مقادیر ویژگی ها اغلب به روشی کم و بیش تصادفی شبیه سازی می شوند. این مورد برای خدمات ارائه شده در پاسخ به R1 استدرخواست. با این حال، برای سرویسهای مربوط به درخواست R2 ، فرض میکنیم که مقادیر ویژگیهای هدف عمومی برای پنج سرویس انتخابشده مشابه هستند و مقادیر ویژگیهای هدف ویژه عملکرد جغرافیایی را محاسبه میکنیم ( جدول 1 را ببینید ). جدول 7 و جدول 8 به ترتیب امتیازهای پیشنهادی درخواست R1 و درخواست R2 را نشان می دهند (همانطور که در بخش 3.2.2 ذکر شد ، به یاد داشته باشید که امتیاز عملکردی با آخرین امتیاز محاسبه شده، که امتیاز I/O است، نشان داده می شود).
در هر دو مورد، نمرات توصیه، مجموعه خدمات معادل را اصلاح کردند. برای نتایج R1 ، هر مجموعه خدمات به دو زیر مجموعه تقسیم شد، در حالی که، برای R2 ، مجموعه اولیه به چهار زیر مجموعه تقسیم شد که امکان تمایز بهتر خدمات را فراهم می کند. می توان فرض کرد که نتیجه برای R2 بهتر است، زیرا ویژگی های خاص بسیار متمایز هستند، زیرا ویژگی های عمومی مقادیر یکسانی برای همه سرویس ها دارند. علاوه بر این، مقادیر ویژگی های خاص مقادیر واقعی هستند که نتیجه را معنادارتر می کند. این مثالها نشان میدهند که در نظر گرفتن ویژگیهای غیرعملکردی، حتی به صورت ثانویه، ارزش افزوده واقعی را برای توصیه GWS به ارمغان میآورد.
5. نتیجه گیری ها
سوال اصلی تحقیق پشت این مقاله، بهبود کشف GWS است. این در زمینه پروژه Choucas اهمیت دارد، جایی که فرض بر این است که دسترسی و پردازش بهتر دادههای مکانی، از جمله تجزیه و تحلیل متقابل دادههای ناهمگن از منابع متعدد، باید کارایی فرآیند نجات کوهستان را بهبود بخشد. کشف GWS فرآیند انتخاب یک یا چند سرویس است که نیازهای کاربر را برآورده می کند، با در نظر گرفتن ویژگی های عملکردی و غیر عملکردی. جستجو در دایرکتوری یا کاتالوگ خدمات در پاسخ به درخواست کاربر انجام می شود. با استفاده از معیارهای شباهت، عملیات تطبیق بین پارامترهای درخواست و ویژگی های ذخیره شده در توضیحات سرویس انجام می شود. دو مسئله اصلی در فرآیندهای کشف GWS شناسایی شده است. اولین مورد عدم وجود معنایی در توصیف GWS، به ویژه در استانداردهای فعلی است. دوم عدم توجه به پیشرفت در تطابق معنایی، به ویژه در روش های محاسبه شباهت است.
این مسائل ارتباط تنگاتنگی با هم دارند زیرا، اگر هیچ توصیف معنایی ارائه نشود، فرآیند تطبیق قادر به بهره برداری از دانش معنایی نیست و توصیف های معنایی بدون فرآیند تطبیق معنایی برای بهره برداری از آنها بی معنا هستند. بنابراین، سهم ارائه شده در این مقاله دو گونه است: (الف) یک روش توصیف مبتنی بر یک متا مدل سبک و یک رویکرد حاشیه نویسی معنایی، و (ب) یک روش تطبیق با اعمال یک معیار تشابه معنایی جدید در توصیف خدمات ناشی از استفاده از روش فوق متا مدل از انتزاعی از توصیف معنایی GWS مشتق شده است و در استاندارد OGC WPS نمونه سازی شده است. علاقه مندی به ارائه اطلاعات معنایی ارزشمند با استفاده از تگ های فراداده است، در حالی که مطابق با استاندارد WPS است. روش تطبیق ما بر اساس یک فرآیند سه مرحله ای است. مرحله اول تطبیق معنایی عملکرد سرویس، دوم تطبیق معنایی پارامترهای ورودی/خروجی و سوم تطبیق ویژگیهای غیرعملکردی است. هسته اصلی این رویکرد در تعریف نهفته است SimCalcیک روش ترکیبی جدید برای اندازه گیری شباهت معنایی WPS. آزمایشی بر روی مجموعه ای از 94 سرویس با ویژگی های مختلف انجام شد: عملکردها، انواع پارامترهای ورودی/خروجی، تعداد پارامترهای ورودی/خروجی و غیره. نتایج این آزمایش امیدوارکننده است. به ویژه، آنها ارزش فرآیند تطبیق سه مرحله ای را نشان می دهند. در مرحله اول از بازگرداندن تعداد زیادی از خدمات نامربوط به کاربر جلوگیری می شود. مرحله دوم نتایج را بر روی خدمات انتخاب شده اصلاح می کند. هر دو مرحله شامل موارد پیشنهادی است SimCalcروشی برای تطبیق ویژگی های عملکردی سرویس ها، عملکرد برای مرحله 1 و I/O برای مرحله 2، با پارامترهای درخواست. بخش غیر منطقی روش نمرات تطبیق عددی بین ویژگیها و پارامترها را محاسبه میکند، در حالی که بخش منطقی از پیوندهای فردی بین ویژگیها و پارامترها برای کاهش مثبتهای کاذب که ممکن است از پردازش غیر منطقی ناشی میشود، بهرهبرداری کند. برای انجام آزمایشهای خود، حداقل آستانه پذیرش را تغییر دادیم. ارزیابی بر اساس مجموعه آزمون نشان می دهد که رویکرد کشف بالاترین نرخ دقت را ارائه می دهد ( 90%، نرخ های فراخوان ( 100%) و زمان پاسخ (10 ثانیه) برای عملکرد و آستانه ورودی/خروجی از 0.5. این را می توان پیشرفت جالب توجهی نسبت به رویکردهایی در نظر گرفت که مرحله تطبیق عملکرد را در نظر نمی گیرند (که در آن میزان دقت بهینه نیست (75٪) و زمان پاسخ به طور قابل توجهی افزایش یافته است (83 ثانیه)) و رویکردهایی که از تطابق معنایی دقیق استفاده می کنند (جایی که نرخ فراخوان به (79٪) کاهش یافته است، که با تغییر آستانه های پذیرش شبیه سازی شده است. این آزمایشها همچنین نشان دادهاند که در برخی موارد، نمرات تطبیق معنایی عملکردی میتواند یکسان باشد و به ما اجازه طبقهبندی خدمات را نمیدهد. سپس به مرحله سوم برای محاسبه امتیازات پیشنهادی با در نظر گرفتن نمرات عملکردی و غیر عملکردی پرداختیم. نمونه های ارائه شده در بالا در بخش 4.3.2نشان می دهد که امتیازهای توصیه به اصلاح رتبه بندی خدمات ارائه شده کمک کرده است، که امکان تمایز بهتر خدمات را فراهم می کند.
کار ارائه شده تمایل دارد تا کشف GWS را با ادغام ملاحظات معنایی در سطوح توصیف و تطبیق معنایی بهبود بخشد. در سمت توضیحات، این امکان را برای یک توضیح منطبق با WPS فراهم میکند تا توصیف معنایی ویژگیهای عملکردی و غیرعملکردی سرویسها را یکپارچه کند. در سمت تطبیق معنایی، SimCalcروش محاسبه شباهت، پیشرفتها در تطابق معنایی را با ترکیب مزایای SimWPاندازه گیری، که بر اساس عمق مفهوم در یک ساختار سلسله مراتبی است، و مزایای تطابق منطقی فردی، که مبتنی بر استدلال دقیق است. برای تایید نتایج اولیه باید آزمایش های بیشتری انجام شود. مرحله سوم باید بر اساس مقادیر واقعی برای خواص غیرعملکردی توسعه و ارزیابی شود. بنابراین، در کارهای آینده، ما در نظر داریم که یک فرآیند توصیه خدمات پیشرفته تر را توسعه دهیم. از یک سو، با غنیسازی متا مدل با ویژگیهای غیرعملکردی (ویژگیهای خاص سرویسهای جغرافیایی خاص) که میتوان آنها را توصیف کرد و سپس با یک هستیشناسی حاشیهنویسی کرد تا این دانش را در همان فلسفهای که برای ویژگیهای عملکردی یکسان میکند. متعاقباً با توجه به محاسبه امتیاز غیرعملکردی مربوط به خواص عینی،39 ]). از سوی دیگر، با در نظر گرفتن مشخصات کاربر و زمینه انتخاب قبلی (همانطور که توسط [ 31 ] توصیه می شود).
بدون دیدگاه