خلاصه

بدون شک زمینه ای برای حمایت از مفهوم اشتراک داده های جغرافیایی با توسعه سریع و کاربرد گسترده علم اطلاعات جغرافیایی وجود دارد. با این حال، حفاظت از کپی رایت و تشخیص نقض در فرآیند به اشتراک گذاری داده های جغرافیایی همیشه یک موضوع مهم بوده است که نیاز به رسیدگی فوری دارد. در این مقاله، ما یک روش جدید تشخیص نقض برای داده‌های برداری GIS برای جبران کاستی‌های فناوری واترمارک دیجیتال داده‌های برداری در تشخیص تخلف ارائه می‌کنیم. این روش تعیین می‌کند که آیا نقض با درجه تکرار بین داده‌های اصلی و داده‌های برداری که باید در سه ویژگی از جمله ویژگی‌های ویژگی شناسایی شوند، وجود دارد یا خیر. شامل ویژگی های زاویه و ویژگی های راس است که با استفاده از اطلاعات مکانی داده های برداری برای انجام تطبیق ویژگی بر اساس داده های فرمت GeoJSON می شود. نتایج تجربی نشان می‌دهد که الگوریتم پیشنهادی می‌تواند به طور موثر در برابر حملات هندسی رایج، مانند حمله درون یابی، حمله حذف، حمله تبدیل شباهت، حمله به هم زدن نظم ویژگی، و حمله ساده‌سازی ویژگی، بر روی داده‌های برداری مقاومت کند، که ثابت می‌کند الگوریتم پیشنهادی از استحکام عالی برخوردار است. و الزامات کاربرد عملی را برآورده می کند.

کلید واژه ها:

به اشتراک گذاری داده های جغرافیایی ؛ حفاظت از کپی رایت ؛ تشخیص تخلف ؛ تطبیق ویژگی ; GeoJSON

1. معرفی

داده‌های جغرافیایی بیان نمادین رابطه بین ویژگی‌ها و پدیده‌های مختلف جغرافیایی در فضای سطح زمین است و منبع مهمی برای ارتقای اقتصاد ملی و پایه‌ای ضروری برای تحقیقات علوم زمین است .]. در سال‌های اخیر، اینترنت به دلیل پیشرفت سریع فناوری رایانه، کارایی انتقال داده‌ها را تا حد زیادی بهبود بخشیده است. در این شرایط، گسترش داده‌های جغرافیایی بسیار راحت شده است و در نتیجه مشکلات جدی مانند دزدی دریایی و نشت داده‌های جغرافیایی، سود غیرقانونی، استفاده بدون جبران و سایر پدیده‌هایی که به طور فزاینده‌ای بیداد می‌کنند، شده است. کپی و انتشار غیرقانونی داده های جغرافیایی نه تنها حقوق و منافع مشروع تولیدکنندگان داده را نقض می کند، بلکه نظم عادی صنایع مرتبط با اطلاعات جغرافیایی را مختل می کند. علاوه بر این، نشت داده های جغرافیایی با دقت بالا امنیت ملی را تهدید می کند [ 2]. به این دلایل، صاحبان داده‌های جغرافیایی اهمیت زیادی به داده‌های جغرافیایی می‌دهند و اکثر آنها نگرش محافظه‌کارانه‌ای نسبت به اشتراک‌گذاری داده‌های جغرافیایی دارند. آنها تمایلی به به اشتراک گذاری داده های جغرافیایی ندارند، که تا حد زیادی مانع اشتراک و استفاده از داده های جغرافیایی می شود. تولیدکنندگان داده تمایلی به اشتراک گذاری داده های جغرافیایی ندارند، اما تقاضای فزاینده ای برای داده های جغرافیایی در جامعه وجود دارد. این یک تناقض ایجاد می کند و مسئله اشتراک داده های جغرافیایی باید هر چه سریعتر حل شود.
به منظور ترویج اشتراک‌گذاری داده‌های جغرافیایی، برخی از سازمان‌ها و کشورها سیستم‌ها و پلتفرم‌هایی را راه‌اندازی کرده‌اند که به اشتراک‌گذاری داده‌های جغرافیایی اختصاص داده شده است ، و همچنین تعدادی پلتفرم اطلاعات جغرافیایی با منبع جمعی وجود دارد . [ 6] خود به خود ایجاد شد. ظهور این پلتفرم‌ها پشتیبانی خوبی از داده‌های جغرافیایی برای تحقیق، آموزش و توسعه رشته اطلاعات جغرافیایی فراهم کرده است، اما هنوز نتوانسته تناقض فوق را حل کند. دلیل اصلی این است که بیشتر این پلتفرم‌ها پلتفرم‌های رفاه عمومی هستند که توسط دولت و مردم تامین می‌شوند و هدف پلتفرم‌ها ارائه داده‌های رایگان به عموم است، بنابراین ممکن است این پلت‌فرم‌ها نیازی به اتخاذ روش‌های مرتبط برای حفاظت از حق نسخه‌برداری جغرافیایی نداشته باشند. داده‌ها و منافع تولیدکنندگان داده هنوز در نظر گرفته نشده است. به طور کلی، یکی از دلایل مهم حل نشدن تناقضات فوق این است که هیچ روش جهانی برای حفاظت از کپی رایت داده های جغرافیایی وجود ندارد [ 7 ].]. اولین مورد حق چاپ داده های نقشه الکترونیکی در چین در سال 2016 نشان می دهد که جامعه در حال حاضر اهمیت زیادی به حق چاپ داده های جغرافیایی می دهد. بنابراین، تقاضای فوری برای فناوری وجود دارد که بتواند در صورت وجود قوانین و مقررات ناقص، از حق نسخه‌برداری داده‌های جغرافیایی به طور موثر محافظت کند.
در حال حاضر، فناوری کنترل رمزگذاری و فناوری واترمارک دیجیتال ابزار اصلی حفاظت از حق چاپ داده های جغرافیایی هستند [ 8 ]]. در میان آنها، فناوری کنترل رمزگذاری، سخت افزار کامپیوتر، نرم افزار کامپیوتر و داده های جغرافیایی را برای کنترل خواندن و نوشتن داده های جغرافیایی در پایین سیستم کامپیوتری ترکیب می کند. می‌تواند از خواندن، سوء استفاده و دستکاری داده‌های جغرافیایی غیرمجاز در رایانه‌های غیرمجاز توسط کاربران جلوگیری کند و از اقدامات غیرقانونی مانند نقض و افشای داده‌های جغرافیایی از قبل جلوگیری کند. با این حال، این فناوری برای حفاظت از داده‌های طبقه‌بندی‌شده مناسب‌تر از فرآیند اشتراک‌گذاری داده‌های جغرافیایی عمومی است زیرا برای نرم‌افزار و سخت‌افزار نیاز دارد. فناوری واترمارکینگ دیجیتال یک تکنیک تعقیب پس از واقعیت است [ 9]، که اطلاعات واترمارک (مانند تصویر شناسایی اطلاعات حق چاپ) را در داده های جغرافیایی جاسازی می کند و داده های جغرافیایی قبل و بعد از واترمارک را نمی توان به صورت بصری تشخیص داد [ 10 ]. به این ترتیب، صاحبان داده های جغرافیایی می توانند پس از جاسازی اطلاعات مربوط به حق نسخه برداری در داده ها، داده های جغرافیایی را با عموم به اشتراک بگذارند. هنگامی که داده های جغرافیایی مشکوک به نقض در نظر گرفته می شوند، اختلاف حق نسخه برداری را می توان با شناسایی اطلاعات واترمارک در داده ها حل کرد. بنابراین، فناوری واترمارک دیجیتال می تواند در فرآیند اشتراک گذاری داده های جغرافیایی برای عموم اعمال شود.
داده های جغرافیایی عمدتاً به داده های شطرنجی و داده های برداری تقسیم می شوند. تحقیق روی الگوریتم واترمارک دیجیتال داده های شطرنجی تا حدودی از الگوریتم واترمارک تصویر معمولی پیروی می کند زیرا داده های شطرنجی از نظر حالت ذخیره سازی و نمایش مشابه داده های تصویر معمولی هستند. با این حال، ساختار داده داده های برداری پیچیده است، از جمله اطلاعات هندسی، اطلاعات ویژگی و اطلاعات توپولوژی، که دارای چهار ویژگی اساسی مکانی، ویژگی، زمانی و مقیاس است که دشواری تحقیق واترمارکینگ دیجیتالی داده های برداری را افزایش می دهد. در حال حاضر، اکثر محققان از ویژگی‌های فضایی داده‌های برداری برای مطالعه فناوری واترمارک دیجیتال داده‌های برداری استفاده می‌کنند، به دلیل عدم کاربرد ویژگی، زمانی، و ویژگی‌های مقیاس داده‌های برداری [ 11 ,12 ، 13 ، 14 ، 15 ، 16 ، 17 ، 18 ، 19 ]. بنابراین، استحکام الگوریتم واترمارک پس از اینکه ویژگی‌های فضایی داده‌های برداری در معرض روش‌های مختلف حمله هندسی قرار می‌گیرد، باید در تحقیق الگوریتم‌های واترمارک دیجیتال داده‌های برداری در نظر گرفته شود. روش های رایج حمله هندسی ذکر شده در [ 12 ، 14 ، 15 ، 16 ، 17 ، 18 ، 19] عبارتند از حمله درون یابی، حمله حذف، حمله تبدیل شباهت، حمله به هم زدن ترتیب ویژگی، حمله ساده سازی ویژگی، و حمله تبدیل سیستم مختصات. تعاریف آنها در زیر توضیح داده شده است.
  • حمله درون یابی: حمله درون یابی به فرآیند افزودن ویژگی های جدید به داده های برداری اصلی اشاره دارد [ 14 ، 16 ، 17 ، 18 ، 19 ].
  • حمله حذف: هدف حمله حذف حذف برخی از ویژگی ها از داده های برداری اصلی است [ 15 ، 16 ، 17 ، 18 ، 19 ].
  • حمله تبدیل تشابه: حمله تبدیل تشابه یک تبدیل مشابه هندسی داده های برداری اصلی، از جمله حمله ترجمه، حمله چرخشی و حمله مقیاس بندی است [ 16 ، 18 ، 19 ]. مختصات فضایی ویژگی ها معمولاً پس از اینکه داده ها در معرض این نوع حمله قرار می گیرند با داده های اصلی متفاوت است.
  • حمله به هم زدن ترتیب ویژگی: حمله به هم زدن ترتیب ویژگی، نظم ویژگی را در داده های برداری اصلی [ 15 ، 17 ، 19 ] مختل می کند، مانند تغییر FID یک ویژگی از 0 به 1 در داده های برداری شکل فایل. این نوع حمله فقط ترتیب ویژگی ها را بدون تغییر مختصات ویژگی ها تغییر می دهد، بنابراین داده های قبل و بعد از حمله از نظر بصری تغییر نمی کنند.
  • حمله ساده‌سازی ویژگی: هدف حمله ساده‌سازی ویژگی ساده‌سازی داده‌های برداری خط و چندضلعی با استفاده از الگوریتم داگلاس-پیکر [ 12 ، 18 ] است.
  • حمله تبدیل سیستم مختصات: حمله تبدیل سیستم مختصات به معنای تبدیل سیستم مختصات فعلی داده های برداری اصلی به سیستم مختصات دیگری است [ 18 ].
الگوریتم‌های واترمارک دیجیتال داده‌های برداری را می‌توان به الگوریتم حوزه فضایی، الگوریتم حوزه فرکانس، الگوریتم حوزه هندسی و الگوریتم صفر واترمارک با توجه به موقعیت جاسازی واترمارک و منبع اطلاعات واترمارک تقسیم کرد. الگوریتم واترمارک حوزه فضایی از کمی سازی، نگاشت مختصات، و روش های دیگر برای جاسازی واترمارک با اصلاح مقادیر مختصات داده های برداری در محدوده تحمل خطا استفاده می کند، بنابراین مقاومت قوی در برابر حملات اضافه و حذف به دست می آورد [ 20 ، 21 ، 22 ، 23 ، 24 ].]. الگوریتم واترمارک حوزه فرکانس، واترمارک را در ضرایب دامنه تبدیل مختصات مانند DFT (تبدیل فوریه گسسته)، DCT (تبدیل کسینوس گسسته)، DWT (تبدیل موجک گسسته) تعبیه می کند که توانایی الگوریتم را برای مقاومت در برابر حملاتی مانند نویز بهبود می بخشد. و ترجمه [ 25 ، 26 ، 27 ، 28 ]. الگوریتم واترمارک مبتنی بر دامنه هندسی، واترمارک را در ویژگی‌های هندسی داده‌های جغرافیایی، از جمله زاویه، فاصله، طول قوس تعبیه می‌کند و می‌تواند در برابر حملات هندسی مانند چرخش، مقیاس‌گذاری، و ترجمه مقاوم‌تر باشد [ 29 ، 30 ، 31 ، 32 ]]. الگوریتم واترمارک صفر از ویژگی های آثار دیجیتال برای ساخت واترمارک استفاده می کند. فرآیند ساخت واترمارک نیازی به تغییر اطلاعات اثر دیجیتال اصلی ندارد. بنابراین، دقت داده های برداری پس از جاسازی واترمارک تحت تأثیر قرار نمی گیرد. اشکال این است که اگرچه اکثر الگوریتم ها در برابر حملات خاصی مقاوم هستند، اما استحکام عموما ضعیف است [ 33 ، 34 ، 35 ، 36 ، 37]. به طور خلاصه، تحقیق فعلی در مورد واترمارک دیجیتال داده های برداری بر اساس ویژگی های ساختار داده داده های برداری برای جاسازی واترمارک یا تولید اطلاعات واترمارک است. تعبیه واترمارک و دقت استخراج به طور قابل توجهی تحت تأثیر ساختار داده های برداری قرار می گیرد، و اساساً استخراج اطلاعات واترمارک معتبر از داده ها غیرممکن است اگر داده های برداری به شدت آسیب ببینند (مثلاً بیش از 90٪ داده ها حذف شوند). کمبود متداول و اجتناب ناپذیر در تحقیقات فعلی واترمارکینگ دیجیتال داده های برداری
داده های برداری از نقاط، خطوط و چند ضلعی ها برای دیجیتالی کردن موجودیت های فضایی استفاده می کنند، جایی که خطوط و چند ضلعی ها از چند مختصات نقطه تشکیل شده اند، دو نقطه می توانند به یک خط متصل شوند، سه نقطه می توانند یک چند ضلعی را تشکیل دهند، و هدف نهایی عملیات و تبدیل. بیشتر الگوریتم های واترمارک دیجیتال داده های برداری مختصات نقطه ای هستند. به عنوان مثال، اطلاعات واترمارک مستقیماً در مختصات الگوریتم حوزه فضایی تعبیه شده است. طول و زوایای شامل قطعات خط توسط مختصات نقطه به عنوان اطلاعات ویژگی برای ایجاد یک واترمارک دیجیتال در الگوریتم صفر واترمارک محاسبه می‌شود. الگوریتم صفر واترمارکینگ به عنوان مرجع استفاده می شود. در این صفحه،

2. ساختار داده GeoJSON داده های برداری

ساختار داده GeoJSON همه داده های برداری از انواع نقطه، خط و چند ضلعی که در این فصل توضیح داده شده است از مشخصات ویژگی ساده در استاندارد OGC پیروی می کند [ 38 ، 39 ].

2.1. نقطه

نمایش داده های برداری نقطه ای در GeoJSON دارای دو نوع هندسی است، یکی Point و دیگری MultiPoint. سازماندهی داده های برداری نوع نقطه در قالب GeoJSON در شکل 1 نشان داده شده است . برای نوع Point، هر نقطه یک ویژگی مستقل در شکل 1 الف است. در شکل 1 ب، مقدار کلید “نوع” در “هندسه” نقطه است، مقدار کلید “مختصات” در “هندسه” مختصات تنها یک نقطه است، نوع مقدار کلید “ویژگی ها” یک آرایه است. و هر عنصر در آرایه یک رکورد JSON است. هر رکورد JSON نشان دهنده یک نقطه در شکل 1 a است.
داده های قالب GeoJSON داده های برداری از نوع MultiPoint در شکل 2 ب نشان داده شده است. هنگام مقایسه شکل 2 a با شکل 1 a تفاوتی در نمایش بصری موقعیت مکانی بین داده های نوع MultiPoint و داده های نوع نقطه ای وجود ندارد، اما هنگام مقایسه شکل 2 b با شکل 1 b، می بینیم که برخی از آنها وجود دارد. تفاوت های محلی در قالب GeoJSON دو نوع داده. در فرمت GeoJSON داده های برداری نوع MultiPoint، مقدار کلید “type” در “geometry” MultiPoint است، نوع مقدار کلید “مختصات” در “geometry” یک آرایه است و این آرایه می تواند مختصات چند نقطه را ذخیره کند. که هر رکورد JSON در شکل 2b چندین نقطه را در شکل 2 الف نشان می دهد. همانطور که در شکل 2 الف نشان داده شده است، چهار نقطه (x1، y1)، (x2، y2)، (x3، y3)، و (x4، y4) به طور کلی در اولین رکورد JSON از کلید “features” در شکل ذخیره می شوند. 2 ب و یک ویژگی نقطه ای تشکیل دهید. اگر نوع MultiPoint به نوع Point تبدیل شود، این چهار نقطه چهار رکورد JSON ایجاد می‌کنند که ویژگی چهار نقطه را تشکیل می‌دهند. علاوه بر این، فرمت GeoJSON به طور مستقیم مختصات نقاط در رکورد JSON را هنگام ذخیره اطلاعات مکانی داده های بردار نقطه همانطور که در شکل 1 b و شکل 2 b مشاهده می شود، ذخیره می کند.

2.2. خط

مشابه داده‌های نوع نقطه‌ای، داده‌های بردار خط دارای دو نوع هندسی LineString و MultiLineString در قالب GeoJSON هستند. برای نوع LineString، مقدار کلید “type” در “geometry” LineString است، نوع مقدار کلید “Coordinates” در “geometry” یک آرایه است. همانطور که در شکل 3 ب نشان داده شده است، تعداد عناصر در آرایه نشان دهنده تعداد رئوس ویژگی خط است . فرمت GeoJSON یک نقطه شروع و پایان به هر ویژگی خط اختصاص می دهد که جهت ویژگی خط را تولید می کند. ویژگی خط L1 در شکل 3 ج شامل سه پاره خط با شماره 1، 2 و 3 است، در حالی که ویژگی خط L2 فقط شامل یک پاره خط به شماره 4 است. (x1, y1) و (x2, y2) نقطه شروع و پایان هستند. بخش خط 1، همانطور که در شکل 3 نشان داده شده استc پس می توان در نظر گرفت که جهت (x2, y2) نسبت به (x1, y1) جهت پاره خط 1 است. از آنجایی که پاره خط 1 و پاره خط 2 از نظر مکانی پیوسته هستند (x2, y2) هم نقطه پایانی پاره خط 1 و هم نقطه شروع پاره خط 2، در حالی که L1 و L2 از نظر فضایی ناپیوسته هستند، نقطه شروع پاره خط 4 نقطه پایانی پاره خط 3 نیست. از این قانون می توان برای تعیین اینکه آیا استفاده کرد. دو ویژگی خط یا بخش در داده های GeoJSON به هم متصل شده اند.
توزیع فضایی داده بردار خط از نوع MultiLineString و داده های قالب GeoJSON مربوطه در شکل 4 نشان داده شده است . شکل 4 a در نمایش فضایی داده ها کمی با شکل 3 a متفاوت است، اما پس از تجزیه ساختار GeoJSON بر روی نمودار، می توان مشاهده کرد که خطوط 1، 2، 3 و 4 در شکل 4 c ترکیب شده اند تا متعلق به آن باشند. به ویژگی یک خطی، ML1، که با اولین رکورد JSON کلید “ویژگی ها” در شکل 4 ب مطابقت دارد. ویژگی خطی ML1 شکل 4ج، خط تاشو L1 و خط تاشو L2 از نظر مکانی جدا شده اند، بنابراین سه مختصات راس L1 و سه مختصات راس L2 به ترتیب در عنصر اول و عنصر دوم مقدار کلید “مختصات” ذخیره می شوند تا فضایی را نشان دهند. رابطه بین خطوط علاوه بر این، فرمت GeoJSON ویژگی خط را در ابتدا هنگام ذخیره اطلاعات فضایی داده های بردار خط، به کوچکترین واحد (قطعه خط) تقسیم می کند و سپس مختصات رأس پاره خط را در داده های JSON ذخیره می کند، همانطور که مشاهده می شود. در شکل 3 ب و شکل 4 ب.

2.3. چند ضلعی

دو نوع Polygon در قالب GeoJSON وجود دارد که شامل Polygon و MultiPolygon می شود. داده های برداری چند ضلعی از نوع Polygon و داده های قالب GeoJSON آن در شکل 5 نشان داده شده است. برای نوع Polygon، نوع مقدار کلید “مختصات” در “geometry” یک آرایه است که با A[i] نشان داده می شود. در شکل 5 a,b مشاهده می شود که:
  • وقتی سوراخی در چند ضلعی وجود ندارد، فقط یک عنصر در A[i] وجود دارد.
  • هنگامی که یک سوراخ در چند ضلعی وجود دارد، چندین عنصر در A[i] ذخیره می شود.
  • مختصات راس های پیرامونی چند ضلعی همیشه در اولین عنصر A[i] و مختصات رئوس سوراخ در عنصر دوم و بعدی ذخیره می شود.
اطلاعات فضایی داده های برداری چند ضلعی به صورت مختصات رأس در قالب GeoJSON مانند داده های بردار خط ذخیره می شود. هنگامی که GeoJSON ذخیره می شود، با راس شمالی ترین ویژگی چند ضلعی شروع می شود، مختصات رئوس دیگر چند ضلعی در جهت خلاف جهت عقربه های ساعت ذخیره می شود و از نقطه شروع به عنوان نقطه پایان برای تکمیل بسته شدن چند ضلعی استفاده می کند. اگر سوراخی در چند ضلعی وجود داشته باشد، مختصات رأس سوراخ در جهت عقربه های ساعت ذخیره می شود، همانطور که در شکل 5 ج نشان داده شده است.
مشابه داده های برداری انواع MultiPoint و MultiLineString، برای نوع MultiPolygon، یک رکورد JSON در مقدار کلید “ویژگی ها” چند ضلعی را ذخیره می کند. نوع مقدار کلید «مختصات» در «هندسه» یک آرایه است (که با C[k] مشخص می‌شود)، C[k] همه ویژگی‌های چند ضلعی را ذخیره می‌کند، هر عنصر در C[k] یک آرایه است (که با D[m نشان داده می‌شود] ، و D[m] مربوط به شی چند ضلعی موجود در ویژگی چند ضلعی است، هر عنصر در D[m] نیز یک آرایه است (که با E[n] مشخص می شود)، و مختصات رئوس هر شی چند ضلعی ذخیره می شود. در E[n]. همانطور که در شکل 6 نشان داده شده استa،b، دو جسم چند ضلعی اعداد 3 و 4 متعلق به یک ویژگی چند ضلعی با id 1 هستند، بنابراین دو عنصر در C[k] وجود دارد و یک سوراخ در چند ضلعی شماره 4 وجود دارد، بنابراین D[ m] آرایه دو عنصر دارد. عنصر اول در D[m] مختصات راس های محیطی چند ضلعی 4 و عنصر دوم مختصات رئوس سوراخ در چند ضلعی 4 را ذخیره می کند. به زبان ساده، نوع مقدار کلید “مختصات” در ” هندسه” در نوع MultiPolygon آرایه ای از آرایه های مختصات رأس چند ضلعی است. مانند نوع Polygon، مختصات رئوس محیطی چند ضلعی ها در نوع MultiPolygon در خلاف جهت عقربه های ساعت ذخیره می شود و ترتیب ذخیره رئوس سوراخ ها در جهت عقربه های ساعت است، در حالی که نقطه شروع در رئوس چند ضلعی همیشه نیست. شمالی ترین نقطه،شکل 6 ج.

3. طراحی الگوریتم

3.1. محاسبه زاویه

در داده های برداری GIS، اگر رابطه موقعیت نسبی فضایی بین دو مشخصه تغییر نکند (از نظر هندسه مساوی یا مشابه)، زاویه بین ویژگی ها بدون تغییر باقی می ماند. در الگوریتم این مقاله، زاویه یک شاخص اندازه گیری مهم است. محاسبه زاویه بر اساس مختصات نقطه است و به زاویه آزیموت و زاویه شامل تقسیم می شود. بگذارید مختصات (x1, y1) و (x2, y2) به ترتیب نقطه شروع و پایان پاره خط P باشند. سپس، زاویه α موجود بین پاره خط P و محور x را می توان همانطور که در رابطه (1) نشان داده شده است محاسبه کرد:

α = آرکتان ((y2 – y1)/(x2 – x1))

با توجه به اینکه نقطه پایانی پاره خط P ممکن است در ربع های مختلف نسبت به جهت نقطه شروع باشد، زاویه آزیموت Az پاره خط P در چهار ربع در شکل 7 نشان داده شده است . روش محاسبه Az برای پاره خط P در ربع های مختلف در رابطه (2) آورده شده است. محدوده Az 0-360 درجه است.

A z  = ⎧⎩⎨⎪⎪90 –   (− 1  – 1  ) ، زمانی که P    در ربع اول و چهارم قرار دارد      270 –   (− 1  – 1  ) ، زمانی که P    در ربع دوم و سوم قرار دارد _      آز  = {90 – آرکتان(y2 – y1ایکس2 – ایکس1) ، چه زمانی پ است که در را اولین و چهارم ربع ها270 – آرکتان(y2 – y1ایکس2 – ایکس1) ، چه زمانی پ است که در را ثانیهبعد و سوم ربع ها

پس از اتمام محاسبه آزیموت، زاویه موجود بین دو بخش خط متصل را می توان محاسبه کرد. محاسبه باید به طور جداگانه با توجه به موقعیت های ربع مختلف دو بخش خط مورد بحث قرار گیرد. از آنجایی که موارد زیادی وجود دارد که در آن دو پاره خط با هم ترکیب می شوند، تنها یک مثال در اینجا نشان داده شده است. همانطور که در شکل 8 نشان داده شده است ، پاره خط P به پاره خط L متصل است ، و جهت دو پاره خط در ربع اول قرار دارند، زاویه آزیموت پاره خط P ∠PAz و زاویه آزیموت خط است. قطعه L ∠LAz است، سپس زاویه شامل β بین پاره خط P استو پاره خط L را می توان با توجه به رابطه (3) محاسبه کرد. لازم به ذکر است که از آنجایی که زاویه کمتر از 180 درجه همیشه به عنوان زاویه درج شده بین دو پاره خط در نظر گرفته می شود، دو فرمول برای محاسبه زاویه β لحاظ شده در زمانی که جهات دو پاره خط در یک ربع هستند وجود دارد. به عنوان مثال، P’ همانگونه که در شکل 8 ب نشان داده شده است، خط گسترش پاره خط P است. هنگامی که موقعیت پاره خط L بین محور y’ و P’ باشد (∠PAz > ∠LAz)، محاسبه زاویه گنجانده شده β باید با استفاده از رابطه (3) و محاسبه زاویه شامل β انجام شود.باید با استفاده از رابطه (4) زمانی که موقعیت پاره خط L بین P’ و محور x’ باشد (∠PAz < ∠LAz) انجام شود.

β ∠ LAz − ∠ PAz 180       (– 1  – 1  ) – (  – 2  – 2  ) + 180  � =∠LAz – ∠PAz + 180 = آرکتان(y2 – y1ایکس2 – ایکس1) – آرکتان(y3 – y2ایکس3 – ایکس2) + 180
 β ∠ PAz − ∠ LAz 180        (– 2  – 2  ) – (  – 1  – 1  ) + 180  � = ∠PAz – ∠LAz + 180 = آرکتان(y3 – y2ایکس3 – ایکس2) – آرکتان(y2 – y1ایکس2 – ایکس1)+ 180

3.2. محاسبه مرکز میانگین

برای یک ویژگی چند ضلعی، اگر مختصات راس بدون تغییر باشد، مختصات مرکز تغییر نخواهد کرد. بنابراین، مختصات مرکزی می تواند برای تعیین یکسان بودن موقعیت مکانی دو چند ضلعی استفاده شود. به منظور تضمین عملکرد الگوریتم، مقدار میانگین مختصات راس در اینجا برای نشان دادن مرکز چند ضلعی استفاده می شود. بگذارید مختصات رئوس چند ضلعی M باشد (x1, y1), (x2, y2), …, (x n , y n ) سپس میانگین مرکز مختصات C ( ایکس¯،Y¯ایکس¯،�¯) از M را می توان با توجه به رابطه (5) محاسبه کرد. همانطور که در شکل 9 نشان داده شده است، اگر سوراخی در M وجود داشته باشد، سوراخ نیز به عنوان چندضلعی در نظر گرفته می شود .

ایکس¯ = n1ایکسمنn، Y¯= n1yمنnایکس¯ = ∑من=1�ایکسمن�، �¯= ∑من=1��من�

3.3. الگوریتم تشخیص نقض داده های برداری

از تجزیه و تحلیل ساختار داده GeoJSON، می توان دریافت که سه نوع داده برداری (نقطه، LineString و Polygon) در بیان اطلاعات مکانی ویژگی واضح تر از MultiPoint، MultiLineString و MultiPolygon هستند. بنابراین، الگوریتم نوع هندسه را در قالب GeoJSON به صورت Point، LineString و Polygon در فرآیند طراحی مشخص می کند.
مفهوم اصلی طراحی الگوریتم تشخیص تخلف برای داده های برداری GIS این است که تطبیق ویژگی را بر اساس حداقل واحد تشکیل دهنده داده های برداری انجام دهد تا نرخ تکرار داده ها را به دست آورد، در نتیجه تعیین شود که آیا نقضی در داده ها وجود دارد یا خیر. شناسایی شده. با این حال، ویژگی‌های مکانی داده‌های برداری در برابر حملات هندسی مانند افزودن، حذف و اصلاح بسیار آسیب‌پذیر هستند. بنابراین، لازم است ویژگی‌های ویژگی، ویژگی‌های زاویه گنجانده شده، و ویژگی‌های راس را از ویژگی‌های فضایی داده‌های برداری به عنوان شاخص‌های اندازه‌گیری در تطابق جدا کنیم. به طور کلی، الگوریتم های تشخیص نقض داده های برداری به تشخیص ویژگی، شامل تشخیص زاویه و تشخیص راس تقسیم می شوند. داده‌های برداری نوع نقطه عمدتاً از تشخیص ویژگی و تشخیص زاویه شامل استفاده می‌کنند، در حالی که داده‌های برداری نوع خط و چند ضلعی به هر سه روش تشخیص فوق الذکر نیاز دارند. جریان الگوریتم در نشان داده شده استجدول 1 . نرخ تکرار داده‌های برداری T به صورت T = (تعداد ویژگی‌های تکراری/کاردینالیته ویژگی‌ها) × 100% محاسبه می‌شود. تعداد ویژگی‌های تکراری به تعداد تکرار ویژگی‌های جغرافیایی، مقدار زاویه شامل یا مقدار مختصات مرکز متوسط ​​در داده‌های برداری اشاره دارد. T در این مقاله برای ارزیابی اینکه آیا نقض وجود دارد استفاده می شود، بنابراین حداکثر نرخ تکرار دو یا سه ویژگی به عنوان RT در نظر گرفته می شود . کاردینالیته ویژگی به تعداد کل هر ویژگی اشاره دارد. کاردینالیته کوچکتر ویژگی ها به عنوان کاردینالیته ویژگی در داده های برداری برای شناسایی در نظر گرفته می شود.
مختصات نقطه ابتدا هنگام تشخیص نرخ تکرار داده های نوع نقطه مطابقت داده می شود و مختصات مساوی نشان می دهد که دو ویژگی نقطه تکراری هستند. در نظر گرفتن اینکه آیا رابطه موقعیت نسبی فضایی هر ویژگی با هم مطابقت دارد، علاوه بر در نظر گرفتن اینکه آیا مختصات جغرافیایی هر ویژگی مطابقت دارد یا خیر، ضروری است. ما از زاویه گنجانده شده بین خطوط اتصال ویژگی های نقطه ای برای بیان روابط موقعیتی نسبی ویژگی ها استفاده می کنیم. زاویه آزیموت خط اتصال بین دو ویژگی نقطه باید به ترتیب زمانی محاسبه شود که زوایای گنجانده شده در داده های نقطه محاسبه می شود، و سپس زاویه شامل شده بین دو خط را می توان به ترتیب پس از محاسبه تمام زوایای آزیموت محاسبه کرد. نشان داده شده درشکل 10 الف. هنگام تشخیص داده های نوع خط، باید با مختصات نقطه شروع و پایان ویژگی خط مطابقت داشته باشد. اگر مقادیر مختصات برابر باشند، دو ویژگی خط تکراری در نظر گرفته می شوند. رابطه فضایی نسبی ویژگی های خط با زاویه گنجانده شده بین ویژگی های خط بیان می شود. لازم است قبل از محاسبه زاویه شامل شده بین ویژگی های خط مشخص شود که آیا مشخصه خط P با مختصات نقطه شروع و پایان ویژگی های خط به ویژگی خط M متصل است یا خیر، و زاویه گنجانده شده تنها زمانی محاسبه می شود که خط. همانطور که در شکل 10 نشان داده شده است، ویژگی ها متصل هستندب ویژگی‌های فضایی یک چند ضلعی در صورت حمله به آن بسیار تغییر می‌کند، بنابراین فرآیند تشخیص داده‌های برداری چند ضلعی پیچیده‌تر است و به سه بخش تقسیم می‌شود: تشخیص ویژگی، تشخیص زاویه شامل داخلی، و تشخیص مختصات راس. زمانی که مختصات رأس چند ضلعی تغییر نکرده باشد، میانگین مختصات مرکز بدون تغییر است. بنابراین، تعداد تکرارهای ویژگی های چند ضلعی را می توان با مختصات مرکز میانگین چندضلعی تشخیص داد، اما این فقط برای مواردی مناسب است که مختصات رأس ویژگی چند ضلعی کاملاً بدون تغییر باشد. همانطور که در شکل 10 نشان داده شده است، هنگامی که چند ضلعی بریده می شود یا یکی از رئوس دستکاری می شود، مختصات مرکزی تغییر می کند .ج بنابراین، انجام تشخیص مختصات راس برای قضاوت کمکی هنگام تشخیص داده های نوع چند ضلعی ضروری است.

4. آزمایش و نتیجه

4.1. داده پردازی و محیط تجربی

4.1.1. پردازش داده ها

مجموعه داده این مقاله از مجموعه داده برداری shapefile در OpenStreetMap استفاده می کند. ویژگی‌های نقطه‌ای، داده‌های نقطه علاقه، از جمله مکان‌ها، POI، ترافیک و حمل‌ونقل هستند. ویژگی‌های خط از داده‌های جاده استفاده می‌کنند، ویژگی‌های چند ضلعی از داده‌های ساختمان استفاده می‌کنند، و محدوده طول و عرض جغرافیایی داده‌های تجربی 113.963°-118.493° شرقی و 38.302°°-42.125° شمالی است، سیستم مختصات داده‌های تجربی GCS_WGS_1984 است. نمای کلی داده ها در شکل 11 الف نشان داده شده است و جزئیات محلی در شکل 11 نشان داده شده است.ب توجه به حذف چند نقطه ای، چند خطی و چند ضلعی هنگام تبدیل داده های قالب فایل به فرمت GeoJSON ضروری است زیرا الگوریتم نوع فرمت GeoJSON داده های برداری را به صورت Point، LineString و Polygon مشخص می کند. فرآیند پیش پردازش داده ها در شکل 12 نشان داده شده است .

4.1.2. محیط تجربی

فرمت GeoJSON به طور گسترده در سیستم معماری B/S استفاده می شود که همچنین پسوندی برای فرمت JSON است. در نتیجه، جاوا اسکریپت پشتیبانی خوبی از فرمت GeoJSON دارد. در این آزمایش از زبان جاوا اسکریپت برای پیاده سازی مراحل الگوریتم استفاده می شود. محیط سیستم ویندوز 10 18362.175 مبتنی بر ×64، پردازنده inter i5-7300HQ، 24 گیگابایت رم است و ابزارهای توسعه Sublime Text 3 و Google Chrome هستند.

4.2. آزمایش حمله

ویژگی های مکانی داده های برداری به راحتی قابل تغییر است و هزینه دستکاری اطلاعات مکانی در داده های برداری کم است. چندین نوع متداول از حملات اطلاعات مکانی ذکر شده در تحقیقات واترمارکینگ دیجیتال فعلی عبارتند از حمله درون یابی، حمله حذف، حمله تبدیل شباهت (ترجمه، چرخش، مقیاس‌بندی)، حمله درهم‌سازی ترتیب ویژگی، حمله ساده‌سازی ویژگی، و حمله تبدیل سیستم مختصات. سیستم مرجع مختصات پیش‌فرض برای فرمت GeoJSON، سیستم مختصات جغرافیایی با استفاده از داده WGS84 است، و ما این پیش‌فرض را به عنوان پیش‌شرط الگوریتم پیشنهادی در نظر می‌گیریم و مشخص می‌کنیم که سیستم مختصات داده برای شناسایی باید GCS_WGS_1984 باشد، بنابراین حمله تبدیل سیستم مختصات آزمایش دیگر در آزمایش انجام نمی شود.

4.2.1. حمله درون یابی

ما مقدار مشخصی از نقاط، خطوط و ویژگی‌های چند ضلعی را از مجموعه داده‌های تجربی انتخاب کردیم و سطوح مختلف حمله را برای بررسی استحکام الگوریتم تنظیم کردیم. با در نظر گرفتن 20 درصد از ویژگی ها به عنوان مثال، مقایسه انواع مختلف داده ها و داده های اصلی پس از حمله درون یابی در شکل 13 نشان داده شده است . نتایج آزمون در جدول 2 نشان داده شده است که نشان می دهد الگوریتم پیشنهادی از دقت بالایی برای تشخیص حملات درون یابی برخوردار است. حمله درون یابی فقط ویژگی هایی را اضافه می کند و اطلاعات مکانی داده های اصلی را تغییر نمی دهد، از این رو اکثر الگوریتم های واترمارکی دیجیتال برای تشخیص حملات درون یابی موثر هستند.
4.2.2. حمله حذف
در این آزمایش، سه سطح مختلف حمله حذف تنظیم شد. با در نظر گرفتن 20% حذف ویژگی به عنوان مثال، مقایسه انواع مختلف داده ها و داده های اصلی پس از حمله حذف در شکل 14 و نتایج آزمون در جدول 3 نشان داده شده است.. متفاوت از حملات درون یابی، حذف حملات مستقیماً ویژگی های فضایی داده های اصلی را از بین می برد. از بین رفتن ویژگی‌های فضایی داده‌های اصلی به ناچار منجر به از دست رفتن اطلاعات واترمارک می‌شود، زیرا الگوریتم‌های واترمارک دیجیتال داده‌های برداری فعلی عمدتاً بر اساس ویژگی‌های فضایی برای جاسازی واترمارک هستند. بنابراین، بیشتر الگوریتم‌های واترمارک دیجیتال داده‌های برداری، یک اثر تشخیص نسبتاً ناپایدار برای حملات حذف دارند. به همین دلیل، در فرآیند طراحی الگوریتم پیشنهادی از فناوری واترمارک دیجیتال استفاده نمی‌شود. در ادبیات [ 16 ]، شباهت بین واترمارک شناسایی شده و واترمارک اصلی به ترتیب 90.53٪، 89.75٪ و 90.60٪ بود، پس از یک حمله حذف 20٪ بر روی سه نوع داده [ 16 ].]، و نویسندگان آزمایش حمله حذف با شدت بالاتر را انجام ندادند. جدول 3 نشان می دهد که نتایج تشخیص الگوریتم پیشنهادی پس از حذف 90 درصد از داده های تجربی ثابت می ماند.
4.2.3. حمله تبدیل شباهت
در این آزمایش، دو سطح حمله متفاوت برای هر حمله فرعی تعیین شد. مقایسه انواع مختلف داده ها و داده های اصلی پس از حمله تبدیل تشابه در شکل 15 نشان داده شده است . همانطور که از شکل 15 مشاهده می شود ، اطلاعات مختصات داده ها پس از حمله کاملاً با داده های اصلی متفاوت است، بنابراین F و C در نتیجه 0٪ هستند، همانطور که در جدول 4 نشان داده شده است. با این حال، رابطه فضایی نسبی هر ویژگی در داده‌های تجربی تغییر نمی‌کند، بنابراین می‌توانیم بدانیم که ویژگی‌های زاویه گنجانده شده داده‌ها پس از حمله با داده‌های اصلی با مقدار R مطابقت دارند.A ، که ثابت می کند که الگوریتم پیشنهادی دارای نرخ دقت بالایی برای تشخیص حملات تبدیل شباهت است.
4.2.4. حمله تقلبی سفارش ویژه
دو سطح حمله مختلف در این آزمایش تنظیم شد. مقایسه بین انواع مختلف داده ها و داده های اصلی پس از حمله به هم زدن نظم ویژگی در شکل 16 نشان داده شده است . همانطور که از جدول 5 می بینیم ، A در نتایج داده های بردار نقطه به شدت تحت تاثیر حمله درهم آمیزی ترتیب ویژگی قرار می گیرد. این به این دلیل است که حمله درهم‌آمیزی ترتیب ویژگی‌ها ممکن است ترتیب راس بین ویژگی‌های قبل و بعد را در جایی از داده‌های اصلی قطع کند و در نتیجه زاویه موجود بین ویژگی‌ها تغییر کند. از این رو، نتیجه تشخیص Aداده های برداری نقطه ای با افزایش سطح حمله خطای زیادی دارد. با این حال، حمله به هم زدن اطلاعات ویژگی نقطه مکانی را تغییر نمی دهد، بنابراین مقادیر RF 100 ٪ است. اگرچه ترتیب بین ویژگی‌ها تغییر می‌کند، موقعیت رأس هر ویژگی بدون تغییر باقی می‌ماند، بنابراین مقادیر F ، A و C در نتایج همه صحیح هستند. به طور کلی، الگوریتم پیشنهادی حساسیت بالایی به ویژگی‌های حملات درهم‌سازی سفارش دارد.
4.2.5. حمله ساده سازی ویژگی
ما از الگوریتم داگلاس-پیکر برای ساده کردن داده ها استفاده کردیم و سه محدوده آستانه متفاوت در این آزمایش برای حمله به داده ها تنظیم شد. مقایسه بین انواع مختلف داده و داده های اصلی پس از حمله ساده سازی ویژگی در شکل 17 نشان داده شده است . حمله ساده سازی ویژگی، تعداد معینی از رئوس را از داده ها حذف می کند، شکل ویژگی های خط و ویژگی های چند ضلعی تغییر می کند و زاویه گنجانده شده بین ویژگی های محاسبه شده بر اساس مختصات راس نیز تغییر می کند. در نتیجه، مقادیر F و A در نتایج تشخیص داده های بردار خط و چند ضلعی به تدریج با افزایش سطح حمله ساده سازی کاهش می یابد، همانطور که در نشان داده شده است.جدول 6 . مختصات رأس باقی مانده پس از اینکه داده ها در معرض حمله ساده سازی ویژگی قرار گرفتند، همچنان به مختصات راس در داده های اصلی تعلق دارند. بنابراین، می‌توانیم از مقدار C برای نشان دادن نرخ تکرار داده‌هایی که باید شناسایی شوند و داده‌های اصلی در حمله ساده‌سازی ویژگی استفاده کنیم. در مطالعه قبلی، میزان خطای استخراج واترمارک توسط سطح حمله ساده سازی 20 درصدی بر روی داده ها 3.26 درصد و نرخ خطای استخراج واترمارک با سطح حمله ساده سازی 30 درصدی روی داده ها 6.43 درصد بود [ 12 ]. همانطور که از جدول 6 مشاهده می شوددر نتایج تشخیص الگوریتم در این مقاله، خطای نتیجه تشخیص 3.366٪ است که سطح حمله ساده سازی 44.3٪ باشد. خطای نتیجه تشخیص 4.476٪ است وقتی سطح حمله ساده سازی 57.2٪ باشد. از این رو، می توان دید که الگوریتم پیشنهادی در این مقاله هنوز توانایی تشخیص خوبی در مورد حمله ساده سازی درجه بالاتری در مقایسه با الگوریتم واترمارک دیجیتال در ادبیات دارد [ 12 ].
4.2.6. حمله ترکیبی
به منظور ارزیابی بیشتر استحکام الگوریتم پیشنهادی، آزمایش حمله ترکیبی بر روی داده‌های آزمون انجام شد. حمله ترکیبی برای داده های برداری نقطه ای شامل شش حمله به شرح زیر است:
  • درون یابی 20 درصد از ویژگی ها
  • حذف 60 درصد از ویژگی ها
  • ترجمه 20 درصد از ویژگی ها به سمت راست در فاصله 20 کیلومتری
  • چرخش 20 درصد از ویژگی ها 50 درجه
  • بزرگنمایی 20 درصد از ویژگی ها دو برابر
  • به هم زدن 20 درصد از ویژگی ها
حمله ترکیبی برای داده های برداری خط و چند ضلعی علاوه بر شش حمله فوق، یک حمله ساده سازی با آستانه 10 متر انجام داد. مقایسه بین انواع مختلف داده و داده های اصلی پس از حمله ترکیبی در شکل 18 نشان داده شده است . نتایج تجربی حمله ترکیبی در جدول 7 نشان داده شده است. پس از اصلاح گسترده داده‌های تجربی، برای داده‌های بردار نقطه، الگوریتم همچنان می‌تواند تشخیص دهد که 57.827٪ ( RF ) از ویژگی‌های نقطه‌ای از داده‌های مورد حمله از داده‌های نقطه اصلی و 41.099٪ ( R A) روابط فضایی نسبی ویژگی های نقطه با داده های اصلی سازگار است. برای داده‌های بردار خط، داده‌های آزمایشی نوع خط در این حمله تا حد زیادی از بین می‌رود، همانطور که در شکل 18 ب مشاهده می‌شود، اما الگوریتم همچنان می‌تواند 12.920٪ ( F ) از ویژگی‌های خط، 9.604٪ ( A ) از ویژگی‌های خط را شناسایی کند. زوایای گنجانده شده بین ویژگی‌ها و 27.815% ( C ) از موقعیت‌های راس ویژگی خط داده‌های پس از حمله از داده‌های اصلی می‌آیند. در مجموع، 48.224٪ ( F ) از ویژگی های چند ضلعی و 33.871٪ ( C )) از رئوس چند ضلعی در داده های مورد حمله مشابه داده های اصلی است، و روابط فضایی نسبی در 36.552٪ ( A ) از ویژگی های چند ضلعی در داده های برداری چند ضلعی تغییر نمی کند.

5. بحث

ما تحقیق را در این مقاله از چهار جنبه زیر مورد بحث قرار می دهیم:
(1)
امکان سنجی نرخ تکرار در تشخیص نقض: سرقت ادبی نقض قوانین کپی رایت اکثر کشورها است، اما تعریف سرقت ادبی باید دو معیار را در چین رعایت کند. یکی این که آیا سرقت ادبی توسط کپی رایت محافظت می شود یا خیر، و دیگری اینکه آیا استفاده از آثار دیگران توسط دزدان ادبی خارج از محدوده «استنادهای مناسب» است یا خیر. مقررات حفاظت از کتاب در چین به وضوح تعریف می کند که دامنه مقادیر «استنادهای مناسب» یک دهم آثار استناد شده است، و زمانی که از این محدوده فراتر رود، تخلف محسوب می شود. مشابه این واقعیت است که میزان تکرار در مقالات دانشگاهی نباید از یک استاندارد خاص تجاوز کند. بنابراین، ما معتقدیم که نرخ تکرار می تواند به عنوان یک شاخص قضاوت نقض استفاده شود. با این حال،
(2)
تجزیه و تحلیل مشکلات در روش ها و آزمایشات در این مقاله: (1) مشکل کاردینالیته ویژگی. برای دو داده برداری A و B، داده A شامل 80 ویژگی و داده B شامل 50 ویژگی است. اگر داده B مشکوک به نقض باشد، و 40 ویژگی در داده B از داده A مشتق شده باشد، 50 باید به عنوان اصلی در محاسبه نرخ تکرار داده B نسبت به داده A در نظر گرفته شود و نرخ تکرار 80 است. درصد به جای 50 درصد. از این رو، تعداد ویژگی‌های داده‌های برداری با حجم داده کمتر، همیشه به عنوان اصلی در فرآیند محاسبه نرخ تکرار دو مجموعه داده برداری در این مقاله در نظر گرفته می‌شود. (2) مشکل حمله مرکب. در طراحی آزمایشی، به منظور بررسی بیشتر اثربخشی الگوریتم، یک حمله ترکیبی پیچیده بر روی داده‌های آزمایشی انجام شد. اگرچه نرخ تکرار در نتیجه تشخیص کمتر از سایر روش‌های حمله بود، توزیع فضایی داده‌ها پس از حمله ترکیبی با داده‌های اصلی فاصله داشت و ارزش کاربردی عملی و ارزش حفاظت از حق چاپ از بین رفت. (3) مشکل شاخص نرخ تکرار. نتایج الگوریتم در این مقاله یک مقدار نرخ تکرار عمومی ساده نیست، بلکه دارای سه شاخص است:F ، A ، و C. این سه شاخص میزان تکرار داده‌ها را از سه جنبه ویژگی‌های ویژگی، شامل ویژگی‌های زاویه، و ویژگی‌های راس داده‌های برداری اندازه‌گیری می‌کنند، که می‌توانند به طور مؤثرتری در برابر انواع مختلف حملات مقاومت کنند و میزان تکراری بودن بین داده‌های مورد شناسایی و ارزیابی را ارزیابی کنند. داده های اصلی به صورت علمی تر
(3)
مزایای روش پیشنهادی: (1) در مقایسه با الگوریتم واترمارک دیجیتال موجود، روش پیشنهادی در این مقاله ساده و قابل درک است. هیچ محاسبه ریاضی پیچیده ای وجود ندارد و اجرای آن آسان است. (2) در آزمایش، الگوریتم پیشنهادی برای حداقل 0.459 ثانیه اجرا می شود و طولانی ترین زمان 36.244 ثانیه است. راندمان تشخیص در سطح قابل قبولی است. (3) روش پیشنهادی در این مقاله برای هر سه نوع داده برداری قابل اجرا است، که برای اکثر الگوریتم‌های واترمارکینگ صفر صادق نیست. (4) الگوریتم پیشنهادی نرخ تکرار داده ها را بر اساس فرمت GeoJSON تشخیص می دهد که از استاندارد OGC پیروی می کند و تطبیق پذیری خوبی دارد. الگوریتم پیشنهادی می تواند به هر نوع داده ای که می تواند به فرمت GeoJSON تبدیل شود گسترش یابد.
(4)
کاربرد عملی: از آنجایی که فرمت GeoJSON توسعه فرمت JSON است، روش پیشنهادی را می توان با استفاده از معماری B/S در یک سیستم اشتراک گذاری داده های جغرافیایی اعمال کرد. به ویژه برای پلتفرم‌های انتشار داده‌های جغرافیایی فعلی (مانند مجله Earth System Science Data) و پلتفرم‌های احتمالی خودانتشار داده‌های جغرافیایی آینده برای جلوگیری و شناسایی تخلفات در فرآیند انتشار داده‌های جغرافیایی مناسب است.
(5)
معایب: الگوریتم تشخیص پیشنهادی نمی تواند دقت بالایی را در تشخیص حمله تبدیل سیستم مختصات حفظ کند که این نقص الگوریتم است و در تحقیقات آتی حل خواهد شد. روش‌های کمی در تحقیق فناوری واترمارک دیجیتال داده‌های برداری وجود دارد که می‌تواند در حال حاضر در برابر همه روش‌های حمله مقاومت کند. روش پیشنهادی در این مقاله را می توان با فناوری واترمارک دیجیتال در کاربردهای عملی ترکیب کرد و از این طریق به مزایای تکمیلی دست یافت. به عنوان مثال، یکی دیگر از الگوریتم های واترمارکینگ دیجیتالی پیشنهاد شده در ادبیات [ 18] می تواند به طور موثر حملات تبدیل سیستم مختصات را شناسایی کند. در نتیجه، هنگام قضاوت در مورد اینکه آیا نقض داده‌های جغرافیایی وجود دارد، روش پیشنهادی ما می‌تواند برای تشخیص اینکه آیا داده‌های جغرافیایی در معرض حمله درون‌یابی، حمله حذف، حمله تبدیل شباهت، حمله درهم‌سازی نظم ویژگی، و حمله ساده‌سازی ویژگی قرار گرفته‌اند یا خیر، استفاده شود. در حالی که الگوریتم واترمارک دیجیتال پیشنهاد شده در ادبیات [ 18 ] می تواند برای تشخیص اینکه آیا داده های جغرافیایی در معرض حمله تبدیل سیستم مختصات قرار گرفته اند یا خیر، استفاده می شود، در نتیجه می توان نقض را به طور جامع ارزیابی کرد.

6. نتیجه گیری

در این مقاله، یک روش جدید تشخیص نقض برای بردار GIS مبتنی بر پایگاه داده بر روی فرمت GeoJSON پیشنهاد شد. ویژگی‌های مکانی داده‌های برداری برای تطبیق ویژگی استفاده شد و رفتار نقض در داده‌های برداری را می‌توان با توجه به نتایج تطبیق تعیین کرد. ما ویژگی‌های فضایی داده‌های برداری را عمیقاً تجزیه و تحلیل کردیم و سه شاخص مختلف از ویژگی‌های ویژگی، شامل ویژگی‌های زاویه و ویژگی‌های رأس را که برای مقاومت در برابر انواع مختلف حملات استفاده می‌شدند، از هم جدا کردیم و میزان تکرار داده‌ها را دقیقاً شناسایی کردیم. فرآیند تشخیص نرخ تکرار برای سه نوع داده برداری با جزئیات شرح داده شد و حملات هندسی مختلف با استفاده از سه نوع مختلف داده برداری برای ارزیابی اثربخشی و استحکام الگوریتم پیشنهادی انجام شد.

منابع

  1. ژو، دبلیو. زو، CQ; Wu, WD مشکل و اقدام متقابل در مورد طبقه بندی مخفی و رمزگشایی اطلاعات ملی جغرافیایی چین. علمی Surv. نقشه 2016 ، 41 ، 76-79. [ Google Scholar ] [ CrossRef ]
  2. Lyu, WQ مطالعه ای در مورد حفاظت از حق نسخه برداری داده های فضایی برداری بر اساس صفر-واترمارک و اثر انگشت دیجیتال. پایان نامه کارشناسی ارشد، دانشگاه لانژو جیائوتنگ، لانژو، چین، 15 مارس 2018. [ Google Scholar ]
  3. یوو، TG; جنینگز، اس وی؛ گراب، جی دبلیو. اسمیت، AW داخل سایت بایگانی داده های زیست محیطی WWW. در سیستم های نرم افزاری محیطی: جلد 2 ; Denzer, R., Swayne, DA, Schimak, G., Eds. Springer: Boston, MA, USA, 1997; صص 168-174. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  4. وانگ، جی ال. زو، YQ; Xie، طراحی و توسعه پلت فرم شبکه CJ برای به اشتراک گذاری داده های علم سیستم زمین. علوم زمین جلو. 2006 ، 54-59. [ Google Scholar ] [ CrossRef ]
  5. Kimball، JS Earth مشاهده تغییرات جهانی: نقش سنجش از راه دور ماهواره ای در نظارت بر محیط جهانی. Eos Trans. صبح. ژئوفیز. Union 2008 , 89 , 294. [ Google Scholar ] [ CrossRef ]
  6. موکنیک، FB؛ لودویگ، سی. گرینبرگر، ا. جیکوبز، سی. کلونر، سی. رایفر، ام. منابع داده مشترک در حوزه جغرافیایی – طرح طبقه بندی و تکنیک های تجسم مربوطه. ISPRS Int. J. Geo-Inf. 2019 ، 8 ، 242. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  7. کائو، ی آر. Lv، GN; وو، PS; او، JB جایگاه ویژگی منابع اطلاعات جغرافیایی در اشتراک اطلاعات جغرافیایی. J. Geo-Inf. علمی 2011 ، 13 ، 611-616. [ Google Scholar ] [ CrossRef ]
  8. Cui، HC تحقیق در مورد امنیت به اشتراک گذاری داده های جغرافیای برداری. دکتری پایان نامه، دانشگاه عادی نانجینگ، نانجینگ، چین، 13 مارس 2013. [ Google Scholar ]
  9. Zhu, CQ Research در واترمارک دیجیتال و کنترل رمزگذاری برای داده های جغرافیایی پیشرفت می کند. Acta Geod. کارتوگر. گناه 2017 ، 46 ، 1609-1619. [ Google Scholar ] [ CrossRef ]
  10. هو، ایکس. حداقل، LQ; یانگ، اچ. یک طرح واترمارک برگشت پذیر برای نقشه های برداری بر اساس اصلاح هیستوگرام چند سطحی. Symmetry 2018 , 10 , 397. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  11. وانگ، NN; Bian، JL; ژانگ، اچ. واترمارک شکننده ثابت RST برای احراز هویت نقشه برداری دوبعدی. بین المللی J. Multimed. مهندس همه جا حاضر 2015 ، 10 ، 155-172. [ Google Scholar ] [ CrossRef ]
  12. طرح واترمارک قوی Gaata، MT برای نقشه های برداری GIS. ابن الحیثم ج. علمی 2018 ، 31 ، 277-284. [ Google Scholar ] [ CrossRef ]
  13. نیمن، SN; سیتوهانگ، بی. Sutisna، S. واترمارک شکننده برگشت پذیر بر اساس گسترش تفاوت با استفاده از فواصل منهتن برای نقشه برداری دوبعدی. Procedia Technol. 2013 ، 11 ، 614-620. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  14. ابوبهیا، ع. Cocea، M. یک رویکرد خوشه‌بندی برای حفاظت از داده‌های برداری GIS. در مجموعه مقالات مهندسی سیستم های اطلاعات پیشرفته، استکهلم، سوئد، 8 تا 12 ژوئن 2015. [ Google Scholar ] [ CrossRef ]
  15. هو، ایکس. حداقل، LQ; الگوریتم واترمارک شکننده Tang، LW برای مکان یابی گروه های موجودیت دستکاری شده در داده های نقشه برداری. Geomat. Inf. علمی دانشگاه ووهان 2019 , 44 . [ Google Scholar ] [ CrossRef ]
  16. جین، YT; وو، جی سی. چن، ایکس. یانگ، XF; Zhou، JW تحقیق در مورد الگوریتم واترمارک برداری بر اساس مکان مختصات. Spacecr. Recovery Remote Sens. 2017 ، 38 ، 98-106. [ Google Scholar ] [ CrossRef ]
  17. هو، ایکس. حداقل، LQ; یانگ، اچ. یک طرح واترمارک شکننده برای داده های نقشه برداری با استفاده از روش بلوک گراتیکول جغرافیایی. جی. کامپیوتر. به دس کمک کرد. محاسبه کنید. نمودار. 2018 ، 30 ، 2042–2048. [ Google Scholar ] [ CrossRef ]
  18. لیانگ، WD; ژانگ، XC; Xi، X. Zhang, PC یک الگوریتم واترمارک چندگانه برای داده های جغرافیایی برداری بر اساس واترمارک صفر و واترمارک شکننده. Acta Sci. نات. دانشگاه Sunyatseni 2018 ، 57 ، 7–14. [ Google Scholar ] [ CrossRef ]
  19. تانگ، دی. زو، CQ; Ren, N. الگوریتم واترمارکینگ با استفاده از مقدار کمی از داده های جغرافیایی برداری. Acta Geod. کارتوگر. گناه 2018 ، 47 ، 1518-1525. [ Google Scholar ] [ CrossRef ]
  20. اوهبوچی، آر. اوئدا، اچ. Endoh, S. واترمارک قوی نقشه های دیجیتال برداری. در مجموعه مقالات کنفرانس بین المللی IEEE در سال 2002 در چند رسانه ای و نمایشگاه، ICME 2002، لوزان، سوئیس، 26-29 اوت 2002. [ Google Scholar ] [ CrossRef ][ Green Version ]
  21. کائو، ال جی. مردان، CG; Ji, RR واترمارکینگ برگشت پذیر مبتنی بر تقلب غیرخطی برای نقشه های برداری دوبعدی. Vis. محاسبه کنید. 2013 ، 29 ، 231-237. [ Google Scholar ] [ CrossRef ]
  22. پنگ، زی. یو، ام ال. وو، ایکس. طرح واترمارک پنگ، YW کور برای چند خطوط در داده‌های جغرافیایی-مکانی برداری. چندتایی. ابزارهای کاربردی 2015 ، 74 ، 11721-11739. [ Google Scholar ] [ CrossRef ]
  23. تانگ، دی. رن، ن. زو، CQ; Lin, W. الگوریتم واترمارکینگ مقاوم در برابر تبدیل طرح ریزی برای داده های جغرافیایی برداری. J. Geo-Inf. علمی 2016 ، 18 ، 1037-1042. [ Google Scholar ] [ CrossRef ]
  24. Yan، HW; ژانگ، LM؛ یانگ، WF یک طرح واترمارکینگ مبتنی بر عادی سازی برای داده های نقشه برداری دوبعدی. علوم زمین آگاه کردن. 2017 ، 10 ، 471-481. [ Google Scholar ] [ CrossRef ]
  25. وانگ، ایکس. هوانگ، دی جی؛ Zhang، ZY یک الگوریتم واترمارک کور مبتنی بر DCT برای نقشه های دیجیتال برداری. Adv. ماتر Res. 2011 ، 179-180 ، 1053-1058. [ Google Scholar ] [ CrossRef ]
  26. نیمن، SN; پرادنیانا، NP; Sitohang, B. حفاظت جدید از حق چاپ برای نقشه برداری با استفاده از واترمارکینگ مبتنی بر FFT. Telkomnika 2014 ، 12 ، 367-378. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  27. ژانگ، LM؛ Yan، HW; Qi، JX; Zhang، YZ یک الگوریتم واترمارک کور برای حفاظت از حق نسخه برداری از داده های مکانی بردار تحت خطاهای قابل کنترل بر اساس DFT. Geomat. Inf. علمی دانشگاه ووهان 2015 ، 40 ، 990-994. [ Google Scholar ] [ CrossRef ]
  28. من، DH; لی، های. ریو، اس جی. لی، HK وکتور واترمارکینگ قوی برای هر دو اعوجاج هندسی جهانی و محلی. فرآیند سیگنال IEEE Lett. 2008 ، 15 ، 789-792. [ Google Scholar ] [ CrossRef ]
  29. وانگ، سی جی. پنگ، زی. پنگ، YW; یو، ال. وانگ، جی.زی. ژائو، QZ واترمارک کردن داده های جغرافیایی در روابط توپولوژیکی فضایی. چندتایی. ابزارهای کاربردی 2012 ، 57 ، 67-89. [ Google Scholar ] [ CrossRef ]
  30. لی، SH; Huo، XJ; روش واترمارک برداری Kwon، KR Vector برای حفاظت از نقشه دیجیتال با استفاده از توزیع طول قوس. IEICE Trans. Inf. سیستم 2014 ، 97 ، 34-42. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  31. ژانگ، سی. لی، AB; Lv، GN; Lin, BX یک الگوریتم آبسازی برگشت پذیر برای نقشه برداری بر اساس تعدیل زاویه. J. Geo-Inf. علمی 2013 ، 15 ، 180-186. [ Google Scholar ] [ CrossRef ]
  32. ابوبهیا، ع. Cocea، M. خوشه بندی پارتیشن برای حفاظت از داده های نقشه GIS. در مجموعه مقالات بیست و ششمین کنفرانس بین المللی IEEE 2014 در مورد ابزارهای با هوش مصنوعی (ICTAI 2014)، لیماسول، قبرس، 10–12 نوامبر 2014. [ Google Scholar ] [ CrossRef ][ Green Version ]
  33. وانگ، ایکس. هوانگ، دی جی؛ Zhang، ZY یک الگوریتم قوی صفر واترمارک برای نقشه های دیجیتال برداری بر اساس ویژگی های آماری. جی. سافتو. 2012 ، 7 ، 2349-2356. [ Google Scholar ] [ CrossRef ]
  34. پنگ، YW; Yue, ML یک طرح واترمارک صفر برای نقشه برداری بر اساس نسبت فاصله راس ویژگی. جی الکتر. محاسبه کنید. مهندس 2015 ، 2015 ، 421529. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  35. کائو، ال جی. مردان، CG; Gao, Y. یک الگوریتم جاسازی بازگشتی به سمت واترمارکینگ نقشه برداری 2 بعدی بدون تلفات. رقم. فرآیند سیگنال 2013 ، 23 ، 912-918. [ Google Scholar ] [ CrossRef ]
  36. Sun، YC; Li, D. نقشه برداری الگوریتم صفر واترمارک بر اساس ویژگی گره. Geogr. Geo-Inf. علمی 2017 ، 33 ، 17-21. [ Google Scholar ] [ CrossRef ]
  37. لیو، WQ; Zhang، LM یک الگوریتم واترمارک صفر مبتنی بر DFT برای داده های جغرافیایی برداری. جی. ژئومات. علمی تکنولوژی 2018 ، 35 ، 94-98. [ Google Scholar ] [ CrossRef ]
  38. فرمت GeoJSON در دسترس آنلاین: https://www.rfc-editor.org/info/rfc7946 (در 12 دسامبر 2019 قابل دسترسی است).
  39. دسترسی به ویژگی های ساده – قسمت 2: گزینه SQL. در دسترس آنلاین: https://www.opengeospatial.org/standards/sfs (در 12 دسامبر 2019 قابل دسترسی است).
شکل 1. داده های برداری نوع نقطه در GeoJSON: ( الف ) داده های برداری نوع نقطه; ( ب ) فرمت GeoJSON داده های برداری از نوع Point.
شکل 2. داده های برداری نوع MultiPoint در GeoJSON: ( الف ) داده های برداری نوع MultiPoint; ( ب ) فرمت GeoJSON داده های برداری از نوع MultiPoint.
شکل 3. داده های برداری نوع LineString در GeoJSON: ( الف ) داده های برداری نوع LineString. ( ب ) فرمت GeoJSON از نوع LineString داده های برداری. ( ج ) جهت ویژگی خط.
شکل 4. داده های برداری نوع MultiLineString در GeoJSON: ( الف ) داده های برداری نوع MultiLineString. ( ب ) قالب GeoJSON از نوع MultiLineString داده های برداری. ( ج ) جهت ویژگی خط و نمایش بصری ساختار داده GeoJSON داده های برداری از نوع MultiLineString.
شکل 5. داده های برداری از نوع چند ضلعی در GeoJSON: ( الف ) داده های برداری از نوع چند ضلعی. ( ب ) قالب GeoJSON داده های برداری از نوع Polygon. ( ج ) ترتیب ذخیره سازی راس داده های نوع چند ضلعی.
شکل 6. داده های برداری از نوع MultiPolygon در GeoJSON: ( الف ) داده های برداری از نوع MultiPolygon; ( ب ) قالب GeoJSON از نوع MultiPolygon داده های برداری. ( ج ) ترتیب ذخیره سازی راس داده های نوع MultiPolygon.
شکل 7. محاسبه زاویه آزیموت زمانی که P در ربع های مختلف باشد.
شکل 8. محاسبه زاویه شامل: ( الف ) نمودار شماتیک پاره خط P و پاره خط L. ب ) هنگامی که موقعیت پاره خط L بین محور y و P باشد (∠PAz > ∠LAz).
شکل 9. محاسبه میانگین مرکز چند ضلعی.
شکل 10. نشانگرهای تشخیص نقطه، خط و چندضلعی: ( الف ) نشانگرهای تشخیص نقطه. ( ب ) نشانگرهای تشخیص خط. ( ج ) نشانگرهای تشخیص چند ضلعی و تغییر مرکز میانگین زمانی که چند ضلعی اصلاح می شود.
شکل 11. مجموعه داده تجربی: ( الف ) نمای کلی. ( ب ) نمایش جزئیات.
شکل 12. فرآیند پیش پردازش داده ها.
شکل 13. مقایسه انواع مختلف داده ها و داده های اصلی پس از حمله درون یابی: ( الف ) داده های برداری نوع نقطه. ( ب ) داده های برداری نوع خط. ( ج ) داده های برداری از نوع چند ضلعی.
شکل 14. مقایسه انواع مختلف داده ها و داده های اصلی پس از حمله حذف: ( الف ) داده های برداری نوع نقطه. ( ب ) داده های برداری نوع خط. ( ج ) داده های برداری از نوع چند ضلعی.
شکل 15. مقایسه انواع مختلف داده ها و داده های اصلی پس از حمله تبدیل شباهت: ( الف ) حمله ترجمه داده های بردار نوع نقطه. ( ب ) حمله چرخشی داده های بردار نوع نقطه. ( ج ) حمله مقیاس‌پذیری داده‌های بردار نوع نقطه. ( د ) حمله ترجمه داده های بردار نوع خط. ( ه ) حمله چرخشی داده های بردار نوع خط. ( f ) حمله مقیاس‌بندی داده‌های بردار نوع خط. ( g ) حمله ترجمه داده های برداری از نوع چند ضلعی. ( h ) حمله چرخشی داده های برداری از نوع چند ضلعی. ( i ) حمله مقیاس‌بندی داده‌های برداری از نوع چندضلعی.
شکل 16. مقایسه انواع مختلف داده ها و داده های اصلی پس از حمله به هم زدن ترتیب ویژگی: ( الف ) داده های برداری نوع نقطه. ( ب ) داده های برداری نوع خط. ( ج ) داده های برداری از نوع چند ضلعی.
شکل 17. مقایسه انواع مختلف داده ها و داده های اصلی پس از حمله ساده سازی ویژگی: ( الف ) داده های برداری نوع خط. ( ب ) داده های برداری از نوع چند ضلعی.
شکل 18. مقایسه انواع مختلف داده ها و داده های اصلی پس از حمله ترکیبی: ( الف ) داده های برداری از نوع نقطه. ( ب ) داده های برداری نوع خط. ( ج ) داده های برداری از نوع چند ضلعی.

بدون دیدگاه

دیدگاهتان را بنویسید