1. مقدمه
به عنوان معیاری برای تشخیص ویژگی های هندسی چند ضلعی، اندازه گیری تشابه شکل به طور گسترده ای برای مطابقت، بازیابی و طبقه بندی چند ضلعی ها استفاده می شود [ 1 ]. محققان تلاش هایی برای بازیابی چند ضلعی های مشابه برای کشف الگوهای توزیع ساختمان [ 2 ] و تطبیق موجودیت های متناظر [ 3 ] برای غنی سازی داده های جغرافیایی و استخراج اطلاعات فضایی پنهان در مجموعه داده های برداری انجام داده اند. بنابراین، محاسبه یک نتیجه اندازهگیری شباهت شکل قابل اعتماد که با قضاوت انسان سازگار باشد، یک مرحله اساسی برای کشف کامل و دقیق اطلاعات مکانی ارزشمند است. برای کار تعمیم نقشه، کامل بودن و دقت نتایج آن به این بستگی دارد که آیا قضاوت شکل مشابه با ادراک بصری سازگار است [ 4 ]]. اندازه گیری تشابه شکل یک فرآیند شناختی پیچیده است که بر دو جنبه تکیه دارد. از یک سو، ما میتوانیم تفاوت چندضلعیها را بهعنوان اجسام در مشاهده در رابطه با ادراک بصری بهطور کیفی تعیین کنیم. از سوی دیگر، تفاوت نواحی، مرزها و ساختارهای تشکیلشده توسط چندضلعیها را میتوان از نظر ریاضی به صورت کمی شناسایی کرد. در رویکردهای موجود، چند ضلعی ها از نظر ریاضی با مجموعه ای از ضرایب یا شاخص ها نشان داده می شوند که برای ترجمه، چرخش و مقیاس ثابت هستند تا اندازه گیری تشابه را برای مقایسه چند ضلعی ها بدست آورند.
از آنجا که ویژگیهای شکل عموماً از خطوط یک چند ضلعی یا روابط فضایی مناطق چند ضلعی مشتق میشوند، روشهای نمایش و توصیف ویژگی را میتوان به روشهای مبتنی بر کانتور، روشهای مبتنی بر یادگیری عمیق و روشهای مبتنی بر ناحیه طبقهبندی کرد [ 5 ، 6 ] . هر دو روش دارای نقاط قوت و ضعف هستند. روشهای مبتنی بر کانتور، یک سری از رئوس شکل اصلی را به یک نمایش عددی تبدیل میکنند، که ویژگیهای هندسی جزئی شکل را حفظ میکند، از خطوط خطوط (یعنی مرزهای چندضلعی) برای توصیف شکل استفاده میکند، و شباهت شکل را با تشخیص تفاوتهای شکل اندازهگیری میکند. جزئیات کانتور محلی [ 7 ]. الگوریتم های محبوب از این نوع شامل روش کد زنجیره ای [ 8 ]، تابع چرخش [9 ، روش دورترین نقطه [ 10 ]، روش طرح معکوس [ 11 ]، روش خط اسکلت [ 12 ]، روش نمودار موقعیت [ 1 ] و مدل سلسله مراتبی [ 3 ]. از آنجایی که روشهای مبتنی بر کانتور بر روابط متقابل بین رئوس تأکید میکنند، مزیت کارآمدی محاسباتی را دارند. با این حال، نویز محلی یک کانتور ساختار توپولوژیکی نمایش شکل حاصل را تحت تأثیر قرار می دهد.
روش مبتنی بر یادگیری عمیق اساساً یادگیری بازنمایی با سطوح مختلف بازنمایی است. روشی را برای تبدیل ورودی بدون ساختار به یک نمایش خروجی ایده آل می آموزد [ 13 ]. یان و همکاران یک مدل رمزگذار خودکار کانولوشن گراف (GCAE) شامل پیچیدگی گراف و معماری رمزگذار خودکار برای تجزیه و تحلیل نمودار مدلسازی شده و درک کدگذاری شکل از طریق یادگیری بدون نظارت [ 6 ] ارائه کرد. اگرچه روش یادگیری عمیق میتواند ویژگیهای محلی و جهانی را به شیوهای سازگار شناختی شناسایی کند، اما روی چند ضلعیهای بدون حفره تمرکز میکند.
روشهای مبتنی بر منطقه یک توصیفگر عددی را به شکل برداری تولید میکنند تا شکل را مشخص کند و محتوای داخلی یک چندضلعی را منعکس کند. روشهای معمولی شامل توصیفکنندههای ویژگی هندسی، گشتاورهای Zernike [ 14 ]، توصیفگرهای مبتنی بر شبکه [ 15 ]، زمینه شکل [ 16 ]، و گشتاورهای ثابت هو [ 17،18،19 ] است .]. نمایش اشکال در روشهای مبتنی بر منطقه بر ویژگیهای آماری معنیدار تمرکز دارد که اطلاعات جهانی شکل و ویژگیهای مورفولوژیکی سوراخهای داخلی اشیاء فضایی را منعکس میکند. با این حال، اتکای شدید به اطلاعات منطقه ناگزیر باعث از بین رفتن جزئیات خطوط می شود. از آنجایی که مطالعات ذکر شده در بالا معمولاً فقط بر یک نوع ویژگی هندسی تمرکز میکنند که بر اساس دیدگاه بازنمایی ریاضی ساخته شده است، گرفتن یک ویژگی شکل کامل از دیدگاه ادراک بصری دشوار است. روشهای موجود هنوز تلاشی برای بیان ویژگیهای شکل از دیدگاه ادراک بصری ندارند. برای بهبود قابلیت اطمینان تجزیه و تحلیل فضایی، در نظر گرفتن اندازهگیری شباهت شکل از دیدگاه ادراک بصری ضروری است.
یک روش انتشار کانتور مبتنی بر ویژگیهای چند مقیاسی و توصیفگرهای زمینه شبکه برای رسیدگی به محدودیتهای روشهای اندازهگیری تشابه شکل موجود پیشنهاد شدهاست. بر اساس سطوح شناختی تعریف شده در روانشناسی گشتالت، ویژگیهای چند مقیاسی از ویژگیهای ریختشناختی در یک دید کلی تا اطلاعات جزئیات محلی در یک دیدگاه محلی نشان داده میشوند [ 20 ]]. نمایش ویژگی چند مقیاسی نسبت به نمایش ویژگی های ریاضی موجود، که فقط ویژگی های کلی را در نظر می گیرد، درجه بالاتری از تبعیض را به همراه دارد. برای مقابله با هر دو ویژگی کانتور و منطقه، ویژگی چند مقیاسی با نگاشت رئوس به شبکه های آماری، ویژگی های داخلی و خارجی را ترکیب می کند. شبکه ها برای انتقال اطلاعات آماری منطقه ای از ویژگی های شکل استفاده می شوند. به عنوان یک واحد اتمی برای خلاصه کردن و شمارش تعداد رئوس موجود در آن عمل می کند. سپس مفهوم “زمینه شبکه” برای ارائه اطلاعات در مورد موقعیت های نسبی رئوس خطوط داخلی و خارجی معرفی می شود. اطلاعات بافت نشاندهنده آرایش فضایی رنگ یا شدتها در یک شطرنجی است که از ماتریسی از سلولهای سازماندهی شده در یک شبکه تشکیل شده است [ 21 ]]. برای اندازهگیری شباهت، اطلاعات بافت حاصل از ویژگیهای چند مقیاسی برای تعیین کمیت تفاوتهای بین چند ضلعیهای مختلف استفاده میشود. بر اساس استفاده از اطلاعات بافت، نتایج شباهت با نتایج شناختی انسان نسبت به تابع چرخشی و توصیفگر فوریه همخوانی بیشتری دارد.
بقیه مقاله به شرح زیر سازماندهی شده است: در بخش 2 ، الگوریتم مورد استفاده برای استخراج ویژگی کانتور بر اساس ترکیب یک ویژگی آماری چند مقیاسی با اطلاعات زمینه شبکه معرفی شده است. در ادامه، رویکردی برای مقایسه ویژگیهای کانتور شکل ارائه میشود. دقت و کارایی روش ما برای محاسبه شباهت شکل با استفاده از مرزهای برداری مجموعه داده طبیعی زمین و ردپای ساختمان OpenStreetMap (OSM) در بخش 3 آزمایش و تحلیل شده است. مقایسه عملکرد روشهای رایج و محدودیتهای مقایسه متقابل شباهت در بخش 4 مورد بحث قرار گرفته است . در نهایت، نتیجه گیری ها و جهت گیری های تحقیقات آتی در بخش 5 خلاصه می شود.
2. روش شناسی
روش اندازه گیری انتشار کانتور را می توان به دو لایه تقسیم کرد ( شکل 1 ). در لایه اول، ویژگی کانتور استخراج شده و در یک شبکه آماری چند مقیاسی نمایش داده می شود. برای متراکم کردن ویژگی زمینه شبکه آماری، یک توصیفگر زمینه شبکه طراحی شده است تا ویژگی خطوط منطقه ای را از سلول های مجاور به مرکز هسته کانولوشن منتشر کند. در لایه دوم، ویژگی بافت متراکم با روش تحلیل بافت بیان میشود که با شناخت انسان مطابقت دارد. تشابه شکل چند ضلعی ها سپس با مقایسه ویژگی های بافت به دست می آید.
2.1. گردش کار اندازهگیری تشابه شکل
ایده اصلی نمایش ویژگی شکل، نگاشت اطلاعات ساختاری خطوط خارجی و داخلی به سه شبکه آماری با وضوح های مختلف است.
2.1.1. تولید ویژگی های آماری چند مقیاسی
رویکردهای مبتنی بر ناحیه میتوانند هم خطوط خارجی و هم داخلی چندضلعیها را بر اساس یک سری نقاط درونیابی نمونهبرداری شده از خطوط داخلی یا خارجی روی اشیاء نشان دهند [ 15 ]. در رویکرد خود، ما یک رویکرد نمایش چند مقیاسی برای ترکیب کانتور با ویژگیهای منطقهای پیشنهاد کردیم. اطلاعات ساختاری کانتور به شبکه آماری برای دستیابی به یک ویژگی شکل فشرده نگاشت شد. مشابه رویکرد نمایش ویژگی مبتنی بر شبکه، رویکرد نمایش چند مقیاسی نسبت به چرخش، ترجمه و مقیاسبندی ثابت است.
برای حفظ تغییر ناپذیری چرخش، محور اصلی یک چند ضلعی تعیین شد و به موازات محور x چرخانده شد تا ویژگیهای جهتگیری ثابت را تضمین کند. محور اصلی به عنوان خطی تعریف شد که دو راس دورترین را به هم می پیوندد. بر اساس این فرض که θزاویه بین جهت اصلی چند ضلعی و محور x است، مختصات راس پس از چرخش را می توان به دست آورد:
جایی که ایکسمنو yمنمختصات راس i چندضلعی هستند و ایکسمنآرو yمنآرمختصات چرخشی هستند. محور اصلی چند ضلعی چرخانده شده است اسآرموازی با محور x است ( شکل 2 ).
برای حفظ تغییر ناپذیری ترجمه، مختصات رأس چند ضلعی نرمال می شوند. مختصات همه رئوس چند ضلعی از مختصات مرکز چندضلعی کم شد. برای حفظ عدم تغییر مقیاس، طول یک شبکه آماری مطابق با طول محور اصلی یک چندضلعی معین تنظیم میشود ( شکل 3 ج).
تعیین موقعیت نسبی بین مرکز شبکه آماری و مختصات رئوس چندضلعی ضروری است. مرکز یک چند ضلعی به عنوان مرکز پایدار یک شبکه آماری برای اطمینان از سازگاری نمایش ویژگی کانتور استفاده می شود. کانتور خارجی چند ضلعی به عنوان تنها پایه برای تعیین مرکز شبکه آماری استفاده شد. از آنجایی که جعبه مرزی یک چند ضلعی در یک جهت ثابت منحصر به فرد است، مرکز جعبه مرزی به عنوان مرکز شبکه شناخته می شود. پس از آن، جهت گیری شبکه آماری باید مشخص شود. از آنجایی که دورترین نقاط ویژگی های پایداری هستند که تحت تأثیر نویز کانتور قرار نمی گیرند، جهت اصلی یک چند ضلعی جهت گیری شبکه آماری در نظر گرفته می شود [ 10 ]]. مرحله آخر شناسایی طول لبه شبکه آماری است. برای تعادل بین پوشش شبکه و افزونگی اطلاعات، عرض و طول شبکه آماری به عنوان فاصله بین دورترین نقاط رئوس تنظیم می شود ( شکل 3 ج). با در نظر گرفتن تقارن محوری چند ضلعی، یک شبکه مربع شکل طراحی شده است ( شکل 3 د).
از آنجایی که فاصله بین رئوس مجاور بزرگتر از اندازه سلول شبکه است، رئوس پیش بینی شده در شبکه آماری باعث از بین رفتن اطلاعات لبه خطوط داخلی و خارجی می شود. کمی کردن اطلاعات خطوط ساختاری، مانند طول لبه ها و انحنا، بر اساس رئوس پراکنده در شبکه آماری دشوار است. بنابراین، تعداد معینی از نقاط درون یابی در فواصل مساوی بین رئوس کانتور برای حفظ اطلاعات راس و لبه درج شد. طول لبه ها و انحنای به ترتیب با تعداد نقاط درونیابی و چگالی رئوس نشان داده می شود. نقاط درون یابی به هر لبه با توجه به نسبت طول هر لبه به محیط، همانطور که در رابطه (2) تعریف شده است، اختصاص داده شد.شکل 4 الف).
جایی که سآمترپلهپoمنnتیمنتعداد نقاط نمونه در لبه i- امین چندضلعی است. منnتیهrپoلآتیهپoمنnتیتعداد درونیابی هایی است که تنظیم شده است. لهngتیساعتمنطول لبه i چند ضلعی است. ارائه ویژگی های کافی برای پشتیبانی از شباهت شکل بر اساس ادراک انسان، یک شبکه تک رزولوشن دشوار است. بر اساس روانشناسی گشتالت، که فرآیند شناخت انسان را به صورت پالایش تدریجی از مقیاس جهانی به محلی بیان می کند، می توان استنباط کرد که نمایش ویژگی یک شکل نیز شامل سطوح پالایش چندگانه ویژگی ها از مقیاس جهانی به محلی است.
برای تولید یک ویژگی آماری چند مقیاسی که با تشخیص انسان سازگار است، سه شبکه آماری با وضوحهای مختلف ساخته شد. شبکه های آماری با وضوح های مختلف می توانند سطوح مختلفی از جزئیات را در مورد خطوط در مقیاس های مختلف نشان دهند. یک شبکه با وضوح بالا می تواند اطلاعات محلی کانتور مانند انحنا، تقعر و تحدب را به دست آورد. شبکه های با وضوح متوسط اطلاعات درشت تری مانند اسکلت شکل و کانتور تقریبی ارائه می دهند که ویژگی های ظریف لبه ها را از بین می برد. یک شبکه با وضوح پایین ویژگی های شکل جهانی مانند کشیدگی و مستطیل بودن را رمزگذاری می کند. در زمینه پردازش تصویر، هرم تصویر نوعی رویکرد نمایش محتوای چند مقیاسی است. هر سطح از هرم تصویر با نمونه برداری فرعی سطح قبلی با ضریب دو در هر بعد تولید می شود. اگرچه تداوم خوبی بین وضوحهای مجاور با ضریب دو وجود دارد، اما نمیتواند تفاوتهای بین سطوح مختلف ویژگیها را منعکس کند. بنابراین، برای مبادله بین تداوم و استقلال، یک شبکه آماری چند مقیاسی با نمونهگیری فرعی با ضریب سه در امتداد هر جهت مختصات ایجاد شد. در این مقاله، شبکههای با وضوح بالا، متوسط و کم به ترتیب 81 × 81، 27 × 27 و 9 × 9 تعریف شدند. یک شبکه آماری چند مقیاسی با نمونه گیری فرعی با ضریب سه در امتداد هر جهت مختصات ایجاد شد. در این مقاله، شبکههای با وضوح بالا، متوسط و کم به ترتیب 81 × 81، 27 × 27 و 9 × 9 تعریف شدند. یک شبکه آماری چند مقیاسی با نمونه گیری فرعی با ضریب سه در امتداد هر جهت مختصات ایجاد شد. در این مقاله، شبکههای با وضوح بالا، متوسط و کم به ترتیب 81 × 81، 27 × 27 و 9 × 9 تعریف شدند.
2.1.2. استخراج اطلاعات زمینه شبکه
شکل با مجموعه ای از رئوس و نقاط درونیابی نشان داده می شود. بلنگی و همکاران یک توصیفگر شکل محلی به نام شکل زمینه [ 16]. زمینه شکل، در یک نقطه، توزیع نقاط مجاور را و موقعیت نسبی دیگر نقاط شکل را توصیف می کند. اگرچه توصیفکننده بافت شکل موجود، موقعیتهای نسبی نقاط درونیابی را در نظر میگیرد، اطلاعات مهم در مورد ویژگیهای مورفولوژیکی منطقهای، مانند کشیدگی و انحنا، حفظ نشده است. از آنجایی که نقاط درونیابی در سلول یک شبکه آماری با اطلاعات زمینه مشابه نگاشت می شوند، سلول ها به عنوان پراکسی نقاط نمونه گیری برای استخراج اطلاعات زمینه به طور موثر در نظر گرفته می شوند. در همین حال، آرایش سلول ها در شبکه آماری نشان دهنده موقعیت نسبی نقاط نمونه برداری از کانتور است. این آرایش با جهت و فاصله نسبی بین سلول و سلول های همسایه منعکس می شود.
زمینه شبکه، که آرایش درشت بقیه شکل را با توجه به سلول ثبت میکند، به نمایشی کارآمد از موقعیتهای نسبی نقاط درونیابی کانتور اشاره دارد. ترتیب نقاط درونیابی کانتور اطلاعات محلی را با جزئیات به تصویر می کشد. با این حال، اطلاعات زمینه شبکه سلول های مجاور آنقدر کوچک است که اطلاعات بافت جزئی اضافی است ( شکل 5 ). بنابراین، یک توصیفگر ویژگی زمینه شبکه برای رمزگذاری توزیع محلی نقاط کانتور پیشنهاد شده است.
اولین گام در به دست آوردن اطلاعات زمینه سلول ها، شناسایی محدوده زمینه شبکه است. برای مبادله بین کارایی استخراج ویژگی زمینه و کامل بودن اطلاعات زمینه، محدوده مشخصی برای یک الگوی کشویی با وضوح 5 در شبکه آماری تعیین شد. در مرحله دوم، دنباله ای از ویژگی های زمینه هر سلول با استفاده از الگو برای عبور از شبکه آماری و مقدار رکورد شبکه مربوط به الگو به دست آمد. در نهایت، توصیف زمینه شکل هر سلول نمونه تولید شد. با این حال، دنباله ای از ویژگی های بافت پراکنده نمی تواند ساختار جهانی شکل را منعکس کند. علاوه بر این، مقایسه مستقیم اطلاعات زمینه شبکه پراکنده دشوار است. از این رو،
بر اساس ایده پیچیدگی در پردازش تصویر، یک ماتریس پراکنده که اطلاعات زمینه را منعکس میکند، میتواند به شکل متراکم فشرده شود. وزن هسته کانولوشن جهت گیری نسبی بالقوه و فاصله هر عنصر در قالب مستطیلی را تا سلول مرکزی هسته کانولوشن منعکس می کند. بنابراین، طراحی هسته کانولوشن میزان مشارکت سلولهای مجاور را در زمینه شبکه تعیین میکند. این ویژگی ها اطلاعات زمینه مهمی را ذخیره می کنند که پردازش و مقایسه آسان تر است. برای اطمینان از اینکه ویژگی ترکیبی زمینه شبکه شبکههای آماری با وضوحهای مختلف، سازگاری اطلاعات جزئیات مربوطه را حفظ میکند، ابعاد هسته کانولوشن باید با توجه به اندازه شبکه آماری تنظیم شود.
جایی که دمنفاصله بین سلول i و مرکز هسته و استwمنمقدار وزن تعمیم یافته سلول i در یک هسته کانولوشن است. N تعداد کل سلول های یک هسته است. برای حفظ اطلاعات زمینه در محاسبه کانولوشن و حذف تأثیر سلول مرکزی، مقدار سلول مرکزی هسته روی 0 تنظیم شده است ( شکل 6 a). برای جلوگیری از کوچک شدن شبکه آماری پس از محاسبه کانولوشن، دو ردیف سلول شبکه با مقدار آماری 0 در انتهای بالایی و پایینی شبکه آماری بالشتک شدند. پس از آن، دو ستون از سلول های شبکه با مقدار آماری 0 در سمت چپ و راست قرار گرفتند.
برخلاف فیلترهای کانولوشن سنتی، مانند عملگرهای Sobel و Canny، هسته پیچیدگی IDW برای غنیسازی ویژگیهای لبه به جای سادهسازی اطلاعات لبه طراحی شده است. بر اساس نوار رنگ مربوطه ( شکل 6 e)، غنای ویژگی لبه را می توان پس از پیچش مشاهده کرد. رنگ روشن نشان دهنده اطلاعات تقویت شده در مورد رئوس شکل است. پس از پیچیدگی، اطلاعات بافت شبکه پراکنده و اضافی به اطلاعات بافت متراکم شد، که نشان دهنده یک الگوی بصری متمایز است. بنابراین، میتوانیم از روشهای تحلیل ویژگیهای بافت کارآمدتر برای مقایسه ویژگیهای شکل استفاده کنیم.
2.2. محاسبه شباهت
جولز و همکاران پیشنهاد کرد که انسانها از زمینههای بافت به عنوان تمایز بینایی استفاده کنند [ 22 ]. برای به دست آوردن نتایج محاسبه شباهت شکل که با ادراک انسان سازگار است، از اطلاعات بافت برای تشخیص تفاوت بین شبکه آماری چندضلعی ها در این بخش استفاده شد. بر اساس نتایج نمایش شکل شبکه های چند مقیاسی، یک توصیفگر بافت برای ساخت تانسور ویژگی در بخش 2.2.1 معرفی شد. پس از آن، ضرایب همبستگی بین هر دو تانسور مشخصه برای اندازه گیری شباهت شکل دو چند ضلعی در بخش 2.2.2 محاسبه شد.
2.2.1. استخراج ویژگی های بافت چند مقیاسی
اطلاعات بافت منعکس شده توسط اطلاعات زمینه شبکه متراکم می تواند برای تمایز اشکال مختلف استفاده شود. محققان روش های آماری، طیفی و مبتنی بر ساختار را برای اندازه گیری تفاوت بین ویژگی های بافت تصاویر و استخراج اطلاعات بافت پیشنهاد کرده اند. از آنجایی که روشهای مبتنی بر ساختار مستعد چرخش و مقیاسبندی شبکه آماری هستند، ماتریس هموقوع سطح خاکستری (GLCM)، یک روش مبتنی بر آمار، را برای استخراج ویژگیهای بافت با تغییرناپذیری چرخش و پیچیدگی محاسباتی کم انتخاب کردیم.
GLCM به عنوان ماتریس توزیع همزمان یک جفت مقادیر پیکسل در یک افست معین، که فاصله پیکسل d در یک جهت خاص است، تعریف می شود.θ. به طور کلی، جهت θروی 0 درجه، 45 درجه، 90 درجه و 135 درجه تنظیم شده است. از آنجایی که استفاده از فاصله پیکسلی زیاد با یک بافت ظریف، GLCM را به دست میآورد که اطلاعات بافت دقیق را نمیگیرد، فاصله پیکسل d معمولاً روی 1 تنظیم میشود.
تعداد سطوح خاکستری یک عامل مهم در محاسبه GLCM است زیرا پیچیدگی محاسباتی روش GLCM به تعداد سطوح خاکستری بسیار حساس است [ 23 ]. اگرچه سطوح بیشتر اطلاعات بافت استخراجشده دقیقتری را به دست میدهد، پراکندگی بالای GLCM باعث افزایش هزینههای محاسباتی میشود. با این حال، کاهش سطح خاکستری برای کاهش پراکندگی منجر به از بین رفتن اطلاعات وابستگی مکانی می شود. در این مقاله، برای حفظ تعادل بین دقت و کارایی، تعداد سطوح خاکستری n پس از مجموعهای از تستها روی 10 تنظیم شد.
اگرچه هارالیک و همکاران. 13 آمار را برای استخراج ویژگی های بافت از GLCM برای تمایز الگوهای بافت مختلف معرفی کرد [ 24 ]، Ulaby و همکاران. گزارش داد که تنها چهار ویژگی (کنتراست، لحظه اختلاف معکوس، همبستگی و مجموع مربعات) در داده های سنجش از دور مستقل از یکدیگر هستند [ 25 ]. بر اساس این تجزیه و تحلیل تفکیک پذیری آماری، گادکاری ویژگی های لحظه دوم زاویه (ASM) و آنتروپی را به عنوان دو ویژگی بافت مناسب برای آزمایش طبقه بندی تصویر انتخاب کرد. 26 ]]. از آنجایی که مجموع مربع ها به شدت با لحظه دوم زاویه همبستگی دارد، در نهایت پنج آمار (کنتراست، لحظه اختلاف معکوس، همبستگی، لحظه دوم زاویه و آنتروپی) را برای تعیین ویژگی های بافت انتخاب کردیم.
کنتراست (CON) وضوح بافت را منعکس می کند و تعداد تغییرات محلی را اندازه می گیرد. گشتاور اختلاف معکوس (IDM) برای اندازه گیری تغییرات محلی و یکنواختی بافت استفاده شد. همبستگی (COR) شباهت عناصر GLCM در یک ردیف یا ستون را اندازه گیری می کند. مقدار COR شدت همبستگی مقیاس خاکستری محلی را در یک جهت خاص منعکس می کند. ASM اندازه گیری یکنواختی سطح خاکستری بافت است. آنتروپی (ENT) بی نظمی یا پیچیدگی بافت را اندازه گیری می کند.
اگرچه توصیف شهودی بافت با روش مبتنی بر آمار آسان است، اما اطلاعات استخراج شده همچنان از این محدودیت رنج می برد که حاوی اطلاعات ساختاری در مورد جهت گیری گرادیان پیکسل ها نیست [ 27 ].]. بنابراین، ویژگی های بافت محاسبه شده در مقیاس جهانی، قابلیت تشخیص شکل کافی را ندارند. از آنجایی که جهت دورترین نقاط چند ضلعی موازی با ضلع شبکه آماری است، اطلاعات ساختاری به طور قابل توجهی با افزایش اندازه مناطق فرعی نمونه گیری در جهت مورب تغییر می کند. برای غنیسازی اطلاعات ساختاری، زیرمنطقههای نمونهگیری مستطیلی در جهت مورب تنظیم میشوند. بنابراین، تانسورهای ویژگی بافت چند مقیاسی می توانند اطلاعات ساختار بافت را برای چهار جهت از بیرون به داخل منعکس کنند. علاوه بر این، زیرمنطقههای نمونهبرداری با وضوح چندگانه برای ارائه ویژگیهای بافت محلی و جهانی برای بهبود قابلیت تشخیص ویژگی بافت چند مقیاسی ساخته شدهاند.
برای حفظ جزئیات بافت محلی و جهانی در سه شبکه آماری با وضوح های مختلف، زیرمنطقه های نمونه برای اندازه های مختلف طراحی شدند [ 28 ]. مناطق فرعی نمونهبرداری شده در مقیاسهای چندگانه میتوانند عملکرد تشخیص را افزایش دهند، اما مقدار اطلاعات اضافی نیز بر اساس شباهت زیاد ویژگیهای بافت مقیاسهای مجاور افزایش مییابد. برای متعادل کردن اطلاعات و کاهش مقدار دادههای اضافی، اندازههای نمونهگیری برای سه شبکه آماری با وضوحهای مختلف را در چهار مقیاس متفاوت از قابهای نمونهبرداری بافت قرار دادیم.
سپس تانسور ویژگی بافت چند مقیاسی برای اطلاعات زمینه شبکه متراکم تولید شده توسط چهار ناحیه نمونه برداری در هر جهت مورب (A، B، C، و D) ساخته شد ( شکل 7 a). چهار زیرمنطقه نمونه برداری در مقیاس های همسان ( شکل 7 ب). ویژگی های بافت GLCM در هر جهت بر اساس زیرمنطقه های نمونه گیری از شبکه آماری انتخاب شده در بالا محاسبه شد ( شکل 7 ج). در نهایت، بر اساس شبکه های آماری سه وضوح، یک تانسور ویژگی بافت چند مقیاسی با پنج بعد (3 وضوح شبکه × 4 جهت مورب × 4 منطقه نمونه × 4 جهت بافت × 5 توصیف کننده بافت) ساخته شد.
2.2.2. محاسبه تشابه شکل
به عنوان یک شاخص مؤثر که منعکس کننده سازگاری روند متغیرهای وابسته با متغیرهای مستقل متغیر است، از ضریب همبستگی پیرسون برای اندازهگیری شباهت بین دو سری از تانسورهای ویژگی بافت استفاده شد. برای حذف مقایسههای مکرر تانسورهای ویژگی از زیرمنطقههای نمونهبرداری با اندازه یکسان، چهار ماتریس ویژگی بافت (4 × 5) از جهتهای بافت مختلف روی هم قرار گرفتند و در یک ماتریس ویژگی توسعهیافته (16 × 5) ترکیب شدند. مقایسه تانسورهای ویژگی را می توان به سه مرحله تقسیم کرد. در مرحله اول، ضریب همبستگی بین توصیفکننده بافت متناظر دو ماتریس ویژگی توسعهیافته محاسبه میشود. در مرحله دوم، اطلاعات بافت زیرمنطقههای نمونهگیری با چهار اندازه مختلف مقایسه میشود. در مرحله سوم، اطلاعات بافت سه شبکه آماری مقایسه شده است. بر اساس ساختار تانسور بافت چند مقیاسی، میانگین ضریب همبستگی ویژگیهای بافت به ترتیب پایین به بالا محاسبه میشود. معادله محاسبه شباهت برای مقایسه دو تانسور ویژگی بافت S و Q به شرح زیر است:
جایی که اسکو سکاطلاعات زمینه شبکه شبکه آماری را در وضوح k -ام دو شکل نشان می دهد. در تانسور مشخصه، تیهnسorاسکمن،ji- امین ویژگی بافت در j است نمونه گیریپارامتر M روی 3 تنظیم شده است.
همانطور که در بخش 2.1.1 ذکر شد ، ویژگی های کانتور خارجی چند ضلعی های مقایسه شده را می توان بر اساس چرخش چند ضلعی تعیین شده توسط جهت اصلی کانتور خارجی تراز کرد. با این حال، برای چند ضلعی های سوراخ دار، هم ترازی کانتور داخلی به اندازه تراز کانتور خارجی مهم است. به عنوان مثال، در چند ضلعی های دو سوراخه با خطوط خارجی یکسان اما خطوط داخلی متفاوت، خط داخلی در موقعیت مربوطه قرار ندارد ( شکل 8).، گرچه جهت های اصلی دو چند ضلعی چرخانده شده اند. بنابراین، شباهت شکل محاسبه شده نادرست است. برای از بین بردن ناسازگاری در مورد موقعیت ویژگی، شبکه آماری را با چرخش 90 درجه در جهت عقربه های ساعت در اطراف مرکز شبکه آماری تنظیم کردیم. متعاقباً، تبدیلهای متقارن شبکههای آماری چرخشی را انجام و ثبت کردیم. برای به دست آوردن هشت شبکه آماری، هشت تانسور ویژگی بافت مربوطه را می توان تولید کرد. برای تعیین شباهت، هشت تانسور ویژگی الگوی نمونه بهدستآمده و الگوی مرجع محاسبه شد. حداکثر مقدار در بین هشت نتیجه محاسبه به عنوان شباهت بین دو چند ضلعی استفاده شد.
3. نتایج تجربی
در این بخش، ابتدا حساسیت روش پیشنهادی به تکامل تدریجی یک کانتور چند ضلعی را ارزیابی میکنیم. پس از آن، ما عملکرد محاسبه پیشنهادی شباهت شکل را برای چند ضلعی های سوراخ دار و غیر سوراخ دار تایید می کنیم تا مزایای روش پیشنهادی را نشان دهیم. در نهایت، ما روش خود را با دو روش رایج با استفاده از مجموعه دادههای ردپای ساختمان استاندارد مقایسه میکنیم.
3.1. تست حساسیت به تغییرات کانتور
برای آزمایش حساسیت مدل اندازهگیری شباهت شکل به تغییر کانتور چند ضلعی، ویکتوریا نیانزا (چند ضلعی A) در جنوب آفریقا و کلیسای جامع نیداروس (چند ضلعی B) در نروژ به عنوان دادههای نمونه استفاده شدند. چند ضلعی A مشتق شده از مجموعه داده برداری طبیعی Earth یک چند ضلعی سوراخ دار با 15 سوراخ است، در حالی که چند ضلعی B مشتق شده از مجموعه داده ردپای ساختمان OSM یک چند ضلعی بدون سوراخ است. برای به دست آوردن مجموعه ای از چند ضلعی های تعمیم یافته با سطوح مختلف جزئیات، از الگوریتم وانگ-مولر برای ساده سازی خطوط با حذف خمیدگی های ناچیز استفاده شد [ 29 ]. در این مطالعه، از چهار تلورانس برای تعیین قطر دایره ای که تقریباً یک خم قابل توجه است، استفاده شد ( شکل 9 ).
حساسیت کمی تغییرات دقیقه بین خطوط چند ضلعی یک معیار موثر برای روش اندازهگیری شباهت شکل است. از منظر دید انسان، ویژگی های مورفولوژی اولیه برای شناسایی انواع مختلف اشکال کافی است. بنابراین، چند ضلعیهای تعمیمیافته عموماً شکلهای مشابهی در نظر گرفته میشوند، در حالی که تفاوتهای ظریف بین چند ضلعیهای تعمیمیافته نادیده گرفته میشوند ( شکل 9).). با این حال، در کاربردهای عملی، مانند بازیابی ردپای ساختمان های جهانی، شناسایی تفاوت های ظریف در خطوط، کلید نتیجه گیری است. الگوریتم باید به گونه ای حساس باشد که شباهت محاسبه شده روندی سازگار با تغییر کانتور را نشان دهد. از آنجایی که چند ضلعی های تعمیم یافته از چند ضلعی اصلی مشتق می شوند، ویژگی های مورفولوژی اولیه چند ضلعی های ساده شده حفظ می شوند. تفاوت بین شباهت های ناشی از تغییر کانتور شکل ها باید در محدوده معقولی باشد. بنابراین، حساسیت باید از دو جنبه قوام گرایش و عقلانیت تأیید شود.
برای شناسایی حساسیت روش پیشنهادی، شباهت شکل بین چند ضلعیهای تعمیمیافته محاسبه شد و سازگاری بین تمایل تنوع تشابه و تشدید تلورانس تعیین شد. شباهت شکل بین چند ضلعی های تعمیم یافته چند ضلعی های A و B محاسبه شد، همانطور که در جدول 1 و جدول 2 نشان داده شده است. شباهت بین چند ضلعی اصلی و چندضلعی های تعمیم یافته با افزایش تحمل کاهش می یابد. در مقایسه با چند ضلعی اصلی، چند ضلعی تعمیم یافته ساده تر، جزئیات کمتری را حفظ می کند. با افزایش تفاوت در جزئیات کانتور، شباهت شکل به طور قابل توجهی کاهش می یابد. این نشان می دهد که روش پیشنهادی سازگار است.
علاوه بر سازگاری، عقلانیت شباهت نیز یک عامل مهم برای اعتبارسنجی حساسیت است. شباهت شکل بین دو چند ضلعی تعمیم یافته با تلورانس های مشابه بیشتر از چند ضلعی های تعمیم یافته با تلورانس های بزرگتر است، همانطور که در جدول 1 و جدول 2 نشان داده شده است.. این نشان می دهد که روش اندازه گیری شباهت شکل مستقل از درجه ساده سازی کانتور است. علاوه بر این، شباهت شکل محاسبه شده تنها به تفاوت بین دو طرح چندضلعی بستگی دارد. بنابراین، تفاوت بین شباهت ها در یک محدوده معقول است. برای جمعبندی نتایج ذکر شده در بالا، روش اندازهگیری شباهت به تغییرات کانتور حساس است، به این معنی که تفاوتهای شکل ظریف را میتوان ثبت کرد.
3.2. تست بازیابی چند ضلعی مشابه
برای اعتبارسنجی عملکرد روش پیشنهادی، یک چند ضلعی سوراخدار A و چند ضلعی غیر سوراخدار B از دو سناریو واقعی در مونیخ، آلمان انتخاب شدند ( شکل 10 و شکل 11 ). سپس روش پیشنهادی برای تعیین ردپاهایی با شکل ها و اندازه های مشابه اعمال شد. سناریوی الف، انستیتو ماکس پلانک برای فیزیک در دانشجوی اشتاد فرایمان است. سناریو B Hasenbergl-Lerchenau Ost در Feldmoching-Hasenbergl است که یک بخش در بخش شمالی مونیخ است. ردپای ساختمان این سناریوها از مجموعه داده OSM مشتق شده است. سناریوهای A و B به ترتیب شامل 131 و 1183 ردپای ساختمان هستند ( شکل 11 ).
شناسایی چند ضلعی ها با اشکال مشابه نقش مهمی در کاربردهای GIS ایفا می کند. به عنوان مثال، می توان آن را در تحلیل فضایی الگوهای ساختمان معدن استفاده کرد. بنابراین، یک نتیجه شناخت شکل مشابه دقیق و کامل، مبنایی برای تحلیل فضایی بیشتر است. برای تأیید صحت و کامل بودن نتیجه شناخت و آزمایش عملکرد روشمان، از شاخصهای ارزیابی «دقت» و «یادآوری» استفاده کردیم. در این مطالعه، دقت به عنوان نسبت تعداد چند ضلعی های مشابه مربوط به شناخت انسان به تعداد چند ضلعی های بازیابی شده در نظر گرفته شد. فراخوانی به عنوان نسبت تعداد چند ضلعی های مشابه مربوط به شناخت انسان به تعداد همه چند ضلعی های مربوط به یک سناریو در نظر گرفته شد.
3.3. مقایسه با روش تابع عطف و توصیفگر فوریه
از آنجا که ارزیابی شباهت شکل چند ضلعی ها نسبتاً ذهنی است، شباهت شکل محاسبه شده باید با شناخت انسان مطابقت داشته باشد. بنابراین، محققان به طور کلی با توجه به صحت شناخت انسان تعیین می کنند که آیا یک روش در دسترس است یا خیر. آی و همکاران از 20 مرجع و 6 ردپای ساختمان الگو برای اعتبارسنجی مزایا و معایب توصیفگر فوریه (مدل F) و تابع چرخش (مدل T) استفاده کرد [ 30 ]. هر دو تابع Turning [ 31 ] و توصیفگر فوریه [ 1 ] به طور گسترده در GIS برای محاسبه شباهت شکل چند ضلعی ها استفاده می شوند. بنابراین، ما از همان ردپای ساختمان برای مقایسه روش پیشنهادی در این مقاله با روشهای TF و فوریه استفاده کردیم.
بر اساس الگو و چند ضلعی های مرجع مورد استفاده در مطالعه قبلی، همانطور که در داده های تجربی بالا نشان داده شده است، شباهت بین هر مرجع و ردپای ساختمان الگو با استفاده از روش انتشار کانتور (مدل C) محاسبه شد. همان شکل ماتریس برای شباهت شکل، همانطور که در جدول 3 نشان داده شده است، به دست آمد . در میان 20 ردپای ساختمان مرجع، همه عناصر به درستی شبیه به الگوهایی هستند که با شناخت انسان سازگار هستند. بنابراین، صحت تشخیص روش انتشار کانتور 100٪ است. در مقایسه با صحت روش TF (80%) و روش فوریه (85%)، روش انتشار کانتور بیشتر با شناخت انسان مطابقت دارد.
4. بحث
در این بخش، انتخاب پارامتر بهینه برای روش انتشار کانتور و محدودیتهای این رویکرد اندازهگیری شباهت شکل را مورد بحث قرار میدهیم. روش اندازه گیری شباهت پیشنهادی ممکن است تحت تأثیر عوامل زیر قرار گیرد.
4.1. انتخاب پارامتر بهینه برای روش انتشار کانتور
4.1.1. اندازه الگوی پیچیدگی
بر اساس عملیات پیچیدگی، اطلاعات زمینه شبکه کانتور را می توان از یک شبکه آماری با اندازه های مختلف متراکم کرد. با این حال، یک الگوی کانولوشن خیلی کوچک باعث از بین رفتن اطلاعات زمینه می شود. یک الگوی کانولوشن خیلی بزرگ باعث افزونگی می شود. برای شناسایی اندازه الگوی پیچیدگی بهینه برای اندازههای شبکه آماری مختلف، ابتدا سه اندازه هسته کانولوشن را برای سه شبکه آماری با وضوحهای مختلف ساختیم ( شکل 12 ).
از آنجایی که عناصر وزن هسته با رویکرد وزن فاصله معکوس تعیین می شوند، اندازه بر دامنه تحلیل اطلاعات زمینه و ویژگی شکل نشان داده شده در شبکه آماری مربوطه تأثیر می گذارد. برای شناسایی تأثیر هستههای کانولوشنال مختلف بر ویژگیهای شکل بیانشده توسط شبکههای آماری، از هر هسته کانولوشن برای پیچیدن سه شبکه آماری با اندازههای مختلف استفاده شد. برای تعیین کمیت برجستگی ویژگی های شکل، واریانس به عنوان شاخص ارزیابی انتخاب شد. واریانس هر نتیجه کانولوشن محاسبه و ثبت شد ( شکل 13 ).
اندازه هسته کانولوشن بسیار بزرگ، اکثر سلولهای یک شبکه آماری 9×9 را پوشش میدهد، که منجر به یک ویژگی شکل ضعیف (بدون شناسایی) میشود ( شکل 14 ج). در مقابل، یک اندازه هسته بسیار کوچک باعث می شود که اطلاعات زمینه یک شبکه آماری 81 × 81 صرفاً منعکس کننده ریز دامنه کانتور باشد، بدون توجه به اطلاعات ساختاری شکل ( شکل 14).ز). واریانس شبکه های آماری با وضوح های مختلف با افزایش اندازه هسته کاهش می یابد. واریانس بالا نشان می دهد که مقدار سلول نتیجه کانولوشن به شدت در اطراف میانگین نوسان می کند. ویژگی های شکل نشان داده شده توسط نتایج پیچیدگی هنوز قابل توجه است. واریانس کم نشان میدهد که درجه پراکندگی مقدار سلول نتیجه پیچیدگی کوچک است. ویژگی های شکل نشان داده شده توسط نتایج پیچیدگی قابل توجه نیستند. برای در نظر گرفتن دامنه مناسبی از اهمیت ویژگی زمینه و شکل، IDW5 به عنوان هسته کانولوشن انتخاب شد.
4.1.2. نقاط درون یابی
از آنجا که تعداد نقاط درون یابی بر ویژگی زمینه شبکه متراکم به دست آمده پس از عملیات پیچش تأثیر می گذارد، ما یک تحلیل حساسیت نقاط درون یابی را برای ماتریس انتشار در مقیاس های مختلف انجام دادیم. از آنجا که آنتروپی شانون یک متریک پایه است که با هر متغیر تصادفی مرتبط است، که می تواند به عنوان سطح متوسط ”اطلاعات” و “عدم قطعیت” موجود در متغیر تفسیر شود [ 32 ]]، آنتروپی شانون عناصر ماتریس ویژگی زمینه شبکه متراکم را محاسبه کردیم و از نقاط درون یابی مختلف و آنتروپی اطلاعات متناظر آنها به عنوان دو متغیر برای رسم نمودار خطی استفاده کردیم. نتایج نشان میدهد که آنتروپی شانون با افزایش تعداد نقاط درونیابی زمانی که ماتریس سه مقیاس بهدستآمده توسط الگوهای مختلف به عدد معینی افزایش مییابد، وارد یک حالت نوسان ضعیف میشود. ما فرض می کنیم که تعداد نقاط درون یابی که به حالت پایدار می رسند، تعداد نقاط درونیابی بهینه مقیاس فعلی است ( شکل 15 ).
شکل 15 نشان می دهد که تغییر آنتروپی شبکه های آماری مقیاس کوچک زمانی پایدار است که تعداد نقاط درون یابی حدود 1500 باشد. تغییرات آنتروپی یک شبکه آماری مقیاس متوسط زمانی که تعداد نقاط درون یابی حدود 5000 باشد، نوسان نمی کند. زیرا آنتروپی ارزش شبکه های آماری مقیاس بزرگ به دلیل نوسانات زیاد تثبیت نمی شود، ما پایین ترین نقطه شیب 10000 را به عنوان یک گرایش پایدار انتخاب کردیم. بنابراین ما به ترتیب از 1500، 5000 و 10000 به عنوان تعداد بهینه نقاط درونیابی برای سه مقیاس استفاده کردیم.
4.2. محدودیت مقایسه متقابل تشابه
بر اساس نتایج تجربی نشاندادهشده در بخش 3.1 ، روش پیشنهادی به تغییر خطوطی از اجسام مصنوعی و طبیعی حساس است. تست عملکرد در بخش 3.2 صحت و کامل بودن نتایج جستجو را تأیید کرد. با این حال، هنوز یک محدودیت وجود دارد. یعنی شباهت شکل محاسبه شده با روش پیشنهادی را نمی توان برای مقایسه متقابل شباهت استفاده کرد. این بدان معناست که اگرچه چند ضلعی های A و B شباهت شکلی مشابه با چند ضلعی C دارند، چند ضلعی های A و B را نمی توان به عنوان چند ضلعی های مشابه در نظر گرفت، همانطور که در جدول 4 نشان داده شده است.. بنابراین، برای شناسایی چند ضلعی های مشابه برای هر چند ضلعی، باید همه چند ضلعی ها با یکدیگر مقایسه شوند. این محدودیت منجر به درجه خاصی از افزونگی در محاسبه می شود.
اگرچه روش پیشنهادی می تواند برای شناسایی بیشتر ردپاهای ساختمان با اشکال مشابه مورد استفاده قرار گیرد، اما دقت آن رضایت بخش نیست. این به دلیل اندازه چند ضلعی است که همچنین عامل مهمی در بازیابی ردپای ساختمان توسط شهود انسان است. به عنوان مثال، سناریوی A شامل بسیاری از ردپاهای ساختمانی مستطیلی است که شباهت شکل بالایی با چند ضلعی نمونه A دارند. با این حال، به دلیل اندازه های مختلف، هنوز نمی توانند به عنوان ردپای ساختمانی مشابه توسط چشم انسان بازیابی شوند.
5. نتیجه گیری ها
در این مقاله، یک روش انتشار کانتور بر اساس ویژگی چند مقیاسی برای ترکیب ویژگیهای کانتور خارجی و داخلی پیشنهاد شدهاست. برای به دست آوردن یک نتیجه بصری، ما راهی برای نمایش ویژگی شکل در ترکیب با ویژگی آماری چند مقیاسی و اطلاعات زمینه شبکه بر اساس نظریه روانشناسی گشتالت در شناخت سلسله مراتبی انسان پیشنهاد می کنیم [ 33 ].
اطلاعات زمینه شبکه، اطلاعات بافت زیادی را ارائه می دهد. به عنوان یک سرنخ مهم شناخت بصری، روش تجزیه و تحلیل ویژگی بافت منجر به یک نتیجه محاسبه شباهت شکل می شود که بیشتر با شناخت انسان مطابقت دارد. توصیفگر زمینه شبکه می تواند برای انتقال ویژگی های کانتور به شبکه توسط کانولوشن استفاده شود. معادله محاسبه شباهت، تانسور ویژگی را بین چند ضلعی های نمونه و مرجع مقایسه می کند.
نتایج نشان میدهد که روش مبتنی بر ویژگی چندمقیاسی ابزار سنجش تشابه مؤثری برای چندضلعیها در حوزه جغرافیایی است. سه مزیت نسبت به روش های اندازه گیری تشابه شکل موجود دارد. اول، ما هر دو ویژگی کانتور و منطقه را هنگام اندازه گیری شباهت شکل در نظر می گیریم. ثانیاً، استفاده از توصیفگرهای بافت برای بیان ویژگیهای شکل با عادات شناختی انسان سازگاری بیشتری دارد. در نهایت، دقت روش پیشنهادی نسبت به تابع تراشکاری و توصیفگر فوریه، که دو تکنیک محبوب برای اندازهگیری شباهت شکل هستند، برتر است. در این مطالعه، ما فقط چند ضلعی های سوراخ دار و چند ضلعی های بدون سوراخ را در نظر می گیریم و در آینده چند ضلعی ها باید برای افزایش جهانی بودن این رویکرد اندازه گیری شکل آزمایش شوند. در ضمن، علاوه بر دقت، همچنین کارایی باید به عنوان یک شاخص حیاتی برای قضاوت در مورد عملکرد رویکرد اندازه گیری تشابه شکل در تحقیقات آینده در نظر گرفته شود. در برنامههای بازیابی شکل و تطبیق الگو، میتوان به محاسبات بیدرنگ آنلاین دست یافت.
بدون دیدگاه