استخراج ویژگی های جغرافیایی نقشه های تاریخی، پایه مهمی برای تحقق گذار از نقشه خوانی انسانی به نقشه خوانی ماشینی است. روش‌های کنونی استخراج بلوک‌های ساختمانی از نقشه‌های تاریخی مشکلات زیادی مانند دقت پایین و مقیاس‌پذیری ضعیف دارند. علاوه بر این، هزینه بالای حاشیه نویسی نقشه های تاریخی، کاربردهای آن را بیشتر محدود می کند. در این مطالعه، روشی برای استخراج بلوک‌های ساختمانی از نقشه‌های تاریخی بر اساس شبکه توجه شی عمیق ارائه شده است. بر اساس چارچوب OCRNet، مکانیسم‌های توجه متعدد برای بهبود توانایی شبکه برای استخراج اطلاعات متنی هدف مورد استفاده قرار گرفت. علاوه بر این، از طریق بهینه سازی ساختار شبکه استخراج ویژگی، تأثیر فرآیند نمونه‌برداری پایین بر روی اطلاعات محلی و خطوط مرزی کاهش یافت تا توانایی شبکه برای گرفتن اطلاعات مرزی بهبود یابد. متعاقباً، روش یادگیری انتقال برای آموزش مشترک مدل شبکه بر روی مجموعه داده‌های سنجش از راه دور و مجموعه داده‌های نقشه تاریخی چند شات برای بهبود بیشتر توانایی یادگیری ویژگی شبکه، که بر محدودیت‌های اندازه نمونه کوچک غلبه می‌کند، استفاده شد. نتایج تجربی نشان می‌دهد که روش پیشنهادی می‌تواند به طور موثری دقت استخراج بلوک‌های ساختمانی از نقشه‌های تاریخی را بهبود بخشد. روش یادگیری انتقال برای آموزش مشترک مدل شبکه بر روی مجموعه داده‌های سنجش از دور و مجموعه داده‌های نقشه تاریخی چند شات برای بهبود بیشتر توانایی یادگیری ویژگی شبکه، که بر محدودیت‌های اندازه نمونه کوچک غلبه می‌کند، استفاده شد. نتایج تجربی نشان می‌دهد که روش پیشنهادی می‌تواند به طور موثری دقت استخراج بلوک‌های ساختمانی از نقشه‌های تاریخی را بهبود بخشد. روش یادگیری انتقال برای آموزش مشترک مدل شبکه بر روی مجموعه داده‌های سنجش از دور و مجموعه داده‌های نقشه تاریخی چند شات برای بهبود بیشتر توانایی یادگیری ویژگی شبکه، که بر محدودیت‌های اندازه نمونه کوچک غلبه می‌کند، استفاده شد. نتایج تجربی نشان می‌دهد که روش پیشنهادی می‌تواند به طور موثری دقت استخراج بلوک‌های ساختمانی از نقشه‌های تاریخی را بهبود بخشد.

کلید واژه ها:

نقشه های تاریخی ; بلوک ساختمانی ؛ استخراج ویژگی ؛ توجه به شی ؛ انتقال یادگیری

1. مقدمه

نقشه های تاریخی چشم انداز طبیعی و آثار فعالیت های انسانی را در سطح زمین برای مدت طولانی حفظ می کنند [ 1 ، 2 ]. چنین نقشه‌هایی برای میراث تاریخی و فرهنگی ارزشمند هستند و منبعی ضروری برای توصیف و ارتباط ویژگی‌های جغرافیایی و روابط فضایی آن‌ها هستند. بنابراین، نقشه های تاریخی برای تحلیل تحولات و تغییرات منطقه ای از ارزش مرجع بالایی برخوردار هستند. با توسعه مداوم فناوری دیجیتال، بسیاری از کشورها نقشه های تاریخی کاغذی را دیجیتالی کرده و انواع مختلفی از آرشیو نقشه های تاریخی دیجیتالی را برای حفظ و استفاده بهتر از این اسناد تاریخی ایجاد کرده اند ( https://ngmdb.usgs.gov/topoview/viewer/ (دسترسی در 12 نوامبر 2022)،https://www.oldmapsonline.org/ (دسترسی در 12 نوامبر 2022)، https://www.map-cn.com/ (دسترسی در 12 نوامبر 2022)، https://www.swisstopo.admin.ch/ en/maps-geodata-online.html (دسترسی در 12 نوامبر 2022)). اگرچه این نقشه‌های تاریخی دیجیتال در دسترس عموم هستند و می‌توانند به راحتی توسط انسان‌ها خوانده و درک شوند، حجم عظیمی از اطلاعات جغرافیایی در تصاویر قفل شده است که انجام محاسبات کمی و تجزیه و تحلیل فضایی از طریق ماشین‌خوانی خودکار را به چالش می‌کشد [ 3 ]]. در استخراج ویژگی‌های جغرافیایی، هر پیکسل با برچسب طبقه‌بندی دقیق (مثلاً جاده‌ها، آب‌ها، بلوک‌های ساختمانی و حاشیه‌نویسی نقشه) تخصیص می‌یابد به طوری که رایانه‌ها می‌توانند به طور مستقل نقشه‌ها را «خوانند». ساختمان به عنوان یک تاسیسات مصنوعی مهم، مکانی ضروری برای زندگی و فعالیت مردم است. استخراج و شناسایی خودکار ویژگی‌های بلوک‌های ساختمانی از نقشه‌های تاریخی به دلیل محدودیت‌های عصر و فناوری نقشه‌برداری چالش‌های زیر را دارد ( شکل 1).). (1) اندازه‌ها و سبک‌های بلوک‌های ساختمانی متفاوت است، اما می‌توان آن‌ها را به‌عنوان ساختمان‌های منفرد یا مناطق خالی با مرز ساده‌سازی کرد. بنابراین، بیان چند مقیاسی ویژگی ها یک چالش بزرگ است. (2) بلوک های ساختمانی می توانند همپوشانی داشته باشند و با یکدیگر لانه کنند، که دشواری فیلتر کردن و غربال کردن مرزها را افزایش می دهد. (3) بلوک های ساختمانی را می توان با سایر محتویات نقشه پوشانده شد که با ویژگی های بافت بلوک های ساختمانی تداخل می کند. (4) در نهایت، یکپارچگی بلوک های ساختمانی می تواند به دلیل لکه ها، چین و چروک ها و آسیب های نقشه تحت تأثیر قرار گیرد.
با توسعه سریع تکنیک های یادگیری عمیق در زمینه بینایی کامپیوتر، شبکه های عصبی پیچشی (CNN) به طور گسترده در زمینه پردازش اطلاعات مکانی استفاده شده است [ 4 ، 5 ، 6 ]. در مقایسه با تصاویر رایج، بلوک های ساختمانی تنها بخش کوچکی از تصاویر نقشه تاریخی را تشکیل می دهند ( شکل 2 ). بنابراین، اطلاعات محلی ممکن است گم شده باشد، یا مرزهای بلوک های ساختمان ممکن است به دلیل نمونه برداری پایین در فرآیند آموزش محو شود [ 7 ]، که بر نتایج استخراج تأثیر می گذارد. اکثر CNN های موجود از یک سری شبکه های فرعی در توالی های با وضوح بالا، با وضوح پایین و متعاقب آن با وضوح بالا تشکیل شده اند (به عنوان مثال ResNet [ 8 ]]، GoogLeNet [ 9 ]، و VGGNet [ 10 ]). ساختار شبکه تا حدی بر توانایی استخراج ویژگی های بلوک های ساختمانی تأثیر می گذارد. علاوه بر این، بسیاری از مجموعه داده های عمومی برای تقسیم بندی معنایی تصاویر طبیعی، مانند ImageNet [ 11 ]، COCO [ 12 ] و Cityscapes [ 13 ] در دسترس هستند که دقت تقسیم بندی معنایی را تا حد زیادی افزایش می دهد. در مقایسه، مجموعه داده‌های معیار برای تقسیم‌بندی معنایی نقشه‌های تاریخی نسبتاً نادر هستند. بنابراین، بهبود دقت بخش‌بندی معنایی بر اساس داده‌های برچسب محدود، برای استخراج ویژگی از تصاویر نقشه تاریخی اهمیت زیادی دارد [ 14 ].
برای استفاده کامل از مزایای یادگیری عمیق در استخراج ویژگی از نقشه های تاریخی، ویژگی های زمینه شی با مکانیسم توجه در این مطالعه گنجانده شد. به طور خاص، بر اساس HRNet [ 15 ] و OCRNet [ 16]، یک شبکه توجه به شی عمیق (DOANet) برای استخراج ویژگی‌های جغرافیایی دقیق از نقشه‌های تاریخی تحت شرایط نمونه‌های آموزشی محدود توسعه داده شد. DOANet از ویژگی‌های عمیق در نمونه‌های آموزشی محدود استفاده کامل می‌کند، و مکانیسم توجه به دقت اطلاعات متنی جهانی را به تصویر می‌کشد، در نتیجه توانایی مدل را برای یادگیری ویژگی‌های بلوک‌های ساختمان و سرکوب پاسخگویی آن به دسته‌بندی‌های دیگر ویژگی‌ها بهبود می‌بخشد. علاوه بر این، روش یادگیری انتقال در آموزش ادغام شد تا بلوک‌های ساختمانی را از مجموعه داده‌های نقشه تاریخی ایجاد شده استخراج کند. نتایج نشان می دهد که مدل پیشنهادی می تواند به طور موثر هزینه حاشیه نویسی دستی را تحت شرایط نمونه های نقشه محدود کاهش دهد و دقت خوبی در استخراج بلوک های ساختمانی نقشه تاریخی دارد.
مقاله به شرح زیر سازماندهی شده است: به منظور درک ارزش این تحقیق، مقاله کار مربوط به این مقاله را توصیف می کند ( بخش 2 )، ایده الگوریتم را توصیف می کند ( بخش 3 )، و اجرای الگوریتم را انجام می دهد و مقایسه می کند. نتایج تجربی با تجزیه و تحلیل ( بخش 4 ). در نهایت، بخش 5 مقاله را با نکاتی در مورد کارهای آینده به پایان می‌رساند.

2. آثار مرتبط

استخراج اطلاعات از نقشه های تاریخی به عنوان یک وظیفه حیاتی در پردازش نقشه های دیجیتال، مورد توجه بسیاری از محققان در زمینه های مختلف قرار گرفته است [ 17 ، 18 ، 19 ، 20 ، 21 ]. مطالعات اولیه عمدتاً از تقسیم‌بندی رنگ، تطبیق الگو، توصیف‌کننده‌های شکل، عملگرهای ریخت‌شناسی ریاضی و روش‌های دیگر برای استخراج ویژگی‌های جغرافیایی مانند جاده‌ها، خطوط خطوط و ساختمان‌ها استفاده می‌کردند [ 22 ، 23 ، 24 ، 25 ، 26 ، 27 ، 28 .]. با این حال، این روش ها اغلب از فرآیندهای سفارشی و تنظیمات پارامتر برای انواع نقشه یا عناصر جغرافیایی خاص استفاده می کنند و بنابراین، از اتوماسیون پایین رنج می برند. با افزایش مقیاس داده های نقشه دیجیتال، هزینه پردازش داده ها به طور قابل توجهی افزایش یافته است. در سال‌های اخیر، روش‌های تشخیص شی، طبقه‌بندی صحنه و تقسیم‌بندی معنایی مبتنی بر CNN برای استخراج داده‌های مکانی از تصاویر سنجش از راه دور استفاده شده‌اند و این رویکردها نتایج بهتری نسبت به روش‌های سنتی نشان داده‌اند [ 5 ، 29 ، 30 ]]. از آنجایی که هم تصاویر سنجش از دور و هم تصاویر نقشه های تاریخی مبتنی بر پیکسل هستند و هر دو بازنمایی عینی از عناصر جغرافیایی هستند، در سطح معنایی شباهت هایی دارند. از این رو، مطالعات بسیاری برای اعمال روش های یادگیری عمیق برای استخراج اطلاعات از نقشه های تاریخی انجام شده است [ 31 ، 32 ، 33 ، 34 ].
برای کاهش تأثیر مقیاس بر نتایج استخراج ویژگی شبکه‌های یادگیری عمیق، Duan و همکاران. [ 35 ] یک روش ارجاع جغرافیایی مبتنی بر یادگیری تقویتی پیشنهاد کرد. از طریق تراز خودکار داده‌های برداری معاصر و نقشه‌های تاریخی جغرافیایی مرجع، مکان‌های دقیق ویژگی‌های جغرافیایی بر روی نقشه‌های اسکن شده حاشیه‌نویسی شدند. علاوه بر این، شبکه‌های متخاصم مولد (GAN) برای تولید داده‌ها برای نقشه‌های تاریخی استفاده شده‌اند. به عنوان مثال، لی [ 36 ] یک روش خودکار برای تولید مجموعه داده از نقشه خیابان باز برای آموزش سیستم های تشخیص متن برای کار با نقشه های تاریخی پیشنهاد کرد. آندراد و همکاران [ 4] تصاویر شهری ماهواره مانند را بر اساس نقشه های تاریخی سنتز کرد. اگرچه این روش‌ها می‌توانند مقیاس مجموعه‌های داده را تا حدی افزایش دهند و توانایی یادگیری ویژگی‌های شبکه‌های یادگیری عمیق را بهبود بخشند، اما همچنان به مقدار زیادی داده‌های نقشه تاریخی نیاز دارند و انحرافات بین داده‌های برداری و نقشه‌های تاریخی باقی می‌ماند.
سعیدی مقدم و همکاران. [ 33 ] از Faster RCNN برای استخراج نقاط تقاطع جاده‌های تک‌خط و دو لاین از سری نقشه‌های تاریخی سازمان زمین‌شناسی ایالات متحده (USGS) استفاده کرد. آن‌ها همچنین از Inception-Resnet-V2 از پیش آموزش‌دیده‌شده در مجموعه داده‌های Microsoft Common Objects in Context (COCO) برای بهبود دقت شبکه استفاده کردند. از آنجایی که اشیاء مورد نظر در مجموعه داده COCO از نظر مقیاس، جهت و شکل داده ها کاملاً با عناصر مکانی متفاوت هستند [ 37 ]، استفاده از داده های مکانی (به عنوان مثال، تصاویر سنجش از دور) برای پیش آموزش و یادگیری انتقال پیشنهاد شده است.
هایتسلر و همکاران [ 38 ] ساختمان‌های منفرد را از نقشه Siegried سوئیس با استفاده از U-Net تقسیم کرد و از روش‌های مبتنی بر ردیابی خطوط و خوشه‌بندی مبتنی بر جهت‌گیری برای بردار کردن نتایج تقسیم‌بندی استفاده کرد. اوهل و همکاران [ 3 ، 7 ، 39] اثرات ساختارهای مختلف شبکه را برای استخراج ردپای سکونتگاه‌های انسانی از سری نقشه‌های توپوگرافی تاریخی USGS مورد مطالعه قرار داد و از CNN با نظارت ضعیف برای حل مشکل هزینه‌های بالای مربوط به حاشیه‌نویسی دستی استفاده کرد. آنها دریافتند که برای تقسیم بندی معنایی نقشه های تاریخی، دقت شبکه استخراج ویژگی تأثیر قابل توجهی بر عملکرد تقسیم بندی دارد. شایان ذکر است که مطالعات فوق فقط بر ساختمان هایی در نقشه های توپوگرافی کوچک مقیاس متمرکز شده است که با مستطیل های کوچک با شکل منظم و بافت ساده (اکثر آنها با یک رنگ پر شده اند) نمایش داده شده اند. با این حال، در نقشه‌های بزرگ مقیاس، بلوک‌های ساختمان دارای خطوط پیچیده و انواع مختلفی از بافت‌ها، حتی خالی‌های بدون بافت هستند، که چالش بزرگی برای قابلیت‌های استخراج ویژگی الگوریتم ایجاد می‌کند.

3. روش ها

3.1. مدل شبکه

وقتی نمونه‌های آموزشی محدود هستند، تعداد ویژگی‌های هدف (یعنی بلوک‌های ساختمان) در یک نقشه کم است. از این رو، بهبود توانایی استخراج ویژگی یک شبکه ضروری است و مشکل از دست دادن جزئیات در طول نمونه برداری پایین باید برطرف شود. در این مطالعه، ساختارهای رمزگذاری و رمزگشایی HRNet برای گرفتن ویژگی‌های عمیق چند مقیاسی بهینه‌سازی شدند و OCRNet برای به دست آوردن اطلاعات متنی در نمونه‌ها معرفی شد. سپس، ویژگی‌های عمیق با اطلاعات زمینه‌ای گنجانده شد تا توانایی شبکه برای یادگیری ویژگی‌های بلوک ساختمانی در مجموعه داده‌های چند شات افزایش یابد.

3.1.1. معماری DOANet

معماری DOANet پیشنهادی برای استخراج بلوک های ساختمانی از نقشه های تاریخی بر اساس مکانیسم توجه در شکل 3 نشان داده شده است.. بر اساس OCRNet، DOANet از یک ماژول استخراج ویژگی و یک ماژول توجه به شی تشکیل شده است. به طور خاص، ماژول توجه به شی بیشتر به ماژول توجه متقاطع و ماژول زمینه شی تقسیم می شود. به طور خاص، ماژول توجه متقاطع از یک میدان پذیرنده بزرگ برای به دست آوردن اطلاعات توزیع فضایی استفاده می کند و ویژگی های مهم را در حالی که ویژگی های نامربوط را نادیده می گیرد، یاد می گیرد. ماژول زمینه شی طراحی شده است تا فیلدهای گیرنده با اندازه های مختلف را ترکیب کند تا اطلاعات متنی دقیق را بگیرد. سپس، ماژول توجه به شی، اطلاعات توزیع فضایی و اطلاعات زمینه ای شی را جمع می کند تا نمایش ویژگی را افزایش دهد. ویژگی های عمیق استخراج شده توسط ماژول استخراج ویژگی بیشتر توسط ماژول توجه متقاطع بهینه شده است. و ویژگی‌های عمیق بهینه‌شده و نتایج طبقه‌بندی درشت لایه‌های میانی به عنوان ورودی ماژول زمینه شی برای به دست آوردن ویژگی‌های منطقه شی در نظر گرفته می‌شوند. سپس، ویژگی‌های عمیق بهینه‌شده و ویژگی‌های ناحیه شی توسط ماژول توجه متقاطع ترکیب می‌شوند تا ویژگی‌های زمینه شی را به دست آورند. در نهایت، ویژگی‌های عمیق بهینه‌شده با ویژگی‌های زمینه شیء ترکیب می‌شوند تا نمایش ویژگی نهایی با اطلاعات زمینه‌ای پیشرفته به دست آید.
3.1.2. ماژول استخراج ویژگی

برخلاف اکثر شبکه‌های استخراج ویژگی، HRNet از شبکه‌های فرعی موازی با وضوح بالا و وضوح پایین تشکیل شده است و از ترکیب ویژگی‌های چند مقیاسی مکرر استفاده می‌کند. نقشه‌های ویژگی با وضوح پایین با عمق یکسان و سطوح مشابه برای بهبود ویژگی‌های با وضوح بالا استفاده می‌شوند و شبکه را قادر می‌سازد تا اطلاعات محلی را با استحکام قوی ضبط کند. بر اساس HRNet، DOANet از شش رمزگذار و شش رمزگشا تشکیل شده است ( شکل 4) که باعث کاهش اتصالات لایه های هم مقیاس در شبکه اصلی و تقویت اتصالات بین لایه های مقیاس های مختلف می شود. علاوه بر این، به دلیل تعداد کم رمزگذارها، رمزگشاهای کمتری مورد نیاز است و در نتیجه اندازه شبکه کاهش می‌یابد. هر رمزگذار از Leaky-ReLU به عنوان تابع فعال سازی استفاده می کند که با عملیات عادی سازی دسته ای تکمیل می شود تا پایداری پارامترهای مدل را بهبود بخشد. از آنجایی که استخراج اطلاعات ساختمان از نقشه‌های تاریخی یک مشکل طبقه‌بندی باینری است، یعنی برچسب‌ها فقط شامل پس‌زمینه و ساختمان‌ها می‌شوند، آنتروپی متقاطع به عنوان تابع ضرر L استفاده می‌شود :

=1نمن– [yمن⋅ ثبت نام (پمن) + yمن) ⋅ ورود پمن) ]�=1ن∑من-[�من·ورود به سیستم(پمن)+(1-�من)·ورود به سیستم(1-پمن)]

که در آن i برچسب نمونه i است که برای طبقه بندی مثبت یک و برای طبقه بندی منفی صفر است و i احتمال این است که نمونه i به طور مثبت پیش بینی شود.

3.1.3. ماژول توجه

ماژول توجه متقاطع [ 40 ] در شکل 5 در این مطالعه استفاده شد. این ماژول می‌تواند وابستگی هر پیکسل را به بقیه پیکسل‌های تصویر ثبت کند، در نتیجه توانایی شبکه را برای استخراج اطلاعات متنی بهبود می‌بخشد. ابتدا بعد نقشه ویژگی H به اندازه C × W × H با دو پیچش 1 × 1 کاهش می یابد و دو نقشه ویژگی Q و K به دست می آید. سپس، برای هر پیکسل u در نقشه ویژگی Q ، یک بردار کانال u با اندازه 1 × 1 × C′ به دست می آید و تمام پیکسل های موجود در همان سطر و ستون پیکسل u برای ساختن یک بردار ویژگی Ω u با اندازه ( H + W − 1) × C استفاده می شود. سپس، وابستگی i,u هر پیکسل u در نقشه ویژگی Q به بردار ویژگی Ω u از طریق عملیات میل محاسبه می شود:

دمن ، تو=ستوΩتیمن ، تودمن،تو=ستو�من،توتی

که در آن i,u بردار کانال i Ω u را نشان می دهد . نقشه توجه A با اندازه ( H + W – 1) × W × H پس از لایه SoftMax به دست می آید. علاوه بر این، نقشه ویژگی V با اندازه C × W × H از طریق پیچیدگی 1×1 دیگری از نقشه ویژگی H به دست می آید . بردار ویژگی Ψ i,u در همان سطر و ستون هر پیکسل u در V نقطه ضرب در بردار ویژگی i,u است.در موقعیت مربوطه، و محصولات نقطه‌ای برای همه پیکسل‌ها اضافه می‌شوند تا ویژگی تجمع باقی‌مانده در موقعیت به دست آید، که سپس به بردار ویژگی اصلی Hu اضافه می‌شود تا بردار ویژگی Hu ” با قابلیت نمایش ویژگی قوی‌تر به دست آید. معادله به صورت زیر ترسیم شده است:

اچتو=0اچدبلیو– 1آمن ، توΨمن ، تو+اچتواچتو”=∑من=0اچ+دبلیو-1آمن،تو·�من،تو+اچتو
از آنجایی که یک ماژول توجه متقاطع تنها عناصری را در همان سطر و ستون به عنوان یک پیکسل در نظر می گیرد، دو مدول توجه متقاطع به هم متصل می شوند تا اطلاعات متنی را در همه موقعیت ها به دست آورند.

3.2. یادگیری انتقالی

یادگیری انتقالی تکنیکی است که فرآیندهای یادگیری در حوزه مبدا شامل داده های آموزشی، پارامترهای مدل و وظایف را به دانش تبدیل می کند و سپس آنها را به حوزه هدف منتقل می کند تا یادگیری تابع پیش بینی در حوزه هدف را تسهیل کند [ 41 ]. ]. روش یادگیری انتقالی مورد استفاده در این مطالعه در شکل 6 نشان داده شده است. یک مجموعه داده عمومی به عنوان مجموعه داده آموزشی در حوزه منبع استفاده شد. یعنی مجموعه داده‌های نمونه در حوزه منبع برای یادگیری به DOANet وارد شد و پارامترها و ویژگی‌های شبکه دامنه منبع از طریق تکرار شبکه با دامنه هدف به اشتراک گذاشته شد. شبکه دامنه هدف با پارامترهای شبکه در دامنه منبع مقداردهی اولیه شد، در حالی که لایه نرمال سازی دسته ای در دامنه هدف منجمد شد. مجموعه داده در حوزه هدف برای آموزش تنظیم دقیق پارامترهای شبکه در حوزه هدف، و در نتیجه تحقق انتقال دانش مورد استفاده قرار گرفت.

4. آزمایشات

برای ارزیابی کارایی DOANet و مقایسه نتایج با نتایج الگوریتم‌های تقسیم‌بندی معنایی موجود، مجموعه داده برای وظیفه 1 (تشخیص بلوک‌های ساختمانی) در مسابقه ICDAR2021 در بخش‌بندی نقشه تاریخی [ 42 ]] برای آموزش، اعتبارسنجی و آزمایش الگوریتم ها استفاده شد. مجموعه داده شامل نقشه های شهری پاریس در مقیاس بزرگ است که مربوط به سال های 1860 تا 1940 است که توسط کتابخانه ملی فرانسه جمع آوری شده است، که شامل یک تصویر آموزشی، یک تصویر اعتبار سنجی و سه تصویر آزمایشی است. وضوح هر تصویر حداقل 8000 × 6000 است. بلوک های ساختمان در تصاویر آموزشی و اعتبار سنجی به صورت دستی حاشیه نویسی شدند. یک پنجره کشویی 512 × 512 با اندازه گام 200 برای برش تصویر آموزشی و تصویر اعتبار سنجی (شامل تصاویر حاشیه نویسی مربوطه) استفاده شد و سپس بلوک های تصویر برش خورده به عنوان مجموعه داده در آزمایش استفاده شد. سپس مجموعه داده به یک مجموعه آموزشی و یک مجموعه اعتبار سنجی با نسبت 8:2 تقسیم شد. در مجموع 2237 نمونه آموزشی و 559 نمونه اعتبار سنجی به دست آمد. قبل از آموزش، هر نمونه آموزشی در یک تصویر آینه ای به بالا و پایین و چپ و راست برگردانده می شود و سپس به طور تصادفی یک بار در 45 درجه چرخانده می شود. ICDAR2021 یک شاخص استاندارد برای ارزیابی نتایج آزمایش ارائه می دهد که به شرح زیر محاسبه می شود:

پS× =ص ، ج) ∈ تیپمنUص ، ج)تیپ×تیپتیپ+12افپ+12افنپس=اسس×آرس=∑(پ،�)∈تیپمن��(پ،�)تیپ×تیپتیپ+12افپ+12افن

که در آن PQ امتیاز جمع است، SQ میانگین تقاطع بیش از اتحادیه ( mIoU )، RQ امتیاز F است و TP ، FP و FN به ترتیب نشان دهنده مثبت واقعی، مثبت کاذب و منفی کاذب هستند.

پلت فرم آزمایشی یک سیستم عامل 64 بیتی اوبونتو 18.04 بود که مجهز به هشت پردازنده گرافیکی GeForce RTX™ 2080 Ti (11 گیگابایت VRAM) بود. برای ساخت الگوریتم از چارچوب PaddlePaddle v2.1 استفاده شد. اندازه دسته با توجه به ویژگی های GPU ها روی 8 تنظیم شد، نرخ یادگیری اولیه شبکه 0.0125 بود و از گرادیان نزولی تصادفی (SGD) به عنوان بهینه ساز استفاده شد. تکانه 0.9 بود، میزان پوسیدگی وزن 4 × 10-5 بود، و دوره تمرین روی 10000 بار تنظیم شد. مجموعه داده ساختمان منبع باز WHU [ 43] به عنوان مجموعه داده دامنه منبع استفاده شد و مجموعه داده تقسیم شده به عنوان مجموعه داده دامنه هدف برای آموزش DOANet استفاده شد. استخراج بلوک های ساختمانی بر روی سه تصویر آزمون پس از آموزش انجام شد و نتایج با استفاده از شاخص های فوق در معادله (4) مورد ارزیابی قرار گرفت.

4.1. نتایج

نمرات DOANet با نتایج رسمی ICDAR2021 ( جدول 1 ) مقایسه شد. PQ DOANet برای هر سه تصویر آزمایشی بالاتر از روش های دیگر بود. نتیجه تجسم روش در شکل 7 نشان داده شده است . در مقایسه با روش های دیگر، PQDOANet حداقل 7.2٪ افزایش یافته است که نشان می دهد روش استخراج ویژگی مبتنی بر مکانیسم توجه به طور موثر ویژگی های محلی را که از میدان پذیرنده عبور نکرده اند جمع می کند و تأثیر مرزهای مبهم به دلیل تغییر مقیاس کاهش می یابد. بنابراین، الگوریتم پیشنهادی سطح بالایی از دقت تشخیص را نشان داد. با این حال، توانایی روش برای حل مشکل همپوشانی تودرتو در بلوک‌های ساختمانی، همان‌طور که در نتیجه دوم در شکل 7 نشان داده شده است ، که در آن DOANet به اشتباه چندین ساختمان منفرد (بخش‌های سایه‌دار) را به‌عنوان یک کل قضاوت می‌کند.

4.2. تجزیه و تحلیل فرسایش

برای تحلیل بیشتر نقش ماژول توجه به شی و انتقال یادگیری در استخراج ویژگی‌های جغرافیایی از نقشه‌های تاریخی، پنج الگوریتم برای بررسی عملکرد مدولار DOANet طراحی شد:
ANet: ماژول استخراج ویژگی بدون تغییر بود و فقط ماژول توجه متقاطع حفظ شد.
ONet: ماژول استخراج ویژگی بدون تغییر بود و فقط ماژول زمینه شی حفظ شد.
OOANet: ماژول توجه به شی بدون تغییر بود، تعداد رمزگذارها و رمزگشاها در ماژول استخراج ویژگی تغییر کرد و ساختار اصلی HRNet ( شکل 8 ، سمت چپ) استفاده شد [ 15 ].
ROANet: ماژول توجه به شی بدون تغییر بود و شبکه استخراج ویژگی ResNet ( شکل 8 ، سمت راست)، که ساختار سری دارد، استفاده شد [ 8 ].
DOANet-: ساختار شبکه بدون تغییر بود و ماژول یادگیری انتقال حذف شد.
شاخص های ارزیابی کمی هر آزمایش در جدول 2 نشان داده شده است. به دلیل عدم وجود بخشی از ماژول های اصلی، هر دو ANet و ONet نتایج استخراج بلوک های ساختمانی ضعیفی را به همراه داشتند. OOANet ساختار شبکه عمیق تری دارد و از نظر تئوری باید نتایج استخراج بهتری را به همراه داشته باشد، اما نتایج نشان داد که OOANet نتوانست ویژگی ها را بهبود بخشد. علاوه بر این، نتایج ROANet نیز به دلیل از دست دادن اطلاعات محلی، پایین‌تر از نتایج DOANet بود که به طور غیرمستقیم مزایای شبکه‌های موازی را در استخراج ویژگی‌های جغرافیایی از نقشه‌های تاریخی نشان می‌دهد. علاوه بر این، در غیاب انتقال دانش خارجی، عملکرد DOANet- به دلیل تعداد محدود نمونه تا حدی تحت تأثیر قرار گرفت. همانطور که در شکل 9 نشان داده شده استهنگامی که تعداد نمونه های آموزشی کم بود، نمرات DOANet- بدون انتقال کاهش یافت. با افزایش مجموعه داده آموزشی، تفاوت بین DOANet و DOANet- به تدریج کاهش یافت. برای دستیابی به امتیاز بیش از 75 درصد، DOANet به 1200 نمونه آموزشی نیاز داشت، در حالی که DOANet تنها به 600 نمونه تصویر نیاز داشت. از این رو، روش پیشنهادی در این مطالعه می تواند به طور موثر با مشکل محدود بودن نمونه های آموزشی مقابله کند و در نتیجه هزینه حاشیه نویسی را کاهش دهد.

5. نتیجه گیری ها

برای رسیدگی به مشکلات مربوط به استخراج اطلاعات از نقشه های تاریخی، یک شبکه استخراج بلوک ساختمانی برای نقشه های تاریخی، DOANet، بر اساس مکانیسم توجه توسعه داده شد. DOANet که بر اساس ساختارهای HRNet و OCRNet ساخته شده است، از زیرشبکه های موازی برای ترکیب ویژگی های چند مقیاسی استفاده می کند و شامل یک ماژول توجه متقاطع است. علاوه بر این، روش یادگیری انتقال با DOANet یکپارچه شده است تا دقت تشخیص مدل را در مورد نمونه‌های آموزشی محدود بهبود بخشد. نتایج تجربی نشان می دهد که PQروش پیشنهادی حداقل 7.2 درصد در مقایسه با الگوریتم های موجود افزایش یافته است. روش پیشنهادی به طور موثر مشکل عملکرد ضعیف شبکه ناشی از نمونه‌های آموزشی ناکافی در کار استخراج بلوک‌های ساختمانی از نقشه‌های تاریخی را حل می‌کند و مرجعی برای استخراج سایر ویژگی‌ها از نقشه‌های تاریخی فراهم می‌کند. با این حال، توانایی روش برای حل مشکل همپوشانی تودرتو در بلوک‌های ساختمانی چیزهای زیادی باقی می‌گذارد و ما در کار بعدی خود بر حل این مشکل تمرکز خواهیم کرد. علاوه بر این، به کارگیری این روش برای سبک های مختلف نقشه ها (به عنوان مثال، زبان های مختلف، دوره های زمانی مختلف) نیز بخشی از کار آینده ما به منظور بهبود تعمیم پذیری روش در این مقاله خواهد بود.

منابع

  1. دومینیک، ک. Jacek، K. ناتالیا، ک. الژبیتا، ز. کریستوف، او. کاتارزینا، او. اورس، جی. کاتالینا، ام. Volker، CR بازسازی پوشش جنگلی در مقیاس وسیع از نقشه های توپوگرافی تاریخی. Appl. Geogr. 2016 ، 67 ، 39-48. [ Google Scholar ] [ CrossRef ]
  2. شبیتا، بی. Knoblock، CA؛ Duan، WW; چیانگ، YY; Uhl، JH; Leyk، S. داده های مکانی-زمانی مرتبط با ساختمان از نقشه های تاریخی برداری شده. در مجموعه مقالات کنفرانس وب معنایی گسترده 2020، هراکلیون، یونان، 1 تا 4 ژوئن 2020؛ ص 409-426. [ Google Scholar ]
  3. Uhl، JH; لیک، اس. چیانگ، YY; Duan، WW; Knoblock، CA استخراج خودکار الگوهای استقرار انسانی از سری نقشه های توپوگرافی تاریخی با استفاده از شبکه های عصبی کانولوشنال تحت نظارت ضعیف. دسترسی IEEE 2020 ، 8 ، 6978–6996. [ Google Scholar ] [ CrossRef ]
  4. آندراد، اچ جی. فرناندز، BJ سنتز تصاویر شهری ماهواره مانند از نقشه های تاریخی با استفاده از GAN شرطی. IEEE Geosci. سنسور از راه دور Lett. 2020 ، 19 ، 3000504. [ Google Scholar ] [ CrossRef ]
  5. یوان، XH; شی، ج.اف. Gu, LC مروری بر روش‌های یادگیری عمیق برای تقسیم‌بندی معنایی تصاویر سنجش از دور. سیستم خبره Appl. 2021 ، 169 ، 114-147. [ Google Scholar ] [ CrossRef ]
  6. Can، YS; گریتز، پی جی. Kabadayi، ME تشخیص خودکار انواع جاده ها از سومین نقشه برداری نظامی سری نقشه های تاریخی اتریش-مجارستان با شبکه های عصبی کانولوشنال عمیق. دسترسی IEEE 2021 ، 9 ، 62847–62856. [ Google Scholar ] [ CrossRef ]
  7. Uhl، JH; لیک، اس. چیانگ، YY; Duan، WW; Knoblock، CA استخراج ردپای سکونت انسانی از سری نقشه های توپوگرافی تاریخی با استفاده از یادگیری ماشین مبتنی بر زمینه. در مجموعه مقالات هشتمین کنفرانس بین المللی سیستم های تشخیص الگو (ICPRS 2017)، مادرید، اسپانیا، 28 تا 31 اکتبر 2017؛ صص 1-6. [ Google Scholar ]
  8. او، KM; ژانگ، XY؛ Ren, SQ; Sun، J. یادگیری باقیمانده عمیق برای تشخیص تصویر. در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو (CVPR 2016)، لاس وگاس، NV، ایالات متحده آمریکا، 26 تا 30 ژوئن 2016؛ صص 770-778. [ Google Scholar ]
  9. سگدی، سی. لیو، دبلیو. جیا، YQ; سرمانت، پ. رید، اس. آنگلوف، دی. ایرهان، د. ونهوک، وی. رابینوویچ، الف. با پیچیدگی ها عمیق تر رفتن. در مجموعه مقالات کنفرانس IEEE در مورد دید کامپیوتری و تشخیص الگو (CVPR 2015)، بوستون، MA، ایالات متحده آمریکا، 7-9 ژوئن 2015. صفحات 1-9. [ Google Scholar ]
  10. سیمونیان، ک. زیسرمن، الف. شبکه های پیچیده بسیار عمیق برای تشخیص تصویر در مقیاس بزرگ. در مجموعه مقالات کنفرانس IEEE در مورد دید کامپیوتری و تشخیص الگو (CVPR 2015)، بوستون، MA، ایالات متحده آمریکا، 7-9 ژوئن 2015. ص 16-24. [ Google Scholar ]
  11. روساکوفسکی، او. دنگ، ج. سو، اچ. کراوز، جی. ستایش، س. ما، س. هوانگ، ژ. کارپاتی، ا. خسلا، ع. برنشتاین، ام. و همکاران چالش تشخیص بصری در مقیاس بزرگ ImageNet. بین المللی جی. کامپیوتر. Vis. 2015 ، 115 ، 211-252. [ Google Scholar ] [ CrossRef ]
  12. لین، TY; مایر، م. بلنگی، اس. هیز، جی. پرونا، پی. رامانان، دی. دلار، پی. Zitnick، CL مایکروسافت COCO: اشیاء مشترک در زمینه. در مجموعه مقالات کنفرانس اروپایی بینایی کامپیوتر (ECCV 2014)، زوریخ، سوئیس، 7-9 سپتامبر 2014. صص 740-755. [ Google Scholar ]
  13. کوردتس، ام. عمران، م. راموس، اس. رهفلد، تی. انزوایلر، م. بننسون، آر. فرانکه، یو. راث، اس. Schiele, B. مجموعه داده های Cityscapes برای درک معنایی صحنه شهری. در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو (CVPR 2016)، لاس وگاس، NV، ایالات متحده آمریکا، 26 تا 30 ژوئن 2016؛ صص 3212–3223. [ Google Scholar ]
  14. چیانگ، YY; Duan، WW; لیک، اس. Uhl، JH; Knoblock، CA با استفاده از نقشه‌های تاریخی در مطالعات علمی: کاربردها، چالش‌ها و بهترین روش‌ها . Springer: برلین، آلمان، 2020؛ صص 10-25. شابک 978-3-319-66907-6. [ Google Scholar ]
  15. سان، ک. شیائو، بی. لیو، دی. Wang, JD Deep Representation Representation Learning for Human Pose Estimation. در مجموعه مقالات کنفرانس IEEE در مورد دید کامپیوتری و تشخیص الگو (CVPR 2019)، لانگ بیچ، کالیفرنیا، ایالات متحده آمریکا، 16 تا 20 ژوئن 2019؛ صص 5693-5703. [ Google Scholar ]
  16. یوان، YH; چن، XK; چن، XL; وانگ، ترانسفورماتور تقسیم‌بندی JD: بازنمایی‌های شی-متن برای تقسیم‌بندی معنایی. در مجموعه مقالات کنفرانس اروپایی بینایی کامپیوتر (ECCV 2020)، گلاسکو، بریتانیا، 23 تا 28 اوت 2020؛ ص 1417–1438. [ Google Scholar ]
  17. هاو، NR; واینمن، جی. گووار، ج. شمجی، الف. مدل‌های بخش قابل تغییر شکل برای ارجاع خودکار به تصاویر نقشه تاریخی. در مجموعه مقالات بیست و هفتمین کنفرانس بین المللی ACM SIGSPATIAL در مورد پیشرفت در سیستم های اطلاعات جغرافیایی (ICAGIS 2019)، شیکاگو، IL، ایالات متحده آمریکا، 5 تا 8 نوامبر 2019؛ صص 540-543. [ Google Scholar ]
  18. هایتسلر، ام. Hurni، L. باز کردن قفل گذشته جغرافیایی با یادگیری عمیق – ایجاد یک مرکز برای داده های نقشه تاریخی در سوئیس. در مجموعه مقالات بیست و نهمین کنفرانس بین المللی کارتوگرافی (ICC 2019)، توکیو، ژاپن، 15 تا 20 ژوئیه 2019؛ صص 1-10. [ Google Scholar ]
  19. آسوکان، ع. آنیتا، جی. چیوبانو، ام. گابور، ا. نااجی، ع. Hemanth، J. تکنیک های پردازش تصویر برای تجزیه و تحلیل تصاویر ماهواره ای برای طبقه بندی نقشه های تاریخی – یک مرور کلی. Appl. علمی 2020 ، 10 ، 4207. [ Google Scholar ] [ CrossRef ]
  20. گارسیا-مولسوسا، ا. اورنگو، HA; لارنس، دی. فیلیپ، جی. هاپر، ک. پتری، کالیفرنیا پتانسیل تقسیم بندی یادگیری عمیق برای استخراج ویژگی های باستان شناسی از سری نقشه های تاریخی. آرکائول. چشم انداز. 2021 ، 28 ، 187-199. [ Google Scholar ] [ CrossRef ]
  21. چن، YZ; کارلینت، ای. Chazalon، J. مالت، سی. دومنیو، بی. Perret, J. ترکیب یادگیری عمیق و ریخت شناسی ریاضی برای تقسیم بندی نقشه های تاریخی. در مجموعه مقالات کنفرانس بین المللی هندسه گسسته و ریخت شناسی ریاضی (DGMM 2021)، آپسال، سوئد، 24 تا 27 مه 2021؛ صص 79-92. [ Google Scholar ]
  22. چیانگ، YY; Knoblock، CA استخراج داده های بردار جاده از نقشه های Raster. در مجموعه مقالات هشتمین کارگاه بین المللی شناخت گرافیک (GREC 2009)، لاروشل، فرانسه، 11 تا 13 ژوئیه 2009. صص 93-105. [ Google Scholar ]
  23. چیانگ، YY; لیک، اس. Knoblock، CA تشخیص گرافیک کارآمد و قوی از نقشه های تاریخی. در مجموعه مقالات هشتمین کارگاه بین المللی شناخت گرافیک (GREC 2011)، سئول، کره، 21 تا 22 سپتامبر 2011. صص 25-35. [ Google Scholar ]
  24. چن، ی. وانگ، آر اس؛ Qian, J. استخراج خطوط کانتور از نقشه های توپوگرافی شرطی مشترک. IEEE Trans. Geosci. Remote Sens. 2006 , 44 , 1048-1057. [ Google Scholar ] [ CrossRef ]
  25. Miao، QG; Xu، PF; لیو، تی جی; یانگ، ی. Zhang، JY جداسازی ویژگی خطی از نقشه های توپوگرافی با استفاده از چگالی انرژی و تبدیل برشی. IEEE Trans. فرآیند تصویر 2013 ، 22 ، 1548-1558. [ Google Scholar ] [ CrossRef ]
  26. Liu, Y. An Automation System: Generation of Digital Map Data from Pictorial Map Resources. تشخیص الگو 2002 ، 35 ، 1973-1987. [ Google Scholar ] [ CrossRef ]
  27. میوشی، تی. لی، WQ; کاندا، ک. یاماشیتا، اچ. Nakamae, E. استخراج خودکار ساختمان ها با استفاده از ویژگی های هندسی یک نقشه توپوگرافی اسکن شده. در مجموعه مقالات هفدهمین کنفرانس بین المللی شناخت الگو (ICPR 2004)، استکهلم، سوئد، 26 اوت 2004; صص 626-629. [ Google Scholar ]
  28. لیک، اس. Boesch, R. Colors of the Past: تقسیم بندی تصویر رنگی در نقشه های توپوگرافی تاریخی بر اساس همگنی. Geoinformatica 2010 ، 14 ، 1-21. [ Google Scholar ] [ CrossRef ]
  29. Alganci، U. سویداس، م. سرتل، ای. تحقیق مقایسه ای روی رویکردهای یادگیری عمیق برای تشخیص هواپیما از تصاویر ماهواره ای با وضوح بسیار بالا. Remote Sens. 2020 , 12 , 458. [ Google Scholar ] [ CrossRef ]
  30. چنگ، جی. Xie, XX; هان، JW; گوا، ال. Xia، طبقه‌بندی صحنه تصویر سنجش از دور GS با یادگیری عمیق مواجه می‌شود: چالش‌ها، روش‌ها، معیارها و فرصت‌ها. IEEE J. Sel. بالا. Appl. زمین Obs. Remote Sens. 2020 , 13 , 3735–3756. [ Google Scholar ] [ CrossRef ]
  31. وو، SD؛ هایتسلر، ام. Hurni، L. استفاده از تخمین عدم قطعیت و ادغام هرم فضایی برای استخراج ویژگی های هیدرولوژیکی از نقشه های توپوگرافی تاریخی اسکن شده. گیسی. Remote Sens. 2022 , 59 , 200–214. [ Google Scholar ] [ CrossRef ]
  32. اکیم، بی. سرتل، ای. Kabaday، ME استخراج خودکار جاده از نقشه های تاریخی با استفاده از تکنیک های یادگیری عمیق: مطالعه موردی منطقه ای ترکیه در نقشه جنگ جهانی دوم آلمان. ISPRS Int. J. Geo-Inf. 2021 ، 10 ، 492. [ Google Scholar ] [ CrossRef ]
  33. سعیدی مقدم، م. استپینسکی، استخراج خودکار نقاط تقاطع جاده ای TF از سری نقشه های تاریخی USGS با استفاده از شبکه های عصبی کانولوشنال عمیق. بین المللی جی. جئوگر. Inf. علمی 2020 ، 34 ، 947-968. [ Google Scholar ] [ CrossRef ]
  34. Schlegel, I. استخراج خودکار برچسب ها از نقشه های تاریخی در مقیاس بزرگ. گیس چابک. 2021 ، 2 ، 1-14. [ Google Scholar ] [ CrossRef ]
  35. Duan، WW; چیانگ، YY; لیک، اس. Uhl، JH; Knoblock، CA تراز خودکار داده های برداری معاصر و نقشه های تاریخی جغرافیایی مرجع با استفاده از یادگیری تقویتی. بین المللی جی. جئوگر. Inf. علمی 2019 ، 34 ، 824-849. [ Google Scholar ] [ CrossRef ]
  36. Li, Z. ایجاد نقشه های تاریخی از نقشه های آنلاین. در مجموعه مقالات بیست و هفتمین کنفرانس بین‌المللی ACM SIGSPATIAL در مورد پیشرفت‌ها در سیستم‌های اطلاعات جغرافیایی، شیکاگو، IL، ایالات متحده آمریکا، 5 تا 8 نوامبر 2019؛ صص 610-611. [ Google Scholar ]
  37. Xia، GS; بای، ایکس. دینگ، جی. زو، ز. بلنگی، اس. لو، جی بی؛ داتکو، ام. پلیلو، ام. Zhang، LP DOTA: مجموعه داده در مقیاس بزرگ برای تشخیص اشیاء در تصاویر هوایی. در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو (CVPR 2018)، سالت لیک سیتی، GA، ایالات متحده آمریکا، 18 تا 22 ژوئن 2018؛ صص 3974–3983. [ Google Scholar ]
  38. هایتسلر، ام. هورنیم، ال. بازسازی نقشه‌برداری ردپای ساختمان از نقشه‌های تاریخی: مطالعه روی نقشه زیگفرید سوئیس. ترانس. GIS 2020 ، 24 ، 442-461. [ Google Scholar ] [ CrossRef ]
  39. Uhl، JH; لیک، اس. چیانگ، YY; Duan، WW; Knoblock، CA فضایی سازی عدم قطعیت در بخش بندی تصویر با استفاده از شبکه های عصبی کانولوشنال تحت نظارت ضعیف: مطالعه موردی از پردازش نقشه تاریخی. فرآیند تصویر IET 2018 ، 12 ، 2084–2091. [ Google Scholar ] [ CrossRef ]
  40. هوانگ، ZL; وانگ، XG; هوانگ، ال سی. هوانگ، سی. وی، YC; لیو، WY CCNet: توجه متقاطع برای تقسیم بندی معنایی. در مجموعه مقالات کنفرانس بین المللی IEEE در بینایی کامپیوتر (ICCV 2019)، سئول، کره، 27 تا 31 اکتبر 2019؛ صص 603-612. [ Google Scholar ]
  41. پان، SJ; یانگ، کیو. نظرسنجی در مورد یادگیری انتقالی. IEEE Trans. بدانید. مهندسی داده 2010 ، 22 ، 1345-1359. [ Google Scholar ] [ CrossRef ]
  42. Chazalon، J. کارلینت، ای. چن، YZ; پرت، جی. دومنیو، بی. مالت، سی. ژرو، تی. نگوین، وی. نگوین، ن. بالون، ج. و همکاران مسابقه ICDAR 2021 در بخش بندی نقشه های تاریخی. در مجموعه مقالات شانزدهمین کنفرانس بین المللی تحلیل و شناسایی اسناد (ICDAR 2021)، لوزان، سوئیس، 5 تا 10 سپتامبر 2021؛ صص 693-707. [ Google Scholar ]
  43. جی، SP; استخراج Wei, SQ Building از طریق شبکه های عصبی کانولوشنال از مجموعه داده ساختمان سنجش از دور باز. Acta Geod. کارتوگر. گناه 2019 ، 48 ، 448-459. [ Google Scholar ] [ CrossRef ]
شکل 1. چالش های نمونه در یک نمونه نقشه تاریخی برای استخراج ویژگی: چالش 1: سایه ها ساختمان های منفرد را نشان می دهند و دیگری فقط دارای مرزهای ساختمان است (جعبه آبی). چالش 2: بلوک های ساختمانی با یکدیگر همپوشانی دارند و لانه می کنند (جعبه سبز). چالش 3: بلوک های ساختمان توسط سایر محتویات نقشه پوشانده شده اند (جعبه زرد). چالش 4: چین و آسیب (جعبه قرمز).
شکل 2. مقایسه زمینه های شی. سوار بر اسب در تصویری طبیعی ( سمت چپ ) و ساختمانی در نقشه تاریخی برش خورده ( سمت راست ). تصویر بلوک ساختمان تنها بخش کوچکی از این تصویر نقشه نظری را در مقایسه با تصویر طبیعی نشان می دهد (منطقه ای که با کادرهای قرمز احاطه شده است به عنوان نسبتی از کل مساحت تصویر).
شکل 3. معماری DOANet.
شکل 4. ساختار ماژول استخراج ویژگی.
شکل 5. ساختار ماژول توجه.
شکل 6. ادغام DOANet با یادگیری انتقال.
شکل 7. نتایج نمونه استخراج بلوک ساختمانی (سفید).
شکل 8. ( سمت چپ ): نمودار شماتیک ساختار HRNet. ( راست ): نمودار شماتیک ساختار ResNet.
شکل 9. تعداد نمونه های آموزشی در مقایسه با نمرات.

بدون دیدگاه

دیدگاهتان را بنویسید