1. مقدمه
دیجیتالی شدن نقشه های تاریخی به محققان امکان دسترسی به داده های جغرافیایی با کیفیت از گذشته را داده است. این نقشه ها اغلب تنها منبع دیجیتالی داده های قابل اعتماد هستند که آنها را به منبعی ارزشمند تبدیل می کند. بسیاری از موسسات مجموعه های بزرگی از نقشه های شطرنجی را دیجیتالی کرده اند که دوره های زمانی و مکان های مختلف را به تصویر می کشد. این فرآیند دیجیتالی شدن زمانبر معمولاً به صورت دستی انجام می شود. اکثر نقشه ها حاوی ابرداده کمی هستند، مانند عنوان عمومی، تاریخ و توضیحات کوتاه. این امر جستجوی کارآمد برای نقشه هایی را که یک منطقه خاص مورد علاقه را توصیف می کنند دشوار می کند. پرس و جو در مورد نام آن منطقه نتایج کاملی را به همراه نخواهد داشت، زیرا اکثر نام مکان ها در عنوان یا توضیحات نقشه ظاهر نمی شوند.
حاشیه نویسی دستی یا ارجاع جغرافیایی این مجموعه ها می تواند یک فرآیند خسته کننده باشد. بنابراین، موسسات عمدتاً بر روی مهمترین موارد موجود در مجموعه خود تمرکز می کنند. رویکردهای جمع سپاری اغلب برای حاشیه نویسی این مجموعه ها با ابرداده های ارزشمند استفاده می شود. برای نقشه های شطرنجی، معمولاً از یک برنامه تعاملی برای ارجاع جغرافیایی نقشه ها به صورت دستی استفاده می شود [ 1 ، 2 ، 3]. کاربران باید هم در نقشه شطرنجی و هم در مکان های مربوطه روی زمین، نقاط کنترل منطبق را انتخاب کنند. سپس برنامه به طور خودکار نقشه شطرنجی را ارجاع داده و تصحیح می کند. با توجه به اینکه نقاط کنترل به درستی انتخاب شده اند، این تکنیک نتایج دقیقی را ارائه می دهد. هنگامی که نقشههای مجموعه به زمین ارجاع داده شدند، میتوان آنها را برای مناطق خاص مورد نظر جستجو کرد. با این حال، جستجوی نامها هنوز کارآمد نیست، زیرا هر نقشه باید به صورت دستی برای نامهای مورد نظر بررسی شود.
برای پرس و جو از نام های موجود بر روی نقشه، آنها باید حاشیه نویسی شوند. حاشیه نویسی دستی برای یک نقشه می تواند تا چند ساعت طول بکشد، که برای مجموعه های بزرگ امکان پذیر نیست. بنابراین، رویکردهای تشخیص و تشخیص متن را می توان برای شناسایی و رونویسی متن موجود بر روی نقشه ها به طور خودکار مورد استفاده قرار داد. در مقایسه با رویکرد تشخیص کاراکترهای نوری سنتی (OCR) برای تصاویر اسناد اسکن شده، که در آن متن در خطوط و پاراگراف های افقی ساختار یافته است، نقشه های شطرنجی با چالش های بیشتری همراه هستند. برچسبهای متنی میتوانند دستنویس باشند، در جهتها، اندازهها، فونتها و رنگهای مختلف ظاهر شوند، روی یکدیگر همپوشانی داشته باشند و حتی به همراه ویژگیهای جغرافیایی توصیفشده (مانند رودخانهها) منحنی شوند [ 4 ]]. علاوه بر این، نقشههای تاریخی را میتوان با وضوح پایینتر تخریب یا دیجیتالی کرد و دقت رونویسی را بیشتر کاهش داد [ 5 ].
متن شناسایی شده را می توان از طریق ژئوکدرهای در دسترس عموم به نام های صحیح معاصر پیوند داد. این ژئوکدرها حاوی میلیونها نام نامیده میشوند و سعی میکنند یک رشته ورودی را با پایگاه داده خود مطابقت دهند. برای محاسبه خطاهای املایی، تطبیق فازی اغلب استفاده می شود. تطبیق فازی شامل تطابقات غیردقیق است و برای نقشههای تاریخی ضروری است، زیرا برخی از نامها در طول زمان املای متفاوتی دارند. پیوند دادن متن شناسایی شده به ژئوکدرها و دادههای باز، دسترسی به نقشه را بهبود میبخشد و با حذف موارد مثبت کاذب، خطاهای تشخیص را کاهش میدهد.
این کار یک خط لوله غنیسازی نقشه و ارجاع جغرافیایی عمومی را بر اساس مدلهای تشخیص متن پیشرفته و ژئوکددرهای در دسترس عموم پیشنهاد میکند. این رویکرد موقعیت جغرافیایی دقیقی را برای هر نقشه فراهم می کند و متن و نام های قابل مشاهده را به عنوان داده های باز پیوند داده شده (LOD) استخراج می کند. سپس نقشه های پردازش شده را می توان با حداقل خطای موقعیت جغرافیایی در یک GIS ادغام کرد و محتوای آنها اکنون قابل جستجو است. ما خط لوله را برای نقشه های توپوگرافی از بلژیک و هلند اعمال می کنیم، اما تخمین می زنیم که این خط لوله می تواند برای مجموعه های مشابهی از نقشه های شطرنجی (توپوگرافی) اعمال شود. کد به صورت عمومی در https://github.com/kymillev/geolocation در دسترس است.
این مقاله به صورت زیر سازماندهی شده است: بخش 2 کارهای مربوط به تشخیص متن، تطبیق نام نامها، و مکانیابی خودکار زمینشناسی را مورد بحث قرار میدهد. بخش 3 جزئیات تشخیص متن، کدگذاری جغرافیایی، و الگوریتم موقعیت جغرافیایی توسعه یافته را شرح می دهد. بخش 4 مجموعه داده ها را تشریح می کند و نتایج به دست آمده را ارائه می کند. بخش 5 بحثی از رویکرد ما ارائه میکند، مزایا و معایب اصلی را خلاصه میکند و نتایج را با تحقیقات مرتبط مقایسه میکند. مقاله با نتیجه گیری در بخش 6 به پایان می رسد .
2. کارهای مرتبط
تشخیص متن یکی از زمینه های اصلی بینایی کامپیوتر است و تمرکز بسیاری از مقالات و مطالعات تحقیقاتی بوده است. با ظهور شبکههای عصبی کانولوشنال، تکنیکهای یادگیری ماشینی تحت نظارت برای OCR و تشخیص متن (صحنه) به پیشرفتهترین حالت تبدیل شدند. نتایج OCR روی تصاویر اسناد اسکن شده از ابزارهای پیشرفته و تجاری به طور کلی عالی هستند و بیشتر به کیفیت اسکن بستگی دارد [ 6 ]. تشخیص متن در تصاویر طبیعی معمولا سخت تر است، زیرا این تصاویر معمولاً دارای تنوع بیشتری از فونت ها و پس زمینه متن هستند. با افزایش مجموعه دادههای بزرگتر و متنوعتر (به عنوان مثال، ICDAR2015 و Coco-Text [ 7 ، 8 ])، مدلهای پیشرفته تشخیص و تشخیص متن میتوانند از قبل به دقت نسبتاً بالایی دست یابند.9 ]. بسیاری از آن آثار مدل های از پیش آموزش دیده و کدهای مورد نیاز برای استفاده از آنها را منتشر می کنند. با این حال، هنگام استفاده از این مدلها بر روی نقشههای شطرنجی، هم تشخیص متن و هم عملکرد تشخیص به طور کلی بدتر هستند، حتی در هنگام استفاده از خدمات بازشناسی تجاری [ 10 ]. این کاهش عملکرد عمدتاً به دلیل پیچیدگی بالاتر پسزمینه و قرار دادن برچسب متنی برای نقشههای شطرنجی در مقایسه با تصاویر طبیعی است.
با توجه به این دقت پایین در نقشه های شطرنجی، تکنیک های پیش و پس پردازش اغلب برای بهبود نتایج استفاده می شود. یک رویکرد رایج این است که ابتدا برچسب های متن را از نقشه استخراج کنید و سپس تشخیص متن را انجام دهید. ترکیبی از تکنیک های بینایی کامپیوتری، مانند تجزیه و تحلیل اجزای متصل و کمی سازی رنگ، می تواند برای متمایز کردن برچسب های متنی از پس زمینه نقشه های شطرنجی استفاده شود. همه این تکنیکها نتایج مشابهی تولید میکنند، یعنی تصاویر باینریزه شده که پردازش آنها آسانتر است [ 11 ، 12 ]. از آنجایی که تشخیص خودکار متن پیشزمینه از پسزمینه دشوار است، میتوان از رویکرد نیمه خودکار برای بهبود نتایج استفاده کرد. چیانگ و همکاران [ 13] یک تکنیک عمومی و نیمه خودکار تشخیص متن را توسعه داد که در آن کاربران باید تعداد کمی از محصولات را روی نقشه ها برچسب گذاری کنند و نشان دهند که آیا آنها حاوی متن هستند یا خیر. سپس از تکنیکهای بینایی کامپیوتری برای همگن کردن متن چند جهته و منحنی استفاده کردند. این تکنیک های پیش پردازش دقت تشخیص نرم افزار OCR مورد استفاده را به شدت افزایش داد.
پس از تشخیص متن روی نقشه، می توان از ژئوکددرها برای تطبیق برچسب های متنی با نام های مربوطه و مکان مختصات آنها استفاده کرد. سپس می توان از این مختصات برای تخمین موقعیت جغرافیایی صحیح نقشه استفاده کرد. با این حال، هنگام تطبیق متن شناخته شده با نام اصلی، مشکلات زیادی رخ می دهد. املای یک نام نامی ممکن است در طول زمان تغییر کرده باشد و احتمالاً تشخیص آن دارای اشتباهاتی است. بنابراین، تطبیق رشته فازی برای مقابله با این اشتباهات املایی مورد نیاز است. با این حال، ابهام نام مکان ها، که با تطبیق فازی بیشتر شده است، می تواند بسیاری از موارد مثبت کاذب را ایجاد کند. هنگامی که برای یک رشته معین پرس و جو می شود، یک ژئوکدگذار ممکن است تعداد زیادی نام از کشورهای مختلف را برگرداند. این امر تعیین تطابق، در صورت وجود، برای برچسب متن داده شده را دشوار می کند. این مشکلات زمانی تشدید میشوند که نامهای رایج خیابانها یا نقاط مورد علاقه (مثلاً خیابان اصلی، کلیسا) شناسایی شوند. حتی ممکن است نام نامی در پایگاه داده geocoder وجود نداشته باشد، این امکان برای نقشه های قدیمی بیشتر افزایش می یابد. احتمال دیگر این است که نام اصلی به هیچ وجه تشخیص داده نشود. با این حال، از آنجایی که نقشههای توپوگرافی عموماً حاوی نامهای بسیار زیادی هستند که نسبتاً به یکدیگر نزدیک هستند، میتوان اکثر موارد مثبت کاذب را فیلتر کرد و مکان کلی نقشه را تخمین زد.
واینمن [ 14 ] از این اطلاعات به همراه مختصات جغرافیایی نام های نامی شناخته شده و قرار دادن برچسب های مشخصه برای ساخت یک مدل احتمالی استفاده کرد که دقت تشخیص متن را بهبود بخشید. او نرخ خطای کلمه را در مقایسه با خروجی OCR خام 36 درصد کاهش داد. در [ 15]، چارچوبی برای یک رویکرد پردازش نقشه منبع باز خودکار ارائه شده است. بخشی از چارچوب شامل یک ماژول برای مکانیابی خودکار زمینشناسی است. به عنوان یک نتیجه اولیه از این ماژول، اولین تطابق نام نامی برای یک برچسب با ارزش اطمینان 90٪ یا بیشتر که از API Google Geocoding به دست آمده بود برای مکان یابی هر نقشه استفاده شد. نتایج ژئوکدینگ خوشهبندی شدند و از مرکز بزرگترین خوشه برای پیشبینی مرکز واقعی نقشه استفاده شد. سپس این رویکرد بر روی 500 نقشه به طور تصادفی انتخاب شده از مجموعه نقشه جغرافیایی NYPL ( https://spacetime.nypl.org ) اعتبارسنجی شد.قابل دسترسی در 20 مه 2022). نتایج امیدوارکننده بود: 37٪ از نقشه های جغرافیایی در شعاع 15 کیلومتری از مختصات حقیقت زمین و 28٪ در شعاع 5 کیلومتری قرار داشتند. نویسندگان خاطرنشان کردند که در نظر گرفتن تنها یک تطابق کلمه برای هر برچسب متن بسیار محدود کننده است و تشخیص متن گاهی اوقات قادر به شناسایی برچسب های متنی کافی نیست. در یک کار بعدی توسط همان نویسندگان، آنها یک تکنیک پیوند متن را توسعه دادند که نتایج را بیشتر بهبود بخشید [ 16 ]. با استفاده از محتوای متنی و بصری، آنها توانستند مدلی را آموزش دهند که بتواند به درستی چندین کلمه از یک عبارت مکان را پیوند دهد (به عنوان مثال، پیوند “Los” و “Angeles” به “Los Angeles”). پیوند متنی تعداد تطابق ژئوکدرهای مثبت کاذب را بسیار کاهش داد و موقعیت جغرافیایی را دقیق تر کرد.
هدف ما ارائه یک تکنیک کلی موقعیت جغرافیایی بر اساس نتایج تشخیص متن از نقشه های توپوگرافی بود. ما از مدلهای تشخیص و شناسایی متن از پیش آموزشدیده استفاده کردیم تا نشان دهیم که میتوان نقشههای شطرنجی توپوگرافیک را بدون نیاز به مجموعه دادههای برچسبگذاریشده و مدلهای سفارشی بهدقت جغرافیایی و حاشیهنویسی کرد. این رویکرد ما را برای بسیاری از مؤسسات و محققانی که مایلند مجموعههای نقشههای شطرنجی دیجیتالی خود را با حداقل ورودی دستی حاشیهنویسی کنند، مفید میکند. مدل های تشخیص و تشخیص متن را می توان با سایر سرویس های تشخیص متن جایگزین کرد. مدل از پیش آموزش دیده ( https://github.com/faustomorales/keras-ocr در 20 مه 2022 قابل دسترسی است) از آشکارساز متنی مشابه در [ 17 ] و از همان مدل تشخیص مانند [ 18 ] استفاده می کند.]. مزیت اصلی استفاده از این مدل تشخیص بر خلاف آشکارساز متن محبوب دیگری مانند EAST [ 19 ]، این است که این مدل برای تشخیص متن در سطح کاراکتر آموزش داده شده است که انعطاف پذیری بیشتری را برای متن چرخانده و منحنی فراهم می کند.
3. روش شناسی
این مطالعه با هدف ارائه یک خط لوله عمومی به نقشه های شطرنجی توپوگرافی ژئو ارجاع و استخراج متن و نام های قابل مشاهده به عنوان داده های باز پیوند شده (LOD). نمای کلی کل خط لوله در شکل 1 آورده شده است. اولین مرحله در خط لوله، پیش پردازش نقشه های شطرنجی و استخراج منطقه نقشه واقعی است. بیشتر نقشه های شطرنجی دیجیتالی حاوی اطلاعات اضافی در خارج از مرز نقشه هستند که می تواند بر دقت موقعیت جغرافیایی تأثیر بگذارد. مرحله دوم خط لوله به جزئیات تشخیص متن و کدگذاری جغرافیایی می پردازد. برگه های نقشه با وضوح بالا معمولاً برای پردازش بیش از حد بزرگ هستند، بنابراین به کاشی هایی با اندازه مساوی تقسیم می شوند. متن روی هر کاشی شناسایی میشود، تشخیصهای متن همپوشانی با هم ادغام میشوند و متعاقباً کدگذاری جغرافیایی میشوند. در مرحله بعد، هم محل متن شناسایی شده (مختصات پیکسل) و هم مکان نتایج تطبیق کدگذاری جغرافیایی (مختصات جغرافیایی) برای تخمین موقعیت جغرافیایی نقشه استفاده می شود. پس از شناسایی و کدگذاری جغرافیایی متن روی هر نقشه، هر برچسب متنی با لیستی از مختصات موقعیت جغرافیایی احتمالی مطابقت داده شد. برای ارجاع جغرافیایی نقشه ها، ما باید نقاط کنترلی را روی نقشه و مختصات WGS84 مربوط به آنها (طول و عرض جغرافیایی) پیدا کنیم. با استفاده از این جفتهای نقطه (تطبیق جفتهای پیکسل و مختصات جغرافیایی)، میتوان یک تبدیل برای تبدیل مختصات پیکسل به مختصات جغرافیایی و بالعکس محاسبه کرد. ما یک الگوریتم تکراری ایجاد کردهایم که از مکانهای برچسب متنی و تطابق ژئوکدگذار آنها برای تولید چهار نقطه کنترل که نمایانگر چهار گوشه نقشه در مختصات WGS84 هستند، استفاده میکند. سپس اینها با مختصات جغرافیایی گوشه صحیح مقایسه می شوند تا دقت روش ما برآورد شود. موقعیت جغرافیایی نقشه در چند مرحله با تخمین یک منطقه اولیه مورد علاقه (ROI) تعیین شد. سپس این ROI با حذف مکرر موارد پرت از طریق یک رویکرد فیلترینگ RANSAC بیشتر اصلاح شد. در هر مرحله، ما منطبقات ژئوکدر را که احتمال درستی کمی داشتند فیلتر کردیم. ROI جدید بهعنوان جعبه مرزی مطابقتهای مختصات جغرافیایی که پس از فیلتر باقی میماند، انتخاب شد. این ROI متعاقباً تا زمانی که هیچ چیز پرت دیگری پیدا نشد، پالایش شد. در نهایت، مکان برچسبهای متنی روی نقشه شطرنجی و مختصات جغرافیایی تطبیق آنها برای محاسبه چهار نقطه کنترل و ارجاع جغرافیایی نقشه استفاده شد. خروجی را می توان به عنوان GeoJson یا هر فرمت رایج دیگری ذخیره کرد و حاوی موقعیت جغرافیایی نقشه تخمینی، متن شناسایی شده روی نقشه و نام های موجود به عنوان LOD است. مکان برچسب های متنی روی نقشه شطرنجی و مختصات جغرافیایی تطبیق آنها برای محاسبه چهار نقطه کنترل و ارجاع جغرافیایی نقشه استفاده شد. خروجی را می توان به عنوان GeoJson یا هر فرمت رایج دیگری ذخیره کرد و حاوی موقعیت جغرافیایی نقشه تخمینی، متن شناسایی شده روی نقشه و نام های موجود به عنوان LOD است. مکان برچسب های متنی روی نقشه شطرنجی و مختصات جغرافیایی تطبیق آنها برای محاسبه چهار نقطه کنترل و ارجاع جغرافیایی نقشه استفاده شد. خروجی را می توان به عنوان GeoJson یا هر فرمت رایج دیگری ذخیره کرد و حاوی موقعیت جغرافیایی نقشه تخمینی، متن شناسایی شده روی نقشه و نام های موجود به عنوان LOD است.
این رویکرد به نحوه ایجاد برچسبهای متنی و تطابق کدهای جغرافیایی بستگی ندارد. بنابراین، می توان آن را با هر سیستم تشخیص متن و geocoder استفاده کرد. دقت مکان جغرافیایی تا حد زیادی به دقت تشخیص متن و نتایج geocoder بستگی دارد. اگر نقشه کیفیت پایینی داشته باشد و اکثر برچسب های متنی شناسایی نشوند، نتایج ضعیف خواهند بود. برای هر برچسب متنی، مکان آن را روی نقشه به عنوان نقطه مرکزی کادر تشخیص متن تعیین می کنیم. در حالت ایدهآل، ما فهرستی از مکانهای پیکسل و یک مکان مختصات جغرافیایی مناسب برای هر کدام میخواهیم که امکان استفاده از همه این جفتهای نقطه برای ارجاع جغرافیایی نقشه را فراهم میکند. با این حال، از آنجایی که هم نتایج تشخیص متن و هم نتایج ژئوکددر حاوی خطا هستند، نمیتوانیم مطمئن باشیم که هر یک از نامهای نام و ژئوکددر درست است. فقط موقعیت هر برچسب متنی روی نقشه نسبتاً دقیق است. برای به دست آوردن نتایج دقیق تر، مسابقات geocoder که احتمال درستی کمی دارند باید فیلتر شوند. تمام ارقام ارائه شده در این بخش به همان نقشه توپوگرافی Gent-Melle از مجموعه داده M834 اشاره دارد (نگاه کنید بهبخش 4.1 ). هر شکل جفتهای نقطهای را نشان میدهد که در حال حاضر در هر مرحله از الگوریتم در نظر گرفته شدهاند.
3.1. پیش پردازش
مجموعه داده برگه های نقشه توپوگرافی تاریخی از بلژیک حاوی اطلاعات اضافی خارج از مرز نقشه است. هر نقشه با یک حاشیه سیاه و مقداری فضای خالی احاطه شده است که در آن اطلاعات مختصات داده می شود. در هر گوشه، نقشه بر اساس دادههای بلژیکی 1972 ارجاع داده میشود. اعداد اطراف نقشه مختصات X و Y را در طرح لامبرت72 بلژیکی نشان میدهند [ 20]. این مجموعه داده ابتدا پیش پردازش شد و منطقه نقشه موثر تعیین شد. استخراج منطقه نقشه موثر برای مکان یابی نقشه به شدت ضروری نیست. این تکنیکهای مورد استفاده را کمی دقیقتر میکند، زیرا برش تصویر اکنون فقط شامل خود نقشه است، اما نه افسانه، مختصات اطراف، و نامهای نامی. این برچسبها میتوانند به اشتباه به عنوان نامهای نامی شناسایی شوند که منجر به مثبت کاذب اضافی میشود. شکل 2 گوشه سمت چپ بالای یکی از نقشه های توپوگرافی و منطقه نقشه استخراج شده را نشان می دهد.
عملیات مورفولوژیکی (فرسایش و اتساع) برای تشخیص مرزهای سیاه ضخیم اطراف هر نقشه استفاده شد. سپس، محصولات کوچک در امتداد لبه های نقشه برداشت شدند. متن درون این محصولات شناسایی شد. برای هر دو لبه سمت چپ و راست، محصولات ابتدا چرخانده شدند تا مختصات X/Y قائم باشند. ما از محل این برچسبهای متنی اطراف برای تعیین منطقه نقشه موثر استفاده کردیم. تشخیص این منطقه داخلی با عملیات مورفولوژیکی به تنهایی به دلیل لبه های بیرونی نازک و چرخش های جزئی برخی از نقشه های اسکن شده ناسازگار بود. پس از شناسایی هر برچسب متن، مختصات لامبرت فیلتر شد و از متن باقی مانده برای استخراج منطقه نقشه موثر استفاده شد.
3.2. تشخیص متن
از آنجایی که تصاویر صفحات نقشه وضوح بسیار بالاتری نسبت به تصاویر معمولی دارند، عملکرد مدل تشخیص متن در کل مجموعه داده ضعیف بود. برچسبهای نوشتاری کوچکتر به طور مداوم هنگام استفاده از نقشههای اندازه کامل شناسایی نمیشوند. این احتمالاً به دلیل مدل تشخیص متن با استفاده از آستانه های جهانی برای بخش بندی مناطق متن است. بنابراین، از روش کاشی کاری برای بهبود نتایج استفاده شد. کار قبلی نشان داد که اندازههای کاشی بزرگتر بر کاشیهای کوچکتر ترجیح داده میشوند [ 10]. هر تصویر به چندین کاشی 2500 × 2500 پیکسل، با یک منطقه همپوشانی (در هر دو X و Y) 500 پیکسل تقسیم شد. تشخیص و تشخیص متن در هر یک از کاشی ها انجام شد. برچسبهای نوشتاری شناساییشده در ناحیه همپوشانی با برچسبهای متنی همپوشانی و مشابه از کاشیهای مجاور ادغام شدند تا از تقسیم کلمات در لبههای هر کاشی جلوگیری شود. پس از ادغام، متن شناسایی شده پس پردازش شد.
ابتدا برچسبهای متنی که فقط حاوی اعداد بودند فیلتر شدند. این برچسبها خطوط ارتفاع، نقاط عطف کیلومتری، یا بخشهای بزرگراه را نشان میدهند و نتایج معنیداری را در مراحل ژئوکدر زیر ارائه نمیدهند. در مرحله بعد، تشخیصهای همپوشانی برچسبهای متنی متعدد ادغام شدند، زیرا بسیاری از نامها از چند کلمه تشکیل شدهاند. این می تواند با ادغام نادرست خطاهای اضافی ایجاد کند. بنابراین، تشخیص های همپوشانی تنها در صورتی ادغام می شوند که جهت گیری های نسبی آنها در 15 درجه از یکدیگر باشد. ما دریافتیم که این آستانه اکثر برچسبهای ادغام شده نادرست را حذف میکند. مشکلات جزئی هنوز هم گهگاه به دلیل خطاهای تشخیص متن و ترتیب پیچیده نامها رخ میدهد. شکل 3یکی از این ترتیبات پیچیده را نشان می دهد که در آن هر برچسب شناسایی شده با دیگری همپوشانی دارد و همچنین نتیجه را پس از ادغام نشان می دهد.
هنگام ادغام چندین برچسب متنی همپوشانی، آنها را در جهت خواندن طبیعی مرتب کردیم. تشخیص های فردی ابتدا از بالا به پایین دسته بندی شدند و بر اساس تفاوت در مختصات Y آنها به گروه های مختلف تقسیم شدند. سپس، هر گروه به صورت جداگانه از چپ به راست مرتب شد و در نتیجه جهت خواندن طبیعی بود. فقط برچسبهای متنی (معمولاً نشاندهنده رودخانهها) که از پایین به چپ به سمت راست بالا خوانده میشوند، گاهی اوقات به اشتباه ادغام میشوند.
همانطور که در شکل 4 مشاهده می شود، متن عمودی معمولاً به درستی تشخیص داده می شود، اما اغلب به اشتباه رونویسی می شود .آ. همانطور که مدل تشخیص فرض می کند که متن از چپ به راست جهت گیری می کند، چنین خطاهایی رخ می دهد. پس از شناسایی منطقه متن موثر، برش های تصویر به متن افقی تاب خورده شدند. اگر برچسب به صورت عمودی بود، این تغییر شکل باید تنظیم شود تا به درستی تاب بخورد. اگر سمت چپ ترین نقطه برچسب متنی در بالا باشد، متن معمولاً از بالا به پایین خوانده می شود. به دلیل خطاهای جزئی در تشخیص متن، ما همیشه نمیتوانیم به مختصات جعبههای مرزی پیشبینیشده تکیه کنیم، بنابراین دو تبدیل تابخوردگی ممکن است. هر دو تبدیل تصویر انجام شد و متن شناسایی شد. در مرحله بعد، پیش بینی نادرست با استفاده از نتایج geocoder فیلتر شد. شکل 4b مثالی از راه حل پیشنهادی را نشان می دهد. ما فرض می کنیم که می توان از راه حل ظریف تری برای تعیین جهت گیری متن صحیح بر اساس اطلاعات بصری یا محتوای متن استفاده کرد. از آنجایی که هر نقشه فقط شامل تعداد انگشت شماری از چنین برچسب های متنی عمودی است، چنین پیشرفتی به عنوان کار آینده باقی مانده است. از آنجایی که هدف اصلی این کار این است که نشان دهد چگونه میتوان از مدلهای تشخیص و تشخیص متن خارج از قفسه برای ارجاع جغرافیایی مؤثر نقشههای شطرنجی توپوگرافی با تنظیمات کمی استفاده کرد. هیچ پردازش یا پیوند اضافی از برچسب های متنی شناسایی شده انجام نشد.
3.3. ژئوکدینگ
پس از شناسایی و پردازش برچسبهای متنی روی نقشه، چندین ژئوکدر با هر برچسب متنی پیشبینیشده پرس و جو شد. رشتههای کوتاهتر از سه کاراکتر نادیده گرفته شدند، زیرا به ندرت نتایج معنیداری را نشان میدادند. سه سرویس جغرافیایی مختلف استفاده شد: Google Geocoding، TomTom Geocoding و Geonames (متن باز). ما در ابتدا قصد داشتیم فقط از Geonames استفاده کنیم، اما متوجه شدیم که بسیاری از پرسوجوها نتایج معنیداری نداشتند، در حالی که مطابقت خوبی با geocoderهای تجاری پیدا شد. برای هر ژئوکدر، نام های به دست آمده با رشته پرس و جو از طریق امتیاز شباهت جزئی رشته ( https://github.com/seatgeek/thefuzz#partial-ratio در 20 مه 2022) مقایسه شد. دو رشته به طول n و m داده می شوداگر رشته کوتاهتر طول m باشد، شباهت جزئی رشته امتیاز شباهت بهترین رشته فرعی طول-m را برمیگرداند. این امتیاز بر اساس فاصله محبوب Levenshtein ( https://en.wikipedia.org/wiki/Levenshtein_distanceقابل دسترسی در 20 مه 2022). این امتیاز شباهت از 0 (عدم تطابق) تا 100 (تطابق کامل زیر رشته) متغیر است. ما دریافتیم که این امتیاز بهتر از فاصله استاندارد Levenshtein، به ویژه برای سیمهای کوتاهتر عمل میکند. برای هر مسابقه، نام نام، مختصات جغرافیایی، شباهت و نوع (محل پرجمعیت، خیابان و غیره) ذخیره شد. همانطور که از چندین ژئوکددر استفاده کردیم، این نتایج حاوی موارد تکراری بود. در صورت وجود تطابق دقیق برای نام و نوع نام و اگر هر دو مختصات به یکدیگر نزدیک بودند، موارد تکراری حذف میشوند. بررسی نزدیکی آنها مهم است زیرا دو مکان یا خیابان متفاوت می توانند نام یکسانی داشته باشند. برخی از مسابقات تکراری هنوز باقی مانده بودند، اما این موارد تأثیر کمی بر منطقه نهایی مورد علاقه داشتند.
هر نقشه به ترتیب شامل 365 و 671 برچسب متن قابل استفاده برای مجموعه داده بلژیکی (M834) و هلندی (TOP50raster) بود. یک هیستوگرام از تطابق ژئوکدر در هر برچسب متنی برای هر دو مجموعه داده در شکل 5 نشان داده شده است . واضح است که توزیع ها نامتقارن هستند و اکثر برچسب های متنی دارای تعداد کمی تطابق هستند. برچسبهایی که تعداد منطبقها بیشتر است، کمترین اطلاعات را برای پیشبینی منطقه مورد علاقه دارند، زیرا این نامها نشاندهنده نامهای مکان رایج هستند که در یک منطقه بزرگ پخش شدهاند.
3.4. تخمین منطقه مورد علاقه اولیه
از آنجایی که برخی از نامهای مکان رایج هستند، پرس و جوهای خاص بیش از 100 ژئوکدر منطبق را به دست آوردند. نامهای بسیاری از خیابانها، مانند «Kerkstraat» (مقایسه با «خیابان اصلی» در ایالات متحده آمریکا)، در شهرهای بلژیک رایج است. ترسیم این مختصات منطبقات احتمالی را در سراسر بلژیک و هلند و تعداد کمی از مکانهای تصادفی در سراسر جهان نشان داد. حتی اگر ژئوکدرها اجازه می دهند یک کشور مشخص شود، نتایج همیشه به آن کشور محدود نمی شود. اکثر این تطابقات ژئوکدر برای متن درخواست شده صحیح نبودند. آنها یا نام مکان و خیابان رایج بودند یا به دلیل تطابق فازی ژئوکدرها پیدا شدند. شکل 6a مختصات تمام تطابقات اولیه ژئوکدر را برای همه برچسب های متنی شناسایی شده روی نقشه Gent-Melle نشان می دهد. واضح است که اینها در سرتاسر بلژیک توزیع میشوند، با برخی موارد پرت.
بنابراین برچسبهای متنی با تعداد زیادی تطابق برای پیشبینی منطقه مورد علاقه اولیه چندان مرتبط نیستند. به طور مشابه، مسابقات geocoder با شباهت رشته کمتر با برچسب متنی مربوطه، احتمال درستی کمتری دارند. بنابراین، منطبقهای ژئوکدر را با شباهت جزئی رشتهای زیر 90 کنار گذاشتیم. پس از آن، برچسبهای متنی که حاوی بیش از پنج تطابق ژئوکددر بودند نیز کنار گذاشته شدند. به این ترتیب بدترین تطابق رشته ها و رایج ترین نام مکان ها فیلتر شدند. این نامها هنوز در صدها کیلومتر پراکنده بودند و خوشهبندی آنها مناطق عظیمی را به وجود آورد. بنابراین، مسابقات geocoder نیز با فاصله مختصات نسبی آنها فیلتر شدند. با فرض اینکه مطابقت های صحیح پیدا شد، فواصل نسبی آنها باید کم باشد و باید به طور نسبتاً یکنواخت روی نقشه توزیع شوند. پس از آن، هر مختصات صحیح باید نسبتا نزدیک به سایر مختصات صحیح باشد. بنابراین، فاصله هارسینه بین نامزدهای نامگذاری محاسبه شد و اگر فاصله تا هر یک از پنج نزدیکترین همسایه بیشتر از 100 کیلومتر بود یا اگر فاصله تا نزدیکترین همسایه بیشتر از 25 کیلومتر بود، تطابق ژئوکدر حذف شد. این فیلتر اضافی تضمین کرد که نقاط پرت واضح حذف شدند. این آستانه های فاصله تا حدودی به مقیاس نقشه بستگی دارد. با این حال، اکثر نقشه های توپوگرافی حاوی نام های بسیاری هستند، بنابراین فاصله نسبی مطابقت های صحیح باید کم باشد. برای مجموعه دادههای مورد استفاده، آستانه فاصله بسیار کمتری میتواند انتخاب شود، زیرا قطر هر نقشه تنها تقریباً 19 و 32 کیلومتر را پوشش میدهد.
سپس، ژئوکوئوردیناتهای باقیمانده با الگوریتم خوشهبندی DBSCAN [ 21 ]، که مناطق با چگالی بالاتر را خوشهبندی میکند، خوشهبندی شدند. این خوشه بندی موارد پرت اضافی را حذف کرد و همچنین در کارهای قبلی با موفقیت مورد استفاده قرار گرفت [ 15 ، 16 ]. ما از متقابل تعداد تطابق ژئوکدر به عنوان وزن نمونه برای هر نقطه استفاده کردیم. به این ترتیب، امتیازات با چندین مسابقه وزن کمتری در خوشهبندی دریافت کردند. جعبه مرزی خوشه پیدا شده به عنوان منطقه اولیه مورد نظر در نظر گرفته شد. اگر چند خوشه پیدا شد، خوشه ای که بیشترین امتیاز را داشت انتخاب می شد. شکل 6b نتیجه را پس از کنار گذاشتن مختصات با احتمال کم و خوشه بندی نمایش می دهد. نمودار دقیق تر از مختصات باقی مانده پس از تعیین یک منطقه اولیه مورد علاقه برای نقشه Gent-Melle در شکل 7 نشان داده شده است .
3.5. پالایش منطقه مورد علاقه
برای اصلاح منطقه مورد نظر اولیه، هم از مکانهای برچسبهای متنی و هم از مکانهای مختصات تطابق ژئوکددر آنها استفاده کردیم. به طور کلی، مکان نسبی پیکسل روی نقشه باید بسیار شبیه به مکان مختصات نسبی تطابق نام نامی مربوطه باشد. به طور مشابه، برچسبهای متنی که روی نقشه از یکدیگر دورتر هستند، باید مختصات جغرافیایی متناظری داشته باشند که دورتر از یکدیگر نیز قرار دارند. به طور طبیعی، مکان دقیق برچسب متنی به طور کامل با مختصات ژئوکدر صحیح مطابقت نخواهد داشت. با این حال، نقاط پرت را می توان فیلتر کرد، زیرا این خطا به طور متوسط برای تطابق نادرست geocoder بسیار بزرگ است.
ما از یک رویکرد مبتنی بر RANSAC برای حذف اکثر تطابقات مختصات مثبت کاذب استفاده کردیم. RANSAC یک الگوریتم تکراری عمومی است که میتواند با یک مدل مطابقت داشته باشد در حالی که هنوز نسبت به موارد پرت قوی است [ 22 ]. شکل 8 یک نمای کلی از فیلتر بیرونی مبتنی بر RANSAC را نشان می دهد. ابتدا مجموعهای از جفتهای نقطه درونی بهطور تصادفی از بین تمام جفتهای نقطه ممکن انتخاب شد. به هر برچسب متنی شناسایی شده و مکان پیکسل مربوطه روی نقشه شطرنجی، احتمال 50 درصد انتخاب داده شد. برای هر مکان پیکسل انتخاب شده، ما به طور تصادفی یکی از تطابقات مختصات جغرافیایی مربوطه را انتخاب کردیم. این یک مجموعه تصادفی از جفت نقطه های درونی تولید کرد. با فرض صحیح بودن این موارد، موقعیت جغرافیایی نقشه پیش بینی شده بود (به بخش 3.6 مراجعه کنید.). سپس از این موقعیت جغرافیایی برای فیلتر کردن انتخاب جفت نقاط اضافی در الگوریتم RANSAC استفاده شد. برای هر جفت نقطه دیگری که در ابتدا انتخاب نشده بود، ما دو بررسی انجام دادیم تا تصمیم بگیریم که آیا اینها باید به مجموعه ای از ورودی ها اضافه شوند یا خیر. ابتدا، بررسی کردیم که آیا مختصات جغرافیایی در داخل موقعیت جغرافیایی پیش بینی شده قرار دارند یا خیر. بعد، خطای موقعیت نسبی (به بخش 3.7 مراجعه کنید) محاسبه شد. اگر نقطه در داخل موقعیت جغرافیایی قرار داشت و خطا از حد آستانه از پیش تعیین شده کوچکتر بود، نقطه را به عنوان نام نامزد اضافه می کنیم. در نهایت، هر دو ورودی اولیه و نامزدهای جدید برای پیشبینی جدید موقعیت جغرافیایی نقشه و محاسبه میانگین خطای فاصله نسبی روی تمام جفتهای نقطه انتخاب شده استفاده شدند. کل این فرآیند برای 10000 تکرار تکرار شد و مجموعه ای از جفت های نقطه با کمترین میانگین خطا برای پردازش بیشتر انتخاب شد.
3.6. پیش بینی موقعیت جغرافیایی
همانطور که قبلا ذکر شد، مکان یک برچسب متنی بر روی نقشه شطرنجی به طور کامل با موقعیت جغرافیایی نام توپون متناظر آن مطابقت ندارد. یک خطای جزئی برای هر جفت مختصات وجود دارد، زیرا قرار دادن برچسب متنی تا حد زیادی به سایر ویژگیها یا نمادهای جغرافیایی در آن مکان بستگی دارد. اگر برچسب متن با سایر ویژگی های نقشه همپوشانی داشته باشد، معمولاً برای ارائه نمای بهتری از منظره جابجا می شود. یک ویژگی زیربنایی (رودخانه، جاده، و غیره) تغییر نخواهد کرد تا یک برچسب نام نامی به درستی قرار گیرد. همراه با این واقعیت که هنوز نمیتوانیم تضمین کنیم کدام جفت نقطه درست است، از میانگین بردار مختصات همه جفتهای نقطه انتخاب شده برای مکانیابی نقشه استفاده میکنیم تا خطا در قرار دادن برچسب کاهش یابد. به عنوان مثال، حتی اگر برچسبهای نام نامی دارای یک سوگیری ثابت بر خلاف فرضیات ما باشند،
پس از انتخاب تصادفی یک مجموعه اولیه از جفت مختصات درونی، ما موقعیت جغرافیایی نقشه را با فرض صحیح بودن این جفت ها تخمین می زنیم. سپس از این موقعیت جغرافیایی برای فیلتر کردن انتخاب جفت مختصات اضافی در الگوریتم RANSAC استفاده می شود. ابتدا میانگین بردارهای پیکسل و ژئوکوردینات محاسبه شد که منجر به یک جفت نقطه مرکزی شد. سپس، اختلاف بردار مطلق با هر جفت نقطه و مراکز محاسبه شد. تفاوت در X و Y به طور مستقل و همچنین تفاوت در طول و عرض جغرافیایی محاسبه شد. پس از آن، یک ضریب تبدیل خطی بین مختصات پیکسل و مختصات جغرافیایی محاسبه شد. تمام تفاوت های X بر اختلاف طول جغرافیایی تقسیم شدند و به طور مشابه، همه تفاوت ها در Y بر اختلاف عرض جغرافیایی برای هر جفت نقطه تقسیم شدند. ما اکنون یک ضریب تبدیل از پیکسل به مختصات جغرافیایی را برای هر جفت نقطه و نقاط مرکزی محاسبه کرده ایم. از آنجایی که موقعیت برچسب متن کاملاً با مختصات ژئوکددر متناظر مطابقت ندارد، میانه برای هر یک از این فاکتورها انتخاب شد که منجر به یک ضریب تبدیل متوسط از مختصات پیکسل به مختصات جغرافیایی شد. میانه بر میانگین ترجیح داده می شود زیرا نسبت به نقاط پرت قوی تر است. برای محاسبه ضریب تبدیل، فقط به دو جفت نقطه صحیح نیاز داریم. با در نظر گرفتن ضریب میانه همه جفتهای نقطه، واریانس و خطای موقعیت جغرافیایی کاهش مییابد زیرا کاملاً به درستی یک جفت تکیه نمیکند (که نمیتوانیم بدانیم). از آنجا که مبدا مختصات پیکسل با گوشه سمت چپ بالای نقشه شطرنجی مطابقت دارد، ضریب تبدیل Y همچنان باید در -1 ضرب شود. از آنجایی که موقعیت برچسب متن کاملاً با مختصات ژئوکددر متناظر مطابقت ندارد، میانه برای هر یک از این فاکتورها انتخاب شد که منجر به یک ضریب تبدیل متوسط از مختصات پیکسل به مختصات جغرافیایی شد. میانه بر میانگین ترجیح داده می شود زیرا نسبت به نقاط پرت قوی تر است. برای محاسبه ضریب تبدیل، فقط به دو جفت نقطه صحیح نیاز داریم. با در نظر گرفتن ضریب میانه همه جفتهای نقطه، واریانس و خطای موقعیت جغرافیایی کاهش مییابد زیرا کاملاً به درستی یک جفت تکیه نمیکند (که نمیتوانیم بدانیم). از آنجا که مبدا مختصات پیکسل با گوشه سمت چپ بالای نقشه شطرنجی مطابقت دارد، ضریب تبدیل Y همچنان باید در -1 ضرب شود. از آنجایی که موقعیت برچسب متن کاملاً با مختصات ژئوکددر متناظر مطابقت ندارد، میانه برای هر یک از این فاکتورها انتخاب شد که منجر به یک ضریب تبدیل متوسط از مختصات پیکسل به مختصات جغرافیایی شد. میانه بر میانگین ترجیح داده می شود زیرا نسبت به نقاط پرت قوی تر است. برای محاسبه ضریب تبدیل، فقط به دو جفت نقطه صحیح نیاز داریم. با در نظر گرفتن ضریب میانه همه جفتهای نقطه، واریانس و خطای موقعیت جغرافیایی کاهش مییابد زیرا کاملاً به درستی یک جفت تکیه نمیکند (که نمیتوانیم بدانیم). از آنجا که مبدا مختصات پیکسل با گوشه سمت چپ بالای نقشه شطرنجی مطابقت دارد، ضریب تبدیل Y همچنان باید در -1 ضرب شود. منجر به یک ضریب تبدیل متوسط از مختصات پیکسل به مختصات جغرافیایی می شود. میانه بر میانگین ترجیح داده می شود زیرا نسبت به نقاط پرت قوی تر است. برای محاسبه ضریب تبدیل، فقط به دو جفت نقطه صحیح نیاز داریم. با در نظر گرفتن ضریب میانه همه جفتهای نقطه، واریانس و خطای موقعیت جغرافیایی کاهش مییابد زیرا کاملاً به درستی یک جفت تکیه نمیکند (که نمیتوانیم بدانیم). از آنجا که مبدا مختصات پیکسل با گوشه سمت چپ بالای نقشه شطرنجی مطابقت دارد، ضریب تبدیل Y همچنان باید در -1 ضرب شود. منجر به یک ضریب تبدیل متوسط از مختصات پیکسل به مختصات جغرافیایی می شود. میانه بر میانگین ترجیح داده می شود زیرا نسبت به نقاط پرت قوی تر است. برای محاسبه ضریب تبدیل، فقط به دو جفت نقطه صحیح نیاز داریم. با در نظر گرفتن ضریب میانه همه جفتهای نقطه، واریانس و خطای موقعیت جغرافیایی کاهش مییابد زیرا کاملاً به درستی یک جفت تکیه نمیکند (که نمیتوانیم بدانیم). از آنجا که مبدا مختصات پیکسل با گوشه سمت چپ بالای نقشه شطرنجی مطابقت دارد، ضریب تبدیل Y همچنان باید در -1 ضرب شود. واریانس و خطای موقعیت جغرافیایی کاهش می یابد زیرا به طور کامل به صحت یک جفت تکیه نمی کند (که ما نمی توانیم بدانیم). از آنجا که مبدا مختصات پیکسل با گوشه سمت چپ بالای نقشه شطرنجی مطابقت دارد، ضریب تبدیل Y همچنان باید در -1 ضرب شود. واریانس و خطای موقعیت جغرافیایی کاهش می یابد زیرا به طور کامل به صحت یک جفت تکیه نمی کند (که ما نمی توانیم بدانیم). از آنجا که مبدا مختصات پیکسل با گوشه سمت چپ بالای نقشه شطرنجی مطابقت دارد، ضریب تبدیل Y همچنان باید در -1 ضرب شود.
پس از محاسبه بردارهای مختصات مرکزی و ضریب تبدیل، چهار گوشه نقشه را می توان از مختصات پیکسلی به مختصات جغرافیایی متناظر تبدیل کرد. با فرض اینکه موقعیت جغرافیایی پیش بینی شده یک مستطیل است، فقط نقاط چپ بالا و پایین سمت راست باید برای ارجاع جغرافیایی نقشه تبدیل شوند. محاسبه نقاط کنترل به عنوان یک معادله برداری در رابطه ( 1 ) توضیح داده شده است. بود، سی1سی1و سی2سی2به ترتیب نقاط کنترل بالا سمت چپ و پایین سمت راست را مشخص کنید. سیge oسی�ه�و سیx yسیایکس�میانگین بردار مختصات جغرافیایی و پیکسلی، fx y�ایکس�نشان دهنده ضریب تبدیل و بx yبایکس�یک بردار 1 بعدی شامل عرض و ارتفاع نقشه شطرنجی است.
اساساً، بردار ترجمه مختصات میانگین پیکسل و مرزهای نقشه ([0، 0] و [w، h]) محاسبه شده و در ضریب تبدیل ضرب میشود تا بردار ترجمه مربوطه در مختصات جغرافیایی به دست آید. سپس این بردار از میانگین زمین مختصات کم می شود تا به مرزهای نقشه پیش بینی شده در مختصات WGS84 برسد.
3.7. خطای نسبی موقعیت
در هر تکرار RANSAC، مجموعه ای از جفت مختصات درونی به طور تصادفی انتخاب شد و منطقه نقشه پیش بینی شد. برای جفتی که انتخاب نشد، بررسی کردیم که آیا مختصات جغرافیایی در منطقه نقشه پیشبینیشده قرار دارند یا خیر. اگر آنها بودند، خطای موقعیت نسبی محاسبه شد. اگر این خطا کوچکتر از یک آستانه از پیش تعیین شده بود، جفت مختصات به مجموعه ای از نامزدهای جدید اضافه می شود. این خطای موقعیت نسبی ساده اما موثر با مقایسه موقعیت نسبی هر جفت نقطه با جفت نقطه داخلی، برای هر دو مکان پیکسل و مختصات جغرافیایی محاسبه شد. بررسی می کنیم که چند نقطه در سمت چپ/راست نقطه فعلی روی نقشه و چند نقطه در سمت چپ/راست مختصات جغرافیایی مرتبط قرار دارند. ما تفاوت بین این دو مقدار را می گیریم و تفاوت مشابهی را برای چند نقطه در بالا/زیر جفت مشخص شده محاسبه می کنیم. در نهایت، این تفاوت ها جمع شده و بر تعداد جفت نقطه های درونی تقسیم می شوند. به این ترتیب، متریک به تعداد کل جفت های درونی در نظر گرفته شده نرمال می شود. معیار خطا را میتوان بسیار کارآمد محاسبه کرد و بسیاری از موارد پرت را در طول انتخاب نامزد تصادفیسازی شده حذف میکند. ما نتایج خوبی با آستانه 0.05 پیدا کردیم. بنابراین، موقعیت نسبی هر جفت نامزد نامزد باید با حداقل 95 درصد از جفتهای اولیه انتخاب شده برای انتخاب «موافق» باشد. پس از انتخاب این نامزدهای جدید، متریک خطا برای همه جفتهای امتیاز انتخاب شده محاسبه و میانگین میشود. مجموعه زوج های نقطه ای با کمترین میانگین خطای بعد از 10،
3.8. تعیین منطقه نهایی مورد علاقه
اکنون که یک منطقه مورد نظر تعریف شده است و بیشتر جفتهای مختصات پرت با RANSAC فیلتر شدهاند، میتوان موقعیت جغرافیایی نهایی را تخمین زد. ابتدا از جفت مختصات انتخاب شده از مرحله قبل برای پیش بینی موقعیت جغرافیایی نقشه استفاده شد. این نتیجه در شکل 9 نشان داده شده است. پس از تعیین موقعیت جغرافیایی نقشه، برخی از تطابقهای ژئوکددر همچنان میتوانند خارج از منطقه پیشبینیشده قرار بگیرند، یا به دلیل نادرست بودن تطابق آنها یا به دلیل نادرست بودن منطقه پیشبینیشده. ما به طور مکرر با چنین موارد پرت باقی مانده سروکار داریم. نقطه ژئوکوئوردینات پرت را پیدا می کنیم که دورترین نقطه از منطقه پیش بینی شده است، آن جفت نقطه را حذف می کنیم و موقعیت جغرافیایی نقشه را دوباره با تمام جفت های باقی مانده پیش بینی می کنیم. این روند را تا زمانی تکرار میکنیم که دیگر هیچ نقطهای وجود نداشته باشد. پیشبینی حاصل بهترین تخمین ما برای موقعیت جغرافیایی نقشه است. این فرآیند تکراری فیلتر کردن پرت، دقت الگوریتم ما را بیشتر بهبود بخشید. شکل 10 تخمین موقعیت جغرافیایی نهایی و جفت مختصات باقیمانده برای نقشه Gent-Melle را نشان می دهد.
4. ارزیابی
این بخش دو مجموعه داده از نقشه های شطرنجی توپوگرافی مورد استفاده برای اعتبارسنجی تکنیک های ما را شرح می دهد. ما مجموعهای از نقشههای قدیمیتر را که بعداً اسکن و دیجیتالی شدهاند، و همچنین مجموعهای از نقشههای امروزی که از دادههای برداری توپوگرافی تولید شدهاند، انتخاب کردهایم. ما تکنیک های یکسانی را برای هر دو مجموعه داده اعمال کرده ایم و نتایج خود را در بخش 4.2 مقایسه کرده ایم .
4.1. مجموعه داده ها
این مجموعه داده شامل 16 برگه نقشه توپوگرافی مجاور بلژیک است که در اطراف شهر گنت واقع شده است. این نقشهها بخشی از نسخه دوم سری M834 هستند و بین سالهای 1980 و 1987 توسط موسسه ملی جغرافیایی بلژیک (NGI) ایجاد شدهاند [ 23 ].]. صفحه های نقشه دارای کیفیت 225 نقطه در اینچ (6300 × 4900 پیکسل) هستند که از کیفیت معمول توصیه شده 300 نقطه در اینچ برای OCR و تشخیص متن پایین تر است. هر برگه نقشه حاوی یک افسانه و اطلاعات اضافی در مورد طرح ریزی و سیستم ژئودتیک مورد استفاده است. برگه های نقشه در مقیاس 1:25000 در شش رنگ بر روی پرس افست چاپ شدند. میانگین طول مورب هر نقشه تقریباً 19 کیلومتر است. هر نقشه توسط یک مستطیل سیاه و مقداری فضای خالی احاطه شده است که در آن اطلاعات مختصات داده می شود. در هر گوشه، نقشه بر اساس داده بلژیکی 1972 ارجاع داده می شود. اعداد اطراف نقشه مختصات X و Y را در طرح لامبرت72 بلژیکی یادداشت می کنند [ 20 ]]. برای تأیید اعتبار ارجاع جغرافیایی این نقشه ها، مختصات حقیقت زمینی WGS84 چند ضلعی مرزی برای هر نقشه از ابرداده رسمی ارائه شده توسط NGI گرفته شد. این نقشه ها مشمول حق چاپ هستند، بنابراین ما متأسفانه نمی توانیم تصاویر کامل شطرنجی را به اشتراک بگذاریم. با این حال، نقشه ها را می توان به صورت آنلاین در Cartesius مشاهده کرد ( https://www.cartesius.be/CartesiusPortal/ در 20 مه 2022 مشاهده شد). لیستی از تمام نقشه های انتخاب شده با کد ما همراه است. از آنجایی که تکنیک ارجاع جغرافیایی ما از موقعیت برچسبهای متنی روی نقشه استفاده میکند، این مجموعه داده ابتدا پیش پردازش شد و منطقه نقشه موثر تعیین شد.
این مجموعه داده شامل 9 برگه نقشه شطرنجی توپوگرافی معاصر مجاور از مجموعه داده کامل Top50Raster است که هلند را پوشش می دهد. این 9 نقشه در سال 2018 ایجاد شده و در PDOK ( https://www.pdok.nl/downloads/-/article/dataset-basisregistratie-topografie-brt-topraster در 20 مه 2022) منتشر شده است. پلت فرم داده، منتشر شده توسط دولت هلند. نقشه های TOP50raster و سایر مجموعه های شطرنجی از داده های برداری TOP10NL تعمیم داده شدند [ 24]. هر نقشه در مقیاس 1:50000 تولید شده است و قطر آن به طور میانگین 32 کیلومتر است. برگه های نقشه مجاور به طور تصادفی از مجموعه کامل انتخاب شدند، پیوندهایی به برگه های نقشه اصلی، و نتایج پردازش شده با کد ما گنجانده شده است. هر نقشه در قالب GeoTIFF [ 25 ] ذخیره می شود و قبلاً ارجاع داده شده است. مختصات گوشه های نقشه استخراج و به WGS84 تبدیل شد. تصاویر دارای کیفیت 508 dpi (8000 × 10000 پیکسل) هستند که به طور قابل توجهی بهتر از مجموعه داده های دیگر است. هیچ اطلاعات اضافی پیرامون هر نقشه شطرنجی وجود ندارد، بنابراین نیازی به پیش پردازش نیست.
4.2. نتایج
تکنیکهای توسعهیافته برای هر دو مجموعه داده جغرافیایی ارجاعشده اعمال شد و پیشبینیهای حاصل با موقعیتهای جغرافیایی حقیقت زمین مقایسه شد. برای ارزیابی پیشبینیهای موقعیت جغرافیایی، فاصله خطای ارجاع جغرافیایی متوسط و مرکز محاسبه شد. ما فاصله میانگین را به عنوان فاصله میانگین بین تمام نقاط کنترل (رأس چندضلعی حقیقت زمین) و پیش بینی های مربوطه تعریف می کنیم. ما فاصله مرکز را به عنوان فاصله هارسین بین مرکز نقشه پیش بینی شده و مرکز موقعیت جغرافیایی حقیقت زمین تعریف می کنیم. برای هر مرحله از الگوریتم موقعیت جغرافیایی، این فواصل خطا محاسبه شد. برای هر مجموعه داده، کل الگوریتم مکان یابی جغرافیایی سه بار اجرا شد و نتایج به طور میانگین محاسبه شد و در جدول 1 ارائه شده است.
حداکثر خطا نشان دهنده بزرگترین خطای میانگین برای هر نقشه است. توجه داشته باشید که فاصله خطای مرکز هیچ نشانه ای از بزرگی منطقه نقشه پیش بینی شده در مقایسه با موقعیت جغرافیایی حقیقت زمین را نشان نمی دهد و بنابراین معمولاً بسیار کوچکتر از میانگین خطا است. میانگین فاصله خطا برای مجموعه داده های M834 و TOP50raster به ترتیب 316 متر (1.67٪ با توجه به مورب نقشه) و 287 متر (0.90٪) بود. بیشترین میانگین فاصله خطا به ترتیب 631 متر (33/3 درصد) و 438 متر (37/1 درصد) بود. با توجه به فواصل خطای کوچک با توجه به اندازه هر نقشه، این نتایج بسیار امیدوارکننده و به اندازه کافی دقیق برای استفاده در عمل هستند. نتایج کامل برای مجموعه داده M834 در شکل 11 نشان داده شده است. از 16 موقعیت جغرافیایی پیش بینی شده، 15 مکان دارای میانگین خطای کمتر از 500 متر و 11 مکان دارای خطای مرکزی کمتر از 200 متر هستند.
5. بحث
ما یک رویکرد پردازش نقشه خودکار را توسعه دادیم که میتواند نامهای قابل مشاهده را بر روی نقشههای شطرنجی استخراج کند و متعاقباً این نقشهها را با خطای نسبتاً کمی ارجاع دهد. جای تعجب است که پیشبینیها برای مجموعه داده TOP50raster، که حاوی نقشههای بسیار بزرگتری است، بهتر از سایر مجموعه دادهها بود. دو دلیل اصلی برای این وجود دارد. اولاً، نقشههای TOP50raster از کیفیت بالاتری برخوردار هستند (508 نقطه در اینچ در مقابل 225 نقطه در اینچ)، که باید منجر به تشخیص و عملکرد بهتر متن شود. دوم، میانگین تعداد برچسبهای متنی شناسایی شده تقریباً دو برابر بیشتر است، در حالی که توزیع تعداد تطابقهای ژئوکددر در هر برچسب متن مشابه است ( شکل 5 را ببینید.). این باعث می شود که الگوریتم موقعیت جغرافیایی به طور متوسط اطلاعات بسیار ارزشمندتری را دریافت کند و در نتیجه پیش بینی بهتری داشته باشد. شناسایی برچسبهای متنی بیشتر، پیشبینیها را تنها در صورتی بهبود میبخشد که بتوان آنها را با نام نامی مربوطه مطابقت داد.
جدول 1 بهبودهای مربوط به هر مرحله در الگوریتم موقعیت جغرافیایی را نشان می دهد. واضح است که صرف خوشهبندی تطابقات ژئوکددر اولیه نتایج نادرستی در مقایسه با پیشبینی نهایی میدهد. فواصل خطا نیز نشان می دهد که خطای مرکز شاخص خوبی برای دقت کلی نیست. همانطور که ما فقط مرکز حقیقت پیش بینی شده و زمینی را مقایسه کردیم. هیچ نشانه ای از مقیاس نسبی منطقه پیش بینی شده وجود ندارد. بدون فیلتر، الگوریتم موقعیت جغرافیایی به طور مداوم مناطق بسیار بزرگتر از نقشه واقعی را پیش بینی می کرد.
برای بسیاری از برنامه ها، میانگین خطای کمتر از 2% قابل استفاده است. این نقشهها اکنون میتوانند در یک GIS با برچسبهای متنی شناسایی شده و نامهای همسان به عنوان ابرداده اضافی ادغام شوند. علاوه بر خود نقشه های شطرنجی، ما فقط از اطلاعات کشور استفاده کردیم. این برای کاهش تعداد تطابقات نام اشتباه در اختیار ژئوکدرها قرار گرفت. برای اکثر مجموعه ها، ارائه اطلاعات کشور به الگوریتم امری بی اهمیت است. برای نقشههایی که مناطق مرزی کشورها را نشان میدهند، گنجاندن هر دو کشور در درخواستهای ژئوکدر میتواند مفید باشد. علاوه بر پرس و جو برچسب های متنی شناسایی شده با ژئوکدرها، کل خط لوله پردازش، از تشخیص و تشخیص متن تا پیش بینی موقعیت جغرافیایی، نسبتا سریع است.بخش 3.7 تقریباً همه بردار شدند و بنابراین بسیار کارآمد هستند.
با این حال، تعیین اینکه آیا پیشبینیهای ارجاع جغرافیایی بهطور خودکار دقیق بودهاند، دشوار است. این یک مشکل کلاسیک است که بسیاری از رویکردهای بدون نظارت را آزار می دهد، زیرا هنگام استفاده از این تکنیک در عمل، هیچ داده برچسب گذاری شده ای در دسترس نخواهد بود. با این حال، با توجه به اینکه نقشه شطرنجی بخشی از یک سری یکنواخت است (که معمولاً در مورد نقشههای توپوگرافی صدق میکند) میتوانیم برخی اعتبارسنجیهای اضافی را انجام دهیم. برای مثال، اگر ارتفاع یا عرض موقعیت جغرافیایی پیشبینیشده برای یک نقشه بسیار بیشتر از پیشبینیهای دیگر باشد، میتوان فرض کرد که این پیشبینی دقیقتر است. علاوه بر این، اگر ترتیب برگههای نقشه مشخص باشد، مکانهای جغرافیایی شکست خورده نیز میتوانند شناسایی شوند، زیرا همپوشانی بسیار بیشتری با سایر پیشبینیها خواهند داشت. البته،
ستون فقرات این خط لوله، تعیین منطقه اولیه مورد نظر است. از آنجایی که از خوشهبندی مبتنی بر چگالی استفاده شده است، این تعیین فرض میکند که تشخیص متن قابل استفاده بوده و تعداد تطابقهای ژئوکدر مثبت کاذب در مقایسه با تعداد منطبقهای صحیح نسبتاً کم است. بنابراین، دو مورد شکست اصلی رویکرد مکانیابی جغرافیایی زمانی اتفاق میافتد که نقشه کیفیت پایینی داشته باشد، که منجر به نتایج تشخیص متن ضعیف میشود، یا زمانی که برچسبهای متن به طور مداوم به کلمات چندگانه و دور تقسیم میشوند یا با ترتیبات پیچیده ارائه میشوند. تکنیکهای تشخیص متن که میتوانند با تصاویر با کیفیت پایین کار کنند، مانند [ 26]، می تواند برای بهبود نتایج استفاده شود. اما معمولاً در هنگام تجزیه و تحلیل نقشه های شطرنجی این مسئله مطرح نمی شود. مسئله اصلی اغلب پیوند صحیح برچسب های متنی با عبارت مکان یکسان است. این موضوع تمرکز تحقیقات ما نبود و کار بی اهمیتی برای حل آن نیست، زیرا کار چشمگیر در [ 16] نشان می دهد. حتی با یک تکنیک پیچیده برای پیوند صحیح برچسب های متنی، برخی از خطاها باقی ماندند. در آن مطالعه، فقط مرکز هر نقشه جغرافیایی تعیین شد. مرکز بزرگترین خوشه مطابقت های ژئوکددر به عنوان پیش بینی مرکز نقشه در نظر گرفته شد که منجر به خطاهای 27٪، 48٪ و 51٪ با مرکز حقیقت زمین، نسبت به قطرهای نقشه، برای سه نقشه مورد بحث شد. در جزئیات بدون هیچ پیوند متنی، این خطاها بیش از 91 درصد بود که به وضوح اهمیت آن را در پیشبینی منطقه مورد علاقه اولیه نشان میدهد.
با وجود اینکه از نتایج ارائه شده راضی هستیم، معتقدیم که هنوز جای پیشرفت زیادی وجود دارد. عمدتاً پیوند متن و جستوجوی geocoder نیاز به بهبود دارند، زیرا این موارد در پیشبینی یک منطقه اولیه مورد علاقه کلیدی هستند. افزودن اطلاعات معنایی اضافی همچنین می تواند به تعیین موقعیت های جغرافیایی قوی تر کمک کند. در حال حاضر، هر برچسب متنی و نام اصلی مربوطه، ساده لوحانه به عنوان یک نقطه در نظر گرفته می شود. این نامها اغلب نقاط منفرد را نشان نمیدهند، بلکه خطوط و چندضلعیها را نشان میدهند. واضح است که این روش بهینه برای مقابله با این نوع ویژگی ها نیست. علاوه بر این، برچسبهای متنی که ویژگیهای قابل مشاهده روی نقشه را نشان میدهند، مانند رودخانهها و خیابانها، میتوانند همراه با محتوای بصری برای تعیین موقعیت جغرافیایی دقیقتر استفاده شوند. همچنین دادن وزن بیشتر به ویژگی های مختلف می تواند مفید باشد، بسته به نوع آنها برای مثال، نام خیابان ممکن است اطلاعات مفیدتر و محلیتری نسبت به نام مکان ارائه دهد. در نهایت، کار بیشتری باید روی توسعه یک استراتژی موثر برای اعتبار سنجی موقعیت جغرافیایی پیش بینی شده به روشی بدون نظارت انجام شود. دانستن اینکه آیا پیشبینیها برای نقشههای خاص در مجموعه داده دقیق نبودهاند، میتواند ارزشمند باشد. سپس می توان آنها را به صورت دستی اصلاح کرد.
6. نتیجه گیری
ما یک تکنیک خودکار برای ارجاع جغرافیایی نقشههای شطرنجی توپوگرافی با استفاده از مدلهای تشخیص متن و ژئوکدرهای از پیش آموزشدیده توسعه دادهایم. دو مجموعه داده پردازش شد که منجر به خطای متوسط 316 متر (1.67٪) و 287 متر (0.90٪) برای نقشه های 19 کیلومتری و 32 کیلومتری شد. با میانگین خطاها در 2٪ از اندازه نقشه، اکنون می توان این نقشه ها را برای یک منطقه خاص مورد علاقه به طور دقیق جستجو کرد. سپس نقشه های جغرافیایی ارجاع شده را می توان در یک GIS با برچسب های متنی شناسایی شده و نام های داده باز پیوند داده شده به عنوان ابرداده اضافی برای هر نقشه شطرنجی در مجموعه ادغام کرد. این ابرداده اضافی کیفیت و دسترسی به مجموعه داده را تا حد زیادی بهبود می بخشد.
بدون دیدگاه