در سال‌های اخیر، بسیاری از مؤسسات علمی مجموعه‌های خود را دیجیتالی کرده‌اند که اغلب شامل طیف گسترده‌ای از نقشه‌های شطرنجی توپوگرافی است. این نقشه های شطرنجی اطلاعات جغرافیایی دقیق (تاریخی) را ارائه می دهند اما به دلیل فقدان ابرداده نمی توانند مستقیماً در یک سیستم اطلاعات جغرافیایی (GIS) ادغام شوند. علاوه بر این، برچسب‌های متنی روی نقشه معمولاً حاشیه‌نویسی نمی‌شوند، که باعث می‌شود جستجو برای نام‌های خاص ناکارآمد باشد. ارجاع جغرافیایی دستی و حاشیه نویسی برچسب های متنی روی این نقشه ها برای مجموعه های بزرگ مقرون به صرفه نیست. این کار یک رویکرد ارجاع جغرافیایی کاملاً خودکار مبتنی بر خط لوله تشخیص متن و کدگذاری جغرافیایی ارائه می‌کند. پس از تشخیص متن روی نقشه ها، از ژئوکددرهای موجود برای تعیین منطقه مورد نظر استفاده شد. این رویکرد بر روی مجموعه ای از نقشه های توپوگرافی تاریخی و معاصر اعتبارسنجی شد. ما نشان می‌دهیم که این رویکرد می‌تواند نقشه‌های توپوگرافی را با دقت نسبتاً جغرافیایی تعیین کند، که منجر به میانگین خطای زمین مرجع تنها 316 متر (1.67٪) و 287 متر (0.90٪) برای 16 نقشه تاریخی و 9 نقشه معاصر به ترتیب 19 کیلومتر و 32 کیلومتر است. (مقیاس 1:25000 و 1:50000). علاوه بر این، این رویکرد اجازه می دهد تا نقشه ها بر اساس متن قابل مشاهده شناخته شده و نام های یافت شده جستجو شوند، که دسترسی و کیفیت مجموعه را بیشتر بهبود می بخشد. به ترتیب (مقیاس 1:25000 و 1:50000). علاوه بر این، این رویکرد اجازه می دهد تا نقشه ها بر اساس متن قابل مشاهده شناخته شده و نام های یافت شده جستجو شوند، که دسترسی و کیفیت مجموعه را بیشتر بهبود می بخشد. به ترتیب (مقیاس 1:25000 و 1:50000). علاوه بر این، این رویکرد اجازه می دهد تا نقشه ها بر اساس متن قابل مشاهده شناخته شده و نام های یافت شده جستجو شوند، که دسترسی و کیفیت مجموعه را بیشتر بهبود می بخشد.

کلید واژه ها:

تشخیص متن ؛ جغرافیایی سازی ؛ بینایی کامپیوتری ؛ نقشه های شطرنجی ; ارجاع جغرافیایی

1. مقدمه

دیجیتالی شدن نقشه های تاریخی به محققان امکان دسترسی به داده های جغرافیایی با کیفیت از گذشته را داده است. این نقشه ها اغلب تنها منبع دیجیتالی داده های قابل اعتماد هستند که آنها را به منبعی ارزشمند تبدیل می کند. بسیاری از موسسات مجموعه های بزرگی از نقشه های شطرنجی را دیجیتالی کرده اند که دوره های زمانی و مکان های مختلف را به تصویر می کشد. این فرآیند دیجیتالی شدن زمانبر معمولاً به صورت دستی انجام می شود. اکثر نقشه ها حاوی ابرداده کمی هستند، مانند عنوان عمومی، تاریخ و توضیحات کوتاه. این امر جستجوی کارآمد برای نقشه هایی را که یک منطقه خاص مورد علاقه را توصیف می کنند دشوار می کند. پرس و جو در مورد نام آن منطقه نتایج کاملی را به همراه نخواهد داشت، زیرا اکثر نام مکان ها در عنوان یا توضیحات نقشه ظاهر نمی شوند.
حاشیه نویسی دستی یا ارجاع جغرافیایی این مجموعه ها می تواند یک فرآیند خسته کننده باشد. بنابراین، موسسات عمدتاً بر روی مهمترین موارد موجود در مجموعه خود تمرکز می کنند. رویکردهای جمع سپاری اغلب برای حاشیه نویسی این مجموعه ها با ابرداده های ارزشمند استفاده می شود. برای نقشه های شطرنجی، معمولاً از یک برنامه تعاملی برای ارجاع جغرافیایی نقشه ها به صورت دستی استفاده می شود [ 1 ، 2 ، 3]. کاربران باید هم در نقشه شطرنجی و هم در مکان های مربوطه روی زمین، نقاط کنترل منطبق را انتخاب کنند. سپس برنامه به طور خودکار نقشه شطرنجی را ارجاع داده و تصحیح می کند. با توجه به اینکه نقاط کنترل به درستی انتخاب شده اند، این تکنیک نتایج دقیقی را ارائه می دهد. هنگامی که نقشه‌های مجموعه به زمین ارجاع داده شدند، می‌توان آن‌ها را برای مناطق خاص مورد نظر جستجو کرد. با این حال، جستجوی نام‌ها هنوز کارآمد نیست، زیرا هر نقشه باید به صورت دستی برای نام‌های مورد نظر بررسی شود.
برای پرس و جو از نام های موجود بر روی نقشه، آنها باید حاشیه نویسی شوند. حاشیه نویسی دستی برای یک نقشه می تواند تا چند ساعت طول بکشد، که برای مجموعه های بزرگ امکان پذیر نیست. بنابراین، رویکردهای تشخیص و تشخیص متن را می توان برای شناسایی و رونویسی متن موجود بر روی نقشه ها به طور خودکار مورد استفاده قرار داد. در مقایسه با رویکرد تشخیص کاراکترهای نوری سنتی (OCR) برای تصاویر اسناد اسکن شده، که در آن متن در خطوط و پاراگراف های افقی ساختار یافته است، نقشه های شطرنجی با چالش های بیشتری همراه هستند. برچسب‌های متنی می‌توانند دست‌نویس باشند، در جهت‌ها، اندازه‌ها، فونت‌ها و رنگ‌های مختلف ظاهر شوند، روی یکدیگر همپوشانی داشته باشند و حتی به همراه ویژگی‌های جغرافیایی توصیف‌شده (مانند رودخانه‌ها) منحنی شوند [ 4 ]]. علاوه بر این، نقشه‌های تاریخی را می‌توان با وضوح پایین‌تر تخریب یا دیجیتالی کرد و دقت رونویسی را بیشتر کاهش داد [ 5 ].
متن شناسایی شده را می توان از طریق ژئوکدرهای در دسترس عموم به نام های صحیح معاصر پیوند داد. این ژئوکدرها حاوی میلیون‌ها نام نامیده می‌شوند و سعی می‌کنند یک رشته ورودی را با پایگاه داده خود مطابقت دهند. برای محاسبه خطاهای املایی، تطبیق فازی اغلب استفاده می شود. تطبیق فازی شامل تطابقات غیردقیق است و برای نقشه‌های تاریخی ضروری است، زیرا برخی از نام‌ها در طول زمان املای متفاوتی دارند. پیوند دادن متن شناسایی شده به ژئوکدرها و داده‌های باز، دسترسی به نقشه را بهبود می‌بخشد و با حذف موارد مثبت کاذب، خطاهای تشخیص را کاهش می‌دهد.
این کار یک خط لوله غنی‌سازی نقشه و ارجاع جغرافیایی عمومی را بر اساس مدل‌های تشخیص متن پیشرفته و ژئوکددرهای در دسترس عموم پیشنهاد می‌کند. این رویکرد موقعیت جغرافیایی دقیقی را برای هر نقشه فراهم می کند و متن و نام های قابل مشاهده را به عنوان داده های باز پیوند داده شده (LOD) استخراج می کند. سپس نقشه های پردازش شده را می توان با حداقل خطای موقعیت جغرافیایی در یک GIS ادغام کرد و محتوای آنها اکنون قابل جستجو است. ما خط لوله را برای نقشه های توپوگرافی از بلژیک و هلند اعمال می کنیم، اما تخمین می زنیم که این خط لوله می تواند برای مجموعه های مشابهی از نقشه های شطرنجی (توپوگرافی) اعمال شود. کد به صورت عمومی در https://github.com/kymillev/geolocation در دسترس است.
این مقاله به صورت زیر سازماندهی شده است: بخش 2 کارهای مربوط به تشخیص متن، تطبیق نام نام‌ها، و مکان‌یابی خودکار زمین‌شناسی را مورد بحث قرار می‌دهد. بخش 3 جزئیات تشخیص متن، کدگذاری جغرافیایی، و الگوریتم موقعیت جغرافیایی توسعه یافته را شرح می دهد. بخش 4 مجموعه داده ها را تشریح می کند و نتایج به دست آمده را ارائه می کند. بخش 5 بحثی از رویکرد ما ارائه می‌کند، مزایا و معایب اصلی را خلاصه می‌کند و نتایج را با تحقیقات مرتبط مقایسه می‌کند. مقاله با نتیجه گیری در بخش 6 به پایان می رسد .

2. کارهای مرتبط

تشخیص متن یکی از زمینه های اصلی بینایی کامپیوتر است و تمرکز بسیاری از مقالات و مطالعات تحقیقاتی بوده است. با ظهور شبکه‌های عصبی کانولوشنال، تکنیک‌های یادگیری ماشینی تحت نظارت برای OCR و تشخیص متن (صحنه) به پیشرفته‌ترین حالت تبدیل شدند. نتایج OCR روی تصاویر اسناد اسکن شده از ابزارهای پیشرفته و تجاری به طور کلی عالی هستند و بیشتر به کیفیت اسکن بستگی دارد [ 6 ]. تشخیص متن در تصاویر طبیعی معمولا سخت تر است، زیرا این تصاویر معمولاً دارای تنوع بیشتری از فونت ها و پس زمینه متن هستند. با افزایش مجموعه داده‌های بزرگتر و متنوع‌تر (به عنوان مثال، ICDAR2015 و Coco-Text [ 7 ، 8 ])، مدل‌های پیشرفته تشخیص و تشخیص متن می‌توانند از قبل به دقت نسبتاً بالایی دست یابند.9 ]. بسیاری از آن آثار مدل های از پیش آموزش دیده و کدهای مورد نیاز برای استفاده از آنها را منتشر می کنند. با این حال، هنگام استفاده از این مدل‌ها بر روی نقشه‌های شطرنجی، هم تشخیص متن و هم عملکرد تشخیص به طور کلی بدتر هستند، حتی در هنگام استفاده از خدمات بازشناسی تجاری [ 10 ]. این کاهش عملکرد عمدتاً به دلیل پیچیدگی بالاتر پس‌زمینه و قرار دادن برچسب متنی برای نقشه‌های شطرنجی در مقایسه با تصاویر طبیعی است.
با توجه به این دقت پایین در نقشه های شطرنجی، تکنیک های پیش و پس پردازش اغلب برای بهبود نتایج استفاده می شود. یک رویکرد رایج این است که ابتدا برچسب های متن را از نقشه استخراج کنید و سپس تشخیص متن را انجام دهید. ترکیبی از تکنیک های بینایی کامپیوتری، مانند تجزیه و تحلیل اجزای متصل و کمی سازی رنگ، می تواند برای متمایز کردن برچسب های متنی از پس زمینه نقشه های شطرنجی استفاده شود. همه این تکنیک‌ها نتایج مشابهی تولید می‌کنند، یعنی تصاویر باینریزه شده که پردازش آنها آسان‌تر است [ 11 ، 12 ]. از آنجایی که تشخیص خودکار متن پیش‌زمینه از پس‌زمینه دشوار است، می‌توان از رویکرد نیمه خودکار برای بهبود نتایج استفاده کرد. چیانگ و همکاران [ 13] یک تکنیک عمومی و نیمه خودکار تشخیص متن را توسعه داد که در آن کاربران باید تعداد کمی از محصولات را روی نقشه ها برچسب گذاری کنند و نشان دهند که آیا آنها حاوی متن هستند یا خیر. سپس از تکنیک‌های بینایی کامپیوتری برای همگن کردن متن چند جهته و منحنی استفاده کردند. این تکنیک های پیش پردازش دقت تشخیص نرم افزار OCR مورد استفاده را به شدت افزایش داد.
پس از تشخیص متن روی نقشه، می توان از ژئوکددرها برای تطبیق برچسب های متنی با نام های مربوطه و مکان مختصات آنها استفاده کرد. سپس می توان از این مختصات برای تخمین موقعیت جغرافیایی صحیح نقشه استفاده کرد. با این حال، هنگام تطبیق متن شناخته شده با نام اصلی، مشکلات زیادی رخ می دهد. املای یک نام نامی ممکن است در طول زمان تغییر کرده باشد و احتمالاً تشخیص آن دارای اشتباهاتی است. بنابراین، تطبیق رشته فازی برای مقابله با این اشتباهات املایی مورد نیاز است. با این حال، ابهام نام مکان ها، که با تطبیق فازی بیشتر شده است، می تواند بسیاری از موارد مثبت کاذب را ایجاد کند. هنگامی که برای یک رشته معین پرس و جو می شود، یک ژئوکدگذار ممکن است تعداد زیادی نام از کشورهای مختلف را برگرداند. این امر تعیین تطابق، در صورت وجود، برای برچسب متن داده شده را دشوار می کند. این مشکلات زمانی تشدید می‌شوند که نام‌های رایج خیابان‌ها یا نقاط مورد علاقه (مثلاً خیابان اصلی، کلیسا) شناسایی شوند. حتی ممکن است نام نامی در پایگاه داده geocoder وجود نداشته باشد، این امکان برای نقشه های قدیمی بیشتر افزایش می یابد. احتمال دیگر این است که نام اصلی به هیچ وجه تشخیص داده نشود. با این حال، از آنجایی که نقشه‌های توپوگرافی عموماً حاوی نام‌های بسیار زیادی هستند که نسبتاً به یکدیگر نزدیک هستند، می‌توان اکثر موارد مثبت کاذب را فیلتر کرد و مکان کلی نقشه را تخمین زد.
واینمن [ 14 ] از این اطلاعات به همراه مختصات جغرافیایی نام های نامی شناخته شده و قرار دادن برچسب های مشخصه برای ساخت یک مدل احتمالی استفاده کرد که دقت تشخیص متن را بهبود بخشید. او نرخ خطای کلمه را در مقایسه با خروجی OCR خام 36 درصد کاهش داد. در [ 15]، چارچوبی برای یک رویکرد پردازش نقشه منبع باز خودکار ارائه شده است. بخشی از چارچوب شامل یک ماژول برای مکان‌یابی خودکار زمین‌شناسی است. به عنوان یک نتیجه اولیه از این ماژول، اولین تطابق نام نامی برای یک برچسب با ارزش اطمینان 90٪ یا بیشتر که از API Google Geocoding به دست آمده بود برای مکان یابی هر نقشه استفاده شد. نتایج ژئوکدینگ خوشه‌بندی شدند و از مرکز بزرگترین خوشه برای پیش‌بینی مرکز واقعی نقشه استفاده شد. سپس این رویکرد بر روی 500 نقشه به طور تصادفی انتخاب شده از مجموعه نقشه جغرافیایی NYPL ( https://spacetime.nypl.org ) اعتبارسنجی شد.قابل دسترسی در 20 مه 2022). نتایج امیدوارکننده بود: 37٪ از نقشه های جغرافیایی در شعاع 15 کیلومتری از مختصات حقیقت زمین و 28٪ در شعاع 5 کیلومتری قرار داشتند. نویسندگان خاطرنشان کردند که در نظر گرفتن تنها یک تطابق کلمه برای هر برچسب متن بسیار محدود کننده است و تشخیص متن گاهی اوقات قادر به شناسایی برچسب های متنی کافی نیست. در یک کار بعدی توسط همان نویسندگان، آنها یک تکنیک پیوند متن را توسعه دادند که نتایج را بیشتر بهبود بخشید [ 16 ]. با استفاده از محتوای متنی و بصری، آنها توانستند مدلی را آموزش دهند که بتواند به درستی چندین کلمه از یک عبارت مکان را پیوند دهد (به عنوان مثال، پیوند “Los” و “Angeles” به “Los Angeles”). پیوند متنی تعداد تطابق ژئوکدرهای مثبت کاذب را بسیار کاهش داد و موقعیت جغرافیایی را دقیق تر کرد.
هدف ما ارائه یک تکنیک کلی موقعیت جغرافیایی بر اساس نتایج تشخیص متن از نقشه های توپوگرافی بود. ما از مدل‌های تشخیص و شناسایی متن از پیش آموزش‌دیده استفاده کردیم تا نشان دهیم که می‌توان نقشه‌های شطرنجی توپوگرافیک را بدون نیاز به مجموعه داده‌های برچسب‌گذاری‌شده و مدل‌های سفارشی به‌دقت جغرافیایی و حاشیه‌نویسی کرد. این رویکرد ما را برای بسیاری از مؤسسات و محققانی که مایلند مجموعه‌های نقشه‌های شطرنجی دیجیتالی خود را با حداقل ورودی دستی حاشیه‌نویسی کنند، مفید می‌کند. مدل های تشخیص و تشخیص متن را می توان با سایر سرویس های تشخیص متن جایگزین کرد. مدل از پیش آموزش دیده ( https://github.com/faustomorales/keras-ocr در 20 مه 2022 قابل دسترسی است) از آشکارساز متنی مشابه در [ 17 ] و از همان مدل تشخیص مانند [ 18 ] استفاده می کند.]. مزیت اصلی استفاده از این مدل تشخیص بر خلاف آشکارساز متن محبوب دیگری مانند EAST [ 19 ]، این است که این مدل برای تشخیص متن در سطح کاراکتر آموزش داده شده است که انعطاف پذیری بیشتری را برای متن چرخانده و منحنی فراهم می کند.

3. روش شناسی

این مطالعه با هدف ارائه یک خط لوله عمومی به نقشه های شطرنجی توپوگرافی ژئو ارجاع و استخراج متن و نام های قابل مشاهده به عنوان داده های باز پیوند شده (LOD). نمای کلی کل خط لوله در شکل 1 آورده شده است. اولین مرحله در خط لوله، پیش پردازش نقشه های شطرنجی و استخراج منطقه نقشه واقعی است. بیشتر نقشه های شطرنجی دیجیتالی حاوی اطلاعات اضافی در خارج از مرز نقشه هستند که می تواند بر دقت موقعیت جغرافیایی تأثیر بگذارد. مرحله دوم خط لوله به جزئیات تشخیص متن و کدگذاری جغرافیایی می پردازد. برگه های نقشه با وضوح بالا معمولاً برای پردازش بیش از حد بزرگ هستند، بنابراین به کاشی هایی با اندازه مساوی تقسیم می شوند. متن روی هر کاشی شناسایی می‌شود، تشخیص‌های متن همپوشانی با هم ادغام می‌شوند و متعاقباً کدگذاری جغرافیایی می‌شوند. در مرحله بعد، هم محل متن شناسایی شده (مختصات پیکسل) و هم مکان نتایج تطبیق کدگذاری جغرافیایی (مختصات جغرافیایی) برای تخمین موقعیت جغرافیایی نقشه استفاده می شود. پس از شناسایی و کدگذاری جغرافیایی متن روی هر نقشه، هر برچسب متنی با لیستی از مختصات موقعیت جغرافیایی احتمالی مطابقت داده شد. برای ارجاع جغرافیایی نقشه ها، ما باید نقاط کنترلی را روی نقشه و مختصات WGS84 مربوط به آنها (طول و عرض جغرافیایی) پیدا کنیم. با استفاده از این جفت‌های نقطه (تطبیق جفت‌های پیکسل و مختصات جغرافیایی)، می‌توان یک تبدیل برای تبدیل مختصات پیکسل به مختصات جغرافیایی و بالعکس محاسبه کرد. ما یک الگوریتم تکراری ایجاد کرده‌ایم که از مکان‌های برچسب متنی و تطابق ژئوکدگذار آنها برای تولید چهار نقطه کنترل که نمایانگر چهار گوشه نقشه در مختصات WGS84 هستند، استفاده می‌کند. سپس اینها با مختصات جغرافیایی گوشه صحیح مقایسه می شوند تا دقت روش ما برآورد شود. موقعیت جغرافیایی نقشه در چند مرحله با تخمین یک منطقه اولیه مورد علاقه (ROI) تعیین شد. سپس این ROI با حذف مکرر موارد پرت از طریق یک رویکرد فیلترینگ RANSAC بیشتر اصلاح شد. در هر مرحله، ما منطبقات ژئوکدر را که احتمال درستی کمی داشتند فیلتر کردیم. ROI جدید به‌عنوان جعبه مرزی مطابقت‌های مختصات جغرافیایی که پس از فیلتر باقی می‌ماند، انتخاب شد. این ROI متعاقباً تا زمانی که هیچ چیز پرت دیگری پیدا نشد، پالایش شد. در نهایت، مکان برچسب‌های متنی روی نقشه شطرنجی و مختصات جغرافیایی تطبیق آنها برای محاسبه چهار نقطه کنترل و ارجاع جغرافیایی نقشه استفاده شد. خروجی را می توان به عنوان GeoJson یا هر فرمت رایج دیگری ذخیره کرد و حاوی موقعیت جغرافیایی نقشه تخمینی، متن شناسایی شده روی نقشه و نام های موجود به عنوان LOD است. مکان برچسب های متنی روی نقشه شطرنجی و مختصات جغرافیایی تطبیق آنها برای محاسبه چهار نقطه کنترل و ارجاع جغرافیایی نقشه استفاده شد. خروجی را می توان به عنوان GeoJson یا هر فرمت رایج دیگری ذخیره کرد و حاوی موقعیت جغرافیایی نقشه تخمینی، متن شناسایی شده روی نقشه و نام های موجود به عنوان LOD است. مکان برچسب های متنی روی نقشه شطرنجی و مختصات جغرافیایی تطبیق آنها برای محاسبه چهار نقطه کنترل و ارجاع جغرافیایی نقشه استفاده شد. خروجی را می توان به عنوان GeoJson یا هر فرمت رایج دیگری ذخیره کرد و حاوی موقعیت جغرافیایی نقشه تخمینی، متن شناسایی شده روی نقشه و نام های موجود به عنوان LOD است.
این رویکرد به نحوه ایجاد برچسب‌های متنی و تطابق کدهای جغرافیایی بستگی ندارد. بنابراین، می توان آن را با هر سیستم تشخیص متن و geocoder استفاده کرد. دقت مکان جغرافیایی تا حد زیادی به دقت تشخیص متن و نتایج geocoder بستگی دارد. اگر نقشه کیفیت پایینی داشته باشد و اکثر برچسب های متنی شناسایی نشوند، نتایج ضعیف خواهند بود. برای هر برچسب متنی، مکان آن را روی نقشه به عنوان نقطه مرکزی کادر تشخیص متن تعیین می کنیم. در حالت ایده‌آل، ما فهرستی از مکان‌های پیکسل و یک مکان مختصات جغرافیایی مناسب برای هر کدام می‌خواهیم که امکان استفاده از همه این جفت‌های نقطه برای ارجاع جغرافیایی نقشه را فراهم می‌کند. با این حال، از آنجایی که هم نتایج تشخیص متن و هم نتایج ژئوکددر حاوی خطا هستند، نمی‌توانیم مطمئن باشیم که هر یک از نام‌های نام و ژئوکددر درست است. فقط موقعیت هر برچسب متنی روی نقشه نسبتاً دقیق است. برای به دست آوردن نتایج دقیق تر، مسابقات geocoder که احتمال درستی کمی دارند باید فیلتر شوند. تمام ارقام ارائه شده در این بخش به همان نقشه توپوگرافی Gent-Melle از مجموعه داده M834 اشاره دارد (نگاه کنید بهبخش 4.1 ). هر شکل جفت‌های نقطه‌ای را نشان می‌دهد که در حال حاضر در هر مرحله از الگوریتم در نظر گرفته شده‌اند.

3.1. پیش پردازش

مجموعه داده برگه های نقشه توپوگرافی تاریخی از بلژیک حاوی اطلاعات اضافی خارج از مرز نقشه است. هر نقشه با یک حاشیه سیاه و مقداری فضای خالی احاطه شده است که در آن اطلاعات مختصات داده می شود. در هر گوشه، نقشه بر اساس داده‌های بلژیکی 1972 ارجاع داده می‌شود. اعداد اطراف نقشه مختصات X و Y را در طرح لامبرت72 بلژیکی نشان می‌دهند [ 20]. این مجموعه داده ابتدا پیش پردازش شد و منطقه نقشه موثر تعیین شد. استخراج منطقه نقشه موثر برای مکان یابی نقشه به شدت ضروری نیست. این تکنیک‌های مورد استفاده را کمی دقیق‌تر می‌کند، زیرا برش تصویر اکنون فقط شامل خود نقشه است، اما نه افسانه، مختصات اطراف، و نام‌های نامی. این برچسب‌ها می‌توانند به اشتباه به عنوان نام‌های نامی شناسایی شوند که منجر به مثبت کاذب اضافی می‌شود. شکل 2 گوشه سمت چپ بالای یکی از نقشه های توپوگرافی و منطقه نقشه استخراج شده را نشان می دهد.
عملیات مورفولوژیکی (فرسایش و اتساع) برای تشخیص مرزهای سیاه ضخیم اطراف هر نقشه استفاده شد. سپس، محصولات کوچک در امتداد لبه های نقشه برداشت شدند. متن درون این محصولات شناسایی شد. برای هر دو لبه سمت چپ و راست، محصولات ابتدا چرخانده شدند تا مختصات X/Y قائم باشند. ما از محل این برچسب‌های متنی اطراف برای تعیین منطقه نقشه موثر استفاده کردیم. تشخیص این منطقه داخلی با عملیات مورفولوژیکی به تنهایی به دلیل لبه های بیرونی نازک و چرخش های جزئی برخی از نقشه های اسکن شده ناسازگار بود. پس از شناسایی هر برچسب متن، مختصات لامبرت فیلتر شد و از متن باقی مانده برای استخراج منطقه نقشه موثر استفاده شد.

3.2. تشخیص متن

از آنجایی که تصاویر صفحات نقشه وضوح بسیار بالاتری نسبت به تصاویر معمولی دارند، عملکرد مدل تشخیص متن در کل مجموعه داده ضعیف بود. برچسب‌های نوشتاری کوچک‌تر به طور مداوم هنگام استفاده از نقشه‌های اندازه کامل شناسایی نمی‌شوند. این احتمالاً به دلیل مدل تشخیص متن با استفاده از آستانه های جهانی برای بخش بندی مناطق متن است. بنابراین، از روش کاشی کاری برای بهبود نتایج استفاده شد. کار قبلی نشان داد که اندازه‌های کاشی بزرگ‌تر بر کاشی‌های کوچک‌تر ترجیح داده می‌شوند [ 10]. هر تصویر به چندین کاشی 2500 × 2500 پیکسل، با یک منطقه همپوشانی (در هر دو X و Y) 500 پیکسل تقسیم شد. تشخیص و تشخیص متن در هر یک از کاشی ها انجام شد. برچسب‌های نوشتاری شناسایی‌شده در ناحیه همپوشانی با برچسب‌های متنی همپوشانی و مشابه از کاشی‌های مجاور ادغام شدند تا از تقسیم کلمات در لبه‌های هر کاشی جلوگیری شود. پس از ادغام، متن شناسایی شده پس پردازش شد.
ابتدا برچسب‌های متنی که فقط حاوی اعداد بودند فیلتر شدند. این برچسب‌ها خطوط ارتفاع، نقاط عطف کیلومتری، یا بخش‌های بزرگراه را نشان می‌دهند و نتایج معنی‌داری را در مراحل ژئوکدر زیر ارائه نمی‌دهند. در مرحله بعد، تشخیص‌های همپوشانی برچسب‌های متنی متعدد ادغام شدند، زیرا بسیاری از نام‌ها از چند کلمه تشکیل شده‌اند. این می تواند با ادغام نادرست خطاهای اضافی ایجاد کند. بنابراین، تشخیص های همپوشانی تنها در صورتی ادغام می شوند که جهت گیری های نسبی آنها در 15 درجه از یکدیگر باشد. ما دریافتیم که این آستانه اکثر برچسب‌های ادغام شده نادرست را حذف می‌کند. مشکلات جزئی هنوز هم گهگاه به دلیل خطاهای تشخیص متن و ترتیب پیچیده نام‌ها رخ می‌دهد. شکل 3یکی از این ترتیبات پیچیده را نشان می دهد که در آن هر برچسب شناسایی شده با دیگری همپوشانی دارد و همچنین نتیجه را پس از ادغام نشان می دهد.
هنگام ادغام چندین برچسب متنی همپوشانی، آنها را در جهت خواندن طبیعی مرتب کردیم. تشخیص های فردی ابتدا از بالا به پایین دسته بندی شدند و بر اساس تفاوت در مختصات Y آنها به گروه های مختلف تقسیم شدند. سپس، هر گروه به صورت جداگانه از چپ به راست مرتب شد و در نتیجه جهت خواندن طبیعی بود. فقط برچسب‌های متنی (معمولاً نشان‌دهنده رودخانه‌ها) که از پایین به چپ به سمت راست بالا خوانده می‌شوند، گاهی اوقات به اشتباه ادغام می‌شوند.
همانطور که در شکل 4 مشاهده می شود، متن عمودی معمولاً به درستی تشخیص داده می شود، اما اغلب به اشتباه رونویسی می شود .آ. همانطور که مدل تشخیص فرض می کند که متن از چپ به راست جهت گیری می کند، چنین خطاهایی رخ می دهد. پس از شناسایی منطقه متن موثر، برش های تصویر به متن افقی تاب خورده شدند. اگر برچسب به صورت عمودی بود، این تغییر شکل باید تنظیم شود تا به درستی تاب بخورد. اگر سمت چپ ترین نقطه برچسب متنی در بالا باشد، متن معمولاً از بالا به پایین خوانده می شود. به دلیل خطاهای جزئی در تشخیص متن، ما همیشه نمی‌توانیم به مختصات جعبه‌های مرزی پیش‌بینی‌شده تکیه کنیم، بنابراین دو تبدیل تاب‌خوردگی ممکن است. هر دو تبدیل تصویر انجام شد و متن شناسایی شد. در مرحله بعد، پیش بینی نادرست با استفاده از نتایج geocoder فیلتر شد. شکل 4b مثالی از راه حل پیشنهادی را نشان می دهد. ما فرض می کنیم که می توان از راه حل ظریف تری برای تعیین جهت گیری متن صحیح بر اساس اطلاعات بصری یا محتوای متن استفاده کرد. از آنجایی که هر نقشه فقط شامل تعداد انگشت شماری از چنین برچسب های متنی عمودی است، چنین پیشرفتی به عنوان کار آینده باقی مانده است. از آنجایی که هدف اصلی این کار این است که نشان دهد چگونه می‌توان از مدل‌های تشخیص و تشخیص متن خارج از قفسه برای ارجاع جغرافیایی مؤثر نقشه‌های شطرنجی توپوگرافی با تنظیمات کمی استفاده کرد. هیچ پردازش یا پیوند اضافی از برچسب های متنی شناسایی شده انجام نشد.

3.3. ژئوکدینگ

پس از شناسایی و پردازش برچسب‌های متنی روی نقشه، چندین ژئوکدر با هر برچسب متنی پیش‌بینی‌شده پرس و جو شد. رشته‌های کوتاه‌تر از سه کاراکتر نادیده گرفته شدند، زیرا به ندرت نتایج معنی‌داری را نشان می‌دادند. سه سرویس جغرافیایی مختلف استفاده شد: Google Geocoding، TomTom Geocoding و Geonames (متن باز). ما در ابتدا قصد داشتیم فقط از Geonames استفاده کنیم، اما متوجه شدیم که بسیاری از پرس‌و‌جوها نتایج معنی‌داری نداشتند، در حالی که مطابقت خوبی با geocoder‌های تجاری پیدا شد. برای هر ژئوکدر، نام های به دست آمده با رشته پرس و جو از طریق امتیاز شباهت جزئی رشته ( https://github.com/seatgeek/thefuzz#partial-ratio در 20 مه 2022) مقایسه شد. دو رشته به طول n و m داده می شوداگر رشته کوتاه‌تر طول m باشد، شباهت جزئی رشته امتیاز شباهت بهترین رشته فرعی طول-m را برمی‌گرداند. این امتیاز بر اساس فاصله محبوب Levenshtein ( https://en.wikipedia.org/wiki/Levenshtein_distanceقابل دسترسی در 20 مه 2022). این امتیاز شباهت از 0 (عدم تطابق) تا 100 (تطابق کامل زیر رشته) متغیر است. ما دریافتیم که این امتیاز بهتر از فاصله استاندارد Levenshtein، به ویژه برای سیم‌های کوتاه‌تر عمل می‌کند. برای هر مسابقه، نام نام، مختصات جغرافیایی، شباهت و نوع (محل پرجمعیت، خیابان و غیره) ذخیره شد. همانطور که از چندین ژئوکددر استفاده کردیم، این نتایج حاوی موارد تکراری بود. در صورت وجود تطابق دقیق برای نام و نوع نام و اگر هر دو مختصات به یکدیگر نزدیک بودند، موارد تکراری حذف می‌شوند. بررسی نزدیکی آنها مهم است زیرا دو مکان یا خیابان متفاوت می توانند نام یکسانی داشته باشند. برخی از مسابقات تکراری هنوز باقی مانده بودند، اما این موارد تأثیر کمی بر منطقه نهایی مورد علاقه داشتند.
هر نقشه به ترتیب شامل 365 و 671 برچسب متن قابل استفاده برای مجموعه داده بلژیکی (M834) و هلندی (TOP50raster) بود. یک هیستوگرام از تطابق ژئوکدر در هر برچسب متنی برای هر دو مجموعه داده در شکل 5 نشان داده شده است . واضح است که توزیع ها نامتقارن هستند و اکثر برچسب های متنی دارای تعداد کمی تطابق هستند. برچسب‌هایی که تعداد منطبق‌ها بیشتر است، کمترین اطلاعات را برای پیش‌بینی منطقه مورد علاقه دارند، زیرا این نام‌ها نشان‌دهنده نام‌های مکان رایج هستند که در یک منطقه بزرگ پخش شده‌اند.

3.4. تخمین منطقه مورد علاقه اولیه

از آنجایی که برخی از نام‌های مکان رایج هستند، پرس و جوهای خاص بیش از 100 ژئوکدر منطبق را به دست آوردند. نام‌های بسیاری از خیابان‌ها، مانند «Kerkstraat» (مقایسه با «خیابان اصلی» در ایالات متحده آمریکا)، در شهرهای بلژیک رایج است. ترسیم این مختصات منطبقات احتمالی را در سراسر بلژیک و هلند و تعداد کمی از مکان‌های تصادفی در سراسر جهان نشان داد. حتی اگر ژئوکدرها اجازه می دهند یک کشور مشخص شود، نتایج همیشه به آن کشور محدود نمی شود. اکثر این تطابقات ژئوکدر برای متن درخواست شده صحیح نبودند. آنها یا نام مکان و خیابان رایج بودند یا به دلیل تطابق فازی ژئوکدرها پیدا شدند. شکل 6a مختصات تمام تطابقات اولیه ژئوکدر را برای همه برچسب های متنی شناسایی شده روی نقشه Gent-Melle نشان می دهد. واضح است که اینها در سرتاسر بلژیک توزیع می‌شوند، با برخی موارد پرت.
بنابراین برچسب‌های متنی با تعداد زیادی تطابق برای پیش‌بینی منطقه مورد علاقه اولیه چندان مرتبط نیستند. به طور مشابه، مسابقات geocoder با شباهت رشته کمتر با برچسب متنی مربوطه، احتمال درستی کمتری دارند. بنابراین، منطبق‌های ژئوکدر را با شباهت جزئی رشته‌ای زیر 90 کنار گذاشتیم. پس از آن، برچسب‌های متنی که حاوی بیش از پنج تطابق ژئوکددر بودند نیز کنار گذاشته شدند. به این ترتیب بدترین تطابق رشته ها و رایج ترین نام مکان ها فیلتر شدند. این نام‌ها هنوز در صدها کیلومتر پراکنده بودند و خوشه‌بندی آنها مناطق عظیمی را به وجود آورد. بنابراین، مسابقات geocoder نیز با فاصله مختصات نسبی آنها فیلتر شدند. با فرض اینکه مطابقت های صحیح پیدا شد، فواصل نسبی آنها باید کم باشد و باید به طور نسبتاً یکنواخت روی نقشه توزیع شوند. پس از آن، هر مختصات صحیح باید نسبتا نزدیک به سایر مختصات صحیح باشد. بنابراین، فاصله هارسینه بین نامزدهای نامگذاری محاسبه شد و اگر فاصله تا هر یک از پنج نزدیکترین همسایه بیشتر از 100 کیلومتر بود یا اگر فاصله تا نزدیکترین همسایه بیشتر از 25 کیلومتر بود، تطابق ژئوکدر حذف شد. این فیلتر اضافی تضمین کرد که نقاط پرت واضح حذف شدند. این آستانه های فاصله تا حدودی به مقیاس نقشه بستگی دارد. با این حال، اکثر نقشه های توپوگرافی حاوی نام های بسیاری هستند، بنابراین فاصله نسبی مطابقت های صحیح باید کم باشد. برای مجموعه داده‌های مورد استفاده، آستانه فاصله بسیار کمتری می‌تواند انتخاب شود، زیرا قطر هر نقشه تنها تقریباً 19 و 32 کیلومتر را پوشش می‌دهد.
سپس، ژئوکوئوردینات‌های باقی‌مانده با الگوریتم خوشه‌بندی DBSCAN [ 21 ]، که مناطق با چگالی بالاتر را خوشه‌بندی می‌کند، خوشه‌بندی شدند. این خوشه بندی موارد پرت اضافی را حذف کرد و همچنین در کارهای قبلی با موفقیت مورد استفاده قرار گرفت [ 15 ، 16 ]. ما از متقابل تعداد تطابق ژئوکدر به عنوان وزن نمونه برای هر نقطه استفاده کردیم. به این ترتیب، امتیازات با چندین مسابقه وزن کمتری در خوشه‌بندی دریافت کردند. جعبه مرزی خوشه پیدا شده به عنوان منطقه اولیه مورد نظر در نظر گرفته شد. اگر چند خوشه پیدا شد، خوشه ای که بیشترین امتیاز را داشت انتخاب می شد. شکل 6b نتیجه را پس از کنار گذاشتن مختصات با احتمال کم و خوشه بندی نمایش می دهد. نمودار دقیق تر از مختصات باقی مانده پس از تعیین یک منطقه اولیه مورد علاقه برای نقشه Gent-Melle در شکل 7 نشان داده شده است .

3.5. پالایش منطقه مورد علاقه

برای اصلاح منطقه مورد نظر اولیه، هم از مکان‌های برچسب‌های متنی و هم از مکان‌های مختصات تطابق ژئوکددر آنها استفاده کردیم. به طور کلی، مکان نسبی پیکسل روی نقشه باید بسیار شبیه به مکان مختصات نسبی تطابق نام نامی مربوطه باشد. به طور مشابه، برچسب‌های متنی که روی نقشه از یکدیگر دورتر هستند، باید مختصات جغرافیایی متناظری داشته باشند که دورتر از یکدیگر نیز قرار دارند. به طور طبیعی، مکان دقیق برچسب متنی به طور کامل با مختصات ژئوکدر صحیح مطابقت نخواهد داشت. با این حال، نقاط پرت را می توان فیلتر کرد، زیرا این خطا به طور متوسط ​​برای تطابق نادرست geocoder بسیار بزرگ است.
ما از یک رویکرد مبتنی بر RANSAC برای حذف اکثر تطابقات مختصات مثبت کاذب استفاده کردیم. RANSAC یک الگوریتم تکراری عمومی است که می‌تواند با یک مدل مطابقت داشته باشد در حالی که هنوز نسبت به موارد پرت قوی است [ 22 ]. شکل 8 یک نمای کلی از فیلتر بیرونی مبتنی بر RANSAC را نشان می دهد. ابتدا مجموعه‌ای از جفت‌های نقطه درونی به‌طور تصادفی از بین تمام جفت‌های نقطه ممکن انتخاب شد. به هر برچسب متنی شناسایی شده و مکان پیکسل مربوطه روی نقشه شطرنجی، احتمال 50 درصد انتخاب داده شد. برای هر مکان پیکسل انتخاب شده، ما به طور تصادفی یکی از تطابقات مختصات جغرافیایی مربوطه را انتخاب کردیم. این یک مجموعه تصادفی از جفت نقطه های درونی تولید کرد. با فرض صحیح بودن این موارد، موقعیت جغرافیایی نقشه پیش بینی شده بود (به بخش 3.6 مراجعه کنید.). سپس از این موقعیت جغرافیایی برای فیلتر کردن انتخاب جفت نقاط اضافی در الگوریتم RANSAC استفاده شد. برای هر جفت نقطه دیگری که در ابتدا انتخاب نشده بود، ما دو بررسی انجام دادیم تا تصمیم بگیریم که آیا اینها باید به مجموعه ای از ورودی ها اضافه شوند یا خیر. ابتدا، بررسی کردیم که آیا مختصات جغرافیایی در داخل موقعیت جغرافیایی پیش بینی شده قرار دارند یا خیر. بعد، خطای موقعیت نسبی (به بخش 3.7 مراجعه کنید) محاسبه شد. اگر نقطه در داخل موقعیت جغرافیایی قرار داشت و خطا از حد آستانه از پیش تعیین شده کوچکتر بود، نقطه را به عنوان نام نامزد اضافه می کنیم. در نهایت، هر دو ورودی اولیه و نامزدهای جدید برای پیش‌بینی جدید موقعیت جغرافیایی نقشه و محاسبه میانگین خطای فاصله نسبی روی تمام جفت‌های نقطه انتخاب شده استفاده شدند. کل این فرآیند برای 10000 تکرار تکرار شد و مجموعه ای از جفت های نقطه با کمترین میانگین خطا برای پردازش بیشتر انتخاب شد.

3.6. پیش بینی موقعیت جغرافیایی

همانطور که قبلا ذکر شد، مکان یک برچسب متنی بر روی نقشه شطرنجی به طور کامل با موقعیت جغرافیایی نام توپون متناظر آن مطابقت ندارد. یک خطای جزئی برای هر جفت مختصات وجود دارد، زیرا قرار دادن برچسب متنی تا حد زیادی به سایر ویژگی‌ها یا نمادهای جغرافیایی در آن مکان بستگی دارد. اگر برچسب متن با سایر ویژگی های نقشه همپوشانی داشته باشد، معمولاً برای ارائه نمای بهتری از منظره جابجا می شود. یک ویژگی زیربنایی (رودخانه، جاده، و غیره) تغییر نخواهد کرد تا یک برچسب نام نامی به درستی قرار گیرد. همراه با این واقعیت که هنوز نمی‌توانیم تضمین کنیم کدام جفت نقطه درست است، از میانگین بردار مختصات همه جفت‌های نقطه انتخاب شده برای مکان‌یابی نقشه استفاده می‌کنیم تا خطا در قرار دادن برچسب کاهش یابد. به عنوان مثال، حتی اگر برچسب‌های نام نامی دارای یک سوگیری ثابت بر خلاف فرضیات ما باشند،
پس از انتخاب تصادفی یک مجموعه اولیه از جفت مختصات درونی، ما موقعیت جغرافیایی نقشه را با فرض صحیح بودن این جفت ها تخمین می زنیم. سپس از این موقعیت جغرافیایی برای فیلتر کردن انتخاب جفت مختصات اضافی در الگوریتم RANSAC استفاده می شود. ابتدا میانگین بردارهای پیکسل و ژئوکوردینات محاسبه شد که منجر به یک جفت نقطه مرکزی شد. سپس، اختلاف بردار مطلق با هر جفت نقطه و مراکز محاسبه شد. تفاوت در X و Y به طور مستقل و همچنین تفاوت در طول و عرض جغرافیایی محاسبه شد. پس از آن، یک ضریب تبدیل خطی بین مختصات پیکسل و مختصات جغرافیایی محاسبه شد. تمام تفاوت های X بر اختلاف طول جغرافیایی تقسیم شدند و به طور مشابه، همه تفاوت ها در Y بر اختلاف عرض جغرافیایی برای هر جفت نقطه تقسیم شدند. ما اکنون یک ضریب تبدیل از پیکسل به مختصات جغرافیایی را برای هر جفت نقطه و نقاط مرکزی محاسبه کرده ایم. از آنجایی که موقعیت برچسب متن کاملاً با مختصات ژئوکددر متناظر مطابقت ندارد، میانه برای هر یک از این فاکتورها انتخاب شد که منجر به یک ضریب تبدیل متوسط ​​از مختصات پیکسل به مختصات جغرافیایی شد. میانه بر میانگین ترجیح داده می شود زیرا نسبت به نقاط پرت قوی تر است. برای محاسبه ضریب تبدیل، فقط به دو جفت نقطه صحیح نیاز داریم. با در نظر گرفتن ضریب میانه همه جفت‌های نقطه، واریانس و خطای موقعیت جغرافیایی کاهش می‌یابد زیرا کاملاً به درستی یک جفت تکیه نمی‌کند (که نمی‌توانیم بدانیم). از آنجا که مبدا مختصات پیکسل با گوشه سمت چپ بالای نقشه شطرنجی مطابقت دارد، ضریب تبدیل Y همچنان باید در -1 ضرب شود. از آنجایی که موقعیت برچسب متن کاملاً با مختصات ژئوکددر متناظر مطابقت ندارد، میانه برای هر یک از این فاکتورها انتخاب شد که منجر به یک ضریب تبدیل متوسط ​​از مختصات پیکسل به مختصات جغرافیایی شد. میانه بر میانگین ترجیح داده می شود زیرا نسبت به نقاط پرت قوی تر است. برای محاسبه ضریب تبدیل، فقط به دو جفت نقطه صحیح نیاز داریم. با در نظر گرفتن ضریب میانه همه جفت‌های نقطه، واریانس و خطای موقعیت جغرافیایی کاهش می‌یابد زیرا کاملاً به درستی یک جفت تکیه نمی‌کند (که نمی‌توانیم بدانیم). از آنجا که مبدا مختصات پیکسل با گوشه سمت چپ بالای نقشه شطرنجی مطابقت دارد، ضریب تبدیل Y همچنان باید در -1 ضرب شود. از آنجایی که موقعیت برچسب متن کاملاً با مختصات ژئوکددر متناظر مطابقت ندارد، میانه برای هر یک از این فاکتورها انتخاب شد که منجر به یک ضریب تبدیل متوسط ​​از مختصات پیکسل به مختصات جغرافیایی شد. میانه بر میانگین ترجیح داده می شود زیرا نسبت به نقاط پرت قوی تر است. برای محاسبه ضریب تبدیل، فقط به دو جفت نقطه صحیح نیاز داریم. با در نظر گرفتن ضریب میانه همه جفت‌های نقطه، واریانس و خطای موقعیت جغرافیایی کاهش می‌یابد زیرا کاملاً به درستی یک جفت تکیه نمی‌کند (که نمی‌توانیم بدانیم). از آنجا که مبدا مختصات پیکسل با گوشه سمت چپ بالای نقشه شطرنجی مطابقت دارد، ضریب تبدیل Y همچنان باید در -1 ضرب شود. منجر به یک ضریب تبدیل متوسط ​​از مختصات پیکسل به مختصات جغرافیایی می شود. میانه بر میانگین ترجیح داده می شود زیرا نسبت به نقاط پرت قوی تر است. برای محاسبه ضریب تبدیل، فقط به دو جفت نقطه صحیح نیاز داریم. با در نظر گرفتن ضریب میانه همه جفت‌های نقطه، واریانس و خطای موقعیت جغرافیایی کاهش می‌یابد زیرا کاملاً به درستی یک جفت تکیه نمی‌کند (که نمی‌توانیم بدانیم). از آنجا که مبدا مختصات پیکسل با گوشه سمت چپ بالای نقشه شطرنجی مطابقت دارد، ضریب تبدیل Y همچنان باید در -1 ضرب شود. منجر به یک ضریب تبدیل متوسط ​​از مختصات پیکسل به مختصات جغرافیایی می شود. میانه بر میانگین ترجیح داده می شود زیرا نسبت به نقاط پرت قوی تر است. برای محاسبه ضریب تبدیل، فقط به دو جفت نقطه صحیح نیاز داریم. با در نظر گرفتن ضریب میانه همه جفت‌های نقطه، واریانس و خطای موقعیت جغرافیایی کاهش می‌یابد زیرا کاملاً به درستی یک جفت تکیه نمی‌کند (که نمی‌توانیم بدانیم). از آنجا که مبدا مختصات پیکسل با گوشه سمت چپ بالای نقشه شطرنجی مطابقت دارد، ضریب تبدیل Y همچنان باید در -1 ضرب شود. واریانس و خطای موقعیت جغرافیایی کاهش می یابد زیرا به طور کامل به صحت یک جفت تکیه نمی کند (که ما نمی توانیم بدانیم). از آنجا که مبدا مختصات پیکسل با گوشه سمت چپ بالای نقشه شطرنجی مطابقت دارد، ضریب تبدیل Y همچنان باید در -1 ضرب شود. واریانس و خطای موقعیت جغرافیایی کاهش می یابد زیرا به طور کامل به صحت یک جفت تکیه نمی کند (که ما نمی توانیم بدانیم). از آنجا که مبدا مختصات پیکسل با گوشه سمت چپ بالای نقشه شطرنجی مطابقت دارد، ضریب تبدیل Y همچنان باید در -1 ضرب شود.

پس از محاسبه بردارهای مختصات مرکزی و ضریب تبدیل، چهار گوشه نقشه را می توان از مختصات پیکسلی به مختصات جغرافیایی متناظر تبدیل کرد. با فرض اینکه موقعیت جغرافیایی پیش بینی شده یک مستطیل است، فقط نقاط چپ بالا و پایین سمت راست باید برای ارجاع جغرافیایی نقشه تبدیل شوند. محاسبه نقاط کنترل به عنوان یک معادله برداری در رابطه ( 1 ) توضیح داده شده است. بود، سی1سی1و سی2سی2به ترتیب نقاط کنترل بالا سمت چپ و پایین سمت راست را مشخص کنید. سیgoسی�ه�و سیyسیایکس�میانگین بردار مختصات جغرافیایی و پیکسلی، fy�ایکس�نشان دهنده ضریب تبدیل و بyبایکس�یک بردار 1 بعدی شامل عرض و ارتفاع نقشه شطرنجی است.

سی1سی2=سیgofyسیy=سیgofy(سیyبy)سی1=سی�ه�-�ایکس�سیایکس�سی2=سی�ه�-�ایکس�(سیایکس�-بایکس�)
اساساً، بردار ترجمه مختصات میانگین پیکسل و مرزهای نقشه ([0، 0] و [w، h]) محاسبه شده و در ضریب تبدیل ضرب می‌شود تا بردار ترجمه مربوطه در مختصات جغرافیایی به دست آید. سپس این بردار از میانگین زمین مختصات کم می شود تا به مرزهای نقشه پیش بینی شده در مختصات WGS84 برسد.

3.7. خطای نسبی موقعیت

در هر تکرار RANSAC، مجموعه ای از جفت مختصات درونی به طور تصادفی انتخاب شد و منطقه نقشه پیش بینی شد. برای جفتی که انتخاب نشد، بررسی کردیم که آیا مختصات جغرافیایی در منطقه نقشه پیش‌بینی‌شده قرار دارند یا خیر. اگر آنها بودند، خطای موقعیت نسبی محاسبه شد. اگر این خطا کوچکتر از یک آستانه از پیش تعیین شده بود، جفت مختصات به مجموعه ای از نامزدهای جدید اضافه می شود. این خطای موقعیت نسبی ساده اما موثر با مقایسه موقعیت نسبی هر جفت نقطه با جفت نقطه داخلی، برای هر دو مکان پیکسل و مختصات جغرافیایی محاسبه شد. بررسی می کنیم که چند نقطه در سمت چپ/راست نقطه فعلی روی نقشه و چند نقطه در سمت چپ/راست مختصات جغرافیایی مرتبط قرار دارند. ما تفاوت بین این دو مقدار را می گیریم و تفاوت مشابهی را برای چند نقطه در بالا/زیر جفت مشخص شده محاسبه می کنیم. در نهایت، این تفاوت ها جمع شده و بر تعداد جفت نقطه های درونی تقسیم می شوند. به این ترتیب، متریک به تعداد کل جفت های درونی در نظر گرفته شده نرمال می شود. معیار خطا را می‌توان بسیار کارآمد محاسبه کرد و بسیاری از موارد پرت را در طول انتخاب نامزد تصادفی‌سازی شده حذف می‌کند. ما نتایج خوبی با آستانه 0.05 پیدا کردیم. بنابراین، موقعیت نسبی هر جفت نامزد نامزد باید با حداقل 95 درصد از جفت‌های اولیه انتخاب شده برای انتخاب «موافق» باشد. پس از انتخاب این نامزدهای جدید، متریک خطا برای همه جفت‌های امتیاز انتخاب شده محاسبه و میانگین می‌شود. مجموعه زوج های نقطه ای با کمترین میانگین خطای بعد از 10،

3.8. تعیین منطقه نهایی مورد علاقه

اکنون که یک منطقه مورد نظر تعریف شده است و بیشتر جفت‌های مختصات پرت با RANSAC فیلتر شده‌اند، می‌توان موقعیت جغرافیایی نهایی را تخمین زد. ابتدا از جفت مختصات انتخاب شده از مرحله قبل برای پیش بینی موقعیت جغرافیایی نقشه استفاده شد. این نتیجه در شکل 9 نشان داده شده است. پس از تعیین موقعیت جغرافیایی نقشه، برخی از تطابق‌های ژئوکددر همچنان می‌توانند خارج از منطقه پیش‌بینی‌شده قرار بگیرند، یا به دلیل نادرست بودن تطابق آنها یا به دلیل نادرست بودن منطقه پیش‌بینی‌شده. ما به طور مکرر با چنین موارد پرت باقی مانده سروکار داریم. نقطه ژئوکوئوردینات پرت را پیدا می کنیم که دورترین نقطه از منطقه پیش بینی شده است، آن جفت نقطه را حذف می کنیم و موقعیت جغرافیایی نقشه را دوباره با تمام جفت های باقی مانده پیش بینی می کنیم. این روند را تا زمانی تکرار می‌کنیم که دیگر هیچ نقطه‌ای وجود نداشته باشد. پیش‌بینی حاصل بهترین تخمین ما برای موقعیت جغرافیایی نقشه است. این فرآیند تکراری فیلتر کردن پرت، دقت الگوریتم ما را بیشتر بهبود بخشید. شکل 10 تخمین موقعیت جغرافیایی نهایی و جفت مختصات باقیمانده برای نقشه Gent-Melle را نشان می دهد.

4. ارزیابی

این بخش دو مجموعه داده از نقشه های شطرنجی توپوگرافی مورد استفاده برای اعتبارسنجی تکنیک های ما را شرح می دهد. ما مجموعه‌ای از نقشه‌های قدیمی‌تر را که بعداً اسکن و دیجیتالی شده‌اند، و همچنین مجموعه‌ای از نقشه‌های امروزی که از داده‌های برداری توپوگرافی تولید شده‌اند، انتخاب کرده‌ایم. ما تکنیک های یکسانی را برای هر دو مجموعه داده اعمال کرده ایم و نتایج خود را در بخش 4.2 مقایسه کرده ایم .

4.1. مجموعه داده ها

  • نقشه های شطرنجی توپوگرافی M834 بلژیک
این مجموعه داده شامل 16 برگه نقشه توپوگرافی مجاور بلژیک است که در اطراف شهر گنت واقع شده است. این نقشه‌ها بخشی از نسخه دوم سری M834 هستند و بین سال‌های 1980 و 1987 توسط موسسه ملی جغرافیایی بلژیک (NGI) ایجاد شده‌اند [ 23 ].]. صفحه های نقشه دارای کیفیت 225 نقطه در اینچ (6300 × 4900 پیکسل) هستند که از کیفیت معمول توصیه شده 300 نقطه در اینچ برای OCR و تشخیص متن پایین تر است. هر برگه نقشه حاوی یک افسانه و اطلاعات اضافی در مورد طرح ریزی و سیستم ژئودتیک مورد استفاده است. برگه های نقشه در مقیاس 1:25000 در شش رنگ بر روی پرس افست چاپ شدند. میانگین طول مورب هر نقشه تقریباً 19 کیلومتر است. هر نقشه توسط یک مستطیل سیاه و مقداری فضای خالی احاطه شده است که در آن اطلاعات مختصات داده می شود. در هر گوشه، نقشه بر اساس داده بلژیکی 1972 ارجاع داده می شود. اعداد اطراف نقشه مختصات X و Y را در طرح لامبرت72 بلژیکی یادداشت می کنند [ 20 ]]. برای تأیید اعتبار ارجاع جغرافیایی این نقشه ها، مختصات حقیقت زمینی WGS84 چند ضلعی مرزی برای هر نقشه از ابرداده رسمی ارائه شده توسط NGI گرفته شد. این نقشه ها مشمول حق چاپ هستند، بنابراین ما متأسفانه نمی توانیم تصاویر کامل شطرنجی را به اشتراک بگذاریم. با این حال، نقشه ها را می توان به صورت آنلاین در Cartesius مشاهده کرد ( https://www.cartesius.be/CartesiusPortal/ در 20 مه 2022 مشاهده شد). لیستی از تمام نقشه های انتخاب شده با کد ما همراه است. از آنجایی که تکنیک ارجاع جغرافیایی ما از موقعیت برچسب‌های متنی روی نقشه استفاده می‌کند، این مجموعه داده ابتدا پیش پردازش شد و منطقه نقشه موثر تعیین شد.
  • TOP50raster
این مجموعه داده شامل 9 برگه نقشه شطرنجی توپوگرافی معاصر مجاور از مجموعه داده کامل Top50Raster است که هلند را پوشش می دهد. این 9 نقشه در سال 2018 ایجاد شده و در PDOK ( https://www.pdok.nl/downloads/-/article/dataset-basisregistratie-topografie-brt-topraster در 20 مه 2022) منتشر شده است. پلت فرم داده، منتشر شده توسط دولت هلند. نقشه های TOP50raster و سایر مجموعه های شطرنجی از داده های برداری TOP10NL تعمیم داده شدند [ 24]. هر نقشه در مقیاس 1:50000 تولید شده است و قطر آن به طور میانگین 32 کیلومتر است. برگه های نقشه مجاور به طور تصادفی از مجموعه کامل انتخاب شدند، پیوندهایی به برگه های نقشه اصلی، و نتایج پردازش شده با کد ما گنجانده شده است. هر نقشه در قالب GeoTIFF [ 25 ] ذخیره می شود و قبلاً ارجاع داده شده است. مختصات گوشه های نقشه استخراج و به WGS84 تبدیل شد. تصاویر دارای کیفیت 508 dpi (8000 × 10000 پیکسل) هستند که به طور قابل توجهی بهتر از مجموعه داده های دیگر است. هیچ اطلاعات اضافی پیرامون هر نقشه شطرنجی وجود ندارد، بنابراین نیازی به پیش پردازش نیست.

4.2. نتایج

تکنیک‌های توسعه‌یافته برای هر دو مجموعه داده جغرافیایی ارجاع‌شده اعمال شد و پیش‌بینی‌های حاصل با موقعیت‌های جغرافیایی حقیقت زمین مقایسه شد. برای ارزیابی پیش‌بینی‌های موقعیت جغرافیایی، فاصله خطای ارجاع جغرافیایی متوسط ​​و مرکز محاسبه شد. ما فاصله میانگین را به عنوان فاصله میانگین بین تمام نقاط کنترل (رأس چندضلعی حقیقت زمین) و پیش بینی های مربوطه تعریف می کنیم. ما فاصله مرکز را به عنوان فاصله هارسین بین مرکز نقشه پیش بینی شده و مرکز موقعیت جغرافیایی حقیقت زمین تعریف می کنیم. برای هر مرحله از الگوریتم موقعیت جغرافیایی، این فواصل خطا محاسبه شد. برای هر مجموعه داده، کل الگوریتم مکان یابی جغرافیایی سه بار اجرا شد و نتایج به طور میانگین محاسبه شد و در جدول 1 ارائه شده است.
حداکثر خطا نشان دهنده بزرگترین خطای میانگین برای هر نقشه است. توجه داشته باشید که فاصله خطای مرکز هیچ نشانه ای از بزرگی منطقه نقشه پیش بینی شده در مقایسه با موقعیت جغرافیایی حقیقت زمین را نشان نمی دهد و بنابراین معمولاً بسیار کوچکتر از میانگین خطا است. میانگین فاصله خطا برای مجموعه داده های M834 و TOP50raster به ترتیب 316 متر (1.67٪ با توجه به مورب نقشه) و 287 متر (0.90٪) بود. بیشترین میانگین فاصله خطا به ترتیب 631 متر (33/3 درصد) و 438 متر (37/1 درصد) بود. با توجه به فواصل خطای کوچک با توجه به اندازه هر نقشه، این نتایج بسیار امیدوارکننده و به اندازه کافی دقیق برای استفاده در عمل هستند. نتایج کامل برای مجموعه داده M834 در شکل 11 نشان داده شده است. از 16 موقعیت جغرافیایی پیش بینی شده، 15 مکان دارای میانگین خطای کمتر از 500 متر و 11 مکان دارای خطای مرکزی کمتر از 200 متر هستند.

5. بحث

ما یک رویکرد پردازش نقشه خودکار را توسعه دادیم که می‌تواند نام‌های قابل مشاهده را بر روی نقشه‌های شطرنجی استخراج کند و متعاقباً این نقشه‌ها را با خطای نسبتاً کمی ارجاع دهد. جای تعجب است که پیش‌بینی‌ها برای مجموعه داده TOP50raster، که حاوی نقشه‌های بسیار بزرگ‌تری است، بهتر از سایر مجموعه داده‌ها بود. دو دلیل اصلی برای این وجود دارد. اولاً، نقشه‌های TOP50raster از کیفیت بالاتری برخوردار هستند (508 نقطه در اینچ در مقابل 225 نقطه در اینچ)، که باید منجر به تشخیص و عملکرد بهتر متن شود. دوم، میانگین تعداد برچسب‌های متنی شناسایی شده تقریباً دو برابر بیشتر است، در حالی که توزیع تعداد تطابق‌های ژئوکددر در هر برچسب متن مشابه است ( شکل 5 را ببینید.). این باعث می شود که الگوریتم موقعیت جغرافیایی به طور متوسط ​​اطلاعات بسیار ارزشمندتری را دریافت کند و در نتیجه پیش بینی بهتری داشته باشد. شناسایی برچسب‌های متنی بیشتر، پیش‌بینی‌ها را تنها در صورتی بهبود می‌بخشد که بتوان آنها را با نام نامی مربوطه مطابقت داد.
جدول 1 بهبودهای مربوط به هر مرحله در الگوریتم موقعیت جغرافیایی را نشان می دهد. واضح است که صرف خوشه‌بندی تطابقات ژئوکددر اولیه نتایج نادرستی در مقایسه با پیش‌بینی نهایی می‌دهد. فواصل خطا نیز نشان می دهد که خطای مرکز شاخص خوبی برای دقت کلی نیست. همانطور که ما فقط مرکز حقیقت پیش بینی شده و زمینی را مقایسه کردیم. هیچ نشانه ای از مقیاس نسبی منطقه پیش بینی شده وجود ندارد. بدون فیلتر، الگوریتم موقعیت جغرافیایی به طور مداوم مناطق بسیار بزرگتر از نقشه واقعی را پیش بینی می کرد.
برای بسیاری از برنامه ها، میانگین خطای کمتر از 2% قابل استفاده است. این نقشه‌ها اکنون می‌توانند در یک GIS با برچسب‌های متنی شناسایی شده و نام‌های همسان به عنوان ابرداده اضافی ادغام شوند. علاوه بر خود نقشه های شطرنجی، ما فقط از اطلاعات کشور استفاده کردیم. این برای کاهش تعداد تطابقات نام اشتباه در اختیار ژئوکدرها قرار گرفت. برای اکثر مجموعه ها، ارائه اطلاعات کشور به الگوریتم امری بی اهمیت است. برای نقشه‌هایی که مناطق مرزی کشورها را نشان می‌دهند، گنجاندن هر دو کشور در درخواست‌های ژئوکدر می‌تواند مفید باشد. علاوه بر پرس و جو برچسب های متنی شناسایی شده با ژئوکدرها، کل خط لوله پردازش، از تشخیص و تشخیص متن تا پیش بینی موقعیت جغرافیایی، نسبتا سریع است.بخش 3.7 تقریباً همه بردار شدند و بنابراین بسیار کارآمد هستند.
با این حال، تعیین اینکه آیا پیش‌بینی‌های ارجاع جغرافیایی به‌طور خودکار دقیق بوده‌اند، دشوار است. این یک مشکل کلاسیک است که بسیاری از رویکردهای بدون نظارت را آزار می دهد، زیرا هنگام استفاده از این تکنیک در عمل، هیچ داده برچسب گذاری شده ای در دسترس نخواهد بود. با این حال، با توجه به اینکه نقشه شطرنجی بخشی از یک سری یکنواخت است (که معمولاً در مورد نقشه‌های توپوگرافی صدق می‌کند) می‌توانیم برخی اعتبارسنجی‌های اضافی را انجام دهیم. برای مثال، اگر ارتفاع یا عرض موقعیت جغرافیایی پیش‌بینی‌شده برای یک نقشه بسیار بیشتر از پیش‌بینی‌های دیگر باشد، می‌توان فرض کرد که این پیش‌بینی دقیق‌تر است. علاوه بر این، اگر ترتیب برگه‌های نقشه مشخص باشد، مکان‌های جغرافیایی شکست خورده نیز می‌توانند شناسایی شوند، زیرا همپوشانی بسیار بیشتری با سایر پیش‌بینی‌ها خواهند داشت. البته،
ستون فقرات این خط لوله، تعیین منطقه اولیه مورد نظر است. از آنجایی که از خوشه‌بندی مبتنی بر چگالی استفاده شده است، این تعیین فرض می‌کند که تشخیص متن قابل استفاده بوده و تعداد تطابق‌های ژئوکدر مثبت کاذب در مقایسه با تعداد منطبق‌های صحیح نسبتاً کم است. بنابراین، دو مورد شکست اصلی رویکرد مکان‌یابی جغرافیایی زمانی اتفاق می‌افتد که نقشه کیفیت پایینی داشته باشد، که منجر به نتایج تشخیص متن ضعیف می‌شود، یا زمانی که برچسب‌های متن به طور مداوم به کلمات چندگانه و دور تقسیم می‌شوند یا با ترتیبات پیچیده ارائه می‌شوند. تکنیک‌های تشخیص متن که می‌توانند با تصاویر با کیفیت پایین کار کنند، مانند [ 26]، می تواند برای بهبود نتایج استفاده شود. اما معمولاً در هنگام تجزیه و تحلیل نقشه های شطرنجی این مسئله مطرح نمی شود. مسئله اصلی اغلب پیوند صحیح برچسب های متنی با عبارت مکان یکسان است. این موضوع تمرکز تحقیقات ما نبود و کار بی اهمیتی برای حل آن نیست، زیرا کار چشمگیر در [ 16] نشان می دهد. حتی با یک تکنیک پیچیده برای پیوند صحیح برچسب های متنی، برخی از خطاها باقی ماندند. در آن مطالعه، فقط مرکز هر نقشه جغرافیایی تعیین شد. مرکز بزرگترین خوشه مطابقت های ژئوکددر به عنوان پیش بینی مرکز نقشه در نظر گرفته شد که منجر به خطاهای 27٪، 48٪ و 51٪ با مرکز حقیقت زمین، نسبت به قطرهای نقشه، برای سه نقشه مورد بحث شد. در جزئیات بدون هیچ پیوند متنی، این خطاها بیش از 91 درصد بود که به وضوح اهمیت آن را در پیش‌بینی منطقه مورد علاقه اولیه نشان می‌دهد.
با وجود اینکه از نتایج ارائه شده راضی هستیم، معتقدیم که هنوز جای پیشرفت زیادی وجود دارد. عمدتاً پیوند متن و جست‌وجوی geocoder نیاز به بهبود دارند، زیرا این موارد در پیش‌بینی یک منطقه اولیه مورد علاقه کلیدی هستند. افزودن اطلاعات معنایی اضافی همچنین می تواند به تعیین موقعیت های جغرافیایی قوی تر کمک کند. در حال حاضر، هر برچسب متنی و نام اصلی مربوطه، ساده لوحانه به عنوان یک نقطه در نظر گرفته می شود. این نام‌ها اغلب نقاط منفرد را نشان نمی‌دهند، بلکه خطوط و چندضلعی‌ها را نشان می‌دهند. واضح است که این روش بهینه برای مقابله با این نوع ویژگی ها نیست. علاوه بر این، برچسب‌های متنی که ویژگی‌های قابل مشاهده روی نقشه را نشان می‌دهند، مانند رودخانه‌ها و خیابان‌ها، می‌توانند همراه با محتوای بصری برای تعیین موقعیت جغرافیایی دقیق‌تر استفاده شوند. همچنین دادن وزن بیشتر به ویژگی های مختلف می تواند مفید باشد، بسته به نوع آنها برای مثال، نام خیابان ممکن است اطلاعات مفیدتر و محلی‌تری نسبت به نام مکان ارائه دهد. در نهایت، کار بیشتری باید روی توسعه یک استراتژی موثر برای اعتبار سنجی موقعیت جغرافیایی پیش بینی شده به روشی بدون نظارت انجام شود. دانستن اینکه آیا پیش‌بینی‌ها برای نقشه‌های خاص در مجموعه داده دقیق نبوده‌اند، می‌تواند ارزشمند باشد. سپس می توان آنها را به صورت دستی اصلاح کرد.

6. نتیجه گیری

ما یک تکنیک خودکار برای ارجاع جغرافیایی نقشه‌های شطرنجی توپوگرافی با استفاده از مدل‌های تشخیص متن و ژئوکدرهای از پیش آموزش‌دیده توسعه داده‌ایم. دو مجموعه داده پردازش شد که منجر به خطای متوسط ​​316 متر (1.67٪) و 287 متر (0.90٪) برای نقشه های 19 کیلومتری و 32 کیلومتری شد. با میانگین خطاها در 2٪ از اندازه نقشه، اکنون می توان این نقشه ها را برای یک منطقه خاص مورد علاقه به طور دقیق جستجو کرد. سپس نقشه های جغرافیایی ارجاع شده را می توان در یک GIS با برچسب های متنی شناسایی شده و نام های داده باز پیوند داده شده به عنوان ابرداده اضافی برای هر نقشه شطرنجی در مجموعه ادغام کرد. این ابرداده اضافی کیفیت و دسترسی به مجموعه داده را تا حد زیادی بهبود می بخشد.

منابع

  1. کراچیونسکو، وی. کنستانتینسکو، ش. اویجانو، آی. Rus, I. پروژه eHarta: یک ابتکار مشترک برای حفظ دیجیتالی و به اشتراک گذاری آزادانه اسناد کارتوگرافی قدیمی در رومانی. e-Perimetron 2011 ، 6 ، 261-269. [ Google Scholar ]
  2. ناوگان، سی. کوال، کی سی; Pridal, P. Georeferencer: Georeferencing جمعی برای مجموعه های کتابخانه نقشه. D-Lib Mag. 2012 ، 18 ، 52. [ Google Scholar ] [ CrossRef ]
  3. واترز، تی مپ وارپر. 2020. در دسترس آنلاین: https://mapwarper.net/ (در 20 مه 2022 قابل دسترسی است).
  4. پزشک، ع. Tutwiler، RL استخراج خودکار ویژگی ها و تشخیص متن از نقشه های توپوگرافی اسکن شده. IEEE Trans. Geosci. Remote Sens. 2011 , 49 , 5047–5063. [ Google Scholar ] [ CrossRef ]
  5. بیساکو، آ. کامینز، ام. نتزر، ی. Neven, H. Photoocr: خواندن متن در شرایط کنترل نشده. در مجموعه مقالات کنفرانس بین المللی IEEE در بینایی کامپیوتر، سیدنی، NSW، استرالیا، 1-8 دسامبر 2013. صص 785-792. [ Google Scholar ]
  6. تفتی، AP; بقایی، ع. آصفی، م. عرب نیا، منابع انسانی; یو، ز. Peissig، P. OCR به عنوان یک سرویس: ارزیابی تجربی Google Docs OCR، Tesseract، ABBYY FineReader، و Transym. در مجموعه مقالات سمپوزیوم بین المللی در محاسبات بصری، لاس وگاس، NV، ایالات متحده آمریکا، 12-14 دسامبر 2016. صص 735-746. [ Google Scholar ]
  7. کاراتزاس، دی. گومز-بیگوردا، ال. نیکولائو، ا. قوش، س. باگدانوف، آ. ایوامورا، م. ماتاس، جی. نویمان، ال. چاندراسخار، وی آر؛ لو، اس. و همکاران مسابقه ICDAR 2015 در مورد خواندن قوی. در مجموعه مقالات سیزدهمین کنفرانس بین المللی تجزیه و تحلیل و شناسایی اسناد (ICDAR) در سال 2015، تونس، تونس، 23 تا 26 اوت 2015؛ صص 1156–1160. [ Google Scholar ]
  8. ویت، ا. ماترا، تی. نویمان، ال. ماتاس، جی. Belongie, S. Coco-text: مجموعه داده و معیار برای تشخیص و تشخیص متن در تصاویر طبیعی. arXiv 2016 , arXiv:1601.07140. [ Google Scholar ]
  9. باک، جی. کیم، جی. لی، جی. پارک، اس. هان، دی. یون، اس. اوه، SJ; لی، اچ. مقایسه مدل های تشخیص متن صحنه چه اشکالی دارد؟ تجزیه و تحلیل مجموعه داده و مدل در مجموعه مقالات کنفرانس بین‌المللی IEEE در بینایی رایانه، سئول، کره، 27 اکتبر تا 2 نوامبر 2019؛ صص 4715-4723. [ Google Scholar ]
  10. میلویل، ک. ورستوکت، اس. Van de Weghe, N. بهبود دقت تشخیص توپونیم در نقشه های توپوگرافی تاریخی. در کارگاه بین المللی بردارسازی خودکار نقشه های تاریخی . گروه نقشه برداری و ژئوانفورماتیک، دانشگاه ELTE Eötvös Loránd: بوداپست، مجارستان، 2020. [ Google Scholar ]
  11. آبکنار، س. احمدی فرد، ع. استخراج متن از نقشه های رستری با استفاده از کوانتیزه کردن فضای رنگ. CS IT Conf. Proc. 2017 ، 7 ، 77-86. [ Google Scholar ] [ CrossRef ]
  12. Höhn, W. تشخیص برچسب‌های متنی با جهت‌گیری دلخواه در نقشه‌های اولیه. در مجموعه مقالات کنفرانس ایبری در تشخیص الگو و تجزیه و تحلیل تصویر، مادیرا، پرتغال، 5-7 ژوئن 2013. صص 424-432. [ Google Scholar ]
  13. چیانگ، YY; Knoblock، CA تشخیص متن در نقشه های شطرنجی. Geoinformatica 2015 ، 19 ، 1-27. [ Google Scholar ] [ CrossRef ]
  14. Weinman, J. مدل‌های جغرافیایی و سبک برای هم‌ترازی نقشه‌های تاریخی و تشخیص توپونیوم. در مجموعه مقالات چهاردهمین کنفرانس بین المللی IAPR در سال 2017 در تجزیه و تحلیل و شناسایی اسناد (ICDAR)، کیوتو، ژاپن، 9 تا 15 نوامبر 2017؛ جلد 1، ص 957–964. [ Google Scholar ]
  15. توکل، س. چیانگ، YY; واترز، تی. هان، اف. پراساد، ک. آزمایشگاه های کیوریس، آر. کارتا: بازپرداخت نقشه های تاریخی. در مجموعه مقالات سومین کارگاه بین المللی ACM SIGSPATIAL در مورد هوش مصنوعی برای کشف دانش جغرافیایی، سیاتل، WA، ایالات متحده آمریکا، 5 نوامبر 2019؛ ص 48-51. [ Google Scholar ]
  16. لی، ز. چیانگ، YY; توکل، س. شبیتا، بی. Uhl، JH; لیک، اس. Knoblock، CA رویکردی خودکار برای ایجاد ابرداده های جغرافیایی مرتبط و غنی از تصاویر نقشه تاریخی. در مجموعه مقالات بیست و ششمین کنفرانس بین المللی ACM SIGKDD در مورد کشف دانش و داده کاوی، رویداد مجازی، 23 تا 27 اوت 2020؛ صص 3290-3298. [ Google Scholar ]
  17. باک، ی. لی، بی. هان، دی. یون، اس. لی، اچ. آگاهی منطقه کاراکتر برای تشخیص متن. در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو، لانگ بیچ، کالیفرنیا، ایالات متحده آمریکا، 16 تا 17 ژوئن 2019؛ ص 9365–9374. [ Google Scholar ]
  18. شی، بی. بای، ایکس. یائو، سی. یک شبکه عصبی قابل آموزش سرتاسر برای تشخیص توالی مبتنی بر تصویر و کاربرد آن در تشخیص متن صحنه. IEEE Trans. الگوی مقعدی ماخ هوشمند 2017 ، 39 ، 2298-2304. [ Google Scholar ] [ CrossRef ] [ PubMed ][ نسخه سبز ]
  19. ژو، ایکس. یائو، سی. ون، اچ. وانگ، ی. ژو، اس. او، دبلیو. لیانگ، جی ایست: یک آشکارساز متن صحنه کارآمد و دقیق. در مجموعه مقالات کنفرانس IEEE در مورد دید رایانه و تشخیص الگو، هونولولو، HI، ایالات متحده آمریکا، 21 تا 26 ژوئیه 2017؛ صص 5551–5560. [ Google Scholar ]
  20. دانی، جی پی؛ Lambot, P. استانداردهای ژئودتیکی و کارتوگرافی که در بلژیک اعمال می شود. مختصر جئوگر. بلژیک 2012 ، 1 ، 41-42. [ Google Scholar ]
  21. استر، ام. کریگل، اچ پی؛ ساندر، جی. Xu, X. الگوریتم مبتنی بر چگالی برای کشف خوشه‌ها در پایگاه‌های داده فضایی بزرگ با نویز. در مجموعه مقالات دومین کنفرانس بین المللی کشف دانش و داده کاوی (KDD’96)، پورتلند، OR، ایالات متحده آمریکا، 2 تا 4 اوت 1996. صص 226-231. [ Google Scholar ]
  22. فیشلر، MA; بولس، اجماع نمونه تصادفی RC: الگویی برای تطبیق مدل با کاربردهای آنالیز تصویر و کارتوگرافی خودکار. اشتراک. ACM 1981 ، 24 ، 381-395. [ Google Scholar ] [ CrossRef ]
  23. دی مایر، پ. De Vliegher، BM; بروندیل، ام. اشپیگل ون د ورلد ; انتشارات آکادمی: گنت، بلژیک، 2004. [ Google Scholar ]
  24. استوتر، جی. کراک، ام جی. Knippers، R. تعمیم داده های چارچوب: یک دستور کار تحقیقاتی. در مجموعه مقالات کارگاه ICA در مورد “تعمیم و نمایندگی چندگانه”، لستر، بریتانیا، 20-21 اوت 2004. ص 20-21. [ Google Scholar ]
  25. ریتر، ن. روث، ام. استاندارد تبادل داده GeoTiff برای تصاویر جغرافیایی شطرنجی. بین المللی J. Remote Sens. 1997 ، 18 ، 1637-1647. [ Google Scholar ] [ CrossRef ]
  26. وانگ، دبلیو. زی، ای. سان، پ. وانگ، دبلیو. تیان، ال. شن، سی. Luo, P. TextSR: وضوح فوق العاده متن آگاه از محتوا که توسط تشخیص هدایت می شود. arXiv 2019 ، arXiv:1909.07113. [ Google Scholar ]
شکل 1. نمای کلی از کل خط لوله.
شکل 2. مستطیل بیرونی با عملیات مورفولوژیکی (به رنگ آبی)، و منطقه نقشه موثر از طریق تشخیص متن در مختصات اطراف (قرمز) تعیین می شود.
شکل 3. نمونه ای از ادغام برچسب های متن در جهت خواندن طبیعی.
شکل 4. نمونه ای از راه حل پیشنهادی برای متن عمودی گرا. ( الف ) متن به اشتباه به عنوان کاراکتر “s” شناخته شد. ( ب ) نتیجه تشخیص متن پس از تاب برداشتن متن به هر دو صورت.
شکل 5. هیستوگرام ها توزیع تعداد تطابقات رمزگذار جغرافیایی را در هر برچسب متن شناسایی شده برای هر دو مجموعه داده نشان می دهد. بسیاری از برچسب های متنی دارای تعداد زیادی تطابق ژئوکدر (بیش از 50) هستند که ارزش زیادی ارائه نمی دهند.
شکل 6. مختصات ژئوکدر اولیه قبل و بعد از فیلتر کردن و خوشه بندی مطابقت دارد. ( الف ) مختصات تطابق ژئوکدر اولیه. مستطیل سبز نشان دهنده موقعیت جغرافیایی حقیقت زمینی نقشه است. شکل بلژیک در توزیع نقاط قابل مشاهده است (نقاط پرت شدید برای بهبود دید شکل نشان داده نشده است). ( ب ) نتیجه پس از فیلتر کردن و خوشه بندی مختصات اولیه. بزرگترین خوشه یافت شده با رنگ قرمز نشان داده شده است. مستطیل سبز نشان دهنده موقعیت جغرافیایی حقیقت زمینی نقشه است.
شکل 7. مختصات منطبقات ژئوکددر که در داخل منطقه اولیه مورد نظر قرار داشتند. موقعیت جغرافیایی حقیقت زمینی نقشه به رنگ سبز نشان داده شده است.
شکل 8. بررسی اجمالی الگوریتم فیلتر کردن نقاط پرت RANSAC.
شکل 9. ( سمت چپ ) مختصات طول و عرض جغرافیایی منطبق بر ژئوکدر. مستطیل های سبز و قرمز به ترتیب موقعیت جغرافیایی حقیقت زمین و موقعیت جغرافیایی پیش بینی شده را نشان می دهند. جفت های انتخاب شده در طول الگوریتم RANSAC با رنگ قرمز و بقیه با آبی نشان داده می شوند. ( سمت راست ) مختصات پیکسل X و Y برچسب های متنی مربوطه. مستطیل سبز مرزهای نقشه شطرنجی (عرض و ارتفاع) را نشان می دهد.
شکل 10. پیش بینی موقعیت جغرافیایی نهایی (به رنگ قرمز) و موقعیت جغرافیایی حقیقت زمین (به رنگ سبز) برای نقشه Gent-Melle. جفت های مورد استفاده برای پیش بینی با رنگ قرمز مشخص شده اند. یک همبستگی قابل مشاهده بین موقعیت های نسبی جفت نقطه وجود دارد.
شکل 11. میانگین و فاصله خطای مکان جغرافیایی برای هر نقشه در مجموعه داده M834.

بدون دیدگاه

دیدگاهتان را بنویسید