1. مقدمه
جاده ها بخش های مهم شهرها هستند. اشیاء خیابانی در دو طرف جاده بخش مهمی از مدیریت زیرساخت شهری، ساخت سیستم حمل و نقل هوشمند و نقشههای با دقت بالا بدون سرنشین هستند [ 1 ، 2 ]. دستیابی به جمع آوری سریع و دقیق اشیاء خیابانی به یک وظیفه مهم برای ساخت دیجیتال شهرها و ترافیک و همچنین تحقق رانندگی خودکار تبدیل شده است. موقعیت جغرافیایی و ویژگیهای اشیاء خیابانی شاخصهای مهمی برای جمعآوری بهویژه اطلاعات مکان است که اساس شی خیابان و یکی از مهمترین عوامل آن است. موقعیت مکانی اشیاء خیابانی می تواند در مدیریت دارایی جاده [ 3 ] و محاسبه شاخص ریسک ایمنی برای ارزیابی ایمنی راه کمک کند [3]4 ]. وجود اشیاء خیابانی مناسب در مکان های مناسب می تواند به طور موثری خطرات ترافیکی را کاهش دهد، به عنوان مثال، با قرار دادن علائم راهنمای آسان خوان بر روی پیچ ها [ 5 ]. بنابراین، انجام موقعیت جغرافیایی موثر و کسب ویژگی های اشیاء خیابانی بسیار مهم است.
برای به دست آوردن موقعیت جغرافیایی و اطلاعات ویژگی های اشیاء خیابانی در دو طرف جاده، یک روش جمع آوری و استخراج داده های موثر مورد نیاز است. روشهای جمعآوری دادههای کنونی شامل اندازهگیری میدان دستی، تصاویر سنجش از راه دور هوایی و سیستمهای نقشهبرداری موبایل (MMS) است. اندازهگیری دستی میدانی به تعداد زیادی متخصص برای انجام اندازهگیریهای خارجی نیاز دارد و هزینه نیروی کار نسبتاً بالا است. تصاویر سنجش از دور هوایی سطح جاده را از منظری از بالا به پایین مشاهده میکنند که میتواند اشیاء با مساحت بزرگ مانند خطکشیهای جاده را بهتر جمعآوری کند [ 6 ]. با این حال، منطقه طرحنویسی املایی اشیاء باریک و عمودی در دو طرف جاده کوچک است و بنابراین گرفتن آن دشوار است، فاقد جزئیات محلی است [ 7 ]]، و تحت تأثیر ساختمان های بلند و درختان دو طرف جاده قرار دارد. با توجه به MMS که می تواند اشیاء خیابانی را در دو طرف جاده از نمای جانبی مشاهده کند، نتایج مشاهدات بیشتر با روانشناسی بصری افرادی که اشیا را مشاهده می کنند مطابقت دارد و به راحتی استخراج می شود [ 8 ]. اندازهگیری مبتنی بر MMS متکی به مجهز بودن سیستم به یک سیستم ماهوارهای ناوبری جهانی با دقت بالا (GNSS) برای تعیین موقعیتیابی، یک واحد اندازهگیری اینرسی فرکانس بالا (IMU) برای درک تعیین نگرش، یک دوربین با وضوح بالا برای تشخیص خیابان مشاهده تصویربرداری، و لیزر پرسرعت برای اندازهگیری فاصله اشیاء خیابانی [ 9 ]]. به عنوان یک دستگاه اندازه گیری، LIDAR می تواند مکان دقیق اشیاء خیابان را از داده های ابر نقطه ای به دست آمده توسط اسکن استخراج کند، اگرچه هزینه آن بالا است [ 10 ، 11 ]. در مقایسه با تصاویر، ابر نقطه در تقسیم بندی معنایی چالش برانگیزتر است، به ویژه برای صحنه های پیچیده که در آن فناوری نابالغ است. بنابراین، بر اساس یک دوربین نصب شده بر روی سیستم، با کمک تحلیل معنایی تصویر فعلی و نسبتا بالغ [ 12 ] و روشهای تشخیص اشیا [ 13 ]، محلیسازی اشیاء خیابانی بر اساس تصاویر چند نمای خیابان تبدیل شده است. یک جایگزین کم هزینه [ 14 ، 15 ].
روش سنتی موقعیتیابی شیء مبتنی بر تصاویر چند نمای خیابانی که توسط MMS به دست میآید، بر تطابق بصری متکی است. با توجه به ویژگی های تصویر، نقاط مربوطه مطابقت داده می شوند، و موقعیت با محدودیت های هندسی ایجاد شده توسط نقاط مربوطه تحقق می یابد. چانگ و همکاران امکان سنجی موقعیت یابی شی را بر اساس تصاویر چند نمای خیابان با تطبیق دستی نقاط مربوطه نشان داد [ 16 ]. نصار مکان دوربین، فاصله دوربین و زاویه سمت هدف بدستآمده توسط سیستم MMS را بهعنوان پارامترهای ورودی میگیرد، محدودیتهای نرم هندسی را برای شبکه عصبی کانولوشن سیامی اعمال میکند و برای دستیابی به موقعیت مثلثی بر اشیاء منطبق در نماهای متعدد تکیه میکند. 17]. Ogawa استفاده از نقشه و مکان ساختمان ها در تصاویر را برای تصحیح پارامترهای موقعیت دوربین تصویر گرفته شده پیشنهاد کرد، در نتیجه دقت تشخیص شی و دقت موقعیت جغرافیایی تصویر را بهبود بخشید [ 18 ]. زو و همکاران تطبیق تصویر خیابان به هوایی را بر اساس یک شبکه عصبی کانولوشن سیامی بهبودیافته برای تخمین موقعیت جغرافیایی و جهت گیری اهداف در تصاویر نمای خیابان انجام داد [ 19 ]. هنگام تلاش برای مطابقت خودکار نقاط متناظر، به دلیل شباهت اشیاء و پسزمینه در تصاویر چند نمای، تشخیص خودکار اشیاء مشابه در یک پسزمینه دشوار است [ 20 ]]. تصاویر چند نمای به دست آمده توسط MMS دارای نواحی همپوشانی کمتری هستند و دستیابی به نتایج رضایت بخشی در تطابق بصری با استفاده از نقاط کلیدی شی تصویر یا توصیفگرها دشوار است [ 21 ، 22 ]. اشیاء موجود در تصاویر بدستآمده توسط MMS دارای ویژگیهای بصری مشابه از یک نوع و نمونههای مختلف و ویژگیهای بصری متفاوت از یک نمونه و دیدگاههای متفاوت هستند که تطبیق بصری چند نمای را دشوار میکند.
به منظور حل مشکل تطبیق بصری تصاویر چند نمای به دست آمده توسط MMS، محققان سعی کرده اند مشکل موقعیت یابی تطبیق بصری را به یک مشکل موقعیت یابی غیرفعال تبدیل کنند [ 23 ، 24 ، 25 ]. ابتدا شی مورد نظر از تصاویر چند نمای تشخیص داده می شود و سپس جهت گیری شی مورد نظر نسبت به موقعیت عکسبرداری با توجه به پارامترهای پوز محاسبه می شود. سپس جهت گیری با استفاده از خط یاتاقان (LOB) نشان داده می شود و در نهایت، محل احتمالی شی مورد نظر با تقاطع LOB محاسبه می شود. چو و همکاران یک روش مبتنی بر یادگیری عمیق برای تعیین جهت اشیاء در تصاویر پیشنهاد شده است [ 26 ]]. این روش شکل جدیدی از اکتساب و تصحیح جهت گیری LOB و همچنین بهبود دقت موقعیت یابی بر اساس روش LOB را ارائه می دهد. هازلهوف و همکاران از تقاطع و مرکز تجمع LOB های شی در نماهای متعدد به عنوان نتیجه موقعیت یابی استفاده کرد، اگرچه نتیجه ممکن است شامل تعداد زیادی گره شبح باشد [ 27 ، 28 ]. بر اساس روش بهینه سازی میدان تصادفی مارکوف، کریلوف و همکاران. داده های فاصله اشیاء را به تصمیم گیری برای کاهش گره های ارواح وارد کرد، اگرچه نتایج موقعیت یابی شی اغلب تصادفی قابل توجهی داشتند [ 21 ]]. ناسار تشخیص شی و تخمین عمق را در یک شبکه عصبی گراف انتها به انتها ادغام میکند و بر اطلاعات عمق تخمینی تکیه میکند تا فاصله عملیاتی LOB تولید شده توسط نتیجه تشخیص شی را برای دستیابی به موقعیت جغرافیایی تعیین کند [ 20 ]. به طور مشابه، لومنیتز و همکاران. یک الگوریتم تخمین عمق تک چشمی و مثلث بندی را برای نمای خیابان گوگل و نقشه نقشه اعمال کرد و تقاطع های LOB مجاور را در یک خوشه جمع آوری کرد تا موقعیت جغرافیایی درختان شهری در سطح متر را درک کند [ 29 ]]. این روش ها همگی اطلاعات عمقی را معرفی می کنند که دقت موقعیت یابی به دقت آنها بستگی دارد. ژانگ روشی برای اندازهگیری LOB مبتنی بر brute-force اصلاحشده پیشنهاد کرد، که تأثیر گرههای شبح بر نتایج موقعیتیابی قطبهای شهری را بدون معرفی دادههای دیگر کاهش میدهد و میتواند نتایج موقعیتیابی پایدار را به دست آورد [ 30 ]. خان موقعیت جغرافیایی درختان اکالیپتوس را در دو طرف جاده بر اساس اندازهگیری LOB بر اساس نیروی brute-force اصلاح شده دریافت که امکانسنجی این روش را یک بار دیگر تأیید کرد [ 31 ]]. با این حال، اکثر روشهای موقعیتیابی مبتنی بر LOB به تعداد زیادی از محدودیتهای آستانه نیاز دارند و انتخاب یک مقدار آستانه مناسب دشوار است. به عنوان مثال، اندازهگیری LOB مبتنی بر brute-force اصلاحشده باید عرض جاده و سایر عوامل را در نظر بگیرد، که اعمال آن برای استخراج اشیاء در دو طرف جاده با محدوده وسیع و عرضهای مختلف دشوار است.
با هدف کاربرد انتخاب آستانه برای صحنههای مختلف جاده بر اساس موقعیتیابی شی LOB، در این مقاله، ما یک روش موقعیتیابی خودکار برای اشیاء خیابانی بر اساس LOB با محدودیتهای تطبیقی پیشنهاد میکنیم. این روش می تواند به طور خودکار منطقه محاسبه را بر اساس فاصله جمع آوری موثر کالیبره شده و مسیر حرکت به شبکه ها تقسیم کند، که محدوده موثر محاسبه تقاطع LOB را محدود می کند. با توجه به رابطه بین LOB و نقطه تقاطع، دو قانون محدود مستقل از آستانه برای حذف بیشتر گره های شبح تولید شده توسط تقاطع LOB پیشنهاد شده است. نتایج محاسبات رزرو شده نتایج موقعیت یابی خودکار اشیاء خیابانی است. الگوریتم ارائه شده در این مقاله تحت تأثیر عواملی مانند عرض جاده، و برای صحنه های مختلف جاده مناسب است. انتخاب تطبیقی آستانه محدودیت LOB با فاصله عکسبرداری موثر از تصاویر MMS و مسیر رانندگی، که کاربرد جهانی و قابل تعمیم دارد، محقق می شود.
بقیه این مقاله به شرح زیر تنظیم شده است. بخش 2 اجرای روش پیشنهادی را معرفی می کند و اصل اساسی را توضیح می دهد. بخش 3 شهر Yincun، شهر Changzhou، استان جیانگ سو، چین را به عنوان منطقه آزمایشی معرفی می کند، با تصاویر نمای خیابان از منطقه جمع آوری شده توسط MMS به عنوان داده های آزمایشی، و ما فرآیند آزمایشی و نتایج را با جزئیات معرفی می کنیم. سپس، روش موقعیتیابی خودکار اشیاء خیابانی را بر اساس محدودیت خود تطبیقی LOB پیشنهاد شده در این مقاله و روش موقعیتیابی LOB مبتنی بر brute-force اصلاحشده مقایسه و تحلیل میکنیم. آستانه های مختلف نشان داده شده و مورد بحث قرار گرفته است. در نهایت متن کامل خلاصه می شود.
2. روش شناسی
در این مقاله، ما یک روش موقعیتیابی خودکار برای اشیاء در تصاویر نمای خیابان با محدودیت خود تطبیقی LOB پیشنهاد میکنیم که عمدتاً شامل دو بخش است: نقشهبرداری LOB بر اساس نتایج تشخیص شی و موقعیتیابی جغرافیایی مبتنی بر LOB. فرآیند خاص در شکل 1 نشان داده شده است. نقشه برداری LOB بر اساس نتایج تشخیص شی شامل تشخیص شی مشخص شده با یک جعبه محدود و شبیه سازی خط دید بر اساس LOB ها است. موقعیتیابی جغرافیایی مبتنی بر LOB شامل تقسیمبندی شبکه بر اساس مسیر حرکت، کسب نقاط تقاطع بر اساس LOB و حذف گرههای ارواح توسط قوانین محدود میشود. در فرآیند موقعیتیابی جغرافیایی مبتنی بر LOB، تقسیم شبکه بر اساس مسیر حرکت پیشنهادی در این مقاله، کارایی محاسباتی را بهبود میبخشد. همچنین محدودیت های خود تطبیقی را برای حذف گره های ارواح فراهم می کند. برای بهبود دقت موقعیت یابی اشیاء خیابانی با سایر محدودیت ها کار می کند.
2.1. نقشه برداری LOB بر اساس نتایج تشخیص شی
برای درک موقعیت شیء مبتنی بر تصویر، لازم است شیء موجود در تصویر شناسایی شود. الگوریتمهای تشخیص شیء تصویر نسبتاً بالغی وجود دارد که به نتایج تشخیص خوبی در تشخیص اشیاء خیابانی دست یافتهاند [ 11 ، 32 ، 33 ]. در این مقاله، یک شبکه عصبی کانولوشنال منطقه آبشاری (آبشار R-CNN) برای تحقق تشخیص اشیا استفاده شده است. همانطور که در شکل 2 نشان داده شده است، مدل ویژگی های تصویر ورودی را از طریق کانولوشن های ستون فقرات استخراج می کند. از شبکه پیشنهادی منطقه (RPN) برای به دست آوردن یک سری پیشنهادات مستطیلی خشن از شی استفاده می کند. یک سری از آشکارسازهای فرعی سرتاسر به صورت آبشاری، و جعبه های مرزی خروجی توسط آشکارساز مرحله قبلی به آشکارساز مرحله دوم وارد می شوند. این به تدریج آستانه تقاطع بیش از اتحادیه (IoU) بین کاندید محدود و حقیقت زمین محدود را افزایش می دهد تا نتایج تشخیص را بهبود بخشد [ 34 ]. در مقایسه با سایر مدلهای سری R-CNN، آبشار R-CNN شبکههای فرعی شناسایی را با چارچوبهای مختلف معرفی میکند. این برتناسب بیش از حد رگرسیون در یک آستانه IoU خاص غلبه می کند و می تواند به دقت تشخیص نسبتاً خوبی دست یابد [ 34 ]]. اشیایی که باید شناسایی شوند در تصاویر با جعبه های محدود کننده علامت گذاری می شوند و از R-CNN آبشاری برای آموزش و یادگیری استفاده می شود تا همان نوع اشیاء در تصاویر دیگر به طور خودکار با جعبه های محدود کننده علامت گذاری شوند.
همانطور که در شکل 3 نشان داده شده است ، فضای تصویر مختصات است پیکسل مرکزی جعبه با توجه به جعبه مرزی جسم شناسایی شده در تصویر و قانون تصویربرداری به دست می آید [ 8 ، 35 ]. همراه با مختصات فضایی ثبت شده توسط GNSS و زاویه اویلری ثبت شده توسط IMU، مکان و نگرش مطلق وسیله نقلیه به دست می آید، رابطه نقشه برداری بین مرز و جهت مشاهده محاسبه می شود و LOB ساخته می شود [ 30 ، 31 ، 36 ].
طرح ریزی پیکسل در سیستم مختصات جهان می توان از طریق رابطه (1) به دست آورد:
که در آن s نشان دهنده ضریب عمق است که در محاسبات بعدی جبران خواهد شد. R نشان دهنده ماتریس چرخش از سیستم مختصات تصویر-فضای تخمین زده شده از پارامترهای نگرش خودرو به سیستم مختصات جهانی است. و مختصات دنیای دوربین محاسبه شده از پارامترهای GNSS و پارامترهای کالیبراسیون را نشان می دهد.
جهت b مربوط به پیکسل را می توان با رابطه (2) بیان کرد:
LOB با l نشان داده می شود، همانطور که در رابطه (3) نشان داده شده است:
2.2. موقعیت یابی جغرافیایی بر اساس LOB محدود شده خودسازگار
پس از به دست آوردن LOB از نگاشت شی شناسایی شده در تصویر نمای خیابان، تطبیق تداعی شی شناسایی در تصاویر چند نمایه با تجمع فضایی LOB تحقق می یابد. با این حال، ممکن است تعداد زیادی تداعی نادرست ایجاد شود و گرههای شبح را تشکیل دهند. برای کاهش تأثیر گرههای ارواح، ابتدا محدوده تقسیم شبکه به طور خودکار با توجه به مسیر حرکت محاسبه میشود، فاصله مؤثر LOB محدود میشود و گرههای شبح ابتدا حذف میشوند. سپس، تقاطع LOB ها در هر شبکه با یک ماتریس رابطه بیان می شود و گره های شبح بر اساس قوانین محدود خود تطبیقی پیشنهادی حذف می شوند. در ادامه، فرآیند روش موقعیت یابی مبتنی بر LOB به تفصیل شرح داده شده است.
2.2.1. اندازه گیری LOB
همانطور که در شکل 4 نشان داده شده است ، هنگامی که یک شیء مشابه توسط تصاویر چند نما گرفته می شود، کادر محدود کننده شی به یک LOB نگاشت می شود، که یک تقاطع هندسی، یعنی تقاطع LOB ایجاد می کند. با این حال، به دلیل وجود خطاهای مشاهده، این تقاطع ها اغلب در فضا به طور کامل همپوشانی ندارند، اما در یک خوشه در یک محدوده خاص جمع می شوند. مرکز تقاطع ها در این خوشه نشان دهنده موقعیت جغرافیایی شی خیابان است.
همانطور که در شکل 5 نشان داده شده است ، جعبه های مرزی شناسایی شده از تصاویر مختلف در صحنه های پیچیده، همه یک شی نیستند. نقاط تقاطع را می توان بین هر دو LOB غیر موازی ایجاد کرد که شامل موقعیت جغرافیایی واقعی شی شناسایی شده و همچنین شامل تعداد زیادی گره شبح است. بنابراین، قوانین محدود خاصی برای حذف گرههای ارواح مورد نیاز است.
2.2.2. تقسیم گرید
با توجه به گستره وسیع مسیر حرکت، هر نقطه مسیر در محدوده می تواند چندین LOB ایجاد کند و تنها تقاطع LOB ایجاد شده توسط نقاط مسیر با فاصله کوتاه می تواند موقعیت جغرافیایی جسم را تعیین کند. محدوده مسیر حرکت به شبکهها تقسیم میشود و هر بار محاسبه تقاطع LOB فقط در شبکه مجاور انجام میشود، که به طور غیرمستقیم طول موثر LOB را محدود میکند، به طور بالقوه محاسبات غیر ضروری را کاهش میدهد و گرههای شبح خارج از محدوده موثر را حذف میکند. LOB.
همانطور که در شکل 6 نشان داده شده است ، یک مسیر رانندگی شامل n رکورد به صورت ثبت شده است و میانگین طول خط پایه مثلث بندی نماهای مجاور را می توان با معادله (4) تخمین زد که با bl نشان داده می شود .
با توجه به محدوده دو بعدی مسیر رانندگی ( ، به طور مساوی به چندین شبکه مربع تقسیم می شود و k برابر فاصله bl اندازه شبکه واحد می گیرد. تعداد ستون ها، و تعداد ردیف ها، را می توان با رابطه (5) بدست آورد:
جایی که Ceil نشان دهنده تابع گرد کردن است.
در هر فرآیند محاسبه، نقاط تقاطع فقط برای LOB نگاشت شده توسط تصاویر گرفته شده در محدوده معادله (6) محاسبه می شود، که با محاسبه گرید نشان داده می شود ، و فقط نتایج موقعیت جغرافیایی در محدوده معادله (7) ثبت می شود. با Grid recorded نشان داده شده است .
که در آن col نشان دهنده شماره ستون شبکه جاری ثبت شده است و مقدار یک عدد صحیح در محدوده ; و row نشان دهنده شماره ردیف شبکه جاری ثبت شده است که یک عدد صحیح در محدوده .
در طول تقسیم شبکه، آستانه، k برای اطمینان از اینکه حداقل دو نقطه مسیر ( k > 1) برای نقشه برداری LOB ها در محدوده شبکه مورد محاسبه قرار می گیرند، استفاده می شود. شبکه یک مربع منظم است. از آنجایی که هر بار فقط نتایج در شبکه مرکزی ثبت می شود، حداکثر فاصله تقاطع موثر LOB است . با این حال، اشیاء با فاصله طولانی تمایل به داشتن تعداد کمی پیکسل در تصویر و دقت موقعیت یابی ضعیف دارند. بنابراین، فاصله تیراندازی موثر، V ، تجهیزات را می توان با توجه به شرایط تجهیزات تخمین زد. همانطور که در رابطه (8)، با توجه به ، محدوده مقدار آستانه، k ، برابر است با:
2.2.3. ساخت ماتریس رابطه
یک مجموعه، L ، برای نشان دادن n LOB استفاده می شود، که در آن LOB i با l i نشان داده می شود :
سپس، نقطه تقاطع توسط تقاطع LOB ها در مجموعه، L تولید می شود که می تواند با یک ماتریس تقاطع n × n نمایش داده شود:
جایی که نشان دهنده ماتریس تقاطع LOB ها در مجموعه، L و نشان دهنده تقاطع l i و l j است.
همانطور که در شکل 7 الف نشان داده شده است، شی 1، شی 2 و شی 3 به ترتیب در چهار نقطه مشاهده مشاهده می شوند: a، b، c و d. به منظور تسهیل درک، ترکیبی از حروف و اعداد برای ثبت موقعیت مشاهده و شی LOB استفاده می شود. به عنوان مثال: l a 1 LOB شی 1 است که از موقعیت a مشاهده می شود. ما از سه LOB رنگی مختلف برای شبیه سازی خط دید هنگام مشاهده سه شی مختلف استفاده می کنیم. مکان شی محل تجمع تقاطع LOB با همان رنگ است و تقاطع های LOB رنگ های مختلف گره های شبح هستند. همانطور که در شکل 7 نشان داده شده استb، ماتریس تقاطع برای توصیف رابطه تقاطع بین LOB ها استفاده می شود. از آنجایی که ماتریس دارای تقارن خاصی است، فقط باید ماتریس مثلثی بالایی را ثبت کرد. دو LOB که رابطه تقاطع ندارند به عنوان “-” ثبت می شوند.
همانطور که در شکل 7 الف نشان داده شده است، نقطه تقاطع، ، پیموده می شود. اگر دو نقطه تقاطع به هم نزدیک باشند (آستانه روی t تنظیم شده است ) به عنوان یک خوشه طبقه بندی می شوند و به صورت c k ثبت می شوند و مرکز خوشه به صورت ثبت می شود. . اگر هیچ تقاطع دیگری در این نزدیکی وجود نداشته باشد، نقاط به تنهایی به عنوان یک خوشه ثبت می شوند. در شکل 7 ب، عناصر ماتریس در همان خوشه با همان رنگ مشخص شده اند و هر خوشه را می توان به صورت زیر بیان کرد:
جایی که dist نشان دهنده تابع محاسبه فاصله بین دو نقطه است.
2.2.4. حذف گره های شبح بر اساس قوانین محدود
در این مطالعه، ما دو قانون محدود را بدون تعیین آستانه پویا معرفی میکنیم. با اجرای بازگشتی قوانین محدود شده تا زمانی که تعداد خوشهها دیگر تغییر نکند، حذف موثر گرههای ارواح تا آنجا که ممکن است به دست میآید که تاثیر گرههای شبح بر نتایج موقعیتیابی را کاهش میدهد.
- 1.
-
قوانین محدود بر اساس حداقل تعداد تقاطع ها در خوشه
وقتی تعداد LOB های جسم مشاهده شده بیشتر از 2 باشد، تعداد تقاطع ها در خوشه باید بیشتر از 1 باشد [ 27 ، 28 ، 30 ، 31 ]. تعداد تقاطع های موجود در هر خوشه شمارش می شود. اگر فقط یک تقاطع وجود داشته باشد، تقاطع موجود در خوشه به عنوان یک گره شبح تعیین می شود. همانطور که در شکل 8 الف نشان داده شده است، تمام خوشه ها (که با “×” مشخص شده اند) که به عنوان گره های شبح تعیین شده اند حذف می شوند و تقاطع های درون خوشه با LOB ها در ماتریس تقاطع جدا می شوند، همانطور که در شکل 8 نشان داده شده است.ب در این مرحله، بیشتر گرههای ارواح حذف شدهاند، و فقط خوشهها (که با «؟» مشخص شدهاند)، که امتیازهای نامزد آنها بیشتر مورد قضاوت قرار میگیرند، حفظ میشوند.
- 2.
-
قوانین محدود بر اساس منحصر به فرد بودن ارتباط LOB
هر LOB یک شبیه سازی خط دید از شی مشاهده است. اگر LOB فقط با یک تقاطع در یک خوشه مرتبط باشد، خوشه باید محل شی باشد. LOB مرتبط با این خوشه باید از سایر خوشه ها جدا شود تا از منحصر به فرد بودن ارتباط LOB اطمینان حاصل شود.
به عنوان مثال، همانطور که در شکل 9 نشان داده شده است ، l a 1 فقط با نقاط تقاطع یک خوشه رابطه متقاطع دارد، بنابراین خوشه باید محل شیء باشد، یعنی شی 1. سایر LOB های مرتبط با شی 1 نیز باید به صورت منحصر به فرد باشند. فقط با شی 1 مرتبط است. l d 1 علاوه بر ارتباط با شی 1، با خوشه های دیگر نیز مرتبط است. بنابراین، لازم است ارتباط بین l d 1 را جدا کنیمو تقاطع ها در خوشه های دیگر. در این زمان، تعداد تقاطع ها در خوشه قرمز 1 است که در تکرار بعدی به عنوان گره شبح حذف می شود.
3. نتایج تجربی و بحث
3.1. گردآوری داده ها و انتخاب حوزه تحقیق
در این مطالعه، ما از دادههای جمعآوریشده توسط سیستم اندازهگیری اسکن لیزری Alpha 3D که توسط CHC NAVIGATION تولید شده است، برای اعتبارسنجی روش استفاده کردیم. این سیستم مجهز به دوربین پانوراما لیدی باگ، GNSS، IMU و LIDAR است. داده های اصلی به دست آمده توسط سیستم یک سری داده جریان باینری هستند که نمی توانند مستقیماً توسط کاربران استفاده شوند و یک سری عملیات پیش پردازش مورد نیاز است. از طریق نرم افزار CoPre که توسط CHC NAVIGATION توسعه داده شده است، داده های جریان تصویر خروجی توسط دوربین پانورامای لیدی باگ خوانده و به هم متصل می شوند تا یک تصویر پانوراما با زاویه دید 360 درجه که به عنوان یک فرمت تصویر عمومی با وضوح 8192 × 4096 پیکسل ذخیره می شود، تشکیل شود. از طریق نرم افزار Inertial Explorer، داده های IMU و GNSS به طور مشترک پردازش می شوند تا مسیر رانندگی با دقت بالا (مختصات طول و عرض جغرافیایی، مختصات طرحریزی منطقهای و ارتفاع)، سرعت، نگرش (رول، گام، و سرفصل)، و سایر اطلاعات در سیستم مختصات مشخص شده، که یک به یک خروجی میشوند تا یک متن ساختاریافته و قابل خواندن را تشکیل دهند. داده های مسیر خروجی دارای دقت افقی 0.010 متر و دقت عمودی 0.020 متر هستند. برای داده های نگرش به دست آمده، دقت رول/پیچ 0.005 درجه و عنوان 0.017 درجه است [37 ]. تصاویر با وضوح بالا بافت هندسی و اطلاعات معنایی اشیاء کنار خیابان را برای آزمایش ها فراهم می کند. دادههای موقعیت و نگرش با دقت بالا اندازهگیریهای کافی را برای پشتیبانی دقیق برای تأیید روش فراهم میکنند.
همانطور که در شکل 10 نشان داده شده است ، یک سیستم اندازه گیری اسکن لیزری سه بعدی آلفا برای جمع آوری داده ها از مناطق یانزیجی و موفوشان در شهر نانجینگ، استان جیانگ سو، چین و منطقه شهر یینچون در شهر چانگژو، استان جیانگ سو، چین استفاده شد. . شهر نانجینگ و شهر چانگژو در یک استان چین واقع شدهاند، و منطقه Yincun و منطقه Mufushan و Yanziji تنها 120 کیلومتر دورتر هستند، با سبکهای چیدمان خیابانی مشابه.
3.2. تشخیص شی و نقشه برداری LOB
در این مطالعه، 6367 تصویر نمای خیابان جمع آوری شده از منطقه یانزیجی و 6920 تصویر نمای خیابان جمع آوری شده از منطقه Mufushan با وضوح 8192 × 4096 پیکسل به عنوان داده حاشیه نویسی استفاده شد. سه طبقه بندی از اشیاء قطب مانند – قطب های شهری، چراغ های خیابانی، و تابلوهای راهنما (که به طور گسترده و به طور گسترده توزیع شده بودند) – به عنوان اشیاء اکتسابی استفاده شد و یک ایستگاه کاری مجهز به CPU Intel Xeon E5-2698 V4 و GPU Tesla V100 استفاده شد. برای آموزش استفاده می شود.
همانطور که در شکل 11 نشان داده شده است ، به دلیل اینکه بیشتر داده های برچسب گذاری شده در ناحیه مرکز عمودی تصویر توزیع شده اند و اعوجاج تصویر در این ناحیه نسبتاً کم است، برای راحتی آموزش، تصویر اصلی به 53148 2048 × 2048 زیر تصویر بریده شد. که فقط شامل ناحیه میانی برای برچسب گذاری اشیا هستند. این اشیاء قطب مانند برای برچسب زدن به قسمت های میله ای و قسمت های بالایی تقسیم می شدند و تا حد امکان از همپوشانی جعبه های مرزی جلوگیری می شد. نتایج برچسبگذاری عبارتند از: 48162 قطعه میله، 7435 قسمت بالای تیرهای برق، 26751 قسمت بالای چراغهای خیابان و 5695 قسمت بالای تابلوهای راهنما. با در نظر گرفتن این دادههای نمونه، نمونهها بهطور تصادفی به یک مجموعه آموزشی و مجموعه آزمایشی با توجه به نسبت 7:3 تقسیم شدند و در طبقهبندی Cascade R-CNN [ 34 ] قرار گرفتند.] برای تمرین. میانگین دقت تمرین 0.880 و میزان یادآوری 0.929 (IoU > 0.5) بود.
در مجموع 4892 تصویر از نمای خیابان جمع آوری شده در شهر Yincun برای تشخیص اشیا استفاده شد. از آنجایی که محل قرارگیری قطعه میله به عنوان موقعیت جغرافیایی شی در هنگام تعیین موقعیت مورد استفاده قرار می گیرد، در نتایج تشخیص، قسمت های میله، قسمت های بالای تیرهای برق، قسمت های بالای چراغ های خیابان و قسمت های بالای تابلوهای راهنما به طور جداگانه شناسایی شدند. طبقه بندی اجسام قطب مانندی که قطعات میله ای به آن تعلق دارند با طبقه بندی نزدیکترین قسمت های بالایی ارائه می شود. این روش بر جهت گیری قطعات میله برای نقشه برداری LOB ها متکی است، که پارامترهای جهت گیری دقیق تری را برای موقعیت جغرافیایی بعدی اشیاء قطب مانند ارائه می دهد. به منظور کاهش تأثیر خطاهای تشخیص بر فرآیند تطبیق بعدی، نتایج طبقهبندی به صورت دستی بررسی شد.
3.3. موقعیت یابی جغرافیایی بر اساس LOB محدود شده خودسازگار
الگوریتم های تقسیم منطقه و موقعیت جغرافیایی به زبان سی شارپ برنامه ریزی شده و تحت سیستم عامل ویندوز 10 با استفاده از یک رایانه شخصی با پردازنده مرکزی Intel Core i7-7700 و رم 8 گیگابایتی برای محاسبه اجرا می شوند.
نتایج محاسبات روش پیشنهادی با 1409 اشیاء قطب مانند که به صورت دستی در این منطقه جمعآوری شدهاند، مقایسه شد و نتایج محاسباتی از سه شاخص مصرف زمان، نرخ فراخوان و میزان دقت ارزیابی شدند. هر چه نرخ فراخوان و نرخ دقت به 1 نزدیکتر باشد، اثر موقعیت یابی الگوریتم بهتر است. هر چه زمان مصرف به صفر نزدیکتر باشد، الگوریتم کارآمدتر است. زمان مصرف بر اساس زمان اجرای واقعی است (زمان اجرا، زمان محاسبه موقعیت جغرافیایی مبتنی بر LOB است). نرخ فراخوان و نرخ دقت با استفاده از رابطه (12) محاسبه شد:
جایی که تعداد نقاط مرجع را نشان می دهد، تعداد نتایج محاسبه شده را نشان می دهد، تعداد نقاط مرجع را در محدوده بافر 1 متری تمام نتایج محاسبات نشان می دهد و تعداد نتایج محاسباتی را در محدوده بافر 1 متری نقطه مرجع نشان می دهد.
روش موقعیت یابی مبتنی بر LOB که در این مطالعه پیشنهاد شده است تحت تأثیر دو آستانه قرار می گیرد: ضریب بزرگ شدن، k ، برای تقسیم شبکه و فاصله، t ، برای تجمع نقاط خوشه. به منظور مطالعه تأثیر پارامتر آستانه بر روش، تقسیم شبکه با توجه به پارامتر آستانه انجام می شود و تقاطع LOB و حذف گره شبح به صورت شبکه به شبکه و طبقه بندی به طبقه بندی انجام می شود. با توجه به 4892 مسیر رانندگی مربوط به تصاویر نمای خیابان، میانگین طول خط پایه مثلث بندی نماهای مجاور 7.21 متر محاسبه شده است. این دستگاه می تواند به طور موثر اجسام قطب مانند را در فاصله 100 متری شکار کند. فاصله تیراندازی موثر، V، روی 100 متر تنظیم شده است. با توجه به رابطه (8)، محدوده مقدار k به صورت (1، 4.9] محاسبه می شود. برای راحتی محاسبه، یک عدد صحیح نزدیک به این محدوده به عنوان مقدار آستانه، k در نظر گرفته می شود. با در نظر گرفتن خطای ثبت. پارامترهای حین اکتساب، اعوجاج تصاویر نمای خیابان، و تأثیر انحنای زمین بر مثلث ژئودتیکی، فاصله خوشه بندی، t ، از خوشه بین 0.1 متر تا 1 متر تنظیم شده است، و مقدار آستانه، t ، هر 0.1 متر گرفته می شود. جدول 1 نتایج ارزیابی روش موقعیت یابی جغرافیایی را بر اساس LOB محدود خود تطبیقی با ترکیبات آستانه متفاوت نشان می دهد.
در 100 متر حداکثر برد موثر دستگاه، k 4 طول می کشد تا حداکثر محدوده دید به 81.6 متر برسد و مقدار t با توجه به دقت خروجی الگوریتم دستگاه روی 0.2 متر تنظیم می شود. نتایج محاسبه به دست آمده توسط این ترکیب آستانه در شکل 12 نشان داده شده است. نتایج کارایی روش پیشنهادی را برای موقعیتیابی اجسام قطبمانند در مقیاس بزرگ اثبات میکند. نتیجه موقعیت یابی دقت بالایی دارد و با تصاویر شیء مربوطه مرتبط است که می تواند به عنوان نتیجه نهایی به پایگاه داده وارد شود.
3.4. تحلیل تطبیقی و بحث با روش های موجود
به منظور دستیابی به یک تحلیل مقایسه ای بین روش ارائه شده در این مطالعه و روش های موجود، در این مقاله، الگوریتم LOB مبتنی بر brute-force اصلاح شده ارائه شده توسط Zhang [ 30 ، 31 ] را بازتولید کردیم. الگوریتم تحت تأثیر سه آستانه قرار می گیرد: تعداد نماها، زاویه و فاصله تا مرکز جاده انتخاب شده. آستانه با توجه به پارامترهای ارائه شده در مقاله و وضعیت واقعی داده های ارائه شده در این مقاله تنظیم می شود. نتایج ارزیابی به شرح زیر است.
بر اساس الگوریتم LOB مبتنی بر brute-force اصلاح شده، در انتخاب مقدار آستانه، ابهامی وجود دارد. لازم است چندین تلاش برای انتخاب مقدار تجربی در ترکیب با داده ها انجام شود. به خصوص هنگامی که عرض جاده ناشناخته است یا عرض جاده در یک منطقه بزرگ مقیاس بسیار متفاوت است، تعیین آستانه فاصله تا مرکز جاده انتخابی اغلب دشوار است. از جدول 2 به راحتی می توان دریافت که الگوریتم LOB مبتنی بر brute-force اصلاح شده بر گسترش محدوده آستانه برای افزایش تعداد نقاط نامزد متکی است که زمان بیشتری را می طلبد. اگرچه این می تواند کمی نرخ فراخوان را بهبود بخشد، اما اغلب منجر به کاهش دقت نتایج فراخوان می شود.
موقعیت جغرافیایی بر اساس LOB محدود خود تطبیقی پیشنهاد شده در این مطالعه می تواند به طور خودکار محدوده آستانه موثر k را با توجه به مسیر حرکت محاسبه کند، و آستانه t یک مقدار ثابت در شرایط تجهیزات بدون تغییر است. مقادیر k در محدوده تیراندازی موثر، با زمان محاسبه کوتاه، به نرخ یادآوری و دقت خوبی دست یافتند. به عنوان مقدار kافزایش می یابد، دامنه شبکه واحد بزرگتر می شود، زمان محاسبه نیز به تدریج افزایش می یابد، و تعداد گره های شبح تولید شده زمانی که فاصله موثر LOB از فاصله واقعی بیشتر شود نیز افزایش می یابد. نرخ فراخوان و میزان دقت هر دو کاهش یافتند، اما همچنان سطح بالایی را حفظ کردند. به دلیل تأثیر تجهیزات اکتساب، نتایج محاسبات اغلب نمی توانند به دقت بالایی دست یابند و باعث ایجاد افست می شوند. اگر فاصله تجمع خوشه، t ، خیلی کوچک باشد، نقاط تقاطع نزدیک محل شی را نمی توان در یک خوشه جمع کرد، که در نتیجه اکتساب مکرر استفاده می شود. اگر مقدار tبزرگ است، باعث می شود اشیاء مجاور از همان نوع در یک خوشه ادغام شوند و در نتیجه موقعیت یابی از دست رفته و نرخ فراخوانی کاهش یابد. از آنجایی که فاصله بین لامپ های خیابان و تیرهای برق زیاد است، مقدار بالای t تأثیر کمی بر آنها دارد، اگرچه تأثیر قابل توجهی بر روی تابلوهای راهنمایی نزدیک به یکدیگر دارد.
در مقایسه با سایر روشهای موقعیتیابی مبتنی بر LOB که انتخاب آستانهها با آنها دشوار است، روش پیشنهادی در این مطالعه در انتخاب آستانه سازگار است. محدوده مقدار k مناسب را می توان به طور خودکار از طریق مسیر حرکت محاسبه کرد و مقدار t می تواند مقدار ثابتی را با توجه به دقت خروجی تجهیزات بگیرد. در مقایسه با الگوریتم LOB بر اساس نیروی brute-force اصلاح شده، روش پیشنهادی محدوده موثر LOB را با تقسیم شبکه محدود میکند و نیازی به تکیه بر آستانههایی مانند تعداد نقاط دید مجاور و فاصله تا مرکز نیست. جاده انتخاب شده، که تحت تاثیر تغییرات در صحنه های جاده است.
4. نتیجه گیری
در این مطالعه، ما روشی را برای موقعیتیابی خودکار اشیا در تصاویر نمای خیابان بر اساس MMS پیشنهاد کردیم. با هدف کاهش دشواری تطبیق ویژگی های تصویر به دلیل خط پایه طولانی در نمای خیابان، یک روش موقعیت یابی جغرافیایی مبتنی بر LOB محدود خود-تطبیقی با ارجاع به الگوریتم تطبیق شی بر اساس ترکیبی از تشخیص شی و موقعیت یابی LOB اجرا می شود. به منظور غلبه بر زمان مصرف و مشکلات انتخاب آستانه ناشی از یک الگوریتم موقعیت یابی مبتنی بر LOB، ایده “تقسیم-تسخیر” معرفی شده است و منطقه محاسبه با توجه به مسیر حرکت به شبکه ها تقسیم می شود. محاسبات در هر شبکه مستقل هستند و تداخلی با یکدیگر ندارند که کارایی محاسبات را تا حد زیادی بهبود می بخشد. به منظور جهانی کردن الگوریتم،
با در نظر گرفتن تابلوهای راهنما، تیرهای شهری، و چراغهای خیابان از بخشهای جادهای چندگانه در شهر Yincun، شهر چانگژو، استان جیانگ سو، بهعنوان اشیاء آزمایشی، آزمایشها با استفاده از آستانههای چندگانه و مقایسه با روشهای قبلی موقعیتیابی شی مبتنی بر LOB انجام شد. نتایج نشان میدهد که روش پیشنهادی از کارایی و دقت بالاتری نسبت به روشهای قبلی برخوردار است و محدوده انتخاب آستانه واضح و آسان است. این روش میتواند موقعیتیابی جغرافیایی و گرفتن تصویر خودکار و دقیق را برای طیف وسیعی از اشیاء خیابانی بر اساس MMS با دقت بالا انجام دهد و امکانسنجی آن را تأیید کند.
نتایج این مطالعه در دستیابی به اطلاعات موقعیت جغرافیایی برای اشیاء خیابانی قابل استفاده است، که میتواند برای ترسیم نقشههای با دقت بالا مورد نیاز برای رانندگی خودکار و ارائه پشتیبانی دادهها برای موقعیتیابی رانندگی خودکار، برنامهریزی مسیر، و هشدار ترافیک مورد استفاده قرار گیرد. اطلاعات مکان یابی در اشیاء کنار خیابان نیز می تواند به تشخیص ایمنی جاده کمک کند و به ادارات دولتی در مدیریت و نگهداری بهتر امکانات زندگی شهری و امکانات حمل و نقل کمک کند.
اشیاء کنار خیابان به راحتی توسط وسایل نقلیه مسدود می شوند و در نتیجه اهداف را شناسایی نمی کنند. هنگامی که تعداد شناسایی یک شیء مشابه در تصاویر چند نمای کمتر از سه باشد، روش موقعیتیابی مبتنی بر LOB نمیتواند موقعیتیابی هدف موثری را انجام دهد و تکرار برای بخش جاده مورد نظر لازم است. روش های جمع آوری داده ها و موقعیت یابی ارائه شده در این مقاله هماهنگ نیستند. با پشتیبانی نرم افزار و سخت افزار، جریان داده های یک سیستم MMS را می توان در زمان واقعی به داده های تصویر و مسیر رانندگی تبدیل کرد. اگر مدل تشخیص شی پیشنهاد شده در این مطالعه با یک مدل سبک وزن با کارایی تشخیص بالاتر، همراه با اطلاعات مسیر به دست آمده در فاصله کوتاه جایگزین شود، می توان موقعیت یابی اشیاء خیابانی مبتنی بر تصویر را در زمان واقعی انجام داد. این امر امکان بهروزرسانی آنلاین و به اشتراک گذاری نقشههای با دقت بالا را در آینده نشان میدهد.
بدون دیدگاه