یک روش یادگیری گروهی انباشته برای طبقه‌بندی الگوهای تقاطع‌های جاده‌ای پیچیده

شناخت الگوهای اتصالات جاده ای در یک شبکه جاده ای در کاربردهای مختلف نقش اساسی دارد. به دلیل تنوع و پیچیدگی مورفولوژی اتصالات جاده‌ای، روش‌های سنتی که به شدت به تنظیمات دستی ویژگی‌ها و قوانین متکی هستند، اغلب مشکل‌ساز هستند. در سال‌های اخیر، چندین مطالعه از شبکه‌های عصبی کانولوشنال (CNN) برای طبقه‌بندی اتصالات پیچیده استفاده کرده‌اند. این روش ها معمولاً اتصالات مبتنی بر برداری را به نمایش های شطرنجی با پوشش ناحیه نمونه برداری از پیش تعریف شده تبدیل می کنند. با این حال، یک پوشش منطقه نمونه گیری ثابت نمی تواند یکپارچگی و وضوح هر اتصال را تضمین کند، که به ناچار منجر به طبقه بندی اشتباه می شود. برای غلبه بر این اشکال، این مطالعه یک روش یادگیری گروهی انباشته را برای طبقه‌بندی الگوهای اتصالات جاده‌ای پیچیده پیشنهاد می‌کند. در این روش، هر اتصال ابتدا به تصاویر شطرنجی با پوشش های چندگانه تبدیل می شود. متعاقبا، چندین طبقه‌بندی‌کننده پایه مبتنی بر CNN با استفاده از تصاویر شطرنجی آموزش داده می‌شوند و احتمالات اتصال به الگوهای مختلف را خروجی می‌دهند. در نهایت، یک متا طبقه‌بندی‌کننده بر اساس جنگل تصادفی برای ترکیب خروجی‌های طبقه‌بندی‌کننده‌های پایه و یادگیری رسیدن به طبقه‌بندی نهایی استفاده می‌شود. نتایج تجربی نشان می‌دهد که روش پیشنهادی می‌تواند دقت طبقه‌بندی را برای اتصالات جاده‌ای پیچیده در مقایسه با طبقه‌بندی‌کننده‌های مبتنی بر CNN که با استفاده از نمایش‌های شطرنجی اتصالات با پوشش منطقه نمونه‌برداری ثابت آموزش داده شده‌اند، بهبود بخشد. و احتمالات اتصال به الگوهای مختلف را خروجی می دهند. در نهایت، یک متا طبقه‌بندی‌کننده بر اساس جنگل تصادفی برای ترکیب خروجی‌های طبقه‌بندی‌کننده‌های پایه و یادگیری رسیدن به طبقه‌بندی نهایی استفاده می‌شود. نتایج تجربی نشان می‌دهد که روش پیشنهادی می‌تواند دقت طبقه‌بندی را برای اتصالات جاده‌ای پیچیده در مقایسه با طبقه‌بندی‌کننده‌های مبتنی بر CNN که با استفاده از نمایش‌های شطرنجی اتصالات با پوشش منطقه نمونه‌برداری ثابت آموزش داده شده‌اند، بهبود بخشد. و احتمالات اتصال به الگوهای مختلف را خروجی می دهند. در نهایت، یک متا طبقه‌بندی‌کننده بر اساس جنگل تصادفی برای ترکیب خروجی‌های طبقه‌بندی‌کننده‌های پایه و یادگیری رسیدن به طبقه‌بندی نهایی استفاده می‌شود. نتایج تجربی نشان می‌دهد که روش پیشنهادی می‌تواند دقت طبقه‌بندی را برای اتصالات جاده‌ای پیچیده در مقایسه با طبقه‌بندی‌کننده‌های مبتنی بر CNN که با استفاده از نمایش‌های شطرنجی اتصالات با پوشش منطقه نمونه‌برداری ثابت آموزش داده شده‌اند، بهبود بخشد.

کلید واژه ها:

تقاطع جاده ای پیچیده ; طبقه بندی الگوی ; شبکه عصبی کانولوشنال ; مجموعه انباشته ; پوشش منطقه

1. مقدمه

به‌عنوان بخش اساسی شبکه‌های جاده‌ای در مناطق شهری، اتصالات جاده‌ای، جاده‌های اولیه را در جهات مختلف به هم متصل می‌کنند. وسایل نقلیه و عابران پیاده اغلب برای رسیدن به مقصد مورد نظر خود نیاز به چرخش در تقاطع های جاده ای دارند. بنابراین، اتصالات جاده ای نقش مهمی در سیستم های حمل و نقل مدرن ایفا می کنند. با این حال، ساختارهای اتصالات جاده ها اغلب به صراحت در پایگاه داده های فضایی موجود ثبت نمی شوند. از این رو، مکان یابی اتصالات جاده ای و طبقه بندی الگوهای آنها یک جزء مهم برای بسیاری از کاربردها است. به عنوان مثال، Ulugtekin و همکاران. [ 1 ] تاکید کرد که تقاطع های جاده ای باید به شیوه ای مناسب برای کاربرد ناوبری خودرو نشان داده شوند. Mackaness و Mackechnie [ 2 ]، Touya [ 3 ] و Yang و همکاران. [ 4] تاکید کرد که شناخت ساختارهای اتصالات برای تعمیم شبکه جاده ای با حفظ الگو ضروری است. علاوه بر این، شناخت اتصالات جاده‌ای به تجزیه و تحلیل و مدیریت ترافیک [ 5 ، 6 ، 7 ] و برنامه‌ریزی شهری و طراحی منظر [ 8 ] کمک می‌کند.

اتصالات جاده ای را می توان به طور کلی به دو دسته ساده یا پیچیده طبقه بندی کرد. تقاطع‌های ساده، مانند چهارراه‌های مسطح و تقاطع‌های جاده‌ای T شکل، به عنوان تقاطع‌هایی تعریف می‌شوند که جاده‌ها مستقیماً به هم می‌رسند، در حالی که اتصالات پیچیده دو یا چند جاده اصلی را از طریق جاده‌های لغزنده یا رمپ به هم متصل می‌کنند. اتصالات پیچیده شامل دو سناریو مختلف است: سازه های مسطح با جاده های لغزنده برای گردش صاف و مبادلات جدا از هم با سطح شیب دار که به وسایل نقلیه اجازه می دهد بدون وقفه از یک جاده به جاده دیگر حرکت کنند [ 9 ، 10 ، 11 ]]. به طور کلی، تقاطع های پیچیده مکان هایی هستند که جاده ها به صورت پیچیده به هم می رسند. بنابراین، اتصالات پیچیده دارای ساختارهای درونی پیچیده و اشکال مختلف خارجی هستند که تشخیص آنها و شناسایی الگوهای آنها را دشوار می کند. در عمل، تشخیص اتصالات پیچیده همچنان به بازرسی بصری دستی بستگی دارد که مستلزم هزینه های کار و زمان بالایی است.

در طول چند دهه گذشته، چندین رویکرد برای خودکارسازی تشخیص اتصالات پیچیده در شبکه‌های جاده‌ای توسعه یافته است. به عنوان مثال، Mackaness و Macchechnie [ 2 ] روشی را برای مکان یابی اتصالات پیچیده با جستجوی مناطقی که گره های جاده در آنها پراکنده شده اند، پیشنهاد کردند. ایده‌های مشابهی توسط Touya [ 3 ] و Zhou و Li [ 11 ] ایجاد شد، که اتصالات پیچیده را با خوشه‌بندی گره‌های مشخصه جاده، از جمله گره‌های Y شکل، Y شکل، چنگال‌شکل و چند پا شناسایی کردند. یانگ و همکاران با هدف حفظ یکپارچگی اتصالات پیچیده. [ 4 ] اصول طراحی راه را برای روشن کردن مرزهای توپولوژیکی اتصالات پیچیده معرفی کرد. لی و همکاران [ 9] از یک مدل تشخیص هدف، یعنی شبکه عصبی کانولوشنال با منطقه سریع‌تر، برای شناسایی مکان‌های تبادل بر اساس نمایش‌های شطرنجی شبکه‌های جاده‌ای استفاده کرد. یانگ و همکاران [ 10 ] یک رویکرد یادگیری عمیق مبتنی بر نمودار را برای شناسایی بخش‌های متعلق به مبادلات در شبکه‌های جاده‌ای توسعه داد. ساختارهای تبادلی با خوشه بندی بخش های مبادله شناسایی شده به دست آمد.

رویکردهای فوق بر شناسایی محل اتصالات پیچیده در شبکه های جاده ای متمرکز شدند. در مقایسه، مطالعات کمی بر طبقه بندی الگوی اتصالات پیچیده شناسایی شده متمرکز شده اند. یک مطالعه اولیه توسط Xu و Yan [ 12 ] انجام شد که یک رویکرد مبتنی بر تطبیق الگو را برای طبقه بندی الگوهای اتصال پیچیده ایجاد کردند. در این رویکرد، یک تقاطع جاده برای اولین بار به عنوان یک نمودار ویژگی-رابطه جهتی نشان داده شد. سپس الگوی این اتصال با جستجوی الگوی با بیشترین شباهت در کتابخانه بر اساس نمایش نمودارها و قوانین از پیش تعریف شده طبقه‌بندی شد. وانگ و همکاران [ 13] از ویژگی های توپولوژیکی برای توصیف ساختارهای اتصال استفاده کرد تا با محاسبه شباهت توپولوژیکی، الگوی تطبیقی برای هر اتصال را شناسایی کند. با توجه به تنوع الگوهای پیوند پیچیده، این رویکردها دارای محدودیت هایی هستند. اول، آنها به شدت بر ویژگی‌های طراحی دستی تکیه کردند و کتابخانه‌های الگو را ساختند، و در نتیجه در طبقه‌بندی اتصالات پیچیده با ساختارهای نامنظم مشکل داشتند. دوم، آنها به ناچار از مشکل تعیین آستانه در هنگام تعیین الگوهای ساختاری رنج می بردند.

در سال‌های اخیر، شبکه‌های عصبی کانولوشنال (CNN) به سرعت توسعه یافته‌اند و به موفقیت‌های زیادی در زمینه‌های مختلف، از جمله تشخیص اشیا [ 14 ]، پردازش زبان طبیعی [ 15 ] و تشخیص گفتار [ 16 ] دست یافته‌اند. در مقایسه با روش‌های یادگیری ماشینی سنتی، CNN‌ها می‌توانند ویژگی‌های سطح بالا را از ویژگی‌های کم عمق به تصویر بکشند. این مزیت محققان را برانگیخته است تا از CNN و انواع آنها برای مدیریت داده های مکانی استفاده کنند [ 17 , 18 , 19]. از منظر شناخت بصری مصنوعی، طبقه‌بندی اتصالات جاده‌ای مشابه طبقه‌بندی تصویر است. مطالعات اخیر پتانسیل CNN ها را برای توصیف و طبقه بندی اتصالات پیچیده بررسی کرده اند. ابتدا، پردازش تصویر برای تبدیل اتصالات مبتنی بر برداری به نمایش تصویر پیاده‌سازی شد و سپس یک طبقه‌بندی مبتنی بر CNN، مانند AlexNet [ 20 ]، U-net [ 21 ]، یا GoogLeNet [ 22 ] برای یادگیری ساخته شد. ویژگی های سطح بالا از نمونه های تصویر و طبقه بندی الگوهای اتصالات پیچیده. با غلبه بر محدودیت‌های ویژگی‌های طراحی شده مصنوعی، مدل‌های یادگیری مبتنی بر CNN می‌توانند عملکرد طبقه‌بندی اتصالات پیچیده را بهبود بخشند.

با این حال، این رویکردها دارای اشکالاتی هستند. یک مسئله معمولی این است که رویکردهای موجود از یک پوشش جغرافیایی ثابت برای تولید نمونه‌های تصویر استفاده می‌کنند. با توجه به اینکه اتصالات پیچیده اغلب از نظر اندازه و شکل متفاوت هستند، پوشش منطقه نمونه ثابت نمی تواند یکپارچگی و وضوح اتصالات اصلی را تضمین کند، که ممکن است منجر به نتایج طبقه بندی نادرست شود. به طور خاص، اگر پوشش منطقه برای یک اتصال پیچیده خیلی کوچک باشد، تصویر تولید شده نمی تواند ساختار اتصال را به طور کامل نشان دهد، و گرفتن ویژگی های کلی اتصال را دشوار می کند. برعکس، با پوشش منطقه بزرگتر، ساختارهای پیچیده محل اتصال دست نخورده هستند، اما وضوح تصویر کمتر است و اطلاعات خالی زیادی در تصویر وجود دارد که منجر به طبقه بندی اشتباه تصاویر شطرنجی می شود.

برای پرداختن به این موضوع، این مطالعه یک روش یادگیری گروه انباشته (SE) را برای طبقه‌بندی الگوهای اتصالات جاده‌ای پیچیده پیشنهاد می‌کند. با ساخت و ترکیب الگوریتم‌های یادگیری ماشینی متعدد، یادگیری مجموعه‌ای می‌تواند بر معایب ناچیز بودن توزیع داده‌ها یا توانایی نمایش محدود یک مدل یادگیری غلبه کند و عملکرد طبقه‌بندی را بهبود بخشد [ 23 ، 24 ، 25 ، 26 ]. روش یادگیری گروهی را می توان به سه روش اجرا کرد: بسته بندی، تقویت و انباشتگی. در میان آنها، الگوریتم SE از یک استراتژی یادگیری برای ترکیب پیش‌بینی‌های دو یا چند مدل برای دستیابی به عملکرد بهتر استفاده می‌کند. 27 ].]، که از نظر پایداری نسبت به استراتژی‌های میانگین‌گیری یا رأی‌دهی مورد استفاده در دو الگوریتم گروه دیگر، مزایایی دارد. به طور خاص، الگوریتم SE ابتدا داده های آموزشی را به طور جداگانه با چندین طبقه بندی کننده (یعنی طبقه بندی کننده های پایه) پردازش می کند، سپس از یک طبقه بندی کننده جدید (یعنی متا طبقه بندی کننده) برای دریافت خروجی های طبقه بندی کننده های پایه به عنوان ورودی استفاده می کند و دوباره برای به دست آوردن آموزش می دهد. نتیجه طبقه بندی نهایی برای طبقه‌بندی اتصالات جاده‌ای پیچیده، با توجه به عدم قطعیت توزیع فضایی آنها، ابتدا هر تقاطع را به تصاویری با پوشش‌های منطقه نمونه‌برداری متعدد تبدیل کردیم. متعاقباً چندین طبقه‌بندی پایه با استفاده از نمونه‌هایی با پوشش‌های سطح متفاوت آموزش داده شدند و بیشتر برای پیش‌بینی احتمالات هر پیوند متعلق به الگوهای مختلف مورد استفاده قرار گرفتند. سرانجام، یک متا طبقه‌بندی کننده برای ترکیب خروجی‌های طبقه‌بندی‌کننده پایه و یادگیری طبقه‌بندی نهایی طراحی شده است. در این مطالعه، AlexNet [28 ] و GoogLeNet [ 29 ] به عنوان طبقه‌بندی‌کننده پایه، و الگوریتم جنگل تصادفی (RF) [ 30 ] به‌عنوان متا طبقه‌بندی‌کننده پیاده‌سازی شد. برای تأیید اثربخشی روش پیشنهادی، یک مجموعه داده جدید و در دسترس عموم شامل اتصالات جاده‌ای پیچیده با هفت نوع الگو برای آموزش و آزمایش طبقه‌بندی‌کننده‌های پایه و متا ساخته شد.

ادامه این مقاله به شرح زیر سازماندهی شده است. روش پیشنهادی در بخش 2 توضیح داده شده است . بخش 3 نتایج تجربی، تجزیه و تحلیل و بحث را ارائه می دهد. بخش 4 نتیجه گیری را ارائه می کند.

2. روش شناسی

این مطالعه یک روش یادگیری SE را برای طبقه‌بندی الگوهای تقاطع‌های جاده‌ای پیچیده پیشنهاد می‌کند. هدف استراتژی یادگیری گروهی یافتن نتایج بهینه طبقه‌بندی با ترکیب خروجی‌های دو یا چند طبقه‌بندی‌کننده پایه مبتنی بر CNN است که برای طبقه‌بندی انواع الگوی تقاطع‌های جاده‌ای با جمع‌آوری نمونه‌های تصویری با پوشش‌های منطقه نمونه‌برداری مختلف ساخته شده‌اند. شکل 1 چارچوب کلی روش پیشنهادی را نشان می دهد که شامل سه بخش اصلی است.

نمونه‌برداری از اتصالات پیچیده با پوشش‌های چندگانه: برای هر پیوند پیچیده مبتنی بر برداری، چندین تصویر شطرنجی با اندازه ثابت با پوشش‌های ناحیه مختلف تولید می‌شوند تا به عنوان نمونه‌های ورودی برای طبقه‌بندی‌کننده‌های پایه استفاده شوند.
ایجاد پیش‌بینی‌های اولیه با استفاده از طبقه‌بندی‌کننده‌های پایه متعدد: بر اساس نمونه‌های تصویری به‌دست‌آمده برای هر منطقه پوشش، یک طبقه‌بندی پایه مبتنی بر CNN برای پیش‌بینی احتمالات اولیه هر اتصال پیچیده ساخته می‌شود.
به دست آوردن نتایج طبقه بندی با استفاده از یک متا طبقه بندی کننده: احتمالات اولیه برای هر اتصال پیچیده ایجاد شده توسط چندین طبقه بندی پایه به عنوان یک بردار ویژگی جدید ترکیب می شوند که به عنوان ورودی یک متا طبقه بندی کننده مبتنی بر RF برای خروجی نتیجه طبقه بندی نهایی عمل می کند.

2.1. نمونه برداری از اتصالات مجتمع با پوشش های مختلف

شکل 2 روند تولید یک تصویر شطرنجی از یک تقاطع جاده ای مبتنی بر برداری را نشان می دهد. ابتدا، برای یک اتصال جاده پیچیده استخراج شده از شبکه جاده بردار، مختصات X- و Y- نقطه میانی هر بخش جاده مرتبط محاسبه شد. دوم، مرکز هندسی ساختار تقاطع با میانگین مختصات نقاط میانی تمام بخش‌های جاده محاسبه شد. بر اساس مرکز هندسی، یک مساحت مربع با طول معین، یعنی پوشش منطقه نمونه برداری، برای نمونه برداری از این اتصال برش داده شد. در نهایت، یک تصویر شطرنجی باینری با پس‌زمینه سیاه و بخش‌های جاده به رنگ سفید برای تحقق شطرنجی‌سازی تقاطع جاده ایجاد شد.

برای هر اتصال پیچیده، تصاویر شطرنجی متعدد با تغییر پوشش منطقه نمونه‌برداری تولید شد. تمام تصاویر شطرنجی تولید شده اندازه پیکسل یکسانی دارند. در طول فرآیند شطرنجی، توجه به این نکته مهم است که عرض خطوط بخش های اتصال به طور قابل توجهی بر تصاویر شطرنجی تولید شده تأثیر می گذارد. عرض کوچکتر ممکن است منجر به نمایش ناچیز ساختارهای اتصال شود، در حالی که عرض بزرگتر ممکن است باعث شود قطعات اتصال به یکدیگر بچسبند و اطلاعات ساختاری اتصال را از دست بدهند. برای توضیح این مشکل، پنج تصویر شطرنجی تولید شده با عرض خطوط مختلف در شکل 3 نشان داده شده است. در این تحقیق، با در نظر گرفتن شفافیت تصویر شطرنجی و داده های مورد نیاز برای ورودی مدل، اندازه تصاویر شطرنجی 250 × 250 پیکسل تعیین شد و عرض خط بخش های جاده با در نظر گرفتن تصویر به صورت تجربی روی دو پیکسل تنظیم شد. وضوح.

2.2. ایجاد پیش‌بینی‌های اولیه با استفاده از طبقه‌بندی‌کننده‌های پایه

بر اساس تصاویر شطرنجی به‌دست‌آمده با پوشش‌های چند ناحیه، طبقه‌بندی‌کننده‌های پایه متعدد برای پیش‌بینی احتمالات هر اتصال متعلق به انواع الگوهای مختلف ساخته شد. به عنوان یک نوع شبکه عصبی پیشخور با معماری عمیق [ 31 ]، CNN ها با ویژگی های هر لایه تولید شده توسط نواحی محلی لایه بالایی از طریق هسته های کانولوشن با وزن های مشترک مشخص می شوند که آنها را برای یادگیری و نمایش تصویر مناسب می کند. امکانات. بنابراین، این مطالعه از CNN به عنوان طبقه‌بندی‌کننده پایه استفاده کرد. دو معماری معروف CNN، AlexNet [ 28 ] و GoogLeNet [ 29]، به ترتیب به عنوان طبقه‌بندی‌کننده پایه برای به دست آوردن پیش‌بینی اولیه الگوهای تقاطع‌های جاده‌ای مورد استفاده قرار گرفتند. بخش های زیر عملیات اصلی در CNN ها و دو معماری را شرح می دهند.

2.2.1. عملیات اساسی در CNN ها

علاوه بر لایه‌های ورودی و خروجی، یک معماری معمولی CNN شامل چندین لایه کانولوشن و ادغام و یک یا چند لایه کاملاً متصل است.

(1) لایه های کانولوشن

لایه های کانولوشن ویژگی های مختلفی را از داده های تصویر خام از طریق عملیات کانولوشن استخراج می کنند. به عنوان مثال، لایه کانولوشنال پایین ویژگی های سطح پایین آشکار مانند لبه ها، گوشه ها و خطوط را استخراج می کند، در حالی که لایه کانولوشنال بالاتر ویژگی های سطح بالا پنهان را استخراج می کند. در لایه کانولوشن، نقشه ویژگی لایه قبلی با یک هسته کانولوشن کشویی در هم می پیچد و یک نقشه ویژگی جدید با استفاده از یک تابع فعال سازی غیرخطی به شرح زیر ایجاد می شود:

g (i, j) = f ⎛⎝⎜ \sum k = 0 ک - 1 \sum l = 0 L - 1 h (i - k, j - l) \times w (k, l) + b ⎞⎠⎟

(1)

جایی که $f (.)$ نشان دهنده تابع فعال سازی است، به عنوان مثال، تابع Softmax . $g (i, j)$ و $h (i, j)$ نشان دهنده مقادیر ویژگی در موقعیت است $(i, j)$ به ترتیب در نقشه ویژگی جدید و لایه قبلی؛ $w (k, l)$ و $b$ هسته های کانولوشنال با اندازه هستند $K \times L$ و تعصب

(2) لایه ادغام

هدف لایه ادغام به دست آوردن ویژگی های فضایی ثابت و فشرده سازی آنها با کاهش وضوح نقشه های ویژگی است. با نمایش داده ها در یک منطقه، یعنی پنجره ادغام، به عنوان یک مقدار واحد پیاده سازی می شود. Max-pooling به طور گسترده برای طراحی معماری CNN استفاده می شود. این عملیات حداکثر مقدار منطقه را به عنوان مقدار پس از ادغام انتخاب می کند که برای فیلتر کردن نویز و اطلاعات بی فایده پس زمینه زمانی که فقط بخشی از اطلاعات مفید در ویژگی ها وجود دارد مناسب است. نتایج حداکثر ادغام به صورت زیر محاسبه می شود:

g (i, j) = حداکثر 0 < k \leq K - 1 0 < l \leq L - 1 (h (M \times i + k ، N \times j + l))

(2)

جایی که $g (i, j)$ و $h (i, j)$ نشان دهنده مقادیر ویژگی در موقعیت است $(i, j)$ در نقشه ویژگی جدید پس از حداکثر ادغام و لایه قبلی به ترتیب. $K$ و $L$ به ترتیب اندازه پنجره ادغام را مشخص کنید. $M$ و $N$ اندازه گام هستند.

(3) تابع Softmax

برای اطمینان از اینکه نتیجه طبقه بندی خروجی نهایی با توزیع احتمالات مطابقت دارد، یعنی هر مقدار از 0 تا 1 و مجموع آن 1 است، یک لایه Softmax طراحی شده است. احتمال تعدیل شده $P (S_{i})$ برای نوع $S_{i} (1 \leq i \leq n)$ به صورت زیر محاسبه می شود:

پ (اس من) = ه g من \sum n j = 1 ه g j

(3)

جایی که $g_{i}$ و $g_{j}$ مقدار خروجی قبلی این نوع را نشان می دهد و $n$ تعداد انواع را نشان می دهد. تابع Softmax نیز اغلب به عنوان یک تابع فعال سازی برای لایه های کانولوشن استفاده می شود.

2.2.2. الکس نت

AlexNet توسط Krizhevsky و همکاران پیشنهاد شد. [ 28 ]، و در رقابت ImageNet با اختلاف زیادی نسبت به سایر الگوریتم‌های شبکه‌های عصبی پیروز شد. AlexNet یک CNN 8 لایه است، همانطور که در شکل 4 نشان داده شده است. پنج لایه اول لایه های کانولوشن، سه لایه آخر لایه های کاملاً متصل هستند و در لایه آخر از Softmax استفاده شده است.

الکس نت مرز بین شبکه های عصبی کم عمق و عمیق است. در مقایسه با شبکه‌های عصبی سنتی، برای اولین بار از تکنیک‌های بسیاری از جمله واحدهای خطی اصلاح‌شده ( ReLU ) و Dropout برای تسریع آموزش مدل و بهبود قابلیت نمایش مدل استفاده می‌کند. همچنین یک لایه نرمال سازی پاسخ محلی (LRN) را معرفی کرد که نرمال سازی جزئی خروجی ReLU را با همسایگان خود در یک محدوده مشخص انجام می داد. مقادیر نرمال شده $b_{(x, y)}^{i}$ به صورت زیر محاسبه شدند:

ب من (x ، y) = آ من ( x ، y ) ( k + α \sum m i n ( N - 1 ، i + n 2 ) j = m a x ( 0 , i - n 2 ) ( آ j ( x ، y ) ) 2 ) β

(4)

جایی که $a_{(x, y)}^{i}$ نشان دهنده خروجی در موقعیت است $(x, y)$ هسته کانولوشن i-ام بعد از تابع ReLU . $n$ تعداد همسایگان است $a_{(x, y)}^{i}$ ، که خود تعریف می شود. $N$ تعداد کل هسته های کانولوشن است. $α$ ، $β$ ، $k$ ضرایب خود تعریف شده هستند. معرفی LRN به همگرایی سریع کمک می کند و توانایی تعمیم مدل را برای یادگیری ویژگی بهبود می بخشد.

2.2.3. GoogleNet

GoogLeNet یک معماری عمیق است که توسط Szegedy و همکارانش پیشنهاد شده است. [ 29 ] که در آن سال در مسابقه ImageNet مقام اول را کسب کرد. در GoogLeNet، یک واحد نورون پایه، یعنی ساختار Inception ، برای ساختن یک شبکه عملکرد محاسباتی پراکنده اما بالا طراحی شده است، همانطور که در شکل 5 نشان داده شده است. واحد Inception می تواند از منابع محاسباتی بهینه استفاده کند و ویژگی های بیشتری را با همان مقدار محاسبات استخراج کند و در نتیجه نتایج آموزشی را بهبود بخشد.

واحد Inception از یک ساختار موازی با چهار شاخه تشکیل شده است. از طریق این چهار شاخه، می توان نقشه های مشخصه در مقیاس های مختلف را به دست آورد و سپس در جهت عمق برای به دست آوردن یک نقشه ویژگی جدید به هم متصل کرد. یک مدل 22 لایه GoogLeNet بر اساس واحد Inception ساخته شد. تصویر ورودی پس از دو لایه کانولوشن و حداکثر لایه ادغام به 9 واحد Inception داده شد. تغییر GoogLeNet به دلیل طراحی ماژولار واحدهای Inception آسانتر است. شبکه در نهایت از ادغام متوسط به جای لایه کاملا متصل استفاده کرد اما همچنان از Dropout استفاده کرد. علاوه بر این، برای جلوگیری از ناپدید شدن گرادیان، دو وسیله کمکی اضافی وجود دارد Softmax کمکی اضافی وجود داردتوابع برای هدایت شیب به جلو اضافه شدند.

2.3. به دست آوردن نتایج نهایی طبقه بندی با استفاده از یک متا طبقه بندی کننده

همانطور که در شکل 6 نشان داده شده است، طبقه بندی کننده های پایه آموزش دیده برای پیش بینی نوع اتصال ورودی استفاده شدند. خروجی‌های این طبقه‌بندی‌کننده‌های پایه، که نشان‌دهنده این احتمال است که اتصال ورودی به انواع الگوهای مختلف تعلق دارد، سپس به عنوان ورودی ویژگی برای متا طبقه‌بندی‌کننده ترکیب شدند تا نتایج طبقه‌بندی نهایی را به دست آورند. در این مطالعه، یک مجموعه انباشته با استفاده از مدل RF برای ترکیب نتایج پیش‌بینی از طبقه‌بندی‌کننده‌های پایه فردی برای تصمیم نهایی اتخاذ شد.

به عنوان یک الگوریتم یادگیری ماشینی انعطاف‌پذیر و کارآمد، مدل RF نتایج رضایت‌بخشی را بدون تنظیم فراپارامتر پیچیده ایجاد می‌کند. مدل RF شامل درخت های تصمیم گیری چندگانه است و کلاس هایی که خروجی می دهد توسط حالت کلاس هایی که درختان خروجی می دهند تعیین می شوند. از آنجایی که درخت‌های تصمیم ادغام شده در مدل RF مستقل از یکدیگر هستند، آموزش سریع و آسان به موازی‌سازی می‌شود و مدل RF را برای کارهای طبقه‌بندی مناسب می‌کند. عملکرد مدل RF تحت تأثیر چندین پارامتر از جمله n_estimators است که تعداد درخت های تصمیم را نشان می دهد و max_depth می باشد.، که بیانگر حداکثر عمق درختان تصمیم است. در طول آموزش مدل، این پارامترها باید به طور مناسب با توجه به مجموعه داده تنظیم شوند تا دقت مدل بهبود یابد.

3. آزمایشات

آزمایش‌هایی برای اعتبارسنجی روش پیشنهادی انجام شد. این بخش مجموعه داده‌های آزمایشی، تنظیمات، نتایج، تحلیل‌ها و بحث را شرح می‌دهد.

3.1. داده های تجربی و پیش پردازش

3.1.1. داده های تجربی

داده های تجربی به صورت دستی از شبکه های جاده ای 30 شهر در چین، از جمله ووهان، شانگهای، هانگژو و نانجینگ استخراج و از OpenStreetMap (OSM) دانلود شدند ( www.openstreetmap.org ، در 20 مارس 2021 مشاهده شد). این شهرها دارای مناطق نسبتاً وسیع، امکانات حمل و نقل جاده ای فراوان و اتصالات جاده ای با انواع و ساختارهای متنوع هستند. با توجه به ویژگی‌های مورفولوژیکی و شکل، اتصالات جاده‌ای پیچیده جمع‌آوری‌شده به هفت نوع معمولی، از جمله پروانه، برگ شبدر، الماس، T شکل، ترومپت، توربین و موارد دیگر طبقه‌بندی شدند که در شکل 7 نشان داده شده است. در مجموع 150 نمونه برای هر نوع اتصال جمع آوری شد که در مجموع 1050 نمونه بود.

3.1.2. افزایش نمونه

تعداد کافی نمونه برای اطمینان از ثبات آموزشی و بهبود دقت طبقه بندی مدل نظارت شده CNN مهم است. بنابراین، دو روش افزایش داده ها برای افزایش تعداد اتصالات جمع آوری شده به کار گرفته شد. از آنجایی که تغییر جهت یک تقاطع جاده بر تشخیص الگو تأثیر نمی گذارد، ابتدا یک روش چرخشی اجرا شد. به طور خاص، هر نمونه اتصال مبتنی بر بردار 90 درجه، 180 درجه و 270 درجه چرخانده شد. دوم، عملیات آینه ای برای هر نمونه در جهت بالا-پایین و چپ-راست استفاده شد. در نتیجه تعداد نمونه های اتصال به 6300 نمونه رسید که شش برابر نمونه های اولیه بود. متعاقباً، تمام نمونه‌ها با نسبت 6:2:2 به مجموعه‌های آموزشی، اعتبارسنجی و آزمایشی با تعداد کل نمونه‌ها به ترتیب 3780، 1280 و 1280 تقسیم شدند.

3.2. تنظیمات پارامتر

برای تعیین پوشش منطقه نمونه‌برداری مناسب و همچنین تعداد طبقه‌بندی‌کننده‌های پایه در مدل‌های SE، اندازه‌های حداقل مربع‌های مرزی [ 22 ] برای همه اتصالات جاده‌ای جمع‌آوری‌شده شمارش شد، و توزیع‌ها در شکل 8 نشان داده شده‌اند .

پوشش‌های منطقه نمونه‌های پیوند جمع‌آوری‌شده بسیار متفاوت بود، با حداکثر پوشش بیش از 2000 × 2000 متر مربع ^و حداقل پوشش کمتر از 250 × 250 متر ^مربع . طبق آمار، سه پوشش مختلف منطقه، یعنی 500 × 500 متر مربع ^، 1000 × 1000 متر مربع ^، و 1500 × 1500 متر مربع ^، برای تولید تصاویر شطرنجی برای هر نمونه اتصال تنظیم شد. نمونه هایی از هفت نوع نمونه اتصال تحت پوشش سه منطقه در جدول 1 فهرست شده است.

در آموزش مدل GoogLeNet، برخی از پارامترها چندین بار مطابق با ویژگی های اتصالات جمع آوری شده تنظیم شدند. در نهایت، نرخ یادگیری روی 0.02، اندازه دسته روی 16، حداکثر تعداد تکرار روی 30000، مقدار Dropout روی 0.8، و کاهش وزن روی 0.00004 تنظیم شد تا از همگرایی اطمینان حاصل شود. مدل ها. برای مدل AlexNet، نرخ یادگیری، اندازه دسته‌ای و Dropout مانند مدل GoogLeNet، حداکثر تکرار روی 20000 و کاهش وزن روی 0.0005 تنظیم شد. برای مدل RF، پارامتر n_estimators و max_depthبه ترتیب روی 200 و 10 تنظیم شدند. علاوه بر این، یک گره باید حداقل دو نمونه آموزشی داشته باشد تا بتواند منشعب شود، و هر فرزند یک گره بعد از یک شاخه باید حداقل یک نمونه برای اطمینان از کارایی و دقت آموزش داشته باشد.

3.3. معیارهای ارزیابی

عملکرد طبقه‌بندی کلی نمونه‌های آزمایشی به صورت کمی با استفاده از متریک دقت ، که به عنوان نسبت تعداد نمونه‌های طبقه‌بندی صحیح به تعداد کل نمونه‌ها تعریف می‌شود، ارزیابی شد. علاوه بر این، برای هر نوع الگو، از سه معیار، یعنی دقت ، یادآوری و F ₁ برای ارزیابی نتایج طبقه‌بندی استفاده شد. سه معیار به صورت زیر محاسبه شد:

p r e c i s i o n = تی پ تی پ + اف پ \times 100 %

(5)

r e c a l l = تی پ تی پ + اف ن \times 100 %

(6)

اف 1 = 2 \times p r e c i s i o n \times r e c a l l p r e c i s i o n + r e c a l l

(7)

که در آن TP ، FP ، و FN به ترتیب تعداد نتایج طبقه بندی مثبت درست، مثبت کاذب و منفی کاذب هستند.

3.4. نتایج و تجزیه و تحلیل

نتایج طبقه‌بندی برای مجموعه آزمون با استفاده از طبقه‌بندی‌کننده‌های پایه مختلف و روش SE در جدول 2 فهرست شده‌اند . اول، دقت طبقه‌بندی طبقه‌بندی‌کننده‌های پایه مبتنی بر GoogLeNet و مدل SE به طور قابل‌توجهی بالاتر از طبقه‌بندی‌کننده‌های پایه مبتنی بر AlexNet و مدل SE بود. این نتیجه ممکن است به قابلیت نمایش مدل های CNN نسبت داده شود. مهمتر از آن، مدل‌های SE به طور قابل‌توجهی بهتر از طبقه‌بندی‌کننده‌های پایه آموزش‌دیده با استفاده از نمونه‌هایی با پوشش منطقه نمونه‌گیری ثابت عمل کردند. متریک دقت مدل SE مبتنی بر AlexNet به 78.9 درصد رسید که 5 تا 6 درصد بیشتر از طبقه‌بندی‌کننده‌های پایه با پوشش منطقه متفاوت بود. برای مدل SE مبتنی بر GoogLeNet، دقتمتریک به 92.4٪ رسید که 6 تا 14٪ بیشتر از طبقه بندی های پایه بود.

سه نمونه از نتایج طبقه بندی در ارائه شده است جدول 3 ارائه شده است. از طریق یادگیری گروهی، اتصالات با پوشش منطقه بسیار کوچک یا بزرگ که در برخی از پوشش‌های منطقه نمونه‌برداری اشتباه طبقه‌بندی شده بودند، می‌توانند اصلاح شوند (مورد 1 و مورد 2). برای برخی از اتصالات که از نظر شکل و ساختار کلی شبیه به انواع دیگر اتصالات هستند (مورد 3)، ویژگی های محلی در یک منطقه کوچک پوشش برای شناسایی الگوهای آنها مهم است و یادگیری مجموعه می تواند از این تفاوت های جزئی به خوبی استفاده کند. ویژگی های محلی برای به دست آوردن نتایج طبقه بندی صحیح. نتایج نشان می‌دهد که یادگیری گروهی مزایای دسته‌بندی‌های پایه قبلی را حفظ می‌کند و کاستی‌های طبقه‌بندی برخی از اتصالات را برطرف می‌کند. در نتیجه، عملکرد طبقه بندی به طور قابل توجهی بهبود یافت، که کارایی روش پیشنهادی را تأیید می کند.

جدول 4 و جدول 5 ماتریس های سردرگمی و سه معیار نتایج طبقه بندی را برای اتصالات جاده آزمایشی با استفاده از مدل های SE مبتنی بر AlexNet و GoogLeNet به ترتیب فهرست می کنند. دقت و یادآوری _معیارهای اتصالات از نوع Cloverleaf در هر دو مدل بالا بود زیرا آنها شامل چهار بخش جاده هستند که ویژگی های بصری آنها را قابل توجه می کند. برای برخی از اتصالات نوع پروانه و نوع توربین، هر دو مدل دارای طبقه بندی نادرست بودند و مدل SE مبتنی بر AlexNet دارای طبقه بندی بیشتری بود. مدل SE مبتنی بر GoogLeNet عملکرد نسبتاً خوبی در طبقه بندی اتصالات نوع الماس و ترومپت داشت، در حالی که مدل SE مبتنی بر AlexNet برخی از اتصالات نوع الماس را به عنوان اتصالات T شکل یا ترومپت شناسایی کرد و برخی از T را به اشتباه طبقه بندی کرد. اتصالات شکل و شیپور. علاوه بر این، طبقه‌بندی نادرستی بین اتصالات نوع دیگر و شش نوع دیگر از اتصالات وجود داشت که در مدل مبتنی بر AlexNet حتی جدی‌تر بود.

علاوه بر این، برخی از نمونه‌های اتصالات طبقه‌بندی نشده برای کشف دلایل احتمالی، همانطور که در شکل 9 نشان داده شده است، تجزیه و تحلیل شدند.. مشاهده می شود که اگر مورفولوژی یک اتصال به طور قابل توجهی با اتصالات معمولی آن متفاوت باشد، مدل احتمالاً یک طبقه بندی نادرست ایجاد می کند، علیرغم این واقعیت که اتصالات بین بخش های جاده آنها تقریباً یکسان است. این نتیجه نشان می‌دهد که مدل‌های پیشنهادی بیشتر بر مورفولوژی و ساختار کلی اتصالات در طول طبقه‌بندی تمرکز می‌کنند. با این حال، اتصالات بین بخش‌های جاده نیز معیارهای مهمی برای طبقه‌بندی دستی هستند، اگرچه در فرآیند مدل‌های یادگیری ماشینی مبتنی بر تصویر ضعیف می‌شوند. در این شرایط، رابطه توپولوژیکی بین بخش‌های جاده باید بیشتر مورد توجه قرار گیرد و یک مدل یادگیری عمیق مبتنی بر نمودار ممکن است یک راه‌حل بالقوه برای این منظور باشد.

3.5. بحث

برای بررسی تأثیر تعداد مختلف طبقه‌بندی‌کننده‌های پایه بر روی یادگیری گروه انباشته، تصاویر شطرنجی برای اتصالات با پوشش‌های ناحیه نمونه‌برداری متفاوت برای آموزش طبقه‌بندی‌کننده‌های پایه و متا تولید شد. به طور خاص، ما دو پوشش منطقه 500 × 500 متر مربع ^و 1500 × 1500 متر مربع ^را برای مطابقت با دو طبقه‌بندی پایه طراحی کردیم. چهار پوشش منطقه 500 × 500 متر مربع ^، 750 × 750 متر مربع ^، 1000 × 1000 متر مربع ^، و 1500 × 1500 متر مربع ^مربوط به چهار طبقه بندی پایه. و پنج منطقه نمونه برداری 500 × 500 متر مربع ^, 750 × 750 متر مربع ^, 1000 × 1000 متر مربع ^, 1250 × 1250 متر ^مربع، و 1500 × 1500 متر مربع² مربوط به پنج طبقه بندی پایه. دقت طبقه بندی مدل های SE با تعداد مختلف طبقه بندی کننده پایه در جدول 6 ارائه شده است.

مشاهده شد که دقت طبقه‌بندی مدل‌های SE مبتنی بر AlexNet و GoogLeNet در ابتدا افزایش می‌یابد و سپس با افزایش تعداد طبقه‌بندی‌کننده‌های پایه کاهش می‌یابد و زمانی که تعداد طبقه‌بندی‌کننده‌های پایه سه بود به بالاترین حد خود رسید. این نتیجه نشان می‌دهد که تعداد طبقه‌بندی‌کننده‌های پایه بر دقت طبقه‌بندی یادگیری گروه تأثیر می‌گذارد. افزایش مناسب در تعداد طبقه‌بندی‌کننده‌های پایه می‌تواند به طور موثری دقت یادگیری گروه را بهبود بخشد. با این حال، لزوما بهتر نیست. یکی از دلایل احتمالی این نتیجه این است که افزایش تعداد طبقه‌بندی‌کننده‌های پایه منجر به افزایش سریع بعد ویژگی ورودی به متا طبقه‌بندی‌کننده می‌شود، بنابراین بر عملکرد طبقه‌بندی متا طبقه‌بندی‌کننده تأثیر می‌گذارد. در این مطالعه،

3.6. تست در شهرهای دیگر

برای تأیید بیشتر توانایی تعمیم روش یادگیری گروهی، اتصالات جاده از چهار شهر دیگر، به عنوان مثال، پکن، چنگدو، گوانگژو، و چونگ کینگ، برای انجام یک آزمایش اضافی استفاده شد. رویکرد معرفی شده در [ 10 ] برای شناسایی اتصالات جاده ای پیچیده از شبکه های جاده ای این شهرها استفاده شد. در نتیجه، 217، 90، 109 و 156 تقاطع پیچیده به ترتیب در پکن، چنگدو، گوانگژو و چونگ کینگ شناسایی شدند. توزیع انواع اتصالات در هر شهر در جدول 7 ارائه شده است .

نتایج طبقه بندی اتصالات پیچیده در چهار شهر با استفاده از مدل های SE مبتنی بر AlexNet و GoogLeNet در شکل 10 نشان داده شده است ، که در آن از رنگ های مختلف برای علامت گذاری انواع مختلف اتصالات استفاده می شود. دقت طبقه بندی اتصالات در چهار شهر با استفاده از مدل های SE در جدول 8 فهرست شده است.

همانطور که در جدول 8 نشان داده شده است ، اگرچه توزیع تعداد انواع مختلف اتصالات در هر شهر بسیار متفاوت است، بیش از 70 درصد از اتصالات در چهار شهر به درستی طبقه بندی شده اند. دقت طبقه‌بندی مدل SE مبتنی بر GoogLeNet برای چهار شهر بیشتر از مدل SE مبتنی بر AlexNet است که با نتایج آزمایش‌های قبلی داده‌ها مطابقت دارد. به طور کلی، این نتیجه تأیید می کند که روش پیشنهادی اتصالات در شهرهای مختلف را به خوبی طبقه بندی می کند و توانایی تعمیم مدل را اثبات می کند.

4. نتیجه گیری

این مطالعه یک روش یادگیری گروهی را برای طبقه‌بندی الگوهای تقاطع‌های جاده‌ای پیچیده ارائه می‌کند. برخلاف روش‌های طبقه‌بندی مبتنی بر یادگیری عمیق موجود، روش پیشنهادی شامل چند طبقه‌بندی پایه و یک متا طبقه‌بندی‌کننده است. هر طبقه‌بندی‌کننده پایه، نوع هر تقاطع جاده‌ای پیچیده را با یادگیری ویژگی‌های تصاویر شطرنجی تولید شده از اتصالات مبتنی بر برداری با پوشش‌های ناحیه نمونه‌برداری متفاوت، پیش‌بینی می‌کند. سپس، متا طبقه‌بندی‌کننده، پیش‌بینی‌های اولیه این دسته‌بندی‌کننده‌های پایه را برای به دست آوردن پیش‌بینی نهایی ترکیب می‌کند. دو معماری یادگیری عمیق محبوب، AlexNet و GoogLeNet، برای ساختن طبقه‌بندی‌کننده‌های پایه استفاده شدند و مدل RF به عنوان متا طبقه‌بندی‌کننده استفاده شد.

نتایج تجربی نشان می دهد که عملکرد طبقه بندی پس از استفاده از روش SE بهبود یافته است. متریک دقت مدل SE مبتنی بر GoogLeNet به 92.4 درصد رسید که 6 تا 14 درصد بیشتر از طبقه‌بندی‌کننده‌های پایه بود. یعنی مدل‌های GoogLeNet با استفاده از تصاویر شطرنجی از یک منطقه نمونه‌برداری منفرد آموزش دیده‌اند. ایندقتمتریک مدل SE مبتنی بر AlexNet به 78.9٪ رسید که 5 تا 6٪ بیشتر از طبقه بندی های پایه است. این نتایج نشان می‌دهد که روش SE پیشنهادی می‌تواند به طور موثر مشارکت‌های طبقه‌بندی‌کننده‌های مختلف را که بر اساس نمایش‌های شطرنجی اتصالات پیچیده با پوشش‌های ناحیه مختلف آموزش داده شده‌اند، ترکیب کند. علاوه بر این، ثابت شده است که این روش قابلیت تعمیم خوبی دارد و می تواند برای طبقه بندی تقاطع های جاده ای در شهرهای مختلف استفاده شود.

کار آینده بر افزایش تنوع نمونه ها برای بهبود جهانی بودن روش پیشنهادی برای طبقه بندی اتصالات جاده ای پیچیده متمرکز خواهد بود. علاوه بر این، اتصالات توپولوژیکی بین بخش‌های جاده را می‌توان برای بهبود کمبود مدل مبتنی بر شطرنجی در نظر گرفت، مانند ساخت یک مدل یادگیری عمیق مبتنی بر نمودار به‌عنوان یک طبقه‌بندی پایه برای مشارکت در یادگیری گروهی. علاوه بر این، استراتژی‌های مختلف یادگیری گروهی دیگر، مانند ادغام داده‌های چند منبع (مسیرها، و غیره)، برای بهبود بیشتر دقت طبقه‌بندی، مستحق توجه هستند.

منابع

اولوگ تکین، ن. دوگرو، آئو. تامسون، RC مدل‌سازی شبکه‌های جاده‌ای شهری با ادغام نمایش‌های متعدد از ساختارهای پیچیده جاده‌ها و اتصالات. در مجموعه مقالات دوازدهمین کنفرانس بین المللی ژئوانفورماتیک، Gävle، سوئد، 7-9 ژوئن 2004. [ Google Scholar ]
Mackaness، WA; Mackechnie، GA خودکارسازی تشخیص و ساده سازی اتصالات در شبکه های جاده ای. Geoinf. بین المللی J. Adv. محاسبه کنید. علمی Geogr. 1999 ، 3 ، 185-200. [ Google Scholar ] [ CrossRef ]
Touya, G. فرآیند انتخاب شبکه جاده بر اساس غنی سازی داده ها و تشخیص ساختار. ترانس. GIS 2010 ، 14 ، 595-614. [ Google Scholar ] [ CrossRef ]
یانگ، جی. ژائو، ک. لی، ام. خو، ز. Li، Z. شناسایی اتصالات پیچیده در یک شبکه جاده ای. ISPRS Int. J. Geo-Inf. 2020 ، 10 ، 4. [ Google Scholar ] [ CrossRef ]
ژو، ی. چانگ، ای. باسکار، ا. Cholette، ME یک استراتژی برنامه‌ریزی مسیر مبتنی بر کنترل بهینه مبتنی بر دولت برای تسهیل مانورهای ادغام در آزادراه و مانورهای ادغام روی سطح شیب دار تحت ترافیک شلوغ. ترانسپ Res. قسمت C-Emerg. تکنولوژی 2019 ، 109 ، 321-342. [ Google Scholar ] [ CrossRef ]
جیانگ، بی. لیو، سی. نمایش های توپولوژیکی مبتنی بر خیابان و تجزیه و تحلیل برای پیش بینی جریان ترافیک در GIS. بین المللی جی. جئوگر. Inf. علمی 2009 ، 23 ، 1119-1137. [ Google Scholar ] [ CrossRef ]
لیو، بی. دونگ، دبلیو. ژان، ز. وانگ، اس. Meng, L. تفاوت در رفتارهای نگاه عابران پیاده که بین الگوهای جاده منظم و نامنظم حرکت می کنند. ISPRS Int. J. Geo-Inf. 2020 ، 9 ، 45. [ Google Scholar ] [ CrossRef ]
هابرمن، دی. ویدو، سی. Osorio، FS; راموس، F. تشخیص تقاطع جاده از ابرهای نقطه سه بعدی. در مجموعه مقالات کنفرانس مشترک بین‌المللی شبکه‌های عصبی، ونکوور، BC، کانادا، 24 تا 29 ژوئیه 2016. صص 4934-4940. [ Google Scholar ]
لی، اچ. هو، م. Huang, Y. شناسایی خودکار سازه های روگذر: روشی برای یادگیری عمیق. ISPRS Int. J. Geo-Inf. 2019 ، 8 ، 421. [ Google Scholar ] [ CrossRef ]
یانگ، م. جیانگ، سی. یان، ایکس. آی، تی. کائو، ام. چن، دبلیو. تشخیص مبادلات در شبکه های جاده ای با استفاده از رویکرد شبکه کانولوشن گراف. بین المللی جی. جئوگر. Inf. علمی 2022 ، 36 ، 1119-1139. [ Google Scholar ] [ CrossRef ]
ژو، Q. Li، Z. تجزیه و تحلیل تجربی انواع مختلف تقاطع جاده برای تشخیص تبادل. ترانس. GIS 2015 ، 19 ، 19-41. [ Google Scholar ] [ CrossRef ]
خو، ز. منگ، ی. لی، ز. Li, M. روش شناسایی تقاطع های جاده ای معمولی بر اساس نمودار رابطه ویژگی جهت دار. Acta Geod. کارتوگر. گناه 2011 ، 40 ، 125-131. [ Google Scholar ]
وانگ، ایکس. کیان، اچ. دینگ، ی. ژانگ، ایکس. لیو، آر. روش تشخیص مبادلات کلی بر اساس روابط توپولوژیکی و طبقه بندی جاده ها. جی. ژئومات. علمی تکنولوژی 2013 ، 30 ، 324-328. [ Google Scholar ]
ژائو، ز. ژنگ، پی. خو، اس. Wu, X. تشخیص شی با یادگیری عمیق: یک بررسی. IEEE Trans. شبکه عصبی فرا گرفتن. سیستم 2019 ، 30 ، 3212–3232. [ Google Scholar ] [ CrossRef ]
سمور، DW; مدینه، JR; کالیتا، JK بررسی کاربردهای یادگیری عمیق برای پردازش زبان طبیعی. IEEE Trans. شبکه عصبی فرا گرفتن. سیستم 2020 ، 32 ، 604-624. [ Google Scholar ] [ CrossRef ]
نصیف، AB; شاهین، من. آتیلی، آی. عزه، م. Shaalan، K. تشخیص گفتار با استفاده از شبکه های عصبی عمیق: یک بررسی سیستماتیک. دسترسی IEEE 2019 ، 7 ، 19143-19165. [ Google Scholar ] [ CrossRef ]
یان، ایکس. آی، تی. یانگ، م. یین، اچ. یک گراف شبکه عصبی کانولوشن برای طبقه بندی الگوهای ساختمان با استفاده از داده های برداری فضایی. ISPRS-J. فتوگرام Remote Sens. 2019 ، 150 ، 259–273. [ Google Scholar ] [ CrossRef ]
یان، ایکس. آی، تی. یانگ، م. تانگ، X. مدل رمزگذار خودکار کانولوشنال نمودار برای کدگذاری شکل و شناخت ساختمان ها در نقشه ها. بین المللی جی. جئوگر. Inf. علمی 2021 ، 35 ، 490-512. [ Google Scholar ] [ CrossRef ]
مایکل، MK; Thirumalai، SVJ; Sureshkanna، P. RBorderNet: شبکه عصبی کانولوشن عمیق مبتنی بر بهینه‌سازی مرز سوار برای تقسیم‌بندی صحنه جاده و طبقه‌بندی تقاطع جاده. رقم. فرآیند سیگنال 2022 ، 129 ، 103626. [ Google Scholar ] [ CrossRef ]
او، اچ. کیان، اچ. زی، ال. Duan, P. روش تشخیص تبادل مبتنی بر CNN. Acta Geod. کارتوگر. گناه 2018 ، 47 ، 385-395. [ Google Scholar ]
تویا، جی. لخت، اول. یادگیری عمیق برای غنی سازی پایگاه داده های فضایی برداری. ACM Trans. تف کردن سیستم الگوریتم 2020 ، 6 ، 1-21. [ Google Scholar ] [ CrossRef ]
لی، سی. ژانگ، اچ. وو، پی. یین، ی. Liu, S. یک روش تشخیص اتصال پیچیده بر اساس مدل GoogLeNet. ترانس. GIS 2020 ، 24 ، 1756-1778. [ Google Scholar ] [ CrossRef ]
یانگ، م. کنگ، بی. دانگ، آر. یان، X. طبقه بندی مناطق عملکردی شهری با ادغام ساختمان ها و نقاط مورد علاقه با استفاده از روش مجموعه انباشته. بین المللی J. Appl. زمین Obs. Geoinf. 2022 ، 108 ، 102753. [ Google Scholar ] [ CrossRef ]
فاطمه، ح. حسام، او. مدل مجموعه‌ای از یادگیری عمیق و کاربرد آن در تشخیص ارقام دست‌نویس فارسی/عربی. بدانید. سیستم مبتنی بر 2021 ، 220 ، 106940. [ Google Scholar ] [ CrossRef ]
کائو، دی. زینگ، اچ. بخوان، WM; MeiPo، K. زینگ، اچ. Meng, Y. یک مدل یادگیری عمیق مجموعه انباشته برای ساخت استخراج از تصاویر سنجش از دور. Remote Sens. 2021 , 13 , 3898. [ Google Scholar ] [ CrossRef ]
چنگ، ایکس. Lei, H. طبقه‌بندی تصویر صحنه سنجش از دور بر اساس mmsCNN–HMM با مدل مجموعه‌ای انباشته. Remote Sens. 2022 , 14 , 4423. [ Google Scholar ] [ CrossRef ]
تعمیم ولپرت، DH Stacked. شبکه عصبی 1992 ، 5 ، 241-259. [ Google Scholar ] [ CrossRef ]
کریژفسکی، آ. سوتسکور، آی. هینتون، GE ImageNet طبقه بندی با شبکه های عصبی کانولوشن عمیق. اشتراک. ACM 2017 ، 60 ، 84–90. [ Google Scholar ] [ CrossRef ]
سگدی، سی. لیو، دبلیو. جیا، ی. سرمانت، پ. رید، SE; آنگلوف، دی. ایرهان، د. ونهوک، وی. رابینوویچ، الف. با پیچیدگی ها عمیق تر می رویم. در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو، بوستون، MA، ایالات متحده آمریکا، 7 تا 12 ژوئن 2015. صفحات 1-9. [ Google Scholar ]
بریمن، ال. جنگل های تصادفی. ماخ فرا گرفتن. 2001 ، 45 ، 5-32. [ Google Scholar ] [ CrossRef ]
دوست خوب، من. بنژیو، ی. کورویل، آ. یادگیری عمیق . انتشارات MIT: کمبریج، MA، ایالات متحده آمریکا، 2016. [ Google Scholar ]

شکل 1. چارچوب کلی روش یادگیری گروه انباشته (SE) پیشنهادی برای طبقه بندی الگوهای اتصالات جاده ای پیچیده.

شکل 2. تصویری از فرآیند تولید تصویر شطرنجی برای یک تقاطع جاده پیچیده مبتنی بر برداری.

شکل 3. مقایسه تصاویر شطرنجی تولید شده با عرض خطوط مختلف.

شکل 4. تصویر ساده شده از معماری AlexNet.

شکل 5. تصویر ساده شده از معماری GoogLeNet.

شکل 6. جزئیات فرآیند یادگیری گروه انباشته.

p_{j}^{i}

نشان دهنده امکان الگوی نمونه ورودی متعلق به نوع i است که توسط طبقه‌بندی‌کننده پایه j پیش‌بینی می‌شود و m و n به ترتیب تعداد طبقه‌بندی‌کننده‌های مبتنی بر و تعداد انواع الگوی اتصال را نشان می‌دهند. .

شکل 7. نمونه هایی برای هفت نوع پیوند جاده ای پیچیده.

شکل 8. توزیع اندازه حداقل مربعات مرزی نمونه های جمع آوری شده از محل اتصال جاده.

شکل 9. برخی از اتصالات طبقه بندی نادرست و اتصالات معمولی انواع آنها: ( الف ) به ترتیب اتصالات طبقه بندی شده اشتباه و نوع معمولی، ( ب ) به ترتیب اتصالات طبقه بندی نادرست و نوع معمولی الماس.

شکل 10. نتایج طبقه‌بندی برای اتصالات جاده‌ای پیچیده در شهرهای مختلف با استفاده از روش مجموعه انباشته پیشنهادی (SE): ( الف – د ) پکن، چنگدو، چونگ کینگ و گوانگژو، به ترتیب با استفاده از مدل SE مبتنی بر AlexNet، ( e- h ) پکن، چنگدو، چونگ کینگ و گوانگژو به ترتیب با استفاده از مدل SE مبتنی بر GoogLeNet.

مقالات داخلی و بین المللی

بدون دیدگاه

دیدگاهتان را بنویسید لغو پاسخ

برای نوشتن دیدگاه باید وارد بشوید.

مشاورین هوش پیروزی

کلید واژه ها:

1. مقدمه

2. روش شناسی

2.1. نمونه برداری از اتصالات مجتمع با پوشش های مختلف