چکیده

استفاده از تصاویر با وضوح بسیار بالا برای استخراج جاده های شهری، برون شهری و روستایی ارزش کاربردی مهمی دارد. با این حال، استخراج موثر منطقه جاده مسدود شده توسط تاج درختان کنار جاده یا ساختمان های بلند برای حفظ یکپارچگی منطقه جاده استخراج شده، صاف بودن خطوط کناری و اتصال شبکه راه همچنان مشکل است. این مقاله یک مدل تقسیم‌بندی معنایی توجه آبشاری DenseUNet (CADUNet) را با تعبیه دو ماژول توجه، مانند ماژول‌های توجه جهانی و توجه هسته، در چارچوب DenseUNet پیشنهاد می‌کند. ابتدا مجموعه ای از ماژول های توجه جهانی آبشاری برای به دست آوردن اطلاعات زمینه ای جاده معرفی می شوند. دوما مجموعه‌ای از ماژول‌های توجه اصلی آبشاری تعبیه شده‌اند تا اطمینان حاصل شود که اطلاعات جاده به بیشترین میزان در میان بلوک‌های متراکم در شبکه منتقل می‌شود، و بیشتر به ماژول توجه جهانی در به دست آوردن اطلاعات جاده‌ای چند مقیاسی کمک می‌کند و در نتیجه اتصال جاده را بهبود می‌بخشد. شبکه جاده در حالی که یکپارچگی منطقه جاده تحت سایه تاج درخت و ساختمان های بلند را بازیابی می کند. بر اساس آنتروپی متقاطع باینری، یک تابع تطبیقی ​​برای تنظیم پارامتر شبکه پیشنهاد شده است. آزمایش‌ها بر روی مجموعه داده‌های جاده ماساچوست و مجموعه داده‌های جاده DeepGlobe-CVPR 2018 نشان می‌دهد که این مدل تقسیم‌بندی معنایی می‌تواند به طور موثر منطقه جاده را که سایه‌دار درختان است استخراج کرده و اتصال شبکه جاده را بهبود بخشد. و بیشتر به ماژول توجه جهانی در به دست آوردن اطلاعات جاده در مقیاس چندگانه کمک می کند، در نتیجه اتصال شبکه جاده را بهبود می بخشد و در عین حال یکپارچگی منطقه جاده تحت سایه درختان و ساختمان های بلند را بازیابی می کند. بر اساس آنتروپی متقاطع باینری، یک تابع تطبیقی ​​برای تنظیم پارامتر شبکه پیشنهاد شده است. آزمایش‌ها بر روی مجموعه داده‌های جاده ماساچوست و مجموعه داده‌های جاده DeepGlobe-CVPR 2018 نشان می‌دهد که این مدل تقسیم‌بندی معنایی می‌تواند به طور موثر منطقه جاده را که سایه‌دار درختان است استخراج کرده و اتصال شبکه جاده را بهبود بخشد. و بیشتر به ماژول توجه جهانی در به دست آوردن اطلاعات جاده در مقیاس چندگانه کمک می کند، در نتیجه اتصال شبکه جاده را بهبود می بخشد و در عین حال یکپارچگی منطقه جاده تحت سایه درختان و ساختمان های بلند را بازیابی می کند. بر اساس آنتروپی متقاطع باینری، یک تابع تطبیقی ​​برای تنظیم پارامتر شبکه پیشنهاد شده است. آزمایش‌ها بر روی مجموعه داده‌های جاده ماساچوست و مجموعه داده‌های جاده DeepGlobe-CVPR 2018 نشان می‌دهد که این مدل تقسیم‌بندی معنایی می‌تواند به طور موثر منطقه جاده را که سایه‌دار درختان است استخراج کرده و اتصال شبکه جاده را بهبود بخشد. یک تابع از دست دادن تطبیقی ​​برای تنظیم پارامتر شبکه پیشنهاد شده است. آزمایش‌ها بر روی مجموعه داده‌های جاده ماساچوست و مجموعه داده‌های جاده DeepGlobe-CVPR 2018 نشان می‌دهد که این مدل تقسیم‌بندی معنایی می‌تواند به طور موثر منطقه جاده را که سایه‌دار درختان است استخراج کرده و اتصال شبکه جاده را بهبود بخشد. یک تابع از دست دادن تطبیقی ​​برای تنظیم پارامتر شبکه پیشنهاد شده است. آزمایش‌ها بر روی مجموعه داده‌های جاده ماساچوست و مجموعه داده‌های جاده DeepGlobe-CVPR 2018 نشان می‌دهد که این مدل تقسیم‌بندی معنایی می‌تواند به طور موثر منطقه جاده را که سایه‌دار درختان است استخراج کرده و اتصال شبکه جاده را بهبود بخشد.

کلید واژه ها: 

یادگیری عمیق ؛ جاده ; DenseUNet ; ماژول توجه ؛ تقسیم بندی معنایی ; سنجش از دور

1. مقدمه

اطلاعات جاده ها در زمینه های توسعه شهری و روستایی [ 1 ]، امداد اضطراری و بلایای طبیعی [ 2 ]، ناوبری وسایل نقلیه [ 3 ] و سیستم های اطلاعات جغرافیایی [ 4 ] اهمیت حیاتی دارد . با توسعه سریع فناوری سنجش از دور، تصاویر سنجش از دور با وضوح بسیار بالا (VHR) برای استخراج اطلاعات جاده مورد استفاده قرار گرفته است [ 5 ]. در عمل، بیشتر به‌روزرسانی‌های داده‌های جاده هنوز از تفسیر دستی استفاده می‌کنند که زمان‌بر و پر زحمت است و کنترل کیفیت ندارد. بسیاری از الگوریتم های استخراج جاده توسعه یافته اند [ 6 ، 7 ، 8 ]. این الگوریتم ها را می توان به روش های سنتی یادگیری ماشینی تقسیم کرد [9 ، 10 ، 11 ، 12 ، 13 ، 14 ] و جدیدترین روش های یادگیری عمیق [ 15 ، 16 ، 17 ]. برخی از روش‌های سنتی استخراج جاده عمدتاً از ویژگی‌های طیفی تصاویر سنجش از دور استفاده می‌کنند که گهگاه با ویژگی‌های بافت تکمیل می‌شوند. با این حال، این روش برای استفاده مؤثر از اطلاعات هندسی و زمینه در تصاویر سنجش از دور دشوار است [ 18 ]، و تولید نویز «نمک و فلفل» آسان است [ 19 ].]. در میان روش های سنتی، رویکرد مبتنی بر شی به وضوح اثر بر استخراج جاده را بهبود می بخشد. به جای پیکسل ها، از اشیاء تصویری به عنوان واحد اصلی استفاده می کند و از ویژگی های طیفی، هندسی، بافتی و زمینه ای آنها برای استخراج اطلاعات استفاده می کند و در نتیجه کیفیت محصول را بهبود می بخشد [ 20 ، 21 ]. از یک طرف، این روش به شدت به کیفیت قطعه‌بندی تصویر وابسته است و چگونگی یافتن پارامترهای مناسب برای تقسیم‌بندی، خود مشکلی دشوار است. از سوی دیگر، ویژگی‌های طیفی، بافت، هندسی و زمینه‌ای بسیاری وجود دارد و تعیین اینکه کدام ویژگی برای استخراج اطلاعات جاده‌ها مناسب‌تر است، دشوار است. هنگامی که منبع داده یا شرایط منطقه ای تغییر می کند، ویژگی های مورد نیاز برای طبقه بندی باید بر اساس آن تنظیم شوند [22 ، 23 ، 24 ]. روش های فوق همچنین تشخیص جاده ها از سایر سطوح مصنوعی مانند ساختمان ها و پارکینگ ها در تصاویر VHR دشوار است.
در سال های اخیر، یادگیری عمیق در استخراج جاده ها از تصاویر سنجش از دور معرفی شده است [ 25 ]. روش‌های مبتنی بر یادگیری عمیق قابلیت‌های بیان ویژگی مؤثر را نشان می‌دهند و می‌توانند به طور خودکار ویژگی‌های مفیدی را از تصاویر برای استخراج جاده کسب کنند [ 26 ، 27 ]. الگوریتم های یادگیری عمیق مورد استفاده در استخراج جاده ها عمدتا بر اساس شبکه های عصبی کانولوشن (CNN) هستند. ژانگ و همکاران [ 28 ] از CNN برای استخراج اطلاعات جاده در تصاویر VHR استفاده کرد. با بهبود معماری CNN، گائو و همکاران. [ 17] یک شبکه عصبی کانولوشنال باقیمانده عمیق با عملیات پس از پردازش پیشنهاد کرد که عملکرد خوبی در استخراج جاده‌ها از پس‌زمینه‌های پیچیده شامل مناطق شهری و روستایی نشان داد. شبکه کاملاً پیچیده (FCN) نوعی CNN است. لانگ و همکاران [ 29 ] ابتدا یک مدل تقسیم بندی معنایی بر اساس FCN برای استخراج جاده پیشنهاد کرد. بعدها، برخی از مدل‌های تقسیم‌بندی معنایی جدید بر اساس FCN، مانند U-Net [ 30 ]، SegNet [ 31 ]، DeepLab V3+ [ 32 ] و غیره توسعه یافتند که در استخراج جاده‌ها از تصاویر VHR استفاده می‌شوند. ژانگ و همکاران [ 33 ] U-Net باقیمانده عمیق را برای استخراج جاده پیشنهاد کرد. این روش از دست دادن اطلاعات را کاهش می دهد و به طور موثری دقت استخراج جاده را بهبود می بخشد. بوسلایف و همکاران [15 ] U-Net بهبود یافته ای را پیشنهاد کرد که می تواند زمان تمرین را کوتاه کند و در چالش CVPR 2018 به نتیجه خوبی دست یابد. رویکردهای مبتنی بر وصله، مانند رویکرد مبتنی بر شی، یک برچسب واحد برای تمام پیکسل‌های یک پچ اختصاص می‌دهند. محمد و همکاران [ 34 ] یک شبکه عصبی عمیق مبتنی بر وصله برای شناسایی جاده ها در مجموعه داده های بزرگ مقیاس پیشنهاد کرد. برخی از مطالعات [ 23 ، 35 ] شبکه‌های عصبی آبشاری را برای انجام یادگیری چند وظیفه‌ای برای استخراج همزمان مناطق جاده، خطوط مرکزی و حاشیه ایجاد کردند. تائو و همکاران برای حل موثر مشکل اثر سایه‌اندازی سایه‌بان و حفظ اتصال شبکه جاده‌ای استخراج‌شده. [ 36] یک شبکه استدلال اطلاعات مکانی را برای ضبط و انتقال اطلاعات زمینه ای خاص جاده پیشنهاد کرد. لی و همکاران با توجه به راندمان محاسباتی پایین D-LinkNet. [ 37 ] یک BD-Linknet Plus بهبود یافته را تأسیس کرد. آزمایشات نشان می دهد که شبکه عصبی بهبود یافته می تواند اندازه شبکه را کاهش دهد و دقت مورد نیاز برای استخراج جاده را بهبود بخشد. یانگ و همکاران [ 38 ] یک ماژول شبکه عصبی کانولوشنال بازگشتی (RCNN) طراحی کرد و آن را در معماری U-Net ادغام کرد تا مشکلاتی مانند نویز، انسداد و پس‌زمینه پیچیده را حل کند. برای حفظ اطلاعات مرزی و به دست آوردن نقشه های راه با وضوح بالا، ابوالفضل و همکاران. [ 39 ] یک شبکه کانولوشنال جدید، یعنی مدل VNet را معرفی کرد. شین و همکاران [ 40] DenseUNet را برای استخراج جاده در صحنه های پیچیده بر اساس DenseNet با توجه به قابلیت های قدرتمند آن در استخراج ویژگی های چند سطحی و استفاده مجدد پیشنهاد کرد. این روش های یادگیری عمیق عملکرد خوبی دارند، به طوری که جاده ها و ساختمان ها و سایر سطوح مصنوعی بهتر طبقه بندی می شوند.
استخراج جاده از تصاویر VHR معمولاً با دو مشکل روبرو است. اولین مورد حفظ یکپارچگی منطقه جاده و صاف بودن خط کناری است. سایبان های درختان بزرگ و ساختمان های مرتفع در کنار جاده اثر سایه ای دارند و اغلب منطقه جاده را مسدود می کنند. دوم این است که اتصال شبکه راه را حفظ کنیم تا جاده مفقود یا قطع نشود. در برخی از مطالعات سعی شده مشکل سایه‌اندازی جزئی که منجر به کمبود حریم راه و مسدود شدن کامل منجر به قطع شدن جاده می‌شود، حل شود. یک روش این است که نتایج تقسیم بندی را پس از پردازش [ 17 ، 41 ، 42 ] انجام دهیم]. با این حال، مشکل این است که پارامترهای پس پردازش باید به صورت دستی تنظیم شوند و عملیات برای جاده های پیچیده مسافت طولانی پیچیده و دشوار است. در سال های اخیر، مکانیسم توجه به مدل یادگیری عمیق معرفی شده است. لای و همکاران [ 43 ] یک واحد توجه بصری طراحی کرد تا ناحیه فوکوس را با دقت بیشتری برای ادغام تصویر تعیین کند. مکانیسم توجه می تواند اثربخشی مدل را در تشخیص هدف بهبود بخشد [ 44 ، 45 ]. با کمک مکانیسم توجه، شبکه‌های یادگیری عمیق می‌توانند ویژگی‌های تمایز بیشتری را برای کار هدف استخراج کنند [ 46 ، 47 ، 48 ]. یه و همکاران [ 49] از مکانیسم توجه برای حل مشکل پرش اتصالات برای استخراج ساختمان استفاده کرد. جتلی و همکاران [ 48 ] ​​از یک ماژول دروازه‌ای توجه برای تولید یک نقشه توجه متنی در سطح بالای شبکه، با تمرکز بر اطلاعات محلی مفید برای پیش‌بینی سطح متوسط ​​در قالب «راهنمای جهانی» استفاده کرد. جین و همکاران [ 50 ] از مکانیسم توجه زمان برای تنظیم غیرخطی بودن و سازگاری دینامیکی شبکه الکتریکی استفاده کرد و در نتیجه عملکرد کلی مدل پیش‌بینی را بهبود بخشید. اوکتای و همکاران [ 51] یک ماژول توجه پیشنهاد کرد که تصاویر وزن‌دار را از سطح بالایی یاد می‌گیرد تا روی ویژگی‌های مفید تمرکز کند و مناطق نامربوط در نقشه ویژگی میانی را سرکوب می‌کند و در نتیجه عملکرد پیش‌بینی را بهبود می‌بخشد.
در پاسخ به مشکلات، ما با تعبیه دو ماژول توجه، مانند توجه جهانی و توجه اصلی، در چارچوب DenseUNet، یک آبشار توجه متراکم-UNet (CADUNet) را پیشنهاد می‌کنیم. ما از ماژول توجه اصلی برای استخراج مناطق جاده‌ای، از جمله قسمت‌های مسدود شده، استفاده می‌کنیم و از ماژول توجه جهانی برای افزایش اطلاعات زمینه جهانی در مورد شبکه جاده‌ها استفاده می‌کنیم. مشارکت های اصلی این مقاله به شرح زیر است:
  • ماژول‌های توجه اصلی و ماژول‌های توجه جهانی در DenseUNet با هم قرار می‌گیرند تا اطلاعات جاده‌ای را در مقیاس‌های مختلف ترکیب کنند، بنابراین اتصال شبکه جاده‌ها و صاف بودن حاشیه‌ها را بهبود می‌بخشند.
  • یک تابع تلفات تطبیقی ​​برای حل مشکل نسبت خیلی کوچک جاده ها به مناطق غیر جاده ای در نمونه های آموزشی معرفی شده است.
ساختار بقیه مقاله به صورت زیر است: در بخش 2 ، روش CADUNet را معرفی می کنیم. بخش 3 آماده سازی داده های مورد استفاده در آزمایش را مشخص می کند. بخش 4 نتایج را نشان می دهد. بخش 5 مکانیسم های اثربخشی مدل شبکه را بررسی می کند و بخش 6 نتیجه گیری را ارائه می دهد.

2. روش ها

CADUNet پیشنهادی یک شبکه تقسیم‌بندی معنایی ترکیبی است که با تعبیه ماژول‌های توجه جهانی و اصلی در چارچوب DenseUNet ایجاد شده است. DenseUNet ادغام دو شبکه کلاسیک UNet و DenseNet است [ 52 ]. UNet معمولا از دو بخش تشکیل شده است: رمزگذار و رمزگشا. DenseUNet معمولا از بلوک های متراکم و لایه های انتقال به پایین مرتبط با UNet تشکیل شده است. هنگام ساخت DenseUNet، بلوک متراکم و لایه‌های انتقال پایین به قسمت رمزگذار UNet وارد می‌شوند تا جایگزین لایه‌های کانولوشنال اصلی و لایه‌های ادغام شوند، بنابراین عملکرد UNet در تقسیم‌بندی معنایی بهبود می‌یابد [ 40 ، 45 ]. در CADUNet، ماژول‌های توجه جهانی بیشتر به بخش رمزگشای UNet اضافه می‌شوند ( شکل 1)). علاوه بر این، ماژول های توجه اصلی بین رمزگذار و رمزگشا تعبیه شده است. برای به دست آوردن نتایج بهتر، لازم است اطلاعات معنایی سطح بالا از تصاویر به دست آید و در عین حال اطلاعات جزئی سطح پایین حفظ شود. اطلاعات لایه های پایین را می توان در طول مسیر انتقال اطلاعات به لایه های بالاتر منتقل کرد. این جزئیات عملکرد سطح پایین و اطلاعات معنایی سطح بالا را جبران می کند [ 44 ]. زیربخش های زیر جزئیات را ارائه می دهند.

2.1. رمزگذار

ما از بلوک های متراکم و لایه های انتقال به پایین در بخش رمزگذار UNet استفاده می کنیم. بلوک متراکم از چهار لایه متراکم تشکیل شده است ( شکل 2 ) و خروجی هر لایه متراکم دارای یک نقشه ویژگی با همان بعد کانال است. در هر بلوک متراکم، تمام لایه ها اتصالات متراکم را حفظ می کنند. بلوک های متراکم از طریق لایه های انتقال به پایین بین آنها متصل می شوند. در یک بلوک متراکم، تابع l ( ) برای تبدیل غیرخطی بین لایه ها استفاده می شود. اتصال متراکم به عنوان معادله (1) [ 52 ] تعریف می شود:

Dل=افل([D0،D1،D2،Dل1])

که در آن l تعداد لایه های متراکم در هر بلوک متراکم است، 1 نقشه ویژگی خروجی لایه اول است و [ 0 , 1 , 2 , …, Dl − آبشاری از تمام نقشه های ویژگی قبلی است. از لایه اول

با توجه به اینکه DenseNet نقشه‌های ویژگی زیادی تولید می‌کند که با پارامترهای مدل بیش از حد همراه است، ما یک نرخ رشد K را برای کنترل تعداد نقشه‌های ویژگی تعریف می‌کنیم، که در آن K تعداد لایه‌های ویژگی خروجی هر لایه را نشان می‌دهد. ما K را روی 48 قرار می دهیم. اندازه نقشه های ویژگی در داخل هر بلوک متراکم یکسان است ( شکل 2 ).
برای کاهش مقدار محاسبه و افزایش میدان دریافتی، پس از هر بلوک متراکم از یک لایه انتقال پایین استفاده می شود. هر لایه انتقال از نرمال سازی دسته ای (BN)، واحد خطی اصلاح شده (ReLU)، لایه گلوگاه (پیچیدگی 1×1) و لایه ادغام متوسط ​​(2×2) تشکیل شده است.

2.2. مکانیسم توجه

مکانیسم توجه می تواند به تمرکز بیشتر بر روی اهداف جالب کمک کند [ 44 ، 45 ]. این مطالعه از دو ماژول توجه استفاده می کند: مدول توجه اصلی [ 44 ] و مدول توجه جهانی [ 45 ]. در ماژول توجه هسته، مقدار ورودی سیگنال با محاسبه خروجی آخرین بلوک متراکم محاسبه می شود ( شکل 3). ماژول توجه اصلی شامل دو ورودی است، یکی خروجی به سه بلوک متراکم و دیگری ورودی سیگنال توجه است. با اتصال ویژگی‌های سطح پایین به ویژگی‌های سطح بالا، ماژول توجه اصلی می‌تواند اطلاعات پس‌زمینه را تضعیف کند و جزئیات مفید محلی را افزایش دهد، در نتیجه قضاوت نادرست ویژگی اتصال پرش اصلی را کاهش داده و یکپارچگی شبکه جاده استخراج‌شده را بهبود می‌بخشد. معرفی ماژول توجه اصلی، از یک سو، می تواند حداکثر انتقال اطلاعات جاده را بین تمام لایه های شبکه تضمین کند. از سوی دیگر، می تواند به ماژول توجه جهانی کمک کند تا یکپارچگی جاده را بهبود بخشد و در عین حال اثر انسداد تاج درخت را از بین ببرد.
در ماژول توجه جهانی، استخر میانگین جهانی ابتدا برای استخراج اطلاعات زمینه جهانی از نقشه ویژگی های سطح بالا استفاده می شود ( شکل 4 ). استخر میانگین جهانی برای به دست آوردن اطلاعات زمینه جهانی در تصاویر راحت است [ 45 ]. سپس، خروجی اطلاعات زمینه جهانی از طریق یک تابع سیگموئید فعال می شود. در نهایت، ویژگی های وزنی برای یکپارچه سازی اطلاعات جهانی به نقشه ویژگی اضافه می شود. ماژول توجه جهانی از لایه میانگین جهانی برای جمع‌آوری اطلاعات زمینه جهانی از نقشه ویژگی استفاده می‌کند و اطلاعات کلی نقشه ویژگی را افزایش می‌دهد، در نتیجه وقفه استخراج جاده ناشی از انسداد تاج درخت را حل می‌کند.

2.3. رمزگشا

ما عمدتاً دو تنظیم در رمزگشا در CADUNet انجام دادیم. یکی استفاده از یک عملیات نمونه برداری ساده با اندازه گام 2 در لایه اول، و دوم استفاده از 4 ماژول توجه سراسری به اضافه 3 عملیات نمونه برداری بهبود یافته است. در عملیات نمونه برداری ارتقا یافته، ابتدا عملیات کانولوشن 1 × 1، BN و ReLU انجام می شود، سپس عملیات کانولوشن 3 × 3، عملیات BN و ReLU و در نهایت، نمونه برداری ساده انجام می شود. این با اندازه خروجی حاصل توسط ماژول توجه مطابقت دارد. خروجی آخرین ماژول توجه سراسری را به لایه مربوطه در رمزگذار اضافه می کنیم. پس از آن، خروجی به لایه مربوطه در رمزگذار مربوط می شود. سپس، یک عملیات نمونه برداری ساده اضافه می شود تا اندازه تصویر به همان اندازه تصویر ورودی اصلی پس از پیچیدگی 1 × 1 بازیابی شود. عملیات BN و ReLU. برای پیچیدگی نهایی، عملیات BN، ReLU و sigmoid برای تولید نقشه راه پیش بینی شده استفاده می شود.

2.4. تابع از دست دادن تطبیقی

در این مقاله، استخراج جاده را به عنوان یک تقسیم بندی معنایی باینری در نظر می گیریم. نسبت مساحت جاده معمولاً کمتر از 10 درصد است و نسبت پس‌زمینه‌های غیرجاده معمولاً بیشتر از 90 درصد است. در مورد نمونه‌گیری تصادفی، کارایی آموزشی پایین است زیرا نمونه‌های منفی بیشتر نمونه‌های آموزشی را اشغال می‌کنند [ 24 ]. برای این منظور، یک تابع تطبیقی ​​تطبیقی ​​جدید برای تنظیم عدم تعادل بین نمونه‌های مثبت و منفی اتخاذ می‌کنیم:

Loسس=پroآد×LبسیE+پبآجکgroتوnد×(1LمنoU)

جایی که، پroآدو پبآجکgroتوnدبه ترتیب نشان دهنده درصد جاده ها و غیر جاده ها در کل منطقه است. LبسیEاز دست دادن آنتروپی متقاطع باینری [ 53 ] است، و LمنoUشاخص نسبت تقاطع [ 54 ] است و بر انحراف بین جاده پیش بینی شده و جاده واقعی تأکید دارد. فرمول محاسبه هر یک به شرح زیر است:

LبسیE=1nمن=1n(gمن(ورود به سیستمپمن)+(1gمن)(1ورود به سیستمپمن))
LمنoU=1من=1ngمنپمنمن=1n(gمن+پمنgمنپمن)

جایی که gمنi = 0، 1، 2، …، n ) حقیقت پایه پیکسل i است،پمنi = 0، 1، 2، …، n ) پیش‌بینی‌های پیکسل i و n تعداد پیکسل‌ها است.

3. آماده سازی آزمایش

مجموعه داده‌های مورد استفاده در این مطالعه از مجموعه داده‌های جاده ماساچوست و مجموعه داده‌های جاده DeepGLOBE-CVPR 2018 (مجموعه داده‌های CVPR) هستند [ 55 ، 56]. آنها از مجموعه داده های تصویری برای آموزش، اعتبار سنجی و آزمایش، همراه با نقشه های مرجع مربوطه تشکیل شده اند. مجموعه داده جاده ماساچوست شامل 1171 تصویر است. هر تصویر در این مجموعه داده 1500 × 1500 پیکسل، با وضوح مکانی 1.2 متر و مساحت پوشش 2.25 کیلومتر مربع است. مجموعه داده‌ها انواع مناطق شهری، حومه‌ای و روستایی را با مساحت کل بیش از 2600 کیلومتر مربع پوشش می‌دهد. مجموعه داده های جاده CVPR شامل 6226 تصویر ماهواره ای با اندازه 1024 × 1024 پیکسل و وضوح فضایی 50 سانتی متر است. بر این اساس، این مجموعه داده ها را می توان به مجموعه داده های جاده های روستایی، برون شهری و شهری تقسیم کرد، همانطور که در شکل 5 نشان داده شده است.
برای ایجاد آموزش، اعتبار سنجی و مجموعه داده های آزمایشی برای این آزمایش، تمام مجموعه داده های تصویر برش داده شدند و افزوده شدند. ابتدا، تصاویر و نقشه های مرجع مربوطه با چرخش تصادفی (90 درجه، 180 درجه و 270 درجه)، چرخش تصادفی افقی و عمودی و تنظیم تصادفی روشنایی (0.5-1.5) صرف شدند. سپس، آنها به طور تصادفی به 256 × 256 پیکسل برش داده شدند [ 36 ]. در نهایت، از مجموعه داده ماساچوست، 50545 تصویر به دست آوردیم که 42963 تصویر برای آموزش و 7582 تصویر برای اعتبارسنجی بود و مجموعه داده آزمایشی 49 تصویر اصلی 1500 × 1500 است. از مجموعه داده های جاده CVPR، 84000 تصویر به دست آمد که 71400 تصویر برای آموزش، 12600 تصویر برای اعتبارسنجی و مجموعه داده آزمایشی 105 تصویر اصلی 1024 × 1024 است.
ما این روش را با UNet [ 30 ]، DeepLab v3+ [ 32 ]، DenseUNet [ 40 ]، DenseUNet بهبود یافته (CDenseUNet) تنها با ماژول های توجه اصلی و DenseUNet بهبود یافته (GDenseUNet) تنها با ماژول های توجه جهانی مقایسه می کنیم.
این آزمایش بر روی یک پلت فرم محاسباتی با کارایی بالا اجرا شده است: CPU از 2 گروه Intel Xeon 5120 با 14 هسته، همراه با 128 گیگابایت حافظه کاری، GPU از 2 گروه NVIDIA P100 با 16 گیگابایت حافظه و سیستم عامل از CentOS 7 استفاده می کند. ما از باطن TensorFlow برای اجرای چارچوب یادگیری عمیق Keras استفاده کردیم. تابع Adam [ 57 ] برای بهینه سازی پارامتر استفاده می شود. هر دوره 16 تصویر را پردازش کرد. نرخ یادگیری در ابتدا 0.0001 تعیین شد و 0.02 بار در هر دوره کاهش یافت و تعداد دوره ها به 50 در نظر گرفته شد.
در این آزمایش، از دقت کلی ( OA )، دقت ، یادآوری ، اف1سجorهو تقاطع روی اتحاد ( IoU ) برای اعتبارسنجی. معادلات (5) – (9) [ 36 ، 54 ، 58 ] این معیارهای ارزیابی را توصیف می کنند:

Oآ=تیپ+تینتیپ+افپ+افن+تین
پrهجمنسمنon=تیپتیپ+افپ
آرهجآلل=تیپتیپ+افن
اف1سجorه=2تیپ2تیپ+افپ+افن
منoU=تیپتیپ+افپ+افن

که در آن، TP ، FP ، FN و TN به ترتیب نشان دهنده مثبت واقعی، مثبت کاذب، منفی کاذب و منفی واقعی هستند.

4. نتایج

4.1. یکپارچگی روسازی و همواری حاشیه جاده ها

4.1.1. مجموعه داده ماساچوست

در مجموعه داده ماساچوست، مسدود شدن جاده عمدتاً از تاج درخت کنار جاده‌های روستایی و حومه‌ای ناشی می‌شود، در حالی که تصاویر مسدود شده توسط جاده‌های شهری کم هستند. شکل 6 جاده های جزئی مسدود شده توسط سایبان درختان در مناطق روستایی (صحنه های 1-3)، جاده های جزئی مسدود شده توسط سایبان درختان در حومه شهر (صحنه های 4-5) و جاده های جزئی مسدود شده توسط ساختمان های بلند شهری در مناطق شهری را نشان می دهد. صحنه 6).
با توجه به این نتایج، CADUNet پیشنهادی در این مقاله به نتایج خوبی در راه های مسدود شده در مناطق روستایی، برون شهری و شهری دست یافته است. می توان دریافت که زمانی که جاده توسط تاج درخت و سایه های آن مسدود می شود، بین نتایج DeepLab v3+ و UNet فاصله وجود دارد. نتایج به دست آمده از CADUNet پیشنهادی نسبت به روش های دیگر به حقیقت اصلی نزدیک تر است. صافی لبه های جاده به طور قابل توجهی بهبود یافته است. UNet در صحنه های 3 و 6 خوب عمل می کند، اما در صحنه های 1، 2 و 4 ضعیف عمل می کند. DeepLab V3+ در صحنه های 1 و 3 عملکرد خوبی داشت و DenseUNet در صحنه های 3 و 5 عملکرد خوبی داشت اما در صحنه ها عملکرد خوبی نداشت. صحنه های باقی مانده در صحنه های 1 و 2 عملکرد CDenseUNet و GDenseUNet ضعیف است و عملکرد در سناریوهای دیگر بهتر است. سرانجام،
4.1.2. مجموعه داده های CVPR
شکل 7نتایج استخراج شده از مجموعه داده های جاده CVPR را با این 6 روش نشان می دهد. صحنه‌های اول و دوم شامل جاده‌هایی است که در مناطق روستایی توسط سایبان درختان مسدود شده‌اند و صحنه‌های سوم و چهارم جاده‌هایی هستند که در حومه شهر با سایبان درختان پوشیده شده‌اند. صحنه‌های پنجم و ششم، جاده‌هایی را در منطقه شهری نشان می‌دهند که توسط سایه‌های ساختمان‌های بلند پوشیده شده‌اند. روش CADUNet ما نتایج خوبی در استخراج اطلاعات راه های روستایی، برون شهری و شهری به دست آورده است. صحنه اول نشان می دهد که هنگام مواجهه با یک جاده نیمه پوشیده، نتایج به دست آمده با روش UNet بهتر از DeepLabv3+ و DenseUNet است. در صحنه های دوم و ششم، زمانی که بخشی از تاج درخت و سایه های ساختمان های مرتفع جاده را مسدود می کند، عملکرد DeepLab V3+ بهتر از UNet و DenseUNet است. DenseUNet فقط در صحنه چهارم عملکرد بهتری را نشان می دهد، در حالی که CDenseUNet فقط در صحنه های سوم و ششم بهتر عمل می کند. GDenseUNet و CADUNet بهترین نتایج را در صحنه های اول، دوم، سوم و پنجم مسدود شده توسط تاج درخت به دست آوردند. بدیهی است که مکانیسم توجه جهانی نقش آشکاری در استخراج جاده های مسدود شده توسط تاج درخت و ایجاد سایه دارد. در مجموعه داده CVPR، مکانیسم توجه جهانی نقش کلیدی در حل مشکل انسداد دارد. روش‌های دیگر به دلیل استفاده نکردن از مکانیسم توجه اصلی، تأثیرات ضعیفی بر صحنه چهارم نشان می‌دهند. بنابراین، این روش CADUNet با مکانیسم توجه دوگانه آبشاری به نتایج خوبی دست یافته است. مکانیسم توجه جهانی نقش آشکاری در استخراج جاده های مسدود شده توسط تاج درخت و ایجاد سایه دارد. در مجموعه داده CVPR، مکانیسم توجه جهانی نقش کلیدی در حل مشکل انسداد دارد. روش‌های دیگر به دلیل استفاده نکردن از مکانیسم توجه اصلی، تأثیرات ضعیفی بر صحنه چهارم نشان می‌دهند. بنابراین، این روش CADUNet با مکانیسم توجه دوگانه آبشاری به نتایج خوبی دست یافته است. مکانیسم توجه جهانی نقش آشکاری در استخراج جاده های مسدود شده توسط تاج درخت و ایجاد سایه دارد. در مجموعه داده CVPR، مکانیسم توجه جهانی نقش کلیدی در حل مشکل انسداد دارد. روش‌های دیگر به دلیل استفاده نکردن از مکانیسم توجه اصلی، تأثیرات ضعیفی بر صحنه چهارم نشان می‌دهند. بنابراین، این روش CADUNet با مکانیسم توجه دوگانه آبشاری به نتایج خوبی دست یافته است.

4.2. اتصال به شبکه جاده ای

4.2.1. مجموعه داده ماساچوست

برای مجموعه داده های جاده ماساچوست، از 6 روش برای استخراج شبکه های جاده ای پیچیده، از جمله روستایی (صحنه های 1-3 در شکل 8 )، حومه ای (صحنه های 4-5 در شکل 8 ) و شبکه های جاده ای شهری (صحنه 6 در شکل 8 ) استفاده می شود. ، و مرکز حمل و نقل (صحنه های 7-8 در شکل 8 ). از نتایج استخراج در مناطق روستایی، حومه و شهری، CADUNet در جاده های پراکنده روستایی، جاده های برون شهری و شهری مجاور پارکینگ ها عملکرد خوبی دارد. هنگام مقایسه مدل‌های دیگر، روش CADUNet نه تنها به ویژگی‌های بصری جاده بستگی دارد، بلکه با مدل‌سازی بافت جاده، توانایی استدلال خاصی نیز دارد. از شکل 8 قابل مشاهده استکه شبکه جاده ای به دست آمده توسط شبکه های UNet و Deeplab V3+ دارای نقص های آشکار است. در مقایسه با UNet و DeepLab V3+، DenseUNet بهبودهایی دارد. در مقایسه با DenseUNet استاندارد، CDenseUNet و GDenseUNet وقفه جاده را کاهش می دهند و اتصال شبکه جاده را افزایش می دهند. در مقایسه با 5 مدل قبلی، نتایج به‌دست‌آمده توسط CADUNet اتصال جاده‌ای بهتر و وقفه‌های جاده‌ای کمتری را انجام می‌دهند.
ارزیابی دقت نشان می‌دهد که OA، یادآوری، دقت، امتیاز F1 و IoU به‌دست‌آمده توسط CADUNet بالاترین میزان را دارند و به ترتیب به 98.00، 76.55، 79.45، 77.89 درصد و 64.12 درصد می‌رسند ( جدول 1 ). در مقایسه با UNet، امتیاز F1 و IoU با روش CADUNet به ترتیب 2.49% و 4.26% افزایش یافت. در مقایسه با DenseUNet استاندارد، امتیاز F1 و IoU توسط CADUNet به ترتیب 3.25% و 4.16% افزایش یافت. پس از افزودن دو ماژول توجه، نسبت تقاطع توسط CADUNet به ترتیب 3.04% و 2.21% در مقایسه با CDenseUNet و GDenseUNet افزایش یافت.
4.2.2. مجموعه داده های CVPR
همانطور که در شکل 9 نشان داده شده است ، نتایج بر اساس مجموعه داده های جاده CVPR شامل جاده های روستایی (صحنه های 1-3)، جاده های برون شهری (صحنه های 4-5) و جاده های شهری (صحنه 6) است. بهترین نتایج استخراج شده توسط CADUNet جاده های روستایی و پس از آن جاده های برون شهری و جاده های شهری هستند. مقایسه بین 6 مدل نشان می دهد که نتایج UNet و DeepLab V3+ بدترین اتصال شبکه جاده ای و ناقص بودن شدید جاده را دارند. CDenseUNet و GDenseUNet بر اساس DenseUNet پیشرفت کرده اند، اما هنوز هم کاستی های خاص خود را دارند و اتصال جاده ضعیف است. با توجه به تعبیه مکانیسم توجه دوگانه آبشاری در DenseUNet، روش CADNUnet بهترین نتایج را از نظر اتصال شبکه جاده ای به دست آورده است.
در آزمایش با مجموعه داده جاده CVPR، روش CADUNet به بالاترین دقت کلی، امتیاز F1 و IoU رسید که به ترتیب به 97.09٪، 76.28٪ و 62.08٪ رسید ( جدول 2 ). در مقایسه با UNet، فراخوان و IoU این روش به ترتیب 14/6 و 83/3 درصد افزایش یافته است. در مقایسه با Deeplab V3+، روش CADUNet IoU را 5.57 درصد افزایش می دهد. پس از افزودن دو مکانیسم توجه، روش CADUNet نسبت به DenseUNet امتیاز F1 و IoU را 1.67% و 2.11% افزایش داده است.

4.3. عملکرد از دست دادن

شکل 10 a,b منعکس کننده تغییرات تابع ضرر با دوره های مربوط به مجموعه داده های آموزشی ماساچوست و CVPR است. با افزایش دوره های آموزشی، تلفات هر 6 مدل به تدریج با افزایش دسته های آموزشی کاهش می یابد. CADUNet پیشنهاد شده در این مقاله نرخ نزولی بهتری را در تابع ضرر نسبت به UNet، DeepLab V3+، CDenseUNet و GDenseUNet نشان می‌دهد. UNet و DeepLab V3+ بدترین عملکرد را داشتند. شکل 6 c,d تغییرات در تابع ضرر مربوط به دوره های آموزشی در مجموعه داده های اعتبارسنجی ماساچوست و CVPR را نشان می دهد. CADUNet پیشنهاد شده در این مقاله دارای کمترین مقدار تلفات تایید شده در دو مجموعه داده است، یعنی نتیجه به‌دست‌آمده از روش نزدیک‌ترین به حقیقت است. پس از 25 دوره CADUNet، مدل تمایل به پایداری دارد.

5. بحث

در نتایج استخراج جاده از تصاویر VHR، اثر انسداد تاج درخت و ساختمان های بلند در کنار جاده اغلب منجر به ناقص بودن سطح جاده و حتی قطع شدن شبکه راه می شود. به عنوان چارچوب اصلی CADUNet پیشنهادی، شبکه تقسیم‌بندی معنایی DenseUNet در استفاده از ویژگی‌های عمیق تصویر، اجتناب از پراکندگی گرادیان و آموزش آسان شبکه به خوبی عمل می‌کند. عملکرد استفاده مجدد از ویژگی آن می تواند تضمین کند که بیشترین اطلاعات جاده بین لایه های شبکه حفظ می شود و در نتیجه اتصال شبکه جاده استخراج شده را بهبود می بخشد. بنابراین، پایه محکمی برای استخراج اطلاعات جاده ای ایجاد می کند. علاوه بر این، ماژول توجه جهانی که به مدل DenseUNet اضافه کرده‌ایم می‌تواند اطلاعات زمینه جهانی را از نقشه ویژگی جاده افزایش دهد، در نتیجه قطع جاده ناشی از انسداد تاج درخت و سایه‌های ساختمان را تا حدی کاهش می‌دهد و یکپارچگی جاده به طور قابل توجهی بهبود می‌یابد. ما ماژول توجه اصلی را به مدل DenseUNet اضافه کردیم تا ویژگی‌های سطح پایین بیشتری را در نقشه ویژگی‌های سطح بالا ترکیب کنیم، تا اطمینان حاصل کنیم که اطلاعات جاده‌ها به بیشترین میزان در بلوک‌های متراکم در شبکه منتقل می‌شود و بیشتر به جهانی کمک می‌کند. ماژول توجه برای به دست آوردن اطلاعات بیشتر جاده در قسمت رمزگذاری. این ماژول اتصال شبکه جاده را بهبود می بخشد و در عین حال یکپارچگی سطح جاده و صافی خطوط کناری در قسمت رمزگشایی را بازیابی می کند. در نتیجه قطعی جاده ناشی از انسداد تاج درختان و سایه های ساختمان تا حدی کاهش می یابد و یکپارچگی جاده به طور قابل توجهی بهبود می یابد. ما ماژول توجه اصلی را به مدل DenseUNet اضافه کردیم تا ویژگی‌های سطح پایین بیشتری را در نقشه ویژگی‌های سطح بالا ترکیب کنیم، تا اطمینان حاصل کنیم که اطلاعات جاده‌ها به بیشترین میزان در بلوک‌های متراکم در شبکه منتقل می‌شود و بیشتر به جهانی کمک می‌کند. ماژول توجه برای به دست آوردن اطلاعات بیشتر جاده در قسمت رمزگذاری. این ماژول اتصال شبکه جاده را بهبود می بخشد و در عین حال یکپارچگی سطح جاده و صافی خطوط کناری در قسمت رمزگشایی را بازیابی می کند. در نتیجه قطعی جاده ناشی از انسداد تاج درختان و سایه های ساختمان تا حدی کاهش می یابد و یکپارچگی جاده به طور قابل توجهی بهبود می یابد. ما ماژول توجه اصلی را به مدل DenseUNet اضافه کردیم تا ویژگی‌های سطح پایین بیشتری را در نقشه ویژگی‌های سطح بالا ترکیب کنیم، تا اطمینان حاصل کنیم که اطلاعات جاده‌ها به بیشترین میزان در بلوک‌های متراکم در شبکه منتقل می‌شود و بیشتر به جهانی کمک می‌کند. ماژول توجه برای به دست آوردن اطلاعات بیشتر جاده در قسمت رمزگذاری. این ماژول اتصال شبکه جاده را بهبود می بخشد و در عین حال یکپارچگی سطح جاده و صافی خطوط کناری در قسمت رمزگشایی را بازیابی می کند. ما ماژول توجه اصلی را به مدل DenseUNet اضافه کردیم تا ویژگی‌های سطح پایین بیشتری را در نقشه ویژگی‌های سطح بالا ترکیب کنیم، تا اطمینان حاصل کنیم که اطلاعات جاده‌ها به بیشترین میزان در بلوک‌های متراکم در شبکه منتقل می‌شود و بیشتر به جهانی کمک می‌کند. ماژول توجه برای به دست آوردن اطلاعات بیشتر جاده در قسمت رمزگذاری. این ماژول اتصال شبکه جاده را بهبود می بخشد و در عین حال یکپارچگی سطح جاده و صافی خطوط کناری در قسمت رمزگشایی را بازیابی می کند. ما ماژول توجه اصلی را به مدل DenseUNet اضافه کردیم تا ویژگی‌های سطح پایین بیشتری را در نقشه ویژگی‌های سطح بالا ترکیب کنیم تا اطمینان حاصل کنیم که اطلاعات جاده‌ها به بیشترین میزان در بلوک‌های متراکم در شبکه منتقل می‌شود و بیشتر به جهانی کمک می‌کند. ماژول توجه برای به دست آوردن اطلاعات بیشتر جاده در قسمت رمزگذاری. این ماژول اتصال شبکه جاده را بهبود می بخشد و در عین حال یکپارچگی سطح جاده و صافی خطوط کناری در قسمت رمزگشایی را بازیابی می کند.
شکل 11نتایج ارزیابی دقت شش مثال را با استفاده از مجموع شش مدل در مجموعه داده ماساچوست نشان می‌دهد، جایی که مناطق سبز، قرمز و آبی به ترتیب نشان‌دهنده TP، FP و FN هستند. خط اول در شکل تصویری با یک جاده حلقه و نتایج استخراج آن را نشان می دهد. فقط مدل‌های CDenseUNet و CADUNet با مکانیسم توجه مرکزی بیشترین وسعت TP و کمترین مساحت FP و FN را دارند و حلقه نسبتاً کامل است. این نشان می دهد که مکانیسم توجه اصلی کمبود مکانیسم توجه جهانی را تا حدودی جبران می کند. ردیف دوم نتیجه استخراج جاده ای را نشان می دهد که توسط راه آهن مرتفع محافظت می شود. از این پانل‌ها می‌توان دریافت که استفاده از مدل‌های CDenseUNet، GDenseUNet و CADUNet می‌تواند جاده‌های محدودی را که توسط راه‌آهن محافظت می‌شوند استخراج کند. این نشان دهنده برتری هسته و ماژول های توجه جهانی است. CADUNet به دلیل استفاده از دو ماژول توجه آبشاری بیشترین ناحیه TP و کمترین ناحیه FP و FN را دارد. ردیف سوم نتیجه استخراج یک تصویر را با تقاطع جاده اصلی و جاده فرعی نشان می دهد. با UNet و مدل DeepLab V3+، فقط جاده اصلی قابل شناسایی است. بر اساس مدل های DenseUNet، CDenseUNet و CADUNet، کیفیت استخراج بهتر از سه مدل دیگر است. مدل CADUNet به بزرگترین مناطق TP و کوچکترین مناطق FP و FN دست می یابد که مزیت مکانیسم توجه آبشاری را نشان می دهد. ردیف چهارم نتایج استخراج جاده هایی را نشان می دهد که توسط سایبان های متراکم درختان در کنار جاده مسدود شده اند. مدل های CDenseUNet، GDenseUNet و CADUNet نتایج خوبی به دست آوردند. مکانیسم توجه دوگانه ادغام شده در مدل CADUNet می تواند مشکل مسدود شدن جاده ها توسط تاج درخت را حل کند. از پانل های ردیف 5 می توان فهمید که تمام شش مدل فوق می توانند جاده اصلی را شناسایی کنند اما نمی توانند جاده فرعی متصل به خانه های مسکونی را شناسایی کنند. در مجموعه داده ماساچوست، مجموعه داده برچسب‌گذاری شده معمولاً چنین جاده‌های کوچکی را شامل نمی‌شود، به طوری که در شش مدل شبکه هنگام یادگیری نادیده گرفته می‌شوند. بنابراین، خطا به دلیل ناهماهنگی داده‌های برچسب‌گذاری و مجموعه داده برچسب‌گذاری کلی است. ردیف 6 مربوط به تصویری با منطقه تقاطع جاده اصلی و فرعی است. در نتایج استخراج، مدل‌های DeepLab V3+ و DenseUNet نتایج ضعیفی ارائه می‌دهند، در حالی که جاده‌های کوچک شناسایی نمی‌شوند. با این حال، جاده اصلی و یکی از جاده های فرعی را می توان با استفاده از CDenseUNet به خوبی شناسایی کرد. مدل های GDenseUNet و CADUNet و بیشترین ناحیه TP و کمترین مناطق FP و FN را می توان با مدل CADUNet به دست آورد. در همان زمان، هر شش مدل هنوز یکی از جاده‌های کوچک برچسب‌گذاری شده در مجموعه داده ارزیابی را از دست دادند. اگرچه جاده فرعی در داده‌های ارزیابی برچسب‌گذاری شده است، ویژگی‌های آن به‌عنوان جاده مشخص نیست، که تشخیص آن را برای شش مدل دشوار می‌کند.
شکل 12نتایج ارزیابی دقت شش نمونه استخراج جاده را با استفاده از مجموع شش مدل در مجموعه داده CVPR نشان می دهد، و تعاریف رنگ با موارد فوق مطابقت دارد. تابلوهای ردیف اول تصویری را با تقاطع جاده اصلی و جاده های فرعی آن در مناطق روستایی نشان می دهد. این 6 مدل صرفاً جاده اصلی را استخراج می کنند، اما نه جاده فرعی را که به مجموعه داده برچسب گذاری مربوط می شود. در مجموعه داده برچسب‌گذاری، تنها بخش کوچکی از جاده‌های این نوع برچسب‌گذاری شده‌اند و بیشتر آنها برچسب‌گذاری نشده‌اند. در نتیجه، این مدل های یادگیری عمیق را نمی توان برای تشخیص جاده های فرعی از این نوع استفاده کرد. تابلوهای خط دوم جاده روستایی را نشان می دهد که درختان در آن سایه انداخته اند. برای این نوع تصویر با جاده های روستایی، مدل های DenseUNet، CDenseUNet، GDenseUNet و CADUNet نتایج خوبی به دست آورده اند. به دست آوردن مناطق TP بیشتر و مناطق FP و FN کمتر، که اثربخشی DenseUNet را به عنوان پایه این شبکه ها و مکانیسم های توجه دوگانه در استخراج جاده ها را برجسته می کند. برای تصویر با جاده های موازی نشان داده شده در ردیف سوم، مدل CADUNet به خوبی عمل می کند و بیشترین ناحیه TP و کمترین ناحیه FP و FN را به دست می آورد که نشان دهنده برتری مکانیسم توجه آبشاری است. با این حال، هنوز یک شکاف بین این نتیجه استخراج و مجموعه داده برچسب‌گذاری شده وجود دارد، زیرا یکی از جاده‌های موازی از داده‌های برچسب‌گذاری حذف شده است. تصاویر در ردیف چهارم، منطقه تقاطع دو جاده را نشان می دهد که با اثر مسدود کننده سایبان کنار جاده همراه است. برای این تصویر، مدل CADUNet به مناطق TP بیشتر و کمترین مناطق FP و FN دست یافت و بهترین اثر تشخیص را به دست آورد. بنابراین منعکس کننده مزایای مکانیسم توجه آبشاری است. ردیف پنجم و ششم تصویر یک جاده منحنی و اثر استخراج آن در یک منطقه شهری را منعکس می کند و بخشی از جاده به وضوح توسط سایه ساختمان ها مسدود شده است. نتایج خوب تنها از طریق مدل‌های CDenseUNet و CADUNet به دست آمد و نتایج از طریق چهار مدل دیگر نسبتا ضعیف است، که نشان می‌دهد مکانیسم توجه اصلی نقش مهمی در استخراج این نوع جاده دارد.

6. نتیجه گیری

در این مطالعه، ما یک مدل CADUNet ابتکاری را بر اساس چارچوب DenseUNet برای حل مشکلات سطح جاده ناقص، حاشیه‌های ناهموار و اتصال ضعیف شبکه جاده‌ای به دلیل تاج درخت کنار جاده در تصاویر HRV پیشنهاد کردیم. ما ماژول های توجه جهانی را برای به دست آوردن اطلاعات جهانی جاده اضافه کردیم و ماژول های توجه اصلی را معرفی کردیم تا اطمینان حاصل کنیم که اطلاعات جاده به بیشترین میزان در بین لایه های مختلف شبکه در محدوده های متراکم منتقل می شود. این مدل می‌تواند اطلاعات جاده‌ای بیشتری را از مکان‌های مختلف استخراج کند تا یکپارچگی جاده را بهبود بخشد و استحکام استخراج ویژگی را در زیر تاج درختان و سایه‌های ساختمان‌های بلند شهری افزایش دهد. در نهایت، یک تابع از دست دادن تطبیقی ​​برای متعادل کردن نسبت مناطق جاده به مناطق غیر جاده ای در نمونه های آموزشی معرفی شد. این مقاله از مجموعه داده ماساچوست و مجموعه داده DeepGLOBE-CVPR 2018 برای آزمایش های مقایسه ای استفاده کرد. نتایج نشان داد که مدل CADUNet در استخراج جاده از تصاویر VHR دلگرم کننده تر است.
اگرچه مدل شبکه ما به عملکرد خوبی دست یافته است، اما هنوز برای مشکلات تقسیم بندی معنایی ناکافی و بیش از حد جاده ها در مورد صاف بودن حاشیه، وقفه و اتصال شبکه جاده ها جا برای بهبود وجود دارد. علاوه بر این، انتظار می‌رود که کیفیت مجموعه داده‌های برچسب در ادامه کار بیشتر بهبود یابد.

منابع

  1. ژانگ، YY; ژانگ، جی پی؛ لی، تی. Sun، K. استخراج جاده و تشخیص تقاطع بر اساس رای گیری تانسور. در مجموعه مقالات سمپوزیوم بین المللی علوم زمین و سنجش از دور IEEE 2016 (IGARSS)، پکن، چین، 10 تا 15 ژوئیه 2016؛ صفحات 1587-1590. [ Google Scholar ]
  2. Frizzle, BG; Evenson، KR; رودریگز، DA; Laraia، BA اهمیت داده های دقیق جاده برای کاربردهای فضایی در بهداشت عمومی: سفارشی کردن یک شبکه جاده. بین المللی J. Health Geogr. 2009 ، 8 ، 24. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  3. لی، دی. دنگ، ال. کای، ز. فرانک، بی. Yao, X. سیستم حمل و نقل هوشمند در ماکائو بر اساس یادگیری عمیق خود کدگذاری. IEEE Trans. Ind. اطلاع رسانی. 2018 ، 14 ، 3253-3260. [ Google Scholar ] [ CrossRef ]
  4. کورترای، ال. Lefevre، S. فیلتر کردن مسیر مورفولوژیکی در مقیاس منطقه برای استخراج شبکه جاده ای کارآمد و قوی از تصاویر ماهواره ای. تشخیص الگو Lett. 2016 ، 83 ، 195-204. [ Google Scholar ] [ CrossRef ]
  5. عبدالهی، ع. پرادان، بی. شوکلا، ن. چاکرابورتی، اس. Alamri، A. رویکردهای یادگیری عمیق به کار گرفته شده در مجموعه داده های سنجش از راه دور برای استخراج جاده: یک بررسی پیشرفته. Remote Sens. 2020 , 12 , 1444. [ Google Scholar ] [ CrossRef ]
  6. منا، JB وضعیت هنر در استخراج خودکار جاده برای به روز رسانی GIS: یک طبقه بندی جدید. تشخیص الگو Lett. 2003 ، 24 ، 3037-3058. [ Google Scholar ] [ CrossRef ]
  7. داس، اس. میرنالینی، تی تی; Varghese, K. استفاده از ویژگی های برجسته برای طراحی یک چارچوب چند مرحله ای برای استخراج جاده ها از تصاویر ماهواره ای چندطیفی با وضوح بالا. IEEE Trans. Geosci. Remote Sens. 2011 , 49 , 3906–3931. [ Google Scholar ] [ CrossRef ]
  8. چاودهری، دی. کوشواها، NK; سمال، الف. تشخیص جاده نیمه خودکار از تصاویر ماهواره ای با وضوح بالا با تکنیک های تقویت مورفولوژیک جهت دار و بخش بندی. IEEE J. Sel. بالا. Appl. زمین Obs. Remote Sens. 2012 ، 5 ، 1538-1544. [ Google Scholar ] [ CrossRef ]
  9. وان، ی. وانگ، ک. مینگ، دی. استخراج جاده از تصاویر سنجش از دور با وضوح بالا بر اساس ویژگی‌های طیفی و شکل. در MIPPR 2009: هدف خودکار. تشخیص و تجزیه و تحلیل تصویر ; SPIE: Bellingham, WA, USA, 2009; جلد 7495، ص 74953R-74951–74953R-74956. [ Google Scholar ] [ CrossRef ]
  10. گائتانو، آر. زروبیا، ج. اسکارپا، جی. پوگی، جی. تقسیم بندی مورفولوژیکی جاده در مناطق شهری از تصاویر ماهواره ای با وضوح بالا. در مجموعه مقالات 2011 هفدهمین کنفرانس بین المللی پردازش سیگنال دیجیتال (DSP)، کورفو، یونان، 6-8 ژوئیه 2011; صص 1-8. [ Google Scholar ]
  11. میرنالینی، تی تی; داس، اس. Varghese, K. چارچوب چند مرحله ای یکپارچه برای استخراج خودکار جاده از تصاویر ماهواره ای با وضوح بالا. J. شرکت هندی Remote 2011 , 39 , 1-25. [ Google Scholar ] [ CrossRef ]
  12. Miao، ZL; شی، WZ; گامبا، پی. Li، ZB یک روش مبتنی بر شی برای استخراج شبکه جاده در تصاویر ماهواره ای VHR. IEEE J. Sel. بالا. Appl. زمین Obs. Remote Sens. 2015 , 8 , 4853–4862. [ Google Scholar ] [ CrossRef ]
  13. لی، MM; استین، ا. بیکر، دبلیو. Zhan، استخراج جاده شهری مبتنی بر منطقه QM از تصاویر ماهواره ای VHR با استفاده از درخت پارتیشن باینری. بین المللی J. Appl. زمین Obs. Geoinf. 2016 ، 44 ، 217-225. [ Google Scholar ] [ CrossRef ]
  14. شانموگام، ال. Kaliaperumal, V. Jonction-Aware Flow Approach for Urban Road Extraction Network. فرآیند تصویر IET 2016 ، 10 ، 227-234. [ Google Scholar ] [ CrossRef ]
  15. بوسلایف، آ. سفربکوف، اس. ایگلوویکوف، وی. Shvets، A. شبکه کاملاً پیچیده برای استخراج خودکار جاده از تصاویر ماهواره ای. در مجموعه مقالات کنفرانس IEEE/CVF 2018 در کارگاه های آموزشی بینایی و تشخیص الگوی کامپیوتری (CVPRW)، سالت لیک سیتی، UT، ایالات متحده آمریکا، 18 تا 22 ژوئن 2018؛ صفحات 197-1973. [ Google Scholar ]
  16. ژو، ال سی. ژانگ، سی. Wu, M. D-LinkNet: لینک نت با رمزگذار از پیش آموزش دیده و پیچش گشاد شده برای استخراج جاده تصاویر ماهواره ای با وضوح بالا. در مجموعه مقالات کنفرانس IEEE/CVF 2018 در کارگاه های آموزشی بینایی و تشخیص الگوی کامپیوتری (CVPRW)، سالت لیک سیتی، UT، ایالات متحده آمریکا، 18 تا 22 ژوئن 2018؛ صفحات 192-1924. [ Google Scholar ]
  17. گائو، ال. آهنگ، دبلیو. دای، جی. Chen, Y. استخراج جاده از تصاویر سنجش از دور با وضوح بالا با استفاده از شبکه عصبی پیچیده باقیمانده عمیق. Remote Sens. 2019 , 11 , 552. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  18. Blaschke، T. تجزیه و تحلیل تصویر مبتنی بر شی برای سنجش از راه دور. ISPRS J. Photogramm. Remote Sens. 2010 , 65 , 2-16. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  19. چن، ام جی. سویی، دبلیو. لی، ال. ژانگ، سی. یو، AZ; Li، HX مقایسه طبقه بندی مبتنی بر پیکسل و شی گرا با استفاده از تصاویر SPOT5. در مجموعه مقالات سیزدهمین کنفرانس بین المللی WSEAS در ریاضیات کاربردی، پورتو د لا کروز، اسپانیا، 14-16 دسامبر 2008. صص 321-326. [ Google Scholar ]
  20. هوانگ، ایکس. Zhang، استخراج خط مرکزی جاده LP از تصاویر با وضوح بالا بر اساس ویژگی‌های ساختاری چند مقیاسی و ماشین‌های بردار پشتیبانی. بین المللی J. Remote Sens. 2009 ، 30 ، 1977-1987. [ Google Scholar ] [ CrossRef ]
  21. شی، WZ; میائو، ز. Debayle, J. یک روش یکپارچه برای استخراج خط مرکزی جاده اصلی شهری از تصاویر سنجش از دور نوری. IEEE Trans. Geosci. Remote Sens. 2014 , 52 , 3359–3372. [ Google Scholar ] [ CrossRef ]
  22. هوانگ، ZJ; خو، FJ; لو، ال. نه، فیلدهای تصادفی شرطی مبتنی بر شی HS برای استخراج جاده از تصویر سنجش از دور. Iop Conf. سر. محیط زمین. علمی 2014 , 17 , 012276. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  23. معبودی، م. امینی، ج. ملیحی، س. هان، ام. ادغام تجزیه و تحلیل تصویر مبتنی بر شی فازی و بهینه‌سازی کلنی مورچه‌ها برای استخراج جاده از تصاویر سنجش از راه دور. ISPRS J. Photogramm. Remote Sens. 2018 , 138 , 151–163. [ Google Scholar ] [ CrossRef ]
  24. لو، XY; ژونگ، YF؛ ژنگ، ز. لیو، YF; ژائو، جی. Ma، AL; یانگ، جی. چارچوب یادگیری عمیق چندمقیاس و چند وظیفه ای برای استخراج خودکار جاده. IEEE Trans. Geosci. Remote Sens. 2019 , 57 , 9362–9377. [ Google Scholar ] [ CrossRef ]
  25. لیان، آر. Huang, L. DeepWindow: پنجره کشویی بر اساس یادگیری عمیق برای استخراج جاده از تصاویر سنجش از راه دور. IEEE J. Sel. بالا. Appl. زمین Obs. Remote Sens. 2020 , 13 , 1905–1916. [ Google Scholar ] [ CrossRef ]
  26. لیو، YF; ژونگ، YF؛ Qin، طبقه بندی صحنه QQ بر اساس شبکه عصبی کانولوشن چند مقیاسی. IEEE Trans. Geosci. Remote Sens. 2018 , 56 , 7109–7121. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  27. زو، QQ; ژونگ، YF؛ ژانگ، LP; چارچوب مدل‌سازی معنایی تطبیقی ​​عمیق پراکنده لی، DR برای طبقه‌بندی صحنه تصویر با وضوح فضایی بالا. IEEE Trans. Geosci. Remote Sens. 2018 , 56 , 6180–6195. [ Google Scholar ] [ CrossRef ]
  28. ژانگ، ی. شیا، دبلیو. ژانگ، YZ; Sun، SK; Sang، LZ Road Extraction از چند منبع تصویر سنجش از دور با وضوح بالا با استفاده از شبکه عصبی کانولوشن. در مجموعه مقالات کنفرانس بین المللی پردازش صدا، زبان و تصویر 2018 (ICALIP)، شانگهای، چین، 16 تا 17 ژوئیه 2018؛ ص 201-204. [ Google Scholar ]
  29. لانگ، جی. شلهامر، ای. دارل، تی. شبکه های کاملاً پیچیده برای تقسیم بندی معنایی. در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو (CVPR)، بوستون، MA، ایالات متحده آمریکا، 7 تا 12 ژوئن 2015. صص 3431–3440. [ Google Scholar ]
  30. رونبرگر، او. فیشر، پی. Brox، T. U-Net: شبکه های کانولوشن برای تقسیم بندی تصویر زیست پزشکی. در مجموعه مقالات محاسبات تصویر پزشکی و مداخله به کمک کامپیوتر – MICCAI 2015، مونیخ، آلمان، 5 تا 9 اکتبر 2015. صص 234-241. [ Google Scholar ]
  31. بدرینارایانان، وی. کندال، ا. Cipolla، R. SegNet: معماری رمزگذار-رمزگشای پیچیده پیچیده برای تقسیم بندی تصویر. IEEE Trans. الگوی مقعدی ماخ Intel 2017 , 39 , 2481–2495 . [ Google Scholar ] [ CrossRef ] [ PubMed ]
  32. چن، L.-C.; زو، ی. پاپاندرو، جی. شروف، اف. آدام، اچ. رمزگذار-رمزگشا با پیچیدگی قابل جداسازی آتروس برای تقسیم بندی تصویر معنایی. در مجموعه مقالات کنفرانس اروپایی بینایی کامپیوتر (ECCV)، مونیخ، آلمان، 8 تا 14 سپتامبر 2018. [ Google Scholar ]
  33. ژانگ، ZX; لیو، کیو جی. Wang، YH Road Extraction توسط Deep Residual U-Net. IEEE Geosci. سنسور از راه دور Lett. 2018 ، 15 ، 749-753. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  34. رضایی، م. Zhang، Y. تشخیص جاده با استفاده از شبکه عصبی عمیق در تصاویر با وضوح فضایی بالا. در مجموعه مقالات رویداد مشترک سنجش از دور شهری 2017 (JURSE)، دبی، امارات متحده عربی، 6 تا 8 مارس 2017؛ صص 1-4. [ Google Scholar ]
  35. چنگ، جی ال. وانگ، ی. Xu، SB; وانگ، HZ; شیانگ، اس ام. Pan، CH خودکار تشخیص جاده و استخراج خط مرکزی از طریق شبکه عصبی کانولوشن انتها به انتها آبشاری. IEEE Trans. Geosci. Remote Sens. 2017 , 55 , 3322–3337. [ Google Scholar ] [ CrossRef ]
  36. تائو، سی. چی، جی. لی، ی. وانگ، اچ. لی، اچ. شبکه استنتاج اطلاعات فضایی: استخراج جاده با استفاده از اطلاعات زمینه‌ای خاص جاده. ISPRS J. Photogramm. Remote Sens. 2019 ، 158 ، 155–166. [ Google Scholar ] [ CrossRef ]
  37. Li، YX; پنگ، بی. او، ال. فن، KL; Li، ZX; Tong, L. استخراج جاده از تصاویر سنجش از دور وسایل نقلیه هوایی بدون سرنشین بر اساس شبکه های عصبی بهبود یافته. Sensors 2019 , 19 , 4115. [ Google Scholar ] [ CrossRef ] [ PubMed ][ نسخه سبز ]
  38. یانگ، XF; لی، XT; بله، YM; لاو، RYK؛ ژانگ، XF; Huang، XH Road Detection و استخراج خط مرکزی از طریق U-Net شبکه عصبی پیچیده بازگشتی عمیق. IEEE Trans. Geosci. Remote Sens. 2019 , 57 , 7209–7220. [ Google Scholar ] [ CrossRef ]
  39. عبدالهی، ع. پرادان، بی. Alamri، A. VNet: یک شبکه عصبی کاملاً کانولوشنال سرتاسر برای استخراج جاده از داده‌های سنجش از دور با وضوح بالا. دسترسی IEEE 2020 ، 8 ، 179424–179436. [ Google Scholar ] [ CrossRef ]
  40. شین، جی. ژانگ، ایکس. ژانگ، ز. Fang, W. استخراج از راه دور تصاویر سنجش از دور با وضوح بالا برگرفته از DenseUNet. Remote Sens. 2019 , 11 , 2499. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  41. Wegner، JD; Montoya-Zegarra، JA; شیندلر، کی. یک مدل CRF با مرتبه بالاتر برای استخراج شبکه جاده ای. در مجموعه مقالات کنفرانس IEEE 2013 در مورد بینایی کامپیوتری و تشخیص الگو (CVPR)، پورتلند، OR، ایالات متحده آمریکا، 23 تا 28 ژوئن 2013. صفحات 1698-1705. [ Google Scholar ]
  42. چن، ال. زو، س. Xie، X. متعجب.؛ Zeng, H. استخراج جاده از تصاویر سنجش از دور VHR از طریق تقسیم بندی شیء محدود شده توسط ویژگی های گابور. ISPRS Int. J. Geo-Inf. 2018 ، 7 ، 362. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  43. لای، آر. Li، YX; Guan، JT; Xiong، A. توجه بصری چند مقیاسی شبکه عصبی کانولوشن عمیق برای تلفیق تصویر چند کانونی. دسترسی IEEE 2019 ، 7 ، 114385–114399. [ Google Scholar ] [ CrossRef ]
  44. وی، ز. آهنگ، اچ. چن، ال. لی، کیو. هان، جی. شبکه DenseUnet مبتنی بر توجه با آموزش خصمانه برای تقسیم بندی ضایعات پوستی. دسترسی IEEE 2019 ، 7 ، 136616–136629. [ Google Scholar ] [ CrossRef ]
  45. هو، اچ جی; لی، ز. لی، ال. یانگ، اچ. زو، طبقه‌بندی HH از تصاویر سنجش از دور با وضوح بسیار بالا با استفاده از یک شبکه کاملاً کانولوشنال با بهبود اطلاعات زمینه‌ای جهانی و محلی. دسترسی IEEE 2020 ، 8 ، 14606–14619. [ Google Scholar ] [ CrossRef ]
  46. منیح، وی. هیس، ن. گریوز، ا. Kavukcuoglu، K. مدل های تکرارشونده توجه بصری. Adv. عصبی Inf. 2014 ، 27 ، 2204-2212. [ Google Scholar ]
  47. ژائو، اچ اس. شی، جی پی؛ Qi، XJ; وانگ، XG; جیا، شبکه تجزیه و تحلیل صحنه هرمی JY. در مجموعه مقالات کنفرانس IEEE 2017 در مورد دید رایانه و تشخیص الگو (CVPR)، هونولولو، HI، ایالات متحده آمریکا، 21 تا 26 ژوئیه 2017؛ صص 6230–6239. [ Google Scholar ]
  48. جتلی، اس. لی، ن. تور، پی. گلودتز، اس. یاد بگیرید که توجه کنید. در مجموعه مقالات ICLR 2018، ونکوور، BC، کانادا، 30 آوریل تا 3 مه 2018. [ Google Scholar ]
  49. بله، ZR; فو، YY; گان، من؛ دنگ، JS; کامبر، ا. وانگ، ک. استخراج ساختمان از تصاویر هوایی با وضوح بسیار بالا با استفاده از شبکه عصبی عمیق توجه مشترک. Remote Sens. 2019 , 11 , 2970. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  50. جین، X.-B. ژنگ، W.-Z. کنگ، جی.-ال. وانگ، X.-Y.; بای، Y.-T. سو، تی.-ال. Lin, S. روش پیش‌بینی یادگیری عمیق برای بار توان الکتریکی از طریق رمزگذار-رمزگر مبتنی بر توجه با بهینه‌سازی بیزی. Energies 2021 , 14 , 1596. [ Google Scholar ] [ CrossRef ]
  51. اوکتای، او. شلمپر، جی. Folgoc، LL; لی، ام. هاینریش، ام. میساوا، ک. موری، ک. مک دونا، اس. هامرلا، نیویورک؛ Kainz، B. توجه U-Net: یادگیری محل جستجوی پانکراس. در مجموعه مقالات اولین کنفرانس تصویربرداری پزشکی با یادگیری عمیق (MIDL 2018)، آمستردام، هلند، 4 تا 6 ژوئیه 2018. [ Google Scholar ]
  52. هوانگ، جی. لیو، ز. ون در ماتن، ال. واینبرگر، شبکه‌های کانولوشن با اتصال متراکم KQ. در مجموعه مقالات کنفرانس IEEE 2017 در مورد دید رایانه و تشخیص الگو (CVPR)، هونولولو، HI، ایالات متحده آمریکا، 21 تا 26 ژوئیه 2017؛ صص 2261-2269. [ Google Scholar ]
  53. ما، YD; لیو، کیو. تقسیم بندی خودکار تصویر Qian، ZB با استفاده از مدل PCNN بهبود یافته بر اساس آنتروپی متقابل. در مجموعه مقالات سمپوزیوم بین المللی 2004 در چند رسانه ای هوشمند، ویدئو و پردازش گفتار، هنگ کنگ، 20 تا 22 اکتبر 2004. صص 743-746. [ Google Scholar ]
  54. ژو، ام. سویی، اچ. چن، اس. وانگ، جی. Chen, X. BT-RoadNet: یک شبکه عصبی مرزی و آگاه از توپولوژی برای استخراج جاده از تصاویر سنجش از دور با وضوح بالا. ISPRS J. Photogramm. Remote Sens. 2020 , 168 , 288–306. [ Google Scholar ] [ CrossRef ]
  55. منیح، وی. هینتون، جنرال الکتریک یادگیری تشخیص جاده ها در تصاویر هوایی با وضوح بالا. In Proceedings of the Computer Vision–ECCV 2010، کرت، یونان، 5-11 سپتامبر 2010. صص 210-223. [ Google Scholar ]
  56. دمیر، آی. کوپرسکی، ک. لیندنباوم، دی. پانگ، جی. هوانگ، جی. باست، اس. هیوز، اف. تویا، دی. Raskar, R. DeepGlobe 2018: چالشی برای تجزیه زمین از طریق تصاویر ماهواره ای. در مجموعه مقالات کنفرانس IEEE/CVF 2018 در کارگاه های آموزشی بینایی و تشخیص الگوی کامپیوتری (CVPRW)، سالت لیک سیتی، UT، ایالات متحده آمریکا، 18 تا 22 ژوئن 2018؛ صص 172-181. [ Google Scholar ]
  57. کینگما، دی. با، جی. آدام: روشی برای بهینه سازی تصادفی. در مجموعه مقالات ICLR 2015، سن دیگو، کالیفرنیا، ایالات متحده آمریکا، 5 تا 8 مه 2015. [ Google Scholar ]
  58. او، اچ. یانگ، دی اف. وانگ، SC; وانگ، سی. استخراج جاده لی، YF با استفاده از ادغام هرم فضایی آتروس یکپارچه شبکه رمزگذار-رمزگشا و از دست دادن تشابه ساختاری. Remote Sens. 2019 , 11 , 1015. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
شکل 1. معماری CADUNet (پارامترها عبارتند از: k ، اندازه هسته، n ، تعداد کانال های خروجی، s ، اندازه گام، p ، اندازه بالشتک).
شکل 2. ساختار بلوک متراکم.
شکل 3. ماژول توجه اصلی.
شکل 4. ماژول توجه جهانی (FC به معنای یک لایه کاملا متصل است).
شکل 5. تصاویر معمولی با جاده ها در مناطق روستایی، حومه ای و شهری در مجموعه داده جاده های ماساچوست. الف ) راههای روستایی؛ ب ) جاده های برون شهری ؛ ج ) جاده های شهری.
شکل 6. یکپارچگی روسازی و صافی حاشیه جاده های استخراج شده در مجموعه داده ماساچوست. ( 1 – 3 ) جاده های جزئی مسدود شده توسط سایبان درختان در مناطق روستایی. ( 4 , 5 ) جاده های جزئی مسدود شده توسط سایبان درختان در حومه شهر. ( 6 ) جاده های جزئی مسدود شده توسط ساختمان های بلند شهری در مناطق شهری.
شکل 7. یکپارچگی روسازی و صافی حاشیه جاده های استخراج شده در مجموعه داده CVPR. ( 1 , 2 ) جاده های جزئی مسدود شده توسط سایبان درختان در مناطق روستایی. ( 3 , 4 ) جاده های جزئی مسدود شده توسط سایبان درختان در حومه شهر. ( 5 ، 6 ) جاده های جزئی مسدود شده توسط ساختمان های بلند شهری در مناطق شهری.
شکل 8. اتصال شبکه های جاده ای استخراج شده از مجموعه داده های جاده های ماساچوست. ( 1 – 3 ) راههای روستایی; ( 4 , 5 ) جاده های برون شهری; ( 6 ) راههای شهری; ( 7 , 8 ) جاده های مرکز حمل و نقل.
شکل 9. اتصال شبکه های جاده ای استخراج شده از مجموعه داده های جاده های CVPR. ( 1 – 3 ) راههای روستایی; ( 4 , 5 ) جاده های برون شهری; ( 6 ) راههای شهری.
شکل 10. آموزش و اعتبارسنجی منحنی ها.
شکل 11. ارزیابی دقت بصری استخراج جاده بر اساس مجموعه داده ماساچوست. ( 1 ) جاده حلقه; ( 2 ) جاده ای که توسط راه آهن مرتفع محافظت شده است. ( 3 ) تقاطع راه اصلی و جاده فرعی. ( 4 ) جاده ای که توسط سایبان های انبوه درختان در کنار جاده مسدود شده است. ( 5 ) جاده فرعی متصل به منازل مسکونی. ( 6 ) منطقه تقاطع جاده اصلی و فرعی.
شکل 12. ارزیابی دقت بصری استخراج جاده بر اساس مجموعه داده CVPR. ( 1 , 2 ) راههای روستایی; 3 ) جاده های موازی; 4 ) جاده های تقاطع; ( 5 , 6 ) جاده شهری توسط سایه ساختمان ها مسدود شده است.

بدون دیدگاه

دیدگاهتان را بنویسید