تقسیم بندی معنایی جاده منحصر به فرد و دشوار است. استخراج جاده از تصاویر سنجش از دور اغلب بخش‌های جاده‌ای تکه‌تکه‌ای را ایجاد می‌کند که منجر به قطع شدن شبکه جاده‌ای به دلیل انسداد درختان، ساختمان‌ها، سایه‌ها، ابر و غیره می‌شود. در این مقاله، ما یک شبکه همجوشی جدید (FuNet) با تلفیقی از تصاویر سنجش از دور پیشنهاد می‌کنیم. و داده های مکان، که نقش مهمی از داده های مکان در استدلال اتصال جاده ایفا می کند. یک ماژول تقویت تکرار جهانی (IteR) در FuNet تعبیه شده است تا توانایی یادگیری شبکه را افزایش دهد. ما فرمول IteR را برای ادغام مکرر اطلاعات اصلی و اطلاعات پیش‌بینی طراحی کردیم و عملکرد تلفات تقویتی را برای کنترل دقت خروجی پیش‌بینی جاده طراحی کردیم. کمک دیگر این مقاله استفاده از پیش پردازش داده های تساوی هیستوگرام برای افزایش کنتراست تصویر و بهبود دقت نزدیک به 1٪ است. ما D-LinkNet عالی را به عنوان شبکه ستون فقرات در نظر می گیریم و آزمایش هایی را بر اساس مجموعه داده باز طراحی می کنیم. نتیجه آزمایش نشان می‌دهد که روش ما نسبت به روش‌های پیشرفته استخراج جاده بهبود می‌یابد، که نه تنها دقت استخراج جاده را افزایش می‌دهد، بلکه اتصال توپولوژیکی جاده را نیز بهبود می‌بخشد.

کلید واژه ها:

استخراج جاده ; اتصال جاده ای ؛ تصویر سنجش از دور ; داده های مکان ؛ افزایش داده ها ؛ پس پردازش داده ها ؛ شبکه عصبی کانولوشنال عمیق

1. مقدمه

استخراج جاده به طور گسترده در بسیاری از کاربردهای شهری مانند به روز رسانی نقشه راه، به روز رسانی اطلاعات جغرافیایی، ناوبری خودرو، تصحیح هندسی تصویر سنجش از دور شهری و غیره استفاده می شود [ 1 ، 2 ، 3 ]. تقسیم بندی منطقه جاده بر اساس تصاویر سنجش از دور [ 4 ] ویژگی های منحصر به فرد و دشوار خود را دارد که در شکل 1 نشان داده شده است.: (1) جاده طولانی و باریک است، اگرچه بخش کمی از کل تصویر را اشغال می کند و اغلب کل تصویر را می پوشاند. (2) رابطه اتصال توپولوژیکی پیچیده است، به خصوص در تقاطع جاده. (3) ویژگی های هندسی مشابه سیستم آب و راه آهن است. (4) ویژگی های بافت به راحتی با محیط پس زمینه اطراف اشتباه گرفته می شوند. (5) جاده های استخراج شده به دلیل انسداد درختان، سایه ها، ساختمان ها و غیره به هم متصل نیستند. این ویژگی های بالا تفاوت بین ویژگی های جاده ای و غیر جاده ای را نشان می دهد، که باعث چالش برای استخراج جاده با استفاده از تقسیم بندی معنایی رایج فعلی می شود. روش ها تا حدودی
اخیراً، روش‌های رایج تقسیم‌بندی معنایی رایج متوالی منتشر شده‌اند. شبکه‌های کاملاً کانولوشنال (FCN) [ 5 ] اولین مدل برای یادگیری و پیش‌آموزش تحت نظارت Encoder-Decoder است، و نمی‌تواند به طور کامل رابطه معنایی متنی را به دلیل از دست دادن اطلاعات مکانی از طریق استفاده از ادغام ثبت کند. در نتیجه، محققان ماژول‌های همجوشی معنایی متنی چند مقیاسی کارآمدی را پیشنهاد کردند، مانند پیچیدگی گشاد شده Deeplab [ 6 ، 7 ، 8 ]، ماژول ادغام هرمی شبکه تجزیه صحنه هرمی (PSPNet) [ 9 ]، و شبکه‌های رمزگذار-رمزگشا برای همجوشی مؤثر. ویژگی های سطح پایین و سطح بالا در وضوح های مختلف، مانند U-Net [ 10]، LinkNet [ 11 ]، و D-LinkNet [ 3 ]. به طور خاص، D-LinkNet، به عنوان یک شبکه استخراج جاده معمولی، اثر سبک وزن خوبی دارد. البته کمبود اطلاعات محلی به دلیل استفاده از کانولوشن گشاد شده وجود دارد. در حال حاضر، مکانیسم توجه نوظهور [ 12 ، 13 ، 14 ] برای یادگیری اطلاعات جهانی نیز در زمینه تقسیم‌بندی معنایی مانند Non-local [ 15 ]، PSANet [ 16 ]، A2Net [ 17 ]، EMANet [17] به موفقیت دست یافته است. 18 ] و HsgNet [ 19 ]. شبکه های پیچیدگی نمودار (GCN) [ 20] نیز به دلیل توانایی یادگیری استدلال قوی آن مورد توجه قرار می گیرند. با این حال، هنوز بکارگیری روش فوق برای استخراج جاده های پیچیده و مسدود با ویژگی های مشابه پس زمینه، به ویژه در بهبود اتصال جاده ها، دشوار است.
به طور مداوم، با توسعه داده های بزرگ مکان، برخی از محققان توزیع شبکه جاده ها را با ردیابی داده های مسیر GPS وسایل نقلیه برای استخراج شبکه جاده ها استنباط می کنند [ 21 ، 22 ، 23 ، 24 ، 25 ]. در [ 26]، محققان از داده های GPS به عنوان داده ورودی برای بهبود قطع ارتباط جاده ناشی از انسداد، شباهت بافت و شباهت ویژگی های هندسی استفاده کردند. ظاهرا، اتصال جاده را می توان با معرفی داده های مکان چند متغیره، که جهتی برای ایجاد مجدد این مقاله فراهم می کند، بهبود بخشید. با این حال، مشکل دیگری که در فرآیند تحقیق یافت می شود نیز در خور توجه و بهینه سازی است. در طول فرآیند تصویربرداری از تصویر سنجش از دور، توزیع تصویر ناهموار خواهد بود و کنتراست به دلیل انسداد ابر و روشن شدن نور کاهش می‌یابد که در نتیجه منجر به مشکل در طبقه‌بندی پیکسل می‌شود [ 27 ، 28 ، 29 ، 30]. بنابراین، افزایش پیش پردازش داده ها یکی دیگر از تمرکزهای این مقاله است.
در این مقاله، هدف ما افزایش دقت استخراج جاده و بهبود اتصال جاده از طریق بهبود مشکلات فوق است. ما پیشنهاد می‌کنیم که عملکرد نمایش‌های پنهان مدل را بر اساس داده‌های مکان همجوشی بهبود بخشیم، و قطع ارتباط جاده ناشی از انسداد، سایه، ابر و غیره را بهبود بخشیم. ما مدل کلی روش رگرسیون را مطالعه می‌کنیم و پیش پردازش داده‌ها را یکپارچه می‌کنیم. و ماژول های پس پردازش در این مقاله. در پیش پردازش داده ها، تساوی هیستوگرام [ 27 ، 31]. برای افزایش داده های تصویر سنجش از راه دور و افزایش کنتراست داده ها و تفاوت ویژگی ها اتخاذ شده است. در پس پردازش داده ها، یک ماژول تقویت تکرار (IteR) طراحی شده است تا اطلاعات اصلی را ترکیب کند تا به طور مکرر خروجی پیش بینی را تصحیح کند و نقشه ویژگی خروجی پیش بینی را توسط Iteration Reinforcement مطالعه کند.
سهم ویژه این مقاله به شرح زیر است:
(1)
ما یک روش استخراج جاده جدید را بر اساس ادغام داده های مکان پیشنهاد می کنیم و یک شبکه استخراج جاده را بر اساس D-LinkNet، شبکه فیوژن (FuNet) به طور خلاصه طراحی می کنیم. علاوه بر این، روش‌های پیش‌پردازش و پس پردازش داده‌های عمومی شبکه پیشنهادی را مطالعه کردیم. ماژول Iteration Reinforcement (IteR) تابع پس پردازش را به ترمینال خروجی شبکه اضافه کردیم تا تمام اطلاعات داده های ورودی اصلی و نتایج خروجی شبکه را به هم متصل، فیوز کرده و دوباره آموزش دهیم.
(2)
ما یک ماژول IteR برای انجام پس پردازش داده ها طراحی می کنیم. IteR از n بلوک اساسی تشکیل شده است. با معرفی تکنیک‌های بهینه‌سازی تکراری چندگانه، نتایج پیش‌بینی می‌توانند پس از بهینه‌سازی‌های چندگانه به یک نتیجه بهینه و پایدار برسند، و شناسایی اتصال جاده نیز می‌تواند زمانی که نرخ تشخیص کلی مدل جاده افزایش می‌یابد بهبود یابد. ساختار بلوک اصلی برای بهبود عملکرد مدل معرفی شده است. ماژول پیشنهادی جهانی است.
(3)
الگوریتم یکسان سازی هیستوگرام برای پیش پردازش داده های تصویر سنجش از راه دور استفاده می شود. داده ها با یکسان سازی هیستوگرام برای بهبود کنتراست تصویر افزایش می یابد. متفاوت از روش‌های متداول تقویت داده‌ها مانند چرخش تصویر، بریدن، و بزرگ‌نمایی و غیره، مجموعه آموزشی محدود ناشی از دشواری در حاشیه‌نویسی قطعه‌بندی معنایی تصویر را جبران می‌کند. روش پیشنهادی جهانی است.
(4)
در این مقاله، ما تعدادی از روش‌های پیشرفته استخراج جاده را در مجموعه داده‌های عمومی BeiJing DataSet [ 1 ] مقایسه و تجزیه و تحلیل می‌کنیم تا اثربخشی و پیشروی (1)- (3) را تأیید کنیم. ما همچنین تغییرات عملکرد مدل پیشنهادی را تحت شرایط مختلف، از جمله استفاده از یکسان سازی هیستوگرام قبل و بعد از پردازش داده ها، نقش ماژول IteR و تغییرات با تعداد بلوک های اصلی ماژول IteR مورد بحث قرار دادیم. با توجه به نتایج بحث، پیشنهادات عملی برای کاربرد در این مقاله ارائه شد.
این مقاله به شرح زیر سازماندهی شده است: در بخش 2 ، کار مرتبط معرفی شده است. در بخش 3 ، روش پیشنهادی مبتنی بر تقویت تکرار شرح داده شده است. آزمایش و نتایج در بخش 4 نشان داده شده است. بحث در بخش 5 ارائه شده است . در نهایت، نتیجه گیری در بخش 6 آورده شده است.

2. کارهای مرتبط

با توسعه سریع یادگیری ماشینی و یادگیری عمیق، برخی از دستاوردها در استخراج جاده ها انباشته شده است. با این حال، استخراج مناطق جاده بر اساس تصاویر سنجش از دور هنوز دشوار است. نتایج تحقیق در مورد اتصال جاده ای به خصوص نسبتاً کمی است.
در جنبه یادگیری ماشین سنتی، Song و Civco [ 32 ] روشی را برای تشخیص مناطق جاده با استفاده از ویژگی شاخص شکل و ماشین‌های بردار پشتیبان (SVM) پیشنهاد کردند. داس و همکاران [ 33 ] یک چارچوب چند سطحی بر اساس دو ویژگی مهم جاده برای استخراج جاده ها از تصاویر چند طیفی با وضوح بالا با استفاده از SVM احتمالی طراحی کرد. الشهی و مارپو [ 2] یک روش استخراج جاده بدون نظارت بر اساس تقسیم بندی تصویر سلسله مراتبی ارائه کرد. اخیراً، یک نتیجه بخش‌بندی جاده با استفاده از شبکه عصبی کانولوشنال کم عمق همراه با مبتنی بر دید چند ویژگی منتشر شده است. شبکه از ویژگی های انتزاعی استخراج شده از نمایش مشتق شده از نمایش تصویر ورودی استفاده کرد و اطلاعات گرادیان را به عنوان ویژگی های اضافی تصویر برای به دست آوردن نتایج بهتر ترکیب کرد [ 34 ]. این روش ها بر دانش قبلی و ویژگی های اضافی متکی هستند و روش یادگیری عمیق به دلیل ویژگی های یادگیری خودکار به طور گسترده در کار استخراج جاده استفاده می شود. در جنبه یادگیری عمیق، Saito [ 35 ] از CNN برای استخراج مستقیم جاده ها از تصاویر اصلی استفاده کرد و نتایج بهتری را در مجموعه داده های جاده ماساچوست به دست آورد. RoadTracer [36 ] پیشنهاد شده توسط باستانی مستقیماً شبکه جاده را از CNN از طریق فرآیند جستجوی تکراری بر اساس تابع تصمیم CNN خروجی می‌دهد. شیا و همکاران [ 37 ] همچنین مستقیماً از DCNN برای استخراج جاده استفاده کرد و آنها را در تصاویر GF-2 آزمایش کرد. با توجه به نتایج تحقیقات جدید منتشر شده، برخی از محققان ایده یادگیری انتقال عمیق و یادگیری یکپارچه را در مراحل استخراج اشیاء هدف جاده برای بهبود یکپارچگی شبکه راه ها معرفی کرده اند [ 38 ].]. در مطالعات فوق، جاده ها مستقیماً توسط شبکه عصبی کانولوشنال عمیق استخراج می شوند. با این حال، با پیشرفت مستمر یادگیری عمیق در زمینه بینایی کامپیوتر، محققان شروع به انجام تحقیقات نوآورانه همراه با یادگیری عمیق کردند. در حال حاضر، با توجه به منحصر به فرد بودن استخراج جاده ها، چهار تکنیک تقسیم بندی معنایی مبتنی بر یادگیری عمیق وجود دارد که ارزش مطالعه بیشتر را دارند.
اولین مدلی که ما را تحت تاثیر قرار می دهد، مدل شبکه همجوشی اطلاعات چند بعدی و چند بعدی است که معمولاً با پیچش گشاد شده نشان داده می شود، مانند U-Net [ 10 ]، LinkNet [ 11 ]، و D-LinkNet [ 3 ]. آنها نقشه های ویژگی را با وضوح های مختلف به هم متصل می کنند تا اطلاعات جزئیات سطح پایین و اطلاعات معنایی سطح بالا را یکپارچه کنند. به طور خاص، D-LinkNet پیشنهاد شده توسط ژو [ 3] و همکاران جایزه اول را در چالش استخراج جاده DeepGlobe 2018 با گسترش میدان پذیرا و ادغام اطلاعات معنایی متنی چند مقیاسی کسب کرد. با این حال، به دلیل ناپیوستگی هسته، همه پیکسل ها در محاسبه دخالت ندارند، که منجر به از دست رفتن اطلاعات مکانی و نامناسب بودن برای استخراج جاده ای می شود که نیاز به یادگیری اطلاعات جهانی دارد.
مدل شبکه دوم، شبکه نوآورانه مبتنی بر مکانیسم توجه است [ 12 ، 13 ، 14 ]. مدل‌های غیر محلی [ 15 ]، PSANet [ 16 ]، OCNet [ 39 ] و CCNet [ 40 ] اولین مدل‌هایی بودند که در سال 2018 خودتوجهی را معرفی کردند و همچنین مدل Local RelationNet [ 41 ] در سال 2019 به نتایج خوبی دست یافتند. در یادگیری اطلاعات فضایی جهانی و از راه دور. A 2 -Nets [ 17 ] و CGNL [ 42 ] توجه به خود را از نظر ریاضی بهینه کردند. SGR [ 43 ]، Beyond Grids [ 44 ]، GloRe [ 45]، LatentGNN [ 46 ]، APCNet [ 47 ]، و EMANet [ 18 ] بازسازی «رده پایین» را کاوش و تمرین کردند. DANet [ 48 ] و شبکه توجه متقابل [ 49 ] بیشتر نشان دادند که توجه به اطلاعات در کانال ویژگی منجر به بهبود دقت تقسیم بندی معنایی می شود. البته، یادگیری اطلاعات جهانی و معناشناسی از راه دور بر اساس توجه موثر است [ 50 ، 51 ] که از دست دادن اطلاعات پیچیدگی گشاد شده را جبران می کند. با این حال، اگرچه مکانیسم های توجه می توانند اطلاعات جهانی را بیاموزند، اما افزونگی اطلاعات را نیز به همراه دارد.
سومین جهتی که ما به آن علاقه داریم پیچیدگی گراف است. شبکه‌های پیچیدگی نمودار (GCN) [ 20 ] یک رویکرد استدلالی رابطه معنایی بسیار محبوب برای تقسیم‌بندی تصویر در سال‌های اخیر است. متفاوت از CRFs [ 52 ] و شبکه پیاده روی تصادفی [ 53 ، 54 ]، GCN در یادگیری اطلاعات فضایی جهانی و مسافت طولانی بهتر است. وانگ و همکاران [ 55 ] پیشنهاد استفاده از GCN در کار تشخیص ویدیو برای گرفتن رابطه بین اشیا را پیشنهاد کرد. در آخرین اختراع منتشر شده توسط CVPR در سال 2020، نویسنده از پیچیدگی نمودار برای انجام تقسیم بندی طرح معنایی استفاده کرد و پیچیدگی نمودار را با دو شاخه برای استخراج ویژگی های درون سکته مغزی و بین استروک به ترتیب استفاده کرد.56 ]. علاوه بر این، روش‌های رایجی مانند GAT [ 57 ]، GAE [ 58 ] و GGN [ 59 ] نیز GCN را به عنوان مدلی برای ساخت بلوک پایه انتخاب می‌کنند. با این حال، برخی از مشکلات در روش های بالا وجود دارد. آنها در زمینه استخراج جاده، به ویژه در بهبود اتصال جاده، آزمایش نشده اند.
جهت چهارم، همچنین یکی از موضوعاتی که در این مقاله مورد توجه قرار گرفته است، بهبود موثر اتصال جاده ها است. در ابتدا، برخی از محققان از روش سنتی برای بهبود اتصال جاده با استفاده از مدل المان محدود طراحی شده دستی و با ترکیب دانش پیشین زمینه‌ای، مانند CRF مرتبه بالا [ 60 ]، فرآیندهای نقطه اتصال [ 61 ] و غیره استفاده کردند. بر. در سالهای اخیر، Batra و همکاران. [ 62 ] سعی کرد اتصال توپولوژیکی جاده ها را با ردیابی جهت حاشیه نویسی خاص در ترکیب با رفتار حاشیه نویسی دستی جاده حل کند. برخی از محققان شبکه جاده را با صاف کردن و حذف نویز به داده های GPS تولید می کنند [ 21 ، 23 ]. در [ 26]، ترکیبی از تصویر سنجش از دور و داده های GPS برای اولین بار به مدل وارد شد تا توانایی استخراج جاده مدل را بهبود بخشد. در روش استخراج جاده، می‌توان با معرفی داده‌های GPS، عدم اتصال جاده استخراج شده را به دلیل گرفتگی درختان، ساختمان‌ها، سایه‌ها و ابرها بهبود بخشید.
عملکرد روش‌های تقسیم‌بندی معنایی بالا بهتر خواهد بود اگر بتوان یک تکنیک افزایش داده و یک روش پس پردازش داده را ادغام کرد. تکنیک افزایش داده ها هنوز یک روش قدرتمند برای بهبود دقت بخش بندی معنایی است. اثر روش‌های سنتی گسترش داده‌ها مانند تنظیم، چرخش و مقیاس‌بندی به دلیل دشواری در حاشیه‌نویسی داده‌ها آشکار نیست. به طور خاص، به دلیل کنتراست کم داده های تصویر سنجش از راه دور حاصل از نور خورشید یا آب و هوا، کنتراست تصویر را می توان با افزایش داده ها بهبود بخشید، به طوری که مدل می تواند شی هدف را راحت تر شناسایی کند [ 27 ، 28 ، 29 ، 30 ].]. به طور همزمان، پس پردازش داده ها یک روش بسیار رایج برای بهبود بخش بندی معنایی است و روش های پس پردازش بسیاری وجود دارد [ 62 ، 63 ]. در [ 63 ]، یک خط لوله پالایش معرفی شده است تا به طور مکرر خروجی پیش بینی را افزایش دهد، و فرآیند پالایش برای کل مدل انجام می شود. نتایج تقسیم‌بندی پیش‌بینی‌شده و تصاویر ورودی اصلی در طول بهینه‌سازی به هم متصل می‌شوند و سپس برای محاسبه به مدل ارسال می‌شوند. این رویکرد عملکرد مدل را پس از تکرارهای متعدد بهبود می بخشد، اما مقدار محاسبات بسیار زیاد است. روش پالایش برای چندین تکرار نیز در [ 21 , 22 , 23 , 24 , 25 .]. متفاوت از روش قبلی برای اتصال نتایج پیش‌بینی با تصاویر اصلی، نتایج پیش‌بینی با نقشه‌های ویژگی خروجی رمزگشایی شده پیوند می‌شوند و اثر مدل پس از تکرارهای متعدد بهتر است. یک ماژول کانولوشن چند شاخه ای انباشته در مدل برای تکرار پیشنهاد شده است، به جای تکرار کل شبکه، که می تواند به طور موثر از اطلاعات متقابل استفاده کند و مقدار محاسبات را کاهش دهد. برخی از محققان همچنین از یک لایه احتمال پس پردازش همراه با یادگیری عمیق برای بهینه‌سازی موثر بخش‌بندی جاده استفاده می‌کنند [ 64 ]. منیح و هینتون [ 65] از RBM ها به عنوان بلوک اصلی برای ساخت شبکه عصبی عمیق استفاده می کند و روش های پیش پردازش و پس پردازش را ترکیب می کند و دقت قطعه بندی جاده ها را بهبود می بخشد. مشارکت محققان فوق الهام بخش تحقیق این مقاله بوده است.
در این مقاله، ما یک شبکه استخراج جاده را با ترکیب پیش پردازش داده ها با یکسان سازی هیستوگرام و داده های مکان تلفیقی برای تقویت یادگیری نتایج خروجی با تعبیه یک ماژول IteR عمومی در انتهای شبکه ایجاد کردیم. ماژول IteR از [ 62 ، 63 الهام گرفته شده است]، اما کل شبکه برای جلوگیری از محاسبات بیش از حد تکرار نمی شود. در عوض، خروجی پیش‌بینی با تصویر اصلی ترکیب می‌شود و تکرار برای دستیابی به تصحیح خود تکرار می‌شود. نتایج تجربی نشان می‌دهد که شبکه استخراج جاده پیشنهادی ماژول پس پردازش مبتنی بر IteR و روش پیش پردازش داده‌ها مؤثر است. در مقایسه با سایر روش‌های تجربی، نتایج بهینه هستند، دقت استخراج جاده افزایش می‌یابد و اتصال جاده بهبود می‌یابد.

3. روش شناسی

3.1. معماری FuNet

یک شبکه فیوژن جدید (FuNet) برای بخش‌بندی تصاویر سنجش از راه دور پیشنهاد شده است که می‌تواند به حوزه تقسیم‌بندی تصویر گسترش یابد. FuNet از D-LinkNet34 [ 3 ] به عنوان ساختار اصلی برای آزمایش ها استفاده می کند. معماری شبکه ( شکل 2 ) پس از کدگذاری D-LinkNet، ترکیب ویژگی های چند مقیاسی و خروجی رمزگشایی به تقویت کننده تکرار جهانی (IteR) متصل می شود و تصاویر اصلی برای انجام آموزش تقویت کمکی برای نتایج خروجی ترکیب می شوند. برای بهبود بیشتر خروجی پیشگویی. بخش 3.2 را برای طراحی تقویت تکرار (IteR) ببینید .

3.2. تقویت تکرار

Iteration Reinforcement ( شکل 3 ) به ترمینال خروجی شبکه D-LinkNet متصل می شود تا پردازش پس از خروجی داده ها را افزایش دهد. داده های ورودی D-LinkNet، خروجی دکانولوشن لایه ماقبل آخر و خروجی لایه پیچیدگی بسط لایه آخر به صورت بیان شده است. نوع گره ناشناخته: فونتنوع گره ناشناخته: فونت، نوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونت، و نوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتUnknown node type: fontUnknown node type: fontUnknown node type: font. خروجی D-LinkNet را می توان به صورت زیر تعریف کرد:

نوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونت

مدل IteR اطلاعات چند بعدی را از طریق یادگیری مکرر بهبود مکرر نتایج اتصال داده های خروجی D-LinkNet و تصاویر اصلی یکپارچه می کند، به طوری که دقت نتایج تحت تأثیر از دست دادن اطلاعات در هنگام پیش بینی مدل قرار نمی گیرد. نتیجه نوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتاز اتصال نوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتبا تصویر ورودی اصلی در امتداد کانال به صورت زیر تعریف می شود:

نوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتF10، X)نوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتنوع گره ناشناخته: فونتج��جآتی(اف10،ایکس)

اف3تیاف3تیورودی از است تیتی ساعتتیتیساعتبلوک پایه که به صورت زیر تعریف می شود:

اف3تی{اف5– 1     من f 1اف30        من f 1… nاف3تی={اف5تی-1     من� تی>1اف30        من� تی=1،تی=1،…،�

اف4تیاف4تینتیجه اتصال است اف20اف20و اف3تیاف3تیدر امتداد کانال در تیتی ساعتتیتیساعتبلوک پایه که به صورت زیر تعریف می شود:

اف4تیF20، اف3تی) ، ، … ، nاف4تی=ج��جآتی(اف20،اف3تی)،تی=1،…،�

اف5تیاف5تینقشه ویژگی پیش بینی است که با کانولوشن (اندازه هسته 3، اتساع 1 است) محاسبه می شود اف4تی�4�، که به صورت زیر تعریف می شود:

اف5تیF4تی) ، ، … ، n�5�=����(�4�),�=1,…,�

جایی که nتعداد بلوک های اصلی است که روی آن تنظیم شده است 5�=5( بخش 5.2 ) پس از بحث تجربی. در معادله (1) اف10اف10و اف30اف30به ترتیب خروجی لایه ماقبل آخر و آخرین لایه D-LinkNet هستند. در معادلات (2) و (4)، concat (.) اتصال در امتداد کانال است. در معادله (3)  اف5– 1 اف5تی-1نقشه ویژگی خروجی است 1تی ساعتتی-1تیساعتبلوک اساسی در معادله (5)، conv(.) عملیات پیچیدگی نقشه ویژگی ورودی است.

هنگامی که بلوک اصلی فعلی آخرین بلوک باشد، پیش بینی شده است eدتیپ�هدتیبدست می آید توسط اف5تیاف5تیاز طریق لایه تبدیل غیرخطی سیگموئید.

پیش بینی شده eدتیپ�هدتیهر بلوک اصلی به صورت زیر تعریف می شود:

eدتیgمن یا من _اف5تی) ، ، … ، nپ�هدتی=سمن�متر�مند(اف5تی)،تی=1،…،�
اگر بلوک اصلی فعلی آخرین بلوک نباشد، اف5تیاف5تیمنتقل می شود به اف31اف3تی+1از بلوک اصلی بعدی در امتداد جهت فلش نقطه‌دار، و سپس معادلات (3) – (5) تکرار می‌شوند.

3.3. عملکرد از دست دادن

در طول فرآیند آموزش FuNet، هر بلوک پایه نتایج پیش‌بینی را خروجی می‌دهد و مجموع ضرر در فرآیند آموزش با محاسبه تلفات انباشته n بلوک پایه به دست می‌آید. با فرض اینکه تیهفتم�thبلوک اصلی نقشه ویژگی پیش بینی را خروجی می دهد اف5تی�5�، نتیجه پیش بینی eدتی�����بلوک اصلی فعلی توسط اف5تی�5�از طریق لایه سیگموئید، و من _ستی�����از eدتی�����و برچسب و کل من _����( شکل 4 ) به شرح زیر محاسبه می شود:

من _ستیCEeدتیl )�����=�������(�����,�����)
=n1من _ستیل�سس=∑تی=1�ل�سستی

جایی که ، … ، nتی=1،…،�شاخص بلوک پایه است و nتعداد کل بلوک های اساسی است.

4. آزمایش و نتایج

4.1. مجموعه داده ها

مجموعه داده‌های آموزش، تأیید و آزمایش که در این مقاله اتخاذ شده‌اند از BeiJing DataSet [ 1 ] هستند. انواع داده ها شامل تصاویر سنجش از راه دور (RS) و داده های سیستم موقعیت یابی جهانی (GPS) است. نمونه های دو مجموعه داده در شکل 5 نشان داده شده است.
348 تصویر سنجش از دور در داده های RS وجود دارد. از این میان 278 تصویر برای مجموعه تایید آموزشی و 70 تصویر برای تست استفاده می شود. هر تصویر دارای اندازه 1024 × 1024 و وضوح پیکسل 0.5 متر بر پیکسل است. برچسب های جاده روی تصویر به صورت دستی توسط نویسنده علامت گذاری شده است. در طول فرآیند آموزش، مجموعه آموزشی و مجموعه تأیید به‌طور تصادفی از مجموعه تأیید آموزشی در 9:1 تقسیم می‌شوند و داده‌های تصویر سنجش از راه دور به‌طور تصادفی با مقیاس، چرخش افقی، چرخش عمودی، چرخش 90 درجه افزایش می‌یابند. ما احتمال تصادفی را تنظیم می کنیم bپ��ب0.5 باشد. در مرحله آموزش برای هر تصویر یک عدد تصادفی 0 تا 1 تولید می شود. اگر عدد تصادفی کمتر از bپ��ب، سپس تصویر افزایش می یابد. اگر بزرگتر از prob باشد، تصویر بهبود نخواهد یافت. قبل از آموزش، تصاویر سنجش از راه دور اصلی توسط یکسان سازی هیستوگرام پردازش می شوند.
داده های GPS از 8100000 نمونه گرفته شده از 28000 تاکسی در پکن در یک هفته بدست می آید. داده‌های GPS در مجموعه داده پکن شامل عرض جغرافیایی، طول جغرافیایی، سرعت و فاصله نمونه‌برداری است. مدل پیشنهادی تنها از میدان‌های طول و عرض جغرافیایی GPS استفاده می‌کند که می‌توان آن‌ها را به صورت بیان کرد پ⟨ n  ⟩پ�من�تی=〈�آتی، ���〉. بر اساس مختصات موقعیت مکانی، نقاط GPS را با توجه به رابطه متناظر بین تصویر سنجش از راه دور اصلی و طول و عرض جغرافیایی GPS به فرمت تصویر باینری تبدیل می کنیم. سپس، ترکیب داده ها را با همپوشانی تصویر باینری GPS و تصویر سنجش از دور اصلی در بعد کانال پیاده سازی می کنیم. نتایج در شکل 5 نشان داده شده است. با مقایسه آن‌ها با تصویر اصلی، می‌توان دریافت که نقاط GPS در ناحیه تنه جاده متمرکز شده‌اند، در حالی که نقاط GPS ظاهراً در برخی مکان‌های پوشیده از درختان روی تصویر سنجش از راه دور متمرکز شده‌اند. بنابراین، ما می‌توانیم استنباط کنیم که آیا جاده‌ای از طریق مکان و چگالی نقاط GPS وجود دارد، که دلیل اساسی معرفی داده‌های مکان برای بهبود اتصال جاده‌ها در این مقاله نیز هست.
ما از شاخص APLS [ 66 ] برای ارزیابی اتصال استفاده می کنیم. سپس، برچسب‌ها و نتایج پیش‌بینی باید در طول فرآیند آزمایش بیشتر پردازش شوند. ابتدا برچسب‌ها و نتایج پیش‌بینی از خط اسکلت استخراج می‌شوند، که سپس به ساختار نمودار تبدیل می‌شود. بر اساس ساختار نمودار، اتصال توپولوژیکی جاده با محاسبه انحراف کوتاه‌ترین فاصله مسیر بین تمام جفت‌های گره در نمودار برچسب و نمودار پیش‌بینی ارزیابی می‌شود.

4.2. برپایی

معماری شبکه اتخاذ شده در این مقاله مبتنی بر D-LinkNet است و از ادغام ویژگی‌های چند بعدی با وضوح چند بعدی بهره می‌برد. بخش 3.1 را ببینید . یک تقویت کننده تکرار (IteR) در انتهای خروجی معماری شبکه اضافه می شود، که در آن بلوک اصلی است. 5�=5، که یک مقدار آزمایشی است. لطفاً به بخش 5.2 مراجعه کنید .
تصویر سنجش از دور و داده های موقعیت مکانی GPS در این مقاله از مجموعه داده های عمومی پکن [ 1 ] است. ما Adma را به عنوان بهینه ساز [ 67 ] و BCE (آنتروپی متقاطع باینری) + از دست دادن ضریب تاس را به عنوان تابع ضرر در نظر می گیریم [ 3]. اندازه دسته را 16 و نرخ یادگیری اولیه را 1e-4 قرار دادیم. اگر از دست دادن شش مجموعه راستی‌آزمایی دوره‌های متوالی از مقدار حداقل تاریخی پایین نیاید، نرخ یادگیری در 0.5 ضرب می‌شود. زمانی که دوره آموزشی بیش از 60 دوره باشد، یا نرخ یادگیری کمتر از 1e-7 باشد، آموزش پایان می یابد. در طول آموزش، داده ها به طور تصادفی با مقیاس، چرخش افقی، چرخش عمودی، چرخش 90 درجه افزایش می یابد. همه آزمایش‌ها بر روی یک NVIDIA Tesla V100 32G با استفاده از سیستم عامل اوبونتو 18.06 آزمایش شده‌اند.

4.3. متریک تکامل

نتایج تجربی با میانگین تقاطع روی اتحاد ( من _Uمترمن��) طبق تعریف زیر:

منoUمن=تیپمنتیپمنافپمنافنمنمن��من=تیپمنتیپمن+افپمن+افنمن
من _U=1nn1منoUمنمترمن��=1�∑من=1�من��من

جایی که تیپمنتیپمنتعداد نمونه های صحیح شناسایی شده به عنوان نمونه مثبت است،  افپمن افپمنتعداد نمونه های نادرست شناسایی شده به عنوان نمونه مثبت است،  افنمن افنمنتعداد نمونه های نادرست شناسایی شده به عنوان نمونه های منفی است منمنتعداد نمونه ها و n تعداد کل نمونه ها است.

علاوه بر شاخص کلی تقسیم بندی معنایی من _Uمترمن��، ما میانگین شباهت طول مسیر پیشنهاد شده در [ 21 ، 66 ] را به عنوان شاخص ارزیابی دیگری در نظر می گیریم تا تأیید کنیم که روش ما می تواند اتصال توپولوژیکی جاده ها را نیز بهبود بخشد. Pال اسآپ�اسیک شاخص مؤثر بر اساس تئوری گراف برای تأکید بر اتصال شبکه راه است. انحراف کوتاه ترین فاصله مسیر بین تمام جفت گره ها در نمودار با روش پیشنهادی گرفته می شود.

ما برچسب را تبدیل می کنیم yو خروجی پیش بینی y^�^را به شکل نمودار دریافت کنید V، ای)جی=(�،�)و جی^(V^،E^)جی^=(�^،�^). تعریف از Pال اسآپ�اسبه سادگی به شرح زیر است:

اسپ→ تی1V|∑ دقیقه ,∣∣b ) – (آ^،بˆ)∣∣b ))اسپ→تی=1-1|�|∑دقیقه(1،|�(آ،ب)-�(آ^،ب^)|�(آ،ب))
Pال اس=1ن( y،y^)11اسپ→ تی( G _جی^)+1استی→ پ(جی^، )آپ�اس=1ن∑(�،�^)11اسپ→تی(جی،جی^)+1استی→پ(جی^،جی)

جایی که ، ∈ Vآ،ب∈�، آ^،ب^V^آ^،ب^∈�^V||�|تعداد کل گره ها در نمودار حقیقت زمین است، ننتعداد کل تصاویر است، b )�(آ،ب)و (آ^،ب^)�(آ^،ب^)طول مسیر بین هستند ⟶ بآ⟶بو آ^ب^آ^⟶ب^، به ترتیب. اسپ⟶ تیاسپ⟶تیمجموع تجمعی کوتاه‌ترین تفاوت مسیر بین تمام جفت‌های گره در نمودار بررسی است V، ای)جی=(�،�)و نمودار جی^(V^،E^)جی^=(�^،�^)استی⟶ پاستی⟶پبه طور متقارن به محاسبه نهایی معرفی می شود Pال اسآپ�اسبرای مجازات موارد مثبت کاذب استی⟶ پاستی⟶پمجموع تجمعی کوتاه‌ترین تفاوت مسیر بین تمام جفت‌های گره در نمودار بررسی است جی^(V^،E^)جی^=(�^،�^)و نمودار V، ای)جی=(�،�).

4.4. نتایج و تجزیه و تحلیل

نتایج تجربی روش های مختلف تقسیم بندی معنایی پیشرفته در مجموعه داده های پکن [ 1 ] در جدول 1 فهرست شده است. ما می توانیم مستقیماً مشاهده کنیم که: (1) دقت مدل ما قبل و بعد از ادغام داده های مکان GPS بهینه است. را من _Uمترمن��(63.31%) مدل پیشنهادی 1.38 بالاتر از HsgNet بر اساس مکانیسم توجه و 2.41 بالاتر از D-LinkNet است که در رقابت استخراج جاده در سال 2018 مقام اول را کسب کرده است. (2) در مقایسه با مدل بدون داده های GPS، دقت تمام مدل های دارای داده های مکان GPS به وضوح بهبود یافته است. (3) اتصال جاده نیز به طور موثر توسط مدل پیشنهادی بهبود یافته است، اما نتایج به خوبی مدل اتصال جاده [ 62 ] با تمرکز بر اتصال جاده نیست. این مشاهدات می تواند ثابت کند که معرفی داده های مکان و داده های پس از پردازش پیشنهادی موثر هستند.
نتایج تجسم به دست آمده با روش های مختلف در شکل 6 نشان داده شده است. از نتایج تجسم، به وضوح می توانیم ببینیم که مدل ما از نظر شباهت بافت، انسداد و پس زمینه پیچیده بهترین عملکرد را دارد. به طور خاص، روش ما در اتصال جاده ها نیز به خوبی عمل می کند.
به منظور نشان دادن بیشتر مزیت های ادغام داده های موقعیت مکانی GPS به طور مستقیم، ما نتایج آزمایش وارد کردن تصویر سنجش از دور تنها و وارد کردن داده های ترکیبی GPS و تصویر سنجش از دور را در شکل 7 ارائه می کنیم.. ما مشاهدات زیر را به دست آوردیم: (1) اگرچه برخی از جاده ها توسط درختان یا خانه ها مسدود شده است، نقاط GPS به وضوح توزیع می شوند که نشان دهنده وجود جاده است. (2) هنگامی که فقط تصاویر سنجش از دور به عنوان داده ورودی استفاده می شود، جاده مسدود شده را نمی توان تشخیص داد یا به طور موثر شناسایی کرد (ستون 4). پس از ادغام داده های مکان GPS، اثر بخش بندی جاده به طور قابل توجهی افزایش می یابد (ستون 5). این نتایج مشاهدات نشان می‌دهد که داده‌های GPS می‌توانند تشخیص و توانایی استدلال مدل را بهبود بخشند، به‌ویژه زمانی که جاده توسط درختان، خانه‌ها، سایه‌ها و غیره مسدود شده است، که در [ 1 و 26 ] نیز نشان داده شده است.

5. بحث

5.1. قبل از برابری پس از هیستوگرام

هدف این بخش تایید بیشتر اثربخشی و جهانی بودن پیش پردازش داده ها با استفاده از یکسان سازی هیستوگرام است. نتایج مقایسه قبل و بعد از استفاده از یکسان سازی هیستوگرام در جدول 2 آورده شده است. مشاهده می کنیم که دقت یکسان سازی هیستوگرام به طور کلی افزایش می یابد بدون توجه به اینکه داده های ورودی فقط تصویر سنجش از راه دور یا داده های همجوشی هستند. این مشاهدات نشان می دهد که رویکرد یکسان سازی هیستوگرام می تواند دقت تشخیص جاده را با افزایش کنتراست تصویر بهبود بخشد. در تصاویر با کنتراست بالا، منطقه جاده را می توان به روشی بهتر از پس زمینه جدا کرد تا عملکرد مدل در استخراج جاده بهبود یابد [ 27 ، 28 ، 29 ، 30 .]. با این حال، مقایسه با نتایج تجربی ستون چهارم (بعد از HE2) و ستون پنجم (پس از HE1) نشان می‌دهد که یکسان سازی هیستوگرام هم برای مجموعه آموزشی و هم برای مجموعه تست مورد نیاز است، در غیر این صورت دقت استخراج جاده کاهش می‌یابد. بنابراین، در کاربرد عملی، یکسان سازی هیستوگرام زمانی در دسترس است که کنتراست تصویر سنجش از راه دور به دلیل عکسبرداری، انسداد، روشنایی و عوامل دیگر ضعیف باشد، اما کاربران باید هم‌زمان هم برای داده‌های آموزشی و هم برای داده‌های کاربردی، یکسان سازی هیستوگرام را از نظر تصویر انجام دهند.
برای توضیح بیشتر نتایج بحث بالا، توزیع سطح خاکستری را پس از یکسان سازی هیستوگرام BeiJing DataSet [ 1 ] ارائه می کنیم ( شکل 8 ). می بینیم که قبل از یکسان سازی، هیستوگرام های پیش زمینه و پس زمینه بیشتر در اوج همپوشانی دارند. پس از یکسان سازی، درجه همپوشانی کاهش می یابد، که نشان می دهد که کنتراست تصویر با یکسان سازی هیستوگرام افزایش می یابد و سطح خاکستری تصویر از توزیع غیر یکنواخت به توزیع یکنواخت با تبدیل سطح خاکستری تنظیم می شود. یکسان سازی هیستوگرام را می توان برای اجزای قرمز، سبز و آبی تصاویر رنگی انجام داد. به ترتیب برای بهبود تصاویر رنگی. هنگامی که استخراج جاده به دلیل نور کافی یا قرار گرفتن در معرض جدی در تصاویر هوایی دشوار است [ 1]، کنتراست تصویر به ویژه با یکسان سازی هیستوگرام بهبود می یابد.

5.2. بلوک چند پایه

هدف این بخش تایید بیشتر اثربخشی و عمومیت ماژول IteR است. قبل و بعد از یکسان سازی هیستوگرام، تأثیر تعداد بلوک های پایه IteR بر عملکرد مدل در جدول 3 ثبت شده است . با در نظر گرفتن زمان اجرای مدل به عنوان، بدون یکسان سازی هیستوگرام، می توان به نتیجه مطلوب دست یافت که nبرابر با 5 است و تعداد ماژول های IteR با استفاده از تساوی هیستوگرام (کاهش 2) 3 می شود. مشاهده می‌کنیم که تعداد ماژول‌های IteR پس از استفاده از تساوی هیستوگرام کاهش می‌یابد، که گواهی می‌دهد که یکسان سازی هیستوگرام می‌تواند عملکرد مدل را بهبود بخشد.
نتایج تجسم ماژول IteR ( ≤ 5�≤5) قبل از یکسان سازی هیستوگرام در شکل 9 نشان داده شده است. ما به وضوح می توانیم آن را ببینیم nافزایش می یابد، مدل در استخراج جاده بهتر عمل می کند. از ردیف دوم، می توانیم ببینیم که به صورت nافزایش می یابد، اشیاء غیر جاده ای (چک باکس قرمز) و اشیاء جاده به درستی توسط مدل شناسایی می شوند. دلیل اصلی این پدیده مشابه اصل خود اصلاحی است که در [ 68 ] توضیح داده شده است. ما داده های خروجی و اطلاعات تصویر اصلی را توسط IteR مکرر ترکیب می کنیم تا از از دست رفتن اطلاعات در سطح پایین جلوگیری کنیم. اثربخشی روش پیشنهادی نیز در مطالعات قبلی تایید شده است [ 21 ، 22 ، 23 ، 24 ، 25 ].
ما تأثیر تعداد بلوک های اساسی در مدل IteR را بر دقت نتایج به ترتیب قبل و بعد از یکسان سازی هیستوگرام مورد بحث قرار دادیم. همانطور که از جدول 3 و شکل 10 مشاهده می شود : (1) به عنوان تعداد بلوک های اساسی nافزایش می یابد، دقت مدل بهبود می یابد و سپس کاهش می یابد و تمایل به پایداری دارد. (2) با افزایش تعداد بلوک های اصلی n، زمان اجرای مدل به طور مداوم افزایش می یابد. (3) اندازه مدل با تغییر به طور قابل توجهی افزایش نمی یابد n، صرف نظر از اینکه از پیش پردازش داده ها با یکسان سازی هیستوگرام استفاده می شود. (4) بدون یکسان سازی هیستوگرام، دقت مدل زمانی بهینه است nبرابر 7 است. اما با توجه به زمان اجرا و دقت مدل، مناسب تر است n5 بودن با یکسان سازی هیستوگرام، دقت بهینه مدل زمانی حاصل می شود که n3 است. با پردازش و محاسبه بیشتر، می‌توان نتیجه گرفت که: (1) مهم نیست که آیا از تساوی هیستوگرام استفاده می‌کنیم، زمانی که n 1 افزایش می‌یابد، زمان آزمایش حدود 1.7 میلی‌ثانیه افزایش می‌یابد. (2) هنگامی که n برابر است، زمان اجرا با تساوی هیستوگرام 3.4 میلی ثانیه بیشتر از زمان بدون تساوی هیستوگرام است. با این حال، تعداد بلوک های اساسی IteR را می توان با تساوی هیستوگرام کاهش داد. مقایسه بیشتر نشان می دهد که: (1) توانایی پیش بینی مدل بدون یکسان سازی هیستوگرام به طور مثبت با nافزایش زمانی که nکمتر از 5 است، و توانایی پیش‌بینی کاهش می‌یابد و زمانی که به ثبات می‌رسد تمایل دارد nبزرگتر از 7 است؛ پس از یکسان سازی هیستوگرام، پیک زمانی رخ می دهد که nبرابر با 3 است و تعداد بلوک های اصلی کاهش می یابد. (2) زمانی که تعداد بلوک های اساسی IteR بدون تساوی هیستوگرام 5 باشد، بهینه است من _Uمترمن��63.31٪ است و زمان اجرا 42.30 میلی ثانیه است. هنگامی که تعداد بلوک های اساسی IteR با تساوی هیستوگرام 3 باشد، حداکثر من _Uمترمن��63.36٪ است و زمان اجرا 42.54 میلی ثانیه است. این داده ها ما را راهنمایی می کنند که چگونه انتخاب کنیم nقبل و بعد از استفاده از یکسان سازی هیستوگرام.
به طور خلاصه، تعداد ماژول های IteR را می توان با پیش پردازش داده ها با یکسان سازی هیستوگرام در صورت تضمین دقت و کارایی کاهش داد، بنابراین با توجه به کیفیت تصویر سنجش از دور، n بدون برابر سازی هیستوگرام برابر با 5 است. n با تساوی هیستوگرام برابر با 3 است. در نهایت، توصیه می‌شود از هر دو پیش‌پردازش داده‌ها با یکسان‌سازی هیستوگرام و پس‌پردازش داده‌های IteR در کاربرد عملی استفاده شود.

6. نتیجه گیری

هدف این مقاله بهبود دقت استخراج جاده و اتصال جاده است. دستاوردهای نوآورانه در این مقاله به شرح زیر است: ما (1) یک شبکه جدید فیوژن (FuNet) را برای ادغام داده های تصویر سنجش از دور و داده های مکان و افزایش عملکرد یادگیری شبکه پیشنهاد کردیم. (2) یک مدل جهانی تقویت تکرار (IteR) برای اصلاح و بهینه سازی مدل با ادغام خروجی پیش بینی و اطلاعات تصویر اصلی و افزایش توانایی یادگیری شبکه طراحی کرد. یک تابع تلفات تقویتی برای بهبود دقت برچسب پیش‌بینی جاده طراحی کرد. و (3) از پیش پردازش داده ها با یکسان سازی هیستوگرام برای بهبود کنتراست تصویر با جلوه بهتر استفاده کردند که تقریباً 1٪ افزایش یافته است. روش پیش پردازش داده ها نیز جهانی است. ما همچنین آزمایش هایی را با D-LinkNet به عنوان ساختار شبکه ستون فقرات طراحی کردیم و چندین روش پیشرفته استخراج جاده را در BeiJing DataSet مقایسه کردیم. این مقاله بر روی پیش پردازش و پس پردازش داده ها تمرکز می کند، عملکرد تساوی هیستوگرام و تعداد بلوک های اساسی در ماژول IteR را تجزیه و تحلیل و بحث می کند و پیشنهادات کاربردی عملی را ارائه می دهد. نتایج تجربی نشان می‌دهد که مدل ما بهترین عملکرد را دارد، که دقت استخراج جاده و اتصال توپولوژیکی جاده را بهبود می‌بخشد. به طور خلاصه، با توجه به و پیشنهادات کاربردی عملی می دهد. نتایج تجربی نشان می‌دهد که مدل ما بهترین عملکرد را دارد، که دقت استخراج جاده و اتصال توپولوژیکی جاده را بهبود می‌بخشد. به طور خلاصه، با توجه به و پیشنهادات کاربردی عملی می دهد. نتایج تجربی نشان می‌دهد که مدل ما بهترین عملکرد را دارد، که دقت استخراج جاده و اتصال توپولوژیکی جاده را بهبود می‌بخشد. به طور خلاصه، با توجه بهبخش 5 ، پیشنهاد می‌کنیم هم از پس‌پردازش داده‌ها بر اساس IteR و هم از پیش‌پردازش داده‌ها بر اساس همسان‌سازی هیستوگرام استفاده کنید، اما کاربران باید هم‌زمان هم برای داده‌های آموزشی و هم برای داده‌های برنامه، یکسان‌سازی هیستوگرام را از نظر تصویر انجام دهند.
در کارهای آینده به بررسی استخراج جاده های پیچیده از تصاویر ماهواره ای که یک موضوع تحقیقاتی ضروری و مهم است، ادامه خواهیم داد. ما قصد داریم روش ادغام داده های چند منبعی را اتخاذ کنیم، به ویژه برای ارائه کامل مزیت کمکی داده های بزرگ مکان، و بهبود بیشتر دقت استخراج جاده با معرفی ترکیب اطلاعات چند منبعی مانند جهت و رابطه فضایی. جاده

مشارکت های نویسنده

مفهوم سازی، کای ژو و یان زی. روش شناسی، یان زی و کای ژو. نرم افزار، لی ژانگ و یان زی. اعتبار سنجی، لی ژانگ و یان زی. تحلیل رسمی، کای ژو، ژان گائو، و فانگ میائو. تحقیق، کای ژو و یان زی. منابع، کای ژو و ژان گائو. مدیریت داده، کای ژو؛ نوشتن – آماده سازی پیش نویس اصلی، یان زی، کای ژو، و لی ژانگ. نوشتن-بررسی و ویرایش، یان شی، کای ژو، لی ژانگ، ژان گائو، و فانگ میائو. تجسم، لی ژانگ و یان زی. نظارت، ژان گائو و فانگ میائو. مدیریت پروژه، کای ژو و یان زی. کسب بودجه، کای ژو. همه نویسندگان نسخه منتشر شده نسخه خطی را خوانده و با آن موافقت کرده اند.

منابع مالی

این تحقیق توسط وظیفه اصلی تحقیق و توسعه پروژه برنامه ریزی علم و فناوری سیچوان (2019YFS0067)، تحقیق و استفاده از تکنیک های کلیدی استخراج دینامیکی منطقه ای و نظارت بر تغییرات بصری تصویر سنجش از دور تبت در استان سیچوان (2020YFS0364) تامین شد.

قدردانی

نویسندگان مایلند از شرکت دا چنگ جون تو برای حمایت از محیط محاسباتی تشکر کنند. ضمناً از سردبیران و داوران به خاطر نظرات ارزشمندشان تشکر می کنیم.

تضاد علاقه

نویسندگان هیچ تضاد منافع را اعلام نمی کنند.

منابع

  1. سان، تی. دی، ز. چه، پ. لیو، سی. Wang, Y. استفاده از داده‌های GPS جمع‌سپاری شده برای استخراج جاده از تصاویر هوایی. در مجموعه مقالات کنفرانس IEEE/CVF 2019 در مورد بینایی کامپیوتری و تشخیص الگو (CVPR)، لانگ بیچ، کالیفرنیا، ایالات متحده آمریکا، 15 تا 20 ژوئن 2019؛ ص 16-20. [ Google Scholar ]
  2. الشهی، ر. Marpu، بخش‌بندی مبتنی بر نمودار سلسله مراتبی روابط عمومی برای استخراج شبکه‌های جاده‌ای از تصاویر ماهواره‌ای با وضوح بالا. ISPRS J. Photogramm. Remote Sens. 2017 , 126 , 245–260. [ Google Scholar ] [ CrossRef ]
  3. ژو، ال. ژانگ، سی. Wu, M. D-LinkNet: لینک نت با رمزگذار از پیش آموزش دیده و پیچش گشاد شده برای استخراج جاده تصاویر ماهواره ای با وضوح بالا. در مجموعه مقالات کنفرانس IEEE/CVF 2018 در کارگاه های آموزشی بینایی رایانه و تشخیص الگو (CVPRW)، سالت لیک سیتی، UT، ایالات متحده آمریکا، 18 تا 22 ژوئن 2018؛ صفحات 192-1924. [ Google Scholar ]
  4. ژانگ، ز. لیو، کیو. وانگ، Y. استخراج جاده توسط Deep Residual U-Net. IEEE Geosci. سنسور از راه دور Lett. 2018 ، 15 ، 749-753. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  5. شلهامر، ای. لانگ، جی. دارل، تی. شبکه های کاملاً پیچیده برای تقسیم بندی معنایی. arXiv 2016 , arXiv:1411.4038. [ Google Scholar ] [ CrossRef ]
  6. چن، L.-C.; پاپاندرو، جی. کوکینوس، آی. مورفی، ک. Yuille، AL DeepLab: Semantic Segmentation image with Deep Convolutional Nets، Atrous Convolution، و CRFهای کاملاً متصل. arXiv 2016 , arXiv:1606.00915. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  7. چن، L.-C.; پاپاندرو، جی. شروف، اف. Adam, H. Rethinking Convolution Atrous for Semantic Image Segmentation. arXiv 2017 , arXiv:1706.05587. [ Google Scholar ]
  8. چن، L.-C.; زو، ی. پاپاندرو، جی. شروف، اف. آدام، اچ. رمزگذار-رمزگشا با پیچیدگی قابل جداسازی آتروس برای تقسیم بندی تصویر معنایی. arXiv 2018 , arXiv:1802.02611. [ Google Scholar ]
  9. ژائو، اچ. شی، ج. Qi، X. وانگ، ایکس. شبکه تجزیه صحنه هرمی جیا، جی. arXiv 2016 , arXiv:1612.01105. [ Google Scholar ]
  10. رونبرگر، او. فیشر، پی. Brox، T. U-Net: شبکه های کانولوشن برای تقسیم بندی تصویر زیست پزشکی. arXiv 2015 ، arXiv:1505.04597. [ Google Scholar ]
  11. چاوراسیا، ا. Culurciello، E. LinkNet: بهره‌برداری از بازنمایی‌های رمزگذار برای تقسیم‌بندی معنایی کارآمد. در مجموعه مقالات IEEE Visual Communications and Image Processing (VCIP) 2017، سن پترزبورگ، FL، ایالات متحده آمریکا، 10–13 دسامبر 2017؛ صص 1-4. [ Google Scholar ]
  12. واسوانی، ع. Shazeer، N. پارمار، ن. Uszkoreit، J. جونز، ال. گومز، AN; قیصر، ال. Polosukhin، I. توجه تمام چیزی است که شما نیاز دارید. arXiv 2017 , arXiv:1706.03762. [ Google Scholar ]
  13. جادربرگ، م. سیمونیان، ک. Zisserman، A. شبکه های ترانسفورماتور فضایی. Adv. عصبی Inf. روند. سیستم 2015 ، 28 ، 2017–2025. [ Google Scholar ]
  14. وانگ، اف. جیانگ، م. کیان، سی. یانگ، اس. لی، سی. ژانگ، اچ. وانگ، ایکس. تانگ، X. شبکه توجه باقیمانده برای طبقه بندی تصویر. arXiv 2017 , arXiv:1704.06904. [ Google Scholar ]
  15. وانگ، ایکس. گیرشیک، آر. گوپتا، ا. او، K. شبکه های عصبی غیر محلی. در مجموعه مقالات کنفرانس IEEE/CVF 2018 در مورد دید رایانه و تشخیص الگو، سالت لیک سیتی، UT، ایالات متحده آمریکا، 18 تا 22 ژوئن 2018؛ صفحات 7794-7803. [ Google Scholar ]
  16. ژائو، اچ. ژانگ، ی. لیو، اس. شی، ج. لوی، سی سی; لین، دی. جیا، J. PSANet: شبکه توجه فضایی نقطه‌ای برای تجزیه صحنه. در کامپیوتر ویژن-ECCV 2018 ؛ فراری، وی.، هبرت، ام.، اسمینچیسسکو، سی.، ویس، ی.، ویرایش. انتشارات بین المللی اسپرینگر: چم، سوئیس، 2018; جلد 11213، ص 270–286. شابک 978-3-030-01239-7. [ Google Scholar ]
  17. چن، ی. کالانتیدیس، ی. لی، جی. یان، اس. Feng, J. A^2-Nets: Double Attention Networks. در پیشرفت در سیستم های پردازش اطلاعات عصبی 31 ; Bengio, S., Wallach, H., Larochelle, H., Grauman, K., Cesa-Bianchi, N., Garnett, R., Eds. Curran Associates, Inc.: Red Hook, NY, USA, 2018; صص 352-361. [ Google Scholar ]
  18. لی، ایکس. ژونگ، ز. وو، جی. یانگ، ی. لین، ز. لیو، اچ. شبکه‌های توجه بیشینه‌سازی انتظارات برای تقسیم‌بندی معنایی. arXiv 2019 ، arXiv:1907.13426. [ Google Scholar ]
  19. زی، ی. میائو، اف. ژو، ک. پنگ، J. HsgNet: یک شبکه استخراج جاده بر اساس درک جهانی از اطلاعات فضایی با مرتبه بالا. ISPRS Int. J. Geo.-Inf. 2019 ، 8 ، 571. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  20. Kipf، TN; ولینگ، ام. طبقه بندی نیمه نظارت شده با شبکه های کانولوشن گراف. arXiv 2017 , arXiv:1609.02907. [ Google Scholar ]
  21. بیاجیونی، جی. اریکسون، جی. استنتاج نقشه در مواجهه با نویز و نابرابری. در مجموعه مقالات بیستمین کنفرانس بین المللی پیشرفت در سیستم های اطلاعات جغرافیایی ; انجمن ماشین‌های محاسباتی: نیویورک، نیویورک، ایالات متحده آمریکا، 2012. صص 79-88. [ Google Scholar ]
  22. کاراگیورگو، اس. Pfoser، D.; اسکوتاس، دی. یک رویکرد لایه‌ای برای تولید قوی‌تر نقشه‌های شبکه جاده‌ای از داده‌های ردیابی خودرو. ACM Trans. تف کردن سیستم الگوریتم 2017 . [ Google Scholar ] [ CrossRef ]
  23. لیو، ایکس. بیاجیونی، جی. اریکسون، جی. وانگ، ی. فورمن، جی. ژو، ی. ردیابی GPS پراکنده در مقیاس بزرگ معدن برای استنتاج نقشه: مقایسه رویکردها. در مجموعه مقالات هجدهمین کنفرانس بین المللی ACM SIGKDD در زمینه کشف دانش و داده کاوی ; انجمن ماشین‌های محاسباتی: نیویورک، نیویورک، ایالات متحده آمریکا، 2012. صص 669-677. [ Google Scholar ]
  24. شان، ز. وو، اچ. سان، دبلیو. Zheng, B. COBWEB: یک سیستم به روز رسانی نقشه قوی با استفاده از مسیرهای GPS. در مجموعه مقالات کنفرانس مشترک بین المللی ACM 2015 در محاسبات فراگیر و فراگیر، اوزاکا، ژاپن، 7 تا 11 سپتامبر 2015. ص 927-937. [ Google Scholar ]
  25. وانگ، ی. لیو، ایکس. وی، اچ. فورمن، جی. Zhu, Y. CrowdAtlas: نقشه‌های خودبه‌روزرسانی برای استفاده‌های ابری و شخصی. در مجموعه مقالات یازدهمین کنفرانس بین المللی سالانه سیستم های تلفن همراه، برنامه ها و خدمات، تایپه، تایوان، 25-28 ژوئن 2013. صص 469-470. [ Google Scholar ]
  26. سان، تی. دی، ز. چه، پ. لیو، سی. Wang, Y. استفاده از داده‌های GPS جمع‌سپاری شده برای استخراج جاده از تصاویر هوایی. arXiv 2019 ، arXiv:1905.01447. [ Google Scholar ]
  27. السامرایی، افزایش کنتراست MF تصاویر جاده ها با صحنه های مه آلود بر اساس همسان سازی هیستوگرام. در مجموعه مقالات دهمین کنفرانس بین‌المللی آموزش علوم رایانه (ICCSE) در سال 2015، کمبریج، انگلستان، 22 تا 24 ژوئیه 2015. صص 95-101. [ Google Scholar ]
  28. Shadeed، WG; ابوالنادی، دی; Mismar، MJ تشخیص علائم ترافیکی جاده در تصاویر رنگی. در مجموعه مقالات دهمین کنفرانس بین المللی IEEE در الکترونیک، مدارها و سیستم ها، شارجه، امارات متحده عربی، 14-17 دسامبر 2003. جلد 2، ص 890–893. [ Google Scholar ]
  29. فرناندز کابالرو، آ. مالدونادو باسکون، اس. آسودو رودریگز، جی. لافونته آرویو، اس. López Ferreras، F. یک بهینه سازی در شناسایی پیکتوگرام برای کار تشخیص علائم جاده با استفاده از svms. محاسبه کنید. Vis. تصویر زیر. 2010 ، 114 ، 373-383. [ Google Scholar ]
  30. اونیدینما، ای. Onyenwe، I.; اینییاما، اچ. ارزیابی عملکرد تساوی هیستوگرام و تکنیک های تقویت تصویر فازی در تصاویر با کنتراست کم. بین المللی جی. کامپیوتر. علمی نرم افزار مهندس 2019 ، 8 ، 144-150. [ Google Scholar ]
  31. گونزالس، آرسی Woods, RE Digital Image Processing ; Addison-Wesley: Boston, MA, USA, 1977. [ Google Scholar ]
  32. آهنگ، م. Civco، D. استخراج جاده با استفاده از SVM و تقسیم بندی تصویر. فتوگرام مهندس Remote Sens. 2004 ، 70 ، 1365-1371. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  33. داس، اس. میرنالینی، تی تی; Varghese, K. استفاده از ویژگی های برجسته برای طراحی یک چارچوب چند مرحله ای برای استخراج جاده ها از تصاویر ماهواره ای چندطیفی با وضوح بالا. IEEE Trans. Geosci. Remote Sens. 2011 , 49 , 3906–3931. [ Google Scholar ] [ CrossRef ]
  34. جنید، م. غفور، م. حسن، ع. خالد، س. طارق، س. احمد، جی. ضیا، تی. شبکه عصبی کانولوشنال کم عمق مبتنی بر نمای چند ویژگی برای تقسیم‌بندی جاده. دسترسی IEEE 2020 ، 8 ، 36612–36623. [ Google Scholar ] [ CrossRef ]
  35. سایتو، اس. یاماشیتا، تی. Aoki، Y. استخراج چند شیء از تصاویر هوایی با شبکه های عصبی کانولوشنال. J. Imaging Sci. تکنولوژی 2016 ، 60 ، 104021–104029. [ Google Scholar ] [ CrossRef ]
  36. باستانی، ف. او هست.؛ آببر، س. علیزاده، م. بالاکریشنان، اچ. چاولا، س. مدن، اس. DeWitt, D. RoadTracer: استخراج خودکار شبکه های جاده ای از تصاویر هوایی. در مجموعه مقالات کنفرانس IEEE/CVF 2018 در مورد دید رایانه و تشخیص الگو، سالت لیک سیتی، UT، ایالات متحده آمریکا، 18 تا 22 ژوئن 2018؛ صص 4720–4728. [ Google Scholar ]
  37. شیا، دبلیو. ژانگ، Y.-Z. لیو، جی. لو، ال. یانگ، ک. استخراج جاده از تصویر با وضوح بالا با شبکه پیچیدگی عمیق – مطالعه موردی تصویر GF-2. مجموعه مقالات 2018 ، 2 ، 325. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  38. سنتیلناث، جی. واریا، ن. دوکانیا، ع. آناند، جی. Benediktsson، JA Deep TEC: Deep Transfer Learning با Ensemble Classifier برای استخراج جاده از تصاویر پهپاد. Remote Sens. 2020 , 12 , 245. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  39. یوان، ی. Wang, J. OCNet: Object Context Network برای تجزیه صحنه. arXiv 2018 , arXiv:1809.00916. [ Google Scholar ]
  40. هوانگ، ز. وانگ، ایکس. هوانگ، ال. هوانگ، سی. وی، ی. لیو، W. CCNet: توجه متقاطع برای تقسیم بندی معنایی. arXiv 2018 ، arXiv:1811.11721. [ Google Scholar ]
  41. متعجب.؛ ژانگ، ز. زی، ز. Lin, S. شبکه های ارتباط محلی برای تشخیص تصویر. arXiv 2019 ، arXiv:1904.11491. [ Google Scholar ]
  42. یو، ک. سان، م. یوان، ی. ژو، اف. دینگ، ای. Xu, F. شبکه غیرمحلی تعمیم یافته فشرده. arXiv 2018 , arXiv:1810.13125. [ Google Scholar ]
  43. لیانگ، ایکس. استدلال نمودار نمادین با پیچیدگی ها ملاقات می کند. در مجموعه مقالات سی و دومین کنفرانس بین المللی سیستم های پردازش اطلاعات عصبی ; Curran Associates Inc.: Red Hook، نیویورک، ایالات متحده آمریکا، 2018؛ پ. 11. [ Google Scholar ]
  44. لی، ی. گوپتا، A. فراتر از شبکه‌ها: آموزش بازنمایی نمودار برای تشخیص بصری. در مجموعه مقالات سیستم‌های پردازش اطلاعات عصبی (NeurIPS)، مونترال، QC، کانادا، 3 تا 8 دسامبر 2018؛ پ. 11. [ Google Scholar ]
  45. چن، ی. رورباخ، م. یان، ز. شویچنگ، ی. فنگ، جی. Kalantidis، Y. شبکه های استدلال جهانی مبتنی بر نمودار. arXiv 2018 ، arXiv:1811.12814. [ Google Scholar ]
  46. ژانگ، اس. یان، اس. او، X. LatentGNN: یادگیری روابط کارآمد غیر محلی برای تشخیص بصری. arXiv 2019 ، arXiv:1905.11634. [ Google Scholar ]
  47. او، جی. دنگ، ZY; ژو، ال. وانگ، ی. Qiao، Y. شبکه زمینه هرمی تطبیقی ​​برای تقسیم بندی معنایی. در مجموعه مقالات کنفرانس IEEE/CVF 2019 در مورد بینایی کامپیوتری و تشخیص الگو (CVPR)، لانگ بیچ، کالیفرنیا، ایالات متحده آمریکا، 15 تا 20 ژوئن 2019؛ صفحات 7511–7520. [ Google Scholar ]
  48. فو، جی. لیو، جی. تیان، اچ. لی، ی. بائو، ی. نیش، ز. لو، اچ. شبکه توجه دوگانه برای تقسیم بندی صحنه. arXiv 2018 , arXiv:1809.02983. [ Google Scholar ]
  49. لیو، ام. یین، اچ. شبکه توجه متقاطع برای تقسیم بندی معنایی. arXiv 2019 ، arXiv:1907.10958. [ Google Scholar ]
  50. زو، س. ژونگ، ی. لیو، ی. ژانگ، ال. لی، دی. چارچوب ترکیبی ویژگی عمیق-محلی-جهانی برای طبقه بندی صحنه تصاویر با وضوح فضایی بالا. Remote Sens. 2018 , 10 , 568. [ Google Scholar ]
  51. خو، ی. زی، ز. فنگ، ی. Chen, Z. استخراج جاده از تصاویر سنجش از دور با وضوح بالا با استفاده از یادگیری عمیق. Remote Sens. 2018 , 10 , 1461. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  52. لافرتی، جی. مک کالوم، ا. Pereira، F. میدان های تصادفی شرطی: مدل های احتمالی برای قطعه بندی و برچسب گذاری داده های توالی. در مجموعه مقالات هجدهمین کنفرانس بین المللی یادگیری ماشین، ویلیامزتاون، MA، ایالات متحده آمریکا، 28 ژوئن تا 1 ژوئیه 2001. صص 282-289. [ Google Scholar ]
  53. لائو، ن. میچل، تی. کوهن، WW تصادفی استنتاج و یادگیری در یک پایگاه دانش در مقیاس بزرگ. در مجموعه مقالات کنفرانس 2011 روشهای تجربی در پردازش زبان طبیعی ; انجمن زبانشناسی محاسباتی: ادینبورگ، انگلستان، 2011; صص 529-539. [ Google Scholar ]
  54. برتاسیوس، جی. ترسانی، ال. یو، اس ایکس; Shi, J. شبکه‌های پیاده‌روی تصادفی کانولوشن برای تقسیم‌بندی تصویر معنایی. arXiv 2017 , arXiv:1605.07681. [ Google Scholar ]
  55. وانگ، ایکس. گوپتا، A. ویدئوها به عنوان نمودارهای منطقه فضا-زمان. در مجموعه مقالات چشم انداز کامپیوتر-ECCV 2018 ; فراری، وی.، هبرت، ام.، اسمینچیسسکو، سی.، ویس، ی.، ویرایش. انتشارات بین المللی اسپرینگر: چم، سوئیس، 2018; صص 413-431. [ Google Scholar ]
  56. یانگ، ال. ژوانگ، جی. فو، اچ. ژو، ک. Zheng, Y. SketchGCN: Semantic Sketch Segmentation with Graph Convolutional Networks. arXiv 2020 ، arXiv:2003.00678. [ Google Scholar ]
  57. ولیچکوویچ، پ. کوکورول، جی. کازانووا، آ. رومرو، آ. لیو، پی. Bengio، Y. گراف شبکه های توجه. arXiv 2018 ، arXiv:1710.10903. [ Google Scholar ]
  58. Kipf، TN; ولینگ، ام. رمزگذار خودکار گراف متغیر. arXiv 2016 , arXiv:1611.07308. [ Google Scholar ]
  59. لی، ی. تارلو، دی. بروکشمیت، ام. زمل، R. شبکه های عصبی توالی گراف دردار. arXiv 2017 , arXiv:1511.05493. [ Google Scholar ]
  60. Wegner، JD; Montoya-Zegarra، JA; شیندلر، کی. یک مدل CRF با مرتبه بالاتر برای استخراج شبکه جاده ای. در مجموعه مقالات کنفرانس IEEE 2013 در مورد بینایی کامپیوتری و تشخیص الگو، پورتلند، OR، ایالات متحده آمریکا، 23 تا 28 ژوئن 2013. صفحات 1698-1705. [ Google Scholar ]
  61. چای، دی. فورستنر، دبلیو. لافارژ، F. بازیابی شبکه های خط در تصاویر توسط فرآیندهای نقطه اتصال. در مجموعه مقالات کنفرانس IEEE 2013 در مورد بینایی کامپیوتری و تشخیص الگو، پورتلند، OR، ایالات متحده آمریکا، 23 تا 28 ژوئن 2013. صفحات 1894–1901. [ Google Scholar ]
  62. باترا، ا. سینگ، اس. پانگ، جی. باسو، س. جواهر، CV; Paluri، M. بهبود اتصال جاده با یادگیری مشترک جهت گیری و تقسیم بندی. در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو، لانگ بیچ، کالیفرنیا، ایالات متحده آمریکا، 15 تا 21 ژوئن 2019؛ پ. 9. [ Google Scholar ]
  63. موسینسکا، آ. مارکز-نیلا، پ. کوزینسکی، م. Fua, P. Beyond the Pixel-Wise Loss for Topology-Aware Delineation. در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو، سالت لیک سیتی، UT، ایالات متحده آمریکا، 18 تا 22 ژوئن 2018؛ صص 3136–3145. [ Google Scholar ]
  64. چن، دبلیو. تقسیم بندی جاده بر اساس یادگیری عمیق با لایه احتمال پس پردازش. در مجموعه مقالات ششمین کنفرانس بین المللی مکاترونیک و مهندسی مکانیک، ووهان، چین، 9 تا 11 نوامبر 2019؛ جلد 719، ص. 012076. [ Google Scholar ]
  65. Mnih، V. یادگیری ماشین برای برچسب گذاری تصویر هوایی. Ph.D. پایان نامه، دانشگاه تورنتو، تورنتو، ON، کانادا، 2013. [ Google Scholar ]
  66. ون اتن، ا. لیندنباوم، دی. Bacastow، TM SpaceNet: مجموعه داده سنجش از راه دور و سری چالش. arXiv 2018 , arXiv:1807.01232. [ Google Scholar ]
  67. Kingma، DP; لی، جی آدام: روشی برای بهینه سازی تصادفی. arXiv 2015 ، arXiv:1412.6980. [ Google Scholar ]
  68. ابراهیم، ​​ام اس; وحدت، ع. رنجبر، م. تقسیم‌بندی تصویر معنایی نیمه‌نظارت‌شده Macready، WG با شبکه‌های خود تصحیح‌کننده. arXiv 2020 ، arXiv:1811.07073. [ Google Scholar ]
شکل 1. منحصر به فرد بودن و دشواری استخراج جاده بر اساس تصویر سنجش از دور. سطر اول تصویر آزمایشی اصلی و سطر دوم خروجی پیش بینی است. قرمز، سبز و آبی TP، FN و FP را نشان می دهد ( برای تعاریف به بخش 4.3 مراجعه کنید). ( a – e ) ویژگی های منحصر به فرد و دشوار جاده را نشان می دهد که مطابق با توضیحات بالا (1) ~ (5) است.
شکل 2. معماری شبکه فیوژن (FuNet)، با D-LinkNet به عنوان شبکه ستون فقرات، شامل کدگذاری، ترکیب ویژگی های چند مقیاسی، رمزگشایی، و ماژول تقویت تکرار پس از پردازش (IteR). کادر آبی نقشه ویژگی است و بقیه در افسانه در گوشه سمت راست پایین نشان داده شده اند.
شکل 3. ماژول IteR. اتصال پرش نقطه‌دار نشان می‌دهد که نقشه ویژگی خروجی بلوک اصلی فعلی، ورودی بلوک اصلی بعدی خواهد بود. کادر آبی نقشه ویژگی است.
شکل 4. فرآیند محاسبه ضرر در فرآیند آموزش.
شکل 5. تجسم داده از مجموعه داده پکن. ( الف ) داده های تصویر سنجش از دور؛ ( ب ) داده های برچسب. ( ج ) داده های مکان سیستم موقعیت یابی جهانی (GPS) (نقاط سفید). ( د ) داده های روی هم قرار گرفته و ترکیب شده.
شکل 6. نتایج تجسم. از چپ به راست: ( الف ) تصویر سنجش از دور، ( ب ) برچسب، ( ج ) داده‌های GPS، ( د ) LinkNet، ( ه ) D-LinkNet، ( f ) اتصال جاده، ( g ) HsgNet، ( h ) D-LinkNet + 1D، ( i ) FuNet.
شکل 7. مقایسه نتایج قبل و بعد از ترکیب داده های GPS. ( الف ) تصویر، ( ب ) برچسب، ( ج ) توزیع GPS، ( د ) نتیجه آزمایش استفاده از تصویر اصلی به عنوان داده ورودی به تنهایی، ( ه ) نتیجه آزمایش ترکیب GPS و تصویر سنجش از دور به عنوان داده ورودی .
شکل 8. مقایسه هیستوگرام قبل و بعد از یکسان سازی هیستوگرام. ردیف اول توزیع هیستوگرام تصویر اصلی است و ردیف دوم توزیع هیستوگرام پس از یکسان سازی هیستوگرام است. ( الف ) ستون اول پس‌زمینه، ( ب ) ستون دوم پیش‌زمینه، و ( ج ) ستون سوم ادغام عادی پیش‌زمینه و پس‌زمینه است.
شکل 9. نمایش بصری تقسیم بندی جاده ها با استفاده از تعداد متفاوت بلوک های اساسی. n نشان دهنده تعداد بلوک های اصلی است، ، ، ، ، 5    �=1, 2, 3, 4, 5. ( الف ) تصویر اصلی، ( ب ) داده‌های برچسب، ( ج ) داده‌های موقعیت مکانی GPS، و ( د ) 1�=1، ( ه ) 2�=2، ( f ) 3�=3، ( گرم ) 4�=4, ( h ) 5�=5، جایی که nتعداد بلوک های اساسی IteR است.
شکل 10. رابطه بین عملکرد مدل و شماره بلوک پایه IteR n.

بدون دیدگاه

دیدگاهتان را بنویسید