خلاصه

برچسب‌گذاری معنایی منطقه شهری یک کار ضروری اما چالش برانگیز برای طیف گسترده‌ای از کاربردها مانند نقشه‌برداری، ناوبری و نظارت است. پیشرفت سریع در سیستم‌های تشخیص و محدوده نور (LiDAR) این کار را با استفاده از ابرهای نقطه سه بعدی که در دسترس، مقرون به صرفه، دقیق و قابل اجرا هستند، یک راه‌حل ممکن را فراهم می‌کند. در میان انواع پلت فرم ها، سکوی هوابرد با LiDAR می تواند به عنوان یک ابزار کارآمد و موثر برای نقشه برداری سه بعدی در مقیاس بزرگ در منطقه شهری عمل کند. در برابر این پس زمینه، تعداد زیادی الگوریتم و روش برای کشف کامل پتانسیل ابرهای نقطه سه بعدی توسعه داده شده است. با این حال، ایجاد مجموعه داده‌های مشروح در مقیاس بزرگ در دسترس عموم، که برای ارزیابی عملکرد الگوریتم‌ها و روش‌های توسعه‌یافته حیاتی هستند، هنوز در سنین پایین است. در این کار، ما یک مجموعه داده ابر نقطه LiDAR هوایی را در مقیاس بزرگ ارائه می‌کنیم که در یک منطقه شهری بسیار متراکم و پیچیده برای ارزیابی روش‌های برچسب‌گذاری معنایی به دست آمده است. این مجموعه داده یک منطقه شهری با ساختمان‌های بسیار متراکم تقریباً ۱ کیلومتری را پوشش می‌دهد2 و شامل بیش از سه میلیون نقطه با پنج کلاس از اشیاء برچسب‌گذاری شده است. علاوه بر این، آزمایش‌ها با نتایج چندین روش پایه انجام می‌شوند که امکان‌سنجی و قابلیت مجموعه داده را به عنوان معیاری برای ارزیابی روش‌های برچسب‌گذاری معنایی نشان می‌دهد.

کلید واژه ها:

ابرهای نقطه ALS ; برچسب گذاری معنایی ; منطقه شهری با متراکم بالا ؛مجموعه داده معیار

1. معرفی

برچسب‌گذاری معنایی مناطق شهری یک کار ضروری اما چالش برانگیز برای طیف گسترده‌ای از کاربردها مانند نقشه‌برداری شهر، ناوبری در فضای باز و نظارت بر ترافیک است. پیشرفت سریع سیستم‌های تشخیص و محدوده نور (LiDAR) به حل این کار کمک کرده است و با استفاده از ابرهای نقطه سه‌بعدی به مرحله‌ای در دسترس، مقرون‌به‌صرفه، دقیق و قابل اجرا منجر شده است. در میان انواع سیستم‌های LiDAR که از پلتفرم‌های مختلف استفاده می‌کنند، سیستم هوابرد (یعنی اسکن لیزری هوابرد (ALS) قبلاً ثابت شده است که یک تکنیک همه کاره برای جمع‌آوری داده‌های توپوگرافی در مقیاس بزرگ، با وضوح بالا و بسیار دقیق است که مستقیماً ارائه می‌کند. اندازه گیری ارتفاع زمین [ 1]. اگرچه محققان و مهندسان از پتانسیل داده‌های اسکن لیزری هوابرد (ALS) آگاه بوده‌اند و سعی کرده‌اند از آن در کارهای مختلف استفاده کنند، قبل از هر کاربرد با استفاده از داده‌های ALS چالشی وجود دارد: ما باید اطلاعات معنایی صحنه‌های مشاهده‌شده ارائه‌شده را تفسیر کنیم. توسط ابرهای نقطه سه بعدی ALS. هدف اصلی تفسیر معنایی ابرهای نقطه ALS اختصاص دادن هر نقطه سه بعدی با یک برچسب معنایی منحصر به فرد است که کلاس اشیاء خاص در صحنه را مطابق با اطلاعات هندسی یا رادیومتری ارائه شده توسط خود نقطه و نقاط همسایه آن نشان می دهد. .
برای دستیابی به برچسب گذاری معنایی نقاط، تعداد زیادی الگوریتم و روش برای حل معماهای پنهان در ابرهای نقطه سه بعدی اندازه گیری شده توسعه داده شده است. برای بسیاری از کاربردها و مطالعات، عملکرد الگوریتم یا روش توسعه‌یافته باید از طریق مجموعه داده‌های معیار استاندارد عمومی ارزیابی شود، که به طور قابل‌توجهی به توسعه، ارزیابی و مقایسه الگوریتم کمک می‌کند [ 2 ].]. برای برچسب‌گذاری معنایی ابرهای نقطه ALS، طبیعتاً به چارچوب‌های استاندارد برای انجام فرآیند ارزیابی نیز نیاز داریم که باید توسط مجموعه داده‌های معیار کمک شود. با این حال، ایجاد مجموعه داده‌های مشروح در مقیاس بزرگ در دسترس عموم، که برای ارزیابی عملکرد الگوریتم‌ها و روش‌های توسعه‌یافته حیاتی هستند، هنوز در سنین پایین است. برای این منظور، در این مقاله، یک مجموعه داده ابر نقطه‌ای هوایی در مقیاس بزرگ ارائه شده است که در یک منطقه شهری بسیار متراکم به دست آمده است. این مجموعه داده یک منطقه شهری با ساختمان‌های بسیار متراکم تقریباً 1 کیلومتر مربع را پوشش می‌دهد و شامل بیش از 3 میلیون نقطه با پنج کلاس از اشیاء برچسب‌گذاری شده است. نمونه ای از یک منطقه کوچک از مجموعه داده ارائه شده در شکل 1 نشان داده شده است .
هدف این مقاله معرفی یک مجموعه داده ALS مشروح جدید است که به عنوان معیاری برای ارزیابی روش‌ها و الگوریتم‌های برچسب‌گذاری معنایی ابر نقطه عمل می‌کند. علاوه بر این، با انجام آزمایش‌ها با استفاده از چندین روش مرجع، هدف ما تعیین تأثیر بالقوه استفاده از استراتژی‌های سلسله مراتبی و چند مقیاسی در روش‌های مبتنی بر یادگیری عمیق است. بنابراین، سهم اصلی این مقاله دو جنبه است: یکی ارائه یک مجموعه داده ابر نقطه ای ALS در مقیاس بزرگ با برچسب های نقطه ای برای برچسب گذاری معنایی است. داده‌ها در یک منطقه شهری بسیار متراکم و چالش برانگیز، با انواع مختلف ساختمان‌های پیچیده، زیرساخت‌ها و پوشش گیاهی اندازه‌گیری و حاشیه‌نویسی به دست آمد. با ویژگی های مشابه اما سناریوهای چالش برانگیزتر و اندازه بزرگتر، این مجموعه داده به طور قابل توجهی برای مجموعه داده های برچسب گذاری معنایی ISPRS 3D که معمولاً استفاده می شود مکمل است. سهم دیگر این مقاله ارزیابی و تحلیل عملکرد برچسب‌گذاری معنایی روی مجموعه داده پیشنهادی با استفاده از چندین روش مبتنی بر یادگیری عمیق با در نظر گرفتن استراتژی‌های مقیاس مختلف است. از نتایج ارزیابی، ما تأیید کردیم که عوامل مقیاس تأثیر قابل‌توجهی بر عملکرد شبکه عصبی عمیق برای برچسب‌گذاری معنایی ابر نقطه‌ای در سناریویی که در آن اشیا دارای اندازه‌های هندسی مختلف هستند، دارند.

2. مجموعه داده ها را از LiDAR Point Clouds محک بزنید

در دهه گذشته، طیف گسترده ای از مجموعه داده های معیار برای وظایف مختلف پردازش ابری نقطه ای ارائه شده است. به عنوان مثال، مجموعه داده‌های معیار نابودکننده برای ثبت ابر نقطه‌ای مانند مجموعه داده‌های اسکن‌های دنیای واقعی با همپوشانی کوچک (RESSO) [ 3 ] و مجموعه داده‌های معیار ثبت ابر نقطه‌ای اسکن زمینی LiDAR (TLS) در مقیاس بزرگ (WHU-TLS) وجود دارد. [ 4 ، 5 ]. با توجه به بخش‌بندی معنایی و برچسب‌گذاری معنایی، مجموعه داده‌های معیار فراوانی وجود دارد که ارائه شده‌اند، مانند مجموعه داده‌های اسکن LiDAR تلفن همراه در فضای باز اوکلند (MLS) [ 6 ]، معیار برچسب‌گذاری معنایی ISPRS [ 7 ]، مجموعه داده Semantic3D.net TLS. Semantic3D) [ 8]، مجموعه داده های MLS1-TUM City Campus (2016) [ 9 ]، مجموعه داده های پاریس–لیل-3D MLS [ 10 ]، مجموعه داده های TorontoCity [ 11 ]، و مجموعه داده های Toronto-3D MLS [ 12 ]]. به طور خاص، مجموعه داده TorontoCity شامل داده‌هایی از منابع تصاویر RGB هوایی، پانورامای نمای خیابان، LIDAR نمای خیابان، و LIDAR هوابرد است که کل منطقه بزرگتر تورنتو را پوشش می‌دهد. به جای برچسب‌های حاشیه‌نویسی دستی، از نقشه‌های مختلف با دقت بالا برای ایجاد حقیقت زمینی استفاده شد، که این مجموعه داده را به ابزاری قدرتمند برای ارزیابی روش‌های توسعه‌یافته در طیف گسترده‌ای از کاربردها تبدیل کرد. با این حال، برای هر یک از مجموعه داده‌های ابر نقاط معیار، همیشه یک مرزبندی برای پلتفرم مورد استفاده برای اندازه‌گیری نقاط سه‌بعدی وجود دارد. این به این دلیل است که ویژگی ها، دقت، چگالی و کیفیت انواع مختلف ابرهای نقطه ای به دلیل پلت فرم های مختلف مورد استفاده در اندازه گیری، به طور قابل توجهی متفاوت است [ 13 ].]. بنابراین، برای ارزیابی الگوریتم‌ها و روش‌های طراحی‌شده برای کاربردهای مختلف، باید انواع مختلف ابرهای نقطه‌ای (یعنی ابرهای نقطه‌ای که از انواع مختلف پلت‌فرم‌ها به دست می‌آیند) برای تولید مجموعه داده‌های معیار مورد استفاده قرار گیرند. علاوه بر این، هزینه ها و مشکلات تولید این مجموعه داده های معیار نیز کاملاً متفاوت است. در بخش‌های فرعی بعدی، به بررسی مختصری از تفاوت‌های ویژگی‌های بین ابرهای نقطه LiDAR به‌دست‌آمده با پلت‌فرم‌های مختلف و معرفی مجموعه‌های داده ابر نقطه‌ای ALS برای برچسب‌گذاری معنایی سه بعدی خواهیم پرداخت.
ادامه این مقاله به شرح زیر سازماندهی شده است. در بخش 2 ، بررسی مختصری از مجموعه داده‌های معیار ALS خروجی برای برچسب‌گذاری معنایی ارائه شده است. در بخش 3 ، اطلاعات اساسی و ویژگی‌ها، و همچنین چالش‌های مجموعه داده LASDU ارائه شده توضیح داده شده است. بخش 4 آزمایش های انجام شده را با استفاده از مجموعه داده ارائه شده معرفی می کند. بخش 5 نتایج تجربی را گزارش می‌کند و بحث و تحلیل دقیقی از عملکرد ارائه می‌دهد. در نهایت، بخش 6 مقاله را به پایان می رساند و کارهای آینده را ارائه می دهد.

2.1. تفاوت بین ابرهای نقطه ای LiDAR که با پلتفرم های مختلف به دست آمده اند

همانطور که در بالا ذکر شد، با سیستم‌ها و پلتفرم‌های مختلف LiDAR، مجموعه داده‌های معیار تولید شده با ابرهای نقطه‌ای مختلف، ویژگی‌های مختلفی را نشان می‌دهند. به عنوان مثال، چگالی نقطه می تواند از کمتر از 10 نقطه در متر مربع ( pts/m2 ) تا 5000 pts/m2 [2 متفاوت باشد . به طور کلی، با توجه به پلت‌فرم‌های مورد استفاده در کمپین اندازه‌گیری، ابرهای نقطه‌ای که با سیستم‌های LiDAR به دست می‌آیند به انواع عمده طبقه‌بندی می‌شوند: ابرهای نقطه‌ای TLS، ابرهای نقطه‌ای MLS، و ابرهای نقطه‌ای ALS.
TLS با یک پلت فرم ثابت کار می کند که معمولاً روی سه پایه با موقعیت های اسکنر دقیق و پایدار نصب می شود. TLS می‌تواند اندازه‌گیری‌های میانی و نزدیک را ارائه دهد، و چگالی نقطه‌ای همراه با فواصل اندازه‌گیری متفاوت است [ 14 ]. بنابراین، TLS را می توان برای به دست آوردن ابرهای نقطه ای با دقت بالا در کاربردهایی مانند نقشه برداری داخلی [ 15 ]، باستان شناسی [ 16 ] و نظارت [ 17 ] ساختمان ها و زیرساخت های دست ساز اعمال کرد. با این حال، به دلیل پلت فرم کار ثابت، میدان دید برای TLS همیشه به دلیل انسداد محدود است. این یک مشکل به خصوص در اندازه گیری سناریوهای شهری با ساختمان های شلوغ و مرتفع است.
MLS معمولاً روی یک پلت فرم موبایل (مثلاً اتومبیل یا قایق) کار می کند. در مقایسه با TLS، اسکن لیزری از MLS یک نمای جانبی از نماهای ساختمان و خیابان ها یا سواحل رودخانه ها را ارائه می دهد، که آن را به ابزاری مفید برای کارهایی مانند نقشه برداری سه بعدی شهر [ 18 ] و رانندگی مستقل [ 6 ] تبدیل می کند. علاوه بر این، ابرهای نقطه‌ای از MLS با بهره‌مندی از یک پلت‌فرم انعطاف‌پذیر و متحرک، می‌توانند تا حدی از پدیده‌های انسدادی که در داده‌های به‌دست‌آمده از طریق TLS رخ می‌دهند، جلوگیری کنند. ALS روی هواپیما یا پهپاد کار می کند و اسکن در طول پرواز انجام می شود. اندازه گیری با ALS می تواند یک منطقه بزرگ را پوشش دهد، اما چگالی نقطه به فرکانس اسکن و ارتفاع پرواز بستگی دارد. بر اساس این ویژگی، ALS اغلب در نقشه برداری شهری استفاده می شود [ 7]، تحقیقات کشاورزی، و نقشه برداری جنگلداری [ 19 ]. با این حال، در مراحل اولیه توسعه، ALS تنها می‌تواند ابرهای نقطه‌ای 2.5 بعدی را ارائه دهد که ویژگی‌های آن به DEM یا داده‌های تصویر عمق نزدیک‌تر است. اسکن لیزری انجام شده از طریق یک پلت فرم پهپاد را نیز می توان در ALS دسته بندی کرد. به لطف اندازه کوچکتر و وزن سبک تر پلت فرم خود، ALS مبتنی بر پهپاد می تواند انعطاف پذیری عملیاتی بالایی را ارائه دهد [ 2 ]، که حتی می تواند در یک سناریوی داخلی استفاده شود [ 20 ]. یکی از معایب اصلی ALS ناپایداری پلت فرم کار است، به این معنی که ابرهای نقطه ای که توسط ALS به دست می آیند معمولاً دقت موقعیت جغرافیایی نسبتاً پایینی دارند. در برخی شرایط، جبران حرکت نیز برای پردازش داده مورد نیاز است.

2.2. نماینده مجموعه داده های ابر نقطه ای ALS برای برچسب گذاری معنایی سه بعدی

سکوی متحرک و اندازه گیری از راه دور باعث می شود که ابرهای نقطه ALS در مقایسه با ابرهای TLS و MLS پراکنده و نادرست باشند. عدم دقت سیستم جهانی ناوبری ماهواره ای (GNSS) و واحد اندازه گیری اینرسی (IMU) نیز کیفیت ابرهای نقطه ای ALS اندازه گیری شده را کاهش می دهد. علاوه بر این، اندازه‌گیری ALS در جهت نمای بالا انجام می‌شود، که منجر به این می‌شود که نقاط به‌دست‌آمده بیشتر شبیه یک طرح ریزی از اجسام سه بعدی هستند. به عنوان مثال، تنها سقف و بخش کوچکی از ساختمان در طول اندازه‌گیری اسکن می‌شوند ( شکل 1 را ببینید.). همه این اشکالات تولید مجموعه داده های معیار از ابرهای نقطه ای ALS را پیچیده و زمان بر می کند. در برخی شرایط، حاشیه نویسی نکات باید توسط متخصصان آموزش دیده انجام شود. بنابراین، تنها چند معیار برچسب‌گذاری معنایی قابل دسترسی از ابرهای نقطه‌ای ALS وجود دارد، و نمونه‌های معرف شامل مجموعه داده‌های پردیس شهری و آبنبرگ TUM (TUM-ALS) [ 21 ]، مجموعه داده‌های معیار ISPRS در برچسب‌گذاری معنایی سه بعدی (Vaihingen) است [ 22 ، 23 ]، مجموعه داده هلندی Actueel Hoogtebestand (AHN3) [ 24 ، 25 ]، مجموعه داده ابر نقطه LiDAR مشروح DublinCity (DublinCity) [ 26 ، 27 ]، مجموعه داده مسابقه ادغام داده IEEE GRSS (DFC) [ 28]، مجموعه داده اسکن زمین LiDAR مشروح دیتون (DALES) [ 29 ].

2.2.1. TUM City Campus و Abenberg ALS Dataset

مجموعه داده TUM-ALS ( https://www.iosb.fraunhofer.de/servlet/is/54965/) یک معیار مشارکتی است که توسط Photogrammetry و Remote Sensing، دانشگاه فنی مونیخ، و Fraunhofer-IOSB، Ettlingen، آلمان به دست آمده و ایجاد شده است. این مجموعه داده در پردیس شهری TUM و آبنبرگ به ترتیب در آوریل 2008 و اوت 2009 به دست آمد. این دو محل آزمایش اسکن شده و توسط چهار نوار در یک الگوی متقاطع با تعداد انباشته امتیاز 5.4 میلیون پوشانده شدند. این مجموعه داده در دو دوره اما در مکان های مشابه به دست آمد، که امکان تجزیه و تحلیل بیشتر، مانند تشخیص تغییر را فراهم می کند. در این مجموعه داده، هر نقطه شامل مختصات سه بعدی، موقعیت سنسور، جهت‌های نرمال محلی، شدت پالس-اکوی و برچسب‌های طبقه‌بندی اولیه است. به طور خاص، نقاط این مجموعه داده به چهار کلاس زیر از اشیاء مختلف حاشیه نویسی شده است: سطح زمین، پوشش گیاهی، سطوح دیگر، و اشکال مسطح میانگین چگالی نقطه ای در حدود 16 pts/m است2 . مهمترین جنبه این مجموعه داده این است که از چهار اسکن تقریباً همپوشانی برای یک منطقه مشاهده شده تشکیل شده است، که امکان استفاده برای ارزیابی تشخیص تغییر با اطلاعات معنایی را فراهم می کند. با این حال، منطقه مشاهده شده نسبتا کوچک است و سناریو فقط شامل مناطق مسکونی است.
2.2.2. مجموعه داده های معیار ISPRS در برچسب گذاری معنایی سه بعدی
مجموعه داده Vaihingen ابر نقطه ALS است که به طور رسمی توسط ISPRS منتشر شده است، که برای مسابقه برچسب‌گذاری معنایی سه بعدی ( https://www2.isprs.org/commissions/comm3/wg4/3d-semantic-labeling.html ) نیز ارائه شده است. به عنوان طبقه بندی شهری و بازسازی سه بعدی. این مجموعه داده در آگوست 2008 توسط یک سیستم Leica ALS50 به دست آمد. میانگین ارتفاع پرواز حدود 500 متر بود 45∘میدان دید در این مجموعه داده، هر نقطه حاوی x -، y -، z است– مختصات در فضای اقلیدسی، مقادیر شدت و تعداد بازگشت‌ها. نقاط این مجموعه داده به صورت دستی به 9 کلاس زیر از اشیاء مختلف حاشیه نویسی شده است: خط برق، پوشش گیاهی کم، سطوح غیر قابل نفوذ، اتومبیل ها، حصارها/پرچین ها، سقف ها، نماها، درختچه ها و درختان. کل مجموعه داده به بخش های تست و آموزش تقسیم می شود. بخش آزمایش در مرکز شهر واقع شده است، جایی که ساختمان ها به صورت متراکم و پیچیده با مساحت 389 متر × 419 متر با تقریباً 412000 نقطه وجود دارند. بخش آموزشی عمدتاً شامل خانه‌های مسکونی و ساختمان‌های بلند است که مساحتی معادل 399 متر × 421 متر را پوشش می‌دهد و تقریباً 753000 امتیاز دارد. میانگین چگالی نقطه تقریباً 4 pts/m2 است. مجموعه داده Vaihingen یکی از متداول ترین مجموعه داده های معیار برای برچسب گذاری معنایی در فضای باز است و حاشیه نویسی بسیار دقیقی از اشیاء شهری ارائه می دهد. با این حال، محدود به اندازه مجموعه داده، برخی از دسته‌های اشیاء دارای امتیاز بسیار کمی هستند، به این معنی که در برخی از روش‌های مبتنی بر یادگیری تحت نظارت، فرآیند آموزش ممکن است با مشکلاتی مانند کمبود نمونه‌های آموزشی یا داشتن نمونه‌های آموزشی نامتعادل مواجه شود. علاوه بر این، سناریوی ساختمان‌هایی که به طور مساوی توزیع شده‌اند نیز برای تجزیه آسان‌تر است.
2.2.3. مجموعه داده Actueel Hoogtebestand Nederland
مجموعه داده AHN3 ابر نقطه ALS است که به عنوان بخشی از فایل ارتفاع واقعی هلند (AHN) ( https://downloads.pdok.nl/ahn3-downloadpage/ ) به دست آمده است، که داده های ارتفاعی با وضوح بالا و دقیق را برای کل منطقه ارائه می کند. هلند. چندین نسخه از مجموعه داده های AHN وجود دارد و جدیدترین و دقیق ترین آنها AHN3 است. مجموعه داده با رویکرد اسکن لیزری FLI-MAP در آوریل 2010 به دست آمد. در این مجموعه داده، هر نقطه دارای x -، y – و z است.– مختصات در فضای اقلیدسی، مقادیر شدت، تعداد بازگشت و زمان GPS. نقاط به صورت دستی به پنج کلاس مختلف اشیاء زیر مشروح شده اند: سطح زمین، آب، ساختمان ها، اشیاء مصنوعی، و طبقه بندی نشده (از جمله پوشش گیاهی). کل مجموعه داده به طور خاص به بخش های آزمایشی و آموزشی تقسیم نمی شود و معمولاً تنها بخشی از مجموعه داده AHN3 برای آزمایش ها استفاده می شود. میانگین چگالی نقطه ای از حدود 8-60 pts/m2 متغیر است. مجموعه داده AHN مجموعه داده بسیار بزرگی را ارائه می دهد و نه تنها مناطق شهری، بلکه مناظر طبیعی و سطوح آب را نیز پوشش می دهد، که زمینه های کاربردی آن را گسترش می دهد. با این حال، تعداد دسته‌های مشروح اشیاء پتانسیل آن را در برخی از وظایف نقشه‌برداری دقیق محدود کرده است. علاوه بر این، برای استفاده به عنوان یک مجموعه داده معیار، مجموعه آموزشی و مجموعه تست در AHN3 مشخص نشده است، که استفاده از این مجموعه داده را در مقایسه با سایرین محدود می کند.
2.2.4. مجموعه داده‌های ابر نقطه‌ای LiDAR مشروح‌شده DublinCity
مجموعه داده DublinCity اولین ابر نقطه ALS بسیار متراکم در مقیاس شهر است و بخشی از داده های ALS مرکز شهر دوبلین است که توسط پروژه بررسی لیزر هوایی و فتوگرامتری مجموعه شهر دوبلین در سال 2015 به دست آمده است. ( https://archive.nyu.edu/handle/2451/38684?mode=full). این مجموعه داده توسط یک سیستم LiDAR در یک هلیکوپتر در سال 2015 با پرواز حدود 300 متر بدست آمد. همه نقاط به صورت دستی با برچسب هایی از 13 کلاس (به عنوان مثال، ساختمان ها، درختان، نماها، پنجره ها، و خیابان ها) در سه سطح سلسله مراتبی حاشیه نویسی شده اند. در سطح اول، امتیازات با برچسب گذاری درشت چهار طبقه اختصاص داده می شود: ساختمان ها، زمین، پوشش گیاهی و تعریف نشده. در سطح دوم، سه دسته اول سطح اول به طبقات بیشتری از جمله سقف، نما، درختان، بوته ها، خیابان ها، پیاده روها و چمن اصلاح می شوند. در سطح سوم، درها و پنجره های سقف و نما بیشتر از هم جدا شده اند. داده های مشروح شامل بیش از 260 میلیون نقطه است که مساحتی در حدود 2 کیلومتر مربع را پوشش می دهد . میانگین چگالی نقطه 348.43 pts/m2 است. جذاب ترین ویژگی مجموعه داده DublinCity، چگالی بالای آن است که امکان بازسازی سه بعدی دقیق مدل های ساختمان را با سطح بالایی از جزئیات فراهم می کند. علاوه بر این، سیستم حاشیه نویسی سلسله مراتبی این مجموعه داده نیز هنگامی که برای کارهایی با سطوح مختلف دقت مورد نیاز اعمال می شود، ارزش زیادی دارد. با این حال، اکثر برنامه‌های کاربردی در فضای باز، و همچنین الگوریتم‌ها و روش‌های مرتبط، همچنان از چگالی نقطه نسبتاً پایینی در نقشه‌برداری در مقیاس بزرگ برای مبادله بین هزینه‌ها و دقت استفاده می‌کنند. بنابراین، برای چنین کاربردها و روش‌هایی، یک معیار با چگالی نقطه نسبتاً کم که شرایط رایج را برآورده می‌کند، مناسب‌تر خواهد بود. علاوه بر این، چگالی نقطه بالا نیز نیازمند کارایی محاسباتی الگوریتم‌ها است.
2.2.5. مجموعه داده مسابقه فیوژن داده IEEE GRSS (DFC)
مجموعه داده DFC یک مجموعه داده معیار مرتبط با طبقه بندی است که در مسابقه ادغام داده های IEEE GRSS در سال 2018 استفاده شد [ 28 ] ( https://www.grss-ieee.org/community/technical-committees/data-fusion/2018 -ieee-grss-data-fusion-contest/). مجموعه داده توسط مرکز ملی نقشه برداری لیزری هوابرد (NCALM) با استفاده از Optech Titan MW (14SEN/CON340) با دوربین یکپارچه به دست آمد. تمام نکات به صورت دستی به 20 دسته کاربری و پوشش زمین حاشیه نویسی شده است. این مجموعه داده در قالب یک DEM با شطرنجی در فاصله نمونه برداری از زمین 0.5 متر (GSD) ارائه شده است. همراه با DEM، تصاویر چند طیفی از همان منطقه نیز ارائه شده است. مجموعه داده DFC بیشترین تعداد دسته بندی اشیاء مشروح را دارد و منطقه نسبتاً زیادی را پوشش می دهد. علاوه بر این، اطلاعات طیفی نیز ارائه می شود که ویژگی های داده ها را برای کاربردهای بیشتر غنی می کند. به عنوان مثال، اطلاعات چند طیفی ارائه شده توسط مجموعه داده DFC می‌تواند تنوع ویژگی‌هایی را که می‌توان برای توسعه الگوریتم‌ها و روش‌ها مورد استفاده قرار داد، بسیار افزایش داد. برخی از داده های LiDAR شکل موج کامل نیز می توانند برای برنامه های جنگلداری مفید باشند. با این حال، مجموعه داده در DEM ساختار یافته است که مقدار مشخصی از اطلاعات سه بعدی را از دست می دهد. بنابراین، این مجموعه داده نیز به عنوان نوعی مجموعه داده تصویری با اطلاعات عمق در نظر گرفته می شود. علاوه بر این، چگالی نقطه پراکنده آن نیز کاربردهای بالقوه آن را محدود می کند.
2.2.6. مجموعه داده اسکن زمین LiDAR مشروح دیتون
مجموعه داده DALES [ 29 ] جدیدترین مجموعه داده هوایی LiDAR در مقیاس بزرگ است که توسط دانشگاه دیتون با استفاده از سیستم دو کاناله Riegl Q1560 که در یک Piper PA31 Panther Navajo ( https://udayton.edu/engineering/research/centers ) به دست آمده است. /vision_lab/research/was_data_analysis_and_processing/dale.php ). ارتفاع پرواز 1300 متر بود که حداقل 400% همپوشانی اسکن ها را تضمین می کرد. کل ابر نقطه‌ای هوایی LiDAR 330 کیلومتر مربع بر فراز شهر سوری در بریتیش کلمبیا، کانادا اندازه‌گیری شده است و شامل بیش از نیم میلیارد نقطه با برچسب دستی است که 10 کیلومتر مربع را پوشش می‌دهد .از منطقه و شامل هشت کلاس از اشیاء. DALES داده‌های حاشیه‌نویسی را به‌طور تصادفی به کاشی‌های آموزشی و آزمایشی با نسبت تقریباً ۷۰ تا ۳۰ درصد کج کرده است. یکی از مهم ترین ویژگی های DALES اندازه بزرگ آن است که در واقع به طور ویژه برای ارزیابی الگوریتم های یادگیری عمیق سه بعدی طراحی شده است.
2.2.7. محدودیت‌های مجموعه داده‌های معیار فعلی ابرهای نقطه‌ای ALS
برای به دست آوردن تصور بهتر از مجموعه داده های معیار فعلی ابرهای نقطه ALS، در جدول 1 ، مقایسه ای از شاخص های جامع مجموعه داده های ذکر شده در بالا ارائه می دهیم.
با ترکیب اطلاعات جدول 1 و نقاط قوت و ضعفی که در مقدمه مجموعه داده های موجود ذکر کردیم، می توانیم چندین محدودیت را در مجموعه داده های معیار ALS فعلی پیدا کنیم و نکاتی را ارائه کنیم.
اولین نکته اندازه محدود مناطق تحت پوشش است. ابر نقطه ALS به ویژه برای نقشه برداری سه بعدی در مقیاس بزرگ مناسب است. بنابراین، برای الگوریتم‌ها و روش‌های توسعه‌یافته، کارایی مقابله با داده‌های مقیاس بزرگ باید به عنوان یک عامل حیاتی در نظر گرفته شود. این بدان معناست که در مرحله ارزیابی، باید معیاری در مقیاس بزرگ ارائه کنیم. با این حال، برای بسیاری از مجموعه‌های داده، اندازه ابرهای نقطه مشروح شده توسط هزینه و مشکلات در جمع‌آوری داده و حاشیه‌نویسی محدود می‌شود. اگرچه مجموعه داده AHN3 یک منطقه پوششی بسیار بزرگ را فراهم می کند، مجموعه داده های آموزشی و آزمایشی به طور پیش فرض اختصاص داده نمی شوند، که ممکن است منجر به مقایسه ناعادلانه نتایج ارزیابی با انتخاب عمدی مناطق تحقیق شود. مجموعه داده DALES این مشکل را حل کرده است، که منطقه بزرگی را در بر می گرفت و مجموعه داده های آموزشی و آزمایشی را با کاشی کاری تصادفی ثابت می کرد. با این حال، این مجموعه از مجموعه داده های آموزشی و آزمایشی کاملاً متفاوت از روشی است که در متداول ترین مجموعه داده Vaihingen استفاده می شود، که نمی تواند مستقیماً به عنوان مکمل برای آن عمل کند. نکته دوم ناشی از چگالی نقطه و فیلدهای ویژگی است. از نظر تئوری، هر چه چگالی نقطه بالاتر باشد، جزئیات بیشتری از جسم زمین قابل اندازه گیری و نمایش است. با این حال، محدود به ارتفاع پرواز و عملکرد دستگاه های LiDAR، اکثر مجموعه داده های معیار ALS می توانند تنها ابرهای نقطه پراکنده را ارائه دهند. استثنا مجموعه داده DublinCity است که بالاترین تراکم نقطه را در بین تمام مجموعه داده های معیار محبوب ALS ارائه می دهد. با این حال، همانطور که در مقدمه این مجموعه داده اشاره کردیم، اکثر الگوریتم‌ها و روش‌های طراحی‌شده برای کاربردهای فضای باز در مقیاس بزرگ برای مجموعه‌های داده با تراکم نقطه نسبتاً کم توسعه داده شده‌اند که به یک معیار مناسب نیاز دارد. علاوه بر این، تراکم نقطه بالا چالش های خاص خود را در مورد هزینه ها و حاشیه نویسی به همراه دارد. فیلدهای ویژگی غنی می توانند اطلاعات بیشتری را در برنامه های کاربردی بالقوه ارائه دهند و گنجاندن اطلاعات طیفی می تواند به طور قابل توجهی عملکرد روش های طبقه بندی را افزایش دهد. با این حال، به عنوان یک مجموعه داده معیار برای برچسب‌گذاری معنایی، کمک کمتری به الگوریتم‌ها و روش‌های مبتنی بر هندسه خالص می‌کند. آخرین اظهار نظر ما مربوط به سناریوی بررسی مناطق تحت پوشش مجموعه داده است. سبک‌ها، تراکم و توزیع ساختمان‌ها، پوشش گیاهی و زیرساخت‌ها، منظره‌های شهری متفاوتی را تشکیل می‌دهند. نشان دادن ویژگی های متنوع ابرهای نقطه به دست آمده. برای مجموعه داده های معیار، زمانی که از مناطقی با سناریوهای مختلف به دست می آیند، ویژگی های متفاوتی خواهند داشت. الگوریتم ها و روش های مختلف معمولاً از عملکرد ناسازگار در مجموعه داده های مختلف رنج می برند. بنابراین، الگوریتم‌ها یا روش‌های طراحی‌شده برای وظایف خاص (مثلاً استخراج ساختمان) باید توسط مجموعه داده‌های معیار مربوطه ارزیابی شوند. در غیر این صورت، ارزیابی مغرضانه خواهد بود. برای این منظور، مجموعه داده‌های معیاری که انواع سناریوهای چالش برانگیز را پوشش می‌دهند (به عنوان مثال، منطقه مسکونی، منطقه حومه‌ای، مناظر طبیعی) مورد نیاز است تا به کاربردهایی با اهداف مختلف خدمت کند. الگوریتم ها و روش های مختلف معمولاً از عملکرد ناسازگار در مجموعه داده های مختلف رنج می برند. بنابراین، الگوریتم‌ها یا روش‌های طراحی‌شده برای وظایف خاص (مثلاً استخراج ساختمان) باید توسط مجموعه داده‌های معیار مربوطه ارزیابی شوند. در غیر این صورت، ارزیابی مغرضانه خواهد بود. برای این منظور، مجموعه داده‌های معیاری که انواع سناریوهای چالش برانگیز را پوشش می‌دهند (به عنوان مثال، منطقه مسکونی، منطقه حومه‌ای، مناظر طبیعی) مورد نیاز است تا به کاربردهایی با اهداف مختلف خدمت کند. الگوریتم ها و روش های مختلف معمولاً از عملکرد ناسازگار در مجموعه داده های مختلف رنج می برند. بنابراین، الگوریتم‌ها یا روش‌های طراحی‌شده برای وظایف خاص (مثلاً استخراج ساختمان) باید توسط مجموعه داده‌های معیار مربوطه ارزیابی شوند. در غیر این صورت، ارزیابی مغرضانه خواهد بود. برای این منظور، مجموعه داده‌های معیاری که انواع سناریوهای چالش برانگیز را پوشش می‌دهند (به عنوان مثال، منطقه مسکونی، منطقه حومه‌ای، مناظر طبیعی) مورد نیاز است تا به کاربردهایی با اهداف مختلف خدمت کند.

3. LASDU: ابرهای نقطه ای هوایی LiDAR در مقیاس بزرگ از مناطق شهری بسیار متراکم

بر اساس تجزیه و تحلیل محدودیت‌ها و مشکلات موجود در مجموعه داده‌های معیار فعلی ابرهای نقطه‌ای ALS، یک مجموعه داده هوایی جدید LiDAR با نام LASDU (داده‌های ALS در مقیاس بزرگ برای برچسب‌گذاری معنایی در مناطق متراکم شهری) ارائه می‌کنیم که برای برچسب‌گذاری معنایی ابرهای نقطه‌ای ALS در مناطق شهری بسیار متراکم

3.1. اکتساب داده ها

این مجموعه داده بخشی از داده‌های به‌دست‌آمده در کمپین‌های پروژه HiWATER (تحقیق تجربی تله متری متحد حوضه Heihe) [ 30 ] بود. منطقه مورد مطالعه در دره کنار رودخانه هیهه در شمال غربی چین است. توپوگرافی منطقه مورد مطالعه تقریباً مسطح و با میانگین ارتفاع 1550 متر است. ابرهای نقطه ای ALS در ابتدا در جولای 2012 با استفاده از سیستم ALS70 لایکا در هواپیمای با ارتفاع پرواز حدود 1200 متر به دست آمدند. کیفیت هندسی این مجموعه داده در انتشار قبلی [ 31 ] ارائه شده است، که نشان می دهد میانگین چگالی نقطه تقریباً 3-4 pts/m2 و دقت عمودی بین 5-30 سانتی متر بوده است. مجموعه داده مشروح یک منطقه شهری حدود 1 کیلومتر را پوشش می دهد2 ، با ساختمان های مسکونی و صنعتی بسیار متراکم. در شکل 2 ، نقشه ارتفاع مجموعه داده نشان داده شده است، با ارتفاع منطقه مورد مطالعه نشان داده شده است. از شکل 2 می بینیم که منطقه مشروح تقریباً مسطح است و حداکثر اختلاف ارتفاع تنها حدود 70 متر است که به دلیل ارتفاعات مختلف ساختمان ها ایجاد می شود.

3.2. توضیحات داده ها

تعداد کل نکات مشروح تقریباً 3.12 میلیون است. کل ابر نقطه برچسب گذاری شده منطقه مورد بررسی به چهار بخش تقسیم شده است و تعداد نقاط این چهار بخش به ترتیب حدود 0.77 میلیون، 0.59 میلیون، 1.13 میلیون و 0.62 میلیون است. در شکل 3 ب، تفکیک منطقه مورد مطالعه نشان داده شده است.
نقاط همان بخش به طور جداگانه در فایل های .las جداگانه ذخیره شدند. جداسازی و حاشیه نویسی نقاط به صورت دستی با استفاده از CloudCompare 2.10 ( https://www.danielgm.net/cc/ ) با دقت نقطه ای انجام شد. در فایل las، هر نقطه با هفت ویژگی زیر تخصیص داده شد:
  • موقعیت ها: ثبت مختصات سه بعدی هر نقطه، با واحد متر در طرح UTM.
  • Intensity: ثبت شدت بازتاب هر نقطه، با محدوده بین 0 تا 255.
  • لبه خط پرواز: مقدار 1 را فقط زمانی نشان می دهد که نقطه در پایان اسکن باشد.
  • جهت اسکن: نشان دهنده جهت آینه اسکنر هنگام ارسال یک پالس.
  • تعداد بازگشت: ثبت تعداد برگشت های متعدد در هر پالس ارسالی.
  • زاویه اسکن: ضبط زاویه اسکن هر نقطه بر حسب درجه.
  • برچسب‌ها: کلاس‌های شیء نمایه‌سازی هر نقطه، با شاخص عدد صحیح از 0 تا 5.

برای به دست آوردن برداشت بیشتر از کیفیت داده ها، تراکم نقاط و در بخش های مختلف به روش آماری تجزیه و تحلیل می شود. برای محاسبه چگالی نقاط، چگالی نقطه محلی (LPD) [ 32 ] ابر نقطه محاسبه می شود:

LPD=کπ·دک2

که در آن k تعداد همسایگان درگیر و دکبه ترتیب مخفف فاصله از نقطه مرکزی تا دورترین همسایه آن است.

در شکل 4 ، توزیع تراکم نقاط نشان داده شده توسط LPD در بخش های مختلف آورده شده است. در این شکل، محور افقی نشان‌دهنده LPD‌های مختلف نقاط است و محور عمودی نشان‌دهنده تعداد نقاط با تراکم نقطه محلی مشخص است. همانطور که از شکل 4 مشاهده می شود ، چگالی نقطه ای این چهار بخش عموماً در مقدار LPD در حدود 3 pts/m2 متمرکز می شود . چگالی ابر نقطه بخش 3 بزرگتر از بخش های 1 و 2 است و به حدود 3.5 pts/m2 می رسد .. این عمدتا به دلیل ساختمان‌های مرتفع و درختان است که ساختار شی بسیار پیچیده‌ای را با نقاط بیشتری اسکن می‌کنند. در مقابل، چگالی نقطه ای بخش 4 در مقدار LPD تنها در حدود 2.7 pts/m2 متمرکز می شود که توزیع نقطه پراکنده ناشی از یک سناریوی ساده در این بخش را نشان می دهد. به طور کلی، ما فرض می‌کنیم که چگالی نقاط در این مجموعه داده ثابت است، زیرا فاصله‌های اندازه‌گیری تقریباً ثابت ALS منجر به چگالی نقاط مشابه می‌شود.
در مورد حاشیه نویسی نقاط، ما به صورت دستی این منطقه را با پنج کلاس مختلف از اشیا و یک کلاس از نقاط طبقه بندی نشده برچسب گذاری کرده ایم و نقاط برچسب های مختلف با رنگ های مختلف ارائه می شوند:
  • برچسب 1: زمین (کدهای رنگی: #AFAFAF): زمین مصنوعی، جاده، زمین بایر.
  • برچسب 2: ساختمان ها (کدهای رنگی: #00007F): ساختمان ها.
  • برچسب 3: درختان (کدهای رنگی: #09781A): درختان بلند و کم ارتفاع.
  • برچسب 4: پوشش گیاهی کم (کدهای رنگی: #AAFF7F): بوته ها، چمن، تخت گل.
  • برچسب 5: مصنوعات (کدهای رنگی: #FF5500): دیوارها، نرده ها، تیرهای چراغ برق، وسایل نقلیه، سایر اشیاء مصنوعی.
  • برچسب 0: طبقه بندی نشده (کدهای رنگی: #000000): نویز، نقاط پرت، و نقاط بدون برچسب.
در شکل 5، آمار درصد نقاط برچسب گذاری شده در بخش های مختلف آورده شده است. از آمار، می‌توان دریافت که برای هر چهار بخش، درصد اشیاء مختلف گرایش مشابهی را نشان می‌دهند، اما به صورت نامتعادل. نقاط زمین بیشترین درصد را در حدود 40٪ تا 55٪ اشغال می کنند، در حالی که درصد نقاط ساختمانی با ارزش حدود 30٪ در رتبه دوم قرار دارد، به جز قسمت 4. نقاط آثار تنها به حدود 4٪ در بین تمام موارد می رسد. نکات مشروح هنگام تلاش برای استفاده از آنها به عنوان مجموعه داده های آموزشی و آزمایشی، توزیع نامتعادل درصد نقاط برچسب گذاری شده در هر بخش باید در نظر گرفته شود. توصیه می شود از بخش های 2 و 3 به عنوان داده های آموزشی و از بخش های 1 و 4 به عنوان داده های آزمایشی برای کار برچسب گذاری معنایی استفاده شود.
در شکل 6 ، نمونه هایی از نقاط حاشیه نویسی اشیاء مختلف در مقایسه با اشیاء در تصاویر ماهواره ای آورده شده است. همانطور که از شکل 6 مشاهده می شود ، به وضوح می توانیم ببینیم که ساختمان های بلند متراکم مستقیماً با یکدیگر همسایه هستند و همیشه با پوشش گیاهی کم مانند بوته ها و تخت های گل احاطه شده اند که جداسازی آنها را دشوار می کند. علاوه بر این، درختان معمولاً توسط بوته ها احاطه شده اند یا روی چمن هستند. چالش برانگیزترین بخش، مصنوعات است که نه تنها وسایل نقلیه بلکه دیوارهای کوتاه موقت در محل ساختمان‌های تخریب شده و پرچین‌ها در زمین‌های لخت را نیز شامل می‌شود. این اجسام کوچک دارای اشکال نامنظم و دارای ویژگی های هندسی مشابه بوته ها هستند. در شکل 6ج، ما حتی می توانیم تفاوت های ظاهری بین ابر نقطه اندازه گیری شده و تصویر ماهواره ای را به دلیل تغییرات دینامیکی در این ناحیه مشاهده کنیم.
در شکل 7 ، نقشه برچسب گذاری شده ابر نقطه ALS در کل منطقه آزمایشی با اشیاء مختلف با رنگ های مختلف ارائه شده است. تمام ساختمان های بسیار متراکم، درختان شلوغ، و مصنوعات با شکل نامنظم را می توان به وضوح مشاهده کرد، که نشان دهنده وظیفه چالش برانگیز برچسب زدن معنایی تمام نقاط در این سناریو است.

3.3. ویژگی های مجموعه داده LASDU

برای این مجموعه داده، بلوک های شهر مشاهده شده هم منطقه بدون تغییر و هم منطقه تغییر یافته را پوشش می دهند. ناحیه بدون تغییر، ناحیه ای است که در آن اشیاء پایدار (به عنوان مثال، جاده، ساختمان ها، درخت) در طول سال ها هنگام مقایسه ابر نقطه ای و تصویر ماهواره ای تغییر نکرده اند. اشیاء دینامیکی مانند وسایل نقلیه متحرک شامل نمی شوند. در شکل 8 ، مثالی از ناحیه بدون تغییر ارائه می دهیم. توجه داشته باشید که ابر نقطه در سال 2012 به دست آمد، در حالی که تصویر ماهواره ای در سال 2014 گرفته شده است. منطقه تغییر در این داده ها عمدتا به سایت های ساخت و ساز اشاره دارد. در طول به دست آوردن ابر نقطه ALS، چندین پروژه ساخت و ساز در حال انجام (برای یک ساختمان یا برای یک منطقه کامل) وجود داشت. در شکل 9، نمونه ای از منطقه تغییر با ساختمانی را که در بازه زمانی بین دستیابی به ابر نقطه و تصویر ماهواره ای به پایان رسیده است، ارائه می دهیم. موقعیت این سایت ساخت و ساز با یک کادر سفید رنگ در شکل مشخص شده است.
علاوه بر این، در شکل 10 ، نمای دقیقی از ابر نقطه محل ساخت و ساز فوق الذکر ارائه می دهیم. نقاط با مقادیر شدت خود ارائه می شوند. وضعیت این محل ساخت در مرحله ساخت سازه از گودال پی بود. همانطور که از شکل 10 مشاهده می شود ، می توانیم نقاط جرثقیل و بیل مکانیکی را تعیین کنیم. قالب ها و سازه های بتنی فولادی در این گودال پی نیز قابل مشاهده است. این امر برای مطالعات تشخیص اشیاء در سایت ساخت و ساز از مجموعه داده های ALS جالب خواهد بود.
علاوه بر این، این سایت های ساخت و ساز همچنین نشان می دهد که منطقه مورد بررسی با تغییرات زیادی در ساختمان ها و جاده ها توسعه قابل توجهی را تجربه کرده است. یک مجموعه داده با ساختمان های تغییر یافته برای تحقیقات تشخیص تغییر جالب تر خواهد بود. این نیز دلیلی است که ما به طور ویژه منطقه سایت های ساخت و ساز را در مجموعه داده انتخاب و ذکر کردیم. با توجه به شرایطی که مجموعه داده ارائه شده ما هیچ اندازه گیری چند زمانی ندارد، بنابراین انجام مقایسه بین ابرهای نقطه برای چنین تحقیقات تشخیص تغییر غیرممکن است. با این حال، انجام تشخیص تغییرات بین مجموعه داده های ALS ارائه شده ما و جدیدترین تصاویر ماهواره ای از Google Maps همچنان ارزشمند است، زیرا چشم انداز به شدت تغییر کرده است.

3.4. اهمیت مجموعه داده LASDU

در مقایسه با مجموعه داده های ALS موجود، اهمیت عمده مجموعه داده LASDU دو مورد است: اول، مجموعه داده های مقیاس بزرگ قابل مقایسه در مقایسه با مجموعه های موجود، به ویژه برای متداول ترین مجموعه داده Vaihingen ارائه می دهد. دوم، سناریوی بسیار پیچیده ای را پوشش می دهد که برچسب زدن آن چالش برانگیز است.

3.4.1. اندازه داده در مقیاس بزرگ قابل مقایسه

با توجه به اندازه مجموعه داده، با مقایسه با مجموعه داده معروف Vaihingen، مجموعه داده LASDU از یک صحنه در فضای باز شهری است که توسط یک سیستم هوایی LiDAR با حسگر ALS جمع آوری شده است. با این حال، LASDU. با مساحت کل تقریباً 1 کیلومتر مربع ، تقریباً چهار برابر بزرگتر از مجموعه داده Vaihingen است که حدود 0.4 کیلومتر مربع را پوشش می دهد .و شامل چهار برابر تعداد امتیاز است. اگرچه اندازه منطقه تحت پوشش در LASDU کوچکتر از DFC، DALES و AHN3 است، اما هنوز با اندازه DublinCity قابل مقایسه است و بهتر از مجموعه داده قبلی TUM-ALS ما است، که صرفاً منطقه اطراف پردیس شهری TUM را پوشش می داد. از یک طرف، اندازه مجموعه داده بزرگ، نیاز آموزش الگوریتم‌ها و روش‌های مبتنی بر یادگیری عمیق را برآورده می‌کند. از سوی دیگر، یک مجموعه داده بزرگ چالش کارایی را افزایش می دهد و این به وضعیت واقعی برای نقشه برداری شهری در مقیاس بزرگ نزدیک تر است.
با توجه به تعداد کلاس‌های برچسب‌گذاری‌شده، مجموعه داده‌های LASDU و Vaihingen هر دو با تعداد مشابهی از کلاس‌ها برای برچسب‌گذاری معنایی برچسب‌گذاری شده‌اند، که جزئیات بیشتری نسبت به TUM-ALS و AHN3 دارد اما از حاشیه‌نویسی DublinCity و DFC پایین‌تر است. با این حال، انواع اصلی اشیاء (به عنوان مثال، ساختمان ها و پوشش گیاهی) در نظر گرفته شده در وظایف نقشه برداری شهری در LASDU گنجانده شده است. یک حاشیه نویسی دقیق، تفسیر معنایی صحنه شهری را تسهیل می کند، اما افزایش هزینه غیرقابل قبول و اجرای برچسب گذاری دستی غیرممکن خواهد بود [ 11 ]]. با توجه به تراکم نقاط، مجموعه داده DublinCity چگالی نقطه ای بسیار بالاتری نسبت به ما دارد و تراکم نقطه بالاتر وظایفی مانند بازسازی سه بعدی در سناریوهای شهری را بهبود می بخشد. با این حال، ابرهای نقطه‌ای اندازه‌گیری شده با چنین چگالی بالایی معمولاً منابع داده‌ای در دسترس برای نقشه‌برداری شهری در مقیاس بزرگ، به ویژه برای برنامه‌های کاربردی در کشورهای در حال توسعه نیستند. علاوه بر این، تراکم بالای نقاط اندازه‌گیری شده، هزینه نقشه‌برداری و مشکلات حاشیه‌نویسی را افزایش می‌دهد. بنابراین، مجموعه داده LASDU ارائه شده دارای یک اندازه داده در مقیاس بزرگ است در حالی که دارای تعداد معقولی از کلاس های برچسب گذاری شده و چگالی نقطه است.
3.4.2. سناریوهای چالش برانگیز و پیچیده
در مقایسه با سایر مجموعه‌های داده، مجموعه داده LASDU با سناریوی چالش برانگیز و پیچیده‌اش مشخص می‌شود که چالش‌های بیشتری را برای انجام برچسب‌گذاری معنایی کافی نقاط به همراه دارد. این همچنین ارزیابی انتقادی تری از روش ها و الگوریتم های توسعه یافته ارائه می دهد. مجموعه داده LASDU منطقه ای پر از ساختمان های بسیار متراکم را پوشش می دهد. بر خلاف توزیع یکنواخت ساختمان ها در مجموعه داده Vaihingen، مجموعه داده LASDU دارای تغییرات اساسی تر در تراکم ساختمان است. به عنوان مثال، در برخی از مناطق، تراکم بسیار بالایی از ساختمان ها وجود دارد، در حالی که مکان های دیگر فقط دارای زیرساخت های کم هستند، اما درختان و بوته های انبوه دارند. علاوه بر این، در مقایسه با مناطق مسکونی ثبت شده در مجموعه داده‌های TUM-ALS، DublinCity و DFC، مجموعه داده LASDU یک منطقه ترکیبی را اسکن کرد. انواع ساختمان‌های شامل مجموعه داده‌های LASDU از ساختمان‌های مسکونی گرفته تا ساختمان‌های صنعتی متفاوت است و مجموعه داده‌ها حتی مکان‌های ساخت و ساز را با تغییرات پویا ثبت می‌کند. همه اینها چالش های توسعه روش های برچسب گذاری معنایی قوی و موثر را افزایش می دهد. مهمتر از همه، همه ساختمان ها به صورت فشرده قرار گرفته اند و میانگین فاصله بین ساختمان های مجاور فقط حدود 5 است.m ، که بسیار کوچکتر از وضعیت TUM-ALS و AHN3 است. حتی با مقایسه جدیدترین مجموعه داده DALES، تراکم ساختمان‌های بلند در مجموعه داده LASDU ما هنوز بسیار بیشتر است. ساختمان ها در LASDU در کنار هم قرار دارند. فاصله کوتاه بین ساختمان ها به طور مستقیم دشواری برچسب گذاری و جداسازی را افزایش می دهد. در شکل 11، ما توزیع ساختمان دو بخش را از مجموعه داده های Vaihingen و LASDU مقایسه می کنیم و از مقایسه، می توانیم به وضوح ساختمان های بسیار متراکم در مجموعه داده LASDU را مشاهده کنیم. این ساختمان های متراکم با اشکال مستطیلی کوچک و باریک، دشواری برچسب گذاری را بسیار افزایش می دهند. علاوه بر این، در سناریوی ثبت‌شده، نه تنها ساختمان‌های مجاور چالش‌هایی را ایجاد می‌کنند، بلکه پوشش گیاهی کم و وسایل نقلیه، به‌ویژه در مناطقی که با قطب‌ها و درختان همپوشانی دارند و نزدیک به ساختمان‌ها هستند، نیز چالش‌هایی را ایجاد می‌کنند. علاوه بر این، برجستگی های کوتاه در زمین برهنه و دیوارهای پنهان در ساختارهای عمودی مختلف دیوار مانند نیز برای شناسایی چالش برانگیز هستند. در واقع، مجموعه داده LASDU همچنین وسایل نقلیه پارکینگ را در کلاس مصنوعات علامت گذاری کرده است، که می تواند بیشتر در کارهایی مانند تشخیص وسیله نقلیه مورد استفاده قرار گیرد. با این حال،
3.4.3. استفاده بالقوه برای برنامه های کاربردی مرتبط با ترافیک
از آنجایی که مجموعه داده LASDU در اصل برای کاربردهایی مانند نقشه‌برداری شهری و بازسازی سه‌بعدی ساختمان‌ها طراحی شده است، بنابراین هنگام طراحی دسته‌بندی‌های اشیایی که نیاز به حاشیه‌نویسی دارند، بیشتر بر روی پوشش‌های گیاهی و ساختمان‌هایی که در ابرهای نقطه‌ای اسکن می‌شوند، تمرکز کردیم. با این حال، برنامه‌های مرتبط با ترافیک هنگام اعمال ابرهای نقطه‌ای در سناریوی شهری توجه فزاینده‌ای را به خود جلب کرده‌اند. این بدان معنی است که جاده ها و وسایل نقلیه نیز دسته های جالبی از اشیاء هستند که ممکن است در کاربردهای مرتبط اهمیت خود را نشان دهند.
برای این منظور، برای بررسی بیشتر پتانسیل استفاده در برنامه های مرتبط با ترافیک، ما همچنین یک دسته بندی دقیق از حاشیه نویسی ابر نقطه ای بر اساس پنج دسته موجود ارائه می دهیم، اگرچه مجموعه داده ALS منبع داده کافی برای برنامه های کاربردی مرتبط با ترافیک نیست. به دلیل تراکم نقطه پراکنده و گرفتگی های ناشی از ساختمان های مرتفع و درختان در مشاهده نادر. به طور خاص، ما نقاط “جاده” را از نقاط زمین جدا کردیم و نقاط وسایل نقلیه را از نقاط مصنوع استخراج کردیم. این نقاط با برچسب های منحصر به فرد حاشیه نویسی می شوند و گزینه ای برای استفاده از این برچسب ها در کارهایی مانند تشخیص جاده یا استخراج وسیله نقلیه است. در کار برچسب‌گذاری معنایی، آنها همچنان به ترتیب به عنوان بخشی از زمین یا مصنوعات در نظر گرفته می‌شوند. در شکل 12، ما نکات مشروح این دو دسته جدید از اشیاء را نشان می دهیم. حاشیه نویسی جاده ها توسط نقشه های گوگل و بازرسی های بصری به صورت دستی هدایت می شود.

4. ارزیابی تجربی

برای ارزیابی مختصری از مجموعه داده پیشنهادی، ما این مجموعه داده را در طبقه بندی نظارت شده اعمال کردیم تا نقاط را با پنج کلاس اشیاء فوق الذکر در صحنه برچسب گذاری کنیم.

4.1. آزمایش های برچسب گذاری معنایی

بر خلاف کاربردهای معمول داخلی در زمینه بینایی رایانه، برچسب‌گذاری معنایی در مناطق شهری با مقیاس بزرگ باید تغییرات مقیاس اشیاء را در نظر بگیرد. در سناریوی فضای باز، برای اشیاء با ابعاد مختلف، ویژگی های رمزگذاری شده به میزان زیادی با اندازه محله های محلی [ 18 ] یا مقیاس نمونه گیری [ 13 ] متفاوت خواهد بود.]. به‌ویژه برای مناطق شهری متراکم، ساختمان‌های فشرده باعث تعیین نادرست مقیاس در برخی روش‌های تطبیقی ​​می‌شوند. مجموعه داده پیشنهادی ما موردی با مقیاس بزرگ و مناطق بسیار متراکم با ساختمان های نزدیک است. بنابراین، در آزمایش‌های ارزیابی، سه روش برچسب‌گذاری معنایی مبتنی بر نقطه انتخاب شده و بر روی مجموعه داده پیشنهادی به عنوان خطوط پایه آزمایش می‌شوند. همه این سه روش مبتنی بر یادگیری عمیق هستند، اما از استراتژی‌های مختلفی برای مقابله با مشکلات مقیاس استفاده می‌کنند که مستقیماً به سناریوهای شهری بسیار متراکم مرتبط است.
  • PointNet [ 33 ]: PointNet یک شبکه عصبی است که مستقیماً با ابرهای نقطه ای کار می کند و به عدم تغییر جایگشت نقاط در چاه ورودی احترام می گذارد. این یک معماری یکپارچه برای برنامه های کاربردی از طبقه بندی اشیا تا تقسیم بندی معنایی ارائه می دهد.
  • PointNet++ [ 34 ]: PointNet ابتدا ویژگی های جهانی را با MLP با ابرهای نقطه خام یاد می گیرد. PointNet++ PointNet را در محله های محلی هر نقطه اعمال می کند تا ویژگی های محلی را به تصویر بکشد، و یک رویکرد سلسله مراتبی برای گرفتن ویژگی ها با زمینه محلی چند مقیاسی اتخاذ شده است.
  • Hierarchical Data Augmented PointNet++ (HDA-PointNet++): این یک روش بهبود یافته مبتنی بر PointNet++ اصلی است که در کار قبلی [ 13 ] به عنوان ویژگی های عمیق چند مقیاسی (MDF) در زمینه یادگیری ویژگی های عمیق سلسله مراتبی پیشنهاد شد. HDL) روش. این بر اساس یک استراتژی افزایش سلسله مراتبی داده توسعه داده شد، که در آن مجموعه داده‌های ابر نقاط شهری قابل توجهی به مجموعه‌های چند مقیاسی تقسیم می‌شوند و توانایی مقابله با تغییرات مقیاس را افزایش می‌دهند. این استراتژی نمونه‌گیری سلسله مراتبی یک راه‌حل مبادله‌ای برای یکپارچگی شی و جزئیات دقیق است.
برای روش HDA-PointNet++، در شکل 13 ، تصویری برای گردش کار HDA-PointNet++ ارائه می دهیم. در کار قبلی [ 13 ]، در روش HDL نیز به عنوان MDF نامیده می‌شود، که در مرحله آموزش، ابر نقطه ورودی، تقسیم‌بندی‌های سه‌گانه با مقیاس‌های مختلف را به طور مکرر تجربه می‌کند. سپس تمام زیرمجموعه‌های نقاط نمونه‌برداری می‌شوند و برای آموزش به شبکه PointNet++ داده می‌شوند و از توانایی تعمیم قوی‌تر هنگام برخورد با مقیاس‌های بسیار متنوع از اشیاء مختلف اطمینان حاصل می‌کنند. با این حال، اشاره شده است که ابرهای نقطه برای آزمایش مستقیماً بدون تقسیم و نمونه برداری به شبکه تغذیه می شوند که با مرحله HDL در [ 13 ] متفاوت است.
در آزمایش‌ها، از بخش‌های 2 و 3 به عنوان داده‌های آموزشی و از بخش‌های 1 و 4 به عنوان داده‌های آزمایش استفاده می‌کنیم. از آنجایی که نقاط موجود در مجموعه داده ما نه تنها به مختصات سه بعدی بلکه به ویژگی های دیگری مانند شدت مجهز هستند، ما دو گروه آزمایش را انجام دادیم. گروه اول فقط از مختصات سه بعدی نقاط با هر سه روش استفاده می کند که برای ارزیابی عملکرد هندسی سه بعدی نقاط در مجموعه داده طراحی شده است. در گروه دوم، مقادیر شدت نقاط در مجموعه داده در آزمایش‌ها با استفاده از دو روش (یعنی PointNet++ و HDA-PointNet++)، با هدف بررسی تأثیر اطلاعات رادیومتری در برچسب‌گذاری معنایی، درگیر می‌شوند. علاوه بر این، تأثیر مسائل مقیاس فوق برای هر سه روش مورد تجزیه و تحلیل و بحث قرار خواهد گرفت.

4.2. معیارهای ارزیابی

معیارهای ارزیابی شامل دقت ( پrه، یادآوری ( آرهج، اندازه گیری F1 ( اف1)، دقت کلی ( Oآ) و میانگین گرفت اف1معیارهای ( میانگیناف1) که از مجموعه داده های معیار ISPRS از برچسب گذاری معنایی سه بعدی پیروی می کنند [ 7 ]. دقت ( پrه.) و یادآوری ( آرهج.) مقادیر نیز برای ارزیابی عملکرد، بر اساس محاسبه شده، داده می شود تیپ، افپ، و افن. تیپبه مثبت واقعی برای نتیجه برچسب‌گذاری شده یک کلاس اشاره دارد، که تعداد نقاطی است که به درستی به عنوان آن کلاس برچسب‌گذاری شده‌اند، یعنی نقاطی که دارای علامت مناسب هستند. افپنشان دهنده مثبت کاذب، نشان دهنده تعداد نقاط با علامت اشتباه است. افنمنفی کاذب است، که تعداد نقاطی است که باید به عنوان کلاس های دیگر علامت گذاری شوند اما اشتباه علامت گذاری شده اند. معیار ارزیابی برای کلاس i به صورت تعریف شده است

اف1من=2تیپمن2تیپمن+افپمن+افنمن.

اندازه گیری ارزیابی برای کل نتیجه طبقه بندی است میانگیناف1، که میانگین جمع آوری است اف1منبرای هر کلاس i .

میانگیناف1=1ن∑من=1ناف1من.

در نهایت، دقت کلی ( Oآ) نیز محاسبه می شود.

Oآ=∑من=1ن(تیپمنتیپمن+تینمن+افپمن+افنمن).

5. نتایج و بحث

5.1. پیش پردازش و آموزش

به عنوان آماده سازی برای آموزش شبکه های عصبی عمیق برای همه روش ها، تعداد ثابتی از نقاط به عنوان زیر مجموعه های قالب بندی شده به عنوان ورودی نمونه برداری شد. در نتیجه، ابرهای نقطه ای از مجموعه داده های آموزشی و آزمایشی به زیرمجموعه هایی بدون همپوشانی تقسیم شدند.
برای آزمایش با استفاده از مختصات سه بعدی، هر نقطه در یک زیرمجموعه با یک بردار سه بعدی با مختصات x -، y -، z – نشان داده شد ، در حالی که برای آزمایش با استفاده از شدت های اضافی، هر نقطه در زیر مجموعه به عنوان یک بردار 4 بعدی با x -، y -، z – مختصات و شدت. تعداد نقاط نمونه برداری شده در هر زیرمجموعه برابر با [ 13 ] تنظیم شد]. یعنی در روش‌های PointNet و PointNet++ 8192 نقطه بدون جایگزینی از هر زیر مجموعه نقاط انتخاب شد، در حالی که هنگام اجرای استراتژی چند مقیاسی در روش HDA-PointNet++، زیر مجموعه‌هایی از نقاط با مقیاس‌های مختلف تولید کردیم. آموزش شبکه ها با این زیرمجموعه نقاط با مقیاس های مختلف نیز به صورت انفرادی انجام شد. بنابراین، ما توانستیم ویژگی‌های رمزگذاری‌شده‌ای را که سطوح مختلف اطلاعات زمینه‌ای را از نقاط محصور می‌کند، بدست آوریم. با در نظر گرفتن مقیاس واقعی اشیاء (به عنوان مثال، ساختمان ها، درختان، پوشش گیاهی کم)، اندازه زیرمجموعه نقاط به طور تجربی برای مقیاس های مختلف به ترتیب 10000، 20000 و 30000 تنظیم شد، زیرا آنها عملکرد رضایت بخشی را در آزمایش ها نشان دادند.
برای اعتبارسنجی و نظارت بر فرآیند آموزش، 10 درصد از نمونه های آموزشی از مجموعه داده های آموزشی به طور مستقیم برای اعتبار سنجی انتخاب شدند. در فرآیند آموزش، از بهینه ساز Adam با نرخ یادگیری اولیه 0.001، مقدار حرکت 0.9 و اندازه دسته ای 16 استفاده شد. نرخ یادگیری به طور مکرر بر اساس دوره فعلی با ضریب 0.7 کاهش یافت. روند آموزش در مجموع 500 دوره به طول انجامید، به این معنی که شرایط پایان دوره آموزشی با 500 دوره تعیین شد. اگر کاهش تمرین ظاهراً کاهش یابد، وزنه‌ها ذخیره می‌شوند. علاوه بر این، مدل‌ها بر اساس بالاترین OA در مجموعه اعتبارسنجی انتخاب شدند. با توجه به سخت افزار مورد استفاده در آزمایشات،

5.2. نتایج طبقه‌بندی مجموعه داده LASDU با استفاده از موقعیت‌های نقطه

اولین گروه از آزمایش ها با مختصات سه بعدی نقاط بدون استفاده از ویژگی های دیگر انجام شد که صرفاً بر اساس ویژگی های هندسی نقاط بود. ما در نهایت به OA 83.11% برای برچسب زدن پنج کلاس با روش HDA-PointNet++ در مجموعه داده LASDU خود دست یافتیم. علاوه بر این، ما مقایسه ای با دو روش دیگر ارائه کردیم که نشان داد، با در نظر گرفتن استراتژی چند مقیاسی، روش HDA-PointNet++ توانست از دو خط پایه دیگر بهتر عمل کند. جدول 2نتایج طبقه بندی هر سه روش را فهرست می کند. با توجه به دقت کلی، می‌توانیم مشاهده کنیم که HDA-PointNet++ با استفاده از ویژگی‌های عمیق چند مقیاسی می‌تواند در درجه اول عملکرد طبقه‌بندی را با افزایش OA تا حدود 17 درصد در مقایسه با PointNet++ بهبود بخشد. این به این دلیل است که برای شبکه عصبی عمیق مبتنی بر نقطه، تقسیم بندی و نمونه برداری از ابرهای نقطه ای در صحنه های بزرگ شهری موضوع مهمی است که مستقیماً بر نتایج طبقه بندی تأثیر می گذارد. PointNet که از ویژگی های عمیق تک مقیاسی استفاده می کند، در مدیریت اشیاء شهری با مقیاس های مختلف مشکل دارد. به عنوان یک پیشرفت، PointNet++ نمونه گیری و گروه بندی را با مقیاس های مختلف معرفی کرد که می تواند نتایج طبقه بندی را بهبود بخشد. از آنجایی که مجموعه‌های نقطه‌ای تقسیم‌شده مبنایی برای ارائه اطلاعات متنی از خوشه‌بندی نقاط بودند، مقیاس های هر مجموعه امتیاز باید آزمایش و بررسی شود. به جای جستجوی اندازه مقیاس بهینه برای مجموعه نقاط تقسیم شده، از یک استراتژی سازش استفاده کردیم. در اینجا، روش HDA-PointNet++ ویژگی های عمیق استخراج شده را با استفاده از یک استراتژی تقسیم سلسله مراتبی با ویژگی های استخراج شده مستقیم از شبکه مقایسه کرد. با استفاده از استراتژی تقسیم سلسله مراتبی، می توان برخی از حوزه های طبقه بندی اشتباه را اصلاح کرد. در مقایسه با روش‌های تک مقیاسی، ویژگی‌های چند مقیاسی هم از نظر آمار دقت و هم از نظر تجسم در نقشه طبقه‌بندی، عملکرد بهتری در نتایج طبقه‌بندی داشتند. روش HDA-PointNet++ ویژگی های عمیق استخراج شده را با استفاده از یک استراتژی تقسیم سلسله مراتبی با ویژگی های استخراج شده مستقیم از شبکه مقایسه کرد. با استفاده از استراتژی تقسیم سلسله مراتبی، می توان برخی از حوزه های طبقه بندی اشتباه را اصلاح کرد. در مقایسه با روش‌های تک مقیاسی، ویژگی‌های چند مقیاسی هم از نظر آمار دقت و هم از نظر تجسم در نقشه طبقه‌بندی، عملکرد بهتری در نتایج طبقه‌بندی داشتند. روش HDA-PointNet++ ویژگی های عمیق استخراج شده را با استفاده از یک استراتژی تقسیم سلسله مراتبی با ویژگی های استخراج شده مستقیم از شبکه مقایسه کرد. با استفاده از استراتژی تقسیم سلسله مراتبی، می توان برخی از حوزه های طبقه بندی اشتباه را اصلاح کرد. در مقایسه با روش‌های تک مقیاسی، ویژگی‌های چند مقیاسی هم از نظر آمار دقت و هم از نظر تجسم در نقشه طبقه‌بندی، عملکرد بهتری در نتایج طبقه‌بندی داشتند.
نتایج طبقه بندی بصری در شکل 14 نشان داده شده است. مشاهده می شود که نتیجه PointNet++ عملکرد خوبی را نشان داد که نشان دهنده کارایی شبکه عصبی عمیق در ارائه ویژگی های تولیدی است. همچنین می توان مشاهده کرد که روش های مختلف خروجی های کاملاً متنوعی را نشان می دهند. به طور خاص، برای دسته‌ای از مصنوعات با اشیاء بسیار پیچیده، PointNet به سختی نتیجه درستی برای برجستگی‌های روی زمین برهنه به دست می‌آورد. در مقابل، PointNet++ با معرفی استراتژی نمونه‌برداری و گروه‌بندی، به اشیا در مقیاس کوچک و بزرگ حساس می‌شود و بنابراین می‌توان چنین مصنوعات کوچک و پیچیده‌ای را به درستی برچسب‌گذاری کرد. با این حال، برای پوشش گیاهی کم و درختان در میان ساختمان‌های بسیار متراکم، PointNet++ نتوانست با این موارد مقابله کند. در مقابل، روش HDA-PointNet++ با ساختار سلسله مراتبی می‌تواند این موضوع را به روشی قوی‌تر و سازگارتر مدیریت کند. بنابراین، می‌توان نتیجه گرفت که ویژگی‌های عمیق چند مقیاسی، توصیف بالاتری را ارائه می‌دهند. از سوی دیگر، از جنبه مجموعه داده، ما همچنین می توانیم اظهار کنیم که مجموعه داده LASDU ما چالش برانگیزتر از مجموعه داده معیار کلاسیک ISPRS است، اگرچه دارای دسته های بیشتری از اشیاء است. با این حال، چنین سناریوهای پیچیده شهری موارد مکرر زمانی هستند که ما نقشه برداری سه بعدی در مقیاس بزرگ را در مناطق مسکونی انجام می دهیم.

5.3. نتایج طبقه بندی مجموعه داده LASDU با استفاده از شدت نقطه اضافی

از آنجایی که شدت نقطه اطلاعات قابل اعتمادی است و به طور مکرر در بسیاری از برنامه های کاربردی داده LiDAR استفاده می شود، گروه دوم آزمایش ها با مختصات سه بعدی نقاط با شدت انجام شد که نتایج آن بر اساس ویژگی های هندسی و ویژگی های رادیومتری نقاط بود. در این آزمایش نتایج روش‌های PointNet++ و HDA-PointNet++ را مقایسه کردیم. در نهایت، برای برچسب گذاری پنج کلاس از اشیاء در مجموعه داده LASDU، به مقادیر OA 82.84٪ و 84.37٪ رسیدیم. جدول 3نتایج طبقه بندی دقیق این دو روش را فهرست می کند. همانطور که از جدول مشاهده می شود، می توان افزایش قابل توجهی در دقت طبقه بندی PointNet++ با افزایش OA بیش از 15٪ مشاهده کرد. این عمدتا به دلیل افزایش دقت در مورد پوشش گیاهی کم است. با معرفی شدت، از آنجایی که اشیاء با پوشش گیاهی کم همیشه در مقایسه با مصنوعات دست ساز دارای شدت های متفاوتی هستند، نقاط این دو طبقه راحت تر از هم جدا می شوند. نتایج HDA-PointNet++ نشان می دهد که افزایش اندکی OA در حدود 1٪ را تجربه کرده است که به ویژه قابل توجه نیست. این به دلیل این واقعیت است که نمونه‌برداری سلسله مراتبی داده و تقویت در HDA-PointNet++ پتانسیل این روش را به طور کامل بررسی کرده است، به این معنی که شدت‌ها به سختی کمک بیشتری به بهبود دقت می‌کنند.
علاوه بر این، نتایج طبقه‌بندی بصری در شکل 15 آورده شده است. همانطور که مشاهده می شود، عملکرد PointNet++ به طور قابل توجهی بهبود یافته است که نشان دهنده سهم استفاده از شدت است. نقاط علف و برآمدگی هایی که به درستی برچسب گذاری شده اند در زمین برهنه به وضوح قابل مشاهده هستند. علاوه بر این، درختان و بوته های شلوغ توسط ساختمان های فشرده بسته را می توان جدا کرد و همچنین برچسب گذاری کرد. به طور مشابه، روش HDA-PointNet++ با ساختار سلسله مراتبی کیفیت مشابهی از نتایج را نشان می دهد. بنابراین، به عنوان یک نتیجه، می‌توانیم اظهار کنیم که برای برچسب‌گذاری معنایی روی مجموعه داده LASDU ما که در یک منطقه ساختمانی بسیار پیچیده به دست آمده است، نه تنها ویژگی‌های هندسی نقش حیاتی دارند، بلکه ویژگی‌هایی مانند شدت‌ها نیز می‌توانند در تمایز نقاط اشیاء مختلف نقش داشته باشند. این همچنین شاخصی از استفاده از مجموعه داده ما در ارزیابی روش پیشنهادی جدید ارائه می دهد. در شکل 16ما همچنین دو منطقه نمونه از بخش‌های 1 و 3 (یعنی داده‌های آزمایشی) را برای نشان دادن جزئیات در مناطق ساختمانی متراکم پر از درختان و پوشش گیاهی کم انتخاب کردیم. واضح است که وقتی مقادیر شدت به داده های ورودی اضافه می شود، هر دو روش می توانند به نتایج طبقه بندی رضایت بخشی برای ساختمان ها، زمین ها و درختان دست یابند. با این حال، برای نتایج به‌دست‌آمده از PointNet++ اصلی، نقاط بیشتری با برچسب نادرست عایق‌بندی‌شده برای پوشش گیاهی و مصنوعات کم وجود دارد، در حالی که برای ساختمان‌های مستقل، آنها به اشتباه به‌عنوان ساختمان‌های متصل شناخته می‌شوند (ساختمان‌های مجاور را در جعبه خط تیره سفید شکل 16 ببینید.آ). برای روش HDA-PointNet++ با در نظر گرفتن ضریب مقیاس، نقاط برچسب‌گذاری شده احتمالاً می‌توانند یک مرز واضح و صاف را برای اشیاء جداگانه نگه دارند، به عنوان مثال، مرز بین ساختمان‌ها و درختان و مرزهای بین درختان و پوشش گیاهی کم. علاوه بر این، از آنجایی که مقیاس درختان و ساختمان‌ها به طور قابل‌توجهی متفاوت است، نتیجه HDA-PointNet++ می‌تواند از خطاهای بزرگ و ادامه دار هنگام برچسب‌گذاری نقاط ساختمان‌ها جلوگیری کند (منطقه را در کادر خط تیره سفید شکل 16 ج ببینید). این امر به ویژه هنگام ترسیم سناریوی شهری از داده‌های ALS بسیار ارزشمند است.

5.4. بحث در مورد استراتژی سلسله مراتبی/چند مقیاسی برای برچسب گذاری معنایی شهری در مقیاس بزرگ

با توجه به دو گروه آزمایش بالا، می‌توانیم ببینیم که روش HDA-PointNet++ با یک استراتژی افزایش سلسله مراتبی داده‌ها نشان‌دهنده پیشرفت قابل‌توجهی نسبت به روش اصلی PointNet++ است، اگرچه ساختار شبکه اصلی یکسانی دارند. همانطور که قبلا ذکر کردیم، مقیاس در هر دو توصیف هندسی و رادیومتری شی نقش دارد. مقیاس نامناسب نمونه‌برداری فقط می‌تواند تا حدی شی را نشان دهد، که منجر به توصیف ویژگی ناقص یا بیش از حد پوشانده می‌شود، افزایش چند مقیاسی داده‌های ورودی، عمومیت شبکه عصبی آموزش‌دیده را افزایش داده است، که باعث می‌شود ویژگی‌های کدگذاری شده با مقیاس سازگار شوند. از شی سناریوی پیچیده با ساختمان‌های متراکم و شلوغ در مجموعه داده ما، دشواری را افزایش می‌دهد و سهم استراتژی چند مقیاسی را برجسته می‌کند. با این حال، در سایر مجموعه‌های داده معیار کلاسیک – به عنوان مثال، مجموعه داده Vaihingen – روش‌هایی که از یک استراتژی سلسله مراتبی یا چند مقیاسی استفاده می‌کنند نیز عملکرد امیدوارکننده‌ای را نشان می‌دهند. ما نتایج روش های طبقه بندی از جمله LUH را جمع آوری و مقایسه کرده ایم.35 ]، PointNet++ [ 34 ]، شبکه عصبی کانولوشنال چند مقیاسی (MCNN) [ 36 ]، شبکه عصبی واحدهای خطی اصلاح شده (ReLu-NN) [ 37 ]، PointNet در مقیاس های چندگانه (PointNet-MS) [ 38 ] تعبیه نقطه عمیق (DPE) [ 13 ]، شبکه هندسی توجه (GA-Conv) [ 39 ]، و شبکه‌های مبتنی بر نمایش وکسل و پیکسل (VPNet) [ 40]، و می‌توانیم ببینیم که برای روش‌هایی که مستقیماً روی نقاط سه‌بعدی کار می‌کنند، آن‌هایی (مانند LUH، DPE، و GA-Conv) که از یک استراتژی سلسله مراتبی یا چند مقیاسی استفاده می‌کنند، عملکرد قابل‌توجهی نشان می‌دهند. به عنوان مثال، روش GA-Conv یک معماری سلسله مراتبی متراکم و ماژول ارتفاع-توجه را پیشنهاد کرد و به یک نتیجه امیدوارکننده دست یافت. علاوه بر این، روش VPNet که هم پیکسل ها و هم وکسل ها را جمع آوری می کند، نمایش مقیاس های مختلف را نیز در نظر می گیرد و نقاط مجزا جدا شده را به هم متصل می کند و عملکرد عالی با میانگین امتیاز F1 73.9٪ به دست می آورد. همه این نتایج نشان می دهد که عامل مقیاس در نظر گرفته شده از طریق یک استراتژی چند مقیاسی یا سلسله مراتبی به برچسب گذاری معنایی در فضای باز کمک می کند، به ویژه برای صحنه های شهری متراکم و پیچیده، که کمی با موارد داخلی متفاوت است. بدین ترتیب،18 ]، بلکه روش‌های مبتنی بر یادگیری عمیق نیز باید مقیاس‌ها را در ورودی داده یا مستقیماً در طراحی شبکه عصبی در نظر بگیرند.

6. نتیجه گیری

در این مقاله، ما یک مجموعه داده ابر نقطه LiDAR هوایی را در مقیاس بزرگ ارائه می‌کنیم که در یک منطقه شهری بسیار متراکم برای ارزیابی روش‌های برچسب‌گذاری معنایی به دست آمده است. این مجموعه داده یک منطقه شهری با ساختمان های بسیار متراکم تقریباً 1 کیلومتر مربع را پوشش می دهدو بیش از 3 میلیون امتیاز را شامل می شود. این مجموعه داده به صورت دستی در پنج دسته از اشیاء حاشیه نویسی شد: زمین، ساختمان ها، درختان، پوشش گیاهی کم، و مصنوعات. با ویژگی‌های مشابه و طبقه‌بندی نقاط حاشیه‌نویسی، اما سناریوهای چالش برانگیزتر و اندازه بزرگ‌تر، این مجموعه داده مکمل قابل توجهی برای مجموعه داده‌های برچسب‌گذاری معنایی ISPRS 3D است که معمولاً استفاده می‌شود. آزمایش‌ها با نتایج چندین روش پایه انجام شد. به عنوان یک نتیجه، می‌توان گفت که مجموعه داده پیشنهادی LASDU امکان‌سنجی و قابلیت آن را نشان می‌دهد که به عنوان معیاری برای ارزیابی روش‌های برچسب‌گذاری معنایی عمل می‌کند. علاوه بر این، آزمایش‌های انجام‌شده ارزیابی روش‌های مبتنی بر یادگیری عمیق را با در نظر گرفتن استراتژی‌های مقیاس مختلف ارائه می‌دهند. به این معنی که تأثیر عوامل مقیاس در شبکه عصبی عمیق برای برچسب‌گذاری معنایی ابر نقطه در سناریویی که در آن اجسام دارای اندازه‌های هندسی متفاوتی هستند، تحلیل می‌شود. مجموعه داده LASDU یک مجموعه داده معیار ALS جدید را در یک صحنه شهری بسیار پیچیده با ساختمان های بسیار متراکم ارائه می دهد. هدف از ارائه این مجموعه داده ابر نقطه ای جدید تشویق توسعه روش های برچسب گذاری معنایی عملی و نوآورانه برای کاربردهای شهری است. در آینده، مجموعه داده برای دسترسی جامعه منتشر می‌شود و دسته‌ها و برچسب‌های این مجموعه داده جدید می‌توانند با بازخورد آزمایش‌ها و ارزیابی‌های بیشتر بهبود و به روز شوند. مجموعه داده LASDU یک مجموعه داده معیار ALS جدید را در یک صحنه شهری بسیار پیچیده با ساختمان های بسیار متراکم ارائه می دهد. هدف از ارائه این مجموعه داده ابر نقطه ای جدید تشویق توسعه روش های برچسب گذاری معنایی عملی و نوآورانه برای کاربردهای شهری است. در آینده، مجموعه داده برای دسترسی جامعه منتشر می‌شود و دسته‌ها و برچسب‌های این مجموعه داده جدید می‌توانند با بازخورد آزمایش‌ها و ارزیابی‌های بیشتر بهبود و به روز شوند. مجموعه داده LASDU یک مجموعه داده معیار ALS جدید را در یک صحنه شهری بسیار پیچیده با ساختمان های بسیار متراکم ارائه می دهد. هدف از ارائه این مجموعه داده ابر نقطه ای جدید تشویق توسعه روش های برچسب گذاری معنایی عملی و نوآورانه برای کاربردهای شهری است. در آینده، مجموعه داده برای دسترسی جامعه منتشر می‌شود و دسته‌ها و برچسب‌های این مجموعه داده جدید می‌توانند با بازخورد آزمایش‌ها و ارزیابی‌های بیشتر بهبود و به روز شوند.

منابع

  1. ووسلمن، جی. اسکن لیزری Maas، HG هوابرد و زمینی ؛ CRC Press: Boca Raton، FL، USA، 2010. [ Google Scholar ]
  2. زی، ی. تیان، جی. Zhu, X. پیوند نقاط با برچسب ها در سه بعدی: مروری بر تقسیم بندی معنایی ابر نقطه. IEEE Geosci. سنسور از راه دور Mag. 2020 . [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  3. چن، اس. نان، ال. شیا، آر. ژائو، جی. Wonka، P. PLADE: توصیفگر مبتنی بر هواپیما برای ثبت ابر نقطه با همپوشانی کوچک. IEEE Trans. Geosci. Remote Sens. 2019 , 58 , 2530–2540. [ Google Scholar ] [ CrossRef ]
  4. دونگ، ز. یانگ، بی. لیانگ، اف. هوانگ، آر. Scherer, S. ثبت سلسله مراتبی ابرهای نقطه TLS نامرتب بر اساس توصیفگر زمینه شکل باینری. ISPRS J. Photogramm. Remote Sens. 2018 ، 144 ، 61–79. [ Google Scholar ] [ CrossRef ]
  5. دونگ، ز. لیانگ، اف. یانگ، بی. خو، ی. زنگ، ی. لی، جی. وانگ، ی. دای، دبلیو. فن، اچ. Hyyppä، J.; و همکاران ثبت ابرهای نقطه اسکنر لیزری زمینی در مقیاس بزرگ: بررسی و معیار ISPRS J. Photogramm. Remote Sens. 2020 , 163 , 327–342. [ Google Scholar ] [ CrossRef ]
  6. مونوز، دی. باگنل، جی. ونداپل، ن. هبرت، ام. طبقه‌بندی متنی با شبکه‌های مارکوف حداکثر حاشیه عملکردی. در مجموعه مقالات کنفرانس IEEE 2009 در مورد بینایی کامپیوتری و تشخیص الگو، میامی بیچ، فلوریدا، ایالات متحده آمریکا، 20-26 ژوئن 2009. ص 975-982. [ Google Scholar ]
  7. نیمایر، جی. روتنشتاینر، اف. Sörgel، U. طبقه‌بندی متنی داده‌های لیدار و تشخیص شی ساختمان در مناطق شهری. ISPRS J. Photogramm. Remote Sens. 2014 ، 87 ، 152-165. [ Google Scholar ] [ CrossRef ]
  8. هاکل، تی. ساوینوف، ن. لدیکی، ال. Wegner، JD; شیندلر، ک. Pollefeys، M. SEMANTIC3D.NET: یک معیار جدید طبقه بندی ابر نقطه ای در مقیاس بزرگ. ISPRS Ann. فتوگرام حسگر از راه دور اسپات. Inf. علمی 2017 ، IV-1-W1 ، 91-98. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  9. گرونگ، ج. هبل، م. آرنس، م. Stilla, U. رویکردی برای استخراج اجسام متحرک از داده های mls با استفاده از نمایش پس زمینه حجمی. ISPRS Ann. فتوگرام حسگر از راه دور اسپات. Inf. علمی 2017 ، 4 . [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  10. روینارد، ایکس. Deschaud، JE; Goulette, F. Paris-Lille-3D: مجموعه داده ابر نقطه شهری با کیفیت زمین و حقیقت برای تقسیم بندی و طبقه بندی خودکار. بین المللی ربات جی. Res. 2018 ، 37 ، 545-557. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  11. وانگ، اس. بای، م. ماتیوس، جی. چو، اچ. لو، دبلیو. یانگ، بی. لیانگ، جی. چوری، جی. فیدلر، اس. Urtasun، R. TorontoCity: دیدن جهان با یک میلیون چشم. در مجموعه مقالات کنفرانس بین المللی IEEE در بینایی کامپیوتری (ICCV)، ونیز، ایتالیا، 22 تا 29 اکتبر 2017. [ Google Scholar ]
  12. تان، دبلیو. کین، ن. ما، ال. لی، ی. دو، ج. کای، جی. یانگ، ک. Li, J. Toronto-3D: مجموعه داده LiDAR موبایل در مقیاس بزرگ برای تقسیم بندی معنایی جاده های شهری. arXiv 2020 ، arXiv:2003.08284. [ Google Scholar ]
  13. هوانگ، آر. خو، ی. هونگ، دی. یائو، دبلیو. غمیسی، پ. Stilla، U. جاسازی نقطه عمیق برای طبقه بندی شهری با استفاده از ابرهای نقطه ALS: چشم اندازی جدید از محلی به جهانی. ISPRS J. Photogramm. Remote Sens. 2020 , 163 , 62–81. [ Google Scholar ] [ CrossRef ]
  14. هاکل، تی. Wegner، JD; شیندلر، ک. تقسیم بندی سریع معنایی ابرهای نقطه سه بعدی با چگالی بسیار متغیر. ISPRS Ann. فتوگرام حسگر از راه دور اسپات. Inf. علمی 2016 ، 3 . [ Google Scholar ]
  15. نقشه های شی سه بعدی Rusu، RB Semantic برای دستکاری روزمره در محیط های زندگی انسان. KI-Künstliche Intelligenz 2010 ، 24 ، 345-348. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  16. Remondino، F. از ابر نقطه به سطح: مدل سازی و مشکل تجسم. بین المللی قوس. فتوگرام حسگر از راه دور اسپات. Inf. علمی 2003 ، 34 . [ Google Scholar ] [ CrossRef ]
  17. خو، ی. هیگنر، ال. توتاس، اس. Stilla، U. یک استراتژی مبتنی بر وکسل و گراف برای تقسیم‌بندی زیرساخت‌های ساخت بشر با استفاده از قوانین گروه‌بندی ادراکی: مقایسه و ارزیابی. فتوگرام مهندس Remote Sens. 2018 , 84 , 377–391. [ Google Scholar ] [ CrossRef ]
  18. واینمن، ام. جوتزی، بی. هینز، اس. Mallet, C. تفسیر ابر نقطه معنایی بر اساس همسایگی های بهینه، ویژگی های مرتبط و طبقه بندی کننده های کارآمد. ISPRS J. Photogramm. Remote Sens. 2015 ، 105 ، 286-304. [ Google Scholar ] [ CrossRef ]
  19. رایتبرگر، جی. شنور، سی. کرزیستک، پ. هنوز، بخش‌بندی سه‌بعدی U. تک درخت‌هایی که از داده‌های LIDAR شکل موج کامل بهره‌برداری می‌کنند. ISPRS J. Photogramm. Remote Sens. 2009 ، 64 ، 561-574. [ Google Scholar ] [ CrossRef ]
  20. جونگ، ن. هوانگ، اچ. Matson، ET ارزیابی سنسور لیدار کم هزینه برای کاربرد در ناوبری uav داخلی. در مجموعه مقالات سمپوزیوم کاربردهای حسگرهای IEEE 2018 (SAS)، سئول، کره، 12 تا 14 مارس 2018؛ صص 1-5. [ Google Scholar ]
  21. هبل، م. آرنس، م. Stilla، U. تشخیص تغییر در مناطق شهری با تجزیه و تحلیل مبتنی بر شی و مقایسه در حین پرواز داده های ALS چند نمای. ISPRS J. Photogramm. Remote Sens. 2013 ، 86 ، 52-64. [ Google Scholar ] [ CrossRef ]
  22. Cramer, M. آزمون DGPF در ارزیابی دوربین هوابرد دیجیتال – نمای کلی و طراحی آزمایش. فتوگرام فرنرکوند. Geoinf. 2010 ، 2010 ، 73-82. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  23. روتنشتاینر، اف. سون، جی. یونگ، جی. گرکه، ام. بیلارد، سی. بنیتز، اس. Breitkopf، U. معیار ISPRS در طبقه بندی اشیاء شهری و بازسازی ساختمان های سه بعدی. ISPRS Ann. فتوگرام حسگر از راه دور اسپات. Inf. علمی 2012 ، 1 ، 293-298. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  24. خو، اس. ووسلمن، جی. Elberink، SO طبقه بندی بر اساس چند نهاد داده های اسکن لیزری هوابرد در مناطق شهری. ISPRS J. Photogramm. Remote Sens. 2014 ، 88 ، 1-15. [ Google Scholar ] [ CrossRef ]
  25. ووسلمن، جی. کوئنن، ام. Rottensteiner, F. طبقه بندی مبتنی بر بخش متنی داده های اسکنر لیزری هوابرد. ISPRS J. Photogramm. Remote Sens. 2017 , 128 , 354–371. [ Google Scholar ] [ CrossRef ]
  26. ذوالانواری، س. روانو، اس. رعنا، ع. کامینز، آ. دا سیلوا، RE; رهبر، م. اسمولیک، A. DublinCity: Annotated LiDAR Point Cloud و کاربردهای آن. arXiv 2019 ، arXiv:1909.03613. [ Google Scholar ]
  27. تروونگ-هنگ، ال. لافر، دی. Lindenbergh, R. تشخیص خودکار لبه های جاده از داده های اسکن لیزری هوایی. بین المللی قوس. فتوگرام حسگر از راه دور اسپات. Inf. علمی 2019 ، 42 ، 1135-1140. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  28. خو، ی. دو، بی. ژانگ، ال. سرا، دی. پاتو، م. کارمونا، ای. پراساد، س. یوکویا، ن. هانش، آر. Le Saux، B. سنجش از راه دور نوری چند سنسوری پیشرفته برای استفاده از زمین شهری و طبقه بندی پوشش زمین: نتیجه مسابقه فیوژن داده IEEE GRSS 2018. IEEE J. Sel. بالا. Appl. زمین Obs. Remote Sens. 2019 ، 12 ، 1709–1724. [ Google Scholar ] [ CrossRef ]
  29. وارنی، ن. آساری، VK; Graehling، Q. DALES: مجموعه داده های هوایی LiDAR در مقیاس بزرگ برای تقسیم بندی معنایی. در مجموعه مقالات کنفرانس IEEE/CVF در کارگاه های آموزشی بینایی رایانه و تشخیص الگو، سیاتل، WA، ایالات متحده آمریکا، 13 تا 19 ژوئن 2020؛ ص 186-187. [ Google Scholar ]
  30. لی، ایکس. چنگ، جی. لیو، اس. شیائو، کیو. ما، م. جین، آر. چه، تی. لیو، کیو. وانگ، دبلیو. چی، ی. و همکاران تحقیقات تجربی تله متری وابسته حوضه هیهه (HiWATER): اهداف علمی و طراحی آزمایشی. گاو نر صبح. شهاب سنگ Soc. 2013 ، 94 ، 1145-1160. [ Google Scholar ] [ CrossRef ]
  31. لی، ایکس. لیو، اس. شیائو، کیو. ما، م. جین، آر. چه، تی. وانگ، دبلیو. هو، ایکس. خو، ز. ون، جی. و همکاران مجموعه داده چند مقیاسی برای درک فرآیندهای پیچیده اکو هیدرولوژیکی در یک سیستم واحه ناهمگن. علمی داده 2017 ، 4 ، 170083. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  32. Vo، AV; تروونگ-هنگ، ال. Laefer، DF; برتولتو، M. Octree منطقه در حال رشد برای تقسیم بندی ابر نقطه. ISPRS J. Photogramm. Remote Sens. 2015 ، 104 ، 88-100. [ Google Scholar ] [ CrossRef ]
  33. Qi، CR; سو، اچ. مو، ک. Guibas، LJ Pointnet: یادگیری عمیق در مجموعه های نقطه برای طبقه بندی و تقسیم بندی سه بعدی. در مجموعه مقالات کنفرانس IEEE در مورد دید رایانه و تشخیص الگو، هونولولو، HI، ایالات متحده آمریکا، 21 تا 26 ژوئیه 2017؛ جلد 1، ص. 4. [ Google Scholar ]
  34. Qi، CR; یی، ال. سو، اچ. Guibas، LJ Pointnet++: یادگیری ویژگی های سلسله مراتبی عمیق در مجموعه های نقطه در یک فضای متریک. Adv. عصبی Inf. روند. سیستم 2017 ، 5099–5108. [ Google Scholar ]
  35. نیمایر، جی. روتنشتاینر، اف. Sörgel، U. Heipke, C. crf مرتبه بالاتر سلسله مراتبی برای طبقه بندی ابرهای نقطه لیدار هوابرد در مناطق شهری. بین المللی قوس. فتوگرام حسگر از راه دور اسپات. Inf. Sci.-ISPRS Arch. 2016 ، 41 ، 655-662. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  36. ژائو، آر. پانگ، ام. Wang, J. طبقه‌بندی ابرهای نقطه‌ای LiDAR هوابرد از طریق ویژگی‌های عمیقی که توسط یک شبکه عصبی کانولوشنال چند مقیاسی آموخته شده است. بین المللی جی. جئوگر. Inf. علمی 2018 ، 32 ، 960-979. [ Google Scholar ] [ CrossRef ]
  37. ژانگ، ال. لی، ز. لی، ا. لیو، اف. برچسب‌گذاری و بازسازی ابر نقاط شهری در مقیاس بزرگ. ISPRS J. Photogramm. Remote Sens. 2018 , 138 , 86-100. [ Google Scholar ] [ CrossRef ]
  38. وینیوارتر، ال. ماندلبرگر، جی. اشمول، اس. فایفر، ن. طبقه‌بندی ابرهای نقطه‌ای ALS با استفاده از یادگیری عمیق انتها به انتها. PFG–J. فتوگرام سنسور از راه دور Geoinf. علمی 2019 ، 87 ، 75–90. [ Google Scholar ] [ CrossRef ]
  39. لی، دبلیو. وانگ، FD; Xia، GS یک شبکه هندسی توجه برای طبقه بندی ابر نقطه ALS. ISPRS J. Photogramm. Remote Sens. 2020 , 164 , 26–40. [ Google Scholar ] [ CrossRef ]
  40. کین، ن. هو، ایکس. وانگ، پی. شان، جی. Li، Y. برچسب‌گذاری معنایی ابر نقطه‌ای ALS از طریق آموزش نمایش‌های وکسل و پیکسل. IEEE Geosci. سنسور از راه دور Lett. 2019 ، 17 ، 859–863. [ Google Scholar ] [ CrossRef ]
شکل 1. بخشی نمونه از مجموعه داده اسکن لیزری هوابرد (ALS) ارائه شده است. ( الف ) نقاط با شدت طبیعی. ( ب ) نقاط مشروح با برچسب های مختلف. ( ج ) نقاط ارائه شده با مقادیر ارتفاع.
شکل 2. نقشه ارتفاع مجموعه داده مشروح.
شکل 3. منطقه تحت پوشش و بخش های جدا شده. ( الف ) شرح منطقه تحت پوشش (تصاویر ماهواره ای از نقشه های گوگل). ( ب ) تصویر چهار بخش مجزا.
شکل 4. توزیع چگالی نقطه. خطوط قرمز گرایش مناسب هستند. ( الف ) بخش 1، ( ب ) بخش 2، ( ج ) بخش 3، و ( د ) بخش 4.
شکل 5. درصد نقاط برچسب گذاری شده در بخش های مختلف.
شکل 6. نمونه هایی از نقاط مشروح اشیاء مختلف. ( الف ) ساختمان ها، تخت های گل، وسایل نقلیه و جاده ها. ب ) علف، بوته، درخت و جاده. ( ج ) ساختمان ها، زمین های خالی، دیوارهای کوتاه.
شکل 7. مجموعه داده مشروح با نقاط برچسب های مختلف که با رنگ های مختلف ارائه شده اند.
شکل 8. نمونه ای از ناحیه بدون تغییر در ناحیه آزمایش. ( الف ) ابر نقطه ALS. ( ب ) تصویر ماهواره ای از همان منطقه.
شکل 9. نمونه ای از ناحیه تغییر یافته در ناحیه آزمون. ( الف ) ابر نقطه ALS. ( ب ) تصویر ماهواره ای از همان منطقه. در کادرهای خط تیره سفید، ناحیه تغییر یافته مشخص شده است (از محل ساخت و ساز تا ساختمان تمام شده).
شکل 10. ابر نقطه ALS محل ساخت و ساز فوق الذکر. نقاط با مقادیر شدت نمایش داده می شوند.
شکل 11. مقایسه توزیع ساختمان در ( الف ) Vaihingen و ( ب ) مجموعه داده های LASDU.
شکل 12. جاده ها و وسایل نقلیه مشروح در مجموعه داده های ( الف ) بخش 1، ( ب ) بخش 2، ( ج ) بخش 3، و ( د ) بخش 4.
شکل 13. گردش کار Hierarchical Data Augmented (HDA) -PointNet++ با یک استراتژی افزایش سلسله مراتبی داده.
شکل 14. نتایج طبقه بندی با استفاده از مجموعه داده LASDU (بدون شدت) با روش های مختلف برچسب گذاری معنایی. ( الف ) حقیقت پایه، ( ب ) PointNet، ( ج ) PointNet++، و ( d ) HDA-PointNet++.
شکل 15. نتایج طبقه بندی با استفاده از مجموعه داده LASDU (با شدت) با روش های مختلف برچسب گذاری معنایی. ( الف ) حقیقت پایه، ( ب ) PointNet++، و ( c ) HDA-PointNet++.
شکل 16. جزئیات طبقه بندی در مناطق ساختمانی متراکم مخلوط با پوشش گیاهی و درختان کم نتیجه می شود. ( a ، c ) از PointNet++، ( b ، d ) از HDA-PointNet++.

بدون دیدگاه

دیدگاهتان را بنویسید