خلاصه

تقسیم بندی درختان برای بسیاری از کاربردها در مدیریت شهری و بوم شناسی شهری ضروری است. سیستم تشخیص نور و محدوده (LiDAR) ابرهای نقطه ای دقیق را به شیوه ای سریع و سازگار با محیط زیست به دست می آورد که امکان تشخیص تک درخت را فراهم می کند. با این حال، تعداد زیاد دسته‌بندی اشیاء و انسداد از اشیاء مجاور در محیط پیچیده، چالش‌های بزرگی را در موجودی درخت شهری ایجاد می‌کند که منجر به حذف یا اشتباهات سفارش می‌شود. بنابراین، این مقاله به این چالش‌ها می‌پردازد و دقت تقسیم‌بندی درختان را با پیشنهاد یک روش خودکار برای مثال تشخیص درختان کنار جاده‌ای شهری افزایش می‌دهد. الگوریتم پیشنهادی از داده‌های اسکن لیزری وسایل نقلیه هوایی بدون سرنشین (UAV-LS) پیاده‌سازی شد. ابتدا، یک الگوریتم فیلتر بهبود یافته برای شناسایی نقاط زمینی و غیر زمینی ایجاد شد. دوم، ما اشیاء درخت مانند را از طریق برچسب گذاری روی نقاط غیرزمینی با استفاده از یک مدل یادگیری عمیق با چند تغییر کوچکتر استخراج کردیم. بر خلاف تمرکز بر ویژگی‌های کلی در روش قبلی، روش پیشنهادی یک شبکه یادگیری معنایی نقطه‌ای را برای گرفتن اطلاعات جهانی و محلی در مقیاس‌های چندگانه بازبینی می‌کند، و به طور قابل‌توجهی از از دست دادن اطلاعات در محله‌های محلی جلوگیری می‌کند و محاسبات کانولوشنی بی‌فایده را کاهش می‌دهد. پس از آن، نمایش معنایی به یک مدل بهینه‌سازی ساختار یافته گراف وارد می‌شود که با ساخت یک نمودار غیرمستقیم وزن‌دار و حل مسئله بهینه‌سازی با برش‌های نمودار، نتایج طبقه‌بندی بهینه جهانی را به دست می‌آورد. نقاط درختی تقسیم شده از طریق یک سری عملیات استخراج و تجمیع شدند. و در نهایت با ترکیب یادگیری تعبیه گراف با یک تابع از دست دادن آگاه از ساختار و یک روش تقسیم بندی برش نرمال شده مبتنی بر سوپروکسل شناسایی شدند. نتایج تجربی روی دو مجموعه داده عمومی نشان داد که چارچوب ما از نظر دقت طبقه‌بندی و نسبت تشخیص درخت به عملکرد بهتری دست یافته است.

کلید واژه ها:

پهپاد-LS ابرهای نقطه ای ; یادگیری معنایی نقطه‌ای ; بهینه سازی نمودار ; تقسیم بندی درخت ; درختان کنار جاده ; یادگیری تعبیه گراف

1. معرفی

طبق تحقیقات کمیسیون توسعه پایدار سازمان ملل متحد (CSD)، انتظار می‌رود تا سال 2050 حدود 70 درصد از جمعیت جهان در شهرها زندگی کنند [ 1 ]. شهرنشینی سریع ممکن است باعث ایجاد یک سری مشکلات زیست محیطی شهری شود که بشریت نیاز فوری به مواجهه با آنها دارد، مانند گرم شدن کره زمین، کیفیت پایین هوا، سیل شهری، اثر جزیره گرمایی شهری، و سر و صدا [ 2 ].]. درختان شهری محیط زندگی زیبا و راحت را برای مردم فراهم می کنند که می تواند مشکلات مختلف زیست محیطی ذکر شده در بالا را کاهش دهد. به عنوان یک نیاز مهم شهرهای هوشمند، موجودی درختان کنار جاده در ساخت و سازهای محیطی شهری بسیار مهم است. با این حال، موجودی درختان شهری در بسیاری از شهرها به دلیل مشکلات مالی به طور مرتب نادرست و ناقص است. بر اساس نظرسنجی انجام شده توسط هیئت حسابرسان سازمان ملل متحد (UNBoA)، کمتر از 20 درصد از شهرهای ایالات متحده اطلاعاتی در مورد موجودی درختان شهری دارند، تنها چند کشور اروپایی برنامه های مدیریتی برای جنگل های شهری دارند و بسیاری از چینی ها. شهرها فاقد استراتژی و بودجه برای موجودی درختان شهری هستند [ 3]. در نتیجه، انجام تحقیقات مربوط به موجودی درختان شهری قریب الوقوع است.
استخراج و قطعه‌بندی درختان کنار جاده‌ای اساس موجودی درختان شهری است و نقش کلیدی در کاربردهای مختلف از جمله توزیع درختان شهری، ظرفیت ذخیره‌سازی کربن درختان و آسیب‌های پس از فاجعه ایفا می‌کند. درختان جدا شده را می توان برای کشف ریزاقلیم شهری و از دست دادن درختان پس از طوفان مورد استفاده قرار داد. بدین ترتیب اطلاعات جامع و دقیقی برای کاشت و مدیریت درختان شهری ارائه می شود. با توسعه سریع تکنولوژی، روش های سنتی اندازه گیری دستی درختان به تدریج جای خود را به اندازه گیری های ماشینی داد. علاوه بر این، روش‌های مبتنی بر تصاویر برای موجودی درخت شهری با چالش‌های زیادی از جمله وضوح تصویر محدود، حساسیت به شرایط آب و هوایی و مشکلات ثبت جغرافیایی مواجه هستند. به تازگی، توسعه سریع فناوری LiDAR به دست آوردن اطلاعات جغرافیایی سه بعدی عظیم برای درختان در صحنه های شهری را ممکن می سازد. تحقیقات در مورد درخت وارد عصر جدیدی شده است [4 ، 5 ].
همانطور که همه ما می دانیم، موجودی جنگل (همین مورد برای موجودی درختان شهری نیز صدق می کند) به ویژگی های ساختاری دقیق درخت نیاز دارد. بنابراین، تقسیم‌بندی درختان کنار جاده، بخش مهمی از مدیریت فضای سبز شهری است. روش های تحقیقاتی متعددی با تمرکز بر شناخت درختان در سال های اخیر توسعه یافته است. برای استفاده کامل از مزایای الگوریتم‌های پردازش تصویر به خوبی توسعه‌یافته در ترسیم تاج درختان، از تغییرات ارتفاع مدل ارتفاع تاج پوشش (CHM) برای یافتن نوک درختان استفاده می‌شود. با توجه به بیانیه [ 6 ]، الگوریتم های تشخیص درخت مبتنی بر CHM (مانند تجزیه و تحلیل حوضه [ 7 ]، تجزیه و تحلیل موجک فضایی [ 8 ]، و تطبیق الگو [ 9 ]]) سریع و کارآمد هستند، اما مشکلات موجود نیز واضح است: شکل تاج درخت را تا حدی تغییر می‌دهد و به لطف انواع اندازه‌های تاج، اطلاعات داده اصلی را کاهش می‌دهد.
برخی مطالعات مستقیماً درختان منفرد را بر روی ابرهای نقطه اصلی تقسیم بندی کردند، زیرا وضوح فضایی ابر نقطه ای ALS (اسکن لیزری هوابرد) افزایش یافت. بخشی از روش های خوشه بندی مبتنی بر نقطه موجود [ 10 ، 11 ، 12 ، 13 ، 14] به طور گسترده برای تقسیم بندی درختان فردی استفاده شده است. در مقایسه با روش‌های مبتنی بر CHM، روش‌های خوشه‌بندی مبتنی بر نقطه برای انواع مختلف درختان قوی هستند و کارایی محاسباتی را تا حد زیادی بهبود می‌بخشند و نیازی به دانش قبلی در مورد اشکال و اندازه‌های تاج درخت ندارند. با این وجود، برای اینکه روش‌های فوق مستقیماً روی داده‌های LiDAR کار می‌کنند، سه مشکل اجتناب‌ناپذیر وجود دارد: (1) خطاهای حذف جدی ناشی از پیچیدگی مناطق شهری (مانند ناهمگونی فضایی جنگل‌های شهری) [ 15 ]. (2) خطاهای سفارش ناشی از ساختار متنوع و شکل نامنظم درختان شهری [ 16]؛ (3) درختان سرکوب شده (که اطلاعات کمتری دارند) و درختان کوچک (که با درختان بلند ترکیب شده یا در زیر درختان قرار دارند) به سختی استخراج و قطعه بندی می شوند به دلیل سیستم های اسکن لیزری متحرک که به سختی به تاج جنگل متراکم نفوذ می کنند [ 17 ].
مناطق شهری موزاییکی از انواع اشیاء هستند که کارایی و امکان سنجی پردازش داده LiDAR را کاهش می دهند [ 18 ]. بنابراین، در مقایسه با ابر نقطه ALS، داده‌های اسکن لیزری سیار (MLS) و اسکن لیزر زمینی (TLS) کمتر در موجودی درختان شهری استفاده می‌شوند. در این مقاله، داده‌های به‌دست‌آمده توسط سیستم LiDAR متحرک مبتنی بر پهپاد برای شناسایی و بخش‌بندی درختان منفرد، با هدف موجودی خودکار درخت کنار جاده‌ای شهری اعمال می‌شود. کار ما به دو بخش تقسیم می‌شود: استخراج اشیاء درخت مانند بر اساس برچسب‌گذاری ابر نقطه‌ای با استفاده از شبکه یادگیری معنایی نقطه‌ای، و شناسایی درختان کنار جاده بر اساس یک شبکه عصبی کانولوشنال جدید.
استخراج و شناخت درختان کنار جاده شهری یک موضوع دیرینه و در عین حال فعال است. تحقیقات روی درختان کنار جاده از ابر نقطه ای در مناطق شهری نسبتاً کمتر از موجودی منابع جنگلی است. علاوه بر این، داده‌های LiDAR جمع‌آوری‌شده در منطقه جنگلی عمدتاً از درخت تشکیل شده است، در حالی که صحنه شهری حاوی مصنوعات مختلفی است که پیچیدگی کار تقسیم‌بندی درخت را افزایش می‌دهد. با توجه به استخراج درختان، کارهای موجود را می‌توان به دو نوع تقسیم کرد: روش‌های مبتنی بر قوانین هندسی و مبتنی بر برچسب‌گذاری معنایی.
روش‌های مبتنی بر قوانین هندسی معمولاً درختان را از صحنه‌های پیچیده محیطی با استفاده از ویژگی‌های هندسی [ 19 ] مانند شکل درخت، شکل تنه استوانه‌ای، توزیع نقاط و غیره شناسایی و استخراج می‌کنند. آنها را می‌توان به سه کلاس تقسیم کرد: خوشه‌بندی [ 20 ]، رشد منطقه. [ 21 ]، و روش مبتنی بر آستانه چگالی [ 22 ]. همه روش های فوق در حوزه های تحقیقاتی خود به خوبی عمل کردند. با این حال، استخراج درختان از صحنه‌های بزرگ مقیاس اجسام ترکیبی متراکم در مناطق شهری، اساساً دشوار است، زیرا هزینه‌های محاسباتی سنگین مورد نیاز برای ویژگی‌های هندسی محلی است. به طور خاص، بیشتر کارهای مبتنی بر قانون سنتی هستند و از نظر سرعت و دقت رقابتی نیستند.
در سال‌های اخیر، مجموعه‌ای از روش‌های یادگیری عمیق سعی شده است برای تقسیم‌بندی معنایی سه بعدی [ 23 ] اعمال شود. توجه داشته باشید که تقسیم‌بندی معنایی مبتنی بر یادگیری عمیق ابرهای نقطه‌ای در صحنه‌های بیرونی اغلب شامل دسته‌بندی درختان می‌شود، این کار برای تکمیل وظیفه تقسیم‌بندی درخت از داده‌های اسکن لیزری مفید است. مستقیم ترین راه برای بهره برداری از یادگیری عمیق در طبقه بندی ابر نقاط LiDAR این است که ابتدا نقاط سه بعدی را به مجموعه های معمولی از تصاویر دو بعدی به روش های مختلف تبدیل کنید. سپس تقسیم‌بندی معنایی از طریق یک شبکه عصبی عمیق (DNN) در میدان تصویر انجام می‌شود و در نهایت نتیجه تقسیم‌بندی تصویر را به ابر نقطه برمی‌گرداند [ 24 ، 25 ، 26 ]]. با این حال، این مدل ها باعث از دست رفتن اطلاعات مکانی و القای خطاهای کوانتیزاسیون در فرآیند تبدیل می شوند [ 27 ]. یکی دیگر از روش های عملی گسترش کانولوشن دو بعدی به شبکه عصبی کانولوشنال سه بعدی (سی ان ان 3 بعدی) است. اکثر محققان مدل حرفه ای را برای تبدیل ابرهای نقطه به وکسل های سه بعدی توسعه می دهند و به دنبال آن یک CNN سه بعدی که برچسب معنایی را بر اساس شبکه اشغال پیش بینی می کند [ 28 ]. با این حال، شبکه های حجمی سه بعدی مستلزم مصرف قابل توجه حافظه و هزینه محاسباتی است.
برای غلبه بر کاستی‌های دو روش فوق، برخی کارها مستقیماً از مدل‌های یادگیری عمیق بر روی ابرهای نقطه خام استفاده می‌کنند. با این حال، CNN ها فقط می توانند فرمت ورودی معمولی را مدیریت کنند. استفاده مستقیم از CNN های استاندارد برای ابرهای نقطه ای نامرتب و بدون ساختار غیرممکن است. از این نظر، کار پیشگام PointNet [ 29 ] پیشنهاد می کند که ویژگی های هر نقطه را با استفاده از پرسپترون چند لایه مشترک (MLP) و ویژگی های جهانی با استفاده از توابع ادغام متقارن یاد بگیرند. بر اساس PointNet، اخیراً یک سری از شبکه های مبتنی بر نقطه پیشنهاد شده است [ 23 ]. به طور کلی، این روش‌ها را می‌توان تقریباً به روش‌های MLP نقطه‌ای [ 30 ، 31 ، 32 ، 33 ]، روش‌های پیچش نقطه [ 34 ] تقسیم کرد.، 35 ، 36 ، 37 ]، روش های مبتنی بر RNN (شبکه عصبی مکرر) [ 38 ، 39 ، 40 ، 41 ]، و روش های مبتنی بر نمودار [ 42 ، 43 ، 44 ، 45 ]. به طور خلاصه، بسیاری از روش‌های مرتبط با یادگیری عمیق موجود که فقط بر اطلاعات آماری جهانی یا محلی تمرکز دارند، منجر به کاهش عملکرد در بازنمایی و توصیفی می‌شوند. علاوه بر این، برخی از مدل‌های فوق از هسته‌های پیچشی استاندارد با میدان‌های دریافتی منظم استفاده می‌کنند که از اتصالات ساختاری بین نقاط غفلت می‌کنند و تراکم نقطه‌ای متفاوت را در نظر نمی‌گیرند.
روش ما از ایده‌ای شبیه به روش‌های پیچیدگی نقطه پیروی می‌کند، با این حال، به جای تمرکز بر ویژگی‌های منفرد و نادیده گرفتن سایر روابط بین نقاط فردی در مدل‌های یادگیری عمیق مشتق‌شده از PointNet، ما یک شبکه یادگیری معنایی نقطه‌ای را پیشنهاد می‌کنیم تا هر دو را به‌دست بیاوریم. و اطلاعات محلی هر نقطه، جلوگیری از از دست رفتن اطلاعات در محله های محلی و کاهش محاسبات پیچیده بی فایده.
برای بهبود دقت و کارایی تقسیم‌بندی به طور همزمان، ما یک رویکرد یادگیری عمیق را پیشنهاد می‌کنیم که برای شناسایی درختان منفرد از داده‌های UAV-LS طراحی شده است. نقاط غیر زمینی شناسایی و به دست می آیند. متعاقباً، یک الگوریتم کانولوشن نقطه‌ای اصلاح‌شده برای استخراج درختان از نقاط غیرزمینی در ابتدا پیشنهاد می‌شود. سپس یک الگوریتم بهینه سازی ساختار یافته نمودار برای به دست آوردن نتایج طبقه بندی بهینه انجام می شود. در نهایت، یک رویکرد جدید به نام یادگیری تعبیه گراف سه بعدی با یک تابع تلفات آگاه از ساختار برای تقسیم‌بندی درختان کنار جاده‌ای معرفی شده است. با بهترین دانش ما، این مقاله کاربرد قبلی روش تقسیم‌بندی نمونه مبتنی بر یادگیری عمیق است [ 46] برای تقسیم درختان منفرد از ابرهای نقطه ALS. هدف ما دستیابی به نتایج بخش‌بندی رضایت‌بخش با استفاده از یادگیری عمیق و در عین حال کاهش قابل ملاحظه تأثیر پیچیدگی صحنه است.
کمک های اصلی رویکرد ما شامل سه جنبه زیر است:
(من) ارائه درک صحنه شهری و رویکرد تشخیص درخت کنار جاده از ورودی داده های پهپاد-LS به بخش بندی درخت.
(ب) طبقه بندی بهبود یافته نقاط نامرتب سه بعدی در مقیاس بزرگ بدون وکسل کردن با استفاده از شبکه یادگیری معنایی نقطه ای. بیشتر پارامترها در شبکه آموخته می شوند و بنابراین هزینه تنظیم پارامتر فشرده به طور قابل توجهی کاهش می یابد.
(iii) تجمیع موثر اطلاعات چند سطحی (اطلاعات هندسی، اطلاعات تعبیه شده متمایز، و اطلاعات از همسایگان) و حذف خطاهای کوانتیزاسیون ناشی از وکسل سازی منظم با استفاده از شبکه عصبی کانولوشن گراف که تابع از دست دادن آگاه از ساختار را با k مبتنی بر توجه ترکیب می کند. -نزدیکترین همسایه.

2. مواد و روشها

همانطور که در شکل 1 نشان داده شده است ، روش ما شامل چهار مرحله اصلی است: (1) حذف زمین (2.1). داده های خام با یک الگوریتم فیلتر بهبود یافته به نقاط زمینی و غیر زمینی تقسیم می شوند. (2) تشخیص اشیاء درختان کنار جاده (2.2). اشیاء درختان کنار جاده از طریق رویکردهای یادگیری عمیق بر اساس شبکه PointNet تجدید نظر شده در نقاط غیر زمینی به دست می آیند. (3) پالایش برچسب زدن (2.3). یک الگوریتم بهینه‌سازی ساختار یافته نمودار برای دستیابی به هموارسازی فضایی نتایج اولیه برچسب‌گذاری معنایی انجام می‌شود. (4) شناخت تک تک درختان کنار جاده (2.4). اشیاء درختان کنار جاده با یک روش مبتنی بر یادگیری عمیق از ابر نقطه ای دسته بندی شده تقسیم می شوند. جزئیات هر مرحله از روش ما به شرح زیر است.

2.1. حذف زمین توسط فیلتر تراکم تراکم TIN پیشرفته

به دلیل حالت اسکن سیستم های Aerial LiDAR، نقاط زمینی بخش بزرگی از کل صحنه را اشغال می کنند. چنین تعداد زیادی از نقاط زمینی نه تنها مناطق جستجو را برای استخراج اشیاء غیرزمینی بزرگ می‌کنند، بلکه پیچیدگی‌های مکانی را افزایش می‌دهند و سرعت پردازش را کاهش می‌دهند. بنابراین، حذف نقاط زمین از صحنه های مختلف یک مرحله مقدماتی اما حیاتی است. برای کاهش مقدار داده‌های مورد استفاده و در نظر گرفتن نوسانات زمین در یک صحنه بزرگ، ما یک الگوریتم فیلترینگ متراکم شبکه مثلثی نامنظم (IPTD) بهبود یافته ایجاد می‌کنیم که می‌تواند به سرعت و به طور موثر نقاط زمین را از نقاط غیرزمینی متمایز کند. ، به ویژه مناطق پیچیده ساختاری.
در الگوریتم های فیلتر موجود، الگوریتم فیلتر مورفولوژیکی [ 47 ] نقاط غیر زمینی را در حالی که جزئیات زمین را حفظ می کند، به دست می آورد. روش متراکم‌سازی پیشرونده [ 48 ] به دلیل استحکام و اثربخشی آن در تقسیم‌بندی نقاط زمین، محبوبیت پیدا کرده است، با این حال، هنگام برخورد با مناطق پیچیده از نظر توپوگرافی و محیطی نارسایی دارد و تمایل به حذف نقاط زمین در مناطق شیب دار و صاف کردن زمین دارد. برای به دست آوردن عملکرد فیلترینگ بهتر برای مناطق پیچیده شهری، امکان سنجی بهبود فیلتر متراکم TIN پیشرونده ابرهای نقطه ای را بررسی می کنیم. در مقایسه با کارهای قبلی [ 49 ، 50]، پیشرفت های الگوریتم فیلتر IPTD پیشنهادی شامل سه جنبه است. (1) نقاط بذر زمینی بالقوه از طریق حداقل محلی توسعه یافته برای شبکه های حاوی نقاط به دست می آیند و نزدیکترین همسایه برای درون یابی ارتفاعات شبکه های بدون نقطه به جای استفاده از پایین ترین نقاط در شبکه های تعریف شده توسط کاربر اتخاذ شده است. (2) نقاط بذر زمین دقیق با قضاوت در مورد اختلاف ارتفاع در همسایگی درون یابی اسپلین صفحه نازک محلی با آستانه داده شده به دست می آیند. این عملیات نقاط بذر زمینی بیشتری را فراهم می کند که عموماً به طور مساوی توزیع شده اند. (3) قبل از تراکم به سمت بالا، تراکم رو به پایین برای ارتقای توانایی الگوریتم پیشنهادی در مقابله با تغییرات شیب انجام می شود. در نهایت، نقاط زمین با متراکم کردن مکرر نقاط بذر زمین استخراج می شوند.شکل 2 نمونه ای از ابر نقطه را قبل و بعد از برداشتن زمین نشان می دهد که در آن رنگ ها تغییرات ارتفاع را نشان می دهند.

2.2. تشخیص سازه های درخت مانند از طریق طبقه بندی نقطه ای در نقاط غیر زمینی

به عنوان یک نیاز مهم موجودی درخت شهری، برچسب‌گذاری داده‌های ورودی با دسته‌بندی درخت در بهره‌برداری از مقادیر اطلاعاتی برای تقسیم‌بندی نمونه درختان اساسی است. این مشکل به طور گسترده مورد بررسی قرار گرفته است. برخی از رویکردهای یکپارچه ویژگی‌های دست‌ساز را به شیوه‌ای اکتشافی ترکیب می‌کنند، اما در گرفتن ساختارهای معنایی سطح بالا شکست می‌خورند. نقاط تقسیم‌بندی‌شده تولید شده توسط روش‌های یادگیری عمیق، اغلب با نویز و نقاط پرت به دلیل توزیع نامنظم و تراکم نقطه ناهموار، که در محیط‌های پیچیده شهری اجتناب‌ناپذیر هستند، خراب می‌شوند. این یک چالش است که به طور موثر و خودکار درختان منفرد در مناطق شهری پیچیده زیست محیطی را از چنین داده هایی شناسایی کنید. برای حل این مسئله،
PointNet نحوه تفکر ما در مورد پردازش ابرهای نقطه را متحول کرده است زیرا یک نمایش ساختاریافته قابل یادگیری برای وظایف تقسیم بندی معنایی سه بعدی ارائه می دهد. با این حال، ویژگی‌های محلی ابرهای نقطه‌ای را نمی‌توان به‌طور مؤثری یاد گرفت و توانایی آن را برای تشخیص شی مورد نظر در صحنه‌های پیچیده محدود می‌کند. معماری پیشنهادی مشابه PointNet با چند تغییر کوچک است، به عنوان مثال، ویژگی‌ها به جای کل نقطه ابر از مناطق محلی محاسبه می‌شوند، که تخمین اطلاعات محلی را دقیق‌تر می‌کند. ما یک شبکه تقسیم‌بندی معنایی سه‌بعدی بهبود یافته بر اساس KNN نقطه‌ای ( k– نزدیکترین همسایه) روش جستجو، که دارای مزیت منحصر به فردی است که ویژگی های چند سطحی را استخراج می کند. شبکه پیشنهادی ویژگی‌های محلی یک نقطه پرس و جو را از منطقه محلی متشکل از مجموعه همسایگان به عنوان ویژگی‌های جدید آن می‌گیرد و با افزودن اتصالات پرش برای تقویت توانایی یادگیری ویژگی‌های محلی، بین چندین لایه ارتباط برقرار می‌کند.
در این بخش، اصول نظری و منطقی شبکه پیشنهادی برای تقسیم‌بندی اشیاء شهری از نقاط غیرزمینی داده‌های ALS را با جزئیات بیشتر ارائه می‌کنیم. با توجه به اینکه توصیفی بودن تفاوت‌های بین نقاط از ویژگی‌های اولیه کم‌بعد به دور از رضایت‌بخش است و غنای ویژگی‌های نقطه‌ای برای استخراج ویژگی‌های محلی خوب است، ابتدا تمایز ویژگی‌های نقطه‌ای را افزایش می‌دهیم و سپس اطلاعات محلی را در فضای ویژگی جدید به‌دست می‌آوریم. شبکه پیشنهادی عمدتاً شامل دو ماژول است: (1) پیاده سازی PointNet بهینه شده توسط KNN، که برای استخراج اطلاعات محلی قدرتمندتر در فضای ویژگی با ابعاد بالا استفاده می شود. (2) تقسیم معنایی ابر نقطه ای در مقیاس بزرگ با استفاده از ویژگی های جهانی و محلی. معماری روش پیشنهادی در خلاصه شده استشکل 3 .
شبکه یادگیری ویژگی دقیق و کامل ما در شکل 3 نشان داده شده است ، قسمت سبز رنگ، که از دو ماژول کلیدی تشکیل شده است: ماژول فرعی استخراج ویژگی نقطه بر اساس PointNet و ماژول فرعی استخراج ویژگی محلی در فضای ویژگی با ابعاد بالا.

2.2.1. زیر ماژول استخراج ویژگی نقطه

این ماژول برای به دست آوردن ویژگی‌های ابر نقطه‌ای غنی‌تر با ابعاد بالا با استفاده از چندین بار عملیات استخراج ویژگی طراحی شده است. برای کل خط لوله، ما مستقیماً از PointNet ساده شده به عنوان شبکه ستون فقرات خود استفاده می کنیم. شبکه ما یک ابر نقطه به اندازه می گیرد ن×دیبه عنوان ورودی، سپس آن را به a رمزگذاری می کند ن×128ماتریس شکل با استفاده از پرسپترون چند لایه مشترک (MLP) [ 29 ]. بعد از حداکثر ادغام، بعد ویژگی جهانی ابر نقطه 128 است. در نهایت، ویژگی های سراسری N بار تکرار می شوند و ویژگی نقطه را به یک بردار ویژگی الحاق می کنند. سپس این بردار به MLP وارد می شود تا یک رمان به دست آید ن×128بردار ویژگی شکل، که برای بدست آوردن ویژگی های محلی به ماژول زیر وارد می شود.
به طور کلی، شبکه یادگیری ویژگی عمدتاً از سه زیر ماژول استخراج ویژگی نقطه با همان اصل استفاده می کند. به عبارت دیگر، ما سه بار استخراج ویژگی را انجام می دهیم. ما ویژگی‌های لایه‌های مختلف را از طریق اتصال عبور داده و فیوز می‌کنیم تا ویژگی‌های سطح بالا غنی‌تر را استخراج و ترکیب کنیم. شبکه یادگیری ویژگی که در شکل 4 نشان داده شده است از دو جزء شامل PointNet ساده شده و کانال های اتصال تشکیل شده است.
2.2.2. زیر ماژول استخراج ویژگی های محلی

ویژگی های نقاط متعلق به یک دسته معنایی مشابه هستند، هدف این ماژول کاهش فاصله ویژگی بین نقاط مشابه و افزایش تمایز ابر نقاط مختلف است. خروجی ماژول فوق الف را تشکیل می دهد ن×128تانسور با اطلاعات سطح پایین برای به دست آوردن قدرت بیان کافی برای تبدیل هر ویژگی نقطه به یک ویژگی با ابعاد بالاتر، یک لایه کاملاً متصل به ماژول KNN اضافه می شود. ابتدا نقاط اصلی را تغییر می دهیم پبه یک حالت متعارف توسط یک STN (شبکه ترانسفورماتور فضایی) [ 51 ]، و سپس K نزدیکترین همسایه ها را در نقاط غیرمتغیر فضایی جستجو کنید.پ˜برای هر نقطه پرس و جو پ˜n. مجموعه نقطه به نقطه جستجوی KNN به صورت زیر تعریف می شود:

پ˜n، ک=کنن(پ˜n|(پ˜-پ˜n))

جایی که پ˜n، کنزدیکترین همسایه k- امین نقطه پرس و جو را نشان می دهدپ˜n.

در فضای ویژگی داده های ورودی، K نقاط همسایه با کمترین فاصله ویژگی از نقطه پرس و جو را جستجو می کنیم. شبه کد ماژول KNN که جزئیات الگوریتم جستجوی فضای ویژگی بر اساس KNN را نشان می دهد، در پیوست A ارائه شده است.
شبکه یادگیری ویژگی شامل سه زیر ماژول استخراج ویژگی محلی با ساختارهای یکسان است. در یک سطح معین، هر ماژول فرآیندی از یادگیری ویژگی های ابر نقطه ای در محله محلی است. بنابراین، این مقاله وظیفه یادگیری را در محله های محلی چند سطحی با اعمال مکرر زیر ماژول استخراج ویژگی محلی سه بار تکمیل می کند. پردازش دقیق این ماژول در شکل 5 نشان داده شده است . ماژول استخراج ویژگی محلی بر اساس فضای ویژگی ویژگی های محلی را در یک سطح استخراج می کند. با اعمال چندین بار این ماژول، میدان عملیات پذیرنده را می توان گسترش داد، این معادل استخراج چندین ویژگی محلی در سطوح مختلف است که برای استخراج ویژگی های ابر نقطه ای بیشتر و غنی تر مفید است.
2.2.3. ماژول تقسیم بندی معنایی و تابع ضرر
جزء تقسیم بندی معنایی سه بردار خروجی (بردار ویژگی نقطه سطح پایین، بردار ویژگی محلی سطح بالا و بردار ویژگی جهانی) را در یک بردار ویژگی 1280 بعدی به هم متصل می کند. این بردار به تدریج با استفاده مستقیم از MLP از ابعاد کاسته می شود و سپس به لایه های Softmax وارد می شود تا نتیجه تقسیم بندی نهایی را به دست آورد که شامل امتیاز N × M برای هر یک از N نقطه و هر یک از مقوله های معنایی M است.

برای به حداقل رساندن خطاهای مدل در طول آموزش، تابع ضرر ℒشبکه ما شامل از دست دادن بخش بندی معنایی است ℒسهمترو از دست دادن کنتراست ℒپآمنr:

ℒ=ℒسهمتر+ℒپآمنr

جایی که ℒسهمتربا تابع افت آنتروپی متقاطع softmax کلاسیک و خارج از قفسه تعریف شده است که به صورت زیر فرموله شده است:

ℒسهمتر=-∑من=1نgمنورود به سیستمهمن∑jهj

جایی که gمننشان دهنده یک برچسب داغ نمونه آموزشی i- امین است، N نشان دهنده اندازه دسته و همن/∑jهjبردار امتیاز پیش بینی softmax است.

در مورد از دست دادن متضاد، با یک تابع تمایز بر اساس این فرض که ویژگی های نقاط متعلق به یک دسته معنایی مشابه هستند بیان می شود. فاصله ویژگی و برچسب نقطه معیارهایی برای اندازه گیری عدم تشابه بین دو نقطه هستند. بنابراین، در فرآیند آموزش، شبکه پیشنهادی تفاوت شباهت ویژگی بین نقاط یک برچسب را به حداقل می‌رساند و تفاوت ویژگی بین دو نقطه متعلق به برچسب‌های شی مختلف در فضای ویژگی را گسترش می‌دهد. به طور خاص، تابع ضرر کنتراست به صورت زیر تعریف می شود:

ℒپآمنr=12ن×∑n=1نyد2+(1-y)×مترآایکس(مترآrgمنn-د، 0)2

که در آن d نشان دهنده فاصله اقلیدسی ویژگی دو نقطه است، N تعداد نقاط است، و حاشیه یک آستانه از پیش تعیین شده است، که یک متریک برای اندازه گیری تمایز بین دو نقطه است. y یک تابع باینری است که نشان می دهد آیا دو نقطه به یک دسته تعلق دارند یا خیر. اگر دو نقطه به یک شی تعلق داشته باشند y برابر است با 1:

ℒپآمنr=12ن×∑n=1ند2

در این حالت، اگر فاصله ویژگی بین دو نقطه کم باشد، مدل مناسب‌تر و از دست دادن است ℒپآمنrکوچکتر است. اگر دو نقطه به یک دسته تعلق ندارند، y = 0:

ℒپآمنr=12ن×∑n=1نمترآایکس(مترآrgمنn-د، 0)2

اگر فاصله ویژگی بین دو نقطه بیشتر از مترآrgمنn، به این معنی است که دو نقطه بر یکدیگر تأثیر نمی گذارد و ضرر ℒپآمنr0 است. اگر فاصله ویژگی دو نقطه کمتر از مترآrgمنn، یعنی ضرر ℒپآمنrبا کاهش فاصله ویژگی افزایش می یابد، پس مدل فعلی مناسب نیست و نیاز به آموزش مجدد دارد.

برچسب معنایی نقطه‌ای بر اساس بردار امتیاز پیش‌بینی پس از به حداقل رساندن تابع ضرر تعیین می‌شود. در نهایت، تقسیم‌بندی معنایی ویژگی‌های ابر نقطه اولیه را به فضاهای ویژگی سطح بالا جدید ترسیم می‌کند. یعنی، نقاط یک دسته معنایی با هم خوشه‌بندی می‌شوند، در حالی که طبقات مختلف در فضای ویژگی معنایی از هم جدا می‌شوند.

2.3. بهینه سازی ساختار یافته نمودار برای پالایش طبقه بندی

روش پیشنهادی دارای چند خطای محلی در نتیجه شبکه یادگیری معنایی نقطه‌ای است. به عنوان مثال، یک درخت بدون تاج به اشتباه به عنوان درخت دیگر یا یک قطب مخلوط با درخت به اشتباه به عنوان درخت طبقه بندی می شود. با در نظر گرفتن درخت شی در نتیجه طبقه‌بندی به عنوان ورودی در مرحله آخر، تقسیم‌بندی نمونه درختان، این برچسب‌های نادرست ممکن است پیامدهای نامطلوبی داشته باشند. بنابراین، می‌توانیم نتایج اولیه را بهینه کنیم و با یک مدل احتمالی، نتایج هموار محلی را بیشتر به دست آوریم. بدیهی است که برچسب‌های اشتباه را می‌توان توسط بافت محلی آن‌ها اصلاح کرد، همانطور که در [ 52 ] حمایت می‌شود.]. ما همبستگی‌های فضایی را با استفاده از یک ساختار گراف مدل‌سازی می‌کنیم تا از سازگاری پیش‌بینی برچسب نقطه‌ای اطمینان حاصل کنیم، به عبارت دیگر، پالایش برچسب‌گذاری را می‌توان به یک مسئله ساختار یافته نمودار تبدیل کرد.

اولین مرحله ساخت نمودار برای ساختار تابع هدف است، مدل گرافیکی توسط گراف مجاورت غیر جهت دار ساخته می شود. جی={V،E}، جایی که V={vمن}نشان دهنده گره ها و مجموعه ای از لبه ها است E={همنj}رابطه فضایی نقاط مجاور با وزن های w را رمزگذاری می کند . در نمودار G ، برای یک راس مرکزی v ، ده همسایه KNN آن را با توجه به حداقل تعداد یال ها از راس دیگر تعریف می کنیم. vمنبه v _ با توجه به وزن های لبه w∈[0، 1]فاصله مکانی، تفاوت زوایای بردار نرمال و شباهت برای تخمین وزن ها اتخاذ شده است. علاوه بر این، اجازه دهید پ={پ1،…،پن}مجموعه ای از نقاط را نشان دهید، اجازه دهید سی={ج1،…،جمتر}مجموعه ای از برچسب ها (در این مقاله، m با تعداد برچسب ها در مجموعه داده تعیین می شود)، اجازه دهید Ψ={Ψ|من=1،…،ن}مجموعه ای از متغیرهای ویژگی نقاط را نشان می دهد و اجازه دهید L={ل=(ل1،…،لن)|لمن∈سی، من=1،…،ن}تمام تنظیمات برچسب ممکن را نشان می دهد [ 53 ]. برای دستیابی به بهینه سازی جهانی با استفاده از نمودار ساخته شده، پیکربندی برچسب بهینه را به عنوان یک مسئله کمینه سازی تابع انرژی رسمی می کنیم و با معادله زیر تعریف می شود:

E(L)= Eدآتیآ(L)+λ⋅Eسمترooتیساعت(L)

که در آن عبارت بالقوه واحد Eدآتیآ(L)به طور کمی اختلاف بین پیکربندی برچسب ممکن L و داده های مشاهده شده را اندازه گیری می کند، در حالی که عبارت پتانسیل صاف Eسمترooتیساعتصافی و سازگاری بین پیش بینی ها را حفظ می کند و λیک ضریب وزنی است که برای متعادل کردن تأثیر بین پتانسیل یکنواخت و صافی محلی استفاده می شود.

با این پیکربندی، فرآیند منظم‌سازی تقسیم‌بندی معنایی اولیه برای اطمینان از برچسب‌ها به صورت محلی پیوسته و بهینه جهانی انجام می‌شود. در چارچوب پیشنهادی، این دو اصطلاح در توابع انرژی فوق، تعاریف متفاوتی دارند. در نتیجه، شکل پتانسیل واحد Eدآتیآ(L)به طور معمول است:

Eدآتیآ(L)=∑من∈Vϕمن(لمن)

جایی که ϕمن(لمن)میزان خوب برچسب زدن را اندازه می گیرد لمنمتناسب با متغیرهای ویژگی Ψمنداده های مشاهده شده داده شده و تأثیر برچسب ها را اعمال می کند. در مورد منطقه شهری، اشیاء یکسان دارای ویژگی های مشابه هستند، در حالی که اشیاء مختلف دارای ویژگی های متمایز هستند. عبارت ϕمن(لمن)=-ورود به سیستمپ(لمن)از احتمال پیش بینی شده به دست می آید پ(لمن)خروجی از طبقه بندی نقطه ای هر چه احتمال رده پسین بالاتر باشد، پتانسیل یکنواخت کوچکتر است.

عبارت دوم در معادله (7) اثر “نمک و فلفل” را سرکوب می کند و جریمه اختصاص دادن برچسب به چند نقطه سه بعدی را نشان می دهد و بنابراین با قضاوت می شود. Eسمترooتیساعت(L)=∑{من، j}∈Eψمن،j(لمن،لj)=∑{من، j}∈Eμ(لمن،لj)∑پ=1پωپک(fمن،fj)[ 54 ]. به طور خاص، μ(لمن،لj)=1اگر لمن≠لjیا 0 در غیر این صورت، کنشان دهنده هسته گاوسی با تکیه بر ویژگی های استخراج شده f است که توسط مقادیر XYZ و شدت نقاط i و j تعیین می شود ، و ωپضرایب ثابت را نشان می دهد. دو هسته گاوسی [ 55 ، 56 ] به شرح زیر انتخاب می شوند:

ωب⋅ه(-“جoorدمنnآتیهمن-جoorدمنnآتیهj”22θα2-“شدتمن-شدتj”22θβ2)+ωس⋅ه(-“جoorدمنnآتیهمن-جoorدمنnآتیهj”22θγ2)

جایی که، ωبوزن هسته دو طرفه است، ωسوزن هسته فضایی است، θα، θβو θγسه فراپارامتر از پیش تعریف شده هستند.

در حالی که ضریب منظم شدن λبه شرح زیر برآورد می شود:

λ=ه-دمنj2δ2

جایی که دمنjفاصله بین نقاط i و j و است δانتظار همه فواصل همسایه است.

بر این اساس، پیش بینی برچسب بهینه L*راه حل تابع انرژی کمینه سازی با ساختار زیر است:

L*∈آrgدقیقهل∈سی∑من∈Vϕمن(لمن)+λ⋅∑{من، j}∈Eψمن،j(لمن،لj)

اگرچه کمینه سازی دقیق غیرقابل حل است، مشکل کمینه سازی به راحتی و به طور مناسب توسط یک الگوریتم برش نمودار با استفاده از α-گسترش [ 57 ، 58 ]. با چند تکرار برش نمودار، می توانیم به طور موثر و سریع یک راه حل تقریبی برای بهینه سازی انرژی های چند برچسبی پیدا کنیم. هزینه برچسب‌گذاری در نظر گرفته نمی‌شود زیرا بهینه‌سازی مبتنی بر نمودار می‌تواند به طور موثری از پیش‌بینی و اطمینان و همچنین تخصیص برچسب معنایی بین دو نقطه مشابه در هر منطقه استفاده کند. نتایج بهینه‌سازی شده می‌تواند به‌طور خودکار با صحنه‌های شهری زیربنایی بدون ویژگی‌های از پیش تعریف‌شده برای برخی از اشیاء نامشخص سازگار شود.

2.4. تقسیم بندی درختان کنار جاده با یادگیری متریک عمیق

پس از تعیین درخت کلاس ، از روش تقسیم بندی مبتنی بر برچسب برای استخراج نقاط درخت استفاده می شود. از آنجایی که تاج درختان اغلب به هم چسبیده و به هم متصل می شوند، تعیین نقاط تک تک درختان با جداسازی صحیح نقاط تاج درخت از هر تنه حیاتی است. به عنوان مثال، شناسایی درختان در مناطق شهری پیچیده زیست محیطی به دلیل داده های با کیفیت پایین یک چالش است. برای غلبه بر این مشکل، کیفیت داده‌های درخت تقسیم‌بندی شده ابتدا از طریق بازیابی مناطق از دست رفته و حذف نویزها، افزایش می‌یابد. ما روش پیشنهادی قبلی را در [ 59 ، 60 ] گسترش می‌دهیم و به دنبال نقاط مشابه خود می‌گردیم تا همزمان با استفاده از تنظیم لاپلاسی گراف، آنها را حذف کنیم. با الهام از الگوریتم [ 61]، ما از یک الگوریتم هموارسازی حفظ لبه با استفاده از اطلاعات محله محلی برای بازیابی مناطق با داده های از دست رفته بهره برداری می کنیم. پس از اصلاح کیفیت، تعیین تک تک درختان از نقاط انجام می شود.
برای استخراج خودکار هر نقطه تاج درخت، یک معماری انتها به انتها جدید برای بخش‌بندی درختان فردی اعمال می‌شود که عملکرد از دست دادن آگاه از ساختار و k نزدیک‌ترین همسایه مبتنی بر توجه ( KNN ) را ترکیب می‌کند. چارچوب پیشنهادی در شکل 6 خلاصه شده است ، ما به ترتیب سه جزء اصلی شبکه پیشنهادی خود را شامل شبکه کانولوشن زیر چندمنیفولد، تابع تلفات آگاه از ساختار و شبکه کانولوشن گراف (GCN) توضیح می دهیم. ما ابتدا تعبیه‌های اولیه را برای هر نقطه توسط شبکه کانولوشنال پراکنده زیرمنیفولد ایجاد می‌کنیم. با الهام از کار [ 62]، ما تعبیه‌های متمایز را برای هر درخت از نقاط LiDAR بر اساس تابع تلفات آگاه از ساختار به دست می‌آوریم، که هم اطلاعات هندسی و هم اطلاعات جاسازی را در نظر می‌گیرد. به منظور دستیابی به تعبیه‌های اصلاح‌شده، ما یک شبکه عصبی کانولوشنال گراف مبتنی بر توجه ایجاد می‌کنیم که هدف آن انتخاب و جمع‌آوری خودکار اطلاعات از همسایگان است. در نهایت، برای تقسیم بندی تک درختان کنار جاده، از یک الگوریتم تقسیم بندی برش نرمال بهبود یافته ساده برای خوشه بندی جاسازی های تصفیه شده استفاده می کنیم.

به طور خاص، ما مستقیماً از معماری شبکه کانولوشنال زیرمنیفولد (SCN) به عنوان اولین مؤلفه خود با وام گرفتن از [ 63 ] استفاده می کنیم.]. در آزمایش خود، از دو شبکه ستون فقرات، شامل معماری UNet مانند (با ظرفیت کمتر و سرعت بیشتر) و معماری ResNet مانند (با ظرفیت بیشتر و سرعت کمتر) استفاده می کنیم. در این بخش، ما عمدتاً دو مؤلفه آخر روش پیشنهادی خود را برای مثال تقسیم‌بندی درختان توضیح می‌دهیم. در یادگیری متریک، نقاط درون یک درخت دارای تعبیه‌های مشابه هستند در حالی که نقاط درختان مختلف در فضای جاسازی از هم جدا هستند. با در نظر گرفتن نقاط درون هر درخت نه تنها ویژگی های تعبیه شده، بلکه دارای روابط هندسی نیز هستند، امیدواریم با ترکیب اطلاعات ساختار با ویژگی های تعبیه شده، نتایج نهایی متمایزتر باشد. برخی از معیارهای رایج مورد استفاده (به عنوان مثال، فاصله کسینوس) برای اندازه‌گیری شباهت بین تعبیه‌ها ممکن است فرآیند یادگیری و پس فرآیند را به عنوان نوعی دلیل دشوارتر کند. برای اینکه جاسازی به اندازه کافی متمایز باشد، فاصله اقلیدسی برای اندازه‌گیری شباهت بین جاسازی‌ها پس از آزمایش‌های آزمایشی زیاد انتخاب شد. پس از اندازه‌گیری شباهت بین تعبیه‌ها، تعبیه‌های متمایز برای هر درخت را با یک تابع از دست دادن آگاه به ساختار به دست می‌آوریم. تابع ضرر ما از دو مورد زیر تشکیل شده است:

ℒستیrتوجتیتوrه=1ن∑من=1نℒمنمنnتیrآ+1ن(ن-1)∑من=1ن∑j=1،j≠مننℒمنjمنnتیهr

که در آن N تعداد کل درخت در کل صحنه است. اولین مورد ℒمنمنnتیrآهدف آن به حداقل رساندن فاصله بین جاسازی ها در همان درخت است. همانطور که در رابطه (13) نشان داده شده است، ویژگی کلی یک درخت را می توان با تعبیه متوسط ​​توصیف کرد.

ℒمنمنnتیrآ=∑j=1nمن11+ه-سدمن،j[هدمن،j-α]+2

جایی که αنشان دهنده آستانه ای برای جریمه کردن فاصله زیاد جاسازی است، nمنشماره نقطه درخت i است.سدمن،jمختصات نقطه j در درخت i است که فاصله فضایی بین نقطه j و مرکز هندسی را اندازه می گیرد.μسد،مناز درخت منهدمن،jتعبیه نقطه j در درخت i است که فاصله جاسازی بین نقطه j و میانگین جاسازی را اندازه می گیرد. μهد،من. توضیح بیشتر، سدمن،jو هدمن،jسپس به ترتیب معادلات (14) و (15) نشان داده می شوند.

سدمن،j=”سدj-μسد،من”=”سدj-1nمن∑j=1nمنسدمن،j”
هدمن،j=”هدj-μهد،من”=”سدj-1nمن∑j=1nمنهدمن،j”

از سوی دیگر، مورد دوم ℒمنjمنnتیهrمعمولاً برای تمایز دادن نقاط از درختان مختلف استفاده می شود. به طور مشخص،

ℒمنjمنnتیهr=[β-“μسد،من-μسد،j”]+2

جایی که βنشان دهنده آستانه ای برای فاصله بین جاسازی های متوسط ​​است. پس از آزمایش های مکرر، αو βبه ترتیب 0.7 و 1.5 تنظیم شده است.

برای دستیابی به هدفی که تولید تعبیه‌های مشابه در یک درخت و تعبیه‌های متمایز بین درختان مختلف است، از الگوریتم KNN برای بهبود سازگاری محلی جاسازی‌ها و جمع‌آوری اطلاعات از نقاط اطراف برای یک نقطه خاص استفاده می‌شود. با این حال، مایه تاسف است که برخی از اطلاعات نادرست ارائه شده توسط KNN برای جاسازی مضر باشد. واضح تر است که یک نقطه نزدیک به لبه یک درخت خاص ممکن است اطلاعات درخت دیگری را جمع آوری کند. به جای تجمیع استاندارد KNN ( ایکسمنآggrهgآتیه، یک KNN مبتنی بر توجه برای جاسازی تجمع توسعه داده شده است ( ایکسمنآggrهgآتیه”) که می تواند وزن های مختلفی را برای همسایگان مختلف تعیین کند. فرآیند تبدیل را می توان به صورت زیر رسمیت داد:

ایکسمنآggrهgآتیه=1ک∑متر=1کایکسjمنمتر↦ایکسمنآggrهgآتیه”=∑متر=1کαمتر⋅ایکسjمنمتر

که در آن جاسازی های ورودی ابرهای نقطه ای با X = نشان داده می شود {ایکس1،…،ایکسn}⊆آراف، {ایکسjمن1،…،ایکسjمنک}k نزدیکترین همسایگان هستندایکسمنبا توجه به موقعیت مکانی آنها، و αمتروزن توجه برای هر همسایه و عادی سازی تابع softmax است.

شکل 7 تصویری از KNN مبتنی بر توجه است که جمع‌کننده شبکه عصبی کانولوشنال گراف پیشنهادی ما شامل دو مرحله است. در مرحله 1، برای هر نقطه ورودی، k نزدیکترین همسایه با توجه به مختصات مکانی جستجو می شود. وزن‌های متفاوتی به همسایه‌های مختلف در مرحله 2 اختصاص داده می‌شود. خروجی جمع‌کننده میانگین وزنی جاسازی‌های k همسایه است. به طور کلی، Aggregator در قالب KNN مبتنی بر توجه ، یک عملیات طبیعی و معنادار برای نقاط سه بعدی است و به شبکه اجازه می دهد تا اهمیت متفاوتی را برای همسایگان مختلف بیاموزد.

در تحقیق قبلی، GCN معمولاً از دو بخش تشکیل شده است: جمع‌کننده و به‌روزرسانی (نشان داده شده در شکل 8 ). همانطور که در بالا توضیح داده شد، گردآورنده برای جمع آوری اطلاعات از همسایگان با استفاده از KNN مبتنی بر توجه پیشنهادی است . برای به‌روزرسانی اطلاعات جمع‌آوری‌شده با نگاشت جاسازی‌ها در یک فضای ویژگی جدید، یک لایه کاملاً متصل ساده بدون سوگیری به عنوان به‌روزرسانی‌کننده استفاده می‌شود. عملیات به شرح زیر رسمیت یافته است:

ایکسمنتوپدآتیه=[ایکسمن،ایکسمنآggrهgآتیه]دبلیو،

جایی که W ⊆ آر2اف×افیک پارامتر قابل آموزش از به روز رسانی است.

بخشی از GCN ها رابطه را با استفاده از ماتریس لاپلاسین و تجزیه ویژه توصیف می کنند که به هزینه محاسباتی هنگفتی نیاز دارد (پیچیدگی) O(n2)). بر خلاف GCN های قبلی، نقطه توجه اصلی GCN فضایی ما این است که KNN مبتنی بر توجه به عنوان جمع کننده استفاده می شود. به عبارت دیگر، KNN (پیچیدگی O( n × k )) برای توصیف رابطه استفاده می شود. برای GCN بسیار حیاتی است که روی داده های اصلی اعمال شود. آخرین اما نه کم اهمیت، شبکه پیشنهادی به راحتی به صورت سرتاسر آموزش داده می شود و از بهینه ساز ADAM با نرخ یادگیری ثابت 0.001 استفاده می کند. در طول اجرا، ابتدا شبکه ستون فقرات را برای به دست آوردن یک مدل تقسیم‌بندی از پیش آموزش‌دیده شده، آموزش می‌دهیم، سپس کل شبکه تقسیم‌بندی درختی را بر اساس مدل از پیش آموزش‌دیده آموزش می‌دهیم، که می‌تواند در زمان انجام آزمایش‌های متعدد صرفه‌جویی کند.

درختان مستقل فضایی به سرعت و به طور موثر جدا می شوند، اما درختان همپوشانی یا مجاور به سختی جدا می شوند. چندین تحقیق قبلی خطاهای حذف را با یک الگوریتم قطع نمودار کاهش دادند که دقت را افزایش داد اما پیچیدگی محاسباتی را افزایش داد. برای بخش بندی بیشتر آن اشیاء حاوی بیش از یک شی، یک روش تقسیم بندی برش نرمال شده مبتنی بر سوپروکسل توسعه داده شده است. اشیاء مخلوط ابتدا به سوپروکسل های همگن با وضوح تقریباً مساوی با استفاده از الگوریتم تقسیم بیش از حد موجود در [ 64 ] تقسیم می شوند، که می تواند مرز جسم را بسیار بهتر از بقیه حفظ کند. سپس، یک نمودار وزنی کامل G ( V , E ) را در نظر بگیرید) از سوپروکسل های داده شده با توجه به همسایه های فضایی آنها ساخته شده است، که در آن رئوس V با مرکز سوپروکسل ها نشان داده می شوند و یال های E بین هر جفت سوپروکسل مجاور متصل می شوند. وزن معنی دار تخصیص داده شده به لبه برای اندازه گیری شباهت بین یک جفت سوپروکسل که توسط لبه به هم متصل شده اند اتخاذ می شود و با اطلاعات هندسی مرتبط با سوپروکسل ها به صورت زیر محاسبه می شود:

ωمنj={هایکسپ(-(دیمنjایکسY)2σایکسY2)⋅هایکسپ(-(دیمنjز)2σز2)⋅هایکسپ(-(جیمنjمترآایکس)2σجی)،دیمنjایکسY≤rایکسY0،دیمنjایکسY>rایکسY

جایی که دیمنjایکسYو دیمنjزبه ترتیب فاصله افقی و عمودی بین سوپروکسل های i و j هستند. σایکسY، σزو σجیانحراف معیار را نشان می دهد دیمنjایکسY، دیمنjزو جیمنjمترآایکس، به ترتیب. rایکسYیک آستانه فاصله برای تعیین حداکثر فاصله معتبر بین دو سوپروکسل در صفحه افقی است. جیمنjمترآایکسبه صورت بیان می شود

جیمنjمترآایکس=مترآایکس(دیایکسY(من، تیrههتیoپ)،دیایکسY(j، تیrههتیoپ))

جایی که دیایکسY(من، تیrههتیoپ)و دیایکسY(j، تیrههتیoپ)فاصله افقی بین سوپروکسل های i , j و بالای نزدیکترین درخت را نشان می دهد.

به طور خاص، شباهت بین دو سوپروکسل با در نظر گرفتن فاصله آنها در صفحه افقی و توزیع نسبی افقی و عمودی آنها اندازه گیری می شود. با چنین تعریفی، ما نمودار وزنی کامل G را با روش تقسیم بندی برش نرمال شده به دو گروه جدا از هم A و B تقسیم می کنیم، که شباهت را در هر گروه به حداکثر می رساند. آ∩ب=∅) و عدم تشابه بین دو گروه ( آ∪ب=V). با توجه به [ 65 ]، تابع هزینه مربوطه به صورت تعریف شده است

نجتوتی(آ،ب)=جتوتی(آ،ب)آسسoج(آ،V)+جتوتی(آ،ب)آسسoج(ب،V)

جایی که جتوتی(آ،ب)=∑من∈آ،من∈بωمنjنشان دهنده مجموع وزن های روی لبه های متصل کننده گروه های A و B است. آسسoج(آ،V)=∑من∈آ،من∈Vωمنjو آسسoج(ب،V)=∑من∈ب،من∈Vωمنjمجموع وزنه های روی یال های قرار گرفته در گروه A و B را نشان دهید.

فرآیند تقسیم نمودار وزنی G به دو گروه جداگانه A و B به عنوان کمینه سازی در نظر گرفته می شود نجتوتی(آ،ب). از آنجایی که مشکل کمینه‌سازی NP-hard است، روش پیشنهادی بر استراتژی تقریب تکیه می‌کند که نتایج نسبتاً خوبی از نظر کیفیت و سرعت حل به دست می‌آورد. سپس به حداقل رساندن نجتوتی(آ،ب)با حل مسئله مقدار ویژه تعمیم یافته مربوطه به دست می آید

(دی-دبلیو)y=λدیy

که در آن W ( i ، j ) = ωمنjو D یک ماتریس مورب است که ردیف i مجموع وزن های لبه های مربوط به سوپروکسل i را ثبت می کند.

دی(من،j)={∑متر∈Vωمنمتر، منf من=j0،  oتیساعتهrwمنسه

ما یک پارامتر z را معرفی می کنیمدی-12yبنابراین، معادله (22) به صورت نمایش داده می شود دی-12(دی-دبلیو)دی-12z=λz. از اصل اولیه ضریب ریلی می توان فهمید که حل مسئله حداقل مقدار از نجتوتی(آ،ب)به حل بردار ویژه دوم سیستم ویژگی تبدیل می شود و بهترین نتیجه تقسیم بندی نرمال شده به دست می آید.

z=آrgدقیقهzتیz0=0zتیدی-12(دی-دبلیو)دی-12zzتیzy=آrgدقیقهyتیدیy0=0yتی(دی-دبلیو)yyتیدیy

جایی که {λ=0، z0=دی-12من}راه حل کوچک سیستم ویژگی فوق الذکر است، y0=منکوچکترین بردار ویژگی است.

بر اساس اصل برش نرمال شده، اشیاء همپوشانی با استفاده از یک آستانه برای بردار ویژه مرتبط با دومین مقدار ویژه کوچک به دو بخش تقسیم می شوند. از آنجایی که عناصر دومین بردار ویژه کوچک‌ترین معمولاً به‌عنوان مقادیر واقعی پیوسته ظاهر می‌شوند، باید یک نقطه جدایی معرفی شود تا دو نیم شود، معمولاً 0 یا میانه عناصر بردار ویژه به عنوان نقطه جداسازی استفاده می‌شود. به منظور به حداقل رساندن نجتوتی(آ،ب)برای یافتن نقطه جداسازی بهینه از روش اکتشافی [ 66 ] استفاده می شود. اطلاعات ارتفاع نقش مهمی در پردازش داده های هوایی LiDAR ایفا می کند، ما در نهایت یک ماژول توجه به ارتفاع [ 67 ] را اتخاذ کردیم که به طور مستقیم اطلاعات ارتفاع در هر نقطه را برای بهبود نتایج تقسیم بندی اعمال می کند.

3. نتایج

توضیح مختصری در مورد داده های تجربی ابتدا در این بخش ارائه شده است. سپس به ترتیب عملکرد نتایج حاصل از روش پیشنهادی را به صورت کیفی و کمی تحلیل می کنیم.

3.1. توضیحات داده ها

ما عملکرد رویکرد خود را با استفاده از دو مجموعه داده عمومی زیر ارزیابی می‌کنیم: رقابت 2019 IEEE Geoscience and Remote Sensing Society (GRSS) رقابت سه بعدی طبقه‌بندی ابر نقطه‌ای (DFC 3D) [ 68 ] و Dayton Annotated Earth LiDAR Scan (DALES) [ 69 ] ] مجموعه داده. DFC 3D یک مجموعه داده هوایی LiDAR است که توسط IEEE GRSS جمع آوری شده و تقریباً 100 کیلومتر را پوشش می دهد. .در بخش هایی از جنوب ایالات متحده، ارائه شده در فایل های متنی ASCII. با توجه به تفاوت در تعریف دسته، شش کلاس معنایی از پیش تعریف شده، یعنی زمین، درخت، ساختمان، آب، جاده/پل مرتفع و نقاط بدون برچسب را بررسی می‌کنیم. XYZ و شدت به عنوان ورودی در آزمایش های ما استفاده می شود. صحنه هایی از سه نوع مختلف در وب سایت برچسب زدن IEEE GRSS 3D ارائه شده است: دو صحنه با 10 فایل به عنوان مجموعه آموزشی و صحنه دیگر با 6 فایل به عنوان مجموعه آزمایشی استفاده می شود.
مجموعه داده DALES همچنین از داده‌های ALS به‌دست‌آمده با سیستم Riegl LiDAR تشکیل شده است که با ارتفاع متوسط ​​پرواز حدود 1000 متر بالای برخی از شهرهای کانادا پرواز می‌کند. به عنوان یک مجموعه داده جدید ALS در مقیاس بزرگ، 10 کیلومتر مربع مساحت و هشت دسته شی با بیش از 0.5 میلیارد نقطه برچسب گذاری شده را در بر می گیرد. مجموعه داده به طور تصادفی به دو منطقه تقسیم می شود، یعنی مجموعه آموزشی و مجموعه آزمایشی به ترتیب با تقسیم درصدی 70/30.

3.2. عملکردهای طبقه بندی

ما عملکرد طبقه‌بندی رویکرد پیشنهادی را از نظر معیارهای ارزیابی زیر [ 70 ] ارزیابی می‌کنیم: دقت، یادآوری، امتیاز F1، دقت کلی (OA)، و میانگین امتیاز F1 (1 AvgF1 ).). در میان آنها، سه معیار اول به طور خاص برای ارزیابی عملکرد در هر کلاس استفاده می شود، در حالی که دقت کلی و میانگین امتیاز F1 برای ارزیابی عملکرد در کل مجموعه آزمون استفاده می شود. برای آزمایش عملکرد شبکه بهبود یافته بر اساس جستجوی نقطه‌ای KNN، مقایسه بین نتایج با PointNet اصلی انجام می‌شود. علاوه بر این، برای تأیید امکان‌سنجی بهینه‌سازی ساختار گراف که برای پالایش برچسب‌گذاری طراحی شده است، مقایسه بین نتایج با و بدون هموارسازی انجام می‌شود. اینجا،جدول 1 و جدول 2نتایج طبقه‌بندی نهایی را به ترتیب در مجموعه داده‌های DFC 3D و مجموعه داده‌های DALES فهرست کنید. به طور خاص، ما در نهایت به دقت 87.0٪، یادآوری 91.2٪، و امتیاز F1 89.1٪ برای برچسب زدن کلاس درختی در مجموعه داده DFC 3D، و IoU 94.1٪ برای دسته درخت در مجموعه داده DALES به دست آوردیم.

3.2.1. مقایسه بین پوینت نت و روش ما

برای تقسیم‌بندی معنایی نقطه‌ای، یادگیری ویژگی داده‌های ALS یک مشکل اساسی است که مستقیماً بر نتایج درک صحنه شهری تأثیر می‌گذارد. برای اعتبارسنجی عملکرد طبقه‌بندی شبکه پیشنهادی، نتایج به‌دست‌آمده از استخراج اطلاعات محلی قدرتمندتر با استفاده از PointNet بهینه‌سازی شده توسط KNN را با نتایج استخراج ویژگی‌های جهانی مستقیماً از PointNet اصلی مقایسه کردیم. نتایج طبقه بندی PointNet اصلی و بهینه شده بر روی مجموعه داده سه بعدی DFC به عنوان مقایسه در جدول 3 ارائه شده است. شبکه پیشنهادی می‌تواند تا حد زیادی عملکرد طبقه‌بندی را با افزایش 10.7% در OA و افزایش 19.9% ​​در AvgF1 بهبود بخشد.. علاوه بر این، دقت، یادآوری و F1 درخت به ترتیب 0.7٪، 11.6٪، 6.1٪ افزایش قابل توجهی را نشان می دهد که نشان می دهد استراتژی پیشنهادی می تواند دقت بالاتری را به خصوص برای استخراج شی درخت ایجاد کند. توضیح احتمالی این است که القای اطلاعات محلی چند مقیاسی می تواند نمایش بهتری را به خصوص در بهبود یکپارچگی شی ارائه دهد. شکل 9 تجسم نتایج طبقه‌بندی روی مجموعه داده‌های سه بعدی DFC را نشان می‌دهد، می‌توان مشاهده کرد که استفاده از روش بهینه‌سازی PointNet نتیجه اولیه خوبی را ارائه می‌دهد که کارایی شبکه پیشنهادی را در ارائه ویژگی‌های اطلاعاتی نشان می‌دهد.
3.2.2. اثربخشی هموارسازی برچسب‌گذاری با استفاده از بهینه‌سازی ساختار یافته نمودار
تعداد کمی از نقاط با برچسب اشتباه در خروجی ها وجود دارد که می توان آنها را در هموارسازی برچسب ها با اطلاعات متنی اصلاح کرد. به منظور ارزیابی سودمندی بهینه‌سازی مبتنی بر نمودار، یک چارچوب منظم برای به دست آوردن برچسب‌گذاری معنایی فضایی صاف داده‌های UAV-LS از یک طبقه‌بندی نقطه‌ای مورد آزمایش قرار گرفت. در اینجا، جدول 4 نتایج اولیه و بهینه سازی شده تقسیم بندی معنایی را فهرست می کند، مشاهده می شود که عملکرد کلی بهبود قابل توجهی را نشان نمی دهد، اجرای هموارسازی برچسب OA را 0.2٪ بهبود می بخشد، اما تأثیر بهینه سازی طبقه بندی در برخی مشخص است. طبقات خاص مانند درختان شکل 10تصویر بصری دقیق را نشان می دهد، که نشان دهنده بهبود عملکرد همواری و طبقه بندی است. همانطور که قبلاً ذکر شد، اگرچه نقاط طبقه‌بندی اشتباه اغلب صحنه‌های شهری به درستی از طریق یک روش یادگیری عمیق قدرتمند برچسب‌گذاری می‌شوند، تغییر در آمار دقت طبقه‌بندی آشکار به نظر نمی‌رسد. این را می توان به این دلیل نسبت داد که استراتژی ما قبلاً ویژگی های جهانی و محلی را با کیفیت بالا ارائه کرده است، به ویژه اجرای استراتژی جستجوی نقطه ای KNN.
3.2.3. مقایسه با سایر روش های منتشر شده
علاوه بر این، ما چندین رویکرد تقسیم‌بندی معنایی سه بعدی را برای مقایسه منصفانه با استفاده از دو مجموعه داده عمومی فوق‌الذکر اجرا کردیم. چنین مقایسه ای می تواند نشان دهد که روش پیشنهادی می تواند بهتر از سایر روش های کلاسیک عمل کند.
پس از نشان دادن اثربخشی، روش پیشنهادی را با سایر روش‌های منتشر شده با دقت بالا که دارای کدهای موجود با استفاده از مجموعه داده‌های سه بعدی DFC هستند، از جمله DANCE-Net [ 71 ] و GA-Conv [ 67 ] مقایسه می‌کنیم. روش DANCE-Net [ 71 ] داده‌های ALS را با معرفی یک ماژول کانولوشن آگاه از چگالی که از چگالی نقطه‌ای برای وزن‌دهی مجدد وزن‌های قابل یادگیری هسته‌های کانولوشن استفاده می‌کند و توسعه یک مدل چند مقیاسی CNN برای انجام معنایی هر نقطه، طبقه‌بندی کرد. برچسب زدن در روش GA-Conv [ 67 ] که استراتژی آن شبیه به DANCE-Net است [ 71 ]]، پیچیدگی تقریبی بر روی مجموعه‌های نقطه سه بعدی توزیع نابرابر با یک شبکه هندسی-توجه متشکل از پیچیدگی آگاه به هندسه، معماری سلسله مراتبی متراکم و ماژول ارتفاع-توجه برای جاسازی سه مشخصه به طور موثر، که می‌تواند به صورت انتها به انتها آموزش داده شود. . علاوه بر این، در مقایسه با روش‌های فوق‌الذکر، روش پیشنهادی که مستقیماً بر روی ابرهای نقطه‌ای نیز عمل می‌کند، رتبه دوم را در بین سه استراتژی دارد، با مقدار OA که 5.1٪ بیشتر از GA-Conv [ 67 ] است. جدول 5 مقایسه ای از دقت طبقه بندی با معیارهای ارزیابی فوق الذکر را در بین سه روش مختلف نشان می دهد. در مقایسه با DANCE-Net [ 71]، به OA کمتری دست پیدا می کنیم. با این حال، ما عملکرد بهبود یافته ای را در طبقه بندی درخت ارائه می دهیم که دقت بالاتری ایجاد می کند.

برای بررسی بیشتر تطبیق پذیری روش پیشنهادی در مجموعه داده های ALS در مقیاس بزرگ، ما همچنین نتایج طبقه بندی نقطه ای را در مجموعه داده DALES به دست آوردیم. ما معیارهای ارزیابی معیارهای ابر نقطه LiDAR در مقیاس بزرگ را دنبال می کنیم و از میانگین IoU و OA به عنوان معیارهای ارزیابی اصلی خود استفاده می کنیم. هر کلاس IoU ابتدا به عنوان معادله (25) تعریف می شود، میانگین IoU به سادگی میانگین در تمام هشت دسته است، به استثنای دسته مجهول، شکل معادله (26)، و OA را می توان به عنوان معادله (27) محاسبه کرد. . برای ارزیابی بیشتر، روش پیشنهادی با روش‌های منتشر شده قبلی مقایسه شد (ما فقط الگوریتم‌هایی را انتخاب کردیم که نتایج منتشر شده و کدهای موجود را دارند، از جمله PointNet++ [ 30 ]، ShellNet [ 72 ]، و Superpoint Graphs [42 ]). نتایج مقایسه کمی روی مجموعه داده DALES در جدول 6 فهرست شده است ، که نشان می‌دهد شبکه پیشنهادی نسبت به مدل‌های دیگر عملکرد طبقه‌بندی بهتری از نظر OA و میانگین امتیاز IoU دارد. به طور خاص، مدل پیشنهادی عملکرد استخراج پیشرفته‌ای را برای درختان به دست می‌آورد. عملکرد بسیار قوی معماری ما بر روی درختان با IoU 94.1 درصد، بیش از 2 درصد بیشتر از شبکه های دیگر، احتمالاً به دلیل تفاوت بین معماری پیشنهادی و روش های دیگر است، این است که ما بر انتخاب یک عدد ثابت تکیه نکرده ایم. از نقاط در شعاع جستجو این روش انتخاب دسته ای امکان انتخاب یک محله به اندازه کافی وسیع را برای دریافت اطلاعات کافی و همچنین داشتن نقاط کافی برای شناسایی اشیاء کوچک فراهم می کند.

منoUمن=جمنمنجمنمن+∑j≠منجمنj+∑ک≠منجکمن
منoU¯=∑من=1نمنoUمنن
Oآ=∑من=1نجمنمن∑j=1ن∑ک=1نجjک

3.3. عملکردهای تقسیم بندی درختان منفرد

3.3.1. تقسیم بندی درختان کنار جاده

شکل 11 و شکل 12 به ترتیب نتایج تقسیم‌بندی درختان کنار جاده را برای داده‌های آزمایش ابرهای نقطه‌ای انتخاب شده 1، داده‌های آزمایشی 2 از مجموعه داده‌های DFC 3D نشان می‌دهند. شکل 11 a و شکل 12 a دو صحنه انتخاب شده را نشان می دهد که با ارتفاع هر نقطه رنگ شده است. پس از حذف نقاط زمینی توسط الگوریتم فیلتر IPTD، امکانات جاده به صورت معنایی از نقاط غیرزمینی شناسایی شد. شکل 11 ب و شکل 12 ب نتایج تشخیص شی را با رنگ های مختلف نشان می دهد که در آن نقاط خاکستری، قرمز، نارنجی، سبز و آبی به ترتیب نقاطی از زمین، ساختمان ها، آب، درختان و سایر نقاط را نشان می دهند. شکل 11 ج و شکل 12c نتایج استخراج درختان کنار جاده را نشان می دهد، جایی که درخت به رنگ سبز کشیده شده است و زمین به رنگ خاکستری نقطه چین شده است. شکل 11 d و شکل 12 d نتایج قطعه‌بندی نمونه درختان کنار جاده را نشان می‌دهند که با رنگ‌های مختلف نقطه‌گذاری شده‌اند. درست مانند شکل 11 و شکل 12 ، شکل 13 a-d و شکل 14 a-d نتایج بصری هر مرحله از روش ما را در مجموعه داده DALES نشان می دهد. جزئیات بیشتر از نتیجه قطعه بندی درخت کنار جاده در شکل 15 نشان داده شده است ، شکل 15 a نتایج قطعه بندی برای درختان کوچک است و شکل 15b نتایج تقسیم بندی برای درختان ناقص است. مشاهده می شود که اگر درختان به طور جدی روی هم قرار نگیرند، به خوبی شناسایی می شوند، به این معنی که روش پیشنهادی عملکرد خوبی را در تشخیص درختان کنار جاده، حتی اشیاء کوچک و ناقص ارائه می دهد.
3.3.2. ارزیابی روش پیشنهادی

ما الگوریتم تقسیم بندی درخت را در پایتون اجرا کردیم و نتیجه را با درخت های مرجع مقایسه کردیم. در این مطالعه، عملکرد روش تقسیم‌بندی درختی پیشنهادی روی این دو مجموعه داده ALS با معیارهای زیر [ 6 ] ارزیابی می‌شود: دقت تقسیم‌بندی ( AC )، خطای حذف ( OM ) و خطای کمیسیون ( COM ). AC نرخ درختانی است که به درستی شناسایی شده اند. OM نرخ درختان شناسایی نشده است و COM نرخ درختان نادرست شناسایی شده است.

AC = se / رفر
OM = استفاده / رفر
COM = fse / ref

که در آن de تعداد درخت هایی است که به درستی تقسیم شده اند، ude تعداد درخت های بدون بخش، fde تعداد درخت هایی است که به اشتباه تقسیم شده اند و ref تعداد درخت های مرجع است.

جدول 7 دقت تقسیم بندی، خطای حذف و خطای کمیسیون تقسیم بندی درختی جداگانه از این دو مجموعه داده را نشان می دهد. روش ما نتایج خوبی را در بخش‌بندی درختان کنار جاده با میانگین AC ، OM و COM (86.8٪، 13.2٪، 9.5٪) برای دو مجموعه داده به دست می‌آورد. سه معیار با افزایش شدید پیچیدگی صحنه اندکی کاهش می یابد.
3.3.3. مطالعات تطبیقی
برای ارزیابی اثربخشی تقسیم‌بندی نمونه درخت، گروهی از آزمایش‌ها را طراحی کردیم و آن را با سه روش دیگر، از جمله روش لی [ 73 ]، ForestMetrics [ 74 ] و treeseg [ 75 ] از نظر دقت تقسیم‌بندی، خطای حذف مقایسه کردیم. و خطای کمیسیون برای تشخیص درختان کنار جاده، همانطور که در جدول 8 آمده است. ما همین داده ها را برای ارزیابی روش پیشنهادی و روش های دیگر در این مقاله اعمال می کنیم.
لی و همکاران [ 73 ] یک روش رشد منطقه از بالا به پایین برای تقسیم بندی درختان در جنگل های سوزنی برگ اتخاذ کرد. با این حال، عملکرد الگوریتم زمانی که برای درختان کنار جاده شهری اعمال می شود ایده آل نیست. ForestMetrics [ 74 ] به طور عمده تنه ها را تشخیص می دهد و درختان منفرد را از ALS ترسیم می کند تا با الگوریتم جدید از پایین به بالا برای درختانی با تاج هایی با اشکال ساختاری پیچیده مناسب باشند. اگرچه ForestMetrics با مقادیر AC ، OM ، و COM به ترتیب 85.9٪، 14.1٪ و 11.8٪ عملکرد قطعه بندی درخت خوبی را به دست آورد . متأسفانه، نمی تواند با اشکال گسترده و نامنظم درختان مقابله کند، به خصوص اگر مرز تاج به درستی ترسیم نشده باشد. رویکرد داده محور،treeseg [ 75 ]، از تکنیک‌های پردازش ابر نقطه‌ای عمومی از جمله خوشه‌بندی اقلیدسی، تجزیه و تحلیل مؤلفه‌های اصلی، تقسیم‌بندی مبتنی بر ناحیه، برازش شکل، و آزمایش اتصال استفاده می‌کند. رویکرد منبع باز برای خودکارسازی تکلیف تقسیم‌بندی درخت، که از چند فرض پیشینی معماری درختی استفاده می‌کند، به ترتیب با مقادیر AC ، OM ، و COM به ترتیب 80.9%، 19.1% و 13.2% دقت تقسیم‌بندی بدتری را به دست آورد.
روش پیشنهادی از یک GCN مبتنی بر توجه استفاده می‌کند که می‌تواند به‌طور خودکار اطلاعات را از همسایگان انتخاب و جمع‌آوری کند، و یک تابع از دست دادن آگاه از ساختار برای تقسیم‌بندی درخت برای بهبود وجه تمایز هندسی و اطلاعات جاسازی شده برای درخت منفرد. روش پیشنهادی همچنین یک روش جدید و موثر تقسیم‌بندی برش نرمال شده مبتنی بر سوپروکسل را توسعه می‌دهد که عملکرد قطعه‌بندی را برای درختان ناقص و کوچک بهبود می‌بخشد. بنابراین، ما دقت بهتری در تقسیم بندی درخت نسبت به روش لی [ 73 ]، ForestMetrics [ 74 ] و treeseg [ 75 ] داریم.

4. نتیجه گیری

برای پرداختن به مشکل پیچیده طبقه‌بندی صحنه‌های مقیاس بزرگ و تقسیم‌بندی اشیاء درختان کنار جاده، یک گردش کار کامل از داده‌های LiDAR موجود در هوا در مناطق شهری پیچیده با محیط زیست، از جمله (1) یک الگوریتم فیلتر تراکم پیشرونده TIN برای حذف نقاط زمین اعمال می‌شود، پیشنهاد کردیم. ، (2) یک چارچوب یادگیری عمیق که یک شبکه یادگیری ویژگی نقطه ای را ادغام می کند، و یک شبکه یادگیری ویژگی محلی برای تجزیه معنایی کارآمد داده های UAV-LS در مقیاس بزرگ، (3) یک مدل بهینه سازی ساختار یافته نمودار برای اطمینان از سازگاری پیش‌بینی برچسب نقطه‌ای، (4) یک روش ساده و در عین حال جدید با استفاده از یادگیری جاسازی گراف با تابع تلفات آگاه از ساختار و تقسیم‌بندی برش نرمال‌شده مبتنی بر سوپروکسل برای جداسازی درختان کنار جاده.رویکرد ما با تخمین دقت در دو مجموعه داده ALS در دسترس عموم ارزیابی شد که منجر به تشخیص و تقسیم‌بندی رضایت‌بخش نقاط درختی از اشیاء متصل و جمع‌شده شد.
نتایج تجربی نشان می‌دهد که روش ما راه‌حلی قدرتمند برای تقسیم‌بندی درختان منفرد از داده‌های UAV-LS شهری از نظر دقت و صحت ارائه می‌دهد. این روش بهتر از چندین روش تقسیم‌بندی معنایی سه بعدی کلاسیک و روش‌های تقسیم‌بندی درختی فردی از نظر تشخیص و دقت تقسیم‌بندی عمل کرد. رویکرد پیشنهادی تنها از مختصات سه بعدی و شدت ابرهای نقطه‌ای استفاده می‌کند و به هیچ اطلاعات تکمیلی نیاز ندارد، و همچنین برای شناسایی و بخش‌بندی اشیاء درخت کنار جاده در منطقه همپوشانی قوی است. تقسیم‌بندی درخت از داده‌های پهپاد-LS همچنین پایه خوبی برای محاسبه دقیق معیارهای ساختار درختان و طبقه‌بندی گونه‌های درختان شهری ایجاد می‌کند، و یک پایگاه داده خوب برای ارزیابی اثرات زیست‌محیطی، تخمین زیست توده فراهم می‌کند. و مدیریت ریسک درختان در آینده، روش پیشنهادی را بر روی محیط جاده‌ای در مقیاس بزرگ‌تر آزمایش خواهیم کرد تا یک پایگاه داده کامل اشیاء درخت کنار جاده برای برنامه‌ریزی و مدیریت جنگل‌های شهری بسازیم.

پیوست اول

الگوریتم A1: استخراج ویژگی محلی مبتنی بر KNN
ورودی: ابر نقطه Pدی={پ1،پ2،…، پn }، بعد هر نقطه d است .
خروجی: ابر نقطه Pدی={پ1،پ2،…، پn }، بعد هر نقطه d است .
پارامتر: K برای جستجوی KNN
مرحله 1: محاسبه فاصله ویژگی بین هر جفت نقطه.
مقداردهی اولیه: ماتریس تشابه را تعریف کنید اسn×nبین جفت نقطه
برای i = 1، 2، …، انجام دهید
  محاسبه فاصله اقلیدسی اسمنj=”ایکسمن-ایکسj”2اففضای ویژگی بین نقطه ایکسمنو امتیازهای فردی ایکسj(1 ≤j ≤n)؛
پایان برای
مرحله 2: K نقطه مجاور هر نقطه پرس و جو را انتخاب کنید .
مقداردهی اولیه: ماتریس K- نزدیکترین همسایه را تعریف کنیدEن×کماتریس ویژگی هر نقطه و هر محله محلی Eن×د، جایی که d بعد ویژگی است.
برای i = 1، 2، …، انجام دهید
  بردار فاصله را استخراج کنید اسمن={اسمن1،اسمن2،…، اسمنn }بین نقطه ایکسمنو نکات دیگر؛
  بردار را مرتب کنید اسمناز کوچک به بزرگ، و عناصر K بالا را انتخاب کنید، Eمنک=[ه1، ه2،…، هn];
  ویژگی های محلی d بعدی را استخراج کنید افمن=مآایکس{ساعت(ایکسمن)،ساعت(ایکسه1)،ساعت(ایکسه2)،…،ساعت(ایکسهک)}(که h MLP است) نقطه ایکسمنو K مناطق مجاور با استفاده از لایه های MLP و max pooling.
پایان برای
مرحله 3: ویژگی هر نقطه پرس و جو را به روز کنید.
برای i = 1، 2، …، انجام دهید
  برای نقطه ایکسمن، ویژگی نقطه داده شده را به روز کنید ایکسمن=افمن.
پایان برای

منابع

  1. روی، اس. بیرن، جی. Pickering، C. بررسی کمی سیستماتیک مزایای درخت شهری، هزینه ها، و روش های ارزیابی در سراسر شهرها در مناطق مختلف آب و هوایی. شهری برای. سبز شهری. 2012 ، 11 ، 351-363. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  2. اسلام، MN; رحمان، ک.س. بهار، م.م. حبیب، م. آندو، ک. هاتوری، N. کاهش آلودگی توسط کمربند سبز کنار جاده در و اطراف مناطق شهری. شهری برای. سبز شهری. 2012 ، 11 ، 460-464. [ Google Scholar ] [ CrossRef ]
  3. چن، ی. وانگ، اس. لی، جی. ما، ال. وو، آر. لو، ز. وانگ، سی. فهرست درختان کنار جاده شهری سریع با استفاده از سیستم اسکن لیزری سیار. IEEE J. Sel. بالا. Appl. رصد زمین. Remote Sens. 2019 , 12 , 3690–3700. [ Google Scholar ] [ CrossRef ]
  4. ایان، اس. نیکیل، ن. کارلو، آر. رافائل، پی. خیابان های سبز – کمی سازی و نقشه برداری درختان شهری با تصاویر سطح خیابان و دید کامپیوتری. Landsc. طرح شهری. 2017 ، 165 ، 93-101. [ Google Scholar ]
  5. خو، ز. شن، ایکس. کائو، ال. نیکلاس، سی. تریستان، جی. ژونگ، تی. ژائو، دبلیو. سان، س. با، اس. ژانگ، ز. و همکاران طبقه بندی گونه های درختی با استفاده از ابرهای نقطه ای فتوگرامتری هوایی دیجیتال مبتنی بر UAS و تصاویر چند طیفی در جنگل های طبیعی نیمه گرمسیری. بین المللی J. Appl. زمین Obs. Geoinf. 2020 , 92 , 102173. [ Google Scholar ] [ CrossRef ]
  6. یان، دبلیو. گوان، اچ. کائو، ال. یو، ی. لی، سی. Lu, J. A Self-Adaptive Mean Shift Tree-Segmentation Method with Use UAV LiDAR Data. Remote Sens. 2020 , 12 , 515. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  7. یانگ، جی. کانگ، ز. چنگ، اس. یانگ، ز. Akwensi، PH یک روش تقسیم‌بندی درختان فردی بر اساس الگوریتم حوضه و تحلیل توزیع فضایی سه‌بعدی از ابرهای نقطه‌ای LiDAR در هوابرد. IEEE J. Sel. بالا. Appl. رصد زمین. Remote Sens. 2020 , 13 , 1055–1067. [ Google Scholar ] [ CrossRef ]
  8. فالکوفسکی، ام جی. اسمیت، AMS؛ Gessler، PE; Hudak، AT; ویرلینگ، لس آنجلس; Evans، JS تأثیر پوشش تاج جنگلی مخروطیان بر دقت دو الگوریتم اندازه‌گیری درخت با استفاده از داده‌های لیدار. می توان. J. Remote Sens. 2008 , 34 , S338–S350. [ Google Scholar ] [ CrossRef ]
  9. لاهیوارا، تی. سپانن، آ. کایپیو، جی پی؛ واکونن، جی. کورهونن، ال. توکولا، تی. رویکرد مالتامو، ام بیزی برای تشخیص درخت بر اساس داده‌های اسکن لیزری هوابرد. IEEE Trans. Geosci. Remote Sens. 2014 , 52 , 2690–2699. [ Google Scholar ] [ CrossRef ]
  10. چن، کیو. بالدوکی، دی. گونگ، پی. کلی، ام. جداسازی درختان منفرد در جنگل ساوانا با استفاده از داده‌های ردپای کوچک لیدار. فتوگرام مهندس Remote Sens. 2006 , 72 , 923-932. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  11. واکونن، جی. ان، ال. گوپتا، اس. هاینزل، جی. هولمگرن، جی. پیتکانن، جی. سولبرگ، اس. وانگ، ی. ویناکر، اچ. هاگلین، KM; و همکاران آزمایش مقایسه ای الگوریتم های تشخیص تک درخت در انواع مختلف جنگل. جنگلداری 2011 ، 85 ، 27-40. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  12. پولوسکی، پ. یائو، دبلیو. هیوریچ، ام. کرزیستک، پ. Stilla، U. تشخیص درختان افتاده در ابرهای نقطه ای ALS با استفاده از رویکرد برش عادی آموزش دیده با شبیه سازی. ISPRS J. Photogramm. Remote Sens. 2015 ، 105 ، 252-271. [ Google Scholar ] [ CrossRef ]
  13. یانگ، بی. دای، دبلیو. دونگ، ز. Liu, Y. نقشه برداری خودکار جنگل در سطوح درختی از ابرهای نقطه اسکن لیزری زمینی با روش حداقل برش سلسله مراتبی. Remote Sens. 2016 , 8 , 372. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  14. فراز، ع. برتار، اف. ژاکمود، اس. گونسالوز، جی. پریرا، ال. تومه، ام. Soares, P. نقشه برداری سه بعدی از یک جنگل مدیترانه ای چند لایه با استفاده از داده های ALS. سنسور از راه دور محیط. 2012 ، 121 ، 210-223. [ Google Scholar ] [ CrossRef ]
  15. ژن، ز. Quackenbush، LJ; Zhang, L. روندها در تشخیص و ترسیم تاج درخت به طور خودکار – تکامل داده های LiDAR. Remote Sens. 2016 , 8 , 333. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  16. لیو، ال. لیم، اس. شن، ایکس. Yebra, M. یک روش ترکیبی برای تقسیم بندی درختان منفرد از داده های لیدار موجود در هوا. محاسبه کنید. الکترون. کشاورزی 2019 ، 163 ، 104871. [ Google Scholar ] [ CrossRef ]
  17. یان، دبلیو. گوان، اچ. کائو، ال. یو، ی. گائو، اس. Lu, J. یک رویکرد سلسله مراتبی خودکار برای تقسیم بندی سه بعدی تک درختان با استفاده از داده های UAV LiDAR. Remote Sens. 2018 , 10 , 1999. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  18. لی، اس. ژو، سی. وانگ، اس. گائو، اس. لیو، ز. ناهمگونی فضایی در تعیین‌کننده‌های فرم شهری: تحلیلی از شهرهای چین با رویکرد GWR. پایداری 2019 ، 11 ، 479. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  19. یانگ، بی. دونگ، ز. ژائو، جی. Dai, W. استخراج سلسله مراتبی اشیاء شهری از داده های اسکن لیزری سیار. ISPRS J. Photogramm. Remote Sens. 2015 ، 99 ، 45-57. [ Google Scholar ] [ CrossRef ]
  20. خو، اس. Xu, SS; بله، ن. Zhu، F. استخراج خودکار اجزای غیرفتوسنتزی درختان خیابان از داده‌های MLS. بین المللی J. Appl. رصد زمین. Geoinf. 2018 ، 69 ، 64-77. [ Google Scholar ] [ CrossRef ]
  21. باباحاجیانی، پ. فن، ال. Kämäräinen، JK; گابوج، م. تقسیم بندی و مدل سازی سه بعدی شهری از تصاویر نمای خیابان و ابرهای نقطه LiDAR. ماخ Vis. Appl. 2017 ، 28 ، 679-694. [ Google Scholar ] [ CrossRef ]
  22. واینمن، ام. واینمن، ام. مالت، سی. Brédif, M. چارچوب طبقه‌بندی-بخش‌بندی برای تشخیص درختان منفرد در داده‌های ابر نقطه‌ای MMS متراکم به‌دست‌آمده در مناطق شهری. Remote Sens. 2017 , 9 , 277. [ Google Scholar ] [ CrossRef ][ Green Version ]
  23. گوا، ی. وانگ، اچ. هو، کیو. لیو، اچ. لیو، ال. بننامون، ام. یادگیری عمیق برای ابرهای نقطه سه بعدی: یک بررسی. IEEE Trans. الگوی مقعدی ماخ هوشمند 2020 . [ Google Scholar ] [ CrossRef ] [ PubMed ]
  24. یانگ، ز. جیانگ، دبلیو. خو، بی. زو، س. جیانگ، اس. Huang, W. یک روش برچسب‌گذاری معنایی سه بعدی مبتنی بر شبکه عصبی کانولوشن برای ابرهای نقطه ALS. Remote Sens. 2017 , 9 , 936. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  25. یانگ، ز. تان، بی. پی، اچ. Jiang, W. تقسیم بندی و طبقه بندی شبکه عصبی کانولوشنال چند مقیاسی داده های اسکنر لیزری هوابرد. Sensors 2018 , 10 , 3347. [ Google Scholar ] [ CrossRef ][ Green Version ]
  26. ژائو، آر. پانگ، ام. Wang, J. طبقه‌بندی ابرهای نقطه‌ای LiDAR هوابرد از طریق ویژگی‌های عمیقی که توسط یک شبکه عصبی کانولوشنال چند مقیاسی آموخته شده است. بین المللی جی. جئوگ. Inf. علمی 2018 ، 32 ، 960-979. [ Google Scholar ] [ CrossRef ]
  27. ته، جی. هو، دبلیو. گوا، ز. ژنگ، A. RGCNN: نمودار منظم CNN برای تقسیم بندی ابر نقطه ای. در مجموعه مقالات کنفرانس بین المللی ACM در چند رسانه ای (MM)، سئول، کره، 22 تا 26 اکتبر 2018؛ صص 746-754. [ Google Scholar ]
  28. ماتورانا، دی. Scherer, S. VoxNet: یک شبکه عصبی کانولوشنال سه بعدی برای تشخیص اشیا در زمان واقعی. در مجموعه مقالات کنفرانس بین المللی IEEE/RSJ در مورد ربات ها و سیستم های هوشمند (IROS)، هامبورگ، آلمان، 28 سپتامبر تا 2 اکتبر 2015. ص 922-928. [ Google Scholar ]
  29. Qi، CR; سو، اچ. مو، ک. Guibas، LJ PointNet: یادگیری عمیق در مجموعه های نقطه برای طبقه بندی و تقسیم بندی سه بعدی. در مجموعه مقالات کنفرانس IEEE در مورد دید کامپیوتری و تشخیص الگو (CVPR)، هونولولو، HI، ایالات متحده آمریکا، 25 تا 30 ژوئیه 2017؛ صص 652-660. [ Google Scholar ]
  30. Qi، CR; یی، ال. سو، اچ. Guibas، LJ PointNet++: یادگیری ویژگی های سلسله مراتبی عمیق در مجموعه های نقطه در یک فضای متریک. در مجموعه مقالات سیستم‌های پردازش اطلاعات عصبی (NIPS)، لانگ بیچ، کالیفرنیا، ایالات متحده آمریکا، 3 تا 9 دسامبر 2017. [ Google Scholar ]
  31. ژائو، اچ. جیانگ، ال. فو، CW; Jia, J. PointWeb: بهبود ویژگی های محله محلی برای پردازش ابر نقطه. در مجموعه مقالات کنفرانس IEEE در مورد دید کامپیوتری و تشخیص الگو (CVPR)، لانگ بیچ، کالیفرنیا، ایالات متحده آمریکا، 16 تا 20 ژوئن 2019؛ صص 5565–5573. [ Google Scholar ]
  32. واسوانی، ع. Shazeer، N. پارمار، ن. Uszkoreit، J. جونز، ال. گومز، AN; قیصر، Ł. Polosukhin، I. توجه شما تمام چیزی است که نیاز دارید. در مجموعه مقالات سیستم‌های پردازش اطلاعات عصبی (NIPS)، لانگ بیچ، کالیفرنیا، ایالات متحده آمریکا، 3 تا 9 دسامبر 2017. [ Google Scholar ]
  33. ژائو، سی. ژو، دبلیو. لو، ال. ژائو، کیو. ادغام امتیازات نقاط همسایه برای تقسیم بندی ابر نقطه سه بعدی بهبود یافته. در مجموعه مقالات کنفرانس بین المللی IEEE در مورد پردازش تصویر (ICIP)، تایپه، تایوان، چین، 22 تا 25 سپتامبر 2019؛ ص 1475-1479. [ Google Scholar ]
  34. وانگ، اس. سو، اس. ما، WC; پوکروفسکی، آ. Urtasun، R. شبکه های عصبی کانولوشن پیوسته پارامتریک عمیق. در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو (CVPR)، سالت لیک سیتی، UT، ایالات متحده آمریکا، 18 تا 22 ژوئن 2018؛ صص 2589-2597. [ Google Scholar ]
  35. توماس، اچ. Qi، CR; Deschaud، JE; مارکوتگی، بی. گولت، اف. Guibas، LJ KPConv: پیچش انعطاف پذیر و قابل تغییر شکل برای ابرهای نقطه ای. در مجموعه مقالات کنفرانس بین المللی IEEE در بینایی کامپیوتری (ICCV)، سئول، کره، 27 اکتبر تا 3 نوامبر 2019؛ صص 6411–6420. [ Google Scholar ]
  36. Hua، BS; Tran، MK; شبکه های عصبی کانولوشنال یونگ، SK Pointwise. در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو (CVPR)، سالت لیک سیتی، UT، ایالات متحده آمریکا، 18 تا 22 ژوئن 2018؛ ص 984-993. [ Google Scholar ]
  37. انگلمن، اف. کنتوگیانی، تی. Leibe, B. انبساط نقطه گشاد: در زمینه پذیرنده پیچش نقطه. در مجموعه مقالات کنفرانس بین المللی IEEE در مورد رباتیک و اتوماسیون (ICRA)، پاریس، فرانسه، 31 مه تا 4 ژوئن 2020. [ Google Scholar ]
  38. هوانگ، Q. وانگ، دبلیو. Neumann، U. شبکه های برش مکرر برای تقسیم بندی سه بعدی ابرهای نقطه ای. در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو (CVPR)، سالت لیک سیتی، UT، ایالات متحده آمریکا، 18 تا 22 ژوئن 2018؛ صص 2626–2635. [ Google Scholar ]
  39. انگلمن، اف. کنتوگیانی، تی. هرمانز، آ. Leibe, B. کاوش زمینه فضایی برای تقسیم بندی معنایی سه بعدی ابرهای نقطه. در مجموعه مقالات کنفرانس بین المللی IEEE در بینایی کامپیوتر (ICCV)، ونیز، ایتالیا، 22 تا 27 اکتبر 2017؛ صص 716-724. [ Google Scholar ]
  40. بله، X. لی، جی. هوانگ، اچ. دو، ال. Zhang، X. شبکه های عصبی بازگشتی سه بعدی با ترکیب زمینه برای تقسیم بندی معنایی ابر نقطه ای. در مجموعه مقالات کنفرانس اروپایی بینایی کامپیوتر (ECCV)، مونیخ، آلمان، 8 تا 14 سپتامبر 2018؛ ص 403-417. [ Google Scholar ]
  41. لیو، اف. لی، اس. ژانگ، ال. ژو، سی. بله، آر. وانگ، ی. Lu, J. 3DCNN-DQN-RNN: یک چارچوب یادگیری تقویتی عمیق برای تجزیه معنایی ابرهای نقطه سه بعدی در مقیاس بزرگ. در مجموعه مقالات کنفرانس بین المللی IEEE در بینایی کامپیوتر (ICCV)، ونیز، ایتالیا، 22 تا 27 اکتبر 2017؛ صص 5678–5687. [ Google Scholar ]
  42. لندریو، ال. Simonovsky، M. تقسیم بندی معنایی ابر نقطه ای در مقیاس بزرگ با نمودارهای ابرنقطه ای. در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو (CVPR)، سالت لیک سیتی، UT، ایالات متحده آمریکا، 18 تا 22 ژوئن 2018؛ صص 4558-4567. [ Google Scholar ]
  43. لیانگ، ز. یانگ، م. دنگ، ال. وانگ، سی. وانگ، ب. شبکه عصبی کانولوشنال گراف عمقی سلسله مراتبی برای تقسیم بندی معنایی سه بعدی ابرهای نقطه ای. در مجموعه مقالات کنفرانس بین المللی IEEE در مورد رباتیک و اتوماسیون (ICRA)، مونترال، QC، کانادا، 20-24 مه 2019؛ صص 8152–8158. [ Google Scholar ]
  44. وانگ، ال. هوانگ، ی. هو، ی. ژانگ، اس. شان، جی. پیچیدگی توجه گراف برای تقسیم بندی معنایی ابر نقطه ای. در مجموعه مقالات کنفرانس IEEE در مورد دید کامپیوتری و تشخیص الگو (CVPR)، لانگ بیچ، کالیفرنیا، ایالات متحده آمریکا، 16 تا 20 ژوئن 2019؛ صص 10288-10297. [ Google Scholar ]
  45. لی، ی. ما، ال. ژونگ، ز. کائو، دی. Li, J. TGNet: نمودار هندسی CNN در تقسیم بندی ابر نقطه ای سه بعدی. IEEE Trans. Geosci. Remote Sens. 2020 , 58 , 3588–3600. [ Google Scholar ] [ CrossRef ]
  46. وانگ، ایکس. لیو، اس. شن، ایکس. شن، سی. Jia, J. بخش‌بندی انجمنی نمونه‌ها و معناشناسی در ابرهای نقطه. در مجموعه مقالات کنفرانس IEEE در مورد دید کامپیوتری و تشخیص الگو (CVPR)، لانگ بیچ، کالیفرنیا، ایالات متحده آمریکا، 16 تا 20 ژوئن 2019؛ صص 4096-4105. [ Google Scholar ]
  47. ژانگ، ک. چن، SC; ویتمن، دی. شیو، ام ال. یان، جی. Zhang, C. یک فیلتر مورفولوژیکی مترقی برای حذف اندازه‌گیری‌های غیرزمینی از داده‌های LIDAR در هوا. IEEE Trans. Geosci. Remote Sens. 2003 , 41 , 872-882. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  48. لین، ایکس. ژانگ، جی. فیلتر بر اساس تقسیم بندی ابرهای نقطه ای LiDAR موجود در هوا با متراکم شدن تدریجی بخش های زمین. Remote Sens. 2014 ، 6 ، 1294-1326. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  49. ژائو، کیو. گوا، کیو. سو، ی. Xue, B. بهبود الگوریتم فیلتر تراکم TIN پیشرو برای داده های LiDAR موجود در هوا در مناطق جنگلی. ISPRS J. Photogramm. Remote Sens. 2016 ، 117 ، 79–91. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  50. ژانگ، دبلیو. چی، جی. وان، پی. وانگ، اچ. زی، دی. وانگ، ایکس. Yan, G. یک روش آسان برای استفاده هوابرد LiDAR فیلتر کردن داده ها بر اساس شبیه سازی پارچه. Remote Sens. 2016 , 8 , 501. [ Google Scholar ] [ CrossRef ]
  51. ژانگ، دی. او، اف. تو، ز. زو، ال. Chen, Y. Pointwise Geometric and Semantic Network Learning on 3D Point Clouds. یکپارچه سازی محاسبه کنید. به کمک مهندس 2020 ، 27 ، 57-75. [ Google Scholar ] [ CrossRef ]
  52. وانگ، ی. جیانگ، تی. یو، م. تائو، اس. سان، ج. لیو، اس. استخراج ساختمان مبتنی بر معنایی از ابرهای نقطه‌ای LiDAR با استفاده از زمینه‌ها و بهینه‌سازی در محیط پیچیده. Sensors 2020 , 20 , 3386. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  53. کانگ، ز. یانگ، جی. یک مدل گرافیکی احتمالی برای طبقه بندی ابرهای نقطه LiDAR موبایل. ISPRS J. Photogramm. Remote Sens. 2018 , 143 , 108–123. [ Google Scholar ] [ CrossRef ]
  54. کین، ن. هو، ایکس. وانگ، پی. شان، جی. Li، Y. برچسب‌گذاری معنایی ابر نقطه‌ای ALS از طریق آموزش نمایش‌های وکسل و پیکسل. IEEE Geosci. سنسور از راه دور Lett. 2020 ، 17 ، 859-863. [ Google Scholar ] [ CrossRef ]
  55. وانگ، پی. لیو، ی. گوا، ی. سان، سی. Tong, X. O-CNN: شبکه های عصبی کانولوشن مبتنی بر Octree برای تجزیه و تحلیل شکل سه بعدی. ACM Trans. نمودار. 2017 ، 36 ، 72. [ Google Scholar ] [ CrossRef ]
  56. کراهنبول، پ. کلتون، V. یادگیری پارامتر و استنتاج همگرا برای میدان های تصادفی متراکم. در مجموعه مقالات کنفرانس بین المللی یادگیری ماشین (ICML)، آتلانتا، GA، ایالات متحده آمریکا، 16-21 ژوئن 2013. صص 513-521. [ Google Scholar ]
  57. کولموگروف، وی. ذبیح، ر. چه توابع انرژی را می توان از طریق برش های نمودار به حداقل رساند؟ IEEE Trans. الگوی مقعدی ماخ هوشمند 2004 ، 26 ، 147-159. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  58. خو، ی. بله، ز. یائو، دبلیو. هوانگ، آر. تانگ، ایکس. هوگنر، ال. Stilla، U. طبقه‌بندی ابرهای نقطه‌ای LiDAR با استفاده از ویژگی‌های Detrended مبتنی بر Supervoxel و مدل گرافیکی وزن‌دار ادراک. IEEE J. Sel. بالا. Appl. رصد زمین. Remote Sens. 2020 , 13 , 72–88. [ Google Scholar ] [ CrossRef ]
  59. زنگ، جی. چونگ، جی. نگ، م. پانگ، جی. یانگ، سی. نویز زدایی ابر نقطه‌ای سه بعدی با استفاده از منظم‌سازی لاپلاسی نمودار یک مدل منیفولد کم‌بعد. IEEE Trans. فرآیند تصویر 2020 ، 29 ، 3474-3489. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  60. اوشر، اس. شی، ز. Zhu, W. مدل منیفولد کم ابعاد برای پردازش تصویر. SIAM J. Imaging Sci. 2017 ، 10 ، 1669-1690. [ Google Scholar ] [ CrossRef ]
  61. هوانگ، اچ. وو، اس. گونگ، ام. یا، D. Ascher، U. Edge-aware مجموعه نقطه نمونه برداری مجدد. ACM Trans. نمودار. 2013 ، 32 ، 9-21. [ Google Scholar ] [ CrossRef ]
  62. لیانگ، ز. یانگ، م. لی، اچ. Wang, C. آموزش تعبیه‌سازی 3 بعدی با تابع ضایعات آگاه از ساختار برای تقسیم‌بندی ابر نقطه‌ای. ربات IEEE. خودکار Lett. 2020 ، 5 ، 4915-4922. [ Google Scholar ] [ CrossRef ]
  63. گراهام، بی. انگلک، م. Maaten، L. تقسیم‌بندی معنایی سه بعدی با شبکه‌های کانولوشنال پراکنده زیرمنیفولد. در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو (CVPR)، سالت لیک سیتی، UT، ایالات متحده آمریکا، 18 تا 22 ژوئن 2018؛ ص 9224–9232. [ Google Scholar ]
  64. لین، ی. وانگ، سی. ژای، دی. لی، دبلیو. لی، جی. به سوی مرزبندی بهتر، تقسیم بندی سوپروکسل برای ابرهای نقطه سه بعدی حفظ شده است. ISPRS J. Photogramm. Remote Sens. 2018 ، 143 ، 39–47. [ Google Scholar ] [ CrossRef ]
  65. یو، ی. لی، جی. گوان، اچ. وانگ، سی. استخراج خودکار تسهیلات جاده شهری با استفاده از داده های اسکن لیزری سیار. IEEE Trans. هوشمند ترانسپ سیستم 2015 ، 16 ، 2167-2181. [ Google Scholar ] [ CrossRef ]
  66. رایتبرگر، جی. اشنور، سی. کرزیستک، پ. هنوز، بخش‌بندی سه‌بعدی U. تک درخت‌هایی که از داده‌های LIDAR شکل موج کامل بهره‌برداری می‌کنند. ISPRS J. Photogramm. Remote Sens. 2009 ، 64 ، 561-574. [ Google Scholar ] [ CrossRef ]
  67. لی، دبلیو. وانگ، اف. Xia, G. یک شبکه هندسی توجه برای طبقه بندی ابر نقطه ALS. ISPRS J. Photogramm. Remote Sens. 2020 , 164 , 26–40. [ Google Scholar ] [ CrossRef ]
  68. LeSaux، B. یوکویا، ن. هانش، آر. براون، M. مسابقه ادغام داده های IEEE GRSS 2019: بازسازی سه بعدی معنایی در مقیاس بزرگ [کمیته های فنی]. IEEE Geosci. سنسور از راه دور Mag. 2019 ، 7 ، 33-36. [ Google Scholar ] [ CrossRef ]
  69. وارنی، ن. آساری، VK; Graehling، Q. DALES: مجموعه داده های هوایی LiDAR در مقیاس بزرگ برای تقسیم بندی معنایی. در دسترس آنلاین: https://arxiv.org/abs/2004.11985 (در 1 ژوئن 2020 قابل دسترسی است).
  70. هوانگ، آر. خو، ی. هونگ، دی. یائو، دبلیو. غمیسی، پ. Stilla، U. جاسازی نقطه عمیق برای طبقه بندی شهری با استفاده از ابرهای نقطه ALS: چشم اندازی جدید از محلی به جهانی. ISPRS J. Photogramm. Remote Sens. 2020 , 163 , 62–81. [ Google Scholar ] [ CrossRef ]
  71. لی، ایکس. وانگ، ال. وانگ، ام. ون، سی. Fang, Y. DANCE-NET: شبکه‌های پیچشی آگاه از چگالی با رمزگذاری زمینه برای طبقه‌بندی ابر نقطه LiDAR در هوا. ISPRS J. Photogramm. Remote Sens. 2020 , 166 , 128–139. [ Google Scholar ] [ CrossRef ]
  72. ژانگ، ز. هوآ، بی. Yeung، SK ShellNet: شبکه‌های عصبی کانولوشنال ابر نقطه کارآمد با استفاده از آمار پوسته‌های متحدالمرکز. در مجموعه مقالات کنفرانس بین المللی IEEE در بینایی کامپیوتری (ICCV)، سئول، کره، 27 اکتبر تا 3 نوامبر 2019؛ صفحات 1607-1616. [ Google Scholar ]
  73. لی، دبلیو. گوا، کیو. Jakubowski، MK; کلی، ام. روشی جدید برای تقسیم درختان منفرد از ابر نقطه لیدار. فتوگرام مهندس Remote Sens. 2012 ، 78 ، 75-84. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  74. شندریک، آی. برویچ، م. Tulbure، MG; الکساندروف، SV ترسیم از پایین به بالا درختان منفرد از اسکن لیزری هوابرد شکل موج کامل در یک جنگل اکالیپت ساختاری پیچیده. سنسور از راه دور محیط. 2016 ، 173 ، 69-83. [ Google Scholar ] [ CrossRef ]
  75. برت، ا. دیزنی، ام. Calders، K. استخراج درختان منفرد از ابرهای نقطه لیدار با استفاده از treeseg. روش ها Ecol. Evolut. 2019 ، 10 ، 438-445. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
شکل 1. خط لوله روش پیشنهادی.
شکل 2. مثالی از نتیجه فیلتر. ( الف ) ابر نقطه خام؛ ( ب ) نقاط زمینی؛ ( ج ) نقاط غیر زمینی پس از برداشتن زمین.
شکل 3. معماری شبکه یادگیری معنایی نقطه‌ای پیشنهادی.
شکل 4. تصویر ساختار ماژول استخراج ویژگی نقطه.
شکل 5. تصویر ساختار ماژول استخراج ویژگی محلی.
شکل 6. تصویری از کل معماری شبکه برای تقسیم بندی درختان منفرد. N تعداد نقاط است. F بعد خروجی ستون فقرات (شبکه کانولوشن زیر چندگانه) است. E بعد تعبیه نمونه است. الگوریتم بیش‌بخش‌بندی برای خوشه‌بندی جاسازی‌های نمونه در طول استنتاج استفاده می‌شود.
شکل 7. تصویر جمع کننده با استفاده از KNN مبتنی بر توجه.
شکل 8. تصویر بخش به روز رسانی. اتصال پرش برای الحاق خروجی جمع‌کننده و تعبیه ورودی به یکدیگر استفاده می‌شود. در نهایت، یک لایه کاملا متصل (FC) برای به روز رسانی و دریافت تعبیه خروجی تصفیه شده دنبال می شود.
شکل 9. نتایج طبقه بندی مجموعه داده DFC 3D. ( الف ) نتیجه طبقه بندی با PointNet. ( ب ) نتیجه طبقه بندی با مدل پیشنهادی. ج ) حقیقت زمینی.
شکل 10. نتایج طبقه بندی تفصیلی یک منطقه انتخاب شده خاص. ( الف ) نتیجه طبقه بندی اولیه؛ ( ب ) نتیجه طبقه بندی هموار. ج ) حقیقت زمینی.
شکل 11. نتایج تفصیلی از ناحیه انتخاب شده 1 مجموعه داده DFC 3D. ( الف ) ابرهای نقطه اصلی؛ ( ب ) نتیجه طبقه بندی. ج ) استخراج درختان کنار جاده. ( د ) تقسیم بندی درختان کنار جاده.
شکل 12. نتایج تفصیلی از ناحیه انتخاب شده 2 مجموعه داده DFC 3D. ( الف ) ابرهای نقطه اصلی؛ ( ب ) نتیجه طبقه بندی. ج ) استخراج درختان کنار جاده. ( د ) تقسیم بندی درختان کنار جاده.
شکل 13. نتایج تفصیلی از ناحیه انتخاب شده 1 مجموعه داده DALES. ( الف ) ابرهای نقطه اصلی؛ ( ب ) نتیجه طبقه بندی. ( ج ) استخراج درختان کنار جاده. ( د ) تقسیم بندی درختان کنار جاده.
شکل 14. نتایج تفصیلی از ناحیه انتخاب شده 2 مجموعه داده DALES. ( الف ) ابرهای نقطه اصلی؛ ( ب ) نتیجه طبقه بندی. ( ج ) استخراج درختان کنار جاده. ( د ) تقسیم بندی درختان کنار جاده.
شکل 15. جزئیات نتایج تشخیص درختان کنار جاده: ( الف ) درختان کوچک. ( ب ) درخت ناقص.

بدون دیدگاه

دیدگاهتان را بنویسید