تأثیر دقت ابر نقطه ای از تطبیق تصویر بر آماده سازی خودکار مجموعه داده های آموزشی برای تشخیص اشیا در تصاویر پهپاد

توسعه پویا روش‌های یادگیری عمیق در سال‌های اخیر باعث استفاده گسترده از این الگوریتم‌ها در زمینه فتوگرامتری و سنجش از دور، به‌ویژه در زمینه‌های تشخیص تصویر، طبقه‌بندی و تشخیص اشیا شده است. با این حال، یکی از بزرگ‌ترین چالش‌ها در این زمینه، در دسترس بودن کم مجموعه داده‌های آموزشی، به‌ویژه در مورد کاربردهای تصاویر هوایی مورب و داده‌های پهپاد است. فرآیند دستیابی به چنین پایگاه های اطلاعاتی کار فشرده ای است. راه حل مشکل در دسترس نبودن مجموعه داده ها و نیاز به حاشیه نویسی دستی، خودکار کردن فرآیند تولید حاشیه نویسی برای تصاویر است. یکی از این رویکردها در کار زیر استفاده شده است. روش پیشنهادی برای نیمه خودکار کردن ایجاد مجموعه داده های آموزشی برای شناسایی اشیاء بر روی تصاویر نادر و مایل به دست آمده از پهپاد استفاده شد. این روش شامل مراحل زیر است: (1) تولید یک ابر نقطه 3 بعدی متراکم با دو روش مختلف: فتوگرامتری UAV و TLS (اسکن لیزری زمینی). (2) پردازش داده ها، از جمله برش دادن به اشیا و فیلتر کردن ابرهای نقطه. (3) نمایش نقاط ابری بر روی تصاویر هوایی. و (4) تولید جعبه های محدود کننده که اشیاء مورد علاقه را محدود می کنند. علاوه بر این، آزمایش‌های انجام‌شده برای آزمایش دقت و کیفیت مجموعه داده‌های آموزشی به‌دست‌آمده به روش پیشنهادی طراحی شده‌اند. اثر دقت ابر نقطه استخراج شده از تطبیق تصویر پهپاد متراکم بر روی جعبه‌های مرزی استخراج‌شده با روش پیشنهادی مورد ارزیابی قرار گرفت.

کلید واژه ها:

مجموعه داده های آموزشی ; تشخیص شی ؛ یادگیری عمیق ؛ ابرهای نقطه ای ; تصویرسازی اریب ; پهپاد

1. مقدمه

با توسعه یادگیری عمیق و افزایش مداوم عملکرد GPU، شبکه های عصبی کانولوشن (CNN) کاربردهای گسترده ای در تشخیص تصویر و تشخیص اشیا پیدا کرده اند [ 1 ، 2 ، 3 ، 4]. این الگوریتم ها هنوز در حال توسعه هستند و مدل های یادگیری عمیق جدید در حال ایجاد هستند. با این حال، یکی از مشکلاتی که در این زمینه مطرح می شود، نیاز به تعداد زیادی حاشیه نویسی حقیقت زمین برای آموزش شبکه های عصبی کانولوشنال عمیق است. علاوه بر این، فرآیند دستیابی به چنین مجموعه داده ها زمان بر است. کسب مجموعه داده های آموزشی سنتی شامل جمع آوری داده ها و حاشیه نویسی است. اگرچه داده‌ها همیشه به دست می‌آیند و داده‌های تصویری جدید هر روز ارائه می‌شوند، چه توسط هواپیما، هواپیماهای بدون سرنشین، سکوهای موبایل یا حسگرهای نصب‌شده بر روی ماهواره‌ها، دلایل زیادی وجود دارد که این داده‌ها ممکن است برای آموزش مدل‌های یادگیری عمیق کافی یا مفید نباشند. با این حال، یکی از بزرگترین چالش ها، پیش پردازش و آماده سازی داده های به دست آمده است تا بتوان بر اساس آن مدل را آموزش داد.
بزرگترین پایگاه های آموزشی برای CNN از صحنه های طبیعی تشکیل شده است. اینها مجموعه داده های بزرگی هستند که برای استفاده عمومی در دسترس هستند. ImageNet [ 5 ]، PASCAL VOC 2012 [ 6 ]، و MSCOCO [ 7 ] چند نمونه از مجموعه داده های یادگیری هستند [ 8 ]]. با این حال، محدودیت این است که آنها را فقط می توان برای صحنه های خاص یا به عنوان ورودی برای مدل های پیش آموزش اعمال کرد. چالش همچنین این است که اشیاء در عکس‌های هوایی در مقایسه با عکس‌های موجود در صحنه‌های طبیعی زمین به طور متفاوتی نقشه‌برداری می‌شوند. تنوع کم کلاس‌های اشیا، تنوع مقیاس، جهت‌گیری و شکل اجسام روی سطح زمین نیز محدودیت‌هایی هستند که استفاده از این مجموعه داده‌های موجود و بایگانی‌شده را در کارهای خاص غیرممکن می‌کنند. در مورد کاربردهای فتوگرامتری و سنجش از دور، حاشیه نویسی دستی معمولاً اجتناب ناپذیر است که به زمان و کار زیادی نیاز دارد.
با این حال، با ظهور روش‌های یادگیری عمیق مبتنی بر داده، تعداد راه‌حل‌ها و استراتژی‌های موثر برای تولید داده‌های واقعی در حال افزایش است. یکی از روش‌شناسی که در اینجا نیز شایان ذکر است روشی است که توسط Laupheimer و Haala، 2021 [ 9 ] ارائه شده است. این شامل انتقال برچسب ها از ابرهای نقطه ای مشروح دستی به مش و از آن مکان به فضای تصویر برای کار تجزیه و تحلیل صحنه معنایی است. این یکی از نمونه هایی از روش ها و رویکردهایی است که تا حدی مشکل عدم دسترسی به مجموعه داده ها و کار دستی را حل می کند. چندین مثال دیگر به طور خلاصه در بخش 2 با بررسی آثار مرتبط توضیح داده شده است.
کار زیر همچنین از فرآیندی برای نیمه خودکار ساخت مجموعه داده های آموزشی برای تشخیص در تصاویر هوایی نادر و مایل استفاده می کند. برای این منظور، نقشه‌های ارتوفتوتوم و ابرهای نقطه‌ای به عنوان نقطه شروعی برای تولید جعبه‌های مرزی حقیقت زمین بر روی تصاویر استفاده می‌شوند. شرح مفصل تری از روش شناسی در بخش 4 توضیح داده شده است .
اگرچه چنین رویکردی کار دستی را حذف نمی کند، اما تلاش را کاهش می دهد. ایجاد یک لایه شکل فایل نقطه ای و علامت گذاری اشیاء با استفاده از نقشه ارتوفوتومپ نسبت به برچسب زدن همه عکس ها در یک پروژه و علامت گذاری تمام جعبه های محدود کننده اشیاء اطراف، زمان کمتری را صرف می کند.
از سوی دیگر، سهم اصلی در کار زیر، جنبه دقت و کیفیت مجموعه داده های آموزشی است که از این طریق به دست آمده است. هدف این تحقیق ارزیابی تأثیر دقت ابر نقطه استخراج شده از تطبیق تصاویر پهپاد متراکم بر روی جعبه‌های مرزی استخراج‌شده با استفاده از روش پیشنهادی است.
بقیه این مقاله شامل بخش های زیر است. بخش 2 در دسترس بودن مجموعه داده های آموزشی را بررسی می کند و روش هایی را برای خودکارسازی فرآیند تولید حاشیه نویسی برای تصاویر شرح می دهد. بخش 3 داده های مورد استفاده را شرح می دهد. بخش 4 ارائه روش شناسی اتخاذ شده در این کار است. بخش 5 شامل نتایج و ارزیابی دقت است. در نهایت، بخش 6 خلاصه ای از کار است و شامل نتیجه گیری است.

2. آثار مرتبط

گسترش روش های یادگیری عمیق در رصد زمین منجر به ایجاد و در دسترس بودن برخی از مجموعه داده ها برای مدل های آموزشی بر روی تصاویر هوایی و ماهواره ای شده است. با این حال، در مورد مجموعه داده های آموزشی متشکل از عکس های هوایی یا صحنه های ماهواره ای، فراوانی آنها بسیار کمتر از ImageNet است. علاوه بر این، این مجموعه ها با تنوع کم دسته بندی اشیا مشخص می شوند. متداول‌ترین مجموعه داده‌ها شامل اشیایی مانند اتومبیل‌ها هستند: مجموعه TAS [ 10 ]، VEDAI [ 11 ]، UCAS-AOD [ 12 ]، 3K-DLR-Munich [ 13 ]. کشتی‌ها: RSOD [ 14 ]، HRSC2016 [ 15 ]؛ و ساختمان ها: مجموعه داده SZTAKI-INRIA [ 16]. دو بزرگترین مجموعه داده برای تشخیص اشیا در حوزه رصد زمین، DOTA [ 17 ] است که شامل 15 دسته از اشیا و 2806 تصویر هوایی است و DIOR [ 18 ] که شامل 23463 تصویر و 192472 نمونه است که 20 کلاس شی را پوشش می دهد. با این وجود، حتی مجموعه داده‌های چند طبقه‌ای ذکر شده در میان این ده‌ها کلاس/دسته از اشیاء ممکن است شامل موارد مورد نظر در یک مورد خاص نباشد. گاهی اوقات اتفاق می افتد که این اشیاء برای کاربردهای خاص خاص هستند.
با این حال، در دسترس بودن آنها از تصاویر هوایی مورب هنوز در مورد مجموعه داده های آموزشی برای تشخیص اشیا کم است. پتانسیلی که فتوگرامتری مایل به همراه دارد بسیار قابل توجه است. اولاً، یک منبع داده با مزایای متمایز ارائه می‌کند: نماهای متعدد از دیدگاه‌های مختلف و مقیاس‌های تصویری بسیار متفاوت [ 19 ]. علاوه بر این، فتوگرامتری مایل امکان به دست آوردن اطلاعات در مورد مکان یک شی در یک سیستم زمین و استفاده از ویژگی چند زمانی را دارد [ 20 ].
علاقه جامعه علمی به استفاده از عکس های هوایی مایل، مزایای این تکنیک را آشکار کرده است. این امر با ظهور انتشارات و مطالعات علمی در مورد تشخیص اشیا [ 1 ، 21 ] مشهود است.
فتوگرامتری پهپاد یک رویکرد جمع‌آوری داده‌های مقرون‌به‌صرفه و انعطاف‌پذیر است که منبع داده‌ای از تصاویر نادر و مایل را فراهم می‌کند [ 22 ]. فتوگرامتری هوایی و هواپیماهای بدون سرنشین نیز تصاویری با دقت بالا از یک شیء را چندین بار در عکس‌های مختلف به دلیل همپوشانی کنار و جلو در یک بلوک از تصاویر به ارمغان می‌آورد. علاوه بر این، استفاده از تصاویر مایل این مزیت اضافی را به ارمغان می آورد که یک شی معین از چندین جهت در زوایای مختلف تصویر می شود، که باعث افزایش بیشتر اندازه و تنوع مجموعه داده می شود. استفاده از داده‌های به‌دست‌آمده از پهپادها و محصولات فتوگرامتری مانند ابرهای نقطه‌ای یا نقشه‌های ارتوفوتومتری، تشخیص اشیاء را با استفاده از الگوریتم‌های مبتنی بر چارچوب‌های یادگیری عمیق امکان‌پذیر می‌سازد [ 23 ]]. با توجه به توانایی جمع آوری سریع داده ها با وضوح بالا، یک سیستم مبتنی بر پهپاد می تواند در بسیاری از زمینه ها استفاده شود. چنین راه حل هایی را می توان در موجودی و مدل سازی اشیاء زیرساخت فنی و حمل و نقل به کار برد. علاقه به استفاده از الگوریتم های یادگیری عمیق برای تشخیص اشیا در صنایعی مانند راه آهن، تولید برق و ساخت و ساز جاده افزایش یافته است [ 24 ، 25 ، 26 ، 27 ، 28 ]. راه حل های مبتنی بر هواپیماهای بدون سرنشین نیز برای بازرسی پانل های خورشیدی استفاده می شوند [ 29 ].
مثال‌های ارائه‌شده پتانسیل استفاده از داده‌های اکتسابی پهپاد را برای شناسایی اشیاء مورد علاقه با استفاده از روش‌های یادگیری عمیق نشان می‌دهند. مقالات مروری [ 30 ، 31 ] موارد قبلی را در مورد اصول یادگیری عمیق به کار رفته در تصاویر مبتنی بر پهپاد خلاصه می کند. Ramachandran و Sangaiah مشکل ذکر شده در دسترس بودن مجموعه داده ها را در کار خود برجسته کردند [ 30 ]، و اشاره کردند که برای پیشرفت تحقیقات در این زمینه ضروری است که یک مجموعه داده معیار بزرگ اختصاص داده شده به مشکل تشخیص اشیا را ایجاد کند. توسط پهپادها
مشابه تصاویر هوایی و ماهواره‌ای، مجموعه داده‌های آموزشی در دسترس عموم برای کاربردهای پهپاد اغلب شامل کلاس‌هایی مانند اتومبیل‌ها می‌شوند [ 21 ، 32 ، 33 ، 34 ]. مجموعه داده‌های آموزشی برای زیرساخت‌های مهندسی [ 35 ] یا تشخیص درخت [ 36 ] نیز شروع به ظاهر شدن می‌کنند، اما اندازه و تنوع کلاس هنوز ناامیدکننده است.
بنابراین، تیم های تحقیقاتی زمان زیادی را صرف ایجاد چنین مجموعه های داده یا استفاده از راه حل های دیگر مانند رویکردهای مبتنی بر تنظیم دقیق یا سایر روش های یادگیری انتقال می کنند. همچنین می‌توان از روش‌های جایگزین برای سرعت بخشیدن به فرآیند دستی استفاده کرد – نظارت ضعیف یا یادگیری نیمه نظارتی (SSL) [ 37 ، 38 ].
روش دیگر برای مقابله با کمبود داده های آموزشی، خودکار کردن فرآیند تولید حاشیه نویسی برای تصاویر است. چنین راه حل هایی هم در تقسیم بندی تصویر و هم در تشخیص اشیا استفاده می شود. راس و همکاران، 2016 [ 39 ] در کار خود پیشنهاد کردند تصاویر مصنوعی با حاشیه نویسی در سطح پیکسل تولید کنند. پیشنهاد دیگری برای حل این مشکل استفاده از یک ابر نقطه LiDAR یا بازسازی سه بعدی صحنه برای ارتقاء وظیفه برچسب‌گذاری نمونه معنایی از دو بعدی به سه بعدی است [ 40 ]. نویسندگان در [ 41] تولید خودکار حاشیه نویسی روی تصاویر را پیشنهاد کرد. این روش شامل سه مرحله است: (1) برچسب زدن دستی یک یا دو تصویر هوایی. (2) انتقال برچسب های پیکسل به چندین تصویر پهپاد از طریق ابر نقطه پهپاد. (3) پالایش حاشیه نویسی های تولید شده با استفاده از یک مدل CRF با جفت متراکم و طبقه بندی کننده ساده و بی تکلف بیز. در مطالعه خود، Zachar و همکاران، 2022 [ 20 ] به کمبود داده های آموزشی برای مدل پرداختند و روشی را پیشنهاد کردند که در آن کار دستی با استفاده از منابع موجود برای انتقال مراجع به پایگاه های داده جدید برای مدل های آموزشی برای تشخیص اشیا جایگزین می شود. روی تصاویر هوایی مورب راه حل های مشابهی با انتقال مراجع و اتخاذ الگوریتم های مبتنی بر یادگیری عمیق در تصاویر صحنه های طبیعی برای تشخیص اشیاء در تصاویر پهپاد قبلاً ارائه شده است [ 42 ], 43 , 44 , 45 ].

3. توضیحات مجموعه داده

برای آزمایش‌های کار زیر، داده‌های فتوگرامتری (تصاویر نادر هوایی و مایل) با پهپاد DJI Phantom 4 RTK با دوربین FC6310R (رزولوشن: 5472 × 3648، فاصله کانونی: 8.8 میلی‌متر، اندازه پیکسل: 2.41 میکرومتر) به‌دست آمد. و محصولات (ابر نقاط و نقشه های ارتوفتوتوم) استفاده شد. منطقه مورد مطالعه که داده های فتوگرامتری در آن به دست آمد، یک بخش راه آهن در نزدیکی Czestochowa، لهستان (Herby) بود. داده‌ها در مارس 2021 به‌دست آمدند. تصاویر هوایی مورب و نادر در مأموریت‌های فتوگرامتری چند متغیره به‌دست آمدند. ارتفاع پروازهای مختلف و همپوشانی های جلو و جانبی عکس ها مورد آزمایش قرار گرفت. داده ها در نرم افزار Pix4D Mapper برای بخشی از زیرساخت راه آهن در منطقه آزمایش پردازش شد.
داده‌های به‌دست‌آمده در تغییرات چندگانه برای تولید ابرهای نقطه‌ای مورد استفاده قرار گرفتند. انتخاب پارامترهای ماموریت فتوگرامتری مربوط به آزمایش‌های روش‌شناسی اکتساب داده‌های پهپاد با الزامات داده‌های ورودی برای شبکه‌های عصبی بود. آزمایش های مربوط به این موضوع در نشریات فوق مورد مطالعه قرار نگرفت. تصاویر نادر در دو ارتفاع (54 متر و 90 متر) به دست آمد، در حالی که تصاویر اریب در 40 متر با شیب زاویه دوربین به میزان 45 درجه به دست آمد. علاوه بر این، انواع در همپوشانی رو به جلو و جانبی متفاوت بودند، که نه تنها بر ابر نقطه حاصل بلکه بر زمان پردازش و جنبه اقتصادی نیز تأثیر می‌گذارد.
با توجه به پارامترهای مختلف پرواز ماموریت (ارتفاع، پوشش ها) و تنظیمات پارامتر متفاوت در نرم افزار، محصولاتی با ویژگی های دیگر به دست آمد. چهارده سناریو برای اکتساب و پردازش تصویر برای منطقه مورد مطالعه تهیه شد. انواع نیز در استفاده از عکس های عمودی و مایل و ترکیب آنها متفاوت بود. همه انواع از همه عکس‌های به‌دست‌آمده استفاده نمی‌کردند، و این با حذف، برای مثال، هر ردیف دوم یا هر عکس دوم اصلاح شد. جدول 1 تمام خلاصه ها و پارامترهای اساسی را نشان می دهد. در نتیجه، 14 نوع ابر نقطه مختلف به دست آمد.
دقت تراز حاصل در جداول زیر نشان داده شده است ( جدول 2 و جدول 3 ). میانگین خطای RMS برای نقاط کنترل از 0.2 سانتی متر تا 3.6 سانتی متر متغیر است، در حالی که برای نقاط چک از 1.3 سانتی متر تا 3.6 سانتی متر متغیر است. بهترین دقت برای نوع شماره به دست آمد. 3 (ارتفاع پرواز: 54 متر؛ OF: 90٪؛ سیستم عامل: 80٪؛ GSD: 1.50 سانتی متر) مقایسه دقت در نقاط کنترل. نوع شماره 1 (ارتفاع پرواز: 54 متر؛ OF: 90٪؛ سیستم عامل: 90٪؛ GSD: 1.50 سانتی متر) بهترین دقت را در نقاط بازرسی نشان داد. جزئیات تنظیم Bundle Block نیز با میانگین خطای بازپرداخت در پیکسل نشان داده شده است ( جدول 4 ).
برای عملکرد آزمایش، ابرهای نقطه ای اسکن لیزری زمینی (TLS) به عنوان حقیقت زمین (داده های مرجع که نتایج با آن مقایسه می شود) استفاده شد.
یک جنبه مهم از دیدگاه تحقیقاتی این بود که داده ها در همان روز به دست آمدند زیرا یک سایت بازسازی ایستگاه راه آهن بود. تغییرات دینامیکی که می تواند روز به روز در چنین محیطی رخ دهد می تواند مقایسه نتایج حاصل از داده های گرفته شده در زمان های مختلف را غیرممکن کند. سپس، تغییرات در پوشش زمین – مانند قرار دادن یک ساختمان جدید – علاوه بر این باید تأیید شود. در مورد آزمایش‌های بالا، داده‌ها در این رابطه تأیید شدند، اما نکته بسیار مهمی است که باید در نظر داشت.
منطقه ای که داده های TLS برای آن به دست آمد، کوچکتر از منطقه تحت پوشش داده های پهپاد بود. بنابراین، منطقه برای داده های پهپاد نیز محدود به سایتی بود که داده های TLS برای آن به دست آمد. در نتیجه این منطقه دارای 20 تیر کششی و 15 دروازه راه آهن بود. این اشیاء مورد تجزیه و تحلیل قرار گرفتند.
جمع آوری داده های اسکن لیزری زمینی (TLS) با استفاده از اسکنر لایکا RTC360 انجام شد. برای منطقه مورد مطالعه، 115 اسکن با استفاده از تنظیمات متوسط، مربوط به وضوح نقطه 6 میلی متر در فاصله 10 متر گرفته شد. داده ها با استفاده از نقاط کنترل زمینی به سیستم مختصات زمین PL-1992 ارجاع داده شدند. برای این منظور 13 نقطه به روش RTK با استفاده از شبکه مرجع ملی (ASG-EUPOS) با دقت اندازه گیری 0.03 متر (افقی) و 0.05 متر (عمودی) اندازه گیری شد. ثبت اسکن ها به روش Cloud-to-Cloud در نرم افزار Leica Cyclone REGISTER 360 انجام شد. دقت مناسب C2C برای باندل ها 1 سانتی متر بود. میانگین خطای تطبیق ابرهای نقطه ای به دست آمده از مکان های مختلف اسکنر با نقاط کنترل زمینی کمتر از 10 سانتی متر بود.جدول 5 .
یک جنبه مهم بررسی شده در آزمایش های حاضر، دقت ابرهای نقطه ای تولید شده از DIM (تطبیق تصویر متراکم) است. دقت تراز در بالا ارائه شده است. با این حال، علاوه بر تجزیه و تحلیل گزارش‌های هم‌ترازی تصاویر هر یک از انواع، تراکم ابرهای نقطه‌ای و تحلیل بصری برای ارزیابی نویز ابرهای نقطه‌ای نیز با هم مقایسه می‌شوند. خلاصه ای از میانگین چگالی نقطه در هر متر مکعب در جدول 6 نشان داده شده است . بالاترین چگالی با انواعی که ابر نقطه در تنظیمات بالا برای آنها ایجاد شده است نشان داده می شود.
با قرار دادن همه انواع به تجزیه و تحلیل بصری، می توان دریافت که تعداد قابل توجهی از عناصر در ابر نقطه برای انواع ایجاد شده در تنظیمات بالا نگاشت شده است. با این حال، ابرهای نقطه ای از این گونه ها پر سر و صداتر هستند. این امر به ویژه برای قطب های کششی مشهود است. شکل های زیر نمونه هایی از یک دروازه ( شکل 1 ) و یک قطب کششی ( شکل 2 ) را برای همه انواع ابر نقطه ای نشان می دهد.
هنگام مقایسه حتی دقیق ترین انواع ابر نقطه از تطبیق تصویر متراکم با داده های اسکن لیزری زمینی، آشکار است که برخی از عناصر در ابر نقطه متراکم نگاشت نشده اند. علاوه بر این، با ترسیم جزئیات بیشتر و افزایش چگالی ابر نقطه، نویز افزایش می یابد. چنین جلوه ای مطلوب نیست، به خصوص زمانی که مرحله بعدی نمایش نقاط در مختصات پیکسلی تصویر برای تعیین مکان دقیق هر جسم (جعبه مرزی) باشد.
با در نظر گرفتن تمام جنبه های نشان داده شده، آزمایش ها انجام شد. هدف این بود که بررسی کنیم که چگونه دقت ابر نقطه‌ای بر جعبه‌های مرزی حاصله تأثیر می‌گذارد. در نتیجه تحقیقات، توصیه هایی ارائه شده است که بر اساس آن پارامترهای یک پرواز ماموریت فتوگرامتری باید برای ایجاد خودکار مجموعه داده های آموزشی با دقت بالا استفاده شود. علاوه بر پارامترهای پرواز ماموریت، عناصر ضروری تنظیمات و پارامترهای پردازش داده هستند که با آن ابرهای نقطه ای باید به گونه ای تولید شوند که برای هدف مشخص شده کافی باشند.
در بخش بعدی مقاله، مراحل خاص تحقیق، روش شناسی اتخاذ شده و نتایج را به تفصیل شرح می دهیم.

4. روش شناسی و راه اندازی آزمایشی

پردازش تصاویر بدست‌آمده از پهپاد، محصولات فتوگرامتری مختلفی مانند ابرهای نقطه‌ای و نقشه‌های ارتوفوتومتری تولید می‌کند. این محصولات به عنوان داده های منبع به عنوان بخشی از روش برای پشتیبانی از آماده سازی مجموعه داده های آموزشی استفاده شد.
اولین مرحله ضروری پردازش بلوک های تصویر بود. یعنی جهت دادن به داده ها. نتایج حاصل از این مرحله در بخش قبلی توضیح داده شد، جایی که دقت تراز برای هر نوع نیز ارائه شد. به عنوان بخشی از پردازش داده‌ها، ابرهای نقطه‌ای و نقشه‌های اورتوفوتومپ برای همه انواع در Pix4D ایجاد شدند.
قسمت بعدی تهیه فایل های حاوی اطلاعات مکان اشیاء مورد علاقه بود. این مرحله به دلیل نیاز به داشتن مختصات زمین هر شی ضروری بود تا بر اساس آنها، ابرهای نقطه ای از تطابق تصویر متراکم به قطعات ابری که شیء را در بر می گیرند، بریده شوند. دو رویکرد مختلف برای دروازه ها و قطب های کششی استفاده شد. بر اساس نقشه ارتوفوتومپ گرفته شده از یکی از انواع تصویر، یک لایه نقطه در ArcGIS Pro ایجاد شد. قطب های کششی با نقاطی روی نقشه ارتوفوتومپ مشخص شده بودند که امکان گرفتن اطلاعات مختصات زمین X، Y و Z قطب را فراهم می کرد ( شکل 3).آ). در مورد دروازه‌ها، تصمیم گرفته شد که یک لایه چندضلعی به دلیل ویژگی‌های متفاوت جسم ایجاد شود. نمونه ای از یک دروازه برداری را می توان در شکل 3 ب مشاهده کرد.
مختصات زمین حاصل از تمام اشیاء به عنوان اطلاعات ورودی برای برش بخش‌هایی از ابر نقطه‌ای که حاوی نقاط متعلق به جسم بود، استفاده می‌شد ( شکل 4 ). در مورد دروازه‌ها، ابرهای نقطه‌ای با یک چند ضلعی بریده می‌شوند، در حالی که برای قطب‌های کششی، از یک بافر از نقطه‌ای با شعاع 5 متر استفاده می‌شود، بنابراین این اطمینان وجود داشت که تمام عناصر قطب کششی از جمله بوم‌ها نقشه‌برداری می‌شوند.
همانطور که در شکل 4 مشاهده می شود ، ابرهای نقطه برش هنوز حاوی عناصری هستند که به اشیاء مورد نظر (از جمله نقاط متعلق به کلاس زمین) تعلق ندارند. بنابراین، فیلتر کردن زمین برای اینکه جعبه‌های مرزی اطراف جسم به خوبی نمایش داده شوند ضروری است. روش فیلتر شبیه سازی پارچه (CSF) که برای استخراج نقاط زمین در ابرها و پردازش داده های LiDAR استفاده می شود، تصمیم گیری شد. با این حال، پس از آزمایش (در ابتدا در نرم‌افزار CloudCompare) و تأیید نتایج، مشخص شد که برای اهداف آزمایش‌های فوق، این روش برای ابرهای نقطه‌ای ناشی از تطبیق تصویر متراکم، همانطور که در شکل 5 نشان داده شده است، مرتبط است . بنابراین، پیاده سازی فیلتر CSF [ 46 ] در GitHub (https://github.com/jianboqi/CSF ، قابل دسترسی در 1 نوامبر 2022) به عنوان جزئی از الگوریتم ما استفاده و اضافه شد.
علاوه بر فیلتر کردن نقاط زمین، همچنین لازم بود نقاطی که نویز بودند و به موضوع مورد نظر تعلق نداشتند نیز فیلتر شوند. ابتدا، فیلتر نویز “نقاط ایزوله” با استفاده از توابع کتابخانه Open3D اعمال شد. این روش ها همسایگی را در ابر نقطه بررسی می کنند و بر این اساس نقاط پرت را رد می کنند. دو روش استفاده شد:
  • حذف آماری پرت – نقاطی را که در مقایسه با میانگین ابر نقطه از همسایگان خود دورتر هستند حذف می کند.
  • حذف شعاع بیرونی – نقاطی را که همسایه های کمی در یک فضای اطراف معین دارند حذف می کند.
نمونه‌ای از فیلتر بیرونی برای دروازه‌ها در شکل 6 نشان داده شده است ، که در آن نقاط قرمز رنگ نویز را نشان می‌دهند.
در حالی که فیلترهای فوق برای دروازه‌ها که عموماً نویز کمتری داشتند به خوبی کار می‌کردند، فیلتر دستی برای قطب‌های کششی ضروری بود، که معلوم شد اجسام پیچیده‌تری هستند. نمونه ای از چنین موردی در شکل 4 نشان داده شده استج، جایی که اشیایی که به شی مورد نظر تعلق ندارند (نقاط ابر در سمت راست) نیز در قطعه بریده شده ابر نقطه (در بافر 5 متری از نقطه موقعیت قطب) نگاشت شده اند. تصمیم گرفته شد که علیرغم فیلتر اولیه با استفاده از توابع کتابخانه Open3D، تمام اشیاء برای هر گونه تأیید شوند و اشیاء غیر ضروری حذف شوند زیرا هیچ ابزار بهینه ای یافت نشد که به طور خودکار چنین قطعاتی از ابر را حذف کند. تأیید و ویرایش دستی (فیلتر کردن) برای ابرهای نقطه TLS و ابرهای نقطه از تطبیق تصویر پهپاد اعمال شد. پس از اطمینان از اینکه تمام ابرهای نقطه اجسام به درستی آماده شده اند، مرحله نهایی رخ داد. این شامل نمایش نقاط ابری بر روی تصویر بود که اساساً مختصات زمین را به مختصات پیکسلی تصاویر تبدیل می کرد.
بر اساس پارامترهای جهت گیری داخلی و خارجی دوربین و همچنین اطلاعات مربوط به مدل اعوجاج دوربین، امکان انتقال دقیق بین مختصات در سیستم مرجع میدان (XYZ) و مختصات پیکسلی تصویر (uv) وجود داشت. ). استفاده از این اطلاعات و انجام محاسبات با استفاده از فایل های ایجاد شده در نتیجه تراز در Pix4D، بر اساس مدل ریاضی توضیح داده شده در وب سایت توسعه دهنده ( https://support.pix4d.com/hc/en-us/articles/202559089- How-are-the-Internal-and-External-Camera-Parameters-defined ؛ در 1 نوامبر 2022 قابل دسترسی است https://support.pix4d.com/hc/en-us/articles/202977149-What-does-the-Output -Params-Folder-contain ، قابل دسترسی در 1 نوامبر 2022)، نتیجه نشان داده شده درشکل 7 به دست آمد.
با تبدیل نقاط ابری به مختصات پیکسلی عکس، می‌توان قسمت آخر را انجام داد. یعنی برای محاسبه مختصات جعبه مرزی. این مقادیر بر اساس مقادیر حداکثر و حداقل نقاط پیش بینی شده (umax، vmax، umin و vmin) برآورد شد. به این ترتیب نتیجه نهایی ایجاد شد. جعبه مرزی اطراف جسم با انتقال ابر نقطه به تصاویر به دست آمد ( شکل 8 ).
روش ( شکل 9 ) به این ترتیب توسعه یافته شامل استفاده از داده های فتوگرامتری و محصولات به عنوان داده منبع برای حاشیه نویسی شی است. سپس تمام مراحل توضیح داده شده در این بخش انجام می شود. نتیجه نهایی، مجموعه داده‌های آموزشی متعددی است که شامل تصاویر و اطلاعات مربوط به موقعیت شی در تصویر با استفاده از یک کادر محدودکننده ذخیره شده در یک فایل متنی مطابق با الزامات زیر آشکارسازها و مدل‌های ML است.
به عنوان مثال، پایگاه داده های آموزشی حاصل می تواند برای آموزش آشکارسازهایی مانند YOLO یا Fast R-CNN استفاده شود. از سوی دیگر، یک موضوع مهم، ارزیابی دقت جعبه های محدود کننده حاصل است. این قسمت مربوط به ارزیابی نتایج در قسمت بعدی مورد بررسی قرار می گیرد که همپوشانی بین مرجع (حقیقت زمین) و جعبه مرزی که نتیجه حاصل از انتقال ابر نقطه به تصاویر است بررسی می شود.
همانطور که قبلا ذکر شد، آزمایش ها بر روی دو شی از زیرساخت های راه آهن انجام شد – دروازه ها و قطب های کششی. بخش زیر نتایج نمونه‌ای را نشان می‌دهد – جعبه‌های مرزی رسم شده روی تصاویر و محدود کردن اشیاء مورد علاقه. بازرسی بصری نتایج نیز بخشی از تجزیه و تحلیل ها را تشکیل می داد.
شکل 10 نمونه هایی از نتایج را برای قطب های کششی نشان می دهد. سمت راست نتایج را برای ابرهای نقطه از TLS نشان می‌دهد و سمت چپ جعبه‌های مرزی را نشان می‌دهد که از ابرهای نقطه‌ای از تطبیق تصویر متراکم ایجاد شده‌اند. مقایسه بصری مشابهی برای دومین شی مورد تجزیه و تحلیل – دروازه ها ( شکل 11 ) انجام شد.
جعبه‌های مرزبندی به‌دست‌آمده از این طریق می‌توانند یک مجموعه داده آموزشی را تشکیل دهند. بنابراین، ورودی شبکه یک تصویر یا قطعه ای از یک عکس حاوی شی مورد نظر و یک فایل، به عنوان مثال، یک فایل متنی حاوی اطلاعاتی در مورد موقعیت شی در سیستم مختصات پیکسل خواهد بود. اگر یک عکس شامل بیش از یک شی باشد، تمام اشیاء باید در فایل حاوی اطلاعات جعبه مرزی گنجانده شوند تا مجموعه کامل شود. نکته مهمی که در اینجا باید بر آن تاکید شود این است که با علامت گذاری یک شی در یک نقشه ارتوفوتومپ، می توان مجموعه داده های آموزشی متعددی را به دست آورد زیرا یک شی معین ممکن است در ده ها تصویر قابل مشاهده باشد. این به پارامترهای ماموریت پرواز بستگی دارد. این موضوع در بخش بعدی به طور گسترده توضیح داده شده است، از جمله تعداد کادرهای محدود کننده به دست آمده در تمام تصاویر یک نوع. روش ارائه شده برای انجام آزمایشات مورد استفاده قرار گرفت که نتایج آن در بخش بعدی توضیح داده شده است.

5. نتایج

یک موضوع مهم در ارزیابی دقت مدل های یادگیری عمیق، کیفیت و دقت مجموعه داده های آموزشی است. همانطور که مشخص است، دقت یک مدل تشخیص شی به کیفیت و تعداد نمونه های آموزشی، تصاویر ورودی، پارامترهای مدل و آستانه دقت مورد نیاز بستگی دارد. بنابراین، دقت، صحت و کامل بودن جعبه‌های مرزی برای آموزش مدل هنگام خودکارسازی فرآیند تولید مجموعه داده آموزشی بسیار مهم است.
هنگام تفسیر نتایج مدل یادگیری عمیق برای تشخیص شی، دقت با استفاده از معیارهای مختلف ارزیابی می شود. یکی از آنها فاکتور Intersection over Union (IoU) است. این معیاری است که به عنوان آستانه ای برای تعیین اینکه آیا یک نتیجه پیش بینی شده مثبت واقعی یا مثبت کاذب است استفاده می شود. این ضریب همپوشانی بین جعبه مرزی پیش بینی شده در اطراف جسم و جعبه مرزی حقیقت زمین را تعیین می کند. به این ترتیب، IoU می تواند به عنوان یک متریک برای ارزیابی دقت آشکارساز شی در یک مجموعه داده خاص با مقایسه نتایج حاصل از مدل با داده های مرجع استفاده شود.
همانطور که قبلاً ذکر شد، سهم اصلی این مقاله تجزیه و تحلیل تأثیر دقت ابرهای نقطه ای استخراج شده از تطبیق تصویر نادر و مایل بر روی جعبه های مرزی حاصله است که به طور خودکار استخراج می شوند. بنابراین، برای اینکه بتوانیم تأثیر دقت ابرهای نقطه ای استخراج شده از تطبیق تصویر بر روی جعبه های مرزی حاصل را ارزیابی کنیم، علاوه بر ارزیابی بصری، از تقاطع متریک بر روی اتحاد استفاده شد ( شکل 12 ).
این متریک برای ارزیابی دقت آشکارسازهای شی در مجموعه ای از داده ها استفاده می شود. هر آشکارساز، که جعبه‌های محدودکننده را به عنوان خروجی از مدل ارائه می‌کند، می‌تواند با متریک IoU ارزیابی شود. برای اعمال این معیار، لازم است:
  • جعبه‌های محدودکننده حقیقت زمین (جعبه‌های مرزی برچسب‌گذاری شده از مجموعه داده آزمایشی، که مکان شی را در یک سیستم مختصات پیکسلی تصویر مشخص می‌کند).
  • جعبه های مرزی پیش بینی شده (جعبه های مرزی خروجی از مدل).
    بر اساس این مقادیر، می توان همپوشانی بین مرجع (حقیقت زمین) و جعبه مرزی را ارزیابی کرد که نتیجه حاصل از نمایش نقاط ابری بر روی تصاویر است. بنابراین IoU به عنوان مساحت تقاطع جعبه مرزی حقیقت زمین با جعبه مرزی خروجی تقسیم بر مساحت ترکیب این دو اندازه گیری می شود.
در صورت‌حساب، مساحت تقاطع جعبه مرزی پیش‌بینی‌شده و جعبه مرزی حقیقت-زمینی وجود دارد، و مخرج، مساحت کل جعبه مرزی پیش‌بینی‌شده و جعبه مرزی حقیقت-زمینی است. تقسیم ناحیه همپوشانی بر ناحیه اتحاد نتیجه نهایی را به دست می دهد – تقاطع روی اتحاد. مقدار IoU از 0 (بدون همپوشانی) تا 1 است (جعبه ها یکسان هستند).
با توجه به اینکه هیچ آشکارساز شی در آزمایش‌های فوق استفاده نشده است، جعبه‌های مرزی حقیقت زمین به عنوان یک مرجع (به‌دست‌آمده بر اساس ابرهای نقطه‌ای از اسکن لیزری زمینی) در نظر گرفته شدند، در حالی که جعبه‌های مرزی حاصل (بر اساس ابرهای نقطه‌ای به دست آمدند). از تطابق تصویر متراکم) به عنوان “پیش بینی شده” در نظر گرفته شدند. همانطور که در بخش بالا توضیح داده شد، هر دو حقیقت پایه و جعبه های محدود کننده با استفاده از یک اسکریپت نیمه اتوماسیون به دست آمدند.
در نتیجه، تمام 14 نوع با جعبه‌های مرزی حقیقت زمین تولید شده از TLS مقایسه شدند.

5.1. دروازه ها

اولین اشیاء ارزیابی شده دروازه های کششی بودند. نتایج آزمایش در جدول 7 ارائه شده است ، که در آن دقت برای همه انواع خلاصه شده است. بهترین نتایج برای واریته‌ای با علامت شماره به دست آمد. 5، که مقدار IoU برای آن 92.42٪ بود. نتایج به دست آمده برای بقیه انواع نیز دقت نسبتا بالایی را نشان داد.
کمترین مقدار IoU برای واریانت با علامت شماره به دست آمد. 14-77.06٪. نظمی که می توان از نتایج مشاهده کرد این است که برای انواعی که برای آنها ابر نقطه با تنظیمات “بالا” تولید شده است، مقادیر کمتری نسبت به انواع با تنظیمات پیش فرض به دست آمده است. پس از تجزیه و تحلیل نتایج آزمایش، می توان نتیجه گرفت که نویز بالاتر، که برای ابرهای نقطه متراکم تولید شده با تنظیمات “چگالی نقطه بالا” به دست آمد، به طور قابل توجهی بر نتایج تأثیر گذاشت.
بر اساس نتایج، امکان نشان دادن یک نوع پرواز ماموریت وجود دارد، که برای آن جعبه‌های مرزبندی بالاترین دقت را نسبت به مراجع نشان می‌دهند. علاوه بر این، آستانه ای که برای متمایز کردن یک نتیجه معتبر استفاده می شود را می توان تعریف کرد (به طور دقیق تر، اینکه چه چیزی یک تطابق “خوب” است (یا نیست). در این حالت، متریک آستانه مقدار IoU است. تغییر آستانه امتیاز باعث می شود که نرخ های مثبت کاذب و مثبت واقعی تشخیص داده شوند تا یک مجموعه داده آموزشی با کیفیت بالا ایجاد شود. با انجام این کار، می‌توان نتایج اشتباه را کنار گذاشت و آن‌هایی را که احتمالاً نیاز به تصحیح دستی دارند، قبل از انتقال به مدل برجسته کرد. اطلاعات بیشتر در مورد مقدار آستانه در بخش 5.3 توضیح داده شده است .
بنابراین، می توان بیان کرد که تنظیمات تراکم ابر در نقطه بالا نتایج کمی بدتر ارائه می دهد. علاوه بر این، چنین ابر نقطه ای تا چهار برابر زمان پردازش و رم بیشتر از چگالی مطلوب نیاز دارد.
در زیر نمونه‌هایی از نتایج به‌دست‌آمده در نتیجه آزمایش‌های انجام‌شده – اعمال شده بر روی جعبه‌های مرزی تصاویر که اجسام را احاطه کرده‌اند، نشان می‌دهد. نمونه هایی از نتایج صحیح با مقادیر IoU بالا ( شکل 13 ) و نتایج بدتر ( شکل 14 ) که نیاز به بهبود دستی احتمالی قبل از گنجاندن در آموزش مدل دارند، نشان داده شده است.

5.2. تیرهای کششی

در مورد نتایج برای شی دوم، آنها با نتایج به دست آمده برای دروازه ها متفاوت هستند. معلوم شد که قطب‌های کششی اجرام پیچیده‌تری هستند که نسبت به دروازه‌ها، نقشه‌برداری کمتری با ابرهای نقطه‌ای دارند. در مورد دروازه ها، دقت برای قطب های کششی در جدول 8 خلاصه شده است.
بهترین نتایج برای واریانت با علامت شماره به دست آمد. 9، که مقدار IoU برای آن 87.54٪ بود. برای بقیه انواع، نتایج دقت 0.75 را نشان داد. کمترین مقدار IoU برای واریته با علامت شماره به دست آمد. 6-68.64٪. قاعده‌ای که در آزمایش‌های دروازه‌ها مورد توجه قرار گرفت، که برای ابرهای نقطه‌ای ایجاد شده در تنظیمات بالا، مقادیر بدتری به‌دست آمد، در مورد قطب‌های کششی رخ نداد. در اینجا، دقت بالاتری برای سه مورد از چهار نوع در تنظیمات بالا به دست آمد.
با تجزیه و تحلیل نتایج دقت برای قطب‌های کششی، همچنین می‌توان متوجه شد که برای انواعی که علاوه بر عکس‌های نادر، از تصاویر مایل استفاده شده است، نتایج بسیار بهتری به دست آمد. بنابراین، بر اساس این نتایج، می‌توان نتیجه گرفت که برای اجرام پیچیده‌تر که در بالای زمین امتداد می‌یابند، مانند قطب‌های کششی، مناسب است عکس‌های مایل را هنگام تولید ابرهای نقطه‌ای در نظر بگیریم.
خلاصه ای مشابه برای دروازه ها برای قطب های کششی ارائه شد. نتیجه صحیح دارای IoU 0.94 بود، که در آن تفاوت در جعبه های محدود تقریباً برای چشم نامرئی است ( شکل 15 ). مثالی که در آن بخشی از قطب کشش احتمالاً از تطبیق تصویر متراکم به ابر نقطه نگاشت نشده است، منجر به IoU تنها 0.48 شد ( شکل 16 ).

5.3. ملاحظات عمومی

برای هر دو نوع شی مورد تجزیه و تحلیل، هیچ ارتباط یا اثر قابل توجهی از همپوشانی های رو به جلو و جانبی و سایر پارامترهای پرواز ماموریت (مانند ارتفاع پرواز) مشاهده نشد.
همانطور که قبلاً گفته شد، مقادیر IoU معمولاً در درصد بیان می شوند. بیشترین استفاده از مقادیر آستانه 50٪ و 75٪ [ 47 ] است. با این حال، چنین مقادیری به عنوان معیارهای ارزیابی تشخیص برای تعیین کمیت عملکرد الگوریتم‌های تشخیص در مناطق و زمینه‌های مختلف استفاده می‌شوند. بنابراین، این سوال مطرح می شود که چه آستانه ای برای روش شناسی فوق اعمال شود. بدیهی است که مجموعه داده آموزشی به دست آمده باید به طور خودکار تا حد امکان دقیق باشد. بنابراین، برای تعریف آستانه IoU برای اشیاء منفرد، باید ارزیابی دقیق تری انجام شود تا مشخص شود که نتیجه از کدام مقدار باید همچنان به صورت دستی بررسی و تصحیح شود. چنین مطالعه ای می تواند بسط آزمایش های فوق باشد.
نتیجه گیری کلی این است که می توان مشاهده کرد که تأثیر نوع پرواز ماموریت، از جمله پارامترهای اکتساب تصویر و پارامترهای پردازش، بر کیفیت ابرهای نقطه ای قابل توجه است.
یک دستاورد مهم اندازه مجموعه داده آموزشی است. خلاصه ای از نمونه های اشیاء در تصاویر برای همه انواع را می توان در جداول بالا مشاهده کرد ( جدول 7 ، جدول 8 ). در مجموع 35 جسم (20 قطب کششی و 15 دروازه) بردار شدند و تعداد نهایی مجموعه نمونه‌های موجود در عکس‌ها برای برخی از انواع آن حتی حدود سه هزار بود. بنابراین، به طور کلی، می توان از روش برای ایجاد خودکار مجموعه داده های آموزشی تا حد امکان استفاده کرد.
شکل 17 و شکل 18 مواردی را برای کل تصاویر با وضوح بالا با حاشیه نویسی های واقعی و کادرهای محدود کننده حاصل از فرآیند نشان می دهد.

6. نتیجه گیری

حاشیه‌نویسی داده‌های حقیقت پایه و جمع‌آوری مجموعه داده‌های آموزشی برای مدل‌های آموزشی، آشکارسازهای اشیا تحت نظارت و رویکردهای یادگیری عمیق ارتباط بسیار مهمی دارد. این کار خسته کننده، وقت گیر و کار فشرده است که منجر به کمبود مجموعه داده های واقعی می شود. لزوم آموزش مدل‌ها با حجم وسیعی از داده‌های حاشیه‌نویسی مستقل (معمولاً در حد ده‌ها هزار) هنوز یک مشکل باز است که استفاده از CNN بالقوه را محدود می‌کند. این در بسیاری از برنامه‌ها و همچنین برای مجموعه داده‌ها برای آموزش مدل‌ها برای تشخیص اشیاء در تصاویر پهپاد قابل توجه است.
بهره‌برداری از پتانسیل روش‌های یادگیری عمیق موجود برای تشخیص اشیا دلیلی برای توسعه موضوع خودکارسازی اکتساب مجموعه داده‌های آموزشی است. بنابراین، نیاز به اعمال رویکرد پیشنهادی آشکار است، و کار بالا سودمندی خودکار کردن این فرآیند را تا حد امکان برجسته می‌کند.
اتخاذ استراتژی پیشنهادی در این مقاله برچسب‌گذاری داده‌ها را آسان‌تر می‌کند. این روش امکان ایجاد جعبه‌های مرزی را بر اساس نقاطی که فقط مکان جسم را نشان می‌دهند، می‌سازد، و به لطف این واقعیت که در فتوگرامتری استفاده از همپوشانی در یک بلوک از تصاویر رایج است، انتقال شی بر روی چند یا چند تصویر انجام می‌شود. ده ها تصویر نشان دهنده شی. اگرچه رویکرد توصیف شده حاشیه نویسی دستی در ابتدای فرآیند را حذف نمی کند، اما زمان را به میزان قابل توجهی کاهش می دهد. علاوه بر این، هیچ چیز مانع از استفاده مکان‌های اشیاء موجود از پایگاه‌های داده از قبل ایجاد شده نیست، که بر کار دستی غلبه می‌کند. ابزارهای باز برای حاشیه نویسی دستی وجود دارند و کاملاً گسترده هستند (مثلاً LabelMe)، اما تهیه مجموعه داده های آموزشی به این روش بسیار زمان بر است.
روش فوق، یا روش دیگری که در فصل 1 با استفاده از فرآیندهای نیمه اتوماسیون توضیح داده شده است، می تواند به غلبه بر مشکل دستیابی به مجموعه داده های آموزشی کمک کند. این فرآیند تلاش دستی مربوط به تولید حقیقت پایه را به حداقل می رساند و به طور قابل توجهی از آموزش الگوریتم های یادگیری عمیق پشتیبانی و ترویج می کند.
نکته مهمی که باید برجسته شود، تعداد مجموعه داده های آموزشی است که با استفاده از روش فوق ایجاد شده است. با استفاده از تصاویر عمودی و مورب، مجموعه داده ای به دست می آوریم که همان ناحیه و اشیاء مشابه را اما از منظرهای متفاوت ترسیم می کند. بنابراین، با بردار کردن شی یک بار بر روی نقشه ارتوفوتومپ، مجموعه ای متشکل از تعداد بیشتری از تصاویر را با استفاده از روش مهم تری که در بالا توضیح داده شد، به دست می آوریم. به عنوان مثال، برای بیست قطب کشش برای واریانت شماره 9، که برای آنها بالاترین دقت به دست آمد، در مجموع 3930 نمونه در تصاویر به دست آمد.
این رویکرد، البته، می‌تواند با استفاده از یک نقشه ارتوفوتومپ به جای تصاویر، به کاشی‌های کوچک‌تر بریده شود. با این حال، اندازه چنین مجموعه ای بسیار کوچکتر از زمانی است که تمام تصاویر موجود در بلوک گرفته شوند زیرا هر شی فقط یک بار تصویر می شود. البته شایان ذکر است که با تغییرات اندک در کد، این روش پس از انجام برخی انطباق ها می تواند برای نقشه های ارتوفوتومی نیز اعمال شود که استفاده از آن مزایای بسیاری دارد.
یک مسئله به خصوص مهم در زمینه ایجاد خودکار مجموعه داده های آموزشی، دقت داده های ورودی است. این رویکرد باید به دقت ابرهای نقطه‌ای که در فرآیند گنجانده شده‌اند توجه کند، زیرا روی جعبه‌های مرزی حاصل، یعنی اساساً مجموعه داده آموزشی آماده‌شده، تأثیر می‌گذارد.
با این حال، نشان داده شده است که حتی با استفاده از ابرهای نقطه ای کمی پر سر و صدا، می توان به مجموعه ای دقیق و معقول دست یافت که احتمالاً به اصلاحات دستی کمی نیاز دارد. بنابراین، می توان نتیجه گرفت که این روش می تواند مشابه روش های برچسب گذاری ذکر شده در بالا استفاده شود، که در آن ابتدا حاشیه نویسی خودکار داده ها انجام می شود و سپس تأیید و بهبود احتمالی بعداً انجام می شود. کمترین دقت به دست آمده در مجموعه داده آزمایشی حدود 70% و برای برخی از انواع، بیش از 90% بود.
بر اساس آزمایشات انجام شده می توان گفت که رویکرد پیشنهادی از نظر عملکرد و سرعت پردازش بهینه است. این یک روش نیمه خودکار برای دستیابی به برچسب های ثابت برای همه تصاویر در یک بلوک ارائه می دهد و تلاش برای برچسب زدن دستی هر شی در عکس ها را کاهش می دهد. این کار با شروع با برچسب زدن اشیاء یک بار روی عکس‌های ارتوفوتو و سپس با برش دادن ابر نقطه به تکه‌ای از شی مورد نظر و نمایش نقاط متعلق به شی بر روی مختصات پیکسلی عکس انجام می‌شود. نتیجه نهایی یک جعبه مرزی است که جسم را احاطه کرده است. شایان ذکر است که مرحله مربوط به علامت گذاری دستی محل اشیا با استفاده از نقشه ارتوفوتومپ یکی از گزینه ها می باشد. ما می توانیم از نقاط زمین شروع کنیم، اما برای مثال استخراج شده، از پایگاه داده اشیاء توپوگرافی یا استفاده از داده های BIM. برچسب‌گذاری دستی جعبه‌های مرزی روی هزاران یا صدها هزار تصویر زمان‌برتر است. علاوه بر این، ابرهای نقطه‌ای حاصل از تطبیق تصویر یا عکس‌های ارتو، محصولاتی هستند که اغلب در فرآیند تولید تولید می‌شوند که پتانسیل این استراتژی را نشان می‌دهد. به طور طبیعی، روش پیشنهادی می تواند با انواع دیگر داده ها (نه تنها از پهپاد) نیز سازگار شود. این رویکرد همچنین می‌تواند از ابرهای نقطه‌ای از تطابق متراکم تصاویر هوایی یا ابرهای نقطه‌ای که از اسکن لیزری از سقف‌های مختلف (هم هوایی و هم زمینی) به دست می‌آیند، استفاده کند. مسلماً روش‌های مورد استفاده یک کشف نیستند، بلکه محاسبات ساده هستند، اما ارزش افزوده در اینجا ترتیب آزمایش‌های تحلیل استراتژی و دقت است. برچسب‌گذاری دستی جعبه‌های مرزی روی هزاران یا صدها هزار تصویر زمان‌برتر است. علاوه بر این، ابرهای نقطه‌ای حاصل از تطبیق تصویر یا عکس‌های ارتو، محصولاتی هستند که اغلب در فرآیند تولید تولید می‌شوند که پتانسیل این استراتژی را نشان می‌دهد. به طور طبیعی، روش پیشنهادی می تواند با انواع دیگر داده ها (نه تنها از پهپاد) نیز سازگار شود. این رویکرد همچنین می‌تواند از ابرهای نقطه‌ای از تطابق متراکم تصاویر هوایی یا ابرهای نقطه‌ای که از اسکن لیزری از سقف‌های مختلف (هم هوایی و هم زمینی) به دست می‌آیند، استفاده کند. مسلماً روش‌های مورد استفاده یک کشف نیستند، بلکه محاسبات ساده هستند، اما ارزش افزوده در اینجا ترتیب آزمایش‌های تحلیل استراتژی و دقت است. برچسب‌گذاری دستی جعبه‌های مرزی روی هزاران یا صدها هزار تصویر زمان‌برتر است. علاوه بر این، ابرهای نقطه‌ای حاصل از تطبیق تصویر یا عکس‌های ارتو، محصولاتی هستند که اغلب در فرآیند تولید تولید می‌شوند که پتانسیل این استراتژی را نشان می‌دهد. به طور طبیعی، روش پیشنهادی می تواند با انواع دیگر داده ها (نه تنها از پهپاد) نیز سازگار شود. این رویکرد همچنین می‌تواند از ابرهای نقطه‌ای از تطابق متراکم تصاویر هوایی یا ابرهای نقطه‌ای که از اسکن لیزری از سقف‌های مختلف (هم هوایی و هم زمینی) به دست می‌آیند، استفاده کند. مسلماً روش‌های مورد استفاده یک کشف نیستند، بلکه محاسبات ساده هستند، اما ارزش افزوده در اینجا ترتیب آزمایش‌های تحلیل استراتژی و دقت است. ابرهای نقطه‌ای حاصل از تطبیق تصویر یا عکس‌های اورتوفوتو، محصولاتی هستند که اغلب در فرآیند تولید تولید می‌شوند، که نشان‌دهنده پتانسیل این استراتژی است. به طور طبیعی، روش پیشنهادی می تواند با انواع دیگر داده ها (نه تنها از پهپاد) نیز سازگار شود. این رویکرد همچنین می‌تواند از ابرهای نقطه‌ای از تطابق متراکم تصاویر هوایی یا ابرهای نقطه‌ای که از اسکن لیزری از سقف‌های مختلف (هم هوایی و هم زمینی) به دست می‌آیند، استفاده کند. مسلماً روش‌های مورد استفاده یک کشف نیستند، بلکه محاسبات ساده هستند، اما ارزش افزوده در اینجا ترتیب آزمایش‌های تحلیل استراتژی و دقت است. ابرهای نقطه‌ای حاصل از تطبیق تصویر یا عکس‌های اورتوفوتو، محصولاتی هستند که اغلب در فرآیند تولید تولید می‌شوند، که نشان‌دهنده پتانسیل این استراتژی است. به طور طبیعی، روش پیشنهادی می تواند با انواع دیگر داده ها (نه تنها از پهپاد) نیز سازگار شود. این رویکرد همچنین می‌تواند از ابرهای نقطه‌ای از تطابق متراکم تصاویر هوایی یا ابرهای نقطه‌ای که از اسکن لیزری از سقف‌های مختلف (هم هوایی و هم زمینی) به دست می‌آیند، استفاده کند. مسلماً روش‌های مورد استفاده یک کشف نیستند، بلکه محاسبات ساده هستند، اما ارزش افزوده در اینجا ترتیب آزمایش‌های تحلیل استراتژی و دقت است. یا ابرهای نقطه ای به دست آمده از اسکن لیزری از سقف های مختلف (هم هوایی و هم زمینی). مسلماً روش‌های مورد استفاده یک کشف نیستند، بلکه محاسبات ساده هستند، اما ارزش افزوده در اینجا ترتیب آزمایش‌های تحلیل استراتژی و دقت است. یا ابرهای نقطه ای به دست آمده از اسکن لیزری از سقف های مختلف (هم هوایی و هم زمینی). مسلماً روش‌های مورد استفاده یک کشف نیستند، بلکه محاسبات ساده هستند، اما ارزش افزوده در اینجا ترتیب آزمایش‌های تحلیل استراتژی و دقت است.
به طور خلاصه، بر اساس نتایج فوق، می توان نتیجه گرفت که استفاده از روش توسعه یافته برای نیمه خودکار کردن فرآیند ایجاد مجموعه داده برای آموزش مدل های یادگیری عمیق برای تشخیص اشیا در تصاویر نادر و مایل به دست آمده از پهپاد منطقی است.

منابع

  1. یانگ، سی. ژانگ، اف. گائو، ی. مائو، ز. لی، ال. Huang, X. شناسایی و حذف ماشین متحرک برای مدلسازی شهری سه بعدی با استفاده از تصاویر مایل. Remote Sens. 2021 , 13 , 3458. [ Google Scholar ] [ CrossRef ]
  2. چو، WT; چائو، YC; چانگ، YS جاروگر خیابان: شناسایی و حذف اتومبیل ها در تصاویر نمای خیابان. چندتایی. ابزارهای کاربردی 2015 ، 74 ، 10965-10988. [ Google Scholar ] [ CrossRef ]
  3. Felzenszwalb، ​​PF; Girshick، RB; مک آلستر، دی. رامانان، دی. تشخیص اشیاء با مدل‌های مبتنی بر جزئی آموزش دیده. IEEE Trans. الگوی مقعدی ماخ هوشمند 2010 ، 32 ، 1627-1645. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  4. سیمونیان، ک. Zisserman, A. شبکه های پیچیده بسیار عمیق برای تشخیص تصویر در مقیاس بزرگ. arXiv 2014 ، arXiv:1409.1556. [ Google Scholar ]
  5. روساکوفسکی، او. دنگ، ج. سو، اچ. کراوز، جی. ستایش، س. ما، س. هوانگ، ز. کارپاتی، ا. خسلا، ع. برنشتاین، ام. و همکاران چالش تشخیص بصری در مقیاس بزرگ ImageNet. بین المللی جی. کامپیوتر. Vis. 2015 ، 115 ، 211-252. [ Google Scholar ] [ CrossRef ]
  6. اورینگهام، ام. اسلامی، س. ون گول، ال. ویلیامز، CK; وین، جی. زیسرمن، آ. چالش کلاس‌های شی بصری پاسکال: یک گذشته‌نگر. بین المللی جی. کامپیوتر. Vis. 2015 ، 111 ، 98-136. [ Google Scholar ] [ CrossRef ]
  7. لین، TY; مایر، م. بلنگی، اس. هیز، جی. پرونا، پی. رامانان، دی. دلار، پی. Zitnick، CL مایکروسافت COCO: اشیاء مشترک در زمینه. در مجموعه مقالات کنفرانس اروپایی بینایی کامپیوتر، زوریخ، سوئیس، 6 تا 12 سپتامبر 2014. Springer: Cham, Switzerland, 2014; صص 740-755. [ Google Scholar ]
  8. وو، اچ. لیو، کیو. لیو، ایکس. مروری بر رویکردهای یادگیری عمیق برای طبقه بندی تصویر و تقسیم بندی اشیا. محاسبه کنید. ماتر ادامه 2019 ، 60 ، 575–597 . [ Google Scholar ] [ CrossRef ]
  9. لاوفایمر، دی. Haala, N. شعبده بازی با بازنمایی: در مورد انتقال اطلاعات بین تصاویر، ابرهای نقطه، و مش برای معناشناسی چند وجهی. ISPRS J. Photogramm. Remote Sens. 2021 ، 176 ، 55-68. [ Google Scholar ] [ CrossRef ]
  10. هایتس، جی. Koller, D. یادگیری زمینه فضایی: استفاده از چیزها برای یافتن چیزها. در مجموعه مقالات کنفرانس اروپایی بینایی کامپیوتر، مارسی، فرانسه، 12 تا 18 اکتبر 2008. Springer: برلین/هایدلبرگ، آلمان، 2008; صص 30-43. [ Google Scholar ]
  11. رازاکاریونی، س. Jurie, F. تشخیص وسیله نقلیه در تصاویر هوایی: یک معیار کوچک تشخیص هدف. J. Vis. اشتراک. تصویر نشان می دهد. 2016 ، 34 ، 187-203. [ Google Scholar ] [ CrossRef ]
  12. زو، اچ. چن، ایکس. دای، دبلیو. فو، ک. بله، س. Jiao, J. تشخیص شیء قوی جهت گیری در تصاویر هوایی با استفاده از شبکه عصبی کانولوشنال عمیق. در مجموعه مقالات کنفرانس بین المللی IEEE 2015 در مورد پردازش تصویر (ICIP)، شهر کبک، QC، کانادا، 27-30 سپتامبر 2015. صص 3735–3739. [ Google Scholar ]
  13. لیو، ک. ماتیوس، جی. تشخیص سریع وسایل نقلیه چند کلاسه در تصاویر هوایی. IEEE Geosci. سنسور از راه دور Lett. 2015 ، 12 ، 1938-1942. [ Google Scholar ]
  14. شیائو، ز. لیو، کیو. تانگ، جی. ژای، ایکس. هیستوگرام‌های مبتنی بر تبدیل فوریه بیضوی از گرادیان‌های جهت‌یافته برای تشخیص شیء ثابت چرخشی در تصاویر سنجش از دور. بین المللی J. Remote Sens. 2015 ، 36 ، 618-644. [ Google Scholar ] [ CrossRef ]
  15. لیو، ز. یوان، ال. ونگ، ال. Yang, Y. مجموعه داده های تصویری ماهواره ای نوری با وضوح بالا برای تشخیص کشتی و برخی خطوط پایه جدید. در مجموعه مقالات کنفرانس بین المللی کاربردها و روش های تشخیص الگو، پورتو، پرتغال، 24 تا 26 فوریه 2017. جلد 2، ص 324-331. [ Google Scholar ]
  16. بندیک، سی. دسکامبز، ایکس. Zerubia, J. نظارت بر توسعه ساختمان در جفت‌های تصویر سنجش از راه دور چند زمانی با دینامیک تولد-مرگ تصادفی. IEEE Trans. الگوی مقعدی ماخ هوشمند 2011 ، 34 ، 33-50. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  17. Xia، GS; بای، ایکس. دینگ، جی. زو، ز. بلنگی، اس. لو، جی. داتکو، ام. پلیلو، ام. Zhang, L. DOTA: مجموعه داده در مقیاس بزرگ برای تشخیص اشیا در تصاویر هوایی. در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو، سالت لیک سیتی، UT، ایالات متحده آمریکا، 18 تا 22 ژوئن 2018؛ صص 3974–3983. [ Google Scholar ]
  18. لی، ک. وان، جی. چنگ، جی. منگ، ال. Han, J. تشخیص شیء در تصاویر سنجش از دور نوری: یک بررسی و یک معیار جدید. ISPRS J. Photogramm. Remote Sens. 2020 , 159 , 296–307. [ Google Scholar ] [ CrossRef ]
  19. مائو، ز. ژانگ، اف. هوانگ، ایکس. جیا، ایکس. گونگ، ی. Zou، Q. شبکه های عصبی عمیق برای تشخیص علائم جاده و مدل سازی تعبیه شده با استفاده از تصاویر هوایی مورب. Remote Sens. 2021 , 13 , 879. [ Google Scholar ] [ CrossRef ]
  20. زاخار، پ. کورچینسکی، ز. Ostrowski، W. کاربرد یادگیری ماشین برای تشخیص اشیا در تصاویر هوایی مورب. بین المللی قوس. فتوگرام حسگر از راه دور اسپات. Inf. علمی 2022 ، 43 ، 657-663. [ Google Scholar ] [ CrossRef ]
  21. هیو، وای؛ کیم، اس. یون، دی. جئونگ، جی. Sung، H. تشخیص شی متحرک مبتنی بر یادگیری عمیق برای تصاویر مایل بدون فریم آینده. در مجموعه مقالات شناسایی خودکار هدف XXX 2020، آنلاین، 27 آوریل تا 8 مه 202؛ جلد 11394، ص. 1139403.
  22. جیانگ، اس. جیانگ، دبلیو. هوانگ، دبلیو. یانگ، L. فتوگرامتری مایل مبتنی بر پهپاد برای جمع آوری داده های فضای باز و بازرسی بصری خارج از محل خط انتقال. Remote Sens. 2017 , 9 , 278. [ Google Scholar ] [ CrossRef ]
  23. سینگ، AK; دوویدی، AK; نهار، ن. سینگ، دی. تشخیص خواب‌آلود ریل راه‌آهن در تصاویر پهپاد در ارتفاع پایین با استفاده از شبکه عصبی پیچیده عمیق. در مجموعه مقالات سمپوزیوم بین المللی علوم زمین و سنجش از دور IEEE IGARSS، بروکسل، بلژیک، 11 تا 16 ژوئیه 2021؛ صص 355-358. [ Google Scholar ]
  24. مامری، ع. صدیقی، ای جی; ژائو، Y. بخش بندی مسیر راه آهن به کمک پهپاد بر اساس شبکه های عصبی کانولوشنال. در مجموعه مقالات 2021 IEEE 93 کنفرانس فناوری خودرو (VTC2021-Spring)، هلسینکی، فنلاند، 25-28 آوریل 2021؛ صص 1-7. [ Google Scholar ]
  25. سینگ، AK; سواراپ، ا. آگاروال، ا. استخراج و نظارت بر خط ریلی سینگ، دی. ویژن از طریق تصاویر هواپیماهای بدون سرنشین. Ict Express 2019 ، 5 ، 250–255. [ Google Scholar ] [ CrossRef ]
  26. صاحبدیوانی، س. عارفی، ح. معبودی، م. شناسایی مسیر ریلی و مدل‌سازی سه‌بعدی مبتنی بر طرح ریزی از ابر نقطه‌ای پهپاد. Sensors 2020 , 20 , 5220. [ Google Scholar ] [ CrossRef ]
  27. هو، کیو. یانگ، بی. خالد، س. شیائو، دبلیو. تریگونی، ن. مارکهام، A. به سوی تقسیم بندی معنایی ابرهای نقطه سه بعدی در مقیاس شهری: مجموعه داده ها، معیارها و چالش ها. در مجموعه مقالات کنفرانس IEEE/CVF در مورد دید رایانه و تشخیص الگو، نشویل، TN، ایالات متحده، 20-25 ژوئن 2021؛ صفحات 4977-4987. [ Google Scholar ]
  28. بوجارچاک، پ. پهپادهای Lesiak، P. در تشخیص تصویر آسیب ریلی که توسط شبکه‌های یادگیری عمیق پشتیبانی می‌شوند. Eng را باز کنید 2021 ، 11 ، 339-348. [ Google Scholar ] [ CrossRef ]
  29. هنری، سی. پودل، اس. لی، SW; Jeong, H. سیستم تشخیص خودکار ماژول‌های PV خراب با استفاده از پهپاد با دوربین حرارتی. Appl. علمی 2020 ، 10 ، 3802. [ Google Scholar ] [ CrossRef ]
  30. راماچاندران، ا. Sangaiah, AK مروری بر تشخیص اشیا در نظارت وسایل نقلیه هوایی بدون سرنشین. بین المللی J. Cogn. محاسبه کنید. مهندس 2021 ، 2 ، 215-228. [ Google Scholar ] [ CrossRef ]
  31. اسکو، ال پی. جونیور، جی.ام. راموس، APM؛ د کاسترو خورخه، لس آنجلس; فتح اللهی، س.ن. د آندراد سیلوا، جی. پیستوری، اچ. Gonçalves، WN; Li, J. مروری بر یادگیری عمیق در سنجش از راه دور پهپاد. بین المللی J. Appl. زمین Obs. Geoinf. 2021 ، 102 ، 102456. [ Google Scholar ] [ CrossRef ]
  32. یانگ، اف. فن، اچ. چو، پی. بلاش، ای. Ling, H. تشخیص شی خوشه ای در تصاویر هوایی. در مجموعه مقالات کنفرانس بین المللی IEEE/CVF در بینایی کامپیوتر، سئول، کره، 27 اکتبر تا 2 نوامبر 2019؛ صص 8311–8320. [ Google Scholar ]
  33. کیرکو، سی. پلاستیرس، جی. تئوکاریدس، تی. ونیریس، SI; بوگانیس، سی.- اس. DroNet: آشکارساز شبکه عصبی کانولوشنال کارآمد برای کاربردهای پهپاد بلادرنگ. در مجموعه مقالات طراحی 2018، آزمون اتوماسیون در نمایشگاه کنفرانس اروپا (DATE)، درسدن، آلمان، 19 تا 23 مارس 2018؛ ص 967-972. [ Google Scholar ]
  34. لی، سی. یانگ، تی. زو، اس. چن، سی. Guan، S. تشخیص شی هدایت شده نقشه چگالی در تصاویر هوایی. arXiv 2020 ، arXiv:2004.05520. [ Google Scholar ]
  35. ژانگ، اچ. یانگ، دبلیو. یو، اچ. ژانگ، اچ. Xia، G.-S. تشخیص خطوط برق در تصاویر پهپاد با ویژگی های کانولوشن و محدودیت های ساختاری. Remote Sens. 2019 ، 11 ، 1342. [ Google Scholar ] [ CrossRef ]
  36. دوس سانتوس، AA; مارکاتو جونیور، جی. آراجو، ام اس؛ دی مارتینی، DR. تتیلا، EC; Siqueira، HL; آئوکی، سی. التنر، ا. ماتسوبارا، ای تی. پیستوری، اچ. و همکاران ارزیابی روش‌های مبتنی بر CNN برای تشخیص درخت فردی بر روی تصاویر گرفته شده توسط دوربین‌های RGB متصل به پهپاد. Sensors 2019 , 19 , 3595. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  37. راسموسن، CB; کرک، ک. Moeslund، TB چالش حاشیه نویسی داده ها در یادگیری عمیق-مطالعه موردی در مورد سیلو ذرت کامل گیاه. Sensors 2022 , 22 , 1596. [ Google Scholar ] [ CrossRef ]
  38. ژانگ، دی. هان، جی. چنگ، جی. یانگ، MH محلی سازی و تشخیص شی تحت نظارت ضعیف: یک بررسی. IEEE Trans. الگوی مقعدی ماخ هوشمند 2021 . [ Google Scholar ] [ CrossRef ]
  39. راس، جی. سلارت، ال. ماترزینسکا، جی. وازکز، دی. Lopez, AM مجموعه داده synthia: مجموعه بزرگی از تصاویر مصنوعی برای تقسیم بندی معنایی صحنه های شهری. در مجموعه مقالات کنفرانس IEEE در مورد دید کامپیوتری و تشخیص الگو، لاس وگاس، NV، ایالات متحده، 27-30 ژوئن 2016. صص 3234–3243. [ Google Scholar ]
  40. زی، جی. کیفل، م. Sun، MT; گایگر، الف. حاشیه نویسی نمونه معنایی صحنه های خیابانی با انتقال برچسب سه بعدی به دوبعدی. در مجموعه مقالات کنفرانس IEEE در مورد دید کامپیوتری و تشخیص الگو، لاس وگاس، NV، ایالات متحده، 27-30 ژوئن 2016. صص 3688–3697. [ Google Scholar ]
  41. ژو، ایکس. فراندرفر، اف. کورز، اف. Reinartz، P. تشخیص ساختمان و بخش‌بندی با استفاده از CNN با داده‌های آموزشی تولید شده به طور خودکار. در مجموعه مقالات IGARSS 2018-2018 IEEE بین المللی زمین شناسی و سمپوزیوم سنجش از دور، والنسیا، اسپانیا، 22 تا 27 ژوئیه 2018؛ صص 3461–3464. [ Google Scholar ]
  42. کاپانیا، س. ساینی، د. گویال، اس. تاکور، ن. جین، آر. Nagrath، P. ردیابی چند شیء با پهپادها با استفاده از SORT عمیق و چارچوب شناسایی YOLOv3 RetinaNet. در مجموعه مقالات اولین کارگاه ACM در مورد سیستم های تلفن همراه خودمختار و هوشمند، بنگلور، هند، 11 ژانویه 2020؛ صص 1-6. [ Google Scholar ]
  43. کلنبرگر، بی. ولپی، م. Tuia, D. تشخیص سریع حیوانات در تصاویر پهپاد با استفاده از شبکه های عصبی کانولوشن. در مجموعه مقالات سمپوزیوم بین المللی علوم زمین و سنجش از دور IEEE 2017 (IGARSS)، ورث، TX، ایالات متحده آمریکا، 23 تا 28 ژوئیه 2017؛ صص 866-869. [ Google Scholar ]
  44. بازی، ی. ملگانی، F. شبکه های SVM کانولوشن برای تشخیص اشیا در تصاویر پهپاد. IEEE Trans. Geosci. Remote Sens. 2018 , 56 , 3107–3118. [ Google Scholar ] [ CrossRef ]
  45. وانگ، ایکس. چنگ، پی. لیو، ایکس. Uzochukwu، B. سریع و دقیق، رویکرد مبتنی بر شبکه عصبی کانولوشن برای تشخیص اشیا از پهپاد. در مجموعه مقالات کنفرانس سالانه IECON 2018-44 انجمن الکترونیک صنعتی IEEE، واشنگتن دی سی، ایالات متحده آمریکا، 21 تا 23 اکتبر 2018؛ صص 3171–3175. [ Google Scholar ]
  46. ژانگ، دبلیو. چی، جی. وان، پی. وانگ، اچ. زی، دی. وانگ، ایکس. Yan, G. روش فیلتر کردن داده‌های LiDAR با کاربری آسان بر اساس شبیه‌سازی پارچه. Remote Sens. 2016 , 8 , 501. [ Google Scholar ] [ CrossRef ]
  47. پادیلا، آر. پاسوس، WL; دیاس، TL; Netto، SL; Da Silva، EA تجزیه و تحلیل مقایسه ای معیارهای تشخیص اشیا با یک جعبه ابزار منبع باز همراه. Electronics 2021 , 10 , 279. [ Google Scholar ] [ CrossRef ]
شکل 1. تکه‌های ابر نقطه‌ای که برای همه انواع تحلیل‌شده به شی دروازه بریده شده است.
شکل 2. تکه های ابر نقطه ای که برای همه انواع تحلیل شده به جسم قطب کششی بریده شده اند.
شکل 3. نمونه هایی از داده های حاشیه نویسی برای ( الف ) قطب های کششی که به عنوان نقاط حاشیه نویسی شده اند و ( ب ) دروازه هایی که به عنوان چند ضلعی بر اساس نقشه اورتوفتوتوم از تصاویر پهپاد برچسب گذاری شده اند.
شکل 4. نمونه هایی از اجسام بریده شده از یک ابر نقطه.
شکل 5. نمونه‌های فیلتر زمینی فیلتر شبیه‌سازی پارچه (CSF): ( الف ) نمونه‌ای از ابر منبع، ( ب ) همان شیء پس از فیلتراسیون زمینی رنگ‌شده با کلاس‌ها – زمینی و غیرزمینی، ( ج ) نمونه‌ای از فیلتراسیون زمینی برای یک ابر نقطه ای با TLS، ( d ) بخش نهایی ابر نقطه به مرحله بعدی الگوریتم منتقل می شود.
شکل 6. نمونه ای از فیلتر کردن نویز برای یک دروازه، که در آن نقاط قرمز نویز و نقاط خاکستری شی هستند.
شکل 7. نمونه ای از نمایش یک ابر نقطه به یک عکس.
شکل 8. نتیجه نهایی نمونه ای از مجموعه داده های آموزشی برای تشخیص قطب کششی است.
شکل 9. گردش کار برای نیمه خودکار کردن فرآیند آماده سازی مجموعه داده های آموزشی برای تشخیص اشیا.
شکل 10. نتایج مثال برای قطب‌های کششی: ( الف ) جعبه‌های مرزی به‌دست‌آمده از ابر نقطه‌ای از DIM، ( ب ) جعبه‌های مرزی حقیقت زمین به‌دست‌آمده از ابر نقطه‌ای از TLS.
شکل 11. نتایج مثال برای گیت ها: ( الف ) جعبه های مرزی به دست آمده از ابر نقطه ای از DIM، ( ب ) جعبه های مرزی حقیقت زمینی به دست آمده از ابر نقطه ای از TLS.
شکل 12. تقاطع روی اتحاد.
شکل 13. نمونه ای از مجموعه داده های آموزشی برای گیت ها با IoU = 0.90; ( الف ) جعبه مرزی تولید شده از ابرهای نقطه DIM. ( ب ) جعبه مرزی حقیقت زمین از ابر نقطه TLS.
شکل 14. نمونه ای از مجموعه داده های آموزشی برای گیت ها با IoU = 0.73; ( الف ) جعبه مرزی تولید شده از ابرهای نقطه DIM. ( ب ) جعبه مرزی حقیقت زمین از ابر نقطه TLS.
شکل 15. نمونه ای از مجموعه داده های آموزشی برای قطب های کششی با IoU = 0.94. ( الف ) جعبه مرزی تولید شده از ابرهای نقطه DIM. ( ب ) جعبه مرزی حقیقت زمین از ابر نقطه TLS.
شکل 16. نمونه ای از مجموعه داده های آموزشی برای قطب های کششی با IoU = 0.48; ( الف ) جعبه مرزی ایجاد شده از ابرهای نقطه DIM. ( ب ) جعبه مرزی حقیقت زمین از ابر نقطه TLS.
شکل 17. نمونه ای از مقایسه جعبه های مرزی برای دروازه ها که با استفاده از تولید خودکار از روی زمین حقیقت برای کل تصویر به دست آمده است. از بالا، مقادیر IoU: 0.9935، 0.9698، 0.9629.
شکل 18. نمونه ای از مقایسه جعبه های مرزی برای قطب های کششی به دست آمده با استفاده از تولید خودکار از حقیقت زمین برای کل تصویر. از بالا، مقادیر IoU: 0.9748، 0.9116، 0.9675، 0.7411، 0.8496.

بدون دیدگاه

دیدگاهتان را بنویسید