خلاصه

تعداد فزاینده تصاویر هوایی عمودی زمین فضایی در مقیاس متر و در دسترس و نیاز به پروژه OpenStreetMap (OSM) برای به روز رسانی مداوم، فرصت استفاده از اولی را برای کمک به دومی، به عنوان مثال، با استفاده از آخرین داده های سنجش از دور در ترکیبی با روش های پیشرفته بینایی کامپیوتری برای کمک به جامعه OSM در کار برچسب زدن. این مقاله پیشرفت ما را در استفاده از شبکه های عصبی مصنوعی (ANN) برای تشخیص تغییر داده های OSM برای به روز رسانی نقشه گزارش می کند. علاوه بر این، هدف ما شناسایی مناطق جغرافیایی است که نقشه‌برداران باید روی تکمیل مجموعه داده جهانی OSM تمرکز کنند. رویکرد ما از لحاظ فنی توسط پلتفرم داده های مکانی بزرگ، مخزن و خدمات یکپارچه تجزیه و تحلیل فیزیکی (PAIRS) پشتیبانی می شود.
مجوز مجموعه داده: ODbL

کلید واژه ها:

جمع آوری داده های OpenStreetMap ; سنجش از دور ؛ تشخیص تغییرات جغرافیایی ; تقسیم بندی تصویر ؛ شبکه های عصبی مصنوعی ; پایگاه داده های بزرگ جغرافیایی

1. معرفی

طبیعی است که بپرسیم چگونه می توان از حجم فزاینده اطلاعات مکانی-زمانی آزادانه موجود، مانند تصاویر هوایی از برنامه ملی تصویربرداری کشاورزی (NAIP)، برای حمایت و راهنمایی نقشه‌برداران OpenStreetMap (OSM) در کارشان استفاده کرد. هدف این مقاله ایجاد راهنمایی بصری برای نقشه‌برداران OSM [ 1 ] است تا از تلاش‌های برچسب‌گذاری آن‌ها با شناسایی برنامه‌ای مناطق مورد علاقه که در آن OSM احتمالاً به به‌روزرسانی نیاز دارد، پشتیبانی کند.
رویکرد مشخص شده مبتنی بر ترجمه داده های سنجش از دور، به ویژه تصاویر هوایی عمودی، به OSM های تخمینی برای مناطق موجود در کاشی های تصویر است. این مرحله اول از یک تکنیک ترجمه تصویر به تصویر به خوبی در حوزه یادگیری عمیق استفاده می کند. در مرحله بعدی، OSM تخمین زده شده با نقشه فعلی مقایسه می‌شود تا یک «نقشه حرارتی» تولید شود، که مصنوعات و ساختارهایی را برجسته می‌کند که نقشه‌برداران را در مورد مکان‌هایی که نیاز به به‌روزرسانی در OSM فعلی دارند، هشدار می‌دهد. خروجی کمکی با سرعت کامپیوتر برای کار برچسب زدن داوطلبان OSM فراهم می کند.

1.1. تولید داده OpenStreetMap با کمک شبکه های عصبی مصنوعی

OpenStreetMap یک تلاش مبتنی بر داده های باز و جامعه محور برای پیوستن به داوطلبان به منظور ترسیم نقشه جهان است. این پلت فرمی را برای برچسب گذاری دستی مصنوعات طبیعی و زیرساخت های انسانی مانند ساختمان ها و جاده ها فراهم می کند. برچسب‌گذاری عمدتاً یک فرآیند دستی است که از طریق یک ابزار آنلاین انجام می‌شود که امکان ارسال تعاریف مصنوع و مختصات سیستم موقعیت‌یابی جهانی (GPS) آن‌ها را در بالای تصاویر ماهواره‌ای ارجاع‌شده جغرافیایی فراهم می‌کند [ 2 ].
با توجه به رشد حجم داده ها در OSM و همچنین تعداد مصنوعات و ساختارهایی که باید نقشه برداری شوند، حفظ پوشش جهانی سازگار با این فرآیند دستی دشوار است. در ابتدای سال 2018، فایل تاریخچه زبان نشانه گذاری توسعه پذیر OSM (XML) فشرده 0.1 ترابایت (TB) (2 ترابایت غیرفشرده) بود. پنج سال قبل، داده های تاریخی کمتر از نصف بود، حدود 40 گیگابایت (گیگابایت) فشرده. پشت محاسبات پاکت نشان می دهد که تلاش برای ایجاد و به روز رسانی برچسب ها انجام شده است:

با فرض اینکه یک عضو جامعه OSM یک رکورد داده برداری جدید (گره ها، راه ها و برچسب ها در اصطلاح OSM) به ترتیب ده ها کیلوبایت (KB) در دقیقه اضافه کند، نسبت زمان سرمایه گذاری شده به زمان واقعی می گوید:

=تخمین زدهزمانسرمایه گذاری کردتوسطیکیOSMنقشه برداربهبرچسبهمهداده هاجمعزمانبهجمع آوری کنیدهمهOSMداده ها=فشرده شده استOSMداده هااندازه·رفع فشارعامل/(نقشه برداربرچسبسرعتبیتنرخ)جمعزمانبهجمع آوری کنیدهمهOSMداده ها=60·106کب·20/(20کب/60س)5·365·24·60·60س∼106/(4·104)∼25.
بنابراین، تقریباً 20 تا 30 نقشه‌بردار باید شبانه روزی کار کنند تا برچسب‌های OSM تولید کنند. این سؤال را مطرح می‌کند که آیا می‌توان این فرآیند را خودکار کرد و یک نقشه برچسب‌دار از تصاویر ارجاع‌شده جغرافیایی ایجاد کرد.

1.2. رویکردی به تولید OSM بر اساس یادگیری عمیق

یکی از روش‌های تولید نقشه‌ها از تصاویر ارجاع‌شده جغرافیایی این است که مشکل را به‌عنوان یک فرآیند دو مرحله‌ای در نظر بگیریم که در آن، بخش‌بندی پیکسلی قبل از گروه‌بندی پیکسل‌ها در موجودیت‌های برداری مانند خطوط کلی ساختمان یا شبکه‌های جاده انجام می‌شود. رویکردهای مدرن برای مشکل تقسیم‌بندی معمولاً از نوعی معماری رمزگذار-رمزگشا استفاده می‌کنند که در ANN گنجانده شده است. این تکنیک‌ها از یک رمزگذار برای کاهش مقیاس و یک رمزگشا و سپس یک تصویر را ارتقا می‌دهند. نمونه هایی از این گونه معماری ها Mask R-CNN [ 3 ]، SegNet [ 4 ، 5 ]، Pix2Pix [ 6 ، 7 ] و U-Net [ 8 ] هستند. برای آغازگر این معماری ها به پیوست A مراجعه کنید .
مشخص می شود که تقسیم بندی ممکن است به عنوان یک وظیفه نگاشت تصویر به تصویر عمومی فرموله شود. این رویکرد در این کار پیاده سازی و بررسی شده است. به طور خاص، استفاده از یک طرح عددی بهینه‌سازی نقطه زینی این به عنوان مسئله حداقلی نیز شناخته می‌شود [ 9 ]. برای جزئیات با توجه به زمینه روش آموزش CycleGAN، به ضمیمه A و [ 10 ] مراجعه کنید. CycleGAN [ 11 ، 12 ] – سیستمی از شبکه های متخاصم مولد دوره ای آموزش دیده (GAN)، به طور دقیق- موفق به ایجاد یک نقشه برداری بین دو مجموعه از تصاویر، حتی بدون نیاز به هیچ گونه مطابقت پیکسل به پیکسل از جفت تصاویر مجموعه ها. در میان دیگران، یک توصیف بصری از روش در ارائه شده استبخش 2.3 .

1.3. کار مرتبط

چالش شناسایی زیرساخت های انسانی از تصاویر هوایی عمودی در سال های اخیر توجه فزاینده ای را به خود جلب کرده است. تحقیقات در این زمینه پیشرفت کرده است، به عنوان مثال، در تشخیص ساختمان [ 13 ، 14 ، 15 ]، طبقه بندی کاربری زمین [ 16 ، 17 ، 18 ، 19 ]، و شناسایی شبکه راه [ 20 ، 21 ، 22 ، 23 ، 24 ، 25 ، 26 ، 27]. از جمله، این رویکردها در داده های مورد استفاده متفاوت هستند. در حالی که چندین نشریه که قبلاً ذکر شده است، به طور مستقیم طرح کلی یک شبکه جاده را از روی تصاویر تخمین می زنند، برخی دیگر از داده های GPS یا مسیرهای GPS استفاده می کنند. با بازگشت به مشکل کلی تولید نقشه، منابع [ 28 ، 29 ، 30 ، 31 ] از نظر مفهومی به رویکرد ما در ترجمه تصویر به تصویر با CycleGAN نزدیک هستند. مجموعه ای از منابع ادبی توسط جامعه OSM در ویکی متشکل از آثار مختلف یادگیری ماشین مربوط به پروژه OSM نگهداری می شود [ 32 ].

1.4. مشارکت ها

این مقاله پیشرفت ما را در استفاده از تکنیک های یادگیری عمیق برای تولید ویژگی های OSM گزارش می دهد. به طور خاص، ما بر ساختمان ها و زیرساخت های جاده ای تمرکز می کنیم. بخش 2.2 جزئیاتی را در مورد مدیریت تصاویر مکانی با استفاده از پایگاه داده IBM Pairs ارائه می دهد. بقیه بخش 2 به طراحی، آموزش و استنتاج ANN می پردازد. مجموعه آزمایش‌هایی که در بخش 3 توضیح داده شده است، اساس تحلیل شهودی و کمی پتانسیل و موانع اجرای یک رویکرد یادگیری عمیق برای تولید OSM را تشکیل می‌دهد. بازرسی بصری داده‌های ما برای بررسی جنبه‌های ترجمه تصویر به تصویر در زمینه تشخیص تغییر داده‌های OSM از تصاویر هوایی عمودی در بخش 4 استفاده می‌شود.. به عنوان مواد تکمیلی، ضمیمه A یک آغازگر فنی در مورد یادگیری عمیق در زمینه رویکرد خاص ما ارائه می دهد.
سهم این مطالعه به شرح زیر خلاصه می شود:
  • ما کاربرد یک CycleGAN اصلاح‌شده را با مکانیزم توجه آموزش‌دیده بر روی تصاویر هوایی عمودی NAIP و کاشی‌های شطرنجی OSM نشان می‌دهیم.
  • ما دقت تشخیص خانه را بر اساس رویکرد بالا کمیت می‌کنیم و آن را با معماری شبکه تشخیص خانه پیشرفته (U-Net) از ادبیات سنجش از دور مقایسه می‌کنیم.
  • ما استخراج یک نقشه حرارتی از پلتفرم بزرگ داده های جغرافیایی IBM Pairs را مثال می زنیم که کاشی های شطرنجی OSM و نقشه های تولید شده توسط CycleGAN اصلاح شده را ذخیره می کند. به این ترتیب، ما با موفقیت مناطق جغرافیایی را شناسایی می‌کنیم که نقشه‌برداران OSM باید نیروی کار خود را متمرکز کنند.
  • ما درس های آموخته شده را در جایی ارائه می دهیم که رویکرد ما به تحقیقات بیشتر نیاز دارد. در زمینه کاشی های نقشه OSM که رنگ های مختلفی را به سلسله مراتب مختلف جاده ها اختصاص می دهد، ما درون یابی رنگ انجام شده توسط معماری CycleGAN اصلاح شده را بررسی می کنیم.

2. مواد و روشها

تشخیص خودکار مصنوعات انسانی با استفاده از شبکه های عصبی مصنوعی مستلزم ذخیره سازی ساختاریافته و پرس و جو از تصاویر هوایی با وضوح بالا است. بخش 2.2 ، و همچنین مدیریت کارآمد خروجی های میانی فرآیند آموزش. کار ما از مخزن تصویر سنجش از راه دور PAIRS برای این کار استفاده می کند. اصول ذخیره سازی و بازیابی تصویر در Pairs بخش 2.1 را پوشش می دهد . بحث کافی ارائه شده است، و خواننده تشویق می شود تا از موتور جفت از طریق رابط کاربری عمومی آن [ 33 ] برای کشف داده های مورد استفاده در این مقاله استفاده کند. در نهایت، بخش 2.3 طرح انتخاب شده برای ANN مورد استفاده برای ارائه نتایج و بینش بخش 3 و بخش 4 را ارائه می دهد..

2.1. پلتفرم داده های جغرافیایی مقیاس پذیر، پردازش داده ها، و جذب

مخزن Pairs [ 34 ، 35 ، 36 ] برای جذب، نگهداری، ذخیره و ایجاد داده های قابل جستجو با نمایه سازی جغرافیایی-زمانی برای بسیاری از انواع تحلیل ها در نظر گرفته شده است. Pairs در دسته پایگاه‌های داده قرار می‌گیرد که به صراحت برای بهینه‌سازی سازمان داده‌های جغرافیایی-مکانی توسعه یافته‌اند [ 37 ، 38 ، 39 ]. کاربردهای ساخته شده بر روی جفت ها از سنجش از دور برای باستان شناسی [ 40 ] و مدیریت پوشش گیاهی [ 41 ] تا مدیریت و نمایه سازی داده های نجومی [ 42 ] را شامل می شود. Pairs یک کاتالوگ آنلاین از تصاویر را برای بازیابی در زمان واقعی با استفاده از معماری مبتنی بر Apache HBase [ 43 ] نگهداری می کند.] به عنوان یک فروشگاه پشتیبان.
نقطه قوت اصلی این پلتفرم توانایی مقیاس‌بندی، نمایش و ارجاع تصاویر با وضوح پیکسلی متفاوت بر روی یک سیستم مختصات فضایی مشترک است. همانطور که در بالا ذکر شد، تصاویر از منابع، سطوح وضوح و پیش‌بینی‌های مکانی متعددی به دست می‌آیند. یکی از عملکردهای کلیدی فاز دریافت داده‌های جفت، مقیاس مجدد و نمایش تصاویر شطرنجی از همه منابع بر روی یک سیستم مختصات مشترک مبتنی بر سیستم مرجع مختصات EPSG:4326/WGS 84 [ 44 ، 45 ] است. سیستم مختصات Pairs داخلی از مجموعه ای از شبکه های تودرتو و سلسله مراتبی برای تراز کردن تصاویر بر اساس وضوح آنها استفاده می کند. این کار به شرح زیر است: Pairs وضوح سطح 29 را دقیقاً یک پیکسل مربع تعریف می کند 10-6درجه × 10-6درجه در طول و عرض جغرافیایی. سطوح وضوح با فاکتورهای دو در طول و عرض جغرافیایی در هر مرحله افزایش یا کاهش می یابد به طوری که سطح پیکسل به طور درجه دوم کاهش یا افزایش می یابد. سطح 28 پیکسل 2 است ×10-6درجه × 2 ×10-6درجه، و غیره. سطح جفت 26 تقریباً با وضوح 1 × 1 متر در استوا مطابقت دارد – این همچنین می تواند به عنوان یک درخت چهارگانه در نظر گرفته شود [ 46 ].
به عنوان مثال، در حین دریافت یک کاشی تصویر ماهواره‌ای خام تا سطح مشخص شده 23، خط لوله انتقال تغییرات تصویر لازم را برای تغییر مقیاس پیکسل‌های اصلی به اندازه 64 انجام می‌دهد. ×10-6درجه × 64 ×10-6درجه به جای ذخیره پیکسل های مجزا در هر ردیف از پایگاه داده، تصویر تبدیل شده به آرایه ای از 32 × 32 پیکسل به نام “سلول” تقسیم می شود. سلول در HBase با استفاده از یک کلید ردیف بر اساس طول و عرض جغرافیایی گوشه سمت چپ پایین سلول در سطح وضوح سلول ذخیره می شود. یک مهر زمانی از زمان به دست آوردن داده ها به کلید اضافه می شود. سلول حداقل واحد آدرس پذیر ذخیره سازی تصویر در طول پرس و جو است.
این سیستم ذخیره‌سازی تصاویر تراز و مقیاس‌شده در جلو، خط لوله جذب را با تبدیل‌های تصویر فشرده CPU بارگذاری می‌کند، اما برای عملکرد در هنگام بازیابی و تجزیه و تحلیل مشترک تصاویر شطرنجی از منابع داده‌های متعدد، بهینه شده است. اندازه رایج CRS و پیکسل استخراج و کار با تصاویر از منابع و وضوح های مختلف را بسیار آسان می کند. به طور خاص، این مفهوم پیکسل ها را در فضا برای مصرف آماده توسط واحدهای پردازش تصویر مانند شبکه های عصبی کانولوشن تراز می کند.
در نهایت، Pairs به ​​مجموعه‌ای از تصاویر به‌دست‌آمده در زمان‌های مختلف از یک منبع، باند، و سطح به‌عنوان «لایه داده» اشاره دارد. لایه داده در رابط کاربری Pairs به ​​عنوان شناسه لایه شماره شش رقمی در معرض دید قرار می گیرد. مجموعه ای از لایه های داده “مجموعه داده” نامیده می شود. در ادامه این مقاله، شناسه لایه تصاویر استفاده شده را ارائه می دهیم.

2.2. منابع اطلاعات

برای دهه‌ها، دولت و سازمان‌های فضایی مجموعه فزاینده‌ای از داده‌های مکانی را در دسترس قرار داده‌اند. با این حال، وضوح فضایی تصاویر ماهواره‌ای غیردفاعی هنوز به مقیاس یک متری نرسیده است. تصاویر چند طیفی با وضوح پیکسلی ده‌ها متر در سطح جهانی توسط ماهواره‌های آژانس فضایی اروپا (ESA) و سازمان زمین‌شناسی ایالات متحده (USGS) / سازمان ملی هوانوردی و فضایی (NASA) به صورت هفتگی جمع‌آوری شده است. به عنوان مثال، ماموریت های Sentinel-2 [ 47 ] و Landsat 8 [ 48 ] به ترتیب. شکل 1 جدول زمانی تاریخی قدرت تفکیک فضایی ماهواره ها را نشان می دهد که تصاویر هوایی عمودی را در مقیاس جهانی تولید می کنند [ 49 , 50 ,51 ]. اعمال برونیابی نمایی خشن ( تی∼-ورود به سیستمr.)، ما انتظار نداریم که داده های رویکرد ما حداقل برای دو دهه دیگر در سراسر جهان در دسترس باشد.
با این حال، همانطور که برنامه NAIP نشان می دهد (به بخش 2.2.1 رجوع کنید )، برنامه های ملی و ایالتی یا شهرستانی آزادانه داده های معادل را بر اساس هر کشور در حوزه عمومی منتشر می کنند، به طوری که رویکردی که در اینجا طرح می کنیم امروزه به یک گزینه تبدیل می شود. فراتر از تصاویر ماهواره ای، وجود دارد، به عنوان مثال، تشخیص نور و محدوده (LiDAR) [ 52 ، 53 ] و تشخیص و برد رادیویی (رادار) [ 54 ، 55 ]، فقط به نام چند منبع دیگر. در واقع، LiDAR داده هایی را تا مقیاس سانتی متر فراهم می کند و می تواند به عنوان منبع دیگری از اطلاعات برای اتوماسیون تولید نقشه OSM عمل کند.

2.2.1. تصاویر هوایی NAIP

از سال 2014، وزارت کشاورزی ایالات متحده (USDA) تصاویر چند طیفی از بالا به پایین [ 56 ] را در چهار کانال طیفی: نزدیک به فروسرخ، قرمز، سبز و آبی از طریق برنامه ملی تصویربرداری کشاورزی (NAIP) ارائه کرده است [ 57 ] ]. داده ها در طول دو سال برای طیف گسترده ای از پوشش در ایالات متحده به هم پیوسته (CONUS) با وضوح مکانی متفاوت از نیم متر تا حدود دو متر جمع آوری می شوند. آزمایش‌های ما بر اساس داده‌های موجود برای آستین، TX، و دالاس، TX، در سال 2016 بود. ما از کانال مادون قرمز نزدیک، که مخصوصاً برای زمین‌های کشاورزی مرتبط است، استفاده نکردیم. به طور خاص، فهرست 1 به این لایه های داده شطرنجی جفت از نظر شناسه لایه جفت آنها ارجاع می دهد: 49238 ، 49239و 49240 به ترتیب برای کانال قرمز، سبز و آبی تصاویر هوایی.
2.2.2. کاشی های نقشه Rasterized OSM
داده های شطرنجی OSM بر اساس سرور کاشی نقشه OSM [ 58 ] است که نقشه ها را بدون متن تولید می کند. کاشی های نقشه فقط هر سه ماه یک بار به روز می شوند. در واقع، هنگامی که نوبت به تولید می‌رسد، به عنوان مثال، یک نقشه حرارتی به‌موقع همانطور که در بخش 3.2 مورد بحث قرار گرفت، بسیار مهم است که پردازش را بر اساس یک سرور کاشی که اغلب به‌روزرسانی می‌شود، با به‌روزرسانی روزانه، مانند آنچه در مورد سرور کاشی انجام می‌شود، قرار دهیم [ 59 ]. ]. یک بار دیگر، شناسه های لایه جفت را برای مرجع فهرست می کنیم: آنها به ترتیب 49842 ، 49841 و 49840 برای کانال های طیفی قرمز، سبز و آبی هستند. مانند قبل، از وضوح جفت سطح 26 استفاده شد.
2.2.3. انتقال داده به جفت برای NAIP و OSM

شکل 2 نمودار جریانی را در مورد نحوه ادغام پلت فرم داده IBM Pairs در پردازش داده برای روش مورد بحث در بخش 2.3 ارائه می‌کند : تصاویر هوایی عمودی NAIP و نقشه‌های OSM کاشی‌شده وارد موتور جذب جفت‌ها می‌شوند که داده‌های شطرنجی را مدیریت می‌کند و به‌صورت مکانی-زمانی فهرست‌بندی می‌کند. به EPSG:4326/WGS 84 CRS. در سناریوی خود، ما استفاده از وضوح جفت سطح 26 را برای تصاویر NAIP و نقشه های OSM انتخاب کردیم. بنابراین، یک تناظر مستقیم یک به یک برای تمام پیکسل های فضایی همه لایه های شطرنجی درگیر وجود دارد. به طور خاص، برای هر پچ تصویر 512 × 512 NAIP قرمز سبز آبی (RGB) از جفت، یک تصویر 512 × 512 RGB مربوطه را به عنوان کاشی نقشه OSM برای آموزش ANN بازیابی کردیم. سطح وضوح L ، طبق تعریف، به این معناست:

جفت فضایی وضوح(جفت وضوح مرحلهL)=229-L/106

درجه طول یا عرض جغرافیایی، یعنی با L=26، ما داریم 23× 10-6= 0.000008 درجه.

پس از بررسی و نمایه‌سازی جغرافیایی داده‌های OSM و NAIP شطرنجی‌شده با جفت‌ها برای آموزش و آزمایش، ما به‌طور تصادفی جفت‌هایی از تصاویر OSM و NAIP RGB که از نظر جغرافیایی منطبق بودند با وضوح ۵۱۲×۵۱۲ پیکسل با وضوح فضایی ۱ متر بازیابی کردیم. برای دو شهر آستین و دالاس در تگزاس، داده‌های به‌دست‌آمده فیلتر شدند تا میانگین تراکم ساختمانی بیش از هزار در هر کیلومتر مربع را شامل شود. از این منظر، کار ما محدود به مناطق پرجمعیت بود. هنگامی که آموزش ANN همگرا شد، داده‌های NAIP از جفت‌ها بیرون کشیده شد و نقشه استنباط‌شده را می‌توان به عنوان لایه‌های جداگانه دریافت کرد – در مورد ما مجموعاً 3 لایه، به ترتیب برای هر کانال RGB با نوع داده بایت.

در حالی که نقشه تولید شده آپلود می شود، سیستم می تواند به طور خودکار هرمی از پیکسل های انبوه فضایی را مطابق با ساختار QuadTree پیکسل های لایه شطرنجی تو در تو بسازد. بنابراین، لایه های جفت به طور خودکار با سطح تفکیک فضایی پایین تر تولید می شوند L<26به عنوان لایه های نمای کلی دانه درشت عمل می کند. همان فرآیند ساخت هرم نمای کلی را می توان پس از جستجوی کد جداگانه داده ها با کمک یک تابع تعریف شده توسط کاربر جفت (UDF) آغاز کرد و نقشه حرارتی تشخیص تغییر را با وضوح فضایی بالا در سطح 26 ایجاد کرد. فهرست 1. سپس، یک فرآیند تولید لایه اجمالی بر اساس جمع مقدار پیکسل، منجر به یک نقشه حرارتی (ر.ک. شکل 3 f) کوچک در اندازه داده می شود. به این ترتیب، مقدار داده‌هایی که باید از جفت‌ها برای نقشه حرارتی تشخیص تغییر پرس و جو شوند، به طور قابل توجهی کاهش می‌یابد.

لیست  1.

جفت‌ها بار JSON را درخواست می‌کنند تا داده‌های با وضوح بالا را به‌عنوان پایه‌ای برای نقشه حرارتی تشخیص تغییر ایجاد کنند. توجه داشته باشید که ما به طور مصنوعی رشته تابع تعریف شده توسط کاربر (UDF) را در زیر عبارت کلید شکستیم . این نحو توسط استاندارد JSON تعریف نشده است، اما به دلایل خوانایی مناسب است. آموزش معرفی دستور JSON پرس و جو جفت را می توان به صورت آنلاین پیدا کرد [66].Ijgi 09 00427 i001

2.3. روش یادگیری عمیق

برخلاف اکثر رویکردهای ذکر شده در پایان بخش 1.3 ، ما با استفاده از یک دیدگاه «جهانی» از ترجمه تصویر به تصویر، یعنی: تصاویر ارتو، به مشکل استخراج داده‌های OSM-مانند ساختمان‌ها و جاده‌ها از تصاویر هوایی- می‌پردازیم. (یعنی عکس‌های هوایی) که تکه‌های فضایی حدود یک چهارم کیلومتر مربع را پوشش می‌دهند، توسط شبکه G رمزگذار-رمزگشای یادگیری عمیق (ED) تبدیل می‌شوند تا نقشه‌های شطرنجی بدون برچسب متنی تولید کنند. همانطور که قبلاً ذکر شد، ضمیمه A یک آغازگر خاص برای خوانندگانی که با موضوع یادگیری عمیق در زمینه کار ما آشنا نیستند ارائه می دهد.
این واقعیت که ساختمان‌ها، جاده‌ها و تقاطع‌ها معمولاً از نظر اندازه کوچک‌تر در مقایسه با تصویر هوایی هستند، مفهوم ما از “جهانی” را تعریف می‌کند. لایه های کانولوشن G به طور مکرر اطلاعات پیکسل مجاور را با هم مخلوط می کنند به طوری که برچسب تقسیم بندی نهایی در هر پیکسل کاشی نقشه OSM تولید شده از تمام مقادیر پیکسل تصویر ورودی مشتق می شود. به این ترتیب، از نظر مفهومی، رنگ پیکسل کاشی شطرنجی OSM تولید شده توسط G از، به عنوان مثال، یک ساختمان توسط بافت آن، به عنوان مثال، ساختمان های اطراف و زیرساخت شبکه جاده ها و در صورت وجود، عناصر طبیعی مانند درختان، رودخانه ها و غیره تعیین می شود. این درمان فراتر از تجزیه و تحلیل است، به عنوان مثال، شکل، بافت، و رنگ سقف یک ساختمان یا سطح یک خیابان که باید طبقه بندی شود.
به طور خاص، برای کار ما، G از یک شبکه مولد معماری CycleGAN سرچشمه می گیرد. نزدیکترین تکنیکی که ما در زمینه داده های OSM از آن آگاه هستیم توسط [ 28 ، 29 ، 30 ، 31 ] ارائه شد. به عنوان مثال، در [ 28 ، 29 ]، نویسندگان یک شبکه ED F را برای بازسازی پیکسل های از دست رفته حذف شده توسط یک شبکه ED نوع خصمانه D از قبل آموزش دادند. در مرحله دوم، F در مورد تکلیف قطعه‌بندی تصویر ارتو که در آن برچسب‌های سطح پیکسل وجود داشت، آموزش دید.
به طور غیررسمی و برای نشان دادن روش آموزش CycleGAN برای خوانندگان خارج از حوزه شبکه های عصبی مصنوعی: یک کلاس کارشناسی ارشد در نقشه برداری نقشه برداری با یک مدرس و 4 دانش آموز مربوط به چهار شبکه عصبی مصنوعی (زیر) را در نظر بگیرید. این دوره به گونه ای سازماندهی شده است که دانش آموز 1 تصاویر هوایی عمودی می گیرد و هدف آن یادگیری نحوه ترسیم نقشه ها از آنها است. دانش آموز 2 نقشه های واقعی (یعنی معتبر) را از استاد دریافت می کند تا یاد بگیرد چگونه آنها را از نقشه های ایجاد شده توسط دانش آموز 1 متمایز کند در حالی که در همان زمان دانش آموز 1 می خواهد دانش آموز 2 را فریب دهد. به روشی مشابه، دانش آموز 3 نقشه ها را می گیرد. برای ایجاد تصاویر هوایی عمودی قابل قبول که توسط دانش آموز 4 به چالش کشیده می شود، که تصاویر هوایی عمودی واقعی را از استاد دریافت می کند تا با آنها مقایسه کند.
مدرس یک تصویر هوایی عمودی را به دانش‌آموز 1 ارائه می‌کند، او نقشه‌ای از آن ایجاد می‌کند، که سپس به دانش‌آموز 3 ارسال می‌شود. به نوبه خود، دانش‌آموز 3 یک تصویر هوایی عمودی مصنوعی تولید می‌کند و آن را به مدرس می‌دهد. استاد این تصویر را با مرجع مقایسه می کند. برعکس، مدرس همچنین نقشه هایی دارد که ابتدا در اختیار دانش آموز 3 قرار می دهد تا از دانش آموز 1 نقشه تولید شده را برای مقایسه دریافت کند.
چندین جنبه کلیدی را می توان از مثال گویا استنباط کرد که برای رویکرد ما در ترجمه تصویر به تصویر در زمینه تولید کاشی نقشه OSM ضروری است:
  • وقتی آموزش کامل شد، از ANN مربوط به دانشجو 1 استفاده می کنیم تا کاشی های نقشه شطرنجی OSM را از تصاویر هوایی عمودی NAIP استنتاج کنیم.
  • در طول کل آموزش، مدرس نیازی به در دسترس بودن جفت تصویر هوایی عمودی و نقشه نداشت. از آنجایی که OSM بر مشارکت های داوطلبانه متکی است و نقشه برداری از کل کره زمین یک کار برچسب گذاری دستی گسترده است و نیازی به در دسترس بودن جفت تصاویر هوایی عمودی و نقشه ندارد، امکان استفاده از نقشه های نادرست یا ناقص را در زمان آموزش فراهم می کند.
  • برای استفاده از این واقعیت که در سناریوی خود، ما واقعاً یک جفت تصویر NAIP و کاشی های نقشه OSM داریم، به استاد اجازه می دهیم هنگام تعیین تفاوت تصاویر NAIP توجه خود را بر روی زیرساخت های انسانی (مانند جاده ها و ساختمان ها) متمرکز کند. این انحراف از رویه CycleGAN همان چیزی است که ما در بخش 3.1 از آن به عنوان fw-CycleGAN (ویژگی وزن CycleGAN) یاد می کنیم .
ما fw-CycleGAN را از ابتدا آموزش دادیم ( پیوست A جزئیاتی در مورد معماری دارد) و یک U-Net برای ارجاع به داده های گرفته شده از آستین. برای تعیین کمیت دقت مدل، روی نسبت R منفی کاذب (FN) در مقابل مثبت واقعی (TP) با توجه به تشخیص ساختمان تمرکز کردیم ( شکل 3 را رجوع کنید).). یعنی تعداد ساختمان های از دست رفته را شمردیم و با توجه به برچسب های داده OSM نسبت به ساختمان هایی که به درستی شناسایی شده بودند قرار دادیم. از آنجایی که OSM یک پروژه جمع‌سپاری است، از شمارش موارد مثبت کاذب (FP) خودداری کردیم، به عنوان مثال، خانه‌ای را که توسط شبکه آموزش دیده شناسایی شده بود و در OSM نشان داده نشده بود به عنوان نشانه‌ای از عملکرد پایین مدل در نظر نگرفتیم. در مقابل، ما از چنین موارد مثبت کاذبی استفاده کردیم تا به عنوان مبنایی برای تولید نقشه حرارتی استفاده شود. به منظور شناسایی موارد مثبت واقعی و منفی کاذب، ما یک نقشه شبیه OSM را با کمک ANN آموزش دیده استنباط کردیم که تصاویر NAIP را به عنوان ورودی دریافت می کند. سپس نتیجه را با داده‌های OSM مربوط به منطقه جغرافیایی مقایسه کردیم. ما تقاطع نسبت روی اتحادیه (IoU) [ 60 ] را با مقدار آستانه ای در نظر گرفتیم0.3برای شناسایی یک تطابق (IoU >0.3) یا یک خانم (IoU <0.3). انتخاب ما از آستانه نسبتاً پایین IoU باعث پوشاندن جزئی خانه های مسکونی به دلیل پوشش گیاهی، به ویژه در محله های حومه دو شهر شد.

2.4. کد کامپیوتر

کد آموزش U-Net و CycleGAN در PyTorch [ 61 ] پیاده سازی شد. مخازن منبع باز مانند [ 62 ، 63 ] به ترتیب وجود دارند. وزن ویژگی به راحتی با اصلاح تابع از دست دادن تمرین از طریق یک عبارت جریمه اضافی بر اساس ماسک ویژگی در شکل 3 d گنجانده شد. کاشی های نقشه شطرنجی شده OSM از [ 64 ] تولید شدند. یک کتابخانه Python که API کوئری جفت را می‌پیچد، منبع باز در GitHub [ 65 ] با یک آموزش دقیق [ 66 ] و دسترسی آکادمیک رایگان [ 33 ] است.

3. آزمایش های عددی

بخش‌های زیر جزئیات آزمایش‌هایی را که با توجه به داده‌ها و روش‌شناسی معرفی‌شده در بخش 2 انجام دادیم، ارائه می‌کند .

3.1. CycleGAN دارای وزن ویژه برای تولید نقشه به سبک OSM

استفاده از یک طرح آموزشی CycleGAN که برای تصاویر بدون جفت ایجاد شده است، دارای مزایا و معایبی است. از یک طرف، این طرح مستقل از ارجاع جغرافیایی دقیق نقشه OSM است. در واقع، حتی به هیچ گونه ارجاع جغرافیایی نیز نیازی ندارد، و در مقابل برچسب های OSM غیردقیق، کاملاً تحمل خطا دارد. با این حال، همانطور که با آزمایش‌های خود تأیید کردیم، آموزش روی جفت‌های تصویر هوایی ارجاع‌شده جغرافیایی و نقشه‌های شطرنجی OSM مربوطه، مطابقت پیکسل به پیکسل را ثبت کرد. علاوه بر این، روش آموزشی ما دارای ویژگی‌های آگنوستیک بود زیرا زمینه کلی صحنه را در بر می‌گرفت، که البته به اندازه ورودی تصویر هوایی بستگی داشت. از سوی دیگر، آموزش موثر مدل CycleGAN به دلیل چالش‌هایی که در اجرای عملی آن وجود داشت، یک کار پیچیده بود. به خصوص،67 ]. برای مقابله با این، ما یک جزء ویژگی وزن به تابع از دست دادن تمرین اضافه کردیم، رجوع کنید به. پیوست A برای جزئیات، نشان دهنده معماری به عنوان fw-CycleGAN. در آزمایش‌های اولیه‌مان، هنگام آموزش CycleGAN روی داده‌های OSM بدون وزن‌دهی ویژگی، عملکرد و ناپایداری‌های پایینی را مشاهده کردیم.
در حالی که جامعه بینایی کامپیوتر مسابقات را بر روی مجموعه داده‌های استاندارد شده مانند ImageNet [ 68 ، 69 ] برگزار می‌کند، جامعه جغرافیایی SpaceNet [ 70 ، 71 ] را با چالش‌های مرتبط تأسیس کرد. یکی از مشارکت‌های برنده قبلی برای شناسایی ساختمان متکی به معماری U-Net بود که از داده‌های OSM به عنوان ورودی اضافی استفاده می‌کرد [ 72 ]. بنابراین، ما عملکرد مدل fw-CycleGAN خود را زمانی که به شناسایی خانه در برابر U-Net آموزش دیده بر روی داده‌های مشابه محدود می‌شود، ارزیابی کردیم. جزئیات در جدول 1 نشان داده شده است و به شرح زیر است.
ما کار نگاشت تصویر به تصویر را با استفاده از fw-CycleGAN خود با کاهش قوام پیکسلی با وزن ویژگی OSM آموزش دادیم. داده های آموزش و آزمایش از منطقه جغرافیایی آستین با تراکم خانه بیشتر از هزار در کیلومتر مربع به طور متوسط ​​نمونه برداری شد. علاوه بر این، آزمایش مدل بدون آموزش بیشتر بر روی نمونه‌هایی از منطقه دالاس، TX انجام شد. علاوه بر این، یک معماری U-Net وانیلی ساده بر روی وظیفه تقسیم بندی باینری آموزش داده شد “Pixel در حال ساخت؟” به عنوان مرجع برای آزمایش، ما توانایی ANN را در تشخیص خانه ها با شمارش منفی کاذب و مثبت واقعی ارزیابی کردیم. از آنجایی که آزمایش تصادفی ممکن است به منطقه ای اشاره کند که به خوبی توسط OSM برچسب گذاری نشده است، ما به صراحت موارد مثبت کاذب را در نظر نگرفتیم. با این حال،
در حالی که هر دو شبکه، U-Net و fw-CycleGAN، از نظر منفی کاذب در مقابل مثبت واقعی برای آزمایش در همان شهر قابل مقایسه بودند، انتقال مدل های آموزش دیده به یک زمینه فضایی متفاوت، منفی کاذب را نسبت به مثبت های واقعی به طور قابل توجهی بیشتر افزایش داد. U-Net در مقایسه با fw-CycleGAN، به عنوان مثال، ما توانایی (fw-)CycleGAN را در تعمیم بهتر در مقایسه با U-Net نشان دادیم. علاوه بر این، ما یک ارزیابی دستی و بصری از مثبت کاذب ANN به دلیل برچسب‌گذاری ناقص خانه OSM برای آستین انجام دادیم. با خرد کردن اعداد توسط ارزیابی انسانی، ما به تخمینی از عملکرد مدل “واقعی” رسیدیم که به طور قابل توجهی بالاتر بود زیرا مثبت کاذب به مثبت واقعی تبدیل شد.
همانطور که ذکر شد، ما استنتاج مدل خالص تصاویر هوایی انتخاب شده از دالاس را بدون آموزش اضافی انجام دادیم. همانطور که انتظار می رفت، دقت کاهش یافت، زیرا ما یک مدل را از یک منطقه جغرافیایی به منطقه دیگر منتقل کردیم: مقدار R -fw-CycleGAN از افزایش یافت 0.35به 0.60یعنی تعداد منفی های کاذب نسبت به تعداد مثبت های واقعی افزایش یافته است.
موضوع انتقال یادگیری حداقل یک دهه سابقه در ادبیات دارد [ 74 ، 75 ، 76 ] با علاقه اخیر به کاربرد سنجش از دور [ 77 ]. با انتخاب دو مثال تصادفی برای مثال، اجازه دهید کاربردهای حیاتی را ذکر کنیم: استنتاج نقشه‌های فقر از شدت نور شبانه که از تصاویر با وضوح بالا در طول روز تولید شده‌اند [ 78 ] و علاوه بر این، کاهش کمبود تصاویر رادار برچسب‌گذاری شده [ 79 ]]. موضوع تحقیق در حال انجام ما استفاده از مدل fw-CycleGAN است که در مناطق به اندازه کافی دارای برچسب OSM آموزش داده شده است تا ساختمان‌ها را به مجموعه داده آموزشی زمین‌های با پوشش کم تراکم اضافه کنیم. منطق اساسی بهبود پوشش خانه OSM در مناطقی است که پیکسل های نقشه مثبت کاذب به کارهای برچسب گذاری معلق در انتظار فعالیت نقشه نگار OSM بازمی گردد. در واقع، ما یک ارزیابی دستی و بصری (که توسط یکی از نویسندگان در یک روز پس از زایمان انجام شد) برای 100 نمونه تصویر هوایی از آستین انجام دادیم و آنها را با کاشی‌های نقشه شطرنجی OSM مربوطه و نمونه‌های تولید شده توسط fw-CycleGAN مقایسه کردیم. نتیجه در آخرین ردیف جدول 1 خلاصه شده استو به شرح زیر است: افزایش مثبت واقعی برای تشخیص خانه به دلیل تخصیص مجدد دستی مثبت کاذب، عملکرد مدل را حدود 10 تا 11 درصد از نظر فراخوان افزایش داد = (1+آر)-1. بر این اساس، امتیاز کلی F1 حدوداً افزایش یافت 0.88/0.77-1≈14%به 0.69/0.83-1≈20%.

3.2. fw-CycleGAN برای تشخیص تغییر داده های OSM

همانطور که قبلا گفته شد، fw-CycleGAN آموزش دیده می تواند برای تشخیص تغییر استفاده شود. گردش کار پردازش داده در شکل 3 نشان داده شده است . به طور خاص، با ایجاد یک نقشه RGB مانند OSM م^تصویر ( شکل 3 ج) از یک تصویر ارتوی NAIP مرتبط با زمین مرجع ( شکل 3 الف)، می‌توانیم ویژگی‌های برداری شده را از نقشه شطرنجی شده با فیلتر کردن رنگ‌های مربوطه استخراج کنیم. برای مثال، ساختمان‌ها معمولاً رنگی بودند (R,G,B) = (194,177,176) که ما از نمونه‌برداری دستی ده‌ها کاشی شطرنجی OSM در موقعیت جغرافیایی مرکز ساختمان‌های شناخته شده در تگزاس تعیین کردیم. از سوی دیگر، جاده‌ها دارای چندین کدگذاری رنگی در کاشی‌های نقشه OSM بودند که ساختار سلسله مراتبی شبکه راه را منعکس می‌کرد. یک بحث کیفی در مورد موضوع تفسیر رنگ نقشه های تولید شده مشابه OSM در بخش 4 ، به ویژه در شکل 5 دنبال می شود.
شکل 3 d، همپوشانی نقشه OSM واقعی M ( شکل 3 ب) را با نقشه OSM تولید شده کدگذاری می کند.م^( شکل 3 ج): پیکسل های سبز نشان دهنده مناطق فضایی است که نه M و نه م^دارای ویژگی های زیرساخت انسانی معتبر ویژگی‌های علامت پیکسل آبی موجود در هر دو، موارد سیاه نگاتیوهای کاذب را برجسته می‌کنند. و زرد نشان دهنده ویژگی های شناسایی شده توسط fw-CycleGAN است که در مجموعه داده OSM وجود ندارد. مورد دوم را می توان با فیلتر کردن نویز و تنظیم کرد همانطور که در شکل 3 e نشان داده شده است با رنگ زرد نشان دهنده مقدار عددی 1 و رمزگذاری بنفش تیره 0. به طور قابل‌توجهی، تعدادی از گروه‌های کوچک جدا شده از پیکسل‌ها وجود داشت که از نادرستی‌های جزئی تراز جغرافیایی-مکانی داده‌های OSM در مقابل تصاویر ماهواره‌ای NAIP ناشی می‌شوند. در واقع، تنظیمات کد کاشی نقشه شطرنجی OSM از عرض ثابتی از یک نوع جاده استفاده می‌کردند که لزوماً با وسعت مکانی متفاوت جاده‌های واقعی مطابقت نداشت. با این حال، ما این پیکسل‌ها را کنار نگذاشتیم و به صورت مکانی جمع‌آوری کردیم تا به شکل 3 f رسیدیم، جایی که رنگ تعداد پیکسل‌های مثبت کاذب را از نمودار باینری مرکزی کد می‌کند – همه در ناحیه پیکسل درشت دانه شمارش می‌شوند: سیاه نشان‌دهنده پیکسل صفر است. شمارش کنید و بالاترین تعداد پیکسل را زرد کنید.
بدیهی است که به نظر می رسد اکثر شبکه جاده ها به درستی توسط OSM برچسب گذاری شده اند. اگر جاده‌ها در OSM ناهمتراز بودند، معمولاً یک وصله خطی برجسته و گسترده ایجاد می‌شد، به عنوان مثال، در کادر حاشیه فرعی پیکسل [100،200]×[0،100]از قطعه مرکزی علاوه بر این، حباب های زرد مختلف، به عنوان مثال، [100،400]×[400،500]برچسب‌های خانه گمشده در OSM. برای خلاصه کردن یافته‌ها به صورت بصری، نقشه باینری یک متری با وضوح بالا می‌تواند بر اساس جمع‌بندی مقادیر پیکسل، درشت دانه‌بندی شود. نتیجه مربوطه در شکل 3 f نشان داده شده است.
در تولید همه نتایج فوق، پلتفرم بزرگ داده‌های جغرافیایی IBM Pairs برای نمونه‌برداری از جفت‌های تکه‌ها به صورت مقیاس‌پذیر از تصاویر هوایی عمودی NAIP و نقشه OSM شطرنجی‌شده کلیدی بود. ما روند کار را در بخش 2.4 و ضمیمه A شرح می دهیم . علاوه بر این، با جذب نقشه تولید شده م^به عنوان جفت لایه های داده شطرنجی، یک پرس و جو پیشرفته به سیستم با بار JSON ارائه شده توسط لیست 1 نقشه هایی مانند شکل 3 e را به دست می دهد.
Pairs از داده‌های بایت علامت‌دار نوع جاوا استفاده می‌کند به طوری که اعداد صحیح رنگی RGB از بازه [0,255] به [-128,127] منتقل می‌شوند . جفت‌های تابع ویژه جفت‌های IBM: nvl ( $ A، مقدار پیش‌فرض) مقدار پیکسل لایه با نام مستعار A را برمی‌گرداند – اگر در پایگاه داده وجود داشته باشد. در غیر این صورت، مقدار پیش‌فرض ریخته می‌شود تا از مدیریت پیش‌بینی نشده، به عنوان مثال، نمایش‌های غیر عددی، NaN جلوگیری شود.
علاوه بر این، توجه داشته باشید که ما از ترفندی برای جمع‌آوری تمام کاشی‌های داده NAIP جمع‌آوری‌شده در طول سال 2016 با پرس‌وجو PAIRS در حال پرواز استفاده کردیم: تجمع حداکثر زمانی حداکثر پیکسل «Max» به سادگی پیکسل‌های یک و تنها موجود را انتخاب می‌کند. برای چند روز (ناشناخته) سال 2016. داده های NAIP به صورت کاشی می آیند و به موقع ثبت می شوند تا زمانی که از آنها عکس گرفته شده است.

عنصر مرکزی پرس و جوی JSON که تابع تعریف شده توسط کاربر است توسط:

math:abs( $ مستعار - expectChannelValue) < colorValueTolerance ? returnValue : defaultValue
در بالا یک عبارت شرطی را تعریف می کند که در صورتی که مقدار پیکسل لایه با نام مستعار به مقدار مورد انتظار expectChannelValue در یک تلورانس مشخص شده توسط colorValueTolerance نزدیک باشد، برای هر پیکسل فضایی returnValue به دست می دهد . defaultValue در غیر این صورت انتخاب می شود.
اگر نتیجه متعاقباً مجدداً به جفت‌ها وارد می‌شود، رجوع کنید به. شکل 2 ، لایه‌های نمای کلی را می‌توان به‌طور خودکار تولید کرد تا مقادیر پیکسل‌ها را به‌طور مکرر با گروه‌بندی فضایی و تجمع محلی جمع‌آوری کند، به طوری که یک نقشه حرارتی دانه درشت از تشخیص تغییر می‌تواند ساخته شود. شکل 3 f.

4. نتایج و بحث

آزمایش‌های مختلفی که با fw-CycleGAN به‌عنوان مولد کاشی‌های نقشه شطرنجی‌شده OSM انجام دادیم، منجر به مشاهدات کیفی بسیاری شد که ارزش به اشتراک گذاشتن در ادامه دارد. علاوه بر این، بخشی از فعالیت تحقیقاتی آتی ما را برانگیخت تا استخراج نقشه از تصاویر هوایی را از منظر تشخیص تغییر پیش ببرد. به ویژه، مطالعات کمی بیشتر برای هدایت بهبود پی در پی دقت مدل مورد نیاز بود. علاوه بر این، هدف ما اجرای طرح‌های آموزشی توزیع‌شده [ 80 ، 81 ] بر روی پلت فرم جفت‌های IBM برای استفاده از مقدار ناهمگن و زیادی از تصاویر هوایی عمودی موجود در سطح جهانی بود. هدف ما فراتر رفتن از حجم داده‌های معیارهایی مانند SpaceNet بود. این فرصت هایی را برای اعمال نفوذ فراهم می کند، به عنوان مثال، Bing [ 82] تصاویر ماهواره‌ای ارائه شده به عنوان پس‌زمینه ویرایشگر داده‌های آنلاین OSM [ 2 ] برای راهنمایی نقشه‌برداران OSM با برچسب‌گذاری.

4.1. تشخیص ساختمان برای اضافه کردن برچسب خانه OSM

همانطور که در بخش 3 توضیح داده شد، fw-CycleGAN ما قادر به ترجمه تصاویر NAIP به نقشه های شطرنجی به سبک OSM بود که می توان از آنها ویژگی هایی مانند خانه ها و جاده ها را استخراج کرد. با اشاره به شکل 4 ، ما از این قابلیت برای استنتاج یک نقشه حرارتی دانه درشت استفاده کردیم که ممکن است به نقشه‌برداران OSM کمک کند مناطقی را که تلاش‌های برچسب‌گذاری باید تشدید شود، شناسایی کنند. با توجه به ظرفیت محدود داوطلبان، ر.ک. در معادله ( 1 )، چنین اطلاعاتی باید به برنامه ریزی به روز رسانی داده های OSM به طور موثر کمک کند، یا حداقل تخمینی از کار پیش رو ارائه دهد، که می تواند در طول زمان ردیابی شود.
در ادامه، ما بر روی سه ناحیه متمایز در بخش 3 که با حروف بزرگ رومی قرمز مشخص شده اند تمرکز می کنیم:
  • با توجه به کاشی های نقشه OSM، آشکار است که در وسط شکل، منطقه b دارای برچسب خانه های مسکونی است، در حالی که منطقه a هنوز توسط نقشه برداران OSM برچسب گذاری نشده است. با توجه به داده های NAIP از سال 2016، fw-CycleGAN قادر به شناسایی خانه ها در منطقه است به طوری که تکنیک ارائه شده در شکل 3 یک نقشه حرارتی با یک سیگنال نشانگر را نشان می دهد. بزرگی های جعلی در منطقه b ناشی از ارجاع جغرافیایی نادقیق ساختمان ها در نقشه OSM، و همچنین پوشش گیاهی بالای پشت بام ها در تصاویر NAIP هوایی است.
    با مراجعه به فهرست 1، ما مجبور بودیم تغییرات کمی در مقدار رنگ با بزرگی را در نظر بگیریم 2·1 = 2 در مورد رنگ ویژگی RGB برای ساختمانها در نقشه OSM شطرنجی M . بنابراین، رویکرد ما نسبت به آشفتگی‌های جزئی در پس‌زمینه نقشه به غیر از زمین‌های لخت ( (R,G,B) = (242,239,233) قابل تحمل شد ، رنگ شنی در منطقه a را ببینید) مانند پس‌زمینه خاکستری در منطقه b باید در نظر گرفته شود. برای. به طور مشابه، طیف وسیع تری از تحمل رنگ 2·9 = 18 برای نقشه تولید شده تنظیم شد م^که سر و صداتر بود علاوه بر این، همانطور که در شکل 5 بحث خواهیم کرد، مشاهده کردیم که fw-CycleGAN سعی کرد رنگ‌ها را به آرامی بر اساس زمینه ویژگی درون‌یابی کند.
  • fw-CycleGAN به درستی جاده ها و مسیرها را در مناطقی که OSM صرفاً نشانگر پارک/منطقه تفریحی داشت شناسایی کرد. با این حال، برای نقشه حرارتی تعریف شده توسط فهرست 1، ما تجزیه و تحلیل نقشه تولید شده را محدود کردیم م^فقط به خانه ها – به همین دلیل است که تغییر در شبکه جاده در این قسمت از تصویر توسط نقشه گرمایی منعکس نمی شود.
  • این بخش از تصویر محدودیت های رویکرد فعلی ما را نشان می دهد. در نقشه ایجاد شده، رنگ‌ها به شدت در نوسان بودند، در حالی که تکه‌های زمین به‌عنوان توده‌های آبی (آبی) یا جنگلی (سبز) مشخص شده بودند. اگر این مصنوعات نتیجه ویژگی‌های خاص در نقشه باشد که به ندرت در مجموعه داده آموزشی نشان داده شده است، تحقیقات بیشتری لازم است. ما در حال برنامه ریزی برای آموزش مجموعه داده های بسیار بزرگتر برای پاسخ به این سوال هستیم.
    یکی دیگر از چالش‌های رویکرد کنونی ما توسط منابع آبی گسترده‌تر به نمایش گذاشته شد. اگرچه در شکل 4 وجود ندارد ، ما متوجه تصویر عمودی تصویر به نقشه ANN هوایی fw-CycleGAN برای ایجاد ترکیبات پیچیده از تکه‌ها در چنین مناطقی شدیم. با این وجود، نقشه حرارتی تولید شده توسط روش ذکر شده در بخش 3.2 سیگنال واضحی ایجاد نکرد که به طور بالقوه بتواند نقشه‌برداران OSM را گمراه کند. بنابراین، هیچ هشدار کاذبی به دلیل این مصنوعات وجود نداشت. بدون در نظر گرفتن، منطقه ای که باید برچسب گذاری شود ممکن است به این شکل از دست داده شود.

4.2. تغییر سلسله مراتب جاده از درون یابی رنگ

ما اکنون تمرکز خود را به شبکه های جاده ای معطوف کرده ایم. برخلاف ساختمان ها، خیابان ها در OSM ساختار سلسله مراتبی دارند. کد مولد کاشی نقشه OSM رنگ های مختلفی را به جاده ها بر اساس موقعیت آنها در این سلسله مراتب اختصاص می دهد. شکل 5 ، نمودار مرکزی، به طور برجسته سناریوی یک تقاطع بزرگراه را با خروجی های خیابان های محلی به رنگ های آبی، سبز، زرد، نارنجی و سفید نشان می دهد.
اجازه دهید در مورد این نوع “تشخیص تغییر” در مورد درون یابی رنگ ویژگی های فرعی OSM برچسب گذاری شده با مقادیر مختلف RGB کاشی های نقشه OSM پیکسل شده مربوطه توضیح دهیم:
  • ما با تمرکز بر خروجی های دایره ای بزرگراه شروع می کنیم. همانطور که از تصویر مشخص است، fw-CycleGAN به جای تعیین یک مرز ناپیوسته، سعی کرد به تدریج از یک بزرگراه اصلی به یک خیابان محلی درون یابی کند.
  • برای آزمایش‌های ما، وزن ویژگی کاهش قوام CycleGAN به جاده‌ها و ساختمان‌ها محدود شد. بر اساس بازرسی بصری مجموعه داده آموزشی ما از شهرهای تگزاس، مشاهده کردیم که پشت بام‌ها (به ویژه ساختمان‌های تجاری) و جاده‌ها می‌توانند رنگ‌های شنی تا خاکستری مشابهی داشته باشند. این ممکن است دلیل اصلی این باشد که چرا بر اساس استنباط، رنگ قهوه‌ای معمولی برچسب‌های خانه OSM در شبکه جاده‌ها مخلوط شد، همانطور که در منطقه c به وضوح قابل مشاهده است. در واقع، به نظر می رسید که مناطق a و b از چنین فرضیه ای حمایت می کنند. به طور خاص، جاده هایی که به یک منطقه پارکینگ مسطح، گسترده و شنی منتهی می شوند (مانند منطقه a) ممکن است به اشتباه به عنوان پشت بام های مسطح، به عنوان مثال، یک مرکز خرید یا انبار، مانند منطقه IIIa و IIId تفسیر شوند.
  • به طور کلی، به نظر می‌رسد که زمینه نقش مهمی برای استنتاج بازی می‌کند: جایی که مناطق a تا d با هم ملاقات می‌کنند، انتقال‌های واضح در تکه‌های رنگی قابل مشاهده است. نقشه تولید شده از دوخت موزاییک های تصویری 512 × 512 پیکسل بدون همپوشانی به دست آمده است. تفسیر مناطق لبه تحت تأثیر اطلاعات نمایش داده شده در جنوب غربی، شمال غربی، شمال شرقی و جنوب شرقی آن قرار گرفت. تغییرات می تواند منجر به تفسیر متفاوتی شود. بدون اثبات، ممکن است که صحنه طبیعی جنوب غربی منطقه d از یک طرف باعث ایجاد لحن آبی مایل به آبی (بدنه آبی) شده باشد، در حالی که، در مقابل، صحنه شهری شمال شرق منطقه a باعث ایجاد متناوب قهوه ای (ساختمان) و سفید (ساختمان) شده است. از طرف دیگر جاده محلی) رنگ آمیزی.
  • در نهایت، مناطق a و b مشخصه ای از روش وزن دهی ویژگی ما را ارائه کردند. اگرچه تصاویر NAIP شامل مناطق گسترده ای از پوشش گیاهی بود، fw-CycleGAN زمین خالی را استنباط کرد.
ملاحظات بالا مستلزم درک عمیق تر و کمی بیشتر معماری CycleGAN زمانی است که به عنوان مترجمی از تصاویر هوایی عمودی به نقشه ها استفاده می شود. آموزش روی مجموعه‌های بزرگ‌تر از داده‌ها ممکن است روشن کند که آیا صحنه‌های متنوع‌تر به شبکه کمک می‌کند تا درک صحنه را اصلاح کند یا خیر. با این حال، سوالات مربوط به طراحی مفهومی، شبکه و آموزشی نیز وجود دارد. مطالعات بیشتری در امتداد خطوط [ 67 ] برای درک روشنی از استنتاج معماری‌های نوع CycleGAN برای خطوط لوله محاسباتی قوی در عمل مورد نیاز است.

5. نتیجه گیری و دیدگاه ها

به طور خلاصه، این کار تولید برچسب OSM را با ترجمه تصویر به تصویر عکس های هوایی عمودی به کاشی های نقشه OSM شطرنجی شده از طریق شبکه های عصبی عمیق برجسته کرد. جدول 1 معیارهای کمی دقت را با توجه به تشخیص ساختمان برای دو معماری ANN مختلف ارائه می کند. اول، انتقال یک مدل ANN آموزش دیده از یک منطقه جغرافیایی به منطقه دیگر بر دقت کلی تشخیص تأثیر می گذارد. در مرحله دوم، بازرسی دستی نشان داد که دقت کلی مدل می‌تواند با برچسب‌گذاری ناقص OSM منحرف شود. بر اساس این بینش، در کار اخیر دیگری، ما یک طرح تکراری برای آموزش مجدد ANN با توجه به پیش‌بینی آن از دوره‌های آموزشی قبلی ایجاد کردیم [ 10 ].
علاوه بر این، نحوه استفاده از پلت‌فرم داده‌های جغرافیایی-مکانی بزرگ IBM Pairs برای تولید نقشه‌های حرارتی را توضیح دادیم که پتانسیل جلب توجه نقشه‌بردار OSM را به مناطقی که ممکن است برچسب‌گذاری کافی را نداشته باشند، دارند. ما رویکرد تشخیص ساختمان (تغییر) را نشان دادیم و به صورت کیفی مورد بحث قرار دادیم و بینشی به اشتراک گذاشتیم که چگونه سلسله مراتب جاده های کدگذاری شده رنگی (جاده محلی در مقابل بزرگراه) می تواند تغییر در نوع جاده را با استفاده از fw-CycleGAN برای تصاویر هوایی عمودی به- برجسته کند. وظیفه ترجمه نقشه
هدف ما این بود که به عنوان یک کمک بین رشته ای برای تحریک تحقیقات بیشتر در زمینه هوش مصنوعی (AI) برای تولید داده های OSM خدمت کند. به طور طبیعی، موفقیت آن به در دسترس بودن تصاویر هوایی عمودی رایگان و با وضوح بالا بستگی داشت. اگرچه برون یابی مسیر وضوح فضایی تصاویر ماهواره ای موجود در سطح جهانی نشان داد که جامعه OSM ممکن است تا دهه 2040 برای این رویکرد صبر کند، برنامه های دولتی مانند NAIP ممکن است آن را بر اساس کشور به کشور فعال کنند.
به عنوان گام بعدی، آزمایش دوام روش شناسی ما بر روی تصاویر ماهواره ای با وضوح متوسط ​​مانند تصاویر ماموریت Sentinel-2 مفید خواهد بود. علاوه بر این، رویکرد ما برای ترجمه تصویر به تصویر به کانال های RGB تصاویر هوایی عمودی محدود نمی شود. بخشی از برنامه تحقیقاتی آینده ما، بهره برداری از اندازه گیری LiDAR به عنوان منبع دیگری برای اطلاعات با وضوح بالا در مقیاس سانتی متری است که از آن می توان کانال های RGB کاذب مدل های ارتفاعی مختلف را برای تولید نقشه توسط fw-CycleGAN ساخت.

اختصارات

در این نسخه از اختصارات زیر استفاده شده است:

هوش مصنوعی هوش مصنوعی
ANN شبکه های عصبی مصنوعی
CNN شبکه عصبی کانولوشنال
کانوس ایالات متحده به هم پیوسته
CRS سیستم مرجع مختصات
درجه واحد درجه برای اندازه گیری زاویه
ED رمزگذار-رمزگشا
ESA آژانس فضایی اروپا
FN منفی اشتباه
FP مثبت کاذب
fw دارای ویژگی وزنی
GAN شبکهی مولد متقابل
جی پی اس سیستم موقعیت یاب جهانی
IoU تقاطع روی اتحاد
LiDAR تشخیص نور و محدوده
م _ م^ OSM نقشه شطرنجی
شده حقیقت زمین، نسخه تولید شده ANN
NAIP محصولات تصویری کشاورزی ملی
ناسا سازمان ملی هوانوردی و فضایی
OSM OpenStreetMap
جفت مخزن و خدمات یکپارچه تجزیه و تحلیل فیزیکی
رادار تشخیص و برد رادیویی
RGB قرمز سبز آبی
اس ، اس^ تصاویر هوایی عمودی
حقیقت زمین، نسخه تولید شده ANN
TN منفی واقعی
TP مثبت واقعی
TX تگزاس
UDF عملکرد تعریف شده توسط کاربر
USDA وزارت کشاورزی آمریکا
USGS سازمان زمین شناسی آمریکا
{T,G,M,K}B {Tera,Giga,Mega,Kilo}بایت
XML زبان نشانه گذاری توسعه پذیر

ضمیمه A. پرایمر در شبکه های عصبی مصنوعی از دیدگاه کار ما

همانطور که در متن اصلی به آن اشاره شد، این بخش پایانی قصد دارد جامعه OSM را به طور غیر رسمی با جنبه های معماری CycleGAN ANN آشنا کند تا تصویری جامع از کار فنی ما همانطور که در این مقاله ارائه شده است ارائه دهد.

در ابتدا، فرض کنیم می خواهیم یک وابستگی عملکردی پیچیده را مدل کنیم م^=جی(اس). در مواردی که S یک تصویر هوایی RGB با ارجاع جغرافیایی را نشان می دهد، ما مؤلفه هایی داریم اسمنjک∈[0،255]، محدوده مقادیر صحیح نوع بایت معتبر، با i و j شاخص های پیکسل (عدد صحیح) مختصات طول و عرض جغرافیایی و k برای نمایه سازی کانال های رنگی رزرو شده است. تعریف M به عنوان یک نقشه OSM شطرنجی متناظر با عناصر ممنjک، G قصد دارد یک تقریب ایجاد کند م^نزدیک به M بر اساس ورودی آن S. یکی از راه های اندازه گیری انحراف M و م^تعیین انحراف درجه دوم از نظر پیکسلی است:

L(م،م^)=(م-م^)2∼∑من،j،ک(ممنjک-م^منjک)2

به طور رسمی به عنوان تابع ضرر نامیده می شود. با توجه به مجموعه ای از داده های آموزشی {(اس،م)}، Lکمینه سازی به صورت عددی فرآیند بهینه سازی را با تنظیم پارامترهای G که به عنوان آموزش مدل نظارت شده نیز شناخته می شود، هدایت می کند [ 89 ].

در حوزه هوش مصنوعی، G با یک ANN نشان داده می شود. یکی از زیرمجموعه‌های شبکه‌ها، شبکه‌های عصبی کانولوشن (CNN) هستند. در بینایی کامپیوتر، به طور معمول، CNN ها به طور مکرر وضوح ورودی S را در ابعاد کاهش می دهندمن،jو آن را در k با دو عمل افزایش دهید: اول، چند عدد را اسلاید کنید (مثلا ک”=1،2،…،6)، هسته های پارامتری شده کمن”j”ک”(n)با اندازه ای به ترتیب چند پیکسل (به عنوان مثال، من”،j”=1،2،3) روی ورودی برای انحراف پیکسل های تصویر مطابق تابع خطی:

اسمنjک·ک”(1)=∑من”،j”کمن”j”ک”اسمن+من”j+j”ک.

پس از آن، اعمال یک تابع تجمع A به پیکسل های همسایه اس(1)کاهش اندازه را برای ابعاد برچسب گذاری شده انجام می دهد من،j. یک انتخاب رایج، تجمیع غیر خطی با انتخاب حداکثر مقدار است که به آن حداکثر ادغام می‌گویند. اغلب، داده می شود آ(اس(1))، یک غیر خطی دیگر σ:آر→آربه طور جداگانه برای هر پیکسل اعمال می شود:

اس^منjک(1)=σآاس(1)منjک

به گونه ای که ابعاد آ(اس(1))و اس^(1)همان هستند. طیف گسترده ای از انتخاب ها برای وجود دارد σ- همه مزایا و معایب خاص خود را دارند [ 90 ]. خیلی خشن بگویم، σورودی آن را سرکوب می کند ایکس∈آرزیر یک مقدار مشخصه σ0>ایکسو در بالا تقویت می شود، σ0≤ایکس، بنابراین سیگنال x را به عنوان خروجی فعال می کندσ(ایکس).

روش از S به اس^(1)می توان N بار تکرار کرد تا به پیکسل های تصویر ختم شود اسمنjک(ن)با کاهش ابعاد فضایی من،j=1…من≲10و بعد کانال ویژگی را به طور قابل توجهی افزایش داد ک≫10. قدم از اس^(n)به اس^(n+1)با اصطلاح یک لایه شبکه عصبی همراه است که توسط وزن هسته پارامتر شده است کمنjک(n). ممکن است تبدیل کلی را به صورت بنویسیم اس^(ن)=هن(اس)و آن را به عنوان رمزگذار CNN ارجاع دهید. به روشی مشابه، ما می‌توانیم با یک رمزگشای CNN برای به دست آوردن موارد زیر از هم خارج شویم:

م^=دن(اس^(ن))=دن(هن(اس)).
رمزگشایی اس^(ن)به م^(ن)شامل یک عملیات پیچشی مانند معادله ( A2 ) نیز می شود. با این حال، به منظور افزایش ابعاد فضایی برای من،jدوباره نمونه برداری م(ن)=U(اس^(ن))ابتدا اعمال می شود. ساده ترین روش ممکن است افزایش تعداد پیکسل ها با ضریب چهار از طریق تکرار هر پیکسل موجود در هر دو بعد فضایی با برچسب گذاری شده با من،j. با این حال، چگونه تعداد کانال ها را کاهش دهیم؟ ضرب ک·ک”در معادله ( A2 ) تنها تعداد کانال ها افزایش می یابد. با این حال، هیچ چیز ما را از میانگین بالای k باز نمی دارد، به طوری که تعداد کانال های خروجی دقیقاً با تعداد هسته های اعمال شده تعیین می شود. در عمل، کانولوشن های متعدد ممکن است با فعال سازی اجرا شوند σدر بالا ترکیب داده ها از سایر لایه های CNN. به طور غیررسمی، در مورد معماری U-Net، کانال های م^(n)علاوه بر این با اس^(n)به منظور تشکیل ورودی لایه deconvolution n که تولید می کند م^(n-1). این نشت اطلاعات از لایه های مختلف ANN به عنوان اتصالات پرش نامیده می شود که یک قطعه مرکزی برای موفقیت U-Net است. برای جزئیات بیشتر در مورد اینکه رمزگذارها و رمزگشاها چگونه از نظر مفهومی متفاوت هستند، مرجع [ 91 ] بینش و منابعی را ارائه می دهد. به طور خاص، پیاده‌سازی U-Net ما از لایه‌های کانولوشنال انتقالی برای رمزگشایی استفاده می‌کند.
کاهش پی در پی تعداد کانال ها از لایه deconvolution ن،ن-1،…از طریق n پایین به …،2،1به ما اجازه می دهد تا خروجی ای را به دست آوریم که با ابعاد تصویر کاشی نقشه OSM M مطابقت داشته باشد به طوری که معادله ( A1 ) را بتوان محاسبه کرد. تغییر پارامترهای هسته تمام لایه های رمزگذاری و رمزگشایی از روش آموزش ANN برای به حداقل رساندن استفاده می کند. L. البته، هدف صرفاً بهینه‌سازی فاصله پیکسلی یک جفت نیست (م^=جی(اس)،م)، اما برای به حداقل رساندن آن در سطح جهانی برای همه تصاویر ماهواره ای NAIP موجود و نقشه های تولید شده مربوطه در مقابل همتایان کاشی نقشه OSM آن.
کارکرد جی=دن∘هنهمان چیزی است که در بالا به عنوان رمزگذار-رمزگر از آن یاد کردیم. یک نوع از آن رمزگذار خودکار متغیر [ 92 ] است. به جای عرضه مستقیم اس^(ن)=هن(اس)به دن، خروجی رمزگذار به عنوان میانگین و واریانس یک توزیع گاوسی تفسیر می شود. نمونه هایی از این توزیع وارد می شوند دن، متعاقبا. به طور مشابه، یک ANN که اعداد تصادفی نامرتبط را به یک توزیع تقریبی شده با آمار داده‌های داده شده تبدیل می‌کند – مانند مقادیر پیکسل کاشی نقشه OSM M – به عنوان یک شبکه متخاصم مولد شناخته می‌شود [ 93 ]. برای کسانی که در سطح بالا صحبت می کنند، دو شبکه، یک ژنراتور جی=دنو یک تمایز، که شبیه یک رمزگذار است، D(م)=ه(م)∈[0،1]، در یک بازی مینی مکس برای فریب دادن یکدیگر به روش زیر رقابت کنید: اعداد تصادفی z وارد شده به G نیاز به تولید نمونه های جعلی دارند. y^=جی(z)=م^به گونه ای که وقتی نشان داده می شود به D(م^)، مقدار عددی خروجی آن نزدیک به یک است. در مقابل، هدف D داشتن است D(م^)≈0. انجام این کار برای D بی اهمیت نیست ، زیرا تابع بهینه سازی آموزشی آن را تشویق می کند D(م)≈1برای نمونه های واقعی M. از این رو، G بیشتر قادر به تولید نقشه است م^که عملکرد D(م^)≈1، بهتر است کاشی های شطرنجی OSM واقعی M را نشان دهند.

در نهایت، تنظیم جی=دن∘هنبه جای ساده جی=دنو اجرای بازی GAN به هر دو صورت، یعنی از تصاویر NAIP تا کاشی های نقشه OSM، و بالعکس، دو چرخه بسته قابل ساخت هستند:

اس^=جیاس(جیم(اس))وم^=جیم(جیاس(م))

که منجر به دو چرخه تلفات ثبات می شود L:

(اس^-اس)2و(م^-م)2،

به ترتیب. تنها تفاوت CycleGAN با fw-CycleGAN وزن کردن مجموع ها در (اس^-اس)2با توجه به اینکه آیا پیکسل های مربوطه M یک ویژگی زیرساختی انسانی مانند ساختمان ها یا جاده ها را نشان می دهند یا خیر.

یک مشاهدات کلیدی: بهینه سازی این دو تابع از دست دادن نیازی به وجود هیچ جفت (از نظر پیکسلی) بین تصاویر NAIP داده های آموزشی S و کاشی های نقشه OSM M . به طور خاص، از این واقعیت برای استنباط تداعی‌های عجیب و غریب مانند ترجمه تصاویر چهره‌ها به تصاویر ظروف رامن استفاده شده است. [ 12] مثلا. در یک مفهوم وسیع‌تر، از هم گسیختگی جفت‌های تصویر برای ترجمه تصویر به تصویر به CycleGAN و اصلاح آن fw-CycleGAN اجازه می‌دهد تا با توجه به عدم دقت داده‌های OSM در مورد ارجاع جغرافیایی، ثابت باشند. علاوه بر این، این به معنای تحمل با توجه به مناطق فضایی است که فاقد برچسب OSM هستند. با این حال، ما ترجمه رامن به چهره را ذکر می کنیم تا تأکید کنیم که رویکرد CycleGAN طیف بسیار گسترده ای از تفاسیر را امکان پذیر می کند، که بخش چالش برانگیزی است که باید به صورت کمی در تحقیقات آینده مورد توجه قرار گیرد. علاوه بر این، آموزش موازی چهار شبکه، یعنی جیاس، جیم، Dاس، و Dم، که هر کدام دارای میلیون ها پارامتر قابل تنظیم هستند، از نظر عددی بی اهمیت هستند.
در خاتمه، اجازه دهید ماهیت غیررسمی این بررسی مختصر را که هدف آن چیزی جز معرفی سطح بالا نیست، تأکید کنیم. برای مثال، در معادله ( A2 )، عبارت بایاس افزایشی را که معمولاً برای هر کانال خروجی در دسترس است حذف کردیم. ما درباره موضوعات آموزشی مرتبط مانند ترک تحصیل [ 94 ] و نرمال سازی دسته ای [ 95 ] و سایر موارد بحث نکردیم. جزئیات فنی را می توان به شکل بسیار پیچیده تری ارائه کرد. بنابراین، مختصری که با آن مطالب پوشش داده شد، نمی تواند وسعت و عمق قابل توجه تحقیق در مورد معماری شبکه های عصبی مصنوعی را رعایت کند. علاوه بر این، آموزش مناسب شبکه های عصبی مصنوعی منجر به تکنیک های بهینه سازی پیشرفته ای شد که در [ 96 ، 97 مورد بحث قرار گرفت.].

منابع

  1. نقشه خیابان باز در دسترس آنلاین: https://www.openstreetmap.org/ (در 25 ژوئن 2020 قابل دسترسی است).
  2. ویرایشگر OpenStreetMap. در دسترس آنلاین: https://www.openstreetmap.org/edit (در 25 ژوئن 2020 قابل دسترسی است).
  3. او، ک. گیوکسری، جی. دلار، پی. Girshick, R. Mask R-CNN. در مجموعه مقالات کنفرانس بین المللی IEEE در بینایی کامپیوتر، ونیز، ایتالیا، 22 تا 29 اکتبر 2017؛ صفحات 2961-2969. [ Google Scholar ] [ CrossRef ]
  4. بدرینارایانان، وی. کندال، ا. Cipolla، R. Segnet: معماری رمزگذار-رمزگشای پیچیده پیچیده برای تقسیم‌بندی تصویر. IEEE Trans. الگوی مقعدی ماخ هوشمند 2017 ، 39 ، 2481-2495. [ Google Scholar ] [ CrossRef ]
  5. SegNet. در دسترس آنلاین: https://mi.eng.cam.ac.uk/projects/segnet/ (در 25 ژوئن 2020 قابل دسترسی است).
  6. ایزولا، پی. زو، جی. ژو، تی. Efros، ترجمه تصویر به تصویر AA با شبکه های خصمانه مشروط. در مجموعه مقالات کنفرانس IEEE 2017 در مورد دید رایانه و تشخیص الگو (CVPR)، هونولولو، HI، ایالات متحده آمریکا، 21 تا 26 ژوئیه 2017؛ صص 5967–5976. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  7. ترجمه تصویر به تصویر با شبکه های خصمانه مشروط. در دسترس آنلاین: https://philipi.github.io/pix2pix/ (در 25 ژوئن 2020 قابل دسترسی است).
  8. رونبرگر، او. فیشر، پی. Brox، T. U-Net: شبکه های کانولوشن برای تقسیم بندی تصویر زیست پزشکی. در مجموعه مقالات کنفرانس بین المللی محاسبات تصویر پزشکی و مداخله به کمک کامپیوتر، مونیخ، آلمان، 5 تا 9 اکتبر 2015. صص 234-241. [ Google Scholar ]
  9. Schmidhuber، J. Minimax بدون نظارت: کنجکاوی متخاصم، شبکه های متخاصم مولد، و به حداقل رساندن قابلیت پیش بینی. arXiv 2019 ، arXiv:cs/1906.04493. [ Google Scholar ]
  10. ژانگ، آر. آلبرشت، سی. ژانگ، دبلیو. کوی، ایکس. فینکلر، یو. کونگ، دی. Lu, S. تولید نقشه از برچسب های داده های ناقص و نادرست مقیاس بزرگ. arXiv 2020 ، arXiv:2005.10053. [ Google Scholar ]
  11. زو، جی. پارک، تی. ایزولا، پی. Efros، ترجمه AA بدون جفت تصویر به تصویر با استفاده از شبکه های متخاصم سازگار با چرخه. در مجموعه مقالات کنفرانس بین المللی IEEE در بینایی کامپیوتر، ونیز، ایتالیا، 22 تا 29 اکتبر 2017؛ صص 2242-2251. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  12. صفحه پروژه CycleGAN. در دسترس آنلاین: https://junyanz.github.io/CycleGAN/ (در 25 ژوئن 2020 قابل دسترسی است).
  13. Tiecke، TG; لیو، ایکس. ژانگ، ا. گروس، آ. لی، ن. یتمن، جی. کیلیچ، تی. موری، اس. بلانکسپور، بی. پریض، ای بی; و همکاران نقشه برداری از جمعیت جهان یک ساختمان در یک زمان. arXiv 2017 ، arXiv:cs/1712.05839. [ Google Scholar ]
  14. ایگلوویکوف، وی. سفربکوف، اس.اس. بوسلایف، آ. Shvets، A. TernausNetV2: شبکه کاملاً پیچیده برای تقسیم‌بندی نمونه. در مجموعه مقالات کنفرانس در کارگاه های بینایی کامپیوتری و تشخیص الگو (CVPRW)، سالت لیک سیتی، UT، ایالات متحده آمریکا، 18 تا 22 ژوئن 2018؛ جلد 233، ص. 237. [ Google Scholar ]
  15. Microsoft/USBuildingFootprints. در دسترس آنلاین: https://github.com/microsoft/USBuildingFootprints (در 25 ژوئن 2020 قابل دسترسی است).
  16. آلبرت، آ. کائور، ج. گونزالس، ام سی استفاده از شبکه های کانولوشن و تصاویر ماهواره ای برای شناسایی الگوها در محیط های شهری در مقیاس بزرگ. در مجموعه مقالات بیست و سومین کنفرانس بین المللی ACM SIGKDD در مورد کشف دانش و داده کاوی، هالیفاکس، NS، کانادا، 13 تا 17 اوت 2017؛ صص 1357–1366. [ Google Scholar ]
  17. راخلین، ا. دیویدو، ا. نیکولنکو، طبقه‌بندی پوشش زمین SI از تصاویر ماهواره‌ای با U-Net و Lovasz-Softmax Loss. در مجموعه مقالات کنفرانس در کارگاه های بینایی کامپیوتری و تشخیص الگو (CVPRW)، سالت لیک سیتی، UT، ایالات متحده آمریکا، 18 تا 22 ژوئن 2018؛ صص 262-266. [ Google Scholar ]
  18. کائو، آر. ژو، جی. تو، دبلیو. لی، کیو. کائو، جی. لیو، بی. ژانگ، کیو. Qiu, G. یکپارچه سازی تصاویر هوایی و نمای خیابان برای طبقه بندی کاربری زمین شهری. Remote Sens. 2018 ، 10 ، 1553. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  19. کو، تی اس; Tseng، KS; یان، JW; لیو، YC; وانگ، شبکه تجمع عمیق YCF برای طبقه بندی پوشش زمین. در مجموعه مقالات کنفرانس در کارگاه های بینایی کامپیوتری و تشخیص الگو (CVPRW)، سالت لیک سیتی، UT، ایالات متحده آمریکا، 18 تا 22 ژوئن 2018؛ صص 252-256. [ Google Scholar ]
  20. ژو، ال. ژانگ، سی. Wu, M. D-LinkNet: لینک نت با رمزگذار از پیش آموزش دیده و پیچش گشاد شده برای استخراج جاده تصاویر ماهواره ای با وضوح بالا. در مجموعه مقالات کنفرانس IEEE/CVF 2018 در کارگاه های آموزشی بینایی رایانه و تشخیص الگو (CVPRW)، سالت لیک سیتی، UT، ایالات متحده آمریکا، 18 تا 22 ژوئن 2018؛ صفحات 192-1924. [ Google Scholar ] [ CrossRef ]
  21. Oehmcke، S. تریسو، سی. بورگستاد، آ. Salles، MAV; برانت، ام. Gieseke، F. تشخیص جاده های به سختی قابل مشاهده در داده های سری زمانی ماهواره ای با وضوح پایین. arXiv 2019 ، arXiv:1912.05026. [ Google Scholar ]
  22. بوسلایف، آ. سفربکوف، اس.اس. ایگلوویکوف، وی. Shvets، A. شبکه کاملاً پیچیده برای استخراج خودکار جاده از تصاویر ماهواره ای. در مجموعه مقالات کنفرانس در کارگاه های بینایی کامپیوتری و تشخیص الگو (CVPRW)، سالت لیک سیتی، UT، ایالات متحده آمریکا، 18 تا 22 ژوئن 2018؛ ص 207-210. [ Google Scholar ]
  23. شیا، دبلیو. ژانگ، YZ; لیو، جی. لو، ال. یانگ، ک. استخراج جاده از تصویر با وضوح بالا با شبکه پیچیدگی عمیق – مطالعه موردی تصویر GF-2. در مجموعه مقالات موسسه انتشارات دیجیتال چند رشته ای ; MDPI: بازل، سوئیس، 2018؛ جلد 2، ص. 325. [ Google Scholar ]
  24. وو، اس. دو، سی. چن، اچ. خو، ی. گوا، ن. Jing, N. استخراج جاده از تصاویر با وضوح بسیار بالا با استفاده از خط مرکزی OpenStreetMap با برچسب ضعیف. ISPRS Int. J. Geo-Inf. 2019 ، 8 ، 478. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  25. شیا، دبلیو. ژونگ، ن. گنگ، دی. Luo, L. یک رویکرد استخراج جاده با نظارت ضعیف از طریق تقسیم‌بندی تصویر مبتنی بر شبکه‌های پیچیده. در مجموعه مقالات کارگاه بین المللی 2017 سنجش از دور با پردازش هوشمند (RSIP)، شانگهای، چین، 19 تا 21 مه 2017؛ صص 1-5. [ Google Scholar ]
  26. سان، تی. دی، ز. چه، پ. لیو، سی. Wang, Y. استفاده از داده‌های GPS جمع‌سپاری شده برای استخراج جاده از تصاویر هوایی. در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو، لانگ بیچ، کالیفرنیا، ایالات متحده آمریکا، 16 تا 20 ژوئن 2019؛ صص 7509–7518. [ Google Scholar ]
  27. روآن، اس. لانگ، سی. بائو، جی. لی، سی. یو، ز. لی، آر. لیانگ، ی. او، تی. Zheng, Y. یادگیری ایجاد نقشه از مسیرها. در مجموعه مقالات کنفرانس AAAI در مورد هوش مصنوعی، نیویورک، نیویورک، ایالات متحده آمریکا، 7 تا 8 فوریه 2020. [ Google Scholar ]
  28. لیو، من؛ بروئل، تی. کاوتز، جی. شبکه های ترجمه تصویر به تصویر بدون نظارت. در پیشرفت در سیستم های پردازش اطلاعات عصبی ; Curran Associates, Inc.: Red Hook, NY, USA, 2017; ص 700-708. [ Google Scholar ]
  29. بونافیلیا، دی. گیل، جی. باسو، س. یانگ، دی. ساختن نقشه‌های با وضوح بالا برای کمک‌های بشردوستانه و توسعه با یادگیری ضعیف و نیمه نظارت. در مجموعه مقالات کنفرانس IEEE در کارگاه های آموزشی بینایی رایانه و تشخیص الگو، لانگ بیچ، کالیفرنیا، ایالات متحده آمریکا، 16 تا 20 ژوئن 2019؛ صفحات 1-9. [ Google Scholar ]
  30. سینگ، اس. باترا، ا. پانگ، جی. ترسانی، ال. باسو، س. پالوری، م. جواهر، سی. آموزش ویژگی تحت نظارت خود برای تقسیم بندی معنایی تصاویر بالای سر. در مجموعه مقالات کنفرانس بینایی ماشین بریتانیا، نیوکاسل آپون تاین، بریتانیا، 3 تا 6 سپتامبر 2018؛ انجمن بینایی ماشین بریتانیا: دورهام، بریتانیا، 2018. [ Google Scholar ]
  31. گانگولی، س. گارزون، پی. Glaser, N. Geogan: یک گان مشروط با بازسازی و از دست دادن سبک برای تولید لایه استاندارد نقشه ها از تصاویر ماهواره ای. arXiv 2019 ، arXiv:1902.05611. [ Google Scholar ]
  32. یادگیری ماشین – OpenStreetMap Wiki. در دسترس آنلاین: https://wiki.openstreetmap.org/wiki/Machine_learning (در 25 ژوئن 2020 قابل دسترسی است).
  33. جفت‌های IBM – Geoscope. در دسترس آنلاین: https://ibmpairs.mybluemix.net/ (در 25 ژوئن 2020 قابل دسترسی است).
  34. کلاین، ال. ماریانو، اف. آلبرشت، سی. فرایتاگ، م. لو، اس. هندز، ن. شائو، ایکس. رودریگز، اس. Hamann, H. Pairs: یک پلت فرم تجزیه و تحلیل داده های جغرافیایی-مکانی مقیاس پذیر. در مجموعه مقالات کنفرانس بین المللی IEEE در سال 2015 درباره داده های بزرگ (داده های بزرگ)، سانتا کلارا، کالیفرنیا، ایالات متحده آمریکا، 29 اکتبر تا 1 نوامبر 2015؛ ص 1290–1298. [ Google Scholar ] [ CrossRef ]
  35. لو، اس. فرایتاگ، م. کلاین، ال جی; رنویک، جی. ماریانو، اف جی؛ آلبرشت، سی ام. Hamann، HF IBM Pairs سرپرستی خدمات کلان داده برای تجزیه و تحلیل و کشف داده های مکانی شتابان. در مجموعه مقالات کنفرانس بین المللی IEEE در سال 2016 درباره داده های بزرگ (داده های بزرگ)، واشنگتن، دی سی، ایالات متحده آمریکا، 5 تا 8 دسامبر 2016؛ پ. 2672. [ Google Scholar ] [ CrossRef ]
  36. آلبرشت، سی ام. بابروف، ن. المگرین، بی. فرایتاگ، م. هامان، HF; خبیبرخمانوف، آی. کلاین، ال. لو، اس. ماریانو، اف. اشمود، جی. و همکاران جفت (دوباره) بارگذاری شده: طراحی سیستم و محک زدن برای کاربردهای جغرافیایی مقیاس پذیر. مجموعه مقالات ISPRS Annals 2020 ، در دست چاپ است. [ Google Scholar ]
  37. فچر، آر. Whitby، MA بهینه سازی تجزیه و تحلیل مکانی-زمانی با استفاده از نمایه سازی چند بعدی با GeoWave. در مجموعه مقالات کنفرانس نرم افزار رایگان و متن باز برای زمین فضایی (FOSS4G)، حیدرآباد، هند، 26-29 ژانویه 2017. جلد 17، ص. 10. [ Google Scholar ] [ CrossRef ]
  38. هیوز، JN; پیوست، الف. Eichelberger، CN; فاکس، ا. هالبرت، ا. Ronquest، M. Geomesa: A Distributed Architecture for Spatio-Temporal Fusion. در مجموعه مقالات PIE 9473، انفورماتیک جغرافیایی، فیوژن، و تجزیه و تحلیل ویدیوی حرکتی V، بالتیمور، MD، ایالات متحده آمریکا، 20-24 آوریل 2015. SPIE: Bellingham، WA، USA، 2015. [ Google Scholar ]
  39. ویتمن، RT; پارک، مگابایت؛ Ambrose، SM; Hoel، EG نمایه سازی فضایی و تجزیه و تحلیل در Hadoop. در مجموعه مقالات بیست و دومین کنفرانس بین المللی ACM SIGSPATIAL در مورد پیشرفت در سیستم های اطلاعات جغرافیایی، دالاس، تگزاس، ایالات متحده آمریکا، 4 تا 7 نوامبر 2014. انجمن ماشین‌های محاسباتی: نیویورک، نیویورک، ایالات متحده آمریکا، 2014. [ Google Scholar ]
  40. آلبرشت، سی ام. فیشر، سی. فرایتاگ، م. هامان، HF; پانکانتی، اس. پزوتی، اف. Rossi, F. یادگیری و شناخت ویژگی های باستان شناسی از داده های LiDAR. در مجموعه مقالات کنفرانس بین‌المللی IEEE 2019 درباره داده‌های بزرگ (داده‌های بزرگ)، لس‌آنجلس، کالیفرنیا، ایالات متحده آمریکا، 9 تا 12 دسامبر 2019؛ صص 5630–5636. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  41. کلاین، ال جی; آلبرشت، سی ام. ژو، دبلیو. زیبنشوه، سی. پانکانتی، اس. هامان، HF; Lu, S. داده‌های جغرافیایی و تجزیه و تحلیل N-بعدی برای ارزیابی ریسک زیرساخت‌های حیاتی. در مجموعه مقالات کنفرانس بین‌المللی IEEE 2019 درباره داده‌های بزرگ (داده‌های بزرگ)، لس‌آنجلس، کالیفرنیا، ایالات متحده آمریکا، 9 تا 12 دسامبر 2019؛ صص 5637–5643. [ Google Scholar ] [ CrossRef ]
  42. المگرین، بی. آلبرشت، سی. هامان، اچ. کلاین، ال. لو، اس. Schmude, J. Physical Analytics یکپارچه مخزن و خدمات برای نجوم: جفت-A. گاو نر صبح. اختر. Soc. 2019 ، 51 ، 28. [ Google Scholar ]
  43. Vora، MN Hadoop-HBase برای داده های مقیاس بزرگ. در مجموعه مقالات کنفرانس بین المللی علوم کامپیوتر و فناوری شبکه در سال 2011، هاربین، چین، 24 تا 26 دسامبر 2011. جلد 1، ص 601–605. [ Google Scholar ] [ CrossRef ]
  44. صفحه اصلی—مرجع فضایی. در دسترس آنلاین: https://spatialreference.org/ (دسترسی در 25 ژوئن 2020).
  45. Janssen, V. درک سیستم های مرجع مختصات، داده ها و تبدیل ها. بین المللی J. Geoinform. 2009 ، 5 ، 41-53. [ Google Scholar ]
  46. سامت، اچ. چهار درخت و ساختارهای داده سلسله مراتبی مرتبط. کامپیوتر ACM. Surv. 1984 ، 16 ، 187-260. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  47. دروش، ام. دل بلو، U. کارلیر، اس. کالین، او. فرناندز، وی. گاسکون، اف. هورش، بی. ایزولا، سی. لابرینتی، پ. مارتیمورت، پی. و همکاران Sentinel-2: ماموریت نوری با وضوح بالا ESA برای خدمات عملیاتی GMES. از راه دور. حس محیط. 2012 ، 120 ، 25-36. [ Google Scholar ] [ CrossRef ]
  48. روی، DP; Wulder، MA; لاول، TR; Woodcock، CE; آلن، آر جی. اندرسون، ام سی؛ هلدر، دی. آیرونز، جی آر. جانسون، دی.م. کندی، آر. و همکاران Landsat-8: علم و چشم انداز محصول برای تحقیقات تغییرات جهانی زمینی. از راه دور. حس محیط. 2014 ، 145 ، 154-172. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  49. صفحه وب ماموریت لندست. در دسترس آنلاین: https://www.usgs.gov/land-resources/nli/landsat/landsat-satellite-missions (در 25 ژوئن 2020 قابل دسترسی است).
  50. صفحه وب ماموریت ترا در دسترس آنلاین: https://terra.nasa.gov/about/mission (در 25 ژوئن 2020 قابل دسترسی است).
  51. صفحه وب ماموریت Sentinel-2. در دسترس آنلاین: https://sentinel.esa.int/web/sentinel/missions/sentinel-2 (در 25 ژوئن 2020 قابل دسترسی است).
  52. لیم، ک. تریتز، پی. ولدر، ام. سنت اونگه، بی. سیل، M. LiDAR سنجش از دور ساختار جنگل. Prog. فیزیک Geogr. 2003 ، 27 ، 88-106. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  53. منگ، ایکس. کریت، ن. ژائو، ک. الگوریتم های فیلتر زمینی برای داده های هوابرد LiDAR: مروری بر مسائل مهم. از راه دور. Sens. 2010 , 2 , 833-860. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  54. Soergel, U. (Ed.) Radar Remote Sensing of Urban Areas , 1st ed.; سری کتاب: سنجش از دور و پردازش تصویر دیجیتال. Springer: Heidelberg، آلمان، 2010. [ Google Scholar ] [ CrossRef ]
  55. Ouchi، K. روند اخیر و پیشرفت رادار دیافراگم مصنوعی با موضوعات انتخاب شده. از راه دور. Sens. 2013 , 5 , 716-807. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  56. Naip Data in Box. در دسترس آنلاین: https://nrcs.app.box.com/v/naip (در 25 ژوئن 2020 قابل دسترسی است).
  57. USGS EROS Archive—Aerial Photography—National Agriculture Imagery Program (NAIP). در دسترس آنلاین: https://doi.org/10.5066/F7QN651G (در 28 ژوئن 2020 قابل دسترسی است).
  58. سرور کاشی آزمایشگاه WMF: “OSM بدون برچسب”. در دسترس آنلاین: https://tiles.wmflabs.org/osm-no-labels/ (دسترسی در 25 ژوئن 2020).
  59. سرور OSM: “کاشی هایی با برچسب”. در دسترس آنلاین: https://tile.openstreetmap.de/ (در 25 ژوئن 2020 قابل دسترسی است).
  60. رضاتوفیقی، ح. تسوی، ن. گواک، جی. صادقیان، ع. رید، آی. Savarese، S. تقاطع تعمیم یافته بر روی اتحاد: یک متریک و یک ضرر برای رگرسیون جعبه محدود. در مجموعه مقالات کنفرانس IEEE/CVF 2019 در مورد بینایی کامپیوتری و تشخیص الگو (CVPR)، لانگ بیچ، کالیفرنیا، ایالات متحده آمریکا، 16 تا 20 ژوئن 2019؛ صص 658-666. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  61. Pytorch/Pytorch. در دسترس آنلاین: https://github.com/pytorch/pytorch (در 25 ژوئن 2020 قابل دسترسی است).
  62. کیلومتری Milesial/Pytorch-UNet. در دسترس آنلاین: https://github.com/milesial/Pytorch-UNet (در 25 ژوئن 2020 قابل دسترسی است).
  63. Zhu، JY Junyanz/Pytorch-CycleGAN-and-Pix2pix. در دسترس آنلاین: https://github.com/junyanz/pytorch-CycleGAN-and-pix2pix (در 25 ژوئن 2020 قابل دسترسی است).
  64. مپنیک/مپنیک. در دسترس آنلاین: https://github.com/mapnik/mapnik (در 25 ژوئن 2020 قابل دسترسی است).
  65. IBM/Ibmpairs. در دسترس آنلاین: https://github.com/IBM/ibmpairs (در 25 ژوئن 2020 قابل دسترسی است).
  66. IBM Pairs — آموزش. در دسترس آنلاین: https://pairs.res.ibm.com/tutorial/ (در 25 ژوئن 2020 قابل دسترسی است).
  67. چو، سی. ژموگینوف، آ. سندلر، M. CycleGAN، استاد استگانوگرافی. arXiv 2017 , arXiv:1712.02950. [ Google Scholar ]
  68. دنگ، ج. دونگ، دبلیو. سوچر، آر. لی، ال جی; لی، ک. لی، F.-F. ImageNet: پایگاه داده تصویر سلسله مراتبی در مقیاس بزرگ. در مجموعه مقالات کنفرانس IEEE/CVF 2019 در مورد بینایی کامپیوتری و تشخیص الگو (CVPR)، لانگ بیچ، کالیفرنیا، ایالات متحده آمریکا، 16 تا 20 ژوئن 2019؛ صص 248-255. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  69. ImageNet. در دسترس آنلاین: https://www.image-net.org/ (در 25 ژوئن 2020 قابل دسترسی است).
  70. ون اتن، ا. لیندنباوم، دی. Bacastow، TM SpaceNet: مجموعه داده سنجش از راه دور و سری چالش. arXiv 2018 , arXiv:1807.01232. [ Google Scholar ]
  71. SpaceNet. در دسترس آنلاین: https://spacenetchallenge.github.io/ (در 25 ژوئن 2020 قابل دسترسی است).
  72. راه حل برنده برای چالش Spacenet: یادگیری مشترک با OpenStreetMap. در دسترس آنلاین: https://i.ho.lc/winning-solution-for-the-spacenet-challenge-joint-learning-with-openstreetmap.html (در 25 ژوئن 2020 قابل دسترسی است).
  73. قدرت ها، ارزیابی DM : از دقت، یادآوری و اندازه گیری F تا ROC، اطلاعات، نشانه گذاری و همبستگی . انتشارات Bioinfo: پونا، هند، 2011. [ Google Scholar ]
  74. پان، SJ; یانگ، کیو. نظرسنجی در مورد یادگیری انتقالی. IEEE Trans. دانستن مهندسی داده 2009 ، 22 ، 1345-1359. [ Google Scholar ] [ CrossRef ]
  75. لو، جی. بهبود، وی. هائو، پی. زو، اچ. ژو، اس. ژانگ، جی. انتقال یادگیری با استفاده از هوش محاسباتی: یک بررسی. دانستن سیستم مبتنی بر 2015 ، 80 ، 14-23. [ Google Scholar ] [ CrossRef ]
  76. ویس، ک. خوش گفتار، TM; وانگ، دی. بررسی یادگیری انتقالی. IEEE Trans. دانستن مهندسی داده 2009 ، 3 ، 9. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  77. لین، جی. جیانگ، ز. سرکاریا، س. ما، دی. Zhao، Y. موضوع ویژه آموزش انتقال عمیق برای سنجش از راه دور. سنجش از دور (ژورنال). در دسترس آنلاین: https://www.mdpi.com/journal/remotesensing/special_issues/DeepTransfer_Learning (در 28 ژوئن 2020 قابل دسترسی است).
  78. زی، ام. ژان، ن. بورک، ام. لوبل، دی. ارمون، اس. انتقال یادگیری از ویژگی های عمیق برای سنجش از راه دور و نقشه برداری فقر. در مجموعه مقالات AAAI 2016: سی امین کنفرانس AAAI در مورد هوش مصنوعی، فینیکس، AZ، ​​ایالات متحده آمریکا، 12 تا 17 فوریه 2016. پ. 7. [ Google Scholar ]
  79. هوانگ، ز. پان، ز. Lei, B. انتقال یادگیری با شبکه عصبی پیچیده عمیق برای طبقه‌بندی هدف SAR با داده‌های برچسب‌گذاری شده محدود. از راه دور. Sens. 2017 , 9 , 907. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  80. لیان، ایکس. ژانگ، سی. ژانگ، اچ. Hsieh, CJ; ژانگ، دبلیو. لیو، جی. آیا الگوریتم های غیرمتمرکز از الگوریتم های متمرکز بهتر عمل می کنند؟ مطالعه موردی برای نزول گرادیان تصادفی غیرمتمرکز موازی. در پیشرفت در سیستم های پردازش اطلاعات عصبی 30 ; Guyon, I., Luxburg, UV, Bengio, S., Wallach, H., Fergus, R., Vishwanathan, S., Garnett, R., Eds. Curran Associates, Inc.: Red Hook, NY, USA, 2017; صص 5330–5340. [ Google Scholar ]
  81. ژانگ، دبلیو. کوی، ایکس. کی، ع. لیو، ام. فینکلر، یو. کینگزبری، بی. ساون، جی. مروئه، ی. بویوکتوسون اوغلو، ع. داس، پ. و همکاران بهبود کارایی در آموزش های غیرمتمرکز توزیع شده در مقیاس بزرگ. در مجموعه مقالات کنفرانس بین المللی ICASSP 2020 IEEE در مورد آکوستیک، پردازش گفتار و سیگنال (ICASSP)، بارسلون، اسپانیا، 4 تا 8 مه 2020. [ Google Scholar ]
  82. نقشه های بینگ در دسترس آنلاین: https://www.bing.com/maps (در 25 ژوئن 2020 قابل دسترسی است).
  83. ژانگ، آر. آلبرشت، سی ام. فرایتاگ، م. لو، اس. ژانگ، دبلیو. فینکلر، یو. کونگ، دی اس؛ Cui، X. سیستم و روش‌شناسی برای تصحیح ویژگی‌های نقشه با استفاده از سنجش از راه دور و یادگیری عمیق. ثبت اختراع ایالات متحده درخواست ارسال شده، در دست بررسی
  84. کلاین، ال جی; لو، اس. آلبرشت، سی ام. ماریانو، اف جی؛ هامان، روش HF و سیستم برای شناسایی محصول و تعیین مرز. پتنت ایالات متحده 10445877B2، 15 اکتبر 2019. [ Google Scholar ]
  85. کلاین، ال. ماریانو، اف جی؛ فرایتاگ، م. هامان، HF; رودریگز، SB پرس و جوی موازی از پایگاه داده مکانی با وضوح قابل تنظیم. پتنت ایالات متحده 10372705B2، 6 اوت 2019. [ Google Scholar ]
  86. فرایتاگ، م. آلبرشت، سی ام. ماریانو، اف جی؛ لو، اس. هامان، HF; Schmude، JW Efficient Querying با استفاده از لایه های اجمالی داده های مکانی-زمانی در بستر تجزیه و تحلیل داده ها. پتنت ایالات متحده P201805207، 14 مه 2020. [ Google Scholar ]
  87. Mapnik.Org- هسته تجسم و پردازش جغرافیایی. در دسترس آنلاین: https://mapnik.org/ (در 25 ژوئن 2020 قابل دسترسی است).
  88. تیم خدمات ابری ویکی‌مدیا. در دسترس آنلاین: https://www.mediawiki.org/wiki/Wikimedia_Cloud_Services_team (در 25 ژوئن 2020 قابل دسترسی است).
  89. بوتو، ال. کورتیس، FE; Nocedal، J. روش‌های بهینه‌سازی برای یادگیری ماشینی در مقیاس بزرگ. Siam Rev. 2018 , 60 , 223–311. [ Google Scholar ] [ CrossRef ]
  90. نوانکپا، سی. ایجوما، دبلیو. گچاگان، ع. مارشال، اس. توابع فعال سازی: مقایسه روندها در عمل و تحقیق برای یادگیری عمیق. arXiv 2018 , arXiv:1811.03378. [ Google Scholar ]
  91. شی، دبلیو. کابالرو، جی. تیس، ال. هوزار، اف. آیتکن، آ. لدیگ، سی. Wang, Z. آیا لایه دکانولوشن مانند لایه کانولوشن است؟ arXiv 2016 , arXiv:1609.07009. [ Google Scholar ]
  92. Kingma، DP; Welling، M. مقدمه ای بر رمزگذارهای خودکار متغیر. arXiv 2019 ، arXiv:1906.02691. [ Google Scholar ] [ CrossRef ]
  93. کوراچ، ک. لوچیچ، م. ژای، ایکس. میچالسکی، م. Gelly، S. یک مطالعه در مقیاس بزرگ در مورد منظم سازی و عادی سازی در GAN ها. در مجموعه مقالات کنفرانس بین المللی یادگیری ماشین، لانگ بیچ، کالیفرنیا، ایالات متحده آمریکا، 9 تا 15 ژوئن 2019. [ Google Scholar ]
  94. هینتون، جنرال الکتریک؛ سریواستاوا، ن. کریژفسکی، آ. سوتسکور، آی. Salakhutdinov، RR بهبود شبکه های عصبی با جلوگیری از سازگاری مشترک آشکارسازهای ویژگی. arXiv 2012 ، arXiv:1207.0580. [ Google Scholar ]
  95. آیوف، اس. Szegedy, C. Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift. arXiv 2015 ، arXiv:1502.03167. [ Google Scholar ]
  96. بنژیو، ی. لورادور، ج. کولوبرت، آر. وستون، جی. یادگیری برنامه درسی. در مجموعه مقالات بیست و ششمین کنفرانس بین المللی سالانه یادگیری ماشین – ICML ’09، مونترال، QC، کانادا، 14 تا 18 ژوئن 2009. صص 1-8. [ Google Scholar ] [ CrossRef ]
  97. پاریسی، GI; کمکر، آر. قسمت، JL; کنان، سی. Wermter, S. یادگیری مستمر مادام العمر با شبکه های عصبی: مروری. شبکه عصبی 2019 ، 113 ، 54–71. [ Google Scholar ] [ CrossRef ] [ PubMed ]
شکل 1. برون یابی ساده برای افزایش وضوح فضایی r>0در طول زمان t برای تصاویر ماهواره ای در دسترس عموم با پوشش جهانی.
شکل 2. داده های جفت IBM و گردش کار پردازش برای تولید نقشه حرارتی تشخیص تغییر OSM. جعبه های چین دار منابع داده و سینک ها را نشان می دهند و جعبه های جامد واحدهای پردازش را در بر می گیرند. ستون سمت راست شبکه های شطرنجی تراز شده (رنگی) به عنوان کاریکاتور نمایه سازی مکانی تو در تو در IBM Pairs عمل می کند.
شکل 3. تصویر پردازش داده برای تشخیص تغییر در داده های OSM از تصاویر هوایی که برای ویژگی های زیرساخت انسانی ترکیبی ساختمان ها و شبکه های جاده ای تجسم شده است. ردیف بالا نمونه‌هایی از داده‌های خام مطالعه ما، شکل 3 a،b، و نقشه تولید شده، شکل 3 c، از fw-CycleGAN را نشان می‌دهد. شکل 3d برچسب گذاری پیکسلی fw-CycleGAN در مقابل حقیقت پایه OSM را به صورت زیر نشان می دهد: TP-OSM و fw-CycleGAN در مورد وجود زیرساخت انسانی توافق دارند (مثبت واقعی). TN – هر دو OSM و fw-CycleGAN زیرساخت انسانی را نشان نمی دهند (منفی واقعی). FP – fw-CycleGAN زیرساخت های انسانی را که توسط OSM از دست رفته است (“مثبت کاذب”) شناسایی می کند. توجه: ما از علامت نقل قول استفاده می کنیم، زیرا بخش قابل توجهی از پیکسل های FP TP هستند. همانطور که از تصویر ماهواره ای حقیقت زمینی آشکار است، شکل 3 a. FN-OSM زیرساخت های انسانی را که توسط fw-CycleGAN از دست رفته برچسب می زند (منفی کاذب). شکل 3 e شکل 3 d را با نشان دادن “مثبت کاذب” (مقدار پیکسل عددی 1 )، فقط روی a (مقدار پیکسل عددی 0 ) کاهش می دهد.).
شکل 4. نقشه حرارتی تشخیص تغییر OSM برای ساختمان ها. طرح یک منطقه مسکونی در حومه جنوب غربی دالاس را به تصویر می کشد. نمودار بالا نقشه استنباط شده توسط fw-CycleGAN آموزش دیده را نشان می دهد. طرح در وسط میزبان کاشی های نقشه OSM بدون متن است. و نوار پایین نمایش RGB از تصاویر NAIP را نشان می دهد که توسط نقشه حرارتی استنباط شده (ر.ک. شکل 3 f) تشخیص تغییر برای ساختمان ها پوشانده شده است – یک نتیجه کلیدی از این کار. برچسب های قرمز Ia، Ib، II و III در پانل میانی به عنوان راهنمایی برای چشم ها برای بحث در متن اصلی عمل می کنند. ما سه قطعه با وسعت فضایی یکسان را به صورت عمودی تراز کردیم.
شکل 5. تشخیص تغییر سلسله مراتب جاده از کدگذاری رنگی OSM. شکل یک اتصال بزرگراه با خروجی های واقع در شمال منطقه مسکونی مورد بحث در شکل 4 را نشان می دهد. پانل بالایی نقشه استنباط شده از fw-CycleGAN آموزش دیده را نشان می دهد. طرح در وسط میزبان کاشی های نقشه OSM بدون متن است. و نوار پایین تصویر NAIP را نشان می دهد.

بدون دیدگاه

دیدگاهتان را بنویسید