چکیده

شناسایی زودهنگام خطرات احتمالی زمین لغزش اهمیت عملی زیادی برای هشدار اولیه و پیشگیری از بلایا دارد. این مطالعه از روش‌های مختلف یادگیری ماشین برای شناسایی زمین لغزش‌های فعال بالقوه در امتداد یک منطقه حائل 15 کیلومتری در دو طرف رودخانه Jinsha (بخش Panzhihua-Huize)، چین استفاده کرد. ویژگی‌های مورفولوژی و بافت زمین لغزش‌ها با داده‌های نظارت بر تغییر شکل InSAR و داده‌های سنجش از دور نوری با وضوح بالا، همراه با 17 عامل تأثیرگذار بر زمین لغزش مشخص شد. در منطقه مورد مطالعه، 83 منطقه تجمع تغییر شکل خطرات احتمالی زمین لغزش و 54 منطقه تجمع تغییر شکل خطرات غیر بالقوه زمین لغزش از طریق تحلیل همپوشانی فضایی با 64 زمین لغزش فعال بالقوه شناسایی شد که با بررسی صحرایی تایید شده است. The Naive Bayes (NB)، الگوریتم‌های درخت تصمیم (DT)، ماشین بردار پشتیبان (SVM) و جنگل تصادفی (RF) از طریق انتخاب ویژگی و بهینه‌سازی پارامتر آموزش و آزمایش شدند. در میان 17 عامل تأثیرگذار زمین لغزش، تراکم زهکشی، NDVI، شیب و درجه هوای نقش ضروری در یادگیری ماشینی و شناسایی خطرات زمین لغزش در منطقه مورد مطالعه ما دارند، در حالی که سایر عوامل تأثیرگذار نقش خاصی را در الگوریتم‌های مختلف بازی می‌کنند. مقایسه چند شاخصی (دقت، یادآوری، F1) نشان می‌دهد که SVM (0.867، 0.829، 0.816) مهارت تشخیص بهتری برای مجموعه‌های داده‌های تغییر شکل زمین لغزش نامتعادل در مقیاس کوچک دارد، و به دنبال آن RF (0.765، 0.751، 0T) (0.751، 0.7). 0.755، 0.756، 0.748) و NB (0.659، 0.659، 0.659). متفاوت از مطالعه قبلی در مورد حساسیت زمین لغزش و نقشه برداری خطر بر اساس یادگیری ماشین، این مطالعه به جای ارزیابی حساسیت زمین لغزش نواحی خاص برای اینکه به ما بگوید کدام مناطق به زمین لغزش حساس‌تر هستند، بر چگونگی کشف نقاط بالقوه زمین لغزش فعال متمرکز است. این مطالعه امکان شناسایی زودهنگام خطرات زمین لغزش را با استفاده از روش‌های مختلف یادگیری ماشین همراه با اطلاعات تغییر شکل و عوامل مؤثر بر زمین لغزش چند منبعی به جای تکیه بر تعامل انسان و رایانه تأیید کرد. این مطالعه نشان می دهد که کارایی شناسایی خطرات بالقوه را می توان افزایش داد و در عین حال سوگیری ذهنی ناشی از تکیه بر متخصصان انسانی را کاهش داد. این مطالعه امکان شناسایی زودهنگام خطرات زمین لغزش را با استفاده از روش‌های مختلف یادگیری ماشین همراه با اطلاعات تغییر شکل و عوامل مؤثر بر زمین لغزش چند منبعی به جای تکیه بر تعامل انسان و رایانه تأیید کرد. این مطالعه نشان می دهد که کارایی شناسایی خطرات بالقوه را می توان افزایش داد و در عین حال سوگیری ذهنی ناشی از تکیه بر متخصصان انسانی را کاهش داد. این مطالعه امکان شناسایی زودهنگام خطرات زمین لغزش را با استفاده از روش‌های مختلف یادگیری ماشین همراه با اطلاعات تغییر شکل و عوامل مؤثر بر زمین لغزش چند منبعی به جای تکیه بر تعامل انسان و رایانه تأیید کرد. این مطالعه نشان می دهد که کارایی شناسایی خطرات بالقوه را می توان افزایش داد و در عین حال سوگیری ذهنی ناشی از تکیه بر متخصصان انسانی را کاهش داد.

کلید واژه ها:

داده های چند منبعی ؛ رانش زمین ; خطرات احتمالی زمین شناسی ; فراگیری ماشین

1. مقدمه

زمین لغزش نوعی بلایای زمین شناسی است که می تواند تلفات جدی و خسارات مالی زیادی را به همراه داشته باشد [ 1 ، 2 ]. ویژگی‌های توپوگرافی و ژئومورفولوژی خاص جنوب غربی چین، مانند ارتفاعات زیاد، کوه‌های متعدد، شیب‌های تند، دره‌های عمیق، سنگ‌ها و خاک‌های شکسته، شیب‌های متعدد و سطوح برشی با پتانسیل لغزش کافی را ایجاد کرده‌اند. این شیب ها شرایط اساسی را برای زمین لغزش هایی که به طور مکرر رخ می دهند تشکیل می دهند [ 1 ]. از جمله، رانش زمین بایگ در اکتبر و نوامبر 2018 در دره رودخانه جینشا باعث خسارات عظیمی در بخش میانی و پایین دست رودخانه جینشا شد [ 2 ].
در زمینه تحقیقاتی زمین لغزش، شناسایی اولیه خطرات احتمالی زمین لغزش موضوعی داغ اما دشوار است [ 3 ، 4 ]. به طور کلی زمین لغزش ها دارای ویژگی های مکانی – زمانی آشکاری هستند. از نظر فضایی، مطالعه زمین لغزش ها را می توان در مقیاس منطقه ای و نقطه ای در نظر گرفت. از نظر زمانی، مطالعه زمین لغزش ها می تواند بر زمان وقوع آنها یا بر خطرات احتمالی زمین لغزش تمرکز کند [ 4 ، 5 ، 6 ]]. مطالعات در مقیاس منطقه ای عمدتاً بر سه جنبه متمرکز هستند: تشخیص زمین لغزش، فهرست نویسی زمین لغزش های تاریخی، و ارزیابی خطر زمین لغزش منطقه ای. این مطالعات در مقیاس منطقه‌ای بر ویژگی‌های طیفی، ویژگی‌های فضایی، ویژگی‌های مورفولوژیکی، و اطلاعات زمینه‌ای زمین لغزش‌ها به دست آمده از تصاویر سنجش از دور چند منبع تکیه می‌کنند. این مطالعات اغلب از روش های شی گرا، SVM، RF و سایر روش های یادگیری ماشین برای شناسایی وقوع زمین لغزش ها و فهرست نویسی آنها استفاده می کنند. سپس ارزیابی ریسک منطقه‌ای زمین لغزش توسط مدل‌های مختلف یادگیری ماشینی و مجموعه‌ای با مدل‌سازی و تحلیل اهمیت عوامل مؤثر در فهرست‌نویسی زمین لغزش و به دست آوردن نقشه‌های حساسیت زمین لغزش تحقق می‌یابد [ 7 ، 8 ، 9 ، 10 ،11 ، 12 ]. مطالعات مقیاس نقطه‌ای بر تحلیل‌های گذشته‌نگر از تکامل مکانی-زمانی یک فاجعه زمین لغزش خاص تمرکز می‌کنند و داده‌هایی را برای نظارت بر شرایط اضطراری و تجزیه و تحلیل یک فاجعه زمین لغزش ارائه می‌کنند. این مطالعات اغلب مبتنی بر سنجش از دور نوری یا راداری هستند و برای پایش و هشدار اولیه خطرات بلایای زمین لغزش، تکامل بلایا، ویژگی‌های خزش قبل از فاجعه و خطرات ثانویه پس از فاجعه مفید هستند [ 6 ، 13 ، 14 ].]. در سال‌های اخیر، با توجه به پیشرفت‌های چشمگیر فناوری InSAR در زمینه پایش تغییر شکل‌های سطحی، مطالعات شروع به استفاده از سری‌های زمانی تداخل سنجی راداری مشاهدات مداری مکرر برای مطالعه خطرات زمین لغزش فعال منطقه‌ای و به‌دست آوردن داده‌های خطرات احتمالی زمین لغزش از طریق تعامل انسان و رایانه کردند. تفسیر [ 15 ، 16]. با این حال، مطالعات قبلی اغلب از تجزیه و تحلیل داده کاوی نتایج تغییر شکل InSAR و همه عوامل مؤثر بر خطرات احتمالی زمین لغزش فعال بهره نمی بردند و رابطه ای بین میزان تغییر شکل سطح و عوامل علت ایجاد نمی کردند، زیرا بر اساس شناسایی زمین لغزش فعال نتایج تغییر شکل از طریق تفسیر تعامل انسان و کامپیوتر کاملتر شده است. یادگیری ماشین ممکن است راه حل بهتری برای تشخیص اینکه کدام مناطق تجمع تغییر شکل خطر زمین لغزش هستند و خطرات غیر لغزش، که یک مشکل پیچیده تر است، ارائه دهد. در مقایسه با روش‌های سنتی، روش‌های یادگیری ماشینی می‌توانند برهمکنش‌های چندگانه پیچیده یا روابط غیرخطی متناسب باشند که دقت پیش‌بینی بالاتری را به همراه دارد. روش‌های یادگیری ماشینی اغلب مکمل خوبی برای روش‌های آماری سنتی و حتی در بسیاری از موارد جایگزین خوبی هستند. علاوه بر این، مطالعات نشان می‌دهد که در مقایسه با مدل‌های رگرسیون آماری یا یادگیری ماشین، یادگیری مجموعه‌ای می‌تواند دقت نگاشت حساسیت زمین لغزش را تا حد معینی بهبود بخشد، که نیاز به بهینه‌سازی و تنظیم مدل پیچیده‌تری دارد. در عین حال، روش‌های مختلف تفاوت‌های زیادی در نمونه‌های داده، انتخاب عوامل مؤثر، تنظیم پارامتر، استحکام مدل و تعمیم دارند.17 , 18 , 19 , 20 , 21 , 22 , 23 , 24 , 25 , 26 , 27 , 28 , 29 ]. یک مشکل فوری در زمینه پایش زمین لغزش و ارزیابی خطر، تعریف چگونگی تجزیه و تحلیل و استخراج عوامل خطر زمین لغزش با استفاده از یادگیری ماشینی برای سنجش از دور چند منبعی، جغرافیای پایه، و داده‌های زمین‌شناسی، و نحوه ایجاد یا انتخاب مدل‌های شناسایی اولیه است. هشدار خطرات احتمالی زمین لغزش بر اساس داده های تغییر شکل.
نتایج تغییر شکل سطح در مقیاس های مختلف می تواند برای تجزیه و تحلیل زمین لغزش ها در مراحل مختلف فعال استفاده شود. نتایج به‌دست‌آمده با داده‌های InSAR نقش مهمی در هشدار اولیه زمین لغزش‌های فعال دارد. انسجام و هندسه تصویری مورد نیاز InSAR آن را برای شناسایی فعال زمین لغزش در میان و پایین دست رودخانه جینشا با ویژگی های معمولی دره خشک و گرم مناسب می کند [ 2 ]]. بنابراین، این مطالعه یک منطقه حایل 15 کیلومتری را در دو طرف دره رودخانه جینشا برای شناسایی خطرات احتمالی زمین لغزش انتخاب کرد. بر اساس نتایج بررسی میدانی خطرات زمین لغزش، داده‌های تغییر شکل سطح InSAR، زمین، شکل زمین، محیط زمین‌شناسی، شاخص‌های پوشش گیاهی و سایر عوامل چند منبع مرتبط زمین لغزش، از طریق تجزیه و تحلیل فضایی و آمار میانگین منطقه‌ای، ویژگی‌های چند منبع – همجوشی- مجموعه داده شامل زمین لغزش و غیر لغزش ساخته شد. و سپس، این مطالعه از چهار روش مختلف یادگیری ماشین برای شناسایی خطرات احتمالی فعال زمین لغزش پس از انتخاب ویژگی و بهینه‌سازی پارامتر استفاده کرد. دقت طبقه‌بندی برای شناسایی روش طبقه‌بندی بهینه برای شناسایی اولیه خطرات زمین لغزش فعال بر اساس داده‌های تجمع تغییر شکل، مقایسه و تجزیه و تحلیل شد.

2. مواد و روشها

2.1. منطقه مطالعه

منطقه مورد مطالعه در بخش میانی و پایین دست (بخش Panzhihua-Huize) رودخانه Jinsha، چین قرار داشت. این بخش از میان کوه‌های هنگدوان جریان دارد و شرایط زمین‌شناسی پیچیده‌ای دارد. لایه ها عمدتاً از سنگ های دگرگونی پیشین، طبقات اندازه گیری زغال سنگ مزوزوئیک، بسترهای قرمز و طبقات پرمین تشکیل شده اند. گسل ها و چین خوردگی ها در منطقه مورد مطالعه به خوبی توسعه یافته اند، عمدتا در جهت شمال-جنوب (NS)، شمال شرقی (NE) و شمال-شمال-شرق (NNE). انواع ژئومورفولوژیک عمدتاً دره های کوهستانی متوسط- مرتفع، سپس حوضه های کوهستانی میانی و شکافی هستند. ارتفاع کوه ها بین 2000 تا 3500 متر و کف دره بین 500 تا 900 متر است.
منطقه مورد مطالعه یک دره معمولی گرم خشک در چین است که توسط آب و هوای موسمی قاره ای گرمسیری کنترل می شود. تابش شدید خورشید منجر به تبخیر سریع در این ناحیه می شود. میانگین دمای روزانه 18 ~ 20 درجه سانتی گراد است، دمای انباشته سالانه به طور کلی 6000 ~ 7500 درجه سانتی گراد است که به مجموع میانگین دمای روزانه در یک دوره زمانی ≥10 درجه سانتی گراد اشاره دارد. بارش سالانه حدود 800 میلی متر است که یک سوم تبخیر سالانه است، تطابق آب و گرما به طور جدی نامتعادل است. شکل زمین منحصر به فرد با زمین های شیب دار و دره عمیق منجر به آب و هوای گرم و خشک در رودخانه جینشا، با توسعه پوشش گیاهی نسبتا کم در دو طرف سواحل می شود. علاوه بر این، به دلیل توسعه مواد معدنی و احیای شیب تند، پوشش گیاهی سطحی کم است و لایه خاک در معرض دید قرار دارد. شرایط زمین شناسی در منطقه مورد مطالعه که در معرض خطر بلایای زمین شناسی است به شدت ناپایدار است. ویژگی های منحصر به فرد منطقه مورد مطالعه برای روش تحلیل زمان بندی فاز دیفرانسیل InSAR بر اساس اهداف منسجم مناسب است.
شکل 1 تصویر سنجش از راه دور ماهواره GaoFen-1 (GF-1) را نشان می دهد.

2.2. داده ها

منابع داده این تحقیق شامل داده های سنجش از دور راداری، داده های سنجش از دور نوری، داده های شکل زمین، داده های اطلاعات جغرافیایی پایه، داده های زمین شناسی پایه و داده های پوشش زمین بود. جزئیات منبع داده در جدول 1 نشان داده شده است.
شکل 2 و شکل 3 نتایج PS-InSAR تغییر شکل صعودی و نزولی را از Sentinel-1 در منطقه مورد مطالعه نشان می دهد. به عنوان مقدمه منطقه مطالعه بخش 2.1 ، روش PS-InSAR برای کار نظارت بر تغییر شکل سطح در منطقه مورد مطالعه مناسب است و نتایج محاسبه شده در میدان مورد تایید قرار می‌گیرند، که مطابقت خوبی با وضعیت واقعی محلی دارد. سایر داده ها در بخش 2.3.2 عوامل مؤثر بر بخش زمین لغزش معرفی خواهند شد.
بر اساس داده های چند دوره ای Sentinel-1 و تصویر نوری Gaofen-1 در لیست داده های جدول 1روش پردازش موقت InSAR و روش تفسیر تعاملی انسان-رایانه بر اساس تجربه متخصص به ترتیب برای به دست آوردن توزیع فضایی ناحیه تجمع تغییر شکل و خطرات احتمالی زمین لغزش فعال در منطقه مورد مطالعه استفاده شد. به منظور حصول اطمینان از صحت شناسایی خطرات زمین لغزش فعال در منطقه مورد مطالعه، این مطالعه بازرسی منطقه همپوشانی و کالیبراسیون مشاهدات خارجی را در فرآیند پردازش داده‌های سری زمانی InSAR معرفی کرد و بررسی میدانی نتایج شناسایی 23 زمین لغزش فعال مشکوک را انجام داد. خطرات که 16 مورد آن به عنوان خطر زمین لغزش فعال شناسایی شد و دقت شناسایی کلی خطرات زمین لغزش فعال در منطقه مورد مطالعه 69.57 درصد بود. که نشان می‌دهد داده‌های بالقوه خطر پنهان لغزش فعال به‌دست‌آمده به دقت بالایی رسیده است، زیرا آنچه که مطالعه بر روی آن تمرکز کرده، زمین لغزش‌های رخ‌داده نیست، بلکه تبعیض و پیش‌بینی خطر پنهان لغزش بالقوه است که هنوز رخ نداده است. سپس بر اساس درک جدید از شرایط بلایا و ویژگی‌های سنجش از دور نوری زمین لغزش‌ها به‌دست‌آمده از راستی‌آزمایی میدانی، نتایج شناسایی خطرات احتمالی زمین لغزش فعال مورد بازنگری قرار گرفت و در نهایت 64 خطر زمین لغزش فعال معمولی در منطقه مورد مطالعه تعیین شد. در همان زمان، با کمک تجزیه و تحلیل پوشش فضایی، مناطق تجمع تغییر شکل نشان دهنده خطرات زمین لغزش و خطرات غیر زمین لغزش متمایز شدند، که یک پایه داده مهم برای ساخت مجموعه داده فراهم می کند. علاوه بر این،جدول 1 ، این مطالعه 17 نوع از نتایج داده های مشخصه خطر زمین لغزش را محاسبه کرد. به منظور ایجاد یک مجموعه داده ویژگی سازگار مقیاس فضایی از شناسایی خطر زمین لغزش فعال برای آموزش مدل و اعتبار سنجی، اندازه شبکه فضایی داده‌های چند منبعی به 30 متر * 30 متر جذب شد. فرآیند یک مجموعه داده مشخصه شناسایی خطر زمین لغزش فعال در بخش 2.3 معرفی خواهد شد . شکل 4 نمونه ای از نتایج راستی آزمایی میدانی خطرات احتمالی زمین لغزش فعال است.

2.3. مواد و روش ها

این مطالعه با کمک داده‌های تغییر شکل InSAR، داده‌های سنجش از دور نوری با وضوح بالا، پس‌زمینه زمین‌شناسی و سایر داده‌های چند منبعی همراه با داده‌های بررسی زمینی، بررسی جامعی از خطرات زمین لغزش فعال در منطقه مورد مطالعه را با رعایت اصل تبعیض انجام داد. تغییر شکل، شکل و تهدید. بر اساس خطرات احتمالی زمین لغزش و منطقه تجمع تغییر شکل معمولی فیلتر شده توسط یک آستانه ایزولاین، 137 رکورد داده از خطرات احتمالی و غیر بالقوه زمین لغزش ثبت شد که شامل 83 رکورد منطقه تجمع تغییر شکل و 54 رکورد منطقه تجمع تغییر شکل بدون لغزش است. ویژگی های ویژگی چند منبعی 137 ناحیه تجمع تغییر شکل با محاسبه و استخراج عوامل مؤثر بر زمین لغزش مانند شکل زمین استخراج شد. زمین شناسی پایه، شرایط هیدرولوژیکی و NDVI. مجموعه های آموزشی (تعداد = 96، 70٪) و مجموعه های اعتبار (n = 41، 30٪) به طور تصادفی ایجاد شد. چهار روش یادگیری ماشینی، یعنی NB، DT، SVM و RF، برای شناسایی خطرات احتمالی زمین لغزش پس از انتخاب ویژگی و بهینه‌سازی پارامتر آموزش داده شدند. در نهایت، مدل بهینه شناسایی خطر احتمالی زمین لغزش در منطقه مورد مطالعه که با ناحیه تجمع تغییر شکل نشان داده می شود، از طریق بررسی و ارزیابی مقایسه به دست آمد. جریان روش شناسی کلی مطالعه در نشان داده شده است برای شناسایی خطرات احتمالی زمین لغزش پس از انتخاب ویژگی و بهینه‌سازی پارامتر آموزش دیدند. در نهایت، مدل بهینه شناسایی خطر احتمالی زمین لغزش در منطقه مورد مطالعه که با ناحیه تجمع تغییر شکل نشان داده می شود، از طریق بررسی و ارزیابی مقایسه به دست آمد. جریان روش شناسی کلی مطالعه در نشان داده شده است برای شناسایی خطرات احتمالی زمین لغزش پس از انتخاب ویژگی و بهینه‌سازی پارامتر آموزش دیدند. در نهایت، مدل بهینه شناسایی خطر احتمالی زمین لغزش در منطقه مورد مطالعه که با ناحیه تجمع تغییر شکل نشان داده می شود، از طریق بررسی و ارزیابی مقایسه به دست آمد. جریان روش شناسی کلی مطالعه در نشان داده شده استشکل 5 .

2.3.1. کاتالوگ خطرات احتمالی زمین لغزش

شناسایی خطر زمین لغزش اساس شناخت خطرات احتمالی زمین لغزش توسط یادگیری ماشینی است. منطقه تجمع تغییر شکل عامل کلیدی تعیین کننده خطر بالقوه زمین لغزش است. بر اساس داده‌های تغییر شکل سطح، در مجموع 137 ناحیه تغییر شکل با ترسیم و فیلتر کردن مناطق غلظت تغییر شکل شناسایی شد. در مجموع 64 خطر احتمالی زمین لغزش با استفاده از تصاویر سنجش از دور نوری با وضوح بالا برای تجزیه و تحلیل ویژگی‌های مورفولوژیکی و خطرات اطراف مناطق تغییر شکل‌پذیر شناسایی شد. این مراحل از طریق تفسیر تعاملی انسان-رایانه و بررسی میدانی همراه با دانش تخصصی انجام شد. مکان خاص و توزیع فضایی مناطق تجمع تغییر شکل و خطرات احتمالی زمین لغزش در منطقه مورد مطالعه نشان داده شده است.شکل 6 .
2.3.2. عوامل موثر بر زمین لغزش
وقوع زمین لغزش اغلب با عوامل زمین شناسی، شرایط هیدرولوژیکی، توپوگرافی، پوشش زمین، فعالیت های انسانی و غیره مرتبط است. ادبیات منتشر شده در مورد حساسیت زمین لغزش در مقیاس جهانی یا منطقه ای تعدادی از عوامل مرتبط با وقوع زمین لغزش را شناسایی می کند. این عوامل عبارتند از ارتفاع، شیب، جنبه، انحنا، زمین شناسی، ساختار، پوشش زمین، فاصله از رودخانه ها و جاده ها و غیره [ 1 ، 26 ].
علاوه بر داده‌های تصویر سنجش از دور نوری و داده‌های پایش تغییر شکل InSAR، این مطالعه 17 عامل تأثیرگذار از جمله توپوگرافی، پس‌زمینه زمین‌شناسی، شرایط هیدرولوژیکی، داده‌های سنجش از دور و فعالیت‌های انسانی را به عنوان متغیرهای ورودی به الگوریتم‌های یادگیری ماشین شناسایی کرد. همانطور که در شکل 7 و جدول 2 نشان داده شده است، شناسایی خطر زمین لغزش مبتنی بر داده ها به جای ارزیابی و تجزیه و تحلیل زمین لغزش مبتنی بر تجربه تخصصی . جدول 2 نیز آمار عددی (میانگین، حداقل، حداکثر) سطح زمین لغزش در منطقه مورد مطالعه را نشان می دهد. پردازش 17 عامل در مجموعه داده در ArcGIS 10.5 پیاده سازی شد.
سپس، بر اساس بخش 2.3.1 و بخش 2.3.2 ، این مطالعه مجموعه داده‌های همجوشی ویژگی ناحیه تغییر شکل سطح را با روش آمار میانگین منطقه‌ای محاسبه کرد، که می‌تواند ناحیه تغییر شکل سطح مبتنی بر چند ضلعی را به نمونه تبدیل کند.
به طور کلی، از نظر توپوگرافی و ژئومورفولوژی، یک زمین نسبتا ملایم با بالای شیب دار مستعد توسعه زمین لغزش است. از نظر زمینه زمین شناسی، توسعه زمین لغزش عمدتاً تحت تأثیر زاویه لایه ها و ساختار زمین شناسی است. اقشار مختلف سختی، فشردگی و حساسیت به هوازدگی و سهم مواد در زمین لغزش متفاوتی دارند. ناپیوستگی های شیب ناشی از گسل در صفحه سازه شرایط را برای وقوع زمین لغزش ایجاد می کند. شرایط هیدرولوژیکی عوامل تعیین کننده اصلی برای توسعه زمین لغزش ها هستند. تفاوت بین زمین لغزش های فعال و زمین لغزش های ناشی از بارندگی در نرم شدن سنگ ها و خاک ناشی از اثر طولانی مدت آب های سطحی و زیرزمینی است که باعث کاهش استحکام سنگ ها و خاک می شود. فشار هیدرودینامیکی و فشار آب منفذی ایجاد می‌کند، چگالی ظاهری سنگ و توده خاک را افزایش می‌دهد و نیروهای شناوری را روی لایه‌های نفوذپذیر، به‌ویژه در سطح لغزش (زون) ایجاد می‌کند که باعث کاهش استحکام کامپوزیت می‌شود. تغییر در پوشش زمین و تأثیر فعالیت های انسانی نیز باعث ایجاد زمین لغزش ها به ویژه تخریب پوشش گیاهی، حفاری در پایه یک شیب، تجمع شیب و سایر فعالیت های مهندسی مخاطره آمیز انسانی از جمله عوامل مهم مؤثر بر وقوع زمین لغزش ها می شود.
2.3.3. الگوریتم های یادگیری ماشین
در ادامه به معرفی مختصری از چهار روش یادگیری ماشینی مورد استفاده در این مطالعه می پردازیم.
  • بیز ساده لوح
Naive Bayes یک الگوریتم یادگیری ماشینی تحلیل آماری بر اساس معیار بیز است. از “فرض استقلال شرطی صفت” برای ساختن یک طبقه‌بندی کننده از یک مدل احتمال و تعیین معیار تصمیم گیری حداکثر احتمال پسین (MAP) استفاده می‌کند تا طبقه‌بندی تصمیم بهینه برای عوامل نامشخص را تحقق بخشد.

فرض کنید یک مورد به صورت X = f 1، f 2، ⋯، fn طبقه بندی شود ، که در آن هر f یک ویژگی مشخصه X است و مجموعه دسته C 1، C 2، ⋯، Cm است، احتمال شرطی را جداگانه محاسبه کنید P ( fn | سانتی متر ). اگر P ( Ck | X ) = MAX ( P ( C 1 | X ), P ( C 2 | X ),…, PCm | X ))، سپس X ∊ Ck ، که بیشترین احتمال را دارد، نتیجه طبقه بندی بیزی است. بیز ساده فرض می کند که هر ویژگی مستقل است، طبق قضیه بیز، می توان آن را استخراج کرد: P ( Ci | X ) = P ( X | Ci ) P ( Ci ) / P ( X ) [ 30 ]. در نهایت، فرمول طبقه‌بندی‌کننده مربوط به الگوریتم Naive Bayes به صورت زیر تعریف می‌شود:

fyف، … ، fn ) =argC ج )nمنFfمن∣∣سیج )��������(�1,…,��)=������ �(�=�)∏���(��=��|�=�)
در میان آنها، fn ویژگی مشخصه X است، p ( C ) احتمال قبلی، و p ( F | C ) احتمال پسین است.
2.
درخت تصمیم
Decision Tree از یکی از ویژگی‌های مشخصه داده‌های نمونه به عنوان شرط طبقه‌بندی استفاده می‌کند، نمونه را به دو زیر مجموعه تقسیم می‌کند و سپس مرتباً طبقه‌بندی را حلقه می‌کند تا هر زیر مجموعه به همان برچسب تعلق داشته باشد. ساختار درختی می تواند به طور موثر مشکل طبقه بندی را مدیریت کند. کلید ساخت یک درخت تصمیم با ویژگی انتخاب شده است. الگوریتم های رایج انتخاب ویژگی برای درخت تصمیم عبارتند از ID3، C4.5 و CART. در میان آنها، هسته الگوریتم ID3 اعمال معیارهای کسب اطلاعات در هر گره درخت تصمیم برای انتخاب ویژگی ها و ساختن درخت تصمیم به صورت بازگشتی است. الگوریتم C4.5 شبیه به فرآیند تولید درخت تصمیم الگوریتم ID3 است و الگوریتم ID3 را بهبود می بخشد، حداکثر نرخ بهره اطلاعات (نسبت) برای انتخاب ویژگی ها استفاده می شود.31 ].

این تحقیق از الگوریتم درخت تصمیم C4.5 استفاده می کند. اطلاعات تقسیم شده توسط الگوریتم به شرح زیر است که تعریف آنتروپی است:

تقسیم _اطلاعاتآ) = 1v|Dj||ورود به سیستم2|Dj||split_info�(�)=−∑�=1�|��||�|log2|��||�|

با توجه به فرمول فوق، فرمول نرخ بهره اطلاعات تعریف شده توسط الگوریتم C4.5 به شرح زیر است:

به دست آوردن _نسبتالف )=g)fالف )gain_ratio(�)=����(�)�����_����(�)
3.
ماشین بردار پشتیبانی
هدف ماشین بردار پشتیبان بدست آوردن یک ابر صفحه جداسازی است که مجموعه داده را به درستی تقسیم می کند و از طریق تبدیل غیرخطی بیشترین بازه هندسی را دارد. بزرگترین مرز جدایی بردار پشتیبان است. نتایج طبقه بندی SVM به انتخاب توابع مختلف هسته، مانند توابع چند جمله ای، توابع سیگموئید و توابع پایه شعاعی بستگی دارد [ 32 ]. تابع هسته مورد استفاده در این مطالعه تابع پایه شعاعی بود.

ایده اصلی SVM محاسبه ابر صفحه جداکننده است: w × x + b = 0، که در آن w بردار نرمال و b است.رهگیری است. برای یک مجموعه داده خطی قابل جداسازی، بی‌نهایت چنین ابرصفحه‌هایی وجود دارد که پرسپترون هستند، اما ابرصفحه جداکننده با بزرگترین بازه هندسی منحصربه‌فرد است. برای مسائل طبقه‌بندی غیرخطی، می‌توان آن را با تبدیل غیرخطی به یک مسئله طبقه‌بندی خطی در فضای مشخصه ابعادی خاص تبدیل کرد و ماشین‌های بردار پشتیبان خطی را می‌توان در فضای ویژگی‌های با ابعاد بالا آموخت. به دلیل مشکل دوگانه SVM خطی، تابع هدف و تابع تصمیم طبقه‌بندی فقط حاصلضرب داخلی بین نمونه و نمونه را دربرمی‌گیرد، بنابراین نیازی به مشخص کردن صریح تبدیل غیرخطی نیست، بلکه حاصلضرب داخلی با هسته جایگزین می‌شود. تابع [ 32 ، 33 ، 34]. به طور خاص، K ( x ، z ) یک تابع است، به این معنی که یک نقشه برداری ɸ ( x ) از فضای ورودی به فضای ویژگی وجود دارد. برای x ، z در هر فضای ورودی،

ک، z) = ∅ ) ∗ ∅ z)�(�,�)=∅(ایکس)∗∅(�)

در مسئله دوگانه یادگیری SVM خطی، جایگزینی حاصلضرب داخلی با تابع هسته K ( x , z )، نتیجه SVM غیرخطی است:

f) = g(1نαمنyمنک_ایکسمن) +ب)�(ایکس)=سمن��(∑من=1ن�من*�منک(ایکس،ایکسمن)+ب*)
4.
جنگل تصادفی
Random Forest یکی از موثرترین روش‌های یادگیری گروهی ناپارامتریک در زمینه یادگیری ماشینی است. این بر اساس استراتژی Bagging است، ویژگی‌های تصادفی را در فرآیند آموزش معرفی می‌کند و از مجموعه داده‌های آموزشی برای تولید درخت‌های تصمیم عمیق متعدد استفاده می‌کند. هر درخت تصمیم که یک جنگل تصادفی را تشکیل می دهد، یک نتیجه خروجی را پیش بینی می کند که با محاسبه وزنی تعداد آرا تعیین می شود. اکثریت رای یک نتیجه خروجی و درجه همگرایی برازش، نتیجه طبقه بندی نهایی را تعیین می کند [ 35 ]. جنگل‌های تصادفی می‌توانند با ایجاد زیرمجموعه‌های تصادفی ویژگی‌ها و استفاده از این زیرمجموعه‌ها برای ساختن درخت‌های تصمیم‌گیری کوچک‌تر و سپس تشکیل زیردرخت‌ها، از اکثر مشکلات بیش‌برازش جلوگیری کنند.

به طور خاص، Random Forest بر اساس Bagging اصلاح شده است. ابتدا از روش Bootstrap برای نمونه برداری از n نمونه از مجموعه داده استفاده کنید، سپس به صورت تصادفی k مشخصه را از همه ویژگی ها انتخاب کنید تا یک درخت CART بسازید و در نهایت مراحل فوق را m بار تکرار کنید تا m درختان CART بسازید. این مدرختان CART یک جنگل تصادفی را تشکیل می دهند و نتیجه رای گیری مشخص می کند که داده ها به کدام دسته تعلق دارند. CART اساساً شبیه به روش های درخت تصمیم مانند ID3.5 و C4.5 است. تفاوت این است که CART از ضریب جینی به عنوان معیار انتخاب ویژگی استفاده می کند. ضریب جینی اساساً تقریبی از به دست آوردن اطلاعات است. هر چه ضریب جینی یک ویژگی بزرگتر باشد، توانایی آن ویژگی برای کاهش آنتروپی نمونه قوی تر است. این ویژگی داده ها را از عدم قطعیت به قطعیت قوی تر می کند. فرمول به شرح زیر است:

جینی ) =1کپک1- _پک) = 1کپ2ک1ک(|سیک||)2جینی(پ)=∑ک=1کپک(1-پک)=1-∑ک=1کپک2=1-∑ک=1ک(|سیک||�|)2
قبل از آموزش مدل، ابتدا باید انتخاب ویژگی و بهینه‌سازی پارامتر انجام شود تا اطمینان حاصل شود که الگوریتم‌های مختلف وظایف طبقه‌بندی را تحت مجموعه و پارامترهای ویژگی (زیر مجموعه) بهینه انجام می‌دهند. یک استراتژی ارزیابی ویژگی را می توان به Wrapper و Filter تقسیم کرد. اولی بر ارزیابی زیرمجموعه ویژگی ها تمرکز دارد، دومی بر ارزیابی ویژگی های منفرد تمرکز دارد. استراتژی‌های ارزیابی مختلف برای Wrapper و Filter روش‌های جستجوی متفاوتی دارند و استراتژی‌های انتخاب ویژگی باید بر اساس الگوریتم‌های مختلف انتخاب شوند [ 36 , 37 , 38 , 39 , 40]. برای یک الگوریتم خاص، سه روش اصلی برای بهینه‌سازی پارامتر وجود دارد: انتخاب پارامتر CV، جستجوی شبکه‌ای و جستجوی چندگانه. اصول انتخاب روش های بهینه سازی پارامتر با توجه به تعداد پارامترهایی که باید بهینه شوند متفاوت است:
(1) اگر بیش از دو پارامتر برای بهینه سازی وجود نداشته باشد، Grid-search انتخاب می شود و مرز به طور خودکار گسترش می یابد.
(2) اگر بیش از دو پارامتر نیاز به بهینه سازی داشته باشد، جستجوی چندگانه انتخاب می شود.
(3) اگر پارامترهای مستقیم طبقه‌بندی‌کننده بهینه شده باشند و تعداد پارامترها بیشتر از دو نباشد، می‌توان انتخاب پارامتر CV را نیز در نظر گرفت.
روش های بهینه سازی پارامترهای مختلف با توجه به الگوریتم های مختلف [ 38 ] انتخاب می شوند. استراتژی انتخاب ویژگی و روش بهینه سازی پارامتر در جدول 3 نشان داده شده است.
تابع ارزیابی ویژگی که مطالعه مورد استفاده قرار گرفت WrapperSubsetEval و CorrelationAttributeEval بود، WrapperSubsetEval مجموعه‌های ویژگی‌ها را با استفاده از یک طرح یادگیری ارزیابی می‌کند. اعتبار متقابل برای تخمین دقت طرح یادگیری برای مجموعه ای از ویژگی ها استفاده می شود [ 38 ]. CorrelationAttributeEval ارزش یک ویژگی را با اندازه گیری همبستگی آن (پیرسون) با کلاس [ 39 ] ارزیابی می کند.
استراتژی جستجوی مورد استفاده مطالعه Ranker، BestFirst و GreedyStepwise بود. Ranker از یک ارزیاب ویژگی/زیرمجموعه برای رتبه بندی همه ویژگی ها استفاده می کند. اگر یک ارزیاب زیرمجموعه مشخص شده باشد، از جستجوی انتخاب پیش رو برای ایجاد یک لیست رتبه بندی استفاده می شود. از فهرست رتبه‌بندی ویژگی‌ها، زیرمجموعه‌های افزایش اندازه ارزیابی می‌شوند، یعنی بهترین ویژگی، بهترین ویژگی به علاوه بهترین ویژگی بعدی و غیره. بهترین مجموعه ویژگی گزارش می‌شود. اگر از یک ارزیاب صفت ساده مانند GainRatioAttributeEval استفاده شود، RankSearch از نظر تعداد صفات خطی است. BestFirst فضای زیرمجموعه‌های ویژگی‌ها را توسط Hill_Climbing حریص که با امکانات عقب‌نشینی افزوده شده است، جستجو می‌کند. [ 40] تنظیم تعداد گره های متوالی غیربهبود مجاز برای کنترل سطح عقبگرد انجام شده. بهترین ممکن است ابتدا با مجموعه خالی از ویژگی ها شروع شود و به جلو جستجو کند، یا با مجموعه کامل ویژگی ها شروع کند و به عقب جستجو کند، یا از هر نقطه شروع کند و در هر دو جهت جستجو کند (با در نظر گرفتن تمام اضافات و حذف های ممکن منفرد در یک نقطه مشخص ) GreedyStepwise یک جستجوی حریصانه به جلو یا عقب را در فضای زیرمجموعه‌های ویژگی انجام می‌دهد و ay با هیچ/همه ویژگی‌ها یا از یک نقطه دلخواه در فضا شروع می‌کند. زمانی که افزودن/حذف هر صفت باقیمانده منجر به کاهش ارزشیابی شود، متوقف می شود. همچنین می‌تواند با پیمایش فضا از یک طرف به سمت دیگر و ثبت ترتیب انتخاب ویژگی‌ها، فهرستی رتبه‌بندی شده از ویژگی‌ها تولید کند. روش‌های بهینه‌سازی پارامتر CVParameterSelection و GridSearch بودند. CVParameterSelection از روش اعتبارسنجی متقابل استفاده می کند، هر تعدادی از پارامترها را می توان بهینه کرد. GridSearch به جای تمام ترکیبات پارامترها در آزمایش برای انتخاب پارامترها استفاده می شود و حداکثر دو پارامتر را می توان بهینه کرد.
2.3.4. ارزیابی دقت
تعدادی از شاخص‌های دقت آزمون الگوریتم‌های مختلف از جمله طبقه‌بندی صحیح، نرخ مثبت واقعی (TP)، نرخ مثبت کاذب (FP)، دقت نرخ منفی کاذب (FN)، فراخوان، F1 و AUC (محدوده زیر ROC) به دست آمد. منحنی). طبقه بندی صحیح نشان دهنده درصد طبقه بندی صحیح است که نشان دهنده نسبت طبقه بندی صحیح TP و منفی واقعی است. TP Rate نسبت نمونه های مثبت را با طبقه بندی صحیح منعکس می کند.

دقت نرخ دقت است که برای اندازه گیری توانایی الگوریتم طبقه بندی در رد اطلاعات نامربوط استفاده می شود، دقت به صورت زیر محاسبه می شود:

دقت = TP/(TP + FP)

Recall نسبت Recall است که برای اندازه‌گیری توانایی الگوریتم طبقه‌بندی برای تشخیص اطلاعات مربوطه استفاده می‌شود و به صورت زیر محاسبه می‌شود:

فراخوان = TP/(TP + FN)

F-Measure (F1) میانگین هارمونیک دقت و فراخوان است و به صورت زیر محاسبه می شود:

F-Measure = (2 × فراخوان × دقت)/( فراخوان + دقت) = (2 × TP)/(2 × TP + FP + FN)
AUC معمولاً بیشتر از 0.5 است. هر چه این مقدار به 1 نزدیکتر باشد، اثر طبقه بندی مدل بهتر است.

3. نتایج

بر اساس فرآیندهای نشان داده شده در شکل 6 . این مطالعه انتخاب ویژگی، نتایج طبقه‌بندی و شاخص دقت الگوریتم‌های مختلف را با کمک WEKA 3.8.4 به دست آورد.

3.1. نتایج شاخص مرجع انتخاب ویژگی

همانطور که از جدول 3 مشاهده می شود ، الگوریتم های مختلف استراتژی های انتخاب ویژگی متفاوتی را اتخاذ می کنند. جدول 4 ضریب همبستگی محصول- لحظه پیرسون را برای انتخاب ویژگی ها در NB نشان می دهد و جدول 5 نتایج اعتبار سنجی متقاطع را برای انتخاب ویژگی DT، SVM و RF نشان می دهد. انتخاب ویژگی با توجه به نتایج شاخص مرجع استراتژی‌های مختلف انتخاب ویژگی اتخاذ شده توسط الگوریتم در جدول 4 و جدول 5 انجام شد. ویژگی‌های با ضریب همبستگی بالا توسط NB حذف شدند، و ویژگی‌های با “تعداد چین‌ها (٪ = 0” توسط DT، SVM و RF حذف شدند.

3.2. نتایج و دقت شناسایی خطرات احتمالی زمین لغزش

الگوریتم‌ها با استفاده از 70 درصد داده‌ها در مجموعه داده ترکیبی ویژگی خوشه‌ای تغییر شکل‌پذیر آموزش داده شدند و روی 30 درصد باقی‌مانده مجموعه داده آزمایش شدند. این مقاله همانطور که در جدول 6 نشان داده شده است، ماتریس سردرگمی نتایج طبقه بندی بر روی مجموعه های آزمایشی را دریافت کرد و نتایج پیش بینی روش های مختلف را می توان در شکل 8 مشاهده کرد.
بر اساس جدول 6 ، مطالعه شاخص طبقه بندی صحیح را به دست آورد، همانطور که در شکل 9 نشان داده شده است ، که مقایسه کلی شاخص های طبقه بندی صحیح را نشان می دهد. شاخص های کلی طبقه بندی صحیح، از بالا به پایین، SVM > RF = DT > NB هستند. این نتیجه نشان می‌دهد که الگوریتم SVM بهترین عملکرد را در دقت طبقه‌بندی مجموعه‌های داده دارد و به دنبال آن RF و DT قرار دارند و بدترین عملکرد با NB است.
در عین حال، عملکرد کلی، عملکرد نمونه مثبت (Landslide) و عملکرد نمونه منفی (Non-Landslide) الگوریتم‌های مختلف با توجه به شاخص‌های ارزیابی مختلف مجموعه آزمون مقایسه شد. تعدادی از شاخص‌های دقت آزمون الگوریتم‌های مختلف، از جمله نرخ مثبت واقعی (TP)، نرخ مثبت کاذب (FP)، دقت نرخ منفی کاذب (FN)، یادآوری و F1 الگوریتم‌ها محاسبه شد. جدول 7 نتایج شاخص دقت را نشان می دهد.
همانطور که از شکل 10 مشاهده می شود ، SVM دارای بالاترین نرخ مثبت واقعی در نمونه های مثبت و منفی، کمترین نرخ مثبت کاذب در نمونه های مثبت و منفی، بالاترین نرخ دقت، بالاترین نرخ فراخوان، و به دنبال آن RF، DT و NB، بر اساس TP Rate، FP Rate، Precision، Recall و F1.
وقتی AUC 0.5-0.7 باشد، الگوریتم ها دقت پایینی دارند و زمانی که بیشتر از 0.7 باشد قابل اعتمادتر هستند. بنابراین، این مطالعه منحنی ROC و AUC 4 الگوریتم را محاسبه کرد و نتایج در جدول 8 و شکل 11 نشان داده شده است. نتایج نشان می‌دهد که الگوریتم RF دارای بزرگترین AUC است و SVM از نزدیک به‌دنبال آن است. اینها توسط DT و NB دنبال شدند. بنابراین، مشاهده می شود که RF، SVM و DT قابل اعتمادتر بودند.

4. بحث

در این مطالعه، مدل‌های مختلف یادگیری ماشینی برای محاسبه و پیش‌بینی خطرات احتمالی زمین لغزش برای مجموعه داده‌های چند منبعی استفاده شد. استفاده گسترده از تکنیک‌های سنجش از دور، داده‌ها و اطلاعات مربوط به تغییر شکل سطح و عوامل مؤثر بر زمین‌لغزش (به عنوان مثال، توپوگرافی و زمین‌شناسی)، و موقعیت‌های اخیر آنها را برای مطالعه ما در دسترس قرار داده است. داده‌های Sentinel-1 SAR و اطلاعات تغییر شکل حاصل از داده‌های سنجش از دور نوری در منطقه به ما کمک کرد تا نقشه موجودی را تهیه کنیم، که مبنایی برای آموزش و اعتبارسنجی الگوریتم‌های یادگیری ماشینی مورد استفاده در این مطالعه بود.
با استفاده از مجموعه داده های موجود از منطقه مورد مطالعه، 17 عامل تأثیرگذار محاسبه شد. قبل از آموزش مدل، عامل همبستگی پیرسون یا تجزیه و تحلیل اعتبار متقابل 10 برابری برای انتخاب ویژگی ویژگی مدل‌های مختلف استفاده شد. مرحله تجزیه و تحلیل انتخاب ویژگی به این نتیجه رسید که مدل‌های مختلف وابستگی متفاوتی به 17 عامل تأثیرگذار زمین لغزش دارند. در مرحله بعد، نمونه‌های آموزشی نواحی غلظت تغییر شکل با عوامل تأثیرگذار به چهار مدل یادگیری ماشینی وارد شدند. در نهایت، منطقه غلظت تغییر شکل به کلاس های زمین لغزش / غیر لغزش طبقه بندی شد.
انتخاب ویژگی‌های ویژگی بر دقت طبقه‌بندی الگوریتم یادگیری ماشین تأثیر می‌گذارد. یک الگوریتم می‌تواند نتایج طبقه‌بندی متفاوتی بر روی زیرمجموعه‌های ویژگی ویژگی‌های مختلف داشته باشد، و الگوریتم‌های مختلف می‌توانند نتایج طبقه‌بندی متفاوتی بر روی یک مجموعه داده یا همان زیرمجموعه ویژگی ویژگی داشته باشند. این با چندین مطالعه قبلی، یعنی [ 10 ، 11 ، 12 ، 19 ] مطابقت دارد. آنچه متفاوت است این است که عوامل موثر بر زمین لغزش انتخاب شده توسط چهار روش در این مطالعه با مطالعات قبلی متفاوت است [ 16 ، 17 ، 18 ، 19 ، 20 ، 21 ،22 ، 23 ، 24 ، 25 ، 26 ، 27 ، 28 ، 29 ]. به این دلیل که عوامل کنترل زمین لغزش در مناطق مختلف متفاوت است که منجر به تفاوت در انتخاب متغیر می شود. با توجه به نتایج در بخش 3 ، چهار الگوریتم زیرمجموعه های ویژگی های مختلف را در مرحله آموزش مدل آموزشی انتخاب کردند. همانطور که از جدول 9 مشاهده می شودچهار ویژگی مشخصه توسط همه الگوریتم‌ها انتخاب شدند: تراکم زهکشی، NDVI، شیب و درجه هوا. شش ویژگی مشخصه با سه الگوریتم انتخاب شدند: ارتفاع، جهت، فاصله خطا، نمایه منحنی، شاخص توپوگرافی و تسکین توپوگرافی. دو الگوریتم چهار ویژگی مشخصه را انتخاب کردند: پوشش زمین، PlanCurv، فاصله رودخانه و ناهمواری توپوگرافی. فقط یک الگوریتم فاصله جاده را به عنوان ویژگی مشخصه انتخاب کرد. دو ویژگی Curv و SlopeLength Factor توسط هیچ الگوریتمی انتخاب نشدند که ممکن است به دلیل همبستگی بین سایر ویژگی ها باشد.
اعتبارسنجی چهار مدل نشان داد که SVM قابل اعتمادترین روش بود که بهترین نرخ پیش‌بینی را در مجموعه داده‌های همجوشی صفت خوشه‌بندی تغییر شکل‌پذیر نشان داد و پس از آن RF و DT قرار گرفتند، در حالی که NB بدترین عملکرد را داشت. این امر بر توانایی طبقه‌بندی SVM در نمونه‌های کوچک با ویژگی‌های ابعادی بالا به دلیل استفاده از تابع هسته غیرخطی SVM تأکید می‌کند. در مقایسه با تحقیقات مرتبط نقشه‌برداری حساسیت زمین لغزش بر اساس یادگیری ماشین، نتایج طبقه‌بندی SVM و RF با مطالعات قبلی سازگاری بهتری دارد [ 16 ، 20 ، 23 ، 25 ، 26 ، 27 ، 28 ، 29 ]. جدول 8و شکل 11دقت و قابلیت اطمینان چهار مدل یادگیری ماشین را بر اساس ناحیه ROC ارائه می دهد، که از آن می توان فهمید که RF بالاترین قابلیت اطمینان را دارد و به دنبال آن SVM و DT قرار دارند، در حالی که NB قابلیت اطمینان پایینی دارد. در مقایسه با چهار مدل یادگیری ماشین، NB کارایی طبقه‌بندی پایدارتری دارد و توضیح نتایج طبقه‌بندی آسان است، اما میزان خطای مشخصی در تصمیم‌گیری طبقه‌بندی وجود دارد. DT دارای قوانین طبقه بندی ساده، راندمان عملیات بالا است، اما تولید بیش از حد برازش پدیده آسان است. SVM دقت بالایی دارد که تضمین نظری برای جلوگیری از برازش می دهد و برای مقابله با مسائل غیرخطی مناسب است و قابلیت تعمیم قوی دارد اما نیاز به تنظیم پارامتر دارد. به عنوان یک مدل یادگیری گروهی، RF دارای راندمان آموزشی بالا و بدون پارامتر است و قابلیت اجرایی قوی دارد.17 ، 20 ، 22 ، 23 ، 26 ، 27 ، 28 ، 29 ]. این مطالعه امکان سنجی شناسایی زودهنگام خطرات زمین لغزش را با استفاده از روش های مختلف یادگیری ماشینی همراه با اطلاعات تغییر شکل و عوامل موثر بر زمین لغزش چند منبعی به جای تکیه بر تعامل انسان و کامپیوتر تأیید کرد، که نشان می دهد کارایی شناسایی خطرات بالقوه می تواند افزایش یافت و در عین حال سوگیری ذهنی ناشی از تکیه بر متخصصان انسانی را کاهش داد.

5. نتیجه گیری ها

بر اساس 64 خطر بالقوه تغییر شکل آشکار شناسایی شده در منطقه مورد مطالعه، 83 منطقه تجمع تغییر شکل و 54 منطقه تجمع تغییر شکل غیر لغزشی به دست آمد. با استفاده از داده‌های چند منبعی مانند داده‌های سنجش از دور، DEM، DLG، زمین‌شناسی پایه و پوشش زمین، 17 عامل تأثیرگذار زمین لغزش مورد تجزیه و تحلیل و استخراج قرار گرفت. از طریق تجزیه و تحلیل فضایی و آمار میانگین منطقه‌ای، مجموعه داده‌های همجوشی ویژگی شامل خطر زمین لغزش و منطقه غلظت تغییر شکل خطر غیرلغزش تشکیل شد. در این مطالعه از چهار الگوریتم یادگیری ماشینی به نام‌های NB، DT، SVM و RF برای طبقه‌بندی و شناسایی مناطق تجمع تغییر شکل خطرات احتمالی زمین لغزش و خطرات غیر بالقوه زمین لغزش استفاده شد.
در همان زمان، الگوریتم های مختلف وابستگی متفاوتی به 17 عامل تأثیرگذار زمین لغزش داشتند که از میان آنها NB 13 عامل قابل انتساب، DT 10 عامل قابل انتساب، SVM 6 عامل قابل انتساب و RF 14 عامل را انتخاب کرد. الگوریتم SVM کمترین ویژگی را انتخاب کرد، اما بهترین نتایج طبقه بندی را داشت. مشاهده می شود که SVM می تواند نتایج بهتری نسبت به سایر الگوریتم ها در مجموعه داده محدود نامتعادل کوچک داشته باشد. با این حال، به دلیل حجم زیادی از محاسبات درگیر با الگوریتم SVM، گسترش آن به مجموعه داده های بزرگ دشوار است و کارایی آن کمتر از سه الگوریتم دیگر است. RF به خوبی زمانی که برای پردازش داده های با ابعاد بالا و داده های از دست رفته استفاده می شود، عمل نمی کند، زیرا ممکن است طبقه بندی خوبی برای مجموعه داده های نمونه کوچک ایجاد نکند. الگوریتم DT به راحتی می تواند همبستگی بین ویژگی ها را در مجموعه داده ها نادیده بگیرد. برای داده هایی با تعداد نمونه های مختلف، DT ویژگی های متفاوتی را انتخاب می کند. الگوریتم NB زمانی که درجه همبستگی ویژگی های نمونه بالا باشد به دلیل استقلال ویژگی های نمونه خوب کار نمی کند.
با توجه به نتایج انتخاب 17 عامل مؤثر بر زمین لغزش ( جدول 9 )، تراکم زهکشی، NDVI، شیب و درجه هوازدگی نقش مهمی در یادگیری ماشینی و شناسایی خطرات زمین لغزش دارند. و به عنوان عوامل مهم شناسایی خطر زمین لغزش، ارتفاع، جهت، فاصله گسل، منحنی نمایه، شاخص توپوگرافی، تسکین توپولوژیکی، پوشش زمین، PlanCurv، فاصله رودخانه، ناهمواری توپوگرافی و فاصله جاده برای روش‌های مختلف یادگیری ماشین انتخاب شدند. با این حال، ضریب طول منحنی و شیب هیچ اثر آشکاری در این مطالعه نداشتند، که ممکن است همبستگی قوی با یک یا برخی از 17 عامل داشته باشد. اما اهمیت عوامل مختلف در الگوریتم سازگار نیست.
به طور خلاصه، این مطالعه راه حل بهتری برای تشخیص اینکه کدام مناطق تجمع تغییر شکل بر اساس تغییر شکل سطح و عوامل تأثیرگذار زمین لغزش، که یک مشکل پیچیده‌تر است، مخاطرات زمین لغزش و خطرات غیر لغزش هستند، ارائه می‌کند. در مقایسه با روش‌های سنتی، روش یادگیری ماشینی می‌تواند برهمکنش‌های چندگانه پیچیده یا روابط غیرخطی مناسب باشد، که دقت پیش‌بینی بالاتری را به همراه دارد. این مطالعه مبتنی بر مطالعه تطبیقی ​​الگوریتم‌های مختلف یادگیری ماشین در زمینه‌های انتخاب ویژگی ویژگی و بهینه‌سازی پارامتر است. علیرغم ارائه دقت خاصی در پیش‌بینی زمین لغزش، نتایج مدل‌های مختلف شناسایی زمین لغزش به دلیل متغیرهای ورودی مختلف و مبنای نظری الگوریتم، مستعد عدم توافق مکانی-زمانی هستند. و بنابراین، عدم قطعیت ها. عدم قطعیت در نتایج مدل های مختلف شناسایی زمین لغزش، چالش هایی را در انتخاب مناسب ترین روش برای مدیریت این پدیده پیچیده طبیعی ایجاد می کند. به منظور کاهش این عدم قطعیت ها، در آینده، این مطالعه تحقیقات بیشتری را بر روی استخراج خودکار مناطق تجمع تغییر شکل سطحی انجام خواهد داد، که اساس دقت تشخیص زمین لغزش فعال بالقوه را تعیین می کند. یک روش شناسایی زمین لغزش مبتنی بر یادگیری گروهی مورد مطالعه قرار خواهد گرفت، که می تواند به طور قابل توجهی دقت و قطعیت پیش بینی ها را با سرکوب نقاط ضعف و مضرات هر مدل فردی بهبود بخشد تا تأثیر عدم قطعیت بر نتایج بالقوه شناسایی زمین لغزش فعال را کاهش دهد. تا حدودی.

منابع

  1. خو، Q. دونگ، XJ; Li, WL سیستم یکپارچه تشخیص زودهنگام، نظارت و هشدار فضا-هوا-زمین برای مخاطرات زمینی فاجعه آمیز بالقوه. Geomat. Inf. علمی دانشگاه ووهان 2019 ، 44 ، 957–966. [ Google Scholar ]
  2. جنرال الکتریک، DQ؛ دای، KR؛ Guo، ZC; Li, ZH شناسایی اولیه خطرات زمین‌شناسی جدی با فناوری‌های سنجش از دور یکپارچه: افکار و توصیه‌ها. Geomat. Inf. علمی دانشگاه ووهان 2019 ، 44 ، 949–956. [ Google Scholar ] [ CrossRef ]
  3. مارکو، اس. لورا، ال. والنتینا، م. مونیکا، پی. سنجش از دور برای تحقیقات زمین لغزش: مروری بر دستاوردها و چشم اندازهای اخیر. Remote Sens. 2014 , 6 , 9600–9652. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  4. ژائو، سی. Lu, Z. سنجش از دور زمین لغزش – بررسی. Remote Sens. 2018 , 10 , 279. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  5. Kirschbaum، DB; فوکوکا، اچ. سنجش از دور و مدل‌سازی زمین لغزش‌ها: تشخیص، پایش و ارزیابی ریسک. محیط زیست علوم زمین 2012 ، 66 ، 1583. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  6. تازیو، اس. کریستین، آ. Hugo, R. تفسیر عکس های هوایی و تداخل سنجی SAR ماهواره ای برای فهرست زمین لغزش ها. Remote Sens. 2013 , 5 , 2554–2570. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  7. کیرشباوم، دی. استنلی، تی. ژو، ی. تجزیه و تحلیل مکانی و زمانی کاتالوگ جهانی زمین لغزش. ژئومورفولوژی 2015 ، 249 ، 4-15. [ Google Scholar ] [ CrossRef ]
  8. جوانگ، CS; استانلی، TA; Kirschbaum، DB استفاده از علم شهروندی برای گسترش نقشه جهانی زمین لغزش: معرفی مخزن زمین لغزش آنلاین باز تعاونی. PLoS ONE 2019 , 14 , e0218657. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  9. حمید، ع. جیسون، KL; Wang, X. فجایع زمین لغزش و کاهش خطر بلایا: یک چارچوب GIS برای پیشگیری و مدیریت زمین لغزش. Remote Sens. 2010 , 2 , 2259–2273. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  10. کیرشباوم، دی. استنلی، تی. Yatheendradas، S. مدل‌سازی حساسیت زمین لغزش در مناطق بزرگ با پوشش فازی. زمین لغزش 2016 ، 13 ، 485-496. [ Google Scholar ] [ CrossRef ]
  11. استنلی، تی. Kirschbaum، DB یک رویکرد اکتشافی به نقشه برداری جهانی حساسیت زمین لغزش. نات. خطرات 2017 ، 87 ، 145-164. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  12. پیرالیلو، ST; شهابی، ح. جاریانی، ب. قربانزاده، ا. بلاشکه، تی. غلام نیا، ک. مینا، اس آر. Aryal, J. تشخیص زمین لغزش با استفاده از تقسیم‌بندی تصویر در مقیاس چندگانه و مدل‌های مختلف یادگیری ماشین در هیمالیاهای عالی. Remote Sens. 2019 , 11 , 2575. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  13. ژائو، سی. کانگ، ی. ژانگ، Q. لو، ز. Li، B. شناسایی و پایش زمین لغزش در امتداد حوضه آبریز رودخانه جینشا (منطقه مخزن Wudongde)، چین، با استفاده از روش InSAR. Remote Sens. 2018 , 10 , 993. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  14. تانگ، پی. چن، اف. گوا، اچ. تیان، بی. وانگ، ایکس. Ishwaran، N. نظارت بر زمین لغزش در منطقه بزرگ با استفاده از تکنیک پیشرفته InSAR چند زمانی بر روی زیستگاه پانداهای غول پیکر، سیچوان، چین. Remote Sens. 2015 ، 7 ، 8925–8949. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  15. لیو، ی. لو، ز. ژائو، سی. کیم، جی. ژانگ، کیو. De La Fuente، J. خصوصیات سینماتیک زمین لغزش سه خرس در شمال کالیفرنیا با استفاده از مشاهدات InSAR باند L. Remote Sens. 2019 , 11 , 2726. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  16. Tien Bui، DT; شهابی، ح. شیرزادی، ع. چاپی، ک. علیزاده، م. چن، دبلیو. محمدی، ع. بن احمد، بی. پناهی، م. هونگ، اچ. و همکاران شناسایی زمین لغزش و نگاشت حساسیت توسط داده های AIRSAR با استفاده از ماشین پشتیبان Vevtor و شاخص مدل های آنتروپی در کامرون هایلندز، مالزی. Remote Sens. 2018 , 10 , 1527. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  17. آچور، ی. پورقاسمی، منابع انسانی چگونه تکنیک‌های یادگیری ماشینی به افزایش دقت نقشه‌های حساسیت زمین لغزش کمک می‌کنند؟ Geosci. جلو. 2019 ، 11 ، 871-883. [ Google Scholar ] [ CrossRef ]
  18. کدوی، روابط عمومی; لی، سی دبلیو; لی، اس. کاربرد مدل‌های یادگیری ماشینی مبتنی بر مجموعه برای نقشه‌برداری حساسیت زمین لغزش. Remote Sens. 2018 , 10 , 1252. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  19. ولی، وی. حمید، ر.پ. محمد، ز. توماس، بی. نقشه‌برداری حساسیت زمین لغزش با استفاده از الگوریتم‌های داده کاوی مبتنی بر GIS. Water 2019 , 11 , 2292. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  20. کلانتر، بی. پرادان، بی. نقیبی، س. متولی، ع. منصور، اس. ارزیابی اثرات انتخاب داده‌های آموزشی بر روی نقشه‌برداری حساسیت زمین لغزش: مقایسه بین ماشین بردار پشتیبان (SVM)، رگرسیون لجستیک (LR) و شبکه‌های عصبی مصنوعی (ANN). Geomat. نات. خطر خطرات 2018 ، 9 ، 49-69. [ Google Scholar ] [ CrossRef ]
  21. فام، بی تی؛ شیرزادی، ع. Bui، DT; پراکاش، آی. رویکرد گروه یادگیری ماشین Ahybrid Dholakia، MB مبتنی بر شبکه عصبی تابع پایه شعاعی و جنگل چرخشی برای مدل‌سازی حساسیت زمین لغزش: مطالعه موردی در منطقه هیمالیا، هند. بین المللی J. Sediment Res. 2018 ، 33 ، 157-170. [ Google Scholar ] [ CrossRef ]
  22. عربامری، ع. پرادان، بی. رضایی، ک. لی، CW ارزیابی حساسیت زمین لغزش با استفاده از مدل یکپارچه FR-RF مبتنی بر هوش مصنوعی و آماری و DEM های چند وضوحی. Remote Sens. 2019 , 11 , 999. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  23. گوتز، JN; برنینگ، آ. پتچکو، اچ. لئوپولد، پی. ارزیابی تکنیک‌های یادگیری ماشین و پیش‌بینی آماری برای مدل‌سازی حساسیت زمین لغزش. محاسبه کنید. Geosci. 2015 ، 81. [ Google Scholar ] [ CrossRef ]
  24. گلوفکو، دی. روسنر، اس. بهلینگ، ر. وتزل، H.-U.; Kleinschmit، B. ارزیابی موجودی زمین لغزش مبتنی بر سنجش از دور برای ارزیابی خطر در جنوب کورگیزستان. Remote Sens. 2017 , 9 , 943. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  25. پارک، اس جی. لی، سی.- دبلیو. لی، اس. لی، ام.-جی. نقشه‌برداری و مقایسه حساسیت زمین لغزش با استفاده از مدل‌های درخت تصمیم: مطالعه موردی منطقه جومونجین، کره. Remote Sens. 2018 , 10 , 1545. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  26. چن، دبلیو. پنگ، جی. هونگ، اچ. شهابی، ح. پرادان، بی. لیو، جی. زو، A.-X. پی، ایکس. Duan، Z. مدل‌سازی حساسیت زمین لغزش با استفاده از تکنیک‌های یادگیری ماشین مبتنی بر GIS برای شهرستان Chongren، استان جیانگشی، چین. علمی کل محیط. 2018 ، 626 ، 1121-1135. [ Google Scholar ] [ CrossRef ]
  27. عدنان، م. رحمان، س. احمد، ن. احمد، بی. خاخام، اف. رحمان، ر. بهبود توافق فضایی در نگاشت حساسیت زمین لغزش مبتنی بر یادگیری ماشین. Remote Sens. 2020 , 12 , 3347. [ Google Scholar ] [ CrossRef ]
  28. کلانتر، بی. اوئدا، ن. سعیدی، و. احمدی، ک. هالین، AA; شعبانی، ف. نقشه‌برداری حساسیت زمین لغزش: یادگیری ماشینی و مجموعه‌ای بر اساس داده‌های بزرگ سنجش از دور. Remote Sens. 2020 ، 12 ، 1737. [ Google Scholar ] [ CrossRef ]
  29. چن، دبلیو. Li.، Y. ارزیابی مبتنی بر GIS حساسیت زمین لغزش با استفاده از مدل‌های هوش محاسباتی ترکیبی. Catena 2020 , 195 , 104777. [ Google Scholar ] [ CrossRef ]
  30. جورج، اچ. جان، PL تخمین توزیع مداوم در طبقه‌بندی‌کننده‌های بیزی. در یازدهمین کنفرانس عدم قطعیت در هوش مصنوعی ; Morgan Kaufmann ناشران: San Mateo، CA، USA، 1995; صص 338-345. [ Google Scholar ]
  31. Ross, Q. C4.5: Programs for Machine Learning ; مورگان کافمن ناشران: سن متئو، کالیفرنیا، ایالات متحده آمریکا، 1993. [ Google Scholar ]
  32. Platt, J. آموزش سریع ماشین‌های بردار پشتیبان با استفاده از بهینه‌سازی حداقل متوالی. In Advances in Kernel Methods Support Vector Learning ; Schoelkopf, B., Burges, C., Smola, A., Eds.; انتشارات MIT: کمبریج، MA، ایالات متحده آمریکا، 1998. [ Google Scholar ]
  33. چانگ، سی سی; Lin, CJ LIBSVM: کتابخانه ای برای ماشین های بردار پشتیبانی. در دسترس آنلاین: https://www.csie.ntu.edu.tw/~cjlin/libsvm/ (در 11 سپتامبر 2019 قابل دسترسی است).
  34. Keerthi، SS; شواد، SK; باتاچاریا، سی. مورتی، KRK بهبود الگوریتم SMO Platt برای طراحی طبقه‌بندی کننده SVM. محاسبات عصبی 2001 ، 13 ، 637-649. [ Google Scholar ] [ CrossRef ]
  35. لئو، بی. جنگل های تصادفی. ماخ فرا گرفتن. 2001 ، 45 ، 5-32. [ Google Scholar ]
  36. ترور، اچ. رابرت، تی. طبقه بندی توسط جفت زوجی. در پیشرفت در سیستم های پردازش اطلاعات عصبی ; انتشارات MIT: کمبریج، MA، ایالات متحده آمریکا، 1998. [ Google Scholar ]
  37. کهوی، ر. جان، GH Wrappers برای انتخاب زیر مجموعه ویژگی. آرتیف. هوشمند 1997 ، 97 ، 273-324. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  38. Kohavi, R. Wrappers for Performance Enhancement and Oblivious Decision Graphs ; دانشگاه استنفورد: استانفورد، کالیفرنیا، ایالات متحده آمریکا، 1995. [ Google Scholar ]
  39. هال، انتخاب زیرمجموعه ویژگی مبتنی بر همبستگی MA برای یادگیری ماشینی ؛ دانشگاه وایکاتو: همیلتون، نیوجرسی، ایالات متحده آمریکا، 1998. [ Google Scholar ]
  40. مارک، اچ. جفری، اچ. تکنیک‌های انتخاب ویژگی معیار برای داده‌کاوی کلاس گسسته. IEEE Trans. بدانید. مهندسی داده 2003 ، 15 ، 1437-1447. [ Google Scholar ]
شکل 1. ماهواره GF-1 منطقه مورد مطالعه در فصل رویش گیاهی در سال 2019.
شکل 2. نتایج تغییر شکل مدار صعودی.
شکل 3. نتایج تغییر شکل مدار نزولی.
شکل 4. نتیجه راستی آزمایی میدانی خطرات مشکوک زمین لغزش فعال. ( الف ) ناحیه تجمع تغییر شکل. ( ب ) تفسیر سنجش از دور نوری از خطرات زمین لغزش. ( ج ) عکسهای تأیید صحرایی.
شکل 5. روش شناسی کلی تحقیق.
شکل 6. توزیع فضایی منطقه تجمع تغییر شکل و خطرات احتمالی زمین لغزش.
شکل 7. نتیجه عوامل تأثیرگذار. ( الف ) DEM; ( ب ) شیب. ( ج ) جنبه; ( د ) انحنا. ( ه ) انحنای صفحه. ( f ) انحنای نمایه. ( g ) زبری سطح. ( ح ) تسکین زمین; ( i ) سنگ شناسی. ( j ) فاصله از خطا. ( k ) فاصله از Hydro; ( ل ) تراکم زهکشی; ( m ) شاخص توپوگرافی; ( n ) فاکتور طول شیب. ( o ) NDVI; ( ص ) پوشش زمین; ( q ) فاصله از جاده.
شکل 8. نتایج پیش بینی 4 روش یادگیری ماشینی. ( الف ) نتیجه پیش‌بینی NB. ( ب ) نتیجه پیش‌بینی DT. ( ج ) نتیجه پیش‌بینی SVM. ( د ) نتیجه پیش بینی RF.
شکل 9. مقایسه شاخص طبقه بندی شده اصلاحی بین الگوریتم ها.
شکل 10. مقایسه TP Rate، FP Rate، Precision، Recall و F1.
شکل 11. منحنی های ROC الگوریتم های مختلف.

بدون دیدگاه

دیدگاهتان را بنویسید