امروزه توسعه و بکارگیری فناوری‌های دیجیتال پیشرفته برای نظارت بر مناطق طبیعی حفاظت‌شده مشکلاتی حیاتی است. جمع‌آوری، دیجیتالی کردن، ذخیره‌سازی و تحلیل داده‌های مکانی-زمانی در جنبه‌های مختلف چرخه حیات چنین سرزمین‌هایی نقش مهمی در نظارت دارد. اغلب، پردازش داده ها نیاز به استفاده از محاسبات با کارایی بالا دارد. برای این منظور، این مقاله به یک رویکرد جدید برای اتوماسیون اجرای عملیات محاسباتی منابع فشرده خدمات پردازش وب در یک محیط محاسباتی توزیع شده ناهمگن می‌پردازد. برای اجرای چنین عملیاتی، ما یک برنامه علمی مبتنی بر گردش کار را توسعه می دهیم که تحت کنترل یک سیستم چند عاملی اجرا می شود. عامل ها منابع ناهمگن محیط را نشان می دهند و بار محاسباتی را بین خود توزیع می کنند. توسعه نرم افزار در چارچوب Orlando Tools تحقق می یابد که ما آن را برای ایجاد و اجرای برنامه های مشکل گرا اعمال می کنیم. مزایای رویکرد پیشنهادی در ادغام خدمات اطلاعات جغرافیایی و ابزارهای محاسباتی با کارایی بالا و همچنین افزایش سرعت محاسبات، متعادل کردن بار محاسباتی و بهبود کارایی استفاده از منابع در محیط محاسباتی توزیع شده ناهمگن است. این مزایا در تجزیه و تحلیل سری های زمانی چند بعدی نشان داده شده است. متعادل کردن بار محاسباتی و بهبود کارایی استفاده از منابع در محیط محاسباتی توزیع شده ناهمگن. این مزایا در تجزیه و تحلیل سری های زمانی چند بعدی نشان داده شده است. متعادل کردن بار محاسباتی و بهبود کارایی استفاده از منابع در محیط محاسباتی توزیع شده ناهمگن. این مزایا در تجزیه و تحلیل سری های زمانی چند بعدی نشان داده شده است.

کلید واژه ها:

خدمات پردازش وب ; کاربردهای علمی مبتنی بر گردش کار ; محاسبات با کارایی بالا ؛ عوامل ؛ سری زمانی ؛ تحلیل و پیش بینی ؛ بهینه سازی چند جانبی

1. مقدمه

امروزه، توسعه و بکارگیری فناوری‌های دیجیتال پیشرفته برای نظارت بر اکولوژی و مدیریت طبیعت محیط‌زیست (به عنوان مثال، هوای جو، آب‌های زمینی سطحی، آب‌های دریا، خاک و پوشش زمین، مناظر و غیره) برای جامعه علمی حیاتی است [ 1 ]. در این زمینه، مناطق طبیعی حفاظت شده به دلیل اهمیت و منحصر به فرد بودن منابع آب، زمین، جنگل، بیولوژیکی و سایر منابع طبیعی، مستحق توجه و کنترل ویژه هستند [ 2 ].
به طور کلی، نظارت بر محیط زیست بدون اعمال یک مجموعه اطلاعات چند سطحی غیرممکن است [ 3 ]. این مجموعه برای در نظر گرفتن و ارزیابی اثر انسانی تجمعی از منابع تاثیر مختلف برای پیش‌بینی پاسخ احتمالی محیط‌های طبیعی و تکامل وضعیت بعدی آنها در نظر گرفته شده است. فرآیند پایش شامل تعیین مکان ها و پارامترهای مشاهده، انتخاب و قرار دادن حسگرها، دریافت و انتقال سیگنال ها، پردازش و بایگانی داده ها، تجسم اطلاعات، پشتیبانی از تصمیم گیری و غیره است. 4]. علاوه بر این، توسعه، انتشار و مونتاژ سرویس‌های وب توسط تیم‌های تحقیقاتی در زمینه‌های تحقیقاتی مختلف بر اساس استانداردهای باز در یک پورتال GIS یکپارچه، بدون شک فرصت‌ها را برای مطالعات بین‌رشته‌ای مرتبط با پایش محیطی گسترش می‌دهد [ 5 ]. هنگام استفاده از خدمات وب، کاربران نهایی به الگوریتم ها، مدل ها، داده ها و حسگرهای توزیع شده برای پردازش داده های جغرافیایی دسترسی دارند.
با این حال، با توجه به رشد در مقدار اطلاعات به دست آمده و تجمیع شده در فرآیند نظارت، توسعه مدرن GIS اغلب به ابزارهای تجزیه و تحلیل داده های بزرگ مبتنی بر محاسبات موازی و توزیع شده نیاز دارد [ 6 ، 7 ]. از این رو، متخصصان حوزه های موضوعی مختلف با نیاز به حل مسائل مهندسی ابر رایانه مواجه هستند. به طور خاص، چالش‌ها در استفاده از محاسبات با کارایی بالا (HPC) هنگام حل مشکلات نظارت بر محیط‌زیست توسط لی و همکاران مورد بحث قرار گرفته‌اند. [ 8]. این نویسندگان پیشنهاد می‌کنند که در حالی که سیستم‌های چند پردازنده‌ای عناصر اصلی محیط محاسباتی هستند، کاربران نهایی نیز باید از پلتفرم‌های ابری و مه استفاده کنند. پلتفرم‌های ابری، منابع اضافی را بر حسب تقاضا، انعطاف‌پذیر و پویا فراهم می‌کنند. در همان زمان، پلت فرم های مه امکان پیش پردازش داده ها را در نزدیکی منابع خود فراهم می کنند. در چنین محیط محاسباتی ناهمگن، یک مشکل غیر پیش پا افتاده اطمینان از استفاده کارآمد از منابع و افزایش سرعت محاسبات است، زیرا تعداد منابع مصرف شده دائما افزایش می یابد. بنابراین، از جمله چالش های اصلی می توان به موارد زیر اشاره کرد:
  • با استفاده از منابع یک محیط محاسباتی توزیع شده، که در آن ناهمگونی هر سال در حال افزایش است، و تعامل با مدیران منابع محلی (LRMs) واقع در گره های منابع [ 9 ]،
  • توسعه برنامه های کاربردی مبتنی بر گردش کار، تشکیل ترکیبی از خدمات وب ارائه شده توسط پروژه های تحقیقاتی مختلف، و اجرای گردش کار در یک محیط محاسباتی توزیع شده، که مستلزم دسترسی انعطاف پذیرتر و ساده تر به منابع HPC است [ 10 ]،
  • پشتیبانی از طیف وسیعی از استانداردهای باز مختلف، مانند رابط محاسباتی ابری باز (OCCI) [ 11 ]، فرمت مجازی سازی باز (OVF) [ 12 ]، استانداردهای بنیاد زمین فضایی منبع باز (OSGeo) [ 13 ] و باز کنسرسیوم جغرافیایی (OGC) [ 14 ]،
  • اجرای سایر عملیات سیستم، به عنوان مثال، برنامه ریزی محاسبات و توزیع بار محاسباتی با رعایت سیاست های اداری تامین منابع.
تلاش بسیاری از محققان در جهت غلبه بر این چالش ها است. فورستر و همکاران [ 15 ] نشان می‌دهد که نمایش داده‌های مبتنی بر استانداردهای OGC در برنامه‌های کاربردی فضایی در بازار انبوه، در دسترس بودن اطلاعات را به میزان قابل توجهی افزایش می‌دهد و در عمل برای اکثر کاربران نهایی ضروری است. به عنوان مثال، یک سرور منبع باز مبتنی بر جاوا، GeoServer، پروتکل های استاندارد OGC را پیاده سازی می کند و به کاربران نهایی انعطاف پذیری زیادی در ایجاد نقشه و به اشتراک گذاری داده های مکانی ارائه می دهد [ 16 ]. از جمله این استانداردها می‌توان به خدمات ویژگی‌های وب (WFS)، خدمات نقشه وب (WMS)، سرویس پوشش وب (WCS)، خدمات پردازش وب (WPS) و خدمات نقشه وب کاشی (WMTS) اشاره کرد.
با این حال، داده های مکانی باید به موقع و کارآمد جمع آوری، تجمیع و به GIS منتقل شوند. در مورد کلان داده، این نیاز به پردازش داده با عملکرد بالا دارد. ابزارهایی شبیه به چنین GISهایی برای این مشکلات خطاب نمی شوند. بنابراین، نرم افزارهای اضافی، به عنوان مثال، ابزارهایی برای ترکیب و مدیریت سرویس های WPS، و همچنین مجازی سازی و اجرای محاسبات شبکه ای یا ابری، مورد نیاز است [ 17 ]. به دلیل چنین نیازی، مشکلات قابل توجهی هم برای ارائه دهندگان خدمات اطلاعات جغرافیایی و هم برای کاربران نهایی آنها ایجاد می شود.
ابزار geoprocessing مبتنی بر گردش کار GeoJModelBuilder در [ 18 ] در نظر گرفته شده است. این برای ادغام حسگرهای وب قابل تعامل، خدمات پردازش جغرافیایی و مدل‌های محقق در جریان کار بر اساس استاندارد OpenMI OGC در نظر گرفته شده است. هنگام استفاده از این ابزار، همگام سازی زمان مدل سازی شده در زمانی که مدل ها با یکدیگر تعامل دارند، اغلب دشوار است. رویکردی برای مهاجرت برنامه‌های کاربردی از یک پورتال GIS به یک ابر خصوصی یا عمومی در [ 19 ] پیشنهاد شده است. وانگ و همکاران [ 20 ] اجرای مقیاس‌پذیر مدل‌های گردش عمومی جوی را در یک خوشه چند هسته‌ای هنگام حل مشکل شبیه‌سازی‌های بلندمدت برای تغییرات آب و هوا نشان می‌دهد. ویژگی های geocomputing با کارایی بالا در خوشه های HPC در [ 21 ] مورد بحث قرار گرفته است.].
با این وجود، برنامه های کاربردی جغرافیایی مبتنی بر فناوری محاسبات ابری هنوز نیاز به توسعه بیشتر دارند [ 22 ]. علاوه بر این، ادغام منابع HPC در مکان‌های فیزیکی مختلف برای اجرای ترکیبی از خدمات وب توسعه‌یافته توسط محققان مختلف در رویکردهای سنتی مبتنی بر گردش کار دشوار است [ 10 ]. یک راه برای غلبه بر این مشکل در [ 23 ] پیشنهاد شده است. سان و همکاران ارائه سیستم Geoweaver برای بهبود کارایی در مدیریت چرخه کامل یک گردش کار هوش مصنوعی.
بنابراین، به دلیل منحصر به فرد بودن هر مسئله از طیف وسیعی از مشکلات حل شده با GIS، و تنوع معماری های نرم افزاری و سخت افزاری مورد استفاده، و همچنین منابع و ساختارهای داده، چالش ها برطرف نشده است. در این راستا، ما بر اساس تجربه عملی خود در حل مسائل کاربردی در مقیاس بزرگ با استفاده از محاسبات موازی و توزیع شده به این زمینه تحقیقاتی کمک می کنیم [ 24 ، 25 ، 26 ]]. در این مقاله، ما رویکردی را پیشنهاد می‌کنیم که قابلیت‌ها و ابزارهای پورتال GIS را برای ایجاد محیط‌های محاسباتی توزیع‌شده، ناهمگن و مشکل‌گرا ارائه می‌کند. در رویکرد پیشنهادی، عملیات منابع فشرده مربوط به تجزیه و تحلیل داده‌های مکانی-زمانی توسط برنامه مبتنی بر گردش کار توسعه‌یافته در چارچوب Orlando Tools (OT) [ 24 ] و توسط سرویس‌های WPS ارائه می‌شود. نتایج در یک پورتال GIS منتشر شده است.
بقیه مقاله به شرح زیر سازماندهی شده است. در بخش 2 ، ما یک پورتال GIS را نشان می‌دهیم که برای حمایت از نظارت محیطی قلمرو طبیعی حفاظت‌شده بایکال استفاده می‌شود و قابلیت‌های OT را برای توسعه و بکارگیری برنامه‌های علمی مبتنی بر گردش کار در نظر می‌گیریم. سپس، ما رویکردی را برای خودکارسازی ایجاد سرویس‌های WPS به‌عنوان رابط‌هایی برای گردش کار برنامه‌های توسعه‌یافته در OT پیشنهاد می‌کنیم. به عنوان نمونه ای از بکارگیری رویکرد پیشنهادی، تکنیک و ابزاری برای پیش بینی دمای ساعتی هوا در بخش 3 آورده شده است.. به طور خاص، تنظیم پارامترهای یک تابع پیش بینی (PF) در نظر گرفته شده است. این تابع یک تابع چند اکسترمال است. چندین پارامتر تنظیم شده دارد و به طور کلی برای یافتن حداقل جهانی نیاز به محاسبات موازی دارد. ما یک تحلیل جامع از آزمایش‌های محاسباتی برای تنظیم پارامترهای PF ارائه می‌کنیم و نتایج مطالعه را مورد بحث قرار می‌دهیم. در نهایت، بخش 4 مقاله را به پایان می رساند.

2. رویکرد پیشنهادی: روش ها و ابزارها

2.1. ایجاد خودکار و استفاده از خدمات WPS در پورتال GIS

یک پورتال GIS مؤسسه ماتروسوف برای دینامیک سیستم و نظریه کنترل شعبه سیبری آکادمی علوم روسیه (ISDCT SB RAS) به کاربران نهایی اجازه می دهد تا داده های مکانی و زمانی خود را جمع آوری، پردازش و تجسم کنند [ 27 ]. داده های مکانی-زمانی ساختارهای مختلف زمین داده را به مکان های خاص در دوره های مختلف ترسیم می کنند. در پورتال GIS، عملکرد آن در خدمات WPS محصور شده است. مشخصات WPS یک استاندارد وب سرویس را برای انتشار قابلیت‌های پردازش جغرافیایی توصیف می‌کند و یک رابط برای پردازش داده‌های مکانی و زمانی فراهم می‌کند. تجسم داده ها با نقشه ها، جداول و نمودارها انجام می شود.
طرح عملکرد با داده های مکانی-زمانی در شکل 1 نشان داده شده است . تجهیزات کنترل و اندازه گیری ایستگاه های هواشناسی، مانیتورهای سطح آب، آشکارسازهای ارتعاشات لرزه ای، ماهواره ها و سایر سیستم های نظارتی، اطلاعات مربوط به وضعیت جسم مشاهده شده را جمع آوری، پیش پردازش و انتقال می دهند (نتایج مشاهده). این نتایج (داده‌های مکانی زمانی) به صورت فایل‌های داده، پایگاه‌های داده مختلف و سرویس‌های وب مختلف نمایش داده می‌شوند. متا مدل داده قوانین جستجو، به دست آوردن، تجمیع، قالب بندی، پردازش، نمایش، تجسم و تجزیه و تحلیل داده های ارسال شده در پورتال GIS را تعیین می کند.
برای کاربران نهایی ثبت شده، رابط وب دسترسی به عملکرد پورتال GIS را فراهم می کند. کاربران نهایی می توانند از خدمات WPS سایر کاربران استفاده کنند یا خدمات جدیدی را توسعه دهند و در کاتالوگ های مربوطه در پورتال GIS ثبت کنند. سیستم پایگاه داده برای هر کاربر نهایی حجم های ذخیره سازی دیسک را برای به خاطر سپردن پارامترهای سرویس های راه اندازی شده یا ترکیبات آنها فراهم می کند. دسترسی به فضای ذخیره سازی از طریق یک رابط وب اجرا می شود که کاربران نهایی را قادر می سازد فایل های داده را آپلود و دانلود کنند. این سرویس ذخیره سازی همچنین یک سیستم فایل مجازی را بر روی رایانه های شخصی (PC) کاربران ارائه می دهد. یک سیستم مدیریت از تعامل بین اجزای پورتال GIS و پیکربندی آنها پشتیبانی می کند.
در پورتال GIS، داده های مکانی-زمانی در دسترس کاربران نهایی مختلف برای حل مشکلات عملی و علمی آنها قرار می گیرد. این داده ها به طور گسترده برای به روز رسانی نقشه های توپوگرافی و ناوبری، پایش کشاورزی، ردیابی دینامیک و وضعیت قطع جنگل، مشاهده شرایط یخ و غیره استفاده می شود. در دو دهه اخیر، پورتال GIS به طور فعال در پایش محیطی بایکال حفاظت شده استفاده شده است. قلمرو طبیعی
ما رویکردی برای خودکارسازی اجرای محاسبات با کارایی بالا به درخواست خدمات WPS در یک محیط محاسباتی ناهمگن و توزیع شده پیشنهاد می‌کنیم. برای اجرای چنین محاسباتی، یک برنامه علمی مبتنی بر گردش کار در حال توسعه است. این برنامه تحت کنترل یک سیستم چند عاملی اجرا می شود. عامل ها منابع ناهمگن محیط محاسباتی را نشان می دهند و بار محاسباتی را بین خود توزیع می کنند. آنها نهادهای نرم افزاری هستند که برای دستیابی به اهداف تعیین شده توسط ارائه دهندگان منابع عمل می کنند.
طرح عملیاتی با خدمات WPS در شکل 2 نشان داده شده است . مدیران پورتال GIS را مدیریت می کنند و ابزارهایی را برای جستجوی داده ها، به دست آوردن، تجمیع، قالب بندی، پردازش، تجزیه و تحلیل، نمایش و تجسم پیکربندی می کنند. کاربران نهایی از طریق پرس و جو با خدمات پورتال GIS تعامل دارند. آنها همچنین می توانند خدمات خود را ثبت کنند.
در رویکرد پیشنهادی، کاربران نهایی می‌توانند برنامه‌ها را در OT از قبل توسعه دهند و سپس خدمات WPS را برای دسترسی به آنها در پورتال GIS ثبت کنند. نرم افزار کاربردی یک برنامه شامل مجموعه ای از ماژول ها است که الگوریتم هایی را برای حل مسائل از حوزه موضوعی پیاده سازی می کنند. هر ماژول دارای مشخصاتی است که شامل اطلاعات زیر است: نوع و معنای پارامترهای ورودی، خروجی و انتقال، روش‌های انتقال پارامترها، نیازمندی‌های محیط محاسباتی، حالت‌های راه‌اندازی و غیره. یک طرح حل مسئله (جریان کاری علمی) منعکس‌کننده اطلاعات و روابط منطقی بین ماژول ها در محاسبات توزیع شده. این نمودار به صورت یک گراف غیر چرخه ای مستقیم (DAG) نشان داده می شود. اجرای گردش کار بر اساس محاسبه جابجایی پارامتر [ 28]. بنابراین، اجرای گردش کار منجر به ایجاد یک جریان کار می شود. یکی از مجموعه‌های ورودی مربوط به یک نمونه گردش کار در یک کار محاسباتی است. ورودی ها و خروجی ها در پایگاه داده محاسباتی OT یا یک پایگاه داده خارجی، به عنوان مثال، در سیستم پایگاه داده پورتال GIS ذخیره می شوند.
چارچوب OT شامل اجزای اصلی زیر است:
  • رابط وب کاربر،
  • زیرسیستم برای یکپارچه سازی مداوم،
  • طراح مدل،
  • طراح خدمات WPS،
  • زیر سیستم اجرا،
  • دانش محور،
  • پایگاه داده محاسباتی
این مؤلفه ها به طور خودکار در مجموعه ماژول برنامه توسعه یافته گنجانده می شوند. توسعه دهندگان می توانند قابلیت های کامپوننت را برای هر برنامه پیکربندی کنند. رابط وب کاربر امکان دسترسی کاربران نهایی به اجزای OT را فراهم می کند.
توسعه برنامه در OT شامل مراحل اصلی زیر است:
  • توسعه یا اصلاح ماژول های کاربردی، و همچنین ساخت، استقرار، تحویل و آزمایش آنها در منابع محیط محاسباتی با ابزارهای زیرسیستم OT برای یکپارچه سازی مداوم،
  • توصیف یک مدل محاسباتی که شامل مشخصات ماژول و روابط بین ماژول ها با استفاده از طراح مدل است،
  • ایجاد گردش کار بر روی مدل محاسباتی
OT کاربران نهایی را قادر می سازد تا مدل محاسباتی را در یک فایل XML یا یک ویرایشگر بصری توصیف کنند. مدل محاسباتی و گردش کار ایجاد شده در پایگاه داده دانش ذخیره می شود. OT مجموعه ای از مبدل توصیف مدل های دامنه خاص کاربران نهایی، از جمله مشخصات گردش کار به مدل محاسباتی در XML را ارائه می دهد. هنگام حل مسائل برای یک حوزه موضوعی جدید، گاهی اوقات توسعه مبدل های جدید یا استفاده از مبدل های خارجی مورد نیاز است.
برای خودکارسازی مراحل ذکر شده در بالا، OT شامل یک سیستم فرعی برای یکپارچه سازی مداوم نرم افزارهای کاربردی است. این زیرسیستم کار با مخازن Git را فراهم می کند. یک ابزار وب منبع باز، GitLab، به عنوان یک سیستم مدیریت مخزن استفاده می شود (در دسترس است: https://gitlab.com ، در 29 اکتبر 2021 در دسترس است). مخزن Git یک دایرکتوری سیستم فایل حاوی فایل های زیر است:
  • فایل های پیکربندی مخزن،
  • فایل های گزارش عملیات ذخیره سازی انجام شده در مخزن،
  • یک فایل فهرستی که مکان فایل ها را توصیف می کند،
  • فایل های کاربر نهایی
کاربران نهایی OT مدل های محاسباتی، ماژول ها و گردش کار خود را در مخازن ذخیره می کنند. OT برای مدیریت مخازن با استفاده از قابلیت‌های GitLab، رابط وب را در اختیار کاربران نهایی قرار می‌دهد. زیرسیستم یکپارچه سازی پیوسته از فرصت های اصلی زیر پشتیبانی می کند ( شکل 2 ):
  • توسعه و اصلاح ماژول ها با استفاده از مخازن GIT آنها،
  • ساخت و تست ماژول ها،
  • استقرار و ارائه ماژول ها،
  • تست گردش کار
زیرسیستم اجرای OT شامل مجموعه ای از مفسرهای گردش کار و زمانبندی محاسباتی است. یک مفسر ساختارهای کنترلی و ماژول های گردش کار را اجرا می کند. یک زمانبندی تصمیماتی را برای بهینه سازی توزیع بار محاسباتی و ارتباطی بر روی منابع موجود محیط محاسباتی اتخاذ می کند. در سطح محیطی به عنوان یک متا زمانبندی عمل می کند. تجزیه را می توان هم در حالت استاتیک قبل از شروع محاسبات و هم در حالت پویا در طول فرآیند محاسباتی انجام داد. کاربران برنامه معیارهای کیفیت حل مسئله را به عنوان سرعت اجرای گردش کار و افزایش سرعت محاسبات تعریف می کنند. ترجیحات صاحبان منابع شامل کارایی استفاده از منابع و متوسط ​​استفاده از CPU است.
عوامل نشان دهنده منابع محیطی هستند. عامل یک نهاد نرم افزاری است که برای دستیابی به اهداف تعیین شده توسط صاحب منابع عمل می کند. عامل ها از تطبیق معیارهای کیفیت حل مسئله با ترجیحات صاحبان منابع و بهبود شاخص های آنها در یک محیط محاسباتی ناهمگن در مقایسه با متا زمانبندی های معروف، مانند GridWay [ 29 ] و Condor DAGMan [ 30 ] اطمینان حاصل می کنند. این مزایا با پشتیبانی از ادغام مداوم نرم افزار کاربردی در OT به دست می آید. Agent ها تست ماژول های برنامه را بر روی منابع محیطی و پیش بینی زمان اجرای آنها ارائه می کنند. این اطلاعات به زمانبندی OT اجازه می دهد تا کارایی تخصیص منابع را برای تکمیل کارهای برنامه افزایش دهد.
Agent ها همچنین کاربردهای خارجی مختلفی را نشان می دهند که در OT استفاده می شوند. به عنوان مثال، عوامل سیستم متا مانیتورینگ اطلاعات مربوط به سخت افزار و نرم افزار مورد استفاده را در اختیار مفسران و زمانبندی OT قرار می دهند.
بنابراین، از نظر دسته های نگهداری نرم افزار [ 31 ]، OT از نگهداری پیشگیرانه و تطبیقی ​​برای توسعه دهندگان نرم افزار پشتیبانی می کند. تعمیر و نگهداری مبتنی بر یکپارچه سازی مداوم، اصلاح نرم افزار را پس از تحویل برای شناسایی و تصحیح عیوب نرم افزار و حفظ نرم افزار در یک محیط محاسباتی در حال تغییر پویا، قابل استفاده نگه می دارد. به عنوان یک قاعده، پشتیبانی از چنین نگهداری برای کاربردهای خارجی یک چالش سیستم پیچیده برای GIS است.
گردش کار به عنوان خدمات WPS ثبت می شود. در OT، یک زیرسیستم جدید (طراح خدمات WPS) برای خودکارسازی ایجاد، ثبت و استفاده از خدمات WPS توسعه یافته است. ماژول های برنامه و گردش کار به صورت خودکار در قالب سرویس های WPS ناهمزمان OT در کاتالوگ های مربوطه در پورتال GIS ثبت می شوند. گردش کار می‌تواند شامل تماس‌هایی با سایر سرویس‌های WPS باشد که کار با ترکیب‌های سرویس را ممکن می‌سازد. در OT، قابلیت تبادل فایل بین سرویس های WPS به عنوان پارامترهای آنها، از جمله تبادل داده با سیستم پایگاه داده پورتال GIS پشتیبانی می شود. در طرح با خدمات WPS نشان داده شده در شکل 2 ، الگوریتم عملیات سرویس WPS ناهمزمان OT ثبت شده در پورتال GIS شامل مراحل زیر است:
  • مرحله 1. سرویس WPS یک درخواست از کاربر نهایی دریافت می کند.
  • مرحله 2. سرویس WPS پارامترهای ورودی موجود در درخواست را بررسی می کند. اگر این پارامترها درست باشند، انتقال به مرحله بعدی انجام می شود. در غیر این صورت یک پیغام خطا به کاربر نهایی برمی گرداند و عملیات آن به پایان می رسد.
  • مرحله 3. سرویس WPS یک فایل XML با وضعیت اجرای درخواست تولید می کند. علاوه بر این، نشانی اینترنتی فایل XML را نشان می دهد که حاوی نتایج اجرای درخواست یا مسیر سیستم پایگاه داده در صورت تبادل داده بین ماژول ها با استفاده از فایل های متنی است.
  • مرحله 4. سرویس WPS عملیات زیر را اجرا می کند: تولید یک کار محاسباتی برای OT، فراخوانی زمانبندی محاسبات، انتقال کار تولید شده و پارامترهای ورودی درخواست به زمانبند با استفاده از یک API تخصصی، تکمیل کار.
پس از دریافت کنترل، زمان‌بند بار محاسباتی را بر اساس منابع تجزیه می‌کند، وظایف فرعی را با ماژول‌ها به صف‌های LRM نصب شده روی این منابع می‌فرستد، پارامترهای ورودی و خروجی را در طول اجرای ماژول منتقل می‌کند و وضعیت اجرای آنها را بررسی می‌کند. در یک فرکانس مشخص، وضعیت درخواست را در فایل XML مربوطه تولید شده توسط سرویس WPS به روز می کند. فرآیند به روز رسانی تا تکمیل موفقیت آمیز فرآیند حل مسئله یا تشخیص شکست در فرآیند محاسباتی انجام می شود.
بنابراین، OT به‌عنوان میان‌افزار عمل می‌کند و تمامی عملیات سیستم لازم را برای زمان‌بندی بار محاسباتی، انتقال داده‌ها بین منابع محیطی، تعامل با LRMS نصب شده بر روی آنها، نظارت بر وضعیت منابع، بررسی وضعیت مشاغل و غیره انجام می‌دهد. خدمات WPS OT یک رابط بین کاربران نهایی پورتال GIS و محیط محاسباتی. آنها عملکرد پورتال GIS را گسترش می دهند و پردازش داده با کارایی بالا را ارائه می دهند.

2.2. تکنیک و ابزار برای پیش بینی دمای هوا

در حالت کلی، مسئله پیش بینی مقادیر سری زمانی به صورت زیر فرموله می شود. اجازه دهید مجموعه یک سری زمانی چند بعدی از داده های گذشته نگر باشد، که در آن ، ، تعدادی سری زمانی است و تعدادی از عناصر در سری های زمانی است. شامل سری های زمانی که نشان دهنده داده های گذشته نگر در مورد پارامترهای هواشناسی بدین ترتیب، یکمین سری زمانی تک بعدی منطبق با پارامتر اول هواشناسی است برای پیش بینی مقدار مورد نیاز است ، جایی که یک پارامتر هواشناسی پیش بینی شده است.
بر اساس دستاوردها در زمینه پیش‌بینی سری‌های زمانی، از جمله پیش‌بینی دمای هوا، به این نتیجه می‌رسیم که روش‌های زیر در عمل بیشترین تقاضا را دارند [ 32 ، 33 ]: روش‌های رگرسیون، روش‌های خودرگرسیون، روش‌های مبتنی بر شبکه عصبی، و روش‌های مبتنی بر روش‌ها. بر روی ماشین بردار پشتیبانی
به عنوان یک قاعده، روش های رگرسیون و خودرگرسیون عمدتاً برای پیش بینی پارامترهای حداقل، حداکثر یا میانگین یک سری زمانی، به عنوان مثال، دمای هوا [ 34 ] استفاده می شود. این روش ها در مقایسه با دو گروه دیگر روش ها از دقت کافی برخوردار نیستند [ 35 ، 36 ]. بنابراین در بسیاری از موارد استفاده از روش‌های مبتنی بر شبکه‌های عصبی و ماشین‌های بردار پشتیبان برای مدل‌سازی و پیش‌بینی ارجحیت دارد. کتابشناسی گسترده ای به استفاده از چنین روش هایی اختصاص داده شده است (برای مثال، [ 37 ، 38 ] را ببینید). استفاده از شبکه های عصبی با ساختارهای مختلف برای پیش بینی دمای هوا در [ 39,40,41 ] در نظر گرفته شده است .]. در [ 42 ]، مقایسه ای بین روش های بردار پشتیبان و شبکه های عصبی انجام شده است. با این حال، این روش ها دارای معایبی نیز هستند [ 43 ، 44 ]. به طور خاص، روش‌های مبتنی بر شبکه‌های عصبی و بردارهای پشتیبانی نیاز به آموزش طولانی برای اعمال مدل به‌دست‌آمده در سری‌های زمانی جدید دارند. در غیر این صورت، ویژگی های خاص یک سری، پیش بینی را بر اساس آموزش قبلی اشتباه نشان می دهد. در عمل، این همیشه راحت نیست زیرا اغلب به استفاده از HPC نیاز دارد.
در این راستا، ما تکنیکی را با استفاده از مفهوم شباهت برای قطعات سری زمانی پیشنهاد می کنیم [ 45 ، 46 ]. در [ 46 ]، یک تکنیک مشابه به طور موثر برای پیش‌بینی تقاضای برق اعمال می‌شود. علاوه بر این، مشکل پیش بینی برای چندین حوزه موضوعی به طور مشابه در [ 45 ] با موفقیت حل شده است. نویسندگان همچنین مزایای استفاده از این تکنیک را در مقایسه با روش های مورد بحث در بالا مورد بحث قرار می دهند. از جمله این مزایا می توان به دقت در پیش بینی اشاره کرد.
در این مقاله، ما بر پیش بینی دمای هوا تمرکز می کنیم. در تکنیک پیشنهادی، قطعه یک سری زمانی ساعتی داده می شود که در آن ، ، ، و تعدادی از عناصر در است . این قطعه قبل از لحظه زمانی برای پیش بینی سپس، جستجو برای شرایط آب و هوایی مشابه در گذشته با همین ابعاد انجام شده است. شباهت های شرایط آب و هوایی با استفاده از تابع شباهت (SF) که در زیر توضیح داده شده است، تعیین می شود. در نهایت، دمای هوا در زمان معین بر اساس شرایط آب و هوایی یافت شده با استفاده از تابع پیش بینی (PF) پیش بینی می شود.
داده های گذشته نگر در مورد شرایط آب و هوایی در یک مکان خاص به عنوان ورودی استفاده می شود. جستجو برای شرایط آب و هوایی مشابه در گذشته با پیچیدگی محاسباتی کم مشخص می شود. در عین حال، تنظیم تعدادی از پارامترهای PF برای به حداقل رساندن خطای پیش بینی نیاز به استفاده از HPC دارد.
ما دو مرحله تکراری را در به کارگیری تکنیک در نظر گرفته شده ارائه می دهیم. مرحله اول برای تنظیم پارامترهای PF در نظر گرفته شده است. در مرحله دوم، از PF برای پیش‌بینی دمای هوا در مکان‌هایی که پارامترهای تابع برای آن‌ها تنظیم شده‌اند، استفاده می‌کنیم. هنگامی که داده‌های مشاهده اضافی جمع می‌شوند، سری زمانی چند بعدی را گسترش می‌دهیم و برای تنظیم مجدد پارامترهای PF به مرحله اول برگردید.
مرحله 1. سری چند بعدی را بدست آورید داده های هواشناسی برای یک مکان خاص دوره پیش بینی از به یعنی مقادیر دمای هوا را برای ، . بعد، مجموعه جستجو را تعیین کنید و مجموعه ارزیابی ، . مجموعه ای است که برای جستجوی قطعات استفاده می شود ، ، و غیره که شبیه به ، ، ، . بقیه سری های زمانی برای کاهش خطای پیش بینی استفاده می شود، و . برای ارزیابی خطای پیش‌بینی مقادیر استفاده می‌شود در مقایسه با مقادیر شناخته شده ، ، .
برای هر دومین عنصر پیش بینی شده از ، جستجوی قطعات ، ، و غیره با استفاده از SF به روش زیر پیاده سازی می شود: forming و محاسبه کردن ، جایی که یک متغیر بولی است که نشان می دهد که آیا قطعه مشابه است ( ) یا نه ( ) به ، مجموعه ای از پارامترهای تنظیم شده است، دامنه ای از ، ، ، ، عددی است که قطعات در آن مقایسه می شوند . شکل 3 جستجو را نشان می دهد ، ، ، و غیره.
قطعه سری زمانی چهار بعدی که به عنوان داده های گذشته نگر در آزمایش ها استفاده می شود در جدول 1 نشان داده شده است. جهت باد عبارتند از “آرام”، “شمال”، “شمال غربی”، “شمال شرقی”، “جنوب”، “جنوب غربی”، “جنوب شرقی”، “غربی” و “شرق”. در صورت درخواست، داده ها از سرویس WPS خارجی ثبت شده در پورتال GIS در دسترس هستند. این سرویس WPS پردازش اولیه داده استخراج شده از منبع داده باز https://rp5.ru/Weather_in_the_world (در 29 اکتبر 2021 قابل دسترسی) را برای یک دوره معین انجام می دهد.

SF بر اساس تعیین همبستگی بین قطعات مقایسه شده است. الگوریتم 1 شبه کد یک الگوریتم عملیات SF را نشان می دهد.

الگوریتم 1. الگوریتم عملیات SF.
 1  تابع
2    اگر   سپس
3       برگردان  0;
4    پایان اگر
5    اگرسپس
6      بازگشت 1;
7    دیگر
8      بازگشت 0;
9    پایان اگر
10  تابع پایان

مقادیر پارامترها از برای به حداقل رساندن خطای پیش بینی تنظیم می شوند. پارامترهای تنظیم‌شده طول مجاز سری‌های زمانی و ضریب همبستگی و همچنین محدودیت‌های ماژول‌های اختلاف دمای هوا، تابش خورشیدی کل، سرعت باد و جهت باد را تعیین می‌کنند. برای تنظیم این پارامترها، مجموعه ای از ترکیبات مقادیر پارامتر را به طور تصادفی از دامنه های پارامتر انتخاب می کنیم. سپس پیش بینی می کنیم با استفاده از PF الگوریتم 2 شبه کد یک الگوریتم عملیات PF را نشان می دهد، جایی که .

الگوریتم 2. الگوریتم عملیات PF.
 1  تابع
2    ;
3    برای از جانب  به   افزایش
4      اگر ( یا  ) سپس
5        ، ، ;
6        اگر ( ) سپس
7          ;
8          ;
9        پایان اگر
10      پایان اگر
11    بعدی ;
12    اگر ( ) سپس
13      ;
14    دیگر
15      ;
16    پایان می یابد اگر
17    بازگشت  ;
18  تابع پایانی

ما میانگین خطای مطلق (MAE) را برای اندازه گیری خطاهای پیش بینی انتخاب می کنیم. در مورد ما، MAE به صورت زیر تعریف می شود:

مرحله 2. زمانی که پارامترها از تنظیم شده است، می‌توان از PF با مقادیر بهینه این پارامترها در کاربردهای مختلف استفاده کرد که در آن‌ها نیاز به مدل‌سازی دمای هوای ساعتی است. برای انجام این کار، اولین عنصر پیش‌بینی‌شده یک سری زمانی و قطعات را تعیین می‌کنیم که قبل از این عنصر در حلقه for قرار دارد و با PF تماس بگیرید. در مدل سازی می توانیم گسترش دهیم با داده های واقعی و مدل شده. به صورت دوره‌ای، می‌توانیم به فاز اول برگردیم و زمانی که داده‌های توسعه‌یافته از اندازه خاصی فراتر رفت، پارامترها را دوباره تنظیم کنیم.
در رویکرد پیشنهادی، ما یک برنامه کاربردی برای تنظیم پارامترهای PF ایجاد می کنیم. برای حل مسئله تشخیص الگو برای تعیین شرایط آب و هوایی مشابه در گذشته و پیش‌بینی دمای هوا در آینده بر اساس آنها استفاده می‌شود. ما پارامترهای PF را با روش چند شروع [ 47 ] تنظیم می کنیم که به طور مشترک با روش Nelder-Mead [ 48 ] برای جستجوی اکسترموم های محلی استفاده می شود.
روش چند شروع بر اساس جستجوی بهینه محلی یک تابع است. می تواند از الگوریتم های مختلف فرود از مجموعه استفاده کند که شامل نقاط شروع به بهینه محلی . هنگامی که بهینه محلی یافت شد، مقدار به عنوان بهینه سراسری تابع مورد مطالعه انتخاب شده است.
به طور کلی، ساختار گردش کار برای اجرای روش چند شروع شامل چهار مرحله اصلی زیر است:
  • تولید مجموعه از نقاط شروع،
  • توزیع نقاط شروع بین منابع محیط محاسباتی،
  • نزول موازی از نقاط شروع به بهینه محلی با استفاده از روش نلدر مید،
  • انتخاب بهینه جهانی از جانب .

بهینه‌سازی یک تابع چند انتها با استفاده از روش چند شروع بر روی منابع ناهمگن با ویژگی‌های محاسباتی مختلف انجام می‌شود. نقطه شروع توزیع در منابع یک مشکل غیر ضروری است. ما باید مشکل زیر را حل کنیم:

جایی که تعدادی هسته است، تعدادی از نقاط شروع است، تعداد متوسطی از عملیات ابتدایی است که برای یافتن حداقل SF محلی از یک نقطه شروع لازم است، تعدادی از نقاط شروع است که در هسته اول پردازش خواهند شد ، تعدادی عملیات ابتدایی است که توسط هسته i در واحد زمان پردازش می شود، سربار هسته i است که به تعداد نقاط شروع پردازش شده بستگی دارد و ارزیابی یک گردش کار است.

این مشکل NP-hard است [ 49 ]. افزایش تعداد نقاط شروع به ازای هر هسته، سربار استفاده از هسته را کاهش می دهد. در این راستا، ما یک استراتژی جدید از اجرای روش چند شروع را با در نظر گرفتن ارزیابی‌های زمان اجرا برای ماژول‌های برنامه و عملکرد منابع اجرا می‌کنیم. ما از ارزیابی های زمان اجرای ماژول در گره های مختلف محیط محاسباتی استفاده می کنیم که بر اساس آزمایش ماژول در این گره ها به دست می آید. چنین آزمایشی در ادغام مداوم ماژول های برنامه اجرا می شود. ما ماژول‌های سیستم را از API یک سیستم متا مانیتورینگ مبتنی بر عامل [ 50 ] اضافه می‌کنیم.] وارد جریان کار شود. این ماژول‌های سیستم، جستجو و ضبط منابع محیطی، پیش‌بینی عملکرد آنها در اجرای ماژول‌های کاربردی، با در نظر گرفتن ارزیابی‌های به‌دست‌آمده و توزیع بار محاسباتی بین منابع ضبط‌شده را فراهم می‌کنند. مزایای استراتژی جدید متعادل کردن موثر بار محاسباتی منابع و کاهش سرعت گردش کار است.
شکل 4 گردش کار را برای حل مشکل تنظیم پارامترهای PF نشان می دهد. پارامترها و ماژول های گردش کار به ترتیب با دایره و بیضی ترسیم می شوند. فلش ها انتقال پارامترها را بین ماژول ها نشان می دهد.
گردش کار شامل چهار ماژول است. GetResources یک ماژول سیستمی است. یک لیست ماژول گردش کار با محدودیت در تعداد راه اندازی نمونه های آنها در فرآیند محاسبات دریافت می کند. سپس منابع را جمع‌آوری می‌کند، عملکرد آنها را با توجه به اجرای ماژول گردش کار با استفاده از عامل‌های سیستم فرا نظارت ارزیابی می‌کند و این منابع را برای اجرای ماژول‌ها اختصاص می‌دهد. GetResources اطلاعات مربوط به منابع تخصیص یافته و عملکرد آنها را به ماژول Generate منتقل می کند. بنابراین، ما یک مرحله اضافی از طرح حل مسئله را در مقایسه با روش کلاسیک چند شروع اجرا می کنیم و تجزیه داده ها را بر اساس اطلاعات اکتشافی در مورد عملکرد منابع ارائه می دهیم.
ماژول Generate مجموعه ای از نقاط شروع را برای هر کار اجرا شده در منابع تخصیص یافته ایجاد می کند. تعداد نقاط شروع پردازش شده برای هر کار با عملکرد منابع تخصیص داده شده برای اجرای کار مطابقت دارد. چنین نقشه برداری استفاده کارآمد از منابع تخصیص یافته را ترویج می کند. مجموعه ای از نقاط شروع با تغییر مختصات نقطه تصادفی (مقادیر پارامترها از ).
ماژول Search الگوریتمی را برای فرود از نقطه شروع به حداقل محلی با استفاده از روش Nelder-Mead پیاده سازی می کند. عناصر لیست های موازی StartPoints و EndPoints متغیرهای ورودی و خروجی این ماژول هستند. آنها به طور مستقل از یکدیگر توسط نمونه های جستجو پردازش می شوند. هر نمونه یک برنامه رابط ارسال پیام (MPI) است. در اجرای جستجوی ماژول، مفسر OT نمونه های خود را بر روی منابع اختصاص داده شده اجرا می کند. در نهایت، ماژول SelectionGM حداقل‌های محلی به‌دست‌آمده را ترکیب می‌کند و یک مقدار حداقل را در بین آنها به عنوان حداقل جهانی تابع برمی‌گرداند.
بنابراین، ما کتابخانه برنامه ای را ارائه می کنیم که شامل PF برای پیش بینی ساعتی دمای هوا و سرویس WPS مبتنی بر گردش کار برای تنظیم پارامترهای PF برای یک منطقه خاص است. کاربران نهایی همچنین می توانند از PF از کتابخانه با پارامترهای پیش فرض استفاده کنند. مقادیر پارامترهای پیش‌فرض برای مکان‌هایی در قلمرو طبیعی بایکال تنظیم می‌شوند.

3. نتایج و بحث

3.1. استفاده از تکنیک پیشنهادی برای پیش‌بینی دمای هوا

ما تأثیر استفاده از داده‌های اضافی را برای پیش‌بینی دمای هوا در تکنیک پیشنهادی تحلیل کردیم. برای این منظور دمای هوا را برای دوره معین پیش بینی کردیم. پیش‌بینی برای چهار مکان (یعنی ایرکوتسک، نیژنگارسک، بایکالسک و گوریاچینسک) با شرایط آب و هوایی مختلف انجام شد. ما از سری های زمانی چند بعدی گذشته نگر به دست آمده با استفاده از سرویس WPS ثبت شده در پورتال GIS برای استخراج و پردازش داده های هواشناسی از [ 51 ] استفاده کردیم. این سری زمانی داده‌هایی را از 1 ژانویه 2011 تا 31 دسامبر 2019 نشان می‌دهد که توسط ایستگاه‌های هواشناسی در مکان‌های انتخابی جمع‌آوری شده است.
در آزمایش، اندازه‌های آن را تغییر دادیم برای مرحله 1 و مرحله 2 تکنیک پیشنهادی به نسبت مساوی. برای مقایسه، ما به دو صورت پیش بینی کردیم. در مورد اول، ما یک پیش بینی بر اساس سری زمانی یک بعدی (ODTS) دمای هوا انجام دادیم. در مورد دوم، ما بر اساس سری های زمانی چند بعدی (MDTS) که شامل داده هایی در مورد دمای هوا و تابش کل خورشید و همچنین سرعت و جهت باد است، پیش بینی کردیم.
خطای پیش بینی برآورد شده با استفاده از MAE در شکل 5 نشان داده شده است . می‌توانیم ببینیم که در آزمایش ما، داده‌های اضافی باعث شد MAE در هر چهار مورد کاهش یابد. این امر به ویژه برای پیش‌بینی‌های بایکالسک ( شکل 5 ج) و گوریاچینسک (شکل 5 د) مشهود است. در موارد ایرکوتسک ( شکل 5 الف) و نیژنگارسک ( شکل 5 ب)، کاهش MAE کمتر بود، زیرا تغییرات دمای هوا در آنجا پایدارتر است. بنابراین، تأثیر داده‌های هواشناسی اضافی در درجه متفاوت است، که معمولاً به دلیل ویژگی‌های ریزاقلیمی یک مکان خاص است. با این وجود، استفاده از داده های اضافی تأثیر مثبتی بر دقت پیش بینی دمای هوا دارد.
در آزمایش بعدی از همین داده ها استفاده کردیم. مجموعه را تقسیم کردیم مربوط به ایرکوتسک به و زیر مجموعه هایی که سری های زمانی را شامل می شود و عناصر به ترتیب ما با استفاده از پارامترهای PF را تنظیم کردیم و پیش بینی کرد و . در حالت اول، خطای پیش‌بینی را با استفاده از آن ارزیابی کردیم . در مورد دوم درخواست دادیم .
شکل 6 a,b پراکندگی خطای پیش بینی را به ترتیب برای حالت اول و دوم نشان می دهد. در هر دو شکل، پراکندگی خطای پیش‌بینی مشابه است. این توسط MAE محاسبه شده برای هر دو پیش‌بینی با پارامترهای PF یکسان تأیید می‌شود ( جدول 2 ). بر اساس این نتایج، نتیجه می گیریم که PF با پارامترهای تنظیم شده امکان پیش بینی دمای هوا را با دقت کافی فراهم می کند. از نظر دقت پیش‌بینی، ما معتقدیم که نتایج ما با نتایج به‌دست‌آمده بر اساس شبکه‌های عصبی و سایر روش‌های پیش‌بینی قابل مقایسه است [ 39 ].
محاسبات مشابهی برای Nizhneangarsk ( شکل 7 )، بایکالسک ( شکل 8 ) و گوریاچینسک ( شکل 9 ) انجام شد. به طور کلی، نتایج آنها نتیجه گیری ما را در مورد ایرکوتسک تأیید می کند.
شکل 10 a وابستگی MAE را به اندازه نشان می دهد در مرحله اول ( محور x ) و دوم ( محور y ) تکنیک پیشنهادی برای پیش‌بینی دمای هوا با توجه به ایرکوتسک استفاده می‌شود. تعداد عناصر موجود در برای هر دو مرحله از 8760 تا 70080 متغیر بود. این مربوط به اندازه داده ها از 1 تا 8 سال است. شکل نشان می دهد که افزایش همزمان تعداد عناصر در در امتداد محور x و محور y اغلب باعث کاهش MAE می شود. علاوه بر این، افزایش تعداد عناصر در در امتداد محور y نیز به کاهش MAE کمک می کند. بنابراین، می توان فرض کرد که در حال گسترش است با مشاهدات فعلی کاهش MAE را هنگام پیش‌بینی دمای هوا با استفاده از همان پارامترهای PF از پیش تنظیم‌شده فراهم می‌کند.
نتایج حاصل از پیش‌بینی دمای هوا با تغییر مشابه در تعداد عناصر برای Nizhneangarsk، Baikalsk، و Goryachinsk به ترتیب در شکل 10 b-d نشان داده شده است. به طور کلی، آنها نتیجه گیری ما را در مورد تایید می کنند تغییرات اندازه برای ایرکوتسک در نظر گرفته شده است.
کتابخانه نرم‌افزار توسعه‌یافته و سرویس WPS مبتنی بر گردش کار برای اصلاح سرویس شبیه‌سازی تجهیزات سازگار با محیط زیست در نظر گرفته شده در [ 52 ] استفاده شده است. این سرویس برای ارزیابی اعمال شد کاهش به دلیل استفاده جزئی از پمپ های حرارتی به جای دیگ بخار زغال سنگ در سیستم های گرمایش اشیاء زیرساختی در قلمرو طبیعی بایکال.
ما تابع پیش‌بینی دمای هوای ساعتی مورد استفاده در سرویس را با PF جایگزین کردیم، که پارامترهای آن با توجه به شرایط آب و هوایی مکان برای اشیاء زیرساخت شبیه‌سازی‌شده تنظیم شد. استفاده از PF به ما این امکان را می دهد که ویژگی های فصل گرما را مشخص کنیم و کاهش آن را روشن کنیم انتشارات

3.2. تجزیه و تحلیل جامع آزمایشات محاسباتی

برنامه مبتنی بر گردش کار زمانی راه اندازی می شود که سرویس WPS برای تنظیم پارامترهای PF فراخوانی شود. ما به نوبه خود مشکل تنظیم پارامترهای PF را با شرایط آب و هوایی ایرکوتسک در دو خوشه HPC از مرکز ابر رایانه ایرکوتسک با دسترسی عمومی [ 53 ] حل کردیم. گره های کلاستر دارای ویژگی های زیر بودند: 2 پردازنده Intel Xeon CPU X5670 (18 هسته، 2.1 گیگاهرتز، 128 گیگابایت رم) برای یک گره از اولین کلاستر. 2 پردازنده AMD Opteron 6276 (16 هسته، 2.3 گیگاهرتز، 64 گیگابایت رم) برای یک گره از خوشه دوم. حداکثر تعداد هسته های استفاده شده از 32 تا 1024 برای خوشه اول (از 36 تا 1080 برای خوشه دوم) متغیر بود.
شکل 11 a,b طول اجرای گردش کار (a) و سرعت محاسبات (b) را در تنظیم پارامترهای PF به دست آمده در اولین خوشه با استفاده از 500، 1000، 2000، 4000 و 8000 نقطه شروع نشان می دهد. شکل 11 c,d نشان دهنده فاصله (c) و speedup (d) بدست آمده در خوشه دوم است. در هر دو مورد، ما شاهد کاهش قابل توجهی در زمان اجرای گردش کار با افزایش تعداد هسته‌های مورد استفاده بودیم. کاهش فاصله با افزایش سرعت محاسبات به دلیل رشد تعداد هسته‌های مورد استفاده به دست آمد.
ناهمگونی ویژگی‌های گره هنگام توزیع بار محاسباتی دلیلی برای یک مشکل غیر ضروری است. نیاز به ارزیابی زمان اجرای گردش کار در گره های مختلف محیط محاسباتی، حل این مشکل را پیچیده می کند. در این راستا، داشتن استراتژی هایی برای توزیع بار محاسباتی ضروری است که ما را حداقل تا حدی قادر به حل مشکل می کند.
ما سه استراتژی زیر را برای توزیع بار محاسباتی بین گره ها مقایسه کردیم:
  • راه اندازی تعداد مساوی کار در هر گره توسط یک کاربر.
  • بارگیری گره های رایگان از صف کار مشترک. این استراتژی در عمل توسط متا زمانبندی های معروفی مانند GridWay و Condor DAGMan و همچنین LRMها برای منابع همگن، به عنوان مثال LSF [ 54 ] استفاده می شود.
  • راه اندازی تعداد کارها در هر گره متناسب با عملکرد گره با در نظر گرفتن زمان اجرای کار ارزیابی شده در این گره. ما این استراتژی را در OT با استفاده از سیستم فرا مانیتورینگ برای پیش‌بینی زمان اجرای کار بر روی گره‌هایی که توسط عواملی که نتایج آزمایش ماژول برنامه در این گره‌ها را در نظر گرفته‌اند، اجرا و اعمال کردیم.
اجرای جستجوی ماژول سهم اصلی در طول اجرای گردش کار را تعیین می کند. بنابراین، ما کارهایی را برای اجرای این ماژول در محیطی متشکل از 10 گره سریع و آهسته به نسبت های مختلف راه اندازی کردیم. گره ها دارای ویژگی های زیر بودند: 2 پردازنده Intel Xeon CPU X5670 (18 هسته، 2.1 گیگاهرتز، 128 گیگابایت رم) برای گره سریع. 2 پردازنده AMD Opteron 6276 (16 هسته، 2.3 گیگاهرتز، 64 گیگابایت رم) برای گره کند. گره ها همچنین بخشی از دو خوشه HPC مرکز ابر رایانه ایرکوتسک بودند. بنابراین، ما از 320 تا 360 هسته در هر آزمایش استفاده کردیم.
ما از سه استراتژی برای توزیع بار محاسباتی بین گره‌ها برای هر راه‌اندازی در این آزمایش‌ها استفاده کردیم. ما زمان اجرای کار را روی گره‌های سریع و آهسته برای استراتژی سوم با آزمایش ماژول بر روی هر دو نوع گره ارزیابی کردیم. آمار تجربی در جدول 2 ارائه شده است. برای هر استراتژی در جدول 2 ، تعداد راه‌اندازی نمونه ماژول، میانگین زمان اجرا برای یک نمونه، زمان اجرای کل برای همه نمونه‌ها و میانگین سربار را آورده‌ایم. هزینه های سربار مربوط به صف بندی، راه اندازی و کنترل نمونه های ماژول و انتقال داده است. آمار با جستجوی حداقل جهانی PF با استفاده از 2000 نقطه شروع در پنج گره سریع و پنج گره کند به دست آمد.
نمونه ماژول در استراتژی دوم بار محاسباتی کمتری داشت (پردازش نقاط شروع کمتر). بنابراین، میانگین زمان اجرا برای یک مثال در استراتژی دوم کمتر از استراتژی های دیگر بود. به دلیل جذب منابع، استراتژی سوم در میانگین سربار کمی کمتر از استراتژی اول بود. با این حال، برای مثال، از استراتژی دوم در میانگین زمان اجرا بهتر عمل کرد. علاوه بر این، استراتژی سوم در کل زمان اجرا برای همه موارد نسبت به سایرین برتری داشت. این مزیت استراتژی اول به دلیل توزیع بهتر بار محاسباتی با در نظر گرفتن زمان اجرای ماژول در گره های اختصاص داده شده به دست آمد.
شکل 12 a طول اجرای گردش کار را بر اساس سه استراتژی توزیع بار محاسباتی برای نسبت های مختلف گره های سریع و کند نشان می دهد. جستجوی ماژول بیشترین کمک را به زمان اجرای گردش کار کرد. بکارگیری استراتژی سوم با رشد گره های سریع، باعث کاهش مداوم در زمان اجرای گردش کار شد. با این حال، استراتژی سوم از استراتژی دوم در کاهش برای همه نسبت‌های گره‌ها بهتر عمل کرد. در عین حال، استراتژی اول در بیشتر نسبت های گره ها نسبت به استراتژی سوم پایین تر بود. این یک طول اجرای گردش کار برابر با همان زمان تعیین شده در استراتژی سوم در محیطی که فقط از منابع همگن تشکیل شده است، ایجاد کرد.
در اولین استراتژی، نمونه های جستجوی ماژول همان تعداد نقاط شروع را پردازش کردند، یعنی تقریباً بار محاسباتی مشابهی داشتند. هنگام استفاده از نه گره سریع، کارهای شروع شده در این گره ها برای جستجوی ماژول به سرعت اجرا می شدند. در همان زمان، برای تکمیل یک کار برای همان ماژول در یک گره آهسته باید مدت زیادی صبر می کردیم. همه این کارها با سرعت یکسان برای ده گره سریع اجرا شدند. در این مورد، کاهش قابل توجهی در طول زمان اجرای گردش کار در مقایسه با نسبت گره های سریع و کند، معادل 9 به 1 به دست آمد.
تغییرات در سرعت محاسبات به دنبال افزایش گره های سریع در شکل 12 ب نشان داده شده است. در اینجا، سرعت محاسبات به عنوان نسبت اجرای گردش کار در یک گره سریع به طول اجرای گردش کار در محیطی متشکل از ده گره سریع و آهسته که به نسبت های مختلف ارائه شده اند، محاسبه می شود. استراتژی سوم بهبود سرعت محاسبات را برای تمام نسبت‌های گره‌های سریع و کند در مقایسه با استراتژی دوم نشان داد. همچنین از استراتژی اول در افزایش سرعت محاسبات برای بیشتر نسبت ها بهتر عمل کرد، به جز در دو مورد که از گره های کاملاً همگن استفاده کردیم.
بازده استفاده از منابع نشان داده شده در شکل 12 c به عنوان نسبت افزایش سرعت محاسبات به تعداد گره های استفاده شده تعریف می شود. در مورد استراتژی سوم، می بینیم که بازده نزدیک بود و از 0.57 به 0.97 تغییر کرد. راهبردهای اول و دوم در این هدف از استراتژی سوم پایین تر بودند، همانطور که سرعت محاسبات نیز پایین بود.
در نهایت، شکل 12 d میانگین استفاده از CPU را برای منابع مورد استفاده نشان می دهد. در اکثر ترکیبات گره های سریع و آهسته، استراتژی اول میانگین استفاده بهتر از CPU را نسبت به استراتژی های دیگر ارائه می دهد.
بر اساس تجزیه و تحلیل داده های تجربی، ما نتایج زیر را در مورد محیط محاسباتی در نظر گرفته می گیریم:
  • استفاده از حداقل یک گره آهسته بر سرعت اجرای گردش کار، سرعت محاسبات و کارایی استفاده از منابع در هنگام اعمال استراتژی اول تأثیر منفی می گذارد. در همان زمان، مقادیر متوسط ​​استفاده از CPU نزدیک به 1 هنگام استفاده از محیط محاسباتی که به طور کامل از گره‌های همگن تشکیل شده بود، به دست آمد.
  • در استراتژی دوم، نمونه‌های بیشتری از جستجوی ماژول تولید شد. همه موارد شامل صف کشیدن قبل از راه اندازی بود. علاوه بر این، انتقال داده ها و بررسی وضعیت اجرا برای هر نمونه ضروری بود. بنابراین، استراتژی دوم با سربار بیشتر مشخص شد. این سربارها در مقایسه با استراتژی های دیگر، عوامل اصلی افزایش طول اجرای گردش کار بودند.
  • مزایای استراتژی سوم به دلیل توزیع بار محاسباتی بر روی منابع بر اساس عملکرد آنها به دست آمد. سرعت محاسبات نشان داده شده با افزایش تعداد گره های سریع استفاده شده و کارایی استفاده از آنها نزدیک به 1 مقیاس پذیری خوب محاسبات توزیع شده را تعیین می کند.
اطمینان از مقیاس پذیری محاسبات توزیع شده یک مشکل مهم است زیرا سیستم های محیط های محاسباتی توزیع شده می توانند شامل منابعی با ویژگی ها و قابلیت های محاسباتی متفاوت باشند.
نتایج تجزیه و تحلیل تجربی انجام شده در محیط محاسباتی، مزایای استراتژی پیشنهادی توزیع بار محاسباتی در OT را در مقایسه با سایر استراتژی‌ها که اغلب در عمل به کار می‌روند، نشان می‌دهد.
مزیت ها در بهبود اهداف کاربران برای کیفیت حل مسئله (یعنی افزایش سرعت محاسبات و کاهش سرعت اجرای گردش کار) و ترجیحات ارائه دهندگان منابع در افزایش کارایی استفاده از منابع و استفاده متوسط ​​از پردازنده هایشان است. این در درجه اول به دلیل پتانسیل OT برای گنجاندن ماژول های سیستم در گردش کار برای جستجو و گرفتن منابع، پیش بینی عملکرد آنها و توزیع بار محاسباتی بین این منابع توسط عوامل است. علاوه بر این، هرچه ناهمگونی محیط محاسباتی مهم‌تر باشد، مزایای استراتژی پیشنهادی در مقایسه با استراتژی‌های دیگر قابل مشاهده‌تر است.

4. نتیجه گیری

در این مقاله، ما رویکردی را برای یکپارچه‌سازی خدمات WPS با برنامه‌های علمی مبتنی بر گردش کار در پورتال GIS پیشنهاد کردیم که از حل مشکلات پایش محیطی پشتیبانی می‌کند. با پیروی از این رویکرد، کاربران یک برنامه کاربردی علمی مبتنی بر برنامه‌نویسی مدولار و یکپارچه‌سازی مداوم ایجاد می‌کنند و همچنین یک محیط محاسباتی ناهمگن را با استفاده از چارچوب OT سازماندهی می‌کنند. در مرحله بعد، آنها گردش کار را تشکیل می دهند، به طور خودکار خدمات WPS را ایجاد می کنند و آنها را در پورتال GIS ثبت می کنند.
بکارگیری استاندارد WPS باز همراه با تکنیک گردش کار ترکیبی از سرویس های وب توسعه یافته توسط محققان مختلف را فراهم می کند و دسترسی به داده های مکانی و زمانی را برای کاربران نهایی پورتال GIS گسترش می دهد.
از دیدگاه سازمان HPC، ما امیدواریم که رویکرد پیشنهادی در دسترس بودن و استفاده از منابع محیط محاسباتی توزیع شده ناهمگن و مقیاس پذیری محاسبات را برای سایر محققان تضمین کند. ما می خواهیم به متخصصان علاقه مند امکانات بهبود یافته ای برای پردازش و تبادل داده ها ارائه دهیم. علاوه بر این، به دلیل اجرای یکپارچه‌سازی مداوم نرم‌افزار کاربردی با استفاده از فناوری چند عاملی، از سازگاری اهداف برای ارائه‌دهندگان منابع و کاربران آنها پشتیبانی می‌کنیم.
نتایج مطالعه انجام آزمایش‌های علمی با داده فشرده را در چارچوب پایش محیطی ترویج می‌دهد و سازمان‌های علاقه‌مند را به نتایج این آزمایش‌ها دسترسی خواهند داد. به نوبه خود، پردازش و تجزیه و تحلیل موثر داده های مکانی-زمانی به قوانین حفظ قلمرو طبیعی بایکال و بهبود اکولوژیکی آن توسط دولت منطقه ای و وزارت منابع طبیعی و محیط زیست فدراسیون روسیه کمک خواهد کرد.
برای بسیاری از مشکلات علمی و کاربردی، کاهش زمان پردازش برای داده های مکانی-زمانی اغلب یک موضوع مرتبط است. در این راستا، ما برای تحقیقات آتی خود، مسیرهای زیر را برجسته می کنیم:
  • پشتیبانی از فناوری شبکه داده های درون حافظه (IMDG) [ 55 ] برای برنامه های توسعه یافته در OT برای ارائه پردازش داده های مکانی-زمانی در RAM گره های محیط محاسباتی توزیع شده ناهمگن،
  • اصلاح سیستم فرامانیتورینگ با توجه به خودکارسازی شناسایی و عیب‌یابی جزئی عیوب در عملکرد نرم‌افزار و سخت‌افزار سیستم برای بهبود قابلیت اطمینان پردازش داده‌های مکانی-زمانی مبتنی بر IMDG.
  • توسعه یک مبدل اضافی برای اطمینان از سازگاری با زبان رایج گردش کار (CWL) [ 56 ] برای جلوگیری از توسعه مجدد جریان های کاری مشابه و در نتیجه کاهش زمان آزمایش ها.

منابع

  1. ماخونکو، NI; بلوسوف، SA; تاراسووا، EA؛ پلوتنیکوا، YA فناوری اطلاعات و ارتباطات در پایش محیطی تغییرات آب و هوا. IOP Conf. سر. محیط زمین. علمی 2021 , 808 , 012045. [ Google Scholar ] [ CrossRef ]
  2. بیچکوف، IV; روژنیکوف، جنرال موتورز؛ Hmelnov، AE; فدوروف، RK; Madzhara, TI; پوپووا، نظارت دیجیتال AK دریاچه بایکال و منطقه ساحلی آن. در مجموعه مقالات دومین کارگاه علمی-عملی فناوری اطلاعات: الگوریتم ها، مدل ها، سیستم ها (ITAMS 2019)، ایرکوتسک، روسیه، 20 سپتامبر 2019؛ CEUR-WS Proc.: آخن، آلمان، 2019؛ جلد 2463، ص 13-23. در دسترس آنلاین: https://ceur-ws.org/Vol-2463/paper2.pdf (دسترسی در 29 اکتبر 2021).
  3. لگا، م. کاسازا، م. تتا، ر. Zappa، CJ ارزیابی اثرات زیست محیطی: یک چارچوب چند سطحی و چند پارامتری برای آب های ساحلی. بین المللی جی. سوست. توسعه دهنده طرح. 2018 ، 13 ، 1041-1049. [ Google Scholar ] [ CrossRef ]
  4. پل، پ. آیتال، PS; Bhuimali، A. کالیشانکار، تی. ساودرا، MR; آرمو، سیستم‌های اطلاعات جغرافیایی PSB و سنجش از راه دور: کاربردها در سیستم‌های محیطی و مدیریت. بین المللی جی. مناگ. فنی Soc. علمی 2020 ، 5 ، 11-18. [ Google Scholar ] [ CrossRef ]
  5. دندان های نیش.؛ دا خو، ال. زو، ی. آهاتی، ج. پی، اچ. یان، جی. Liu, Z. یک سیستم یکپارچه برای نظارت و مدیریت محیطی منطقه ای بر اساس اینترنت اشیا. IEEE Trans. Ind. اطلاع رسانی. 2014 ، 10 ، 1596-1605. [ Google Scholar ] [ CrossRef ]
  6. کوسول، ن. شلستوف، آ. Skakun، S. Grid و فن آوری های وب حسگر برای نظارت بر محیط زیست. علوم زمین آگاه کردن. 2009 ، 2 ، 37-51. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  7. برونیگ، ام. بردلی، PE; جان، م. کوپر، پی. مزروب، ن. روش، ن. الدوری، م. استفاناکیس، ای. جدیدی، م. تحقیقات مدیریت داده های جغرافیایی: پیشرفت و جهت گیری های آینده. ISPRS Int. Geo-Inf. 2020 ، 9 ، 95. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  8. لی، کالیفرنیا؛ Gasster، SD; پلازا، آ. چانگ، CI; Huang, B. تحولات اخیر در محاسبات با کارایی بالا برای سنجش از راه دور: بررسی. IEEE J. Sel. بالا. Appl. 2011 ، 4 ، 508-527. [ Google Scholar ] [ CrossRef ]
  9. دراگان، آی. فورتیش، TF; Iuhasz، G. نیگل، ام. Petcu، D. بکارگیری اصول خود* در محیط های ابری ناهمگن. در رایانش ابری ؛ Antonopoulos, N., Gillam, L., Eds. Springer: Cham, Switzerland, 2017; شابک 978-3-319-85443-4. [ Google Scholar ]
  10. هوانگ، اف. یانگ، اچ. تائو، جی. Zhu, Q. پلت فرم زنجیره خدمات محاسبات جغرافیایی با کارایی بالا مبتنی بر گردش کار جهانی. داده های بزرگ زمین 2020 ، 4 ، 409-434. [ Google Scholar ] [ CrossRef ]
  11. رابط محاسبات ابری باز OGF. در دسترس آنلاین: https://www.occi-wg.org/doku.php (در 29 اکتبر 2021 قابل دسترسی است).
  12. فرمت مجازی سازی باز DMTF. در دسترس آنلاین: https://www.dmtf.org/standards/published_documents/DSP0243_1.0.0.pdf (در 29 اکتبر 2021 قابل دسترسی است).
  13. بنیاد زمین فضایی منبع باز. در دسترس آنلاین: https://www.osgeo.org/ (دسترسی در 29 اکتبر 2021).
  14. مدل‌های Castronova، AM به عنوان خدمات وب با استفاده از استاندارد سرویس پردازش وب کنسرسیوم فضایی باز (ogc) (wps). محیط زیست مدل نرم افزار 2013 ، 41 ، 72-83. [ Google Scholar ] [ CrossRef ]
  15. فورستر، تی. شفر، بی. براونر، جی. Jirka, S. ادغام خدمات پردازش وب ogc در برنامه های کاربردی بازار انبوه جغرافیایی. در مجموعه مقالات کنفرانس بین المللی سیستم های اطلاعات جغرافیایی پیشرفته و خدمات وب، کانکون، مکزیک، 1-7 فوریه 2009. IEEE: نیویورک، نیویورک، ایالات متحده آمریکا، 2009; صص 98-103. [ Google Scholar ] [ CrossRef ]
  16. GeoServer. در دسترس آنلاین: https://geoserver.org/ (دسترسی در 29 اکتبر 2021).
  17. Baranski، B. رایانش شبکه ای را فعال می کند خدمات پردازش وب. در مجموعه مقالات ششمین روز اطلاعات جغرافیایی، مونستر، آلمان، 16-18 ژوئن 2008; IfGI Prints: مونستر، آلمان، 2008; جلد 32، ص 243–256. موجود به صورت آنلاین: https://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.470.8333&rep=rep1&type=pdf (در 29 اکتبر 2021 قابل دسترسی است).
  18. یو، پی. ژانگ، ام. Tan, Z. یک سیستم گردش کار ژئوپردازش برای نظارت بر محیط زیست و مدل سازی یکپارچه. محیط زیست مدل نرم افزار 2015 ، 69 ، 128-140. [ Google Scholar ] [ CrossRef ]
  19. Iosifescu-Enescu، I.; ماتیس، سی. گکونوس، سی. Iosifescu-Enescu، CM; Hurni، L. معماری‌های مبتنی بر ابر برای ژئوپورتال‌های وب مقیاس‌پذیر خودکار به سمت Cloudification GeoVITe Geoportal دانشگاهی سوئیس. ISPRS Int. Geo-Inf. 2017 ، 6 ، 192. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  20. وانگ، ی. جیانگ، جی. ژانگ، اچ. دونگ، ایکس. وانگ، ال. رنجان، ر. Zomaya، AY یک الگوریتم موازی مقیاس‌پذیر برای مدل‌های گردش عمومی اتمسفر در یک خوشه چند هسته‌ای. ژنرال آینده. Comp. سیستم 2017 ، 72 ، 1-10. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  21. هوانگ، اف. کراوات، بی. تائو، جی. تان، ایکس. Ma، Y. روش‌شناسی و بهینه‌سازی برای اجرای الگوریتم‌های جغرافیایی موازی مبتنی بر خوشه با مطالعه موردی. خوشه. محاسبه کنید. 2019 ، 23 ، 673-704. [ Google Scholar ] [ CrossRef ]
  22. کانگ، اس. لی، ک. مقیاس خودکار پردازش تصویر مبتنی بر جغرافیا در یک محیط محاسبات ابری OpenStack. Remote Sens. 2016 , 8 , 662. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  23. سان، ز. دی، ال. برگس، آ. تولیس، جی. Magill, AB Geoweaver: زیرساخت سایبری پیشرفته برای مدیریت گردش‌های کاری هوش مصنوعی زمین‌شناسی ترکیبی. ISPRS Int. Geo-Inf. 2020 ، 9 ، 119. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  24. فئوکتیستوف، آ. گورسکی، اس. سیدوروف، آی. بیچکوف، آی. چرنیخ، آ. Edelev، A. توسعه مشارکتی و استفاده از کاربردهای علمی در ابزار Orlando: یکپارچه سازی، تحویل، و استقرار. اشتراک. محاسبه کنید. Inf. علمی 2020 ، 1087 ، 18-32. [ Google Scholar ] [ CrossRef ]
  25. بیچکوف، آی. فئوکتیستوف، آ. گورسکی، اس. ادلف، آ. سیدوروف، آی. کاسترومین، آر. فرفروف، ای. فدوروف، آر. مهندسی ابر رایانه برای حمایت از تصمیم گیری در مورد انعطاف پذیری سیستم های انرژی. در مجموعه مقالات چهاردهمین کنفرانس بین المللی IEEE در مورد کاربرد فناوری های اطلاعات و ارتباطات، تاشکند، ازبکستان، 7 تا 9 اکتبر 2020؛ IEEE: نیویورک، نیویورک، ایالات متحده آمریکا، 2020؛ صص 1-6. [ Google Scholar ] [ CrossRef ]
  26. چرنیخ، آ. بیچکوف، آی. فئوکتیستوف، آ. گورسکی، اس. سیدوروف، آی. کاسترومین، آر. ادلف، آ. زورکالزف، وی. Avetisyan، A. کاهش عدم قطعیت در توسعه و به کارگیری برنامه های کاربردی علمی در یک محیط محاسباتی یکپارچه. برنامه. محاسبه کنید. نرم. 2020 ، 46 ، 483-502. [ Google Scholar ] [ CrossRef ]
  27. بیچکوف، IV; روژنیکوف، جنرال موتورز؛ فدوروف، RK; Khmelnov، AE; Popova، AK فناوری نظارت بر محیط زیست دیجیتال قلمرو طبیعی بایکال. در مجموعه مقالات سومین کارگاه علمی-عملی فناوری اطلاعات: الگوریتم‌ها، مدل‌ها، سیستم‌ها (ITAMS 2020)، ایرکوتسک، روسیه، 3 سپتامبر 2020؛ CEUR-WS Proc.: آخن، آلمان، 2020؛ جلد 2677، ص 1-7. در دسترس آنلاین: https://ceur-ws.org/Vol-2677/paper1.pdf (دسترسی در 29 اکتبر 2021).
  28. کازانووا، اچ. لگراند، ا. زاگورودنوف، دی. Berman, F. Heuristics for Scheduling Parameter Sweep Applications in Grid Environments. در مجموعه مقالات نهمین کارگاه محاسباتی ناهمگن (HCW) (شماره گربه PR00556)، کانکون، مکزیک، 1 مه 2000. IEEE: نیویورک، نیویورک، ایالات متحده آمریکا، 2000; صص 349-363. [ Google Scholar ] [ CrossRef ]
  29. GridWay Metascheduler. در دسترس آنلاین: https://www.gridway.org (در 29 اکتبر 2021 قابل دسترسی است).
  30. تاننباوم، تی. رایت، دی. میلر، ک. لیونی، ام. کندور—یک برنامه‌ریز شغلی توزیع‌شده. در Beowulf Cluster Computing با لینوکس . استرلینگ، تی.، اد. انتشارات MIT: کمبریج، MA، ایالات متحده آمریکا، 2002; صص 307-350. [ Google Scholar ]
  31. Lientz، BP; سوانسون، ای بی. تامپکینز، جنرال الکتریک ویژگی های نگهداری نرم افزار کاربردی. اشتراک. ACM 1978 ، 21 ، 466-471. [ Google Scholar ] [ CrossRef ]
  32. Chatfield, C. Time-Series Forecasting , 1st ed.; CRC Press: نیویورک، نیویورک، ایالات متحده آمریکا، 2000; پ. 280. [ Google Scholar ] [ CrossRef ]
  33. De Gooijer، JG; Hyndman، RJ 25 سال پیش بینی سری های زمانی. بین المللی J. پیش بینی. 2006 ، 22 ، 443-473. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  34. کیسی، دی. سنت هیلر، آ. الجابی، ن. پیش‌بینی دمای آب با استفاده از مدل‌های رگرسیونی و تصادفی. در مجموعه مقالات پنجاه و هفتمین کنگره سالانه انجمن منابع آب کانادا، مونترال، QC، کانادا، 16-18 ژوئن 2004. در دسترس به صورت آنلاین: https://www.researchgate.net/profile/Daniel-Caissie/publication/274071811_Prediction_of_water_temperatures_using_regression_and_stochastic_models/links/551434800cf2edagression_and_stochastic_models/links/551434800cf2edagression-and_4800cf2edagression . اکتبر 2021).
  35. صمدی، م. مجللی، ف. پیش‌بینی دمای هوا با استفاده از مدل‌های سری زمانی و الگوریتم‌های مبتنی بر عصبی. جی. ریاضی. آمار 2007 ، 3 ، 44-48. [ Google Scholar ] [ CrossRef ]
  36. شرف، ع. روی، SR تحلیل مقایسه ای پیش بینی دما با استفاده از روش های رگرسیون و شبکه عصبی پس انتشار. در مجموعه مقالات دومین کنفرانس بین المللی روندها در الکترونیک و انفورماتیک (ICOEI)، Tirunelveli، هند، 11-12 مه 2018؛ صص 739-742. [ Google Scholar ] [ CrossRef ]
  37. Tran، TTK؛ باتنی، SM; کی، اس جی. وثوقی فر، ح. مروری بر شبکه های عصبی برای پیش بینی دمای هوا. Water 2021 , 13 , 1294. [ Google Scholar ] [ CrossRef ]
  38. سیفوئنتس، جی. مارولاندا، جی. بلو، ا. Reneses، J. پیش بینی دمای هوا با استفاده از تکنیک های یادگیری ماشین: مروری. Energies 2020 , 13 , 4215. [ Google Scholar ] [ CrossRef ]
  39. اسمیت، کارشناسی; مک کلندون، RW; Hoogenboom, G. بهبود پیش‌بینی دمای هوا با شبکه‌های عصبی مصنوعی. آکادمی جهانی علوم، مهندسی و فناوری. بین المللی جی. کامپیوتر. برق خودکار کنترل. Inf. مهندس 2007 ، 1 ، 3146-3153. [ Google Scholar ] [ CrossRef ]
  40. هیوگی، پی. بهرا، ع. ترواتی، م. پریرا، ای. قهرمانی، م. پالمیری، اف. لیو، ی. شبکه عصبی کانولوشنال زمانی (TCN) برای پیش بینی آب و هوای موثر با استفاده از داده های سری زمانی از ایستگاه آب و هوای محلی. محاسبات نرم. 2020 ، 24 ، 16453-16482. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  41. کاروان، ز. Suykens, J. Transductive LSTM برای پیش‌بینی سری‌های زمانی: برنامه‌ای برای پیش‌بینی آب و هوا. شبکه عصبی 2020 ، 125 ، 1-9. [ Google Scholar ] [ CrossRef ]
  42. شوالیه، RF; هوگنبوم، جی. مک کلندون، RW; Paz، JA پشتیبان رگرسیون برداری با کاهش مجموعه های آموزشی برای پیش بینی دمای هوا: مقایسه با شبکه های عصبی مصنوعی. عصبی. محاسبه کنید. Appl. 2011 ، 20 ، 151-159. [ Google Scholar ] [ CrossRef ]
  43. پزشکی، ز. مزینانی، SM مقایسه شبکه های عصبی مصنوعی، منطق فازی و فازی عصبی برای پیش بینی بهینه سازی مصرف حرارتی ساختمان: یک بررسی. آرتیف. هوشمند Rev. 2019 , 52 , 495–525. [ Google Scholar ] [ CrossRef ]
  44. کرمی زاده، س. عبدالله، س.م. حلیمی، م. شایان، ج. رجبی، ام جی مزیت و اشکال عملکرد ماشین بردار پشتیبان. در مجموعه مقالات کنفرانس بین المللی 2014 کامپیوتر، ارتباطات و فناوری کنترل (I4CT)، لنکاوی، مالزی، 2 تا 4 سپتامبر 2014. صص 63-65. [ Google Scholar ] [ CrossRef ]
  45. بهاردواج، س. سریواستاوا، اس. گوپتا، جی. مدل مبتنی بر شباهت الگو برای پیش‌بینی سری‌های زمانی. محاسبه کنید. هوشمند 2013 ، 31 ، 106-131. [ Google Scholar ] [ CrossRef ]
  46. دودک، جی. Pełka، P. روش های یادگیری ماشین مبتنی بر شباهت الگو برای پیش بینی بار میان مدت: یک مطالعه مقایسه ای. Appl. محاسبات نرم. 2021 ، 104 ، 107223. [ Google Scholar ] [ CrossRef ]
  47. مارتی، آر. Resende، MGC; Ribeiro، CC روش های چند شروع برای بهینه سازی ترکیبی. یورو جی. اوپر. Res. 2013 ، 226 ، 1-8. [ Google Scholar ] [ CrossRef ]
  48. نلدر، ج.ا. مید، آر. روش سیمپلکس برای کمینه سازی تابع. محاسبه کنید. J. 1965 , 7 , 308-313. [ Google Scholar ] [ CrossRef ]
  49. گاری، م. جانسون، دی. کامپیوترها و سخت‌ناپذیری . WH Freeman: San Francisco, CA, USA, 1979; ISBN 0716710447. [ Google Scholar ]
  50. بیچکوف، IV; Oparin، GA; Feoktistov، AG; سیدوروف، IA; بوگدانوا، وی.جی. گورسکی، SA کنترل چندعاملی سیستم های محاسباتی بر اساس فرا نظارت و شبیه سازی تقلیدی. اپتوالکترون. ساز. فرآیند داده 2016 ، 52 ، 107-112. [ Google Scholar ] [ CrossRef ]
  51. rp5.ru.برنامه آب و هوا. در دسترس آنلاین: https://rp5.ru/ (در 29 اکتبر 2021 قابل دسترسی است).
  52. کاسترومین، آر. بشارینا، او. فئوکتیستوف، آ. سیدوروف، I. رویکرد مبتنی بر ریز سرویس برای شبیه سازی تجهیزات سازگار با محیط زیست اشیاء زیرساخت با در نظر گرفتن داده های هواشناسی. Atmosphere 2021 , 12 , 1217. [ Google Scholar ] [ CrossRef ]
  53. مرکز ابر رایانه ایرکوتسک در دسترس آنلاین: https://hpc.icc.ru/ (در 29 اکتبر 2021 قابل دسترسی است).
  54. Estévez Ruiz، EP; کالونا چیکایزا، جنرال الکتریک؛ Jiménez Patiño، FR; لوپز لاگو، JC; Thirumuruganandham، الگوریتم های ضرب ماتریس متراکم SP و ارزیابی عملکرد HPCC در 81 گره IBM Power 8 Architecture. Computation 2021 , 9 , 86. [ Google Scholar ] [ CrossRef ]
  55. ژانگ، اچ. چن، جی. Ooi، BC; قهوهای مایل به زرد، KL; ژانگ، ام. مدیریت و پردازش داده های بزرگ در حافظه: یک نظرسنجی. IEEE Trans. بدانید. مهندسی داده 2015 ، 27 ، 1920-1948. [ Google Scholar ] [ CrossRef ]
  56. زبان گردش کار رایج در دسترس آنلاین: https://www.commonwl.org/ (در 29 اکتبر 2021 قابل دسترسی است).
شکل 1. طرحی برای عملکرد با داده های مکانی و زمانی.
شکل 2. طرح عملیات با خدمات WPS در OT.
شکل 3. جستجوی قطعات ، ، و غیره که شبیه به .
شکل 4. گردش کار برای تنظیم مقادیر پارامترها از .
شکل 5. پیش بینی بر اساس ODTS و MDTS دمای هوا برای ایرکوتسک ( a )، نیژنانگارسک ( b )، بایکالسک ( c )، و گوریاچینسک ( d ).
شکل 6. پراکندگی خطای پیش بینی ( الف ) و ( ب ) برای ایرکوتسک.
شکل 7. پراکندگی خطای پیش بینی ( الف ) و ( ب ) برای Nizhneangarsk.
شکل 8. پراکندگی خطای پیش بینی ( الف ) و ( ب ) برای بایکالسک.
شکل 9. پراکندگی خطای پیش بینی ( الف ) و ( ب ) برای گوریاچینسک.
شکل 10. وابستگی MAE به اندازه در مراحل اول ( محور x ) و دوم ( محور y ) تکنیک پیشنهادی برای پیش‌بینی دمای هوا با توجه به ایرکوتسک ( a )، نیژن‌انگارسک ( b )، بایکالسک ( c )، گوریاچینسک ( d ) استفاده شد.
شکل 11. اجرای گردش کار باعث افزایش سرعت محاسبات ( b , d ) در خوشه اول ( a, b ) و خوشه دوم ( c , d ) می شود که در تنظیم پارامترهای PF با استفاده از 500، 1000، 2000، 4000، به دست آمد. و 8000 نقطه شروع
شکل 12. اهداف برای سه استراتژی: زمان اجرای گردش کار ( a )، افزایش سرعت محاسبات ( b )، کارایی استفاده از منابع ( c )، و میانگین استفاده از CPU ( d ) از طریق نسبت های مختلف گره های سریع و کند.

بدون دیدگاه

دیدگاهتان را بنویسید