یک رگرسیون موازی وزن‌دار جغرافیایی مبتنی بر CUDA برای داده‌های جغرافیایی در مقیاس بزرگ

خلاصه

رگرسیون وزن‌دار جغرافیایی (GWR) تابع هسته وزن‌دار فاصله را برای بررسی غیر ثابت بودن پدیده‌های جغرافیایی و بهبود عملکرد رگرسیون جهانی معرفی می‌کند. با این حال، کالیبراسیون GWR هنگام استفاده از حالت محاسبات سریال برای پردازش حجم زیادی از داده‌ها حیاتی می‌شود. برای پرداختن به این مشکل، یک رویکرد بهبود یافته مبتنی بر معماری واحد محاسباتی یکپارچه (CUDA) معماری موازی سریع-موازی-GWR (FPGWR) در این مقاله پیشنهاد شده است تا به طور موثر نیازهای محاسباتی انجام GWR را در میلیون‌ها نقطه داده مدیریت کند.
دوره-آموزش-حرفه-ای-gis
 FPGWR قادر است فرآیند سریال را به ماژول های اتمی موازی تجزیه کند و استفاده از حافظه را بهینه کند. برای تأیید قابلیت محاسباتی FPGWR، مجموعه داده‌های شبیه‌سازی را طراحی کردیم و آزمایش‌های آزمایشی مربوطه را انجام دادیم. ما همچنین عملکرد FPGWR و سایر بسته های نرم افزاری GWR را با استفاده از مجموعه داده های باز مقایسه کردیم. نتایج نشان می‌دهد که زمان اجرا FPGWR با عدد هسته CUDA همبستگی منفی دارد و بازده محاسبه FPGWR به سرعت هزاران یا حتی ده‌ها هزار برابر سریع‌تر از الگوریتم‌های GWR سنتی می‌رسد. FPGWR ابزار موثری برای کاوش ناهمگونی فضایی برای داده های جغرافیایی در مقیاس بزرگ (ژئوداده) فراهم می کند.
کلید واژه ها:

CUDA ; GWR ; محاسبات موازی ; داده های جغرافیایی در مقیاس بزرگ

1. معرفی

داده‌های جغرافیایی مقیاس بزرگ در حال حاضر موضوعی قابل توجه در بسیاری از زمینه‌های تحقیقاتی از جمله ارتباطات سیار [ 1 ]، حمل‌ونقل عمومی [ 2 ]، بهداشت پزشکی [ 3 ]، مشاهده زمین [ 4 ] و پایش آب و هوا [ 5 ] است. برای افزایش توانایی تجزیه و تحلیل داده های جغرافیایی عظیم، دانش کاوی جغرافیایی به الگوهای داده محور روی می آورد [ 6 ]. سیستم توزیع‌شده و محاسبات موازی دو فناوری امکان‌پذیر برای حل مشکل تحلیل داده‌های جغرافیایی عظیم هستند. مقدار زیادی از داده های جغرافیایی چند منبعی در یک سیستم شاخص فضایی توزیع شده ذخیره می شود [ 7]]، مردم را قادر می سازد تا به طور موثر به سوابق دسترسی داشته باشند. با استفاده از مزایای سیستم توزیع شده هادوپ، آجی و همکاران. (2019) [ 8 ] یک سیستم ذخیره‌سازی داده‌های مکانی با کارایی بالا مقیاس‌پذیر (Hadoop-GIS) پیشنهاد کرد که می‌تواند نیازهای مدیریت و پرس و جوی داده‌های جغرافیایی عظیم را برآورده کند. علاوه بر این، بر اساس چارچوب محاسبات موازی MapReduce و فناوری پایگاه داده HadoopBase (HBase)، روش تخمین مبدا-مقصد (OD) [ 9] می تواند به طور موثر داده های سفر اتوبوس را مدیریت کند و به طور مستقیم مبدا و مقصد سفر را برای مسافران اتوبوس محاسبه کند. در زمینه محاسبات موازی، داده‌های جغرافیایی در مقیاس بزرگ می‌توانند با استفاده از استراتژی‌های داده‌های چندگانه دستورالعمل‌های چندگانه (MIMD) و داده‌های چندگانه دستورالعمل منفرد (SIMD) به قطعات داده‌های متعدد موازی شوند. MIMD چندین دستورالعمل را به طور همزمان در تقابل با SIMD مدیریت می کند. محیط های مختلفی برای موازی سازی چندین کار بر اساس استراتژی های مختلف (SIMD، MIMD) وجود دارد، مانند یک رابط ارسال پیام (MPI)، یک CPU چند هسته ای و یک واحد پردازش گرافیکی با حافظه مشترک چند هسته ای (GPU). MPI عمدتا برای استاندارد کردن پروتکل ارتباطی خوشه چند برنامه ای استفاده می شود، CPU چند هسته ای به قدرت محاسباتی هسته CPU متکی است. و پردازنده‌های گرافیکی با حافظه مشترک چند هسته‌ای از پردازنده‌های جریانی متعدد (SP) بهره می‌برند. ویلکینسون و همکاران (1999) [10 ] تکنیک های برنامه نویسی موازی و چگونگی حل مسائل را با سرعت محاسباتی بیشتر از آنچه که با یک کامپیوتر منفرد امکان پذیر است، معرفی می کند. گونگ و همکاران (2013) [ 11 ] یک رویکرد موازی را پیشنهاد می‌کند که از قدرت سیستم‌های چند هسته‌ای برای مقابله با پیچیدگی محاسباتی مدل‌های مبتنی بر عامل (ABM) استفاده می‌کند، و پیچیدگی فضا-زمان یک سیستم جغرافیایی را حل می‌کند. تانگ و همکاران (2015) [ 12 ] و ژانگ و همکاران. (2017) [ 13 ] امکان استفاده از GPU برای انجام محاسبات فضایی موازی گسترده و تسریع تجزیه و تحلیل الگوی نقطه مکانی را بررسی کرد. ساندریک و همکاران (2019) [ 14] موازی سازی را برای برخی از عملیات ویژگی های GIS با استفاده از سیستم رابط عبور پیام-GIS (MPI-GIS) خود انجام داد، که مزایای ورودی/خروجی MPI (I/O) و GPU را بر روی دسته ای از گره ها یکپارچه می کند. استویانوویچ و همکاران (2019) [ 15 ] یک الگوریتم برای تجزیه و تحلیل با رویکرد حوضه، به نام جهت جریان چندگانه (MFD) پیشنهاد کرد که برای CPU چند هسته ای یا پردازنده گرافیکی چند هسته ای طراحی شده بود. پیشرفت‌های شگفت‌انگیزی در زمینه‌های سخت‌افزار و نرم‌افزار کامپیوتر حاصل شده است که پایه محکمی برای به‌روزرسانی ابزارهای تحقیقات جغرافیایی ایجاد می‌کند. با این حال، هنوز یک مشکل قابل توجه وجود دارد که باید حل شود: چگونه ابزارهای تجزیه و تحلیل جغرافیایی موجود را می توان برای سازگاری با توسعه استخراج داده های جغرافیایی بزرگ تغییر داد [ 16 ]؟
تجزیه و تحلیل غیر ایستایی فضایی یک زمینه تحقیقاتی مهم داده کاوی مکانی است. براندون و همکاران (1996) [ 17] ابزار موثر (مدل GWR) را برای کشف عدم ایستایی فضایی پیشنهاد کرد. GWR ایده همواری محلی را برای کالیبره کردن ضرایب رگرسیون و تشخیص عدم ایستایی فضایی در فضای جغرافیایی معرفی می‌کند. گسترش ضریب مکان GWR را از مدل رگرسیون خطی معمولی (OLR) به مدل رگرسیون محلی ارتقا می‌دهد. روش حداقل مربعات با وزن محلی (LWLS) برای تخمین پارامترها نقطه به نقطه استفاده می شود، که در آن وزن به تابع هسته فاصله یک نقطه در برابر هر نقطه مشاهده اشاره دارد. نتایج تخمین پارامتر از GWR هم به وضوح قابل تفسیر و هم از نظر آماری قابل تأیید است. بنابراین، GWR به یک روش اصلی برای مطالعه ناهمگونی فضایی تبدیل شده است. ژانگ و همکاران (2020) [ 18] از GWR برای شناسایی نیروهای محرک تخلیه فاضلاب بین استان های چین استفاده کرد و متوجه شد که سیاست صنعت کلان و اقدامات حفاظت از محیط زیست دلایل اصلی تغییرات فضایی آن هستند. وو (2020) [ 19 ] عوامل مؤثری را که باعث توزیع مکانی و زمانی متفاوت ردپاهای اکولوژیکی با استفاده از GWR می‌شوند را بررسی کرد. یوان و همکاران (2020) [ 20 ] از GWR برای آشکار کردن روابط متغیر فضایی در متغیرهای محیطی (Pb و Al) استفاده کرد و پیشنهاد کرد که GWR از ابزارهای تحلیل آماری معمولی مؤثرتر است. هونگ و همکاران (2020) [ 21] رابطه ناهمگن فضایی بین متغیرهای قیمت و قیمت‌گذاری را با استفاده از رگرسیون وزن‌دار جغرافیایی چندمقیاسی (MGWR)، که در آن بر محدودیت‌های پژوهش مدل قیمت‌گذاری لذت‌گرایانه برای مسکن اقتصاد به اشتراک گذاشته شده بود، تحقیق کرد. وو و همکاران (2020) [ 22 ] یک مدل رگرسیون وزنی شبکه عصبی (GTNNWR) از نظر جغرافیایی و زمانی ایجاد کرد که از شبکه عصبی مجاورت مکانی-زمانی (STPNN) گسترش یافته بود، که نه تنها عملکرد پیش‌بینی بهتری را نشان داد، بلکه توزیع ناهمگنی مکانی-زمانی را نیز با دقت بیشتری نشان داد. .
به طور معمول، موازی سازی ابزارهای تجزیه و تحلیل جغرافیایی به یک موضوع جامع در زمینه کامپیوتر و علم جغرافیا تبدیل شده است. بسته spgwr [ 23 ] برای پیاده سازی GWR در زبان R توسعه داده شد. یک بسته R دیگر (GWmodel) [ 24 ] این مدل را با تکنیک وزن دهی پنجره متحرک بهینه کرد و کارایی کمی بهتر در برابر spgwr به دست آورد. پیاده‌سازی مبتنی بر پایتون (mgwr [ 25 ]) MGWR برای تجزیه و تحلیل چندمقیاسی توسعه داده شد که روابط متفاوتی را با توجه به هر ضریب اجازه می‌دهد. لی و همکاران (2019) [ 26] (یکی از اعضای بسته mgwr) حالت خود را به موازی سازی توزیع شده در محیط محاسباتی با عملکرد بالا (HPC) ارتقا داد و بسته جدید (FastGWR) به نتایج رضایت بخشی دست یافت. تران و همکاران (2016) [ 27] اجرای GWR در مقیاس بزرگ را بر روی یک چارچوب محاسباتی خوشه‌ای در حافظه Spark (Spark-GWR) مورد مطالعه قرار داد و تشخیص داد که این یک راه‌حل امکان‌پذیر با استفاده از رایانه‌های خوشه‌ای برای اجرای موازی GWR است، اما برای برنامه‌نویس‌های معمولی در توسعه با مشکلات زیادی مواجه است. و تست تحت محیط خوشه. به عنوان یک مدل نماینده رگرسیون محلی، GWR همه مشاهدات (نمونه ها) را در حلقه دنباله رگرسیون ترکیب می کند. کلید وزن‌دهی جغرافیایی محاسبه وزن فاصله برای هر نمونه است، جایی که باعث پیچیدگی پرهزینه از نظر زمان اجرا و حافظه می‌شود. در عین حال، کل فرآیند مقدار زیادی از زمان محاسباتی را مصرف می کند زیرا کالیبراتور وزن در حلقه های چند لایه شرکت می کند. تحت شرایط داده های جغرافیایی در مقیاس بزرگ، GWR باید از دو سطح تکرار چرخه بزرگ عبور کند، تکرار بیرونی مسئول رگرسیون نقطه به نقطه است و تکرار داخلی برای محاسبه ماتریس بین نمونه‌های تک نمونه و نمونه کامل استفاده می‌شود. بنابراین، محدود به ساختار داده و حالت عملیاتی، GWR در پرداختن به داده های جغرافیایی در مقیاس بزرگ کمتر موثر است. روش‌های همزمانی می‌توانند کارایی ابزارهای تحلیل جغرافیایی را بسته به بهینه‌سازی نرم‌افزار بهبود بخشند، اما محیط موازی سخت‌افزاری می‌تواند پشتیبانی بومی را به دست آورد و بهترین عملکرد شتاب را به دست آورد. هر دو FastGWR و Spark-GWR می توانند GWR را به چندین مجموعه وظایف موازی تقسیم کنند و دو برنامه موازی برای معماری CPU طراحی شده اند که نمی توانند با معماری GPU سازگار شوند.
در این مقاله، ما FPGWR را برای کاهش پیچیدگی محاسباتی در فرآیند GWR توسعه می‌دهیم و برنامه‌های GWR را در میلیون‌ها یا حتی ده‌ها میلیون داده جغرافیایی فعال می‌کنیم. این تکنیک به طور قابل توجهی کارایی در رگرسیون را هنگام استفاده از موازی سازی وظایف بزرگ بهبود می بخشد. بر اساس چارچوب CUDA، وظایف فرعی اتمی که از وظایف بزرگ تجزیه می شوند، می توانند در یک دستگاه GPU در حالت موازی اجرا شوند. این مقاله به شرح زیر به ادبیات قبلی کمک می کند. (1) FPGWR می تواند کمبودهای GWR را در انجام محاسبات رگرسیونی برای داده های جغرافیایی در مقیاس بزرگ جبران کند و FPGWR با واحدهای محاسباتی اتمی جداگانه (اتمیزه کردن) کارآمدتر از GWR است. (2) FPGWR یک مدل قدرتمند برای کاوش ناهمگونی فضایی و ترکیب موازی بالا در تجزیه و تحلیل جغرافیا است. که برای تحصیل در رشته های مختلف از جمله جغرافیای اقتصادی، علوم اجتماعی، بهداشت عمومی کاربرد دارد. (3) بهبود از GWR به FPGWR می تواند بینش جدیدی را در مورد محاسبات جغرافیایی از منظر فضایی و محاسباتی ارائه دهد.

2. مدل GWR و الگوریتم اتمیزاسیون

2.1. بررسی GWR

قبل از دهه 1980، OLR اغلب برای تجزیه و تحلیل پدیده های جغرافیایی استفاده می شد. ضرایب پیش بینی β^�^محاسبه شده با روش برآوردگر حداقل مربعات معمولی (OLS)، از قانون تخمین بی طرفانه بهینه جهانی تبعیت می کند. نتیجه رگرسیون نهایی صرفاً سطح متوسط ​​در منطقه مورد مطالعه را منعکس می کند. استفاده از روش های رگرسیون جهانی در مدل رگرسیون محلی نامشروع است. بنابراین فاستر و همکاران. (1986) [ 28 ] یک فیلتر تطبیقی ​​فضایی (SAF) ایجاد کرد که از مدل‌سازی ضرایب مختلف یاد می‌گیرد، که می‌تواند به طور خودکار جهش گامی و غیرایستایی فضایی پیوسته را در ضرایب توصیف کند. بر اساس تکنیک هموارسازی چند جمله ای محلی، براندون و همکاران. (1996) [ 17 ] ابزار تحلیل GWR را پیشنهاد کرد.

2.1.1. مدل GWR

مدل GWR OLR را گسترش می‌دهد و فاکتور مکان را برای بیان تغییرات فضایی ضرایب معرفی می‌کند. به عبارت دیگر موارد زیر را داریم:

yمن=β0(تومن،vمن) +1پβمتر(تومن،vمن)ایکسمن _+εمن، ، ⋯ ، n��=�0(��,��)+∑�=1���(��,��)���+���=1,2,⋯,�

جایی که yمن��متغیر رگرسیون (متغیر وابسته) در مکان i است ، (تومن،vمن)(��,��)مختصات (معمولاً طول و عرض جغرافیایی) اولین نقطه نمونه در منطقه مورد مطالعه را نشان می دهد. βمتر(تومن،vمن)��(��,��)نشان دهنده ضریب امین نقطه نمونه بر اساس تابعی با متغیرهای مستقل است تومن��و vمن��، ایکسمن _���m امین متغیر پیش بینی کننده (متغیر مستقل) را بیان می کند و εمن��عبارت خطا را نشان می دهد و n حجم نمونه است. شرایط لازم برای رابطه (2) را می توان به صورت زیر بیان کرد:

εمنن,σ2) ∩سی  (εمن،εj) =0 ( ≠ j )��~�(0,�2) ∩ ���(��,��)=0(�≠�)

برای سادگی، معادله (1) به صورت خلاصه شده است

yi=m=0pβimxim+εii=1,2,,n  xi01��=∑�=0�������+�� �=1,2,⋯,� ∩ ��0≡1
برای جلوگیری از انحطاط GWR به یک رگرسیون خطی عمومی، لازم است که β1m=β2m==βnm�1�=�2�=⋯=���نباید در پیش شرط ها ظاهر شود.

متغیرهای مربوط به GWR را می توان در قالب ماتریس تعریف کرد. ماتریس متغیر مستقل Xبا فرم زیر قابل محاسبه است:

X=⎡⎣⎢⎢⎢⎢⎢111x11x21xn1x12x22xn2x1px2pxnp⎤⎦⎥⎥⎥⎥⎥�=[1�11�12⋯�1�1�21�22⋯�2�⋮⋮⋮⋱⋮1��1��2⋯���]

2.1.2. تابع هسته وزن فضایی

وجود دارد nشرایط وزن فضایی wij���بین دو نقطه نمونه ( i=j�=�مجاز است) در منطقه مورد مطالعه. در مدل GWR معمولاً نشان دادن ماتریس وزن است Wi��به عنوان یک ماتریس مربع مورب:

Wi=⎡⎣⎢⎢wi100win⎤⎦⎥⎥��=[��1⋯0⋮⋱⋮0⋯���]

در حال حاضر، اشکال مختلفی از تابع هسته وزن وجود دارد wij���، و بیشترین استفاده را Bi-Square و Gaussian می کنند. دو تابع را می توان به صورت معادلات (6) و (7) بیان کرد:

BiSquare:wij=⎧⎩⎨⎪⎪[1(dijbw)2]2 ,0    ,dij<bwdijbwBi−Square: ���={[1−(�����)2]2 ,���<��0    ,���≥��
Gaussian:wij=e1/2(dijbw)2Gaussian: ���=�−1/2(�����)2

جایی که dij���نشان دهنده فاصله بین دو نقطه نمونه ( iو jj) و bw��پارامتر پهنای باند را نشان می دهد که می تواند نه تنها به عنوان آستانه همسایگان بلکه به عنوان ضریب تضعیف فاصله در تابع هسته وزن تفسیر شود.

2.1.3. رگرسیون مدل

برآورد ضریب رگرسیون β^i�^�در موقعیت iتعریف شده است

β^i=(XTWiX)1XTWiY�^�=(�����)−1�����

مقدار رگرسیون Y^من�^�از نقطه رگرسیون منبر اساس β^من�^�می توان از آن تخمین زد

Y^من=ایکسمن(ایکستیدبلیومنایکس)– 1ایکستیدبلیومنY�^�=��(�����)−1�����

جایی که ایکسمن��نشان دهنده بردار ردیف i در ماتریس استایکس. ماتریس کلاه نقش بسیار مهمی در تحلیل باقیمانده مدل رگرسیون خطی دارد. این مطالعه به معرفی ماتریس کلاه می پردازد اسبه GWR. ماتریکس اسرا می توان به صورت زیر بیان کرد:

اسمن=ایکسمن(ایکستیدبلیومنایکس)– 1ایکستیدبلیومن��=��(�����)−1����

ماتریس نتیجه رگرسیون Y^من�^�را می توان با ماتریس کلاه نشان داد اس:

Y^SY=⎡⎣⎢⎢⎢Y^1Y^n⎤⎦⎥⎥⎥=⎡⎣⎢⎢اس1اسn⎤⎦⎥⎥Y�^=��=[�^1⋮�^�]=[�1⋮��]�
دوره-آموزش-حرفه-ای-gis

2.1.4. معیارهای انتخاب پهنای باند بهینه

کلید کشف پهنای باند بهینه w��در حال به حداقل رساندن است یک Iسیج����نمره. روش های انتخاب حلقه و انتخاب طلایی برای به دست آوردن کمترین در دسترس هستند یک Iسیج����ارزش. جستجوی پهنای باند بهینه w��از معیار تخمین پارامتر جدایی ناپذیر است. معیار یک Iسیج����[ 29 ] توسط Brunsdon و همکاران معرفی شده است. (2002) [ 30 ] برای انتخاب پهنای باند بهینه تابع وزن. فرمول خاص را می توان به صورت بیان کرد

یک Iسیجln (σ^2) +nln ( π) + [S)– – S)]����=�ln(�^2)+�ln(2�)+�[�+��(�)�−2−��(�)]

باقی مانده εرا می توان با داده های نمونه محاسبه کرد Yو نتیجه رگرسیون Y^�^:

ε YY^�=�−�^

برآورد بی طرفانه واریانس خطای تصادفی به صورت بیان شده است σ^2�^2:

σ^2=آر اساس– S) + (استیاس)�^2=����−2��(�)+��(���)

جایی که RSS مجموع مجذور باقیمانده ها را نشان می دهد، S)��(�)ردی از ماتریس کلاه است اس، و – S) + (استیاس)�−2��(�)+��(���)درجه آزادی موثر GWR را نشان می دهد. در بیشتر موارد، (استیاس)��(���)تقریبا برابر است S)��(�)(استیاس) ≈tr ( S)��(���)≈��(�)، و بدین ترتیب، معادله (14) فوق را می توان به صورت ساده سازی کرد

σ^2=آر اساس– S)�^2=����−��(�)

2.2. اتمیزه کردن مدل GWR

همانطور که در بالا ذکر شد، فرآیند رگرسیون مدل GWR شامل دو مرحله ثابت است: انتخاب پهنای باند بهینه و تشخیص مدل. اکثر بسته های موجود که الگوریتم GWR را پیاده سازی کرده اند توسط حالت سریال پشتیبانی می شوند. در مقایسه با حالت موازی، حالت سریال پیامدهای نامطلوبی برای محاسبه رگرسیون دارد. ظروف محاسباتی با توان محاسباتی نامتناهی با نمونه های بسیار بزرگ بارگذاری می شوند. زمان اجرا همراه با رشد اندازه نمونه، به دنبال یک توان یا حتی یک رابطه نمایی [ 31 ] بوجود می آید. در این مقاله، این یک راه حل عملی برای طراحی الگوریتم 1 (اتمیزه کردن) در کاهش پیچیدگی محاسبه رگرسیون GWR است.

الگوریتم 1 فرآیند اتمی – حداقل واحد الگوریتم ها.
فرآیند اتمی: بهینه سازی جستجوی پهنای باند با به حداقل رساندن امتیاز AIC

  • با توجه به پهنای باند آزمایش ( bw ) و شاخص فرآیند اتمی ( z )
  • محاسبه wzzCalculate ��� (wzz≡ )(���≡1)از معادله (7)
  • حلقه هر ⋯ محاسبه :   Loop each �=1,2,⋯,�+1, calculate:
  • حلقه هر ⋯ محاسبه :   Loop each �=1,2,⋯,�+1, calculate:
  • تنظیم بب0Set ���=0
  • حلقه هر ، ، ⋯ ، ، محاسبه :   Loop each �=1,2,⋯,�, calculate:
  • بب=ایکسمن یک×wzمن×ایکسمن ب���+=���×���×���
  • حلقه پایان
  • حلقه پایان
  • حلقه پایان
  • محاسبه ب1Calculate B−1
  • Set Sz=0,Y^z=0Set ��=0,�^�=0
  • Loop each a=1,2,,p+1, calculate:Loop each �=1,2,⋯,�+1, calculate:
  • Set temp_x_inv=0Set temp_x_inv=0
  • Loop each b=1,2,,p+1, calculate:Loop each �=1,2,⋯,�+1, calculate:
  • temp_x_inv+=xzb×B1batemp_x_inv+=���×B��−1
  • حلقه پایان
  • Sz+=temp_x_inv×xza×wzz��+=temp_x_inv×���×���
  • Set temp_x_w=0Set ����_�_�=0
  • Loop each i=1,2,,n, calculate:Loop each �=1,2,⋯,�, calculate:
  • temp_x_w+=xia×wzi����_�_�+=���×���
  • حلقه پایان
  • Y^z+=temp_x_inv×temp_x_w�^�+=temp_x_inv×����_�_�
  • حلقه پایان
  • Return Sz,Y^zReturn ��,�^�

2.2.1. ماتریس متوسط

به منظور معرفی حالت موازی به صورت قانونی، ما اتمیزه کردن GWR را برای تجزیه فرآیند محاسبه ماتریس طراحی می کنیم. عناصر ماتریسی مورد استفاده در نتیجه بر حسب تقاضا استخراج می شوند تا مقدار نتیجه از طریق محاسبات جبری ساده بدست آید. این باعث صرفه جویی در مصرف حافظه و منابع محاسباتی بزرگ در عملیات ماتریس بزرگ GWR می شود. ماتریس میانی یک هدف تحقیقاتی مهم اتمیزه کردن GWR است که در چندین مدل رایج وجود دارد.

OLR را می توان با فرم ماتریس زیر محاسبه کرد:

Y=Xβ+ε�=��+�

بر اساس OLS، ضریب رگرسیون β^�^برآورد می شود از

β^=(XTX)1XTY�^=(���)−1���

بعد، نتیجه رگرسیون Y^�^OLR را می توان به صورت زیر بیان کرد:

Y^=X(XTX)1XTY�^=�(���)−1���

با تجزیه و تحلیل جامع معادلات (8)، (9)، (17)، و (18)، می‌توان ماتریس میانی را پیدا کرد. Mکه در تمام مدل های رگرسیون تخمین بی طرفانه از طریق OLS وجود دارد. با موارد زیر قابل محاسبه است:

M=(XTWiX)1XTWi    or    M=(XTX)1XT�=(�����)−1����    ��    �=(���)−1��
در فرآیند رگرسیون نقطه به نقطه، ماتریس میانی Mاجتناب ناپذیر است

ماتریس XT��را می توان با تعریف کرد

XT=⎡⎣⎢⎢⎢⎢⎢1x11x1p1x21x2p1xn1xnp⎤⎦⎥⎥⎥⎥⎥. ��=[11⋯1�11�21⋯��1⋮⋮⋱⋮�1��2�⋯���]. 

که در آن p تعداد متغیرهای مستقل است. ضرب ماتریس XT��و ماتریس مربع مورب Wi��خاص است ماتریس حاصل Aرا می توان به صورت زیر بیان کرد:

A=XTWi=⎡⎣⎢⎢⎢⎢⎢1×wi1x11×wi1x1p×wi11×wi2x21×wi2x2p×wi21×winxn1×winxnp×win⎤⎦⎥⎥⎥⎥⎥�=����=[1×��11×��2⋯1×����11×��1�21×��2⋯��1×���⋮⋮⋱⋮�1�×��1�2�×��2⋯���×���]

به طور مشابه، ماتریس Bرا می توان به صورت نوشتاری

B=XTWiX=⎡⎣⎢a=1p+1⎛⎝⎜b=1p+1⎛⎝j=1n(xja×wzj×xjb)⎞⎠⎞⎠⎟⎤⎦⎥(p+1)×(p+1)�=�����=[∑�=1�+1(∑�=1�+1(∑�=1�(���×���×���)))](�+1)×(�+1)

جایی که ماتریس Bیک ماتریس مربع با p+1�+1ابعاد در کاربردهای عملی، p+1�+1معمولا کمتر از 10 است ، به این معنی که نادیده گرفتن زمان صرف شده توسط عملیات معکوس برای ماتریس قانونی است. B.

در مقایسه با تجزیه ماتریس، زیرفرایند رگرسیون GWR به ماتریس وزن متکی است. Wi��هنگام محاسبه ماتریس ها Aو B. تعیین طرح وزنی Wi��می توان به دست آورد: (الف) ماتریس مختصات را بدست آورید UV(n×2)��(�×2)از تمام نمونه ها، و سپس ماتریس را به ماتریس منتقل کنید UVT(2×n)��(2×�)�ب) ماتریس فاصله را حل کنید D(n×n)�(�×�)بین ماتریس مختصات UV(n×2)��(�×2)و ماتریس جابجا شده آن UVT(2×n)��(2×�)�ج) ماتریس وزن را محاسبه کنید W(n×n)�(�×�)از تمام نمونه ها مطابق با معادله (6) یا (7) و سپس Wi��ماتریس مورب است که توسط عناصر ردیف اول ماتریس وزن تشکیل شده استW. با این حال، این فرآیند به فضای بزرگ حافظه و زمان محاسباتی نیاز دارد که شامل حجم عظیم نمونه باشد. علاوه بر این، هر یک از فرآیندهای فرعی GWR تعیین خواهد شد Wi��یک بار، که باعث افزونگی زیاد حافظه و زمان اجرا می شود. اجرای رویکرد تجزیه ماتریس برای کاهش استفاده از حافظه و اشغال زمان اجرا با استفاده از معادلات (21) و (22) انجام شده است.

2.2.2. پیاده سازی الگوریتم اتمیزاسیون

برخلاف فرآیند بزرگ با ضرب ماتریس کامل، هر زیرفرآیند مستقل منطقی صرفاً یک بار بر اساس الگوریتم اتمی‌سازی در محاسبه رگرسیون شرکت می‌کند. این پیش نیاز موازی سازی است تا اطمینان حاصل شود که فرآیند فرعی قابل تکرار است. برای پرداختن به مشکلات ناشی از محاسبات اضافی، دو جنبه (حافظه و زمان) بهینه سازی در این مطالعه انجام شده است. را AICc����نمرات و تخمین Y^�^، تولید شده در طول فرآیند کالیبراسیون پهنای باند، در الگوی تک تن ذخیره می شوند. علاوه بر این، با استفاده از محاسبات بر اساس تقاضا، مضرات محاسبه با نرخ تکرار بالا در فرآیند بزرگ حذف می‌شود. با توجه به پهنای باند آزمایشی bw��، مراحل دقیق الگوریتم اتمیزه کردن را می توان به عنوان الگوریتم 1 پیاده سازی کرد.

3. CUDA Enabled FPGWR

FPGWR مبتنی بر CUDA توانایی پردازش داده‌های مکانی عظیم را دارد. این تکنیک به طور قابل ملاحظه ای برای افزایش سرعت محاسباتی GWR توسعه یافته است. با پشتیبانی از تعداد زیادی SP، دستگاه GPU می تواند محاسبات موازی را به عنوان یک حامل طبیعی HPC انجام دهد. سخت افزار از نظر زمان بندی چند رشته ای بهتر از نرم افزار عمل می کند. از این رو، این راه حل ترجیحی برای بهبود GWR بر اساس چارچوب CUDA است.

3.1. بهینه سازی عملکرد هسته CUDA

CUDA یک معماری محاسباتی موازی همه منظوره است که توسط NVIDIA Corporation معرفی شده است [ 32 ]. در چارچوب CUDA، وظایف موازی به عنوان رشته‌های مستقل قابل کنترل نمونه‌سازی می‌شوند. استقلال به این معنی است که هیچ سیگنال انحصاری متقابلی در بین همه رشته ها وجود ندارد. هر رشته می‌تواند به صورت همزمان اجرا شود بدون اینکه به رشته‌های خواهر و برادر خود وابسته باشد. کنترل پذیری به این معنی است که ویژگی نمونه های نخ را می توان با همان پارامترها کنترل کرد. مقادیر اولیه به گونه‌ای متفاوت تنظیم می‌شوند تا نمونه‌های تولید شده از یکدیگر متفاوت باشند. با توجه به فرآیندهای محاسباتی یکسان رشته‌ها، فقط یک زمان‌بندی رشته برای مدیریت همه رشته‌ها مورد نیاز است.
دو اصل برای طراحی تابع هسته CUDA برای به حداکثر رساندن استفاده از منبع زمانبندی GPU و چرخه محاسباتی وجود دارد. ما باید تا حد امکان وقوع WARP Branch را در عملکرد هسته به حداقل برسانیم. در عین حال توصیه می شود نوع حافظه CUDA را به صورت انعطاف پذیر انتخاب کنید. استراتژی بهینه سازی خاص در شکل 1 نشان داده شده است . با روش تجزیه ماتریس، تابع هسته اتمی با موفقیت از انشعاب فرآیند جلوگیری کرده است. بنابراین حجم کار محاسباتی را می توان در بین رشته ها یکسان کرد. به هر وظیفه اتمی به صورت پویا یک شاخص رشته منحصر به فرد اختصاص داده می شود ( z) که با بقیه فرق دارد. از آنجا که وظایف به صورت کاملا تصادفی اجرا می شوند، رابطه جفت بین رشته های اتمی و SP ها قطع می شود. برای غلبه بر گلوگاه عملکرد ناشی از دسترسی مکرر به حافظه جهانی، FPGWR از حافظه مشترک برای ذخیره این متغیرهای موقت استفاده می کند.

3.2. پیاده سازی FPGWR بر اساس CUDA

در این مطالعه، FPGWR را در چارچوب CUDA با استفاده از روش اتمی‌سازی پیاده‌سازی کرده‌ایم. FPGWR به طور قابل توجهی کل زمان رگرسیون GWR در مقیاس بزرگ را کوتاه می کند و فضای حافظه داده های ماتریس فضایی عظیم را آزاد می کند. پیاده سازی FPGWR شامل پنج مرحله است. مرحله 1، برنامه در دستگاه میزبان، دستگاه GPU را برای آماده شدن فراخوانی می کند و در همان زمان، یک سری پارامترهای اولیه در حافظه ثابت GPU تنظیم می شود. مرحله 2، داده های نمونه به حافظه جهانی GPU وارد می شود. حجم داده‌های جغرافیایی بسیار زیاد است که نمی‌توان آن را در حافظه مشترک یا حافظه محلی نمونه‌سازی کرد. هنگامی که حجم داده های نمونه خیلی زیاد باشد که در حافظه جهانی GPU قرار نگیرد، خطای «خارج از حافظه (OOM)» را ایجاد می کند. مرحله 3، CUDA دستورالعمل های کامپایل شده از کد تابع هسته اتمی را بارگذاری می کند و سپس، زمانبند رشته های مجزا را با همان تابع هسته تولید می کند. مرحله 4، تمام رشته ها به Streaming Multiprocessor (SM) در واحد WARP اختصاص داده می شوند. برای رسیدگی به تعداد بسیار زیاد رشته‌ها، GPU حالت زمان‌بندی flow-shop را فعال می‌کند. مرحله 5، CUDA نتایج رگرسیون را از پردازنده گرافیکی به میزبان بازخورد می دهد و منابع دستگاه GPU بلافاصله آزاد می شوند. گردش کار دقیق اجرای FPGWR در نشان داده شده استشکل 2 .
همانطور که در شکل 2 نشان داده شده استالف، الگوریتم FPGWR را می توان به چهار لایه تقسیم کرد: لایه داده، لایه ورودی، لایه کاری و لایه خروجی. لایه داده به ذخیره فایل های مشاهدات اصلی اختصاص داده شده است. لایه ورودی داده های مشاهدات فضایی را از هارد دیسک به حافظه میزبان می خواند. در عین حال، بخشی از برنامه نویسی CUDA در این لایه نمونه سازی می شود. پارامترهای اولیه و ماتریس‌های مشاهده با هم به تابع هسته اتمی معرفی می‌شوند و سپس تابع در یک برنامه اجرایی کامپایل می‌شود. لایه کاری روی پردازنده گرافیکی NVIDIA اجرا می شود. این کار رشته های وظایف عظیمی را شروع می کند که به طور یکنواخت توسط زمانبندی چند رشته ای GPU مدیریت می شوند. در سطح فیزیکی، WARP ها در یک صف از دسته ها قرار می گیرند، در حالی که WARP ها در همان دسته به طور همزمان اجرا می شوند. لایه خروجی برای جمع آوری نتایج رگرسیون طراحی شده است. بر اساس شاخص های پهنای باند، این نتایج در مجموعه های متعددی از ماتریس های رگرسیون سازماندهی می شوند. S، Y^�^، و β^�^). در نهایت، الگوریتم مجموعه نتایج بهینه را که مطابق با حداقل است، پیدا می کند AICc����نمره.
شکل 2 b,c نشان می دهد که چگونه بخش اصلی FPGWR در سطح خرد کار می کند. معانی خاص پارامترهای اولیه سازی ( n، pو bws���) و نمونه اولیه تابع FPGWR_KERNEL در شکل فرعی (b) توضیح داده شده است. فرآیند دقیق تابع FPGWR_KERNEL در شکل فرعی (c) ارائه شده است. مراحل فرآیند می تواند مطابق با مراحل الگوریتم 1 باشد. زمان بندی چند رشته ای به تنظیمات اولیه BLOCK و GRID تابع هسته در CUDA بستگی دارد. BLOCK به عنوان یک بردار یک بعدی با مقدار ثابت (64) تنظیم شده است، یعنی هر BLOCK شامل 64 رشته است. GRID به عنوان یک بردار دو بعدی تنظیم شده است که در آن تعداد بعد اول، حجم نمونه است. nnتقسیم بر 64 (تعداد بعد اول BLOCK) و بعد دوم اندازه آرایه پهنای باند است.
دوره-آموزش-حرفه-ای-gis

4. نتایج و بحث

4.1. منبع اطلاعات

برای بررسی عملکرد واقعی FPGWR، از سه منبع داده – مجموعه داده های شبیه سازی، مجموعه داده های تست Zillow [ 26 ] و مجموعه داده های «Georgia» [ 33 ]- برای آزمایش استفاده می شود. مجموعه داده شبیه سازی برای ارزیابی تأثیرات ناشی از حجم نمونه و اندازه متغیرهای مستقل طراحی شده است. مجموعه داده تست Zillow ( https://github.com/Ziqi-Li/FastGWR ) برای مقایسه عملکرد شتاب بسته های مختلف GWR اختصاص داده شده است. مجموعه داده “Georgia” برای تایید صحت نتیجه FPGWR در برابر سایر طرح ها استفاده می شود.

4.1.1. مجموعه داده های شبیه سازی

منطقه آزمایش به صورت یک مساحت مربع [ 34 ] با نمایش داده می شودlطول اضلاع، که در آن نقاط نمونه به طور مساوی توزیع می شوند. پس از تنظیم اندازه نمونه هر ردیف به c، تعداد کل نمونه ها را می توان به صورت بیان کرد n=c×c�=�×�. فاصله بین دو نمونه مجاور با محاسبه می شود Δl=l/(c1)Δ�=�/(�−1). گوشه پایین سمت چپ به عنوان مبدا سیستم مختصات تعریف می شود. بیان برای محاسبه موقعیت نمونه ها توسط

(ui,vi)=(Δl×mod(i1c),Δl×floor(i1c))(��,��)=(Δ�×���(�−1�),Δ�×�����(�−1�))

که در آن mod مخفف تابع باقی مانده است و کف نشان دهنده تابع گرد کردن است.

داده های نمونه توسط مدل GWR زیر تولید می شود. در رابطه (24) به صورت زیر از پیش تعریف شده است:

yi=β0(ui,vi)+β1(ui,vi)xi1+β2(ui,vi)xi2+β3(ui,vi)xi3+β4(ui,vi)xi4+εi��=�0(��,��)+�1(��,��)��1+�2(��,��)��2+�3(��,��)��3+�4(��,��)��4+��

برای یکسان سازی ابعاد ضرایب رگرسیون β، همه مقادیر به بازه محدود می شوند (0,βmax)(0,����)βmax����ثابت ثابت است). ضرایب β5 عملکرد را به شرح زیر دنبال کنید :

β0(ui,vi)=2βmaxl2(l22(lui)2(lvi)2)�0(��,��)=2�����2(�22−(�−��)2−(�−��)2)
β1(ui,vi)=βmax2((sinuiπl)2+(sinviπl)2)�1(��,��)=����2((sin����)2+(sin����)2)
β2(ui,vi)=βmax2(2((tan(uiπ2lπ4))2+(tan(viπ2lπ4))2))�2(��,��)=����2(2−((tan(���2�−�4))2+(tan(���2�−�4))2))
β3(ui,vi)=βmaxe12l((l2ui)2+(l2vi)2)�3(��,��)=�����−12�((�2−��)2+(�2−��)2)
β4(ui,vi)=16βmaxl4(l24(l2ui)2)(l24(l2vi)2)�4(��,��)=16�����4(�24−(�2−��)2)(�24−(�2−��)2)
توزیع فضایی ضرایب βدر شکل 3 نمایش داده شده است . پنج ضریب βانتخاب شده توسط مدل ارتباط نزدیکی با موقعیت نمونه دارد، که نشان دهنده عدم ایستایی فضایی مشاهدات است.
طبق فرمول (27)، هشت مجموعه از مجموعه داده های نمونه برای آزمایش تولید می شود. پارامترهای ساخت مجموعه داده ها و پیوند منبع در جدول 1 نشان داده شده است .

4.1.2. مجموعه داده تست Zillow

مجموعه داده تست Zillow [ 26 ] زیرمجموعه ای از مجموعه داده های دارایی Zillow است که از اطلاعات مسکن یک خانواده در منطقه شهری لس آنجلس تشکیل شده است. بیان ریاضی مجموعه داده به صورت معادله (30) بیان می شود. مجموعه داده به همراه الگوریتم FastGWR در GitHub منبع باز است ( https://github.com/Ziqi-Li/FastGWR ). این مقاله هشت مجموعه داده (1 k، 2 k، 5 k، 10 k، 15 k، 20 k، 50 k و 100 k) را برای آزمایش مقایسه ای از مخزن GitHub دانلود کرده است.

Valuei=βi0+βi1Areai+βi2Nbathsi+βi3Nbedsi+βi4Agei+εi������=��0+��1�����+��2����ℎ��+��3������+��4����+��

4.1.3. مجموعه داده گرجستان

مجموعه داده جورجیا [ 33 ] شامل زیرمجموعه ای (ویژگی های جمعیتی-اجتماعی) از سرشماری 1990 ایالات متحده در ایالت جورجیا است. مختصات نقاط داده در مرکز شهرستان ها تنظیم می شود، بنابراین 159 رکورد حاوی ویژگی های جمعیت شهرستان در مجموعه داده وجود دارد. مدل را می توان به صورت معادله (31) تعریف کرد:

PctBach=β0+β1Intercept+β2PctPov+β3PctRural+β4PctBlack+ε������ℎ=�0+�1���������+�2������+�3��������+�4��������+�

4.2. تست مشخصات و محیط

آزمایش FPGWR بر روی یک کامپیوتر رومیزی انجام می شود. پیکربندی این کامپیوتر یک سی پی یو 8 هسته ای Intel i7-9700K 3.60 گیگاهرتز (Intel Corporation, Santa Clara, CA, USA) و 16 گیگابایت حافظه دسترسی تصادفی (RAM) (Kingston Technology Corporation, Fountain Valley, CA, USA) و کارت گرافیک NVIDIA GeForce RTX 2080 Ti 11 گیگابایت (شرکت انویدیا، بزرگراه سن توماس سانتا کلارا، کالیفرنیا، ایالات متحده آمریکا). علاوه بر این، نسخه 10.2.95 کیت توسعه CUDA، نسخه 14.0.25431.01 به روز رسانی 3 Microsoft Visual Studio 2015 (IDE توسعه) و سیستم عامل Microsoft Windows 10.0.17134 Professional Edition (OS) را نصب کرده است. توجه داشته باشید که 4352 واحد هسته SP در دستگاه GPU قرار داده شده است. GPU با تکیه بر قابلیت زمان‌بندی کار با سرعت بسیار بالا، می‌تواند فشار وظایف محاسباتی چند رشته‌ای را به صورت موازی تحمل کند.

4.3. نتایج

4.3.1. عملکرد FPGWR
با توجه به تبدیل موازی سازی، بازده رگرسیون FPGWR به طور چشمگیری در برابر GWR افزایش می یابد. بهینه سازی پهنای باند به وضوح یک فرآیند تکراری است. برای مقایسه عملکرد شتاب، این مطالعه تنها زیرفرایند منفرد با پهنای باند ثابت را تحلیل می‌کند. زمان اجرا FPGWR با اندازه نمونه های مختلف در جدول 2 نشان داده شده است . با توجه به چهار متغیر مستقل، زمانی که اندازه نمونه کمتر از 40 کیلو باشد، زمان اجرا را می توان در عرض 2 ثانیه کنترل کرد. پس از افزایش حجم نمونه به 250 کیلو، زمان اجرا تقریبا 66.6 ثانیه می شود. با افزایش حجم نمونه به مقیاس میلیون‌ها، تنها حدود 1094.7 ثانیه صرف می‌شود. نتیجه نشان می دهد که زمان اجرا با تغییر اندازه نمونه از یک قانون تغییرات لگاریتمی تبعیت می کند.
زمان اجرا با اندازه های مختلف نمونه بسیار متفاوت است. برای فعال کردن نمایش همه نتایج با هم، محور y مقیاس لگاریتمی در شکل 4 ترسیم شده است . تحلیل جامع جدول 2 و شکل 4نشان می دهد که هم حجم نمونه و هم تعداد متغیرهای مستقل می توانند بر تغییرات زمان اجرا تأثیر بگذارند. زمان رگرسیون با تعداد متغیرهای مستقل ارتباط مثبت دارد. هنگامی که اندازه نمونه متفاوت است، تغییر در زمان اجرا با تعداد متفاوتی از متغیرهای مستقل مشابه است. با توجه به حجم نمونه یکسان، نتایج مربوط به زمان یک رابطه چندگانه ساده را بین تعداد مختلف متغیرهای مستقل نشان می‌دهد. به طور خلاصه، حجم نمونه تاثیر بارزتری نسبت به تعداد متغیرهای مستقل بر زمان رگرسیون دارد.
سرعت و کارایی معیارهای مهمی برای بررسی عملکرد الگوریتم‌های موازی هستند [ 35 ]. سرعت بالا به نسبت زمان اجرا تک پردازنده به زمان اجرا چند پردازنده اشاره دارد و کارایی نشان دهنده میانگین افزایش سرعت در چند پردازنده است [ 36 ]. افزایش سرعت FPGWR به عملکرد GPU متکی است که شامل عدد SP، فرکانس ساعت پایه و پهنای باند حافظه است. جدول 3پیکربندی عملکرد انواع مختلف GPU را مقایسه می کند. بر اساس 250000 نمونه شبیه سازی، این مطالعه مدل ارائه شده در رابطه (24) را با افزایش تعداد هسته های GPU رگرسیون می کند. زمان اجرا GTX1050 به عنوان مقدار معیار برای محاسبه ضریب افزایش سرعت پردازنده‌های گرافیکی با اعداد SP مختلف تنظیم شده است. رشد افزایش سرعت ثابت می کند که FPGWR مقیاس پذیری موازی برجسته ای دارد. شکل 5 نشان می دهد که با افزایش تعداد هسته های GPU، زمان محاسبات به طور تقریبی خطی کاهش می یابد. این یک رابطه خطی مثبت آشکار بین کارایی و هسته‌های GPU نشان می‌دهد.
نتیجه تجربی توانایی برجسته FPGWR را برای تسریع GWR نشان می‌دهد، اگرچه عملکرد آن در بین مرتبه‌های مختلف بزرگی مشاهدات کمی متفاوت است. با تنظیم اندازه های نمونه مناسب و اعداد متغیر مستقل، می توان به پتانسیل کامل FPGWR در زمینه های مختلف دست یافت.
4.3.2. مقایسه FPGWR و سایر GWR
با بهره مندی از توسعه سخت افزار کامپیوتر، محققان می توانند به سرعت و به راحتی محیط GPU را برای مطالعه فضایی در مقیاس بزرگ بسازند. برای تأیید قابلیت شتاب، چهار GWR دیگر – یعنی FastGWR (پایتون)، MGWR (پایتون)، GWmodel (R) و spgwr (R) – برای مقایسه با FPGWR انتخاب می‌شوند. داده‌های آزمایشی استفاده‌شده توسط آزمایش «مجموعه داده‌های آزمایشی Zillow» است. GWmodel از تکنیک وزن دهی پنجره متحرک برای کاهش محاسبات استفاده می کند. FastGWR موازی سازی توزیع شده در محیط HPC را برای بهبود کارایی عملیاتی پیاده سازی می کند. FastGWR از نظر بازده محاسبه کلی نسبت به MGWR، GWmodel و spgwr برتری دارد. به عنوان یک نکته جانبی، اگرچه محیط بهینه برای FastGWR یک خوشه HPC است، انجام آزمایش ها بر اساس یک محیط دسکتاپ منفرد بی طرفانه تر است.
زمان اجرا پنج بسته با اندازه های نمونه متفاوت در جدول 4 نمایش داده شده است . زمان اجرا صرفاً شامل زمان رگرسیون منفرد با پهنای باند مشخص است (مانند بخش 4.3.1). با توجه به 1000 مشاهده، FPGWR 5 برابر سریعتر از FastGWR، 32 برابر سریعتر از MGWR، 88 برابر سریعتر از GWmodel و 865 برابر سریعتر از spgwr است. با افزایش حجم نمونه به 10000، FPGWR تقریباً 14 برابر سریعتر از FastGWR، تقریباً 157 برابر سریعتر از MGWR، تقریباً 2185 برابر سریعتر از GWmodel و تقریباً 45،811 برابر سریعتر از spgwr است. هنگامی که حجم نمونه از 20000 فراتر رفت، spgwr ابتدا وظیفه رگرسیون و به دنبال آن GWmodel و MGWR را تکمیل نخواهد کرد. علت این است که این سه طرح از ذخیره ماتریس وزن با ابعاد بالا و سایر ماتریس های میانی خودداری می کنند.
زمان اجرا پنج بسته در شکل 6 نشان داده شده است . محور y در مقیاس لگاریتمی مشخص شده است تا همه نتایج را با هم نشان دهد. مشاهده هر بسته به طور جداگانه نشان می دهد که زمان اجرا پنج طرح همگی یک روند افزایشی لگاریتمی را نشان می دهند. مطابق شکل 6 ، عملکرد پنج بسته نسل به نسل افزایش می یابد. FPGWR ایده آل ترین پیاده سازی در بین این طرح ها است.
به طور کلی، FPGWR یک شتاب دهنده GWR عملی با هزینه توسعه کم و فرآیند تولید ساده است. در مقایسه با بسته‌های دیگر، FPGWR می‌تواند یک کار پیچیده را از طریق تجزیه رگرسیون کامل نمونه اضافی، بسیار ساده کند.
4.3.3. اعتبارسنجی دقت نتیجه
برای تأیید صحت FPGWR در برابر سایر بسته‌های GWR، نتایج ( β^�^، Adj.R2���.�2و AICc����امتیازات) از پنج بسته بر اساس مجموعه داده معروف “گرجستان” مقایسه می شوند. متغیر وابسته PctBach و متغیرهای مستقل Intercept ، PctPov ، PctRural و PctBlack برای کالیبره کردن همان مدل GWR مطابق با معادله (31) انتخاب شده‌اند. بر اساس تابع هسته Bi-square تطبیقی، 93 نزدیکترین همسایه برای پهنای باند بهینه انتخاب می شوند. همانطور که در جدول 5 نشان داده شده است ، میانگین و انحراف استاندارد ضرایب برآورد شده است β^�^در بخش میانی نمایش داده می شوند و Adj.R2���.�2و AICc����نمرات در بخش پایین نشان داده شده است. نتیجه FPGWR به وضوح با نتایج چهار بسته دیگر سازگار است.
توزیع فضایی ضرایب برآورد شده β^�^در منطقه مورد مطالعه در شکل 7 نشان داده شده است . برای شبیه‌سازی بهتر تغییرات فضایی، هر دو سطح به عنوان یک سطح پیوسته با استفاده از روش داده‌های شبکه درون‌یابی می‌شوند.

4.4. بحث

حلقه های متعدد در مدل GWR ضروری است تا زمانی که FPGWR فرآیند بزرگ را اتمیزه کند. افزونگی محاسباتی بسیار ناگزیر در اجرای الگوریتم GWR پدیدار خواهد شد. ساختار الگوریتم با حلقه‌های چند سطحی تودرتو است، جایی که حلقه بالایی به حلقه پایینی بستگی دارد و دنباله داخلی هر حلقه ثابت است. برهم زدن توالی تکراری اصلی فرآیندهای فرعی نامشروع است. در غیر این صورت، صحت نتایج رگرسیون مورد تردید جدی قرار خواهد گرفت. FPGWR یک حالت ترکیبی (موازی-سریال) را معرفی می کند که می تواند دستگاه GPU را قادر سازد نه تنها وظایف موازی هر دسته را تحمل کند، بلکه همه وظایف را به طور موثر انجام دهد. فرآیندهای فرعی می توانند به صورت تصادفی و بدون خطا اجرا شوند و صحت نتایج برای تشخیص مدل تضمین شده است.

4.4.1. حافظه

همانطور که در شکل 8 نشان داده شده است، استراتژی ذخیره سازی ماتریسی GWR با FPGWR متفاوت است . FPGWR حالت ذخیره سازی را در استفاده از طرح ها، ذخیره سازی بر اساس تقاضا و بردارسازی ماتریس بهینه می کند. ماتریس وزن Wi��به عنوان ذخیره می شود n×n�×�ماتریس مورب در مدل GWR. اگرچه فقط عناصر مورب باید حل شوند، فضای ذخیره سازی با اندازه n2�2مطالبه می شود. پیچیدگی حافظه را می توان به صورت بیان کرد O(n2)�(�2). در مراحل بعدی، محاسبات ماتریس ها B، B1�−1و Aهمه پیچیدگی حافظه را به ارث می برند. در مقایسه، روش FPGWR فقط داده ها را در صورت نیاز ذخیره می کند. پیچیدگی حافظه آن را می توان به کاهش داد O((p+1)n)�((�+1)�)p+110�+1≤10مشترک).
جدول 6 مقایسه میزان استفاده از حافظه بین FPGWR و GWR را نشان می دهد. وقتی حجم نمونه کمتر از 100000 باشد، حافظه دستگاه GPU همچنان برای استفاده در دسترس است. هنگامی که اندازه به 10000000 افزایش یافت، GWR تقریباً به 364 ترابایت RAM نیاز دارد. هیچ دستگاه واحد گرافیکی موجود نمی تواند فضای ذخیره سازی زیادی را اختصاص دهد. در مقابل، FPGWR تنها 380 مگابایت رم مصرف می کند. به طور خلاصه، FPGWR یک مزیت فوق العاده نسبت به GWR نشان می دهد.
.

4.4.2. زمان

برای فرآیند محاسبه ماتریس کلاه ضروری است Sدر GWR ماتریس وزن Wi��یک ماتریس مورب ویژه است که پیچیدگی زمان اجرا را در طول ضرب ماتریس افزایش نمی دهد. پیچیدگی زمان اجرا ماتریس ها Aاست O(1)�(1)و پیچیدگی زمان اجرا Bاست O((p+1)2n)�((�+1)2�). زیرا p+1�+1بسیار کمتر از n، زمان محاسبه ماتریس Bرا می توان نادیده گرفت. با توجه به پهنای باند وزن ثابت، پیچیدگی زمان اجرا ماتریس کلاه Si��را می توان به صورت بیان کرد O((p+1)2n)�((�+1)2�). بعد از nعملیات بر روی Si��، پیچیدگی زمان اجرا ماتریس Sتعریف شده است O((p+1)2n2)�((�+1)2�2). طرح‌های مختلف GWR از روش‌های متنوعی برای انتخاب پهنای باند بهینه استفاده می‌کنند، و در نتیجه، مطالعه بحث در مورد پیچیدگی زمان اجرا کل فرآیند را حذف می‌کند. زیرفرایند رگرسیون تک نمونه برای تحلیل زمان اجرا در این بخش مناسب است. به جای محاسبه تکراری، FPGWR فرآیند رگرسیون هر نقطه را به عنوان یک رشته مستقل اتمیزه می کند. این استراتژی پیچیدگی زمان اجرا ماتریس را کاهش داده است Sبه طور قابل ملاحظه ای در همان زمان، پیچیدگی زمان اجرا ماتریس از Aتبدیل می شود O((p+1)n)�((�+1)�)و پیچیدگی زمان اجرا ماتریس از Bتبدیل می شود O((p+1)2n)�((�+1)2�). با ترکیب ماتریس ها Aو Bدر قالب جمع موازی، ماتریس کلاه Si��پیچیدگی زمان اجرا را به دست می آورد O((p+1)(p+2)n)�((�+1)(�+2)�). پیچیدگی زمان اجرا FPGWR از نظر تئوری کمتر از GWR است، اما بازده عملیات دستورالعمل دستگاه میزبان به طور قابل توجهی با دستگاه GPU متفاوت است و روش‌هایی که توسط کتابخانه‌های مختلف برای بهینه‌سازی عملیات ماتریس استفاده می‌شوند، متناقض هستند. بنابراین، نتایج مقایسه واقعی باید به نتایج تجربی (در بخش 4.3.2 ) مراجعه کنند.
دستیابی به ضرایب رگرسیون GWR مستلزم صرف زمان زیادی برای تکرار مکرر هنگام مدیریت داده های جغرافیایی بزرگ است. به عنوان مثال، وقتی حجم نمونه 1000000 است، رگرسیون تک نقطه ای GWR باید 1000000 بار با زمان اشغال و مصرف حافظه زیاد تکرار شود. بنابراین، این مشکل را می توان با استراتژی موازی سازی حل کرد. الگوریتم اتمیزه کردن ماتریس وزن و سایر ماتریس های موقت را در طول هر تکرار رگرسیون نقطه ای ذخیره نمی کند، بلکه فقط عناصر ماتریس را بر حسب تقاضا می خواند و محاسبه می کند. FPGWR از طریق موازی کردن این واحدهای اتمی در CUDA، زمان محاسبات را کوتاه می کند در حالی که از فضای حافظه بسیار کمتری استفاده می کند.

5. نتیجه گیری ها

GWR یک تکنیک مدل سازی محلی است که به طور گسترده در رشته های مختلف مورد استفاده قرار گرفته است. با این حال، GWR دارای افزونگی محاسباتی قابل توجهی است و می تواند تقریباً 15000 مشاهدات جغرافیایی را انجام دهد. برای اعمال تکنیک هموارسازی محلی بر روی یک مجموعه داده فضایی در مقیاس بزرگ، یک الگوریتم بهبود یافته FPGWR برای حل این مشکلات پیشنهاد کردیم. FPGWR حالت ذخیره سازی ماتریسی را بهینه می کند تا بر محدودیت فضای حافظه غلبه کند و در نتیجه پیچیدگی حافظه GWR را به میزان قابل توجهی کاهش دهد. علاوه بر این، یک حالت محاسباتی موازی را معرفی می‌کند، که چرخه بزرگ نمونه کامل را به یک فرآیند اتمی‌سازی تجزیه می‌کند تا پیچیدگی زمان اجرا را به طور قابل‌توجهی کاهش دهد.
برای نشان دادن عملی بودن FPGWR، از شبیه سازی و مجموعه داده های Zillow برای انجام آزمایش استفاده می شود. نتایج نشان می دهد که زمان اجرای رگرسیون به طور نمایی با تعداد مشاهدات مرتبط است و بنابراین، GWR قادر به پردازش وظیفه رگرسیون با حجم زیادی از داده های جغرافیایی نیست. در مقایسه، زمان صرف شده توسط FPGWR یک رابطه لگاریتمی با تعداد مشاهدات نشان می دهد. از این رو، FPGWR نشان دهنده پیشرفت قابل توجهی در رسیدگی به وظیفه استخراج داده های جغرافیایی عظیم است.
به طور خلاصه، معضلی که GWR را در مقیاس داده محدود می کند، می تواند به طور قابل توجهی توسط FPGWR کاهش یابد، و بنابراین، حوزه های کاربردی GWR به طور بالقوه تا حد زیادی گسترش می یابد. تحت این شرایط، مجموعه داده‌های بزرگ به طور فزاینده‌ای از حوزه‌های جغرافیایی یا غیرجغرافیایی می‌توانند به ارائه‌دهندگان خدمات تحلیل جغرافیایی در مقیاس بزرگ تبدیل شوند. در آینده، یک مسئله کلیدی را بررسی خواهیم کرد: نحوه تطبیق FPGWR با معماری های غیر CUDA، حتی سایر دستگاه های HPC غیر GPU، برای افزایش تطبیق پذیری الگوریتم توسعه یافته.

منابع

  1. توچ، ای. لرنر، بی. بن زیون، ای. بن گال، I. تجزیه و تحلیل داده های تحرک انسان در مقیاس بزرگ: بررسی روش ها و کاربردهای یادگیری ماشین. بدانید. Inf. سیستم 2019 ، 58 ، 501-523. [ Google Scholar ] [ CrossRef ]
  2. وکستروم، سی. کوجالا، آر. ملادنوویچ، MN; ساراماکی، جی. ارزیابی انتقال در مقیاس بزرگ در شبکه های حمل و نقل عمومی با استفاده از داده های جدول زمانی باز: مورد گسترش مترو هلسینکی. J. Transp. Geogr. 2019 ، 79 ، 102470. [ Google Scholar ] [ CrossRef ]
  3. هیکس، جی ال. آلتوف، تی. سوسیچ، ر. کوهار، پ. بوستیانچیچ، بی. کینگ، AC; Leskovec، J. Delp، SL بهترین روش‌ها برای تجزیه و تحلیل داده‌های بهداشتی در مقیاس بزرگ از ابزارهای پوشیدنی و برنامه‌های گوشی‌های هوشمند. رقم NPJ. پزشکی 2019 ، 2 ، 1-12. [ Google Scholar ] [ CrossRef ]
  4. تاسار، اُ. تارابالکا، ی. Alliez, P. یادگیری افزایشی برای تقسیم معنایی داده های سنجش از دور در مقیاس بزرگ. IEEE J. Sel. بالا. Appl. زمین Obs. Remote Sens. 2019 , 12 , 3524–3537. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  5. لی، ز. هوانگ، Q. جیانگ، ی. Hu, F. SOVAS: یک سیستم تحلیلی بصری آنلاین مقیاس پذیر برای تجزیه و تحلیل داده های آب و هوایی بزرگ. بین المللی جی. جئوگر. Inf. علمی 2020 ، 34 ، 1188-1209. [ Google Scholar ] [ CrossRef ]
  6. میلر، اچ جی; Goodchild، جغرافیای داده محور MF. GeoJournal 2015 ، 80 ، 449-461. [ Google Scholar ] [ CrossRef ]
  7. شیا، جی. هوانگ، اس. ژانگ، اس. لی، ایکس. لیو، جی. شیو، دبلیو. Tu, W. DAPR-tree: یک طرح نمایه سازی داده های مکانی توزیع شده با الگوهای دسترسی به داده ها برای حمایت از طرح های Digital Earth. بین المللی جی دیجیت. زمین 2020 ، 1-16. [ Google Scholar ] [ CrossRef ]
  8. آجی، ع. وانگ، اف. وو، اچ. لی، آر. لیو، کیو. ژانگ، ایکس. Saltz, J. Hadoop-GIS: یک سیستم ذخیره سازی داده های مکانی با کارایی بالا بر روی MapReduce. در مجموعه مقالات کنفرانس بین المللی VLDB Endowment در مورد پایگاه های داده بسیار بزرگ، ترنتو، ایتالیا، 26 تا 30 اوت 2013. جلد 6. [ Google Scholar ]
  9. وو، QY; سو، KY؛ Zou، ZJ یک روش مبتنی بر کاهش نقشه برای محاسبه موازی مبدا و مقصد مسافران اتوبوس از داده‌های حمل و نقل عظیم. J. Geo Inf. علمی 2018 ، 20 ، 647-655. [ Google Scholar ]
  10. ویلکینسون، بی. Allen, M. برنامه نویسی موازی ; Prentice Hall: Upper Saddle River، نیوجرسی، ایالات متحده آمریکا، 1999. [ Google Scholar ]
  11. گونگ، ز. تانگ، دبلیو. بنت، دی. Thill، J.-CF شبیه‌سازی مبتنی بر عامل موازی از تعاملات فضایی در سطح فردی در یک محیط محاسباتی چند هسته‌ای. بین المللی جی. جئوگر. Inf. علمی 2013 ، 27 ، 1152-1170. [ Google Scholar ] [ CrossRef ]
  12. تانگ، دبلیو. فنگ، دبلیو. جیا، ام. تجزیه و تحلیل الگوی نقطه فضایی بسیار موازی: تابع K ریپلی با استفاده از واحدهای پردازش گرافیکی شتاب گرفت. بین المللی جی. جئوگر. Inf. علمی 2015 ، 29 ، 412-439. [ Google Scholar ] [ CrossRef ]
  13. ژانگ، جی. زو، تبر; Huang، Q. یک رویکرد برآورد چگالی هسته تطبیقی ​​با شتاب GPU برای تجزیه و تحلیل الگوی نقطه ای کارآمد در داده های بزرگ فضایی. بین المللی جی. جئوگر. Inf. علمی 2017 ، 31 ، 2068–2097. [ Google Scholar ] [ CrossRef ]
  14. ساندریک، آی. ایونیتا، سی. چیتو، ز. داردالا، م. ایریمیا، ر. Furtuna، FT استفاده از CUDA برای تسریع مدل‌سازی انتشار عدم قطعیت برای ارزیابی حساسیت زمین لغزش. محیط زیست مدل. نرم افزار 2019 ، 115 ، 176-186. [ Google Scholar ] [ CrossRef ]
  15. استویانوویچ، ن. Stojanovic، D. موازی سازی الگوریتم انباشت جریان چندگانه با استفاده از cuda و openacc. ISPRS Int. J. Geo Inf. 2019 ، 8 ، 386. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  16. پی، تی. آهنگ، سی. گوا، اس. شو، اچ. لیو، ی. دو، ی. ما، تی. ژو، سی. استخراج داده های جغرافیایی بزرگ: هدف، مفاهیم و مسائل تحقیقاتی. جی. جئوگر. علمی 2020 ، 30 ، 251-266. [ Google Scholar ] [ CrossRef ]
  17. براندون، سی. Fotheringham، AS; چارلتون، ME رگرسیون وزن‌دار جغرافیایی: روشی برای کاوش غیرایستایی فضایی. Geogr. مقعدی 1996 ، 28 ، 281-298. [ Google Scholar ] [ CrossRef ]
  18. ژانگ، پی. یانگ، دی. ژانگ، ی. لی، ی. لیو، ی. سن، ی. ژانگ، دبلیو. گنگ، دبلیو. رانگ، تی. لیو، ی. و همکاران بررسی مجدد نیروهای محرک آلودگی فاضلاب صنعتی چین بر اساس مدل GWR در سطح استان. جی. پاک. تولید 2020 , 262 , 121309. [ Google Scholar ] [ CrossRef ]
  19. وو، دی. روابط متفاوت مکانی و زمانی بین ردپای اکولوژیکی و عوامل مؤثر در استان‌های چین با استفاده از رگرسیون وزن‌دار جغرافیایی (GWR). جی. پاک. تولید 2020 ، 261 ، 121089. [ Google Scholar ] [ CrossRef ]
  20. یوان، ی. غار، م. خو، اچ. ژانگ، سی. کاوش روابط فضایی متغیر بین سرب و آل در خاک های شهری لندن در مقیاس منطقه ای با استفاده از رگرسیون وزنی جغرافیایی (GWR). جی. هازارد. ماتر 2020 , 393 , 122377. [ Google Scholar ] [ CrossRef ]
  21. هونگ، آی. Yoo, C. تجزیه و تحلیل واریانس فضایی عوامل تعیین کننده قیمت Airbnb با استفاده از رویکرد چند مقیاسی GWR. Sustainability 2020 , 12 , 4710. [ Google Scholar ] [ CrossRef ]
  22. وو، اس. وانگ، ز. دو، ز. هوانگ، بی. ژانگ، اف. لیو، آر. رگرسیون وزنی شبکه عصبی از نظر جغرافیایی و زمانی برای مدل‌سازی روابط غیر ثابت فضایی و زمانی. بین المللی جی. جئوگر. Inf. علمی 2020 ، 1–27. [ Google Scholar ] [ CrossRef ]
  23. بیوند، ر. یو، دی. ناکایا، تی. گارسیا لوپز، MA Package SPGWR ; بسته نرم افزاری R; بنیاد R برای محاسبات آماری: وین، استرالیا، 2020. [ Google Scholar ]
  24. گولینی، آی. لو، بی. چارلتون، M. GWmodel: یک بسته R برای کاوش ناهمگونی فضایی با استفاده از مدل‌های وزن‌دار جغرافیایی. J. Stat. نرم افزار 2015 ، 63 ، 1-50. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  25. اوشان، TM; لی، ز. کانگ، دبلیو. ولف، ال جی. Fotheringham، AS mgwr: پیاده‌سازی پایتون از رگرسیون وزن‌دار جغرافیایی چند مقیاسی برای بررسی ناهمگونی و مقیاس فضایی فرآیند. ISPRS Int. J. Geo Inf. 2019 ، 8 ، 269. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  26. لی، ز. Fotheringham، AS; لی، دبلیو. Oshan, T. Fast Geographically Weighted Regression (FastGWR): یک الگوریتم مقیاس پذیر برای بررسی ناهمگونی فرآیند فضایی در میلیون ها مشاهده. بین المللی جی. جئوگر. Inf. علمی 2019 ، 33 ، 155-175. [ Google Scholar ] [ CrossRef ]
  27. Tran، HT; نگوین، اچ تی. Tran، VT رگرسیون وزن‌دار جغرافیایی در مقیاس بزرگ در Spark. در مجموعه مقالات هشتمین کنفرانس بین المللی دانش و مهندسی سیستم ها (KSE) 2016، هانوی، ویتنام، 6 تا 8 اکتبر 2016؛ صص 127-132. [ Google Scholar ]
  28. فاستر، SA; Gorr، WL یک فیلتر تطبیقی ​​برای تخمین پارامترهای متغیر مکانی: کاربرد برای مدل‌سازی ساعات پلیس صرف شده در پاسخ به تماس‌های خدمات. مدیریت علمی 1986 ، 32 ، 878-889. [ Google Scholar ]
  29. Akaike, H. نگاهی جدید به شناسایی مدل آماری. IEEE Trans. خودکار کنترل 1974 ، 19 ، 716-723. [ Google Scholar ]
  30. براندون، سی. Fotheringham، AS; چارلتون، ام. آمار خلاصه وزنی جغرافیایی – چارچوبی برای تجزیه و تحلیل داده های اکتشافی محلی. محاسبه کنید. محیط زیست سیستم شهری 2002 ، 26 ، 501-524. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  31. هریس، آر. سینگلتون، ا. گروس، دی. براندسون، سی. Longley، P. رگرسیون وزنی جغرافیایی توانمند گرید: مطالعه موردی مشارکت در آموزش عالی در انگلستان. ترانس. GIS 2010 ، 14 ، 43-61. [ Google Scholar ]
  32. شرکت انویدیا محاسبه معماری دستگاه یکپارچه (CUDA). در دسترس آنلاین: https://developer.nvidia.com/cuda-toolkit (در 6 اکتبر 2020 قابل دسترسی است).
  33. Fotheringham، AS; براندون، سی. چارلتون، ام. رگرسیون وزن‌دار جغرافیایی: تحلیل روابط متغیر فضایی . جان وایلی و پسران: هوبوکن، نیوجرسی، ایالات متحده آمریکا، 2002. [ Google Scholar ]
  34. ژانگ، اچ. Mei, C. برآورد حداقل انحراف مطلق محلی مدل‌های ضریب متغیر مکانی: رویکردهای رگرسیون وزن‌دار جغرافیایی قوی. بین المللی جی. جئوگر. Inf. علمی 2011 ، 25 ، 1467-1489. [ Google Scholar ]
  35. مشتاق، DL; زهورجان، ج. Lazowska، ED Speedup در مقابل بهره وری در سیستم های موازی. IEEE Trans. محاسبه کنید. 1989 ، 38 ، 408-423. [ Google Scholar ]
  36. یانگ، ال. سان، ایکس. Li, Z. چارچوبی کارآمد برای پردازش موازی سنجش از دور: ادغام الگوریتم کلونی زنبورهای مصنوعی و فناوری چند عاملی. Remote Sens. 2019 , 11 , 152. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
شکل 1. بهینه سازی عملکرد هسته معماری واحد محاسبه شده (CUDA).
شکل 2. نمودار جریان FPGWR در CUDA ( a – c ).
شکل 3. ضریب ( Unknown node type: fontUnknown node type: fontUnknown node type: fontUnknown node type: font، Unknown node type: fontUnknown node type: fontUnknown node type: fontUnknown node type: font، Unknown node type: fontUnknown node type: fontUnknown node type: fontUnknown node type: font، Unknown node type: fontUnknown node type: fontUnknown node type: fontUnknown node type: fontو Unknown node type: fontUnknown node type: fontUnknown node type: fontUnknown node type: font) سطح.
شکل 4. مقایسه زمان اجرا (نوار) ​​برای اعداد مختلف ضرایب با استفاده از تعداد نقاط مختلف داده.
شکل 5. مقایسه عملکرد FPGWR برای تعداد فزاینده ای از هسته های GPU.
شکل 6. مقایسه زمان اجرا (نوار) ​​برای بسته های مختلف با استفاده از تعداد مختلف نقاط داده.
شکل 7. سطوح برآورد ضریب.
شکل 8. حالت های ذخیره سازی مختلف ماتریس وزن بین GWR کلاسیک و FPGWR.

بدون دیدگاه

دیدگاهتان را بنویسید