1. مقدمه
ماندلبروت نوشت: “ابرها کره نیستند، کوه ها مخروط نیستند، خطوط ساحلی دایره نیستند، و پوست درخت صاف نیست، و رعد و برق در یک خط مستقیم حرکت نمی کند” [ 1 ] (ص 1-2). از این رو، چنین پدیده های طبیعی را نمی توان به طور دقیق با هندسه اقلیدسی ساده شده نشان داد، اما می توان آن را با هندسه فراکتال توصیف کرد. معنای لغوی “فرکتال” “شکسته” یا “نامنظم” است. از زمانی که هندسه فراکتال کشف شد، مشخص شد که الگوی فراکتال الگوهای «شباهت خود» را نشان میدهد که به عنوان اولین تعریف فراکتال شناخته میشود، به این معنی که هر یک از زیربخشها شبیه به کل هستند [ 2 ، 3 ].]. نمونه ای از یک شباهت کاملاً تعریف شده، فرش سیرپینسکی است که قطعات کوچک آن کپی دقیقی از قطعات بزرگ است. سپس، با افزودن مقداری تصادفی هنگام کپی کردن اشکال بزرگ، تعریف دوم فراکتال برای توصیف اشیاء واقعی گسترش یافته است [ 1 ]. هر دو تعریف به معنای آماری هستند و یک رابطه قدرت-قانون بین تعداد نسخه ها و مقیاس های متناظر آنها را نشان می دهند، که در آن نما تابع قانون قدرت برابر با بعد فراکتال است. با این حال، رابطه قدرت-قانون در بیشتر پدیده های طبیعی به سختی مشاهده می شود. از این رو سومین تعریف آرامتر ارائه شده است، ht-index [ 4]. هدف این بود که دامنه تعاریف فراکتال را با بررسی الگوهایی که در آن ویژگیهای کوچک بسیار بیشتری نسبت به نمونههای بزرگ وجود دارد، گسترش دهیم و ببینیم که چگونه آن توزیعهای الگو شبیه روابط قدرت-قانون هستند. بنابراین، مفهوم تعریف سوم بسیار گسترده تر و عاری از اشکال یا اشکال فضایی است [ 5 ، 6 ]، در عوض بر تغییر تدریجی مقیاس تأکید می کند.
شهرها معمولاً الگوهای فراکتال را نشان می دهند. سپس «شهرهای فراکتال» [ 7 ] نامیده شد. فراکتالها در اشکال مختلف شهری از جمله سیستمهای خیابانی، کاربریهای زمین، پراکندگی شهری و ردپای ساختمان مشاهده شدهاند [ 8 ، 9 ، 10 ]]. به ویژه، اندازه گیری پیچیدگی مورفولوژی شهری عمدتاً با ردپای ساختمان آشکار و مشخص می شود. با این حال، شاخص های فراکتال بر اساس سه تعریف قبلی برای توصیف ویژگی های فراکتال ها کافی نیست. از یک طرف، هر سه تعریف به جای اشکال هندسی، با توصیفات آماری ارائه می شوند. بنابراین ویژگی خود شباهت آماری است تا هندسی. به بیان ساده، یک الگوی فراکتالی مشابه از نظر آماری می تواند اشکال فضایی زیادی داشته باشد. این به این دلیل است که سه تعریف مبتنی بر آمار، به جای تعاریف چند بعدی یا چند متغیره، یک متغیر تک متغیره را هدف قرار می دهند. همانطور که در Rootzén، Segers و Wadsworth پیشنهاد شده است [ 11]، یک مدل ریاضی عمومی برای برازش توزیع های ناهمگن با متغیرهای چند متغیره دشوار است. چنین توزیع های ناهمگنی فراکتال ها را از نظر آماری مشخص می کند و همچنین ابعاد متغیرها را محدود می کند. دو تعریف اول فراکتال، که رابطه قدرت-قانون بین مقیاس و تعداد کپیهای مقیاسشده را بررسی میکنند، و سومی که توزیع نامتعادل را توصیف میکند، همگی بر اساس یک متغیر تک متغیره ساخته شدهاند. با این حال، بیشتر اهداف فضایی، مانند ردپای ساختمان معمولاً دارای ویژگیهای متعددی هستند، از جمله فواصل فضایی بین همسایگان و ویژگیهای فردی (مانند اندازهها، جهتگیریها و شکلها) که هنوز با هیچ یک از تعاریف فراکتالی بهخوبی نمیتوان ثبت کرد. بنابراین، یک شکاف روش شناختی در مورد نحوه ترکیب هر دو شکل و غیره وجود دارد. و ویژگی های آماری فراکتال ها، به طوری که می توان شاخص های توصیفی بهتری را از آن معیارها استنباط کرد. علاوه بر این، با توجه به این شکاف، کمبود نمونه های کاربردی نیز وجود دارد.
در همین حال، برای بسیاری از کاربردها، مدلهای مبتنی بر نمودار در زمینه یادگیری عمیق در مجموعه دادههای غیراقلیدسی قدرت نشان دادهاند [ 12 ]]. این پیشرفت ها فرصت جدیدی را برای مطالعه پیچیدگی ردپای ساختمان فراهم می کند. اول، نحوه توزیع ساختمان ها در فضا را می توان به طور موثر توسط نمودارها نشان داد. توزیع فضایی ساختمان ها اغلب نامنظم است، به این معنی که تعداد همسایگان برای هر ساختمان برابر نیست، و بنابراین، نمی توان با یک ساختار داده ثابت، مانند تصاویر شطرنجی، نمایش داد. از سوی دیگر، یک نمودار به دلیل ساختار انعطاف پذیر خود می تواند روابط پیچیده بین ساختمان ها را نشان دهد. علاوه بر این، با استفاده از قابلیتهای روشهای یادگیری عمیق برای استخراج ویژگیهای چند بعدی، ویژگیهای فضایی و همچنین ویژگیهای تک تک ساختمانها را میتوان به طور همزمان بررسی کرد. به این ترتیب، پیچیدگی ویژگی های متعدد در توزیع ساختمان ممکن است قابل درک باشد،
برای بررسی اینکه آیا و چگونه می توان از مزایای هر دو نظریه فراکتال و گراف استفاده کرد و ترکیب کرد، در این مطالعه یک مدل یادگیری عمیق مبتنی بر نمودار برای نشان دادن پیچیدگی توزیعهای ساختمان، یعنی شاخص شکست مبتنی بر نمودار (GFI) ساخته شد. ، بر اساس ویژگی های هندسی و آماری آنها. مشارکت های سه گانه این کار را می توان به شرح زیر توصیف کرد:
- 1.
-
معرفی یک چارچوب شبکه عصبی کانولوشن گراف جدید بر روی توزیعهای نامنظم ساختمان برای توصیف ویژگیهای مکانی و ویژگیهای محلی آنها برای هر ساختمان، و همچنین ویژگیهای آماری جهانی آنها.
- 2.
-
ابداع روشی تحت تعریف دوم فراکتال برای سنتز الگوهای فراکتال توسط یک رژیم فراکتال مبتنی بر مربع، فرش Sierpinski، که می تواند به عنوان مجموعه داده های آموزشی و اعتبار سنجی استفاده شود.
- 3.
-
نشان دادن اینکه چگونه GFI پیشنهادی میتواند ناتوانی بعد فراکتال یا شاخص ht (یا مشتق آن: شاخص نرخ تجمعی رشد، CRG) را برای ادغام محاسبات مربوط به فراکتال با جنبههای فضایی و فضایی جبران کند.
در نتیجه، ما برنامههای جدیدی را پیشبینی میکنیم که هنوز به آن فکر نکردهایم که در آن دو متغیر با یک ویژگی متفاوت، یعنی معیارهای آماری و شکل فضایی، ترکیب میشوند تا بینشهای جدیدی ارائه کنند.
ادامه این مقاله به شرح زیر سازماندهی شده است. بخش 2 کارهای مرتبط را در مورد پیچیدگی مورفولوژی شهری و شبکه های کانولوشن گراف (GCN) خلاصه می کند. اطلاعات دقیق در مورد روشهای پیشنهادی، مجموعه دادههای ترکیبی و آموزش مدل در بخش 3 آورده شده است. برخی از مطالعات موردی در مورد ردپای ساختمان در منطقه لندن بزرگ در بخش 4 نشان داده شده است. در نهایت، یافتهها و بینشها در بخش 5 با نکات پایانی در بخش 6 مورد بحث قرار میگیرند .
2. کارهای مرتبط
2.1. پیچیدگی مورفولوژی شهری
شهرها مدتهاست که بهعنوان سیستمهای پیچیدهای شناخته شدهاند که بزرگ، غیرخطی و از اجزای متقابل پدید میآیند [ 13 ]. مطالعه پیچیدگی سیستم های شهری برای درک رفتار جمعی انسان در گذشته [ 14 ]، و تسهیل طراحی شهری قابل زندگی یا اختراع شهرهای آینده است [ 13 ]. درک اشکال و فرآیندهای پیچیده شهری کلید همه نشانهها در گذشته و آینده طبیعت است [ 15 ]، که پیکربندی فضایی ردپای ساختمان و توزیع آنها یکی از برجستهترین جنبههای آن است [ 16 ].
الگوهای مورفولوژیکی توزیع ساختمان یا ساده یا پیچیده هستند. الگوهای ساده مانند ترازهای خطی، منحنی یا شبکه مانند به طور گسترده برای تسهیل تعمیم نقشه در نقشه برداری [ 17 ، 18 ، 19 ، 20 ] یا شناسایی همسایگی های عملکردی در نمایه سازی فضایی [ 21 ، 22 ، 23 ] مورد مطالعه قرار گرفته اند. این الگوهای ساده عمدتاً توسط متغیرهای هندسی مانند فاصله و زوایا و برخی توصیفگرهای مورفولوژیکی مانند مجاورت، شباهت، بسته بودن و پیوستگی توصیف میشوند که مبتنی بر متغیرهای بصری ارائهشده توسط نظریه گشتالت است [ 24 ].]. بر خلاف الگوهای ساده، الگوهای پیچیده به سختی دارای اشکال خاصی هستند که بتوان آنها را در آنها طبقه بندی کرد و به طور محدود تنها توسط توصیف کننده های هندسی یا ریخت شناسی توصیف می شوند. چنین محدودیتی عمدتاً ناشی از دیدگاه هندسی اقلیدسی است که اساساً بر جزئیات محلی و هندسی تمرکز می کند، مانند مواردی که در توصیفگرهای هندسی ذکر شده است. در عوض، چیدمان و توزیع ردپای ساختمان ممکن است با پیچیدگی آنها در زمینه هندسه های فراکتال بهتر مشخص شود.
فراکتال یک شکل هندسی تکه تکه است، مانند خط ساحلی بریتانیا، که می تواند به بخش هایی تقسیم شود که هر کدام شبیه به کل هستند [ 2 ]. پیچیدگی آن توسط بعد فراکتال (FD) تعریف شده در محدوده بین 0 و 2 داده می شود، که در آن هر چه مقدار بالاتر باشد، فضای بیشتری پر می شود و منجر به افزایش همگنی در توزیع فضایی می شود. با این حال، برخی از مطالعات نشان داده اند که FD با تراکم ساخته شده در منطقه مورد مطالعه همبستگی مثبت دارد [ 25 ، 26 ]]. این ضعف نشان میدهد که FD یک معیار محدود برای توصیف شکل پیچیده توزیعها است، بهویژه هنگام بررسی تجمعات با چگالی بالا. الگوی تجمعات در مرکز پاریس، به عنوان مثال، به عنوان یک توزیع متراکم یکنواخت با توجه به FD آن ترسیم شده است [ 27 ]. سایر مطالعات تجربی نیز نشان میدهند که مقادیر FD نواحی مرکز شهر به 2 نزدیک میشوند، بدون توجه به نوع مورفولوژی تجمع [ 28 ]. مقایسه تغییرات منحنیهای شمارش جعبه برای توزیعهای غیرقانونی بین تعداد جعبهها و مقیاسها [ 29 ] نمیتواند نادرستی FD را هنگام کار با تودههای با چگالی بالا دور بزند. بنابراین، FD خیلی سفت و سخت است [ 4]: 1، مستلزم آن است که مجموعه داده از توزیع قانون قدرت پیروی کند، و بنابراین، برای داده های دارای توزیع، مانند توزیع های لگ نرمال و نمایی و 2، نمی تواند پیچیدگی یک فراکتال را از نظر سطح متمایز کند. بازگشت برای حل این دو مشکل، یک شاخص انعطافپذیرتر، شاخص ht [ 4 ] و همچنین پیشرفتهای آن، شاخص CRG [ 30 ]، شاخص نسبت مناطق (RA) [ 31 ] و معیارهای یکپارچه 1&2 (UM1&2) ) [ 32 ] پیشنهاد شده است. ht-index با عملیات به اصطلاح شکستن سر/دم به دست می آید [ 33]، که به صورت بازگشتی سر یک توزیع آماری معمولاً سنگین را با مقادیر میانگین آن تقسیم می کند. برای اینکه یک توزیع فراکتال در نظر گرفته شود، شاخص ht باید حداقل 3 باشد. از ht-index، CRG، و همچنین شاخص های RA و UM1&2، شکل انتگرال ht-index را به یک کسری گسترش می دهد تا بتواند تفاوت جزئی را که ht-index نمی تواند حس کند. به طور خاص، اگرچه شاخصهای UM1&2 تفسیرپذیری بهتری نسبت به CRG و RA ارائه میدهند، مقادیر عددی آنها همچنان با CRG (مثبت) و RA (منفی) همبستگی دارند. شکل ریاضی UM1&2، که فقط نسبت بین سر و دم اول دنباله را در نظر می گیرد، به اندازه CRG ها مختصر و سازگار نیست. مهمتر از آن، این شاخص ها تنها شاخص های آماری هستند و به سادگی یک جنبه از ویژگی های موجودیت ها را در یک زمان مورد بررسی قرار می دهند. برای مثال، پیچیدگی نقاط داغ اجتماعی در مناطق شهری با فاصله مکانهای ورود توییتها بررسی میشود.14 ]، یا ناهمگونی توسعه شهری در آمریکا با اندازه مناطق ساخته شده نشان داده شده است [ 34 ]. برای موجودیتهای فضایی، مانند ردپای ساختمان که معمولاً در مطالعه مورفولوژی شهری مشاهده میشود، نه تنها توزیع آماری، بلکه روابط فضایی بین محلهها نیز باید در نظر گرفته شود. علاوه بر این، یک چشم انداز جامع که شامل ویژگی های فضایی چند متغیره، به عنوان مثال، مساحت و فاصله، نیز باید مورد بررسی مجدد قرار گیرد.
2.2. نمودار شبکه های کانولوشنال
در سال های اخیر، یادگیری عمیق مورد توجه گسترده و کاربردهای گسترده ای در صنعت و دانشگاه قرار گرفته است. ثابت کرده است که در زمینه هایی مانند تشخیص الگو و طبقه بندی در داده های ساختاری یکنواخت مانند تصاویر، صدا و متون موفق است [ 35 ]. علاوه بر این، کاربردهای مدلهای مختلف یادگیری عمیق به طور فزایندهای در تحلیل پیشبینیهای مکانی-زمانی، که معمولاً در زمینه ترافیک و حملونقل [ 36 ، 37 ، 38 ]، اکولوژی [ 39 ] و اقتصاد [ 40 ] دیده میشود، استفاده میشوند.]. با این حال، بیشتر پدیدههای طبیعی یا سیستمهای غیرمتمرکز ناهمگن هستند و با نمودارهایی با ساختار نامنظم، مانند نمودارهای شبکههای اجتماعی و مسیرهای ترافیک [ 41 ] نشان داده میشوند. بنابراین، توسعه مدلهای کارآمد برای تجزیه و تحلیل مجموعه دادههای مبتنی بر نمودار نامنظم، توجه قابل توجهی را در زمینه یادگیری عمیق به خود جلب کرده است.
در یادگیری عمیق، موفق ترین آشکارساز ویژگی، عملیات کانولوشن است. به بیان ساده، فرآیند کانولوشن مقایسه و تجمیع تفاوتهای بین جسم مرکزی و همسایگان آن است. بر اساس این تکنیک، شبکه کانولوشن گراف (GCN) ویژگی های گراف را در دو فضا استخراج می کند: حوزه فضایی [ 42 ] و دامنه طیفی [ 43 ].]. در حوزه فضایی، عملیات پیچیدگی مستقیماً روی رئوس منفرد و همسایگیهای آنها اعمال میشود. طراحی تابع هسته کانولوشن، فاصله همسایگانی که باید در نظر گرفته شوند را تعیین می کند. این رویکرد بسیار شبیه عملیات فضایی در قالبهای داده با ساختار منظم است. مانند عملیات کانولوشن سنتی، طراحی هستههای با اندازه ثابت برای رویکردهای مبتنی بر فضایی کار آسانی نیست. برعکس، رویکردهای مبتنی بر طیف، پیچیدگیهای گراف را با معرفی فیلترها از منظر پردازش سیگنال گراف بر اساس نظریه طیفی گراف تعریف میکنند. ویژگیهای گراف توسط تبدیل فوریه به حوزه طیفی نگاشت میشوند و سپس با عملیات کانولوشنی نمونهبرداری میشوند. این رویکرد را می توان در مورد تجمیع ویژگی های نمودار در مقیاس های مختلف در نظر گرفت و به ما کمک می کند تا ساختار گراف زیربنایی را درک کنیم. به این ترتیب رویکردهای مبتنی بر طیف می توانند برای فرمت های داده های نامنظم و بدون ساختار استفاده شوند.
مدلهای GCN در تشخیص ویژگیهای فضایی و اسنادی در بسیاری از زمینهها مانند پیشبینی جریان ترافیک و تشخیص هرزنامههای اجتماعی بسیار توانایی دارند [ 44 ، 45 ]. مطالعات اخیر همچنین نشان میدهد که مدلهای GCN میتوانند به طبقهبندی الگوهای منظم یا نامنظم توزیعهای ساختمانی کمک کنند [ 19 ، 46 ]. علاوه بر این، GCN تعبیهشده با چارچوب رمزگذار خودکار اخیراً برای رمزگذاری اشکال ساختمانهای جداگانه اعمال شده است [ 47 ]. یان و همکاران [ 46] نشان می دهد که حتی یک ساختار کم عمق GCN با چند لایه می تواند به دقت بالایی در طبقه بندی نمودار دست یابد، که در آن منطقه ساختمان به عنوان یک ویژگی واحد قادر به توصیف ساختمان های فردی به خودی خود است. با این حال، اکثر مدلهای GCN در تمایز بیشتر الگوی نمودارهای ناهمگن [ 48 ] و همچنین سناریوهای جغرافیایی که معمولاً مشاهده میشوند، مانند جریانهای مسیر، شبکههای جادهای و ردپای ساختمان، محدود هستند.
یک نمودار ناهمگن با داشتن اتصالات و ویژگی های فضایی غیر یکنواخت مشخص می شود. این ساختار نامتعادل اغلب منجر به توزیع ناهموار (مثلاً توزیع دم سنگین) مقادیر ویژگی ها می شود. اکثر مدلهای GCN سعی میکنند ویژگیهای ویژگیها را به روشی یکسان استخراج کنند (مثلاً با گرفتن مقادیر میانگین). برای رفع این مشکل، ژانگ و همکاران. [ 48 ] یک معماری شبکه عصبی کانولوشنال گراف عمیق پایان به انتها (DGCNN) را پیشنهاد کرد. سه پیشرفت در این چارچوب وجود دارد: (1) استخراج ویژگی های هر لایه GCN به صورت غیرخطی. (2) معرفی یک لایه جدید “SortPooling” برای استخراج ویژگی های کلیدی و (3) پل زدن GCN با لایه های شبکه عصبی کانولوشن سنتی برای بهبود بیشتر تشخیص ویژگی (به بخش 3.4 مراجعه کنید.).
3. روش ها
تئوری های فراکتال هم تعاریف ریاضی و هم توصیفات هندسی را ارائه می دهند. با ترکیب تعاریف آماری و یک الگوی فراکتالی خاص، می توان چندین نوع فراکتال را سنتز کرد. ایده های اصلی روش معرفی شده در اینجا عبارتند از (الف) استفاده از انواع مصنوعی با ابعاد شناخته شده یا تکرار فراکتال ها برای آموزش شبکه عصبی مبتنی بر نمودار برای یادگیری ویژگی های فضایی و آماری فراکتال ها، و (ب) متعاقبا استفاده از مدل آموزشدیده برای برآورد پیچیدگی ساختاری توزیع ساختمان در محیطهای شهری واقعی.
3.1. چارچوبی برای مشخص کردن پیچیدگی توزیع های ساختمانی
برای مشخص کردن پیچیدگی توزیعهای ساختمان، چارچوب شامل سه ماژول است (نشان داده شده در شکل 1 ): (1) ترکیب دادهها. این بخش مجموعه داده های آموزشی از جمله الگوهای فراکتال و یکنواخت را ترکیب می کند. (2) نمایش نمودار. روابط فضایی ساختمانها در یک گروه همراه با ویژگیهای هندسی آنها به صورت نمودارها و (3) ساخت مدل نشان داده میشوند. این بخش برای آموزش یک مدل DGCNN با استفاده از گروههای ساختمان مصنوعی برچسبگذاری شده شامل انواع فراکتال و یکنواخت است. سپس مدل ساخته شده برای توصیف گروه های ساختمانی تجربی استفاده می شود.
3.2. فراکتال های مصنوعی و انواع یکنواخت
مجموعه مجموعه داده های آموزشی به طور کلی شامل حاشیه نویسی دستی از الگوهای واقعی توسط شناخت افراد [ 46 ] یا سنتز خودکار با الگوریتم ها [ 49 ] است. الگوهای ساده، مانند طرحبندیهای خطی یا شبکهای، تنها نوعی از سناریوی ساده را نشان میدهند که میتواند بدون زحمت توسط ناظر انسانی شناسایی شود یا با چند متغیر هندسی مدلسازی شود. با این حال، به دلیل محدودیت ها و ذهنیت شناخت بصری انسان نسبت به الگوهای پیچیده، حاشیه نویسی بر پیچیدگی توزیع نامنظم ساختمان چالش برانگیز است. از این رو، برای این کار، ما به دست آوردن داده های آموزشی با سنتز با استفاده از الگوریتم ها را انتخاب کردیم. در این مقاله، ما دو نوع سنتز ایجاد می کنیم: الگوهای فراکتال و یکنواخت.
یک الگوی فراکتال دارای سه جنبه است: مورفولوژی، عدم قطعیت، و ابعاد [ 1 ، 50 ]. مورفولوژی به شکل هندسی که یک الگوی فراکتال نشان می دهد اشاره دارد. عدم قطعیت در اینجا به عنوان تصادفی بودن در واقعیت در نظر گرفته می شود، در حالی که ابعاد، درجه مقیاس هایی است که یک الگوی فراکتال آشکار می شود. این سه جزء فراکتال ها به طور گسترده برای شبیه سازی پدیده های طبیعی مانند درختان، زمین و خطوط ساحلی به کار رفته اند [ 2 ، 51 ، 52 ]. بسیاری از الگوهای فراکتال منظم کشف یا ایجاد شده اند، مانند فراکتال ویکسک [ 53 ]]، دانه برف Koch و فرش Sierpinski. در اینجا، ما فرش مربعی Sierpinski را بهعنوان پایه فراکتال برای تولید انواع فراکتال انتخاب میکنیم، زیرا به عنوان یک الگوی استاندارد برای اندازهگیری پیچیدگی مناطق ساختهشده شهری در بیشتر مطالعات مورفولوژی شهری [ 8 ، 10 ، 29 ، 54 ] در نظر گرفته میشود. ]. عدم قطعیت توسط مکانیزم تصادفی تحت تعریف دوم فرکتالها که توسط ماندلبروت [ 1 ] پیشنهاد شده است، ایجاد میشود، زیرا آماری است تا هندسی. ما بیشتر یک ساختار فضایی ابداع کردیم تا مربع های تولید شده را در شبکه های دو بعدی معمولی قرار دهیم ( شکل 2 را ببینید ). درجه ابعاد نسبت به فرش Sierpinski به سادگی به عنوان تعداد اعماق بازگشتی تنظیم می شود.
از نظر آماری، انواع فراکتال از فرش Sierpinski ساخته شده است. ساخت فرش سیرپینسکی از یک مربع شروع می شود. این مربع در یک شبکه 3 در 3 به 9 مربع فرعی متجانس تقسیم می شود و سپس مربع مرکزی حذف می شود. این تکنیک به صورت بازگشتی در هر یک از هشت مربع فرعی باقی مانده و غیره تکرار می شود. از مربع اولیه، جایی که مقیاس 1 تعریف شده است، هر مربع فرعی با ضریب مقیاس 1/3 تقسیم می شود. طبق تعریف اول فراکتال ها، تعداد مربع ها ( N ) و مقیاس های مربوط به آن ( s ) دارای یک رابطه قدرت-قانون هستند که به صورت N = s توصیف می شود.(-α) که α ضریب پوسته پوسته شدن یا به اصطلاح بعد فراکتال است. در اینجا، با افزایش هشت برابری تعداد مربع ها نسبت به تعداد مقیاس قبلی و از آنجا که مقیاس ها با ضریب 1/3 کاهش می یابد، بعد فراکتال α به صورت log 8/log3 ≈ 1.89 محاسبه می شود. مقیاس بیشتر به صورت s = (1/3) c نشان داده می شود ، که در آن c درجه ابعاد برای پیچیدگی فرش است. ایده تصادفی که در تعریف دوم فراکتال ها پیشنهاد می شود، اضافه کردن تعدادی اعداد تصادفی به مقیاس است. س±Δس، تعداد مربع ها ( ن±Δن) و مکان های تصادفی در فضا؛ در همین حال، بعد فراکتال (α) باید تقریبا حفظ شود. به این ترتیب، تعداد مربعها و مقیاسها میتواند در هر نسل کمی متفاوت باشد، اما همچنان از نظر آماری از الگوی Sierpinski پیروی میکند. تعداد مربع ها، N به صورت زیر معرفی می شود:
جایی که سمقیاس است، و Δنو Δسعوامل تصادفی هستند که منجر به ایجاد برخی از انواع می شوند که از خط مقیاس بندی ایده آل (منظم) منحرف می شوند ( شکل 2 a).
از نظر فضایی، مربع های تولید شده شامل توزیع های تصادفی در یک صفحه دوبعدی نیز هستند. با توجه به روند ساخت فرش سیرپینسکی ( شکل 2 ب را ببینید)، ابتدا مربع اولیه به یک شبکه با 3×3=9سلول ها و سپس سلول های شبکه، به جز سلول مرکزی، بیشتر به یک تقسیم می شوند 3×3شبکه کودکان; این فرآیند به صورت بازگشتی تا رسیدن به ابعاد از پیش تعریف شده ادامه می یابد. برخلاف این رویکرد تقسیمبندی یکنواخت، برای یک نوع تصادفی Sierpinski، تقسیم فضا در هر مقیاس تا حدی بهصورت تصادفی انجام میشود. از این رو، شبکهها و سلولهای بهدستآمده در سطوح مقیاس یکسان، چندضلعیهای همخوان نیستند، بلکه نامنظم هستند، که در اینجا به آنها به عنوان «کانتینر» اشاره میکنیم. مراکز کانتینرها به طور تصادفی در فضای کانتینرهای اصلی خود در مقیاس های سطح بالاتر توزیع می شوند. به عنوان مثال در شکل 2 نشان داده شده استج، ابتدا کل فضا به طور تصادفی به 9 ظرف قرمز تقسیم می شود و هر یک از آنها به صورت بازگشتی به 9 ظرف سبز تقسیم می شود که هر کدام شامل 9 ظرف خاکستری در سطح نهایی است. تقسیم تصادفی فضا از این طریق به راحتی با الگوریتم های نمودار ورونوی انجام می شود.
در مرحله بعد، سنتز انواع یکنواخت ساده است. توزیع یکنواخت یک آرایش شبکه مانند است که در آن تمام اشکال ساختمان مربع های همخوان هستند و فاصله یکسانی از یکدیگر دارند. این را می توان با افزایش مکرر وضوح شبکه های معمولی در سطوح مختلف به راحتی به دست آورد.
3.3. نمایش نمودار برای گروه های ساختمانی
روابط فضایی بین ساختمان ها در یک گروه با نموداری که به صورت تعریف شده نشان داده می شود جی=V،E،f، جایی که V نشان دهنده گره های ساختمان های جداگانه است، E به پیوندها یا اتصالات فضایی بین همسایگان اشاره دارد، و fنشان دهنده یک سیگنال یا ویژگی است که هر گره حفظ می کند. ویژگی f،می تواند یک بردار چند بعدی باشد که چندین متغیر را در بر می گیرد که ویژگی های ساختمان را مشخص می کند. در اینجا ویژگی یک بردار دو بعدی است ، fمن=آمن،آدمن،جایی که آمنمساحت ساختمان است و آدمنمیانگین فاصله گره تا همسایگانش است، یعنی آدمن=1n∑متر=1nدمن،متر. در این مطالعه، نمودار بدون جهت است، و اتصالات همسایگان ساختمان از شبکه های نامنظم مثلثی (TIN) ساخته شده است (مثالی در شکل 3 نشان داده شده است ). لطفاً توجه داشته باشید که از آنجایی که عملیات کانولوشنی در لایههای GCN به اتصالات حلقه خود به خود گرهها نیاز دارد، اینها نیز باید اضافه شوند.
3.4. مدل DGCNN
با نمایش گروههای ساختمانی بهعنوان نمودار، ویژگیهای فضایی آنها از جمله مناطق ساختمانی و فواصل را میتوان بیشتر جمعآوری کرد و در چندین لایه GCN انباشته نشان داد ( شکل 4 را ببینید ). علاوه بر این، از آنجایی که ویژگیهای فضایی جمعآوری شده به طور ضمنی خاصیت ناهمگونی آماری را نشان میدهند، مورد دوم را میتوان با اتصال یک لایه مرتبسازی و چند لایه شبکه عصبی کانولوشنال سنتی مشخص کرد. در مطالعه ما، این شبکههای عصبی عمیق با اتخاذ یک مدل DGCNN در اندازه کامل مونتاژ میشوند.
یک DGCNN دارای سه مرحله است [ 48 ]: (1) انباشتن چهار لایه GCN برای استخراج ویژگی های محلی. هدف لایههای GCN اعمال عملیات کانولوشنی بر روی نمودارها است. مانند شبکههای عصبی کانولوشن سنتی (CNN)، GCN همچنین هستههای مؤثر را برای جمعآوری و شناسایی ویژگیهای مشخصه محلی میآموزد (ر.ک [ 43 ، 55 ]). برخلاف اکثر مدلهای GCN، DGCNN چهار لایه GCN را با قرار دادن آنها یکی پس از دیگری و بیرون آوردن نتایج از هر یک از آنها به عنوان بخشی از نتایج ترکیبی در لایه نهایی GCN سازماندهی میکند. (2) ابداع یک لایه SortPooling برای مرتب کردن ویژگیهای راس شناسایی شده به ترتیب ثابت و انتخاب اولین کرئوس قبل از وارد کردن آنها به لایه های کانولوشن و متراکم سنتی و (3) وصل کردن یک مدل پیچشی سنتی برای اعمال فیلترها بر روی ویژگی های مرتب شده رئوس. این مرحله نهایی شامل تولید پنج لایه متوالی است: یک لایه کانولوشن 1 بعدی سنتی، یک لایه ادغام حداکثر، یک لایه کانولوشنال 1 بعدی دیگر، یک لایه متراکم کاملا متصل و یک لایه خروجی. تنظیمات پارامتر مدل در شکل 4 نشان داده شده است.
مدل DGCNN با استفاده از باطن PyTorch و کتابخانه گراف عمیق (DGL) پیاده سازی شده است. علاوه بر این، برچسبهای آموزشی نمودارها برای انواع یکنواخت روی 1.0 و برای انواع فراکتال بر اساس ابعاد آنها 2.0، 3.0 و غیره تنظیم شده است. ویژگیهای نمودار مجموعه داده آموزشی و آزمایشی به دنبال استراتژی Z-score به شرح زیر نرمالسازی شدند: norمتر=vآلتوه-μσ، جایی که μمقدار میانگین است و σانحراف معیار صفات است.
3.4.1. لایه های GCN
یک لایه GCN دستکاری های کانولوشنی را روی نمودارها اعمال می کند. برای یک لایه سنتی CNN، کانولوشن معمولاً روی ساختارهای داده معمولی مانند تصاویر اعمال می شود. ویژگی های یک تصویر اساساً توسط یک طرح وزن دهی مستطیلی جمع می شوند، a 3×3ماتریس، به عنوان مثال، پیکسل به پیکسل. در مقابل، یک نمودار معمولاً یک ساختار نامنظم است که در آن تعداد همسایگان گره ها ثابت نیست. برای اعمال طرحهای منظم به ویژگیهای آن، گراف را میتوان ابتدا به عنوان یک ماتریس مجاورت نشان داد و سپس توسط عناصر اصلی ماتریس مجاورت، یعنی پایههای متعامد، به یک ساختار منظم در حوزه طیفی تبدیل شد. برای یک نمودار آو ماتریس ویژگی گره آن ایکس ∈ℝن×م، که در آن N تعداد رئوس و M بعد سیگنال های مشخصه است، یک عملیات کانولوشنی نمودار نمادین به عنوان ” ⋆” به صورت زیر نمایش داده می شود:
که در آن Z خروجی یک لایه GCN است. جیθتابع غیر خطی فرکانس ها است λمناز نمودار A با پارامترهای قابل آموزش θ∈ℝن. Uماتریس متعامد است و Uتیانتقال متناظر آن است. ایکس^تجزیه X بر اساس Uتیدر حوزه طیفی برای استخراج ویژگی های چند مقیاسی، چندین لایه GCN به روش زیر روی هم قرار می گیرند:
جایی که زمنخروجی لایه ith GCN است. توجه داشته باشید که مدل GCN ما در این مقاله با فیلترهای کانولوشن پیشنهاد شده در [ 43 ] یکسان است. با انباشتن چندین لایه GCN، ویژگی های شناسایی شده توسط آخرین لایه GCN به یکدیگر متصل می شوند و بیشتر به یک لایه SortPooling تغذیه می شوند.
3.4.2. لایه SortPooling
به معنای واقعی کلمه، لایه SortPooling یک فرآیند ادغام به سمت ویژگی های مرتب سازی است. لایه ادغام برای کاهش اندازه فضایی داده های پردازش شده در حافظه و تعداد پارامترهای آموزشی است. برای چارچوبهای رگرسیون گراف سنتی، مانند شبکه عصبی برای گراف (NN4G) [ 56 ] و شبکههای عصبی انتشار-پیچیده (DCNN) [ 57 ]، ویژگیهای شناساییشده توسط فرآیند جمعبندی ساده یا میانگینگیری و توپولوژیکی جمعآوری میشوند. تنوع ویژگی های شناسایی شده بین رئوس از بین می رود. بنابراین فرآیند مرتبسازی در اینجا برجسته کردن نقشهای ساختاری رئوس در نمودار [ 42 ] است.
ورودی ها، به عنوان مثال، a ک×منتانسور کجا ک=500و من=3در کار ارائه شده در اینجا، از لایه SortPooling، ویژگی های رأس به هم پیوسته از لایه GCN قبلی هستند. هر ردیف از این تانسور مربوط به یک توصیفگر ویژگی شناسایی شده از هر راس است و هر ستون به ترتیب یک کانال برجسته از سه لایه GCN قبلی است. سپس، ویژگیهای رأس به ترتیب نزولی واژگانی مرتب میشوند: تانسورهای ویژگی ابتدا بر اساس کانال اول مرتب میشوند و اگر برخی از آنها در کانال اول مقادیر یکسانی داشته باشند، بر اساس مقدار کانال دوم مرتبسازی میشوند. به همین ترتیب ( شکل 4 را ببینید). این الگوریتم منطقی مشابه با نحوه سازماندهی واژگان به ترتیب حروف الفبا در فرهنگ لغت دارد. در نهایت، لایه SortPooling ویژگیهای مرتبسازی را به یک برداری برای لایههای کانولوشنی سنتی بعدی گسترش میدهد.
4. انواع مصنوعی و آموزش مدل
دو نوع از انواع سنتز می شوند: فراکتال و یکنواخت. مطابق با ابعاد (یعنی تعداد تکرارها) فراکتال ها، چهار سطح از الگوهای سیرپینسکی با برچسب های 2.0، 3.0، 4.0 و 5.0 سنتز شدند و تعداد انواع تصادفی در هر سطح 500 است. از فرآیند سنتز نشان داده شده است. در 3.2، مشخص است که در اطراف وجود دارد ∑1من8من-1مربع برای یک نوع در سطح-i، به عنوان مثال، 9، 77، 589 و 4096 مربع از سطح 2 تا سطح 5 وجود دارد. برای الگوهای فراکتال بالاتر از سطح 5، مربع های زیادی وجود دارد (برای مثال، بیش از 37000 برای مربع های سطح 6) که برای ساخت گروه ها در سطح محله مناسب است. بنابراین، هر گونه تلاش برای رسیدگی به گروه های ساختمانی بزرگتر از سطح 5 خارج از محدوده این مطالعه است. علاوه بر این، ما بر این اساس انواع یکنواخت را که ابعاد آنها از محدوده متفاوت است، سنتز می کنیم 3×3به منnتیهgهr4096×منnتیهgهr4096=64×64(در مجموع 62 نوع و 30 نسخه تکراری برای هر کدام، یعنی 62 ×30 = 1860 نوع یکنواخت)، و با برچسب 1.0 (نشان داده شده در شکل 5 a).
سپس، انواع مصنوعی الگوهای یکنواخت و فراکتال به عنوان یک مجموعه داده آموزشی ترکیب میشوند و به مدل DGCNN تغذیه میشوند. انواع به طور تصادفی مخلوط شده و به سه بخش تقسیم می شوند: مجموعه داده های آموزش، اعتبار سنجی و آزمایش با نسبت 6:2:2. در هر دوره از فرآیند آموزش، ما ضرر تمرین را نیز تخمین می زنیم و میزان تلفات و دقت برچسب های پیش بینی شده را تایید می کنیم. هم از دست دادن آموزش و هم اعتبارسنجی به سرعت کاهش می یابد و به 0 نزدیک می شود، در حالی که صحت طبقه بندی الگوهای واریانت فراکتال از 1.0٪ به 96.5٪ در نهایت افزایش می یابد. به طور کلی، فرآیند آموزش پس از چند دوره پایان می یابد (90 دوره، در این مورد، در شکل 5 ب نشان داده شده است) که نشان می دهد یک مدل GFI با پیش بینی های بسیار دقیق به دست آمده است.
5. مطالعات موردی
5.1. ساختن ردپای در بلوک ها
در این مطالعه، ردپای ساختمان در لندن برای نشان دادن عملکرد مدل پیشنهادی انتخاب شد. لندن دارای سه منطقه است: لندن بزرگ، منطقه میانی و منطقه هسته مرکزی ( جدول 1 ). برای به دست آوردن گروههای ساختمان، مجموعه دادههای ویژگی شامل ساختمانها، خیابانها و رودخانهها از وبسایت Open Street Map جمعآوری شد (در 15 اکتبر 2020، به وبسایت دانلود مراجعه کنید: https://download.geofabrik.de/)، یک پلتفرم منبع باز محبوب که به کاربران اجازه می دهد تا مجموعه داده های جغرافیایی جمع سپاری را به اشتراک بگذارند و در آن مشارکت کنند. ما ابتدا بلوکهای خیابان را با تجمیع انواع ویژگیهای خیابان و رودخانه تولید کردیم و سپس با بلوکهای خیابانی تولید شده، ساختمانها را به گروههایی تقسیم کردیم. در مجموع، تقریباً 0.48 میلیون ساختمان و 24 هزار بلوک خیابان در منطقه لندن بزرگ وجود دارد. علاوه بر این، منطقه میانی با تنها بیست درصد کل مساحت تقریباً نیمی از ساختمان ها و 40 درصد از بلوک های خیابان را به خود اختصاص داده است. با توجه به مساحت آن، منطقه مرکزی مانند نسخه کاهش یافته منطقه میانی است که تعداد ساختمان ها و بلوک های خیابان در منطقه مرکزی تقریباً ده درصد نسبت به منطقه میانی است.
ساختمان های گروه بندی شده در لندن طبق بخش 3.2 به نمایش نمودار تبدیل شدند و مقادیر GFI آنها توسط مدل آموزش دیده تخمین زده شد (نتایج را در شکل 6 ببینید ). در مناطق مورد نظر بزرگنمایی شده در شکل 6(در زیر)، مقادیر GFI به دست آمده به رنگهایی نگاشت میشوند که پیچیدگی گروههای ساختمان را نشان میدهند: هر چه مقادیر بیشتر باشند، گروههای ساختمان پیچیدهتر هستند. در زمینه لندن، مقادیر GFI از 0 تا 5.90 متغیر است. برای تجسم، آنها به شش بازه با رنگ های مختلف از خاکستری (کمترین) تا آبی تیره (بالاترین) طبقه بندی می شوند. مقادیر GFI بلوکهای خاکستری بهعنوان صفر تنظیم میشوند، زیرا تعداد ساختمانهای آنها کمتر از سه است – حداقل عدد برای ساخت یک نمودار دلونی. در یک نگاه، بلوک هایی با مقادیر GFI از 0.01 تا 2.5 اکثریت را تشکیل می دهند و به طور متراکم در سراسر سه منطقه سلسله مراتبی لندن توزیع می شوند. با این حال، بلوکهای با GFI > 2.5 در مقایسه کمتر هستند و بیشتر در خارج از ناحیه هسته مرکزی قرار دارند.
علاوه بر این، توزیع فضایی مقادیر GFI در لندن نیز با آمار توصیفی آنها در شکل 7 نشان داده شده است. بدیهی است که مقادیر GFI در سه ناحیه توزیعهای مشابه با مقادیر میانگین یکسان 70/1 و انحرافات استاندارد مشابه را نشان میدهند. چنین شباهتی که بین مناطق تو در تو مشترک است، یک الگوی تکراری را در لندن نشان میدهد: پیچیدگی گروههای ساختمانی نه تنها کم و بیش مشابه، بلکه کاملاً ساده است. علاوه بر این، گروه های ساختمانی پیچیده با مقادیر GFI بیشتر از 4.0 بیشتر در حومه منطقه هسته مرکزی هستند. این در راستای بازرسی از توزیع فضایی مقادیر GFI است که در شکل 6 نشان داده شده است .
5.2. ردپای ساختمان در محله
برای بررسی دقیق چگونگی توزیع در محله ها، یعنی در بلوک های خیابان، توسط GFI، 34 گروه ساختمانی به طور تصادفی جمع آوری و در شکل 8 فهرست شده اند.. به طور کلی، مقادیر GFI از 0.79 تا 5.65 متغیر است و با پیچیده تر شدن توزیع گروه های ساختمانی به تدریج افزایش می یابد. برای مثال، توزیعهای با مقادیر GFI در حدود 1.0 ظاهراً ساده و بسیار شبیه به الگوی شبکهای هستند و آنهایی که مقادیر GFI بزرگ تقریباً 5.0 دارند، الگوهای فراکتال مانند را نشان میدهند. توجه داشته باشید، برای توزیع هایی با مقادیر GFI در حدود 2.0، 3.0 یا 4.0، یعنی سطوح پیچیدگی از پیش تعریف شده، یک ساختمان بزرگ از نظر مساحت یا فاصله در مقایسه با ساختمان های باقی مانده وجود دارد. این به خوبی با الگویی که یک نوع سیرپینسکی نشان می دهد مطابقت دارد: یک مربع بزرگ وجود دارد در حالی که تعداد زیادی مربع دیگر در مربع های کوچک وجود دارد. چنین الگویی در محدوده کوچکی را میتوان به عنوان یک ساختار تک تلقی کرد و میتوان آن را به صورت بازگشتی با هم ترکیب کرد یا به تدریج با هم ترکیب کرد تا کل پیچیدهتری را تشکیل دهد تا زمانی که ساختمان بزرگ دیگری در مقیاس بالاتر ظاهر شود. این تغییر تدریجی در توزیع ساختمان را می توان در مثال هایی که در نشان داده شده است نیز مشاهده کردشکل 8 .
برای مقایسه بیشتر اینکه چگونه مقادیر GFI پیچیدگی گروههای ساختمانی را مشخص میکند، دو توصیفگر شامل تعداد ساختمانها، تراکم منطقه ساخته شده (نسبت بین مساحت ساختمانها و حداقل بوکس مرزی)، و پیچیدگی کلاسیک نیز محاسبه میشود. شاخص ها (یعنی بعد فراکتال (FD)، شاخص های ht و شاخص های CRG برای مناطق (ht-A و CRG-D) و فاصله گروه های ساختمان (ht-A و CRG-D)) ( جدول 2 را ببینید.). قابل ذکر است که هیچ یک از توصیفگرها یا شاخص های ذکر شده نمی توانند پیچیدگی توزیع ساختمان را مشخص کنند. به نظر می رسد تعداد ساختمان ها افزایش پیچیدگی را به خوبی منعکس می کند، اما این یک شرط ضروری است نه کافی، یعنی اینکه یک توزیع پیچیده به ساختمان های زیادی نیاز ندارد و بالعکس. تراکم منطقه ساخته شده نیز هیچ تفاوتی با پیچیدگی مورفولوژیکی ندارد. مثلاً تراکم شماره 3 و 31 تقریباً برابر است، اما بدیهی است که شماره 31 بسیار پیچیده تر از شماره 3 است.
علاوه بر این، شاخصهای CRG (CRG-A/D) نسبت به شاخصهای ht (ht-A/D) حساستر هستند. با پیچیده تر شدن توزیع ها، CRG-A/D افزایش می یابد، در حالی که ht-A/D بر این اساس تغییر نمی کند. به خصوص تغییر در CRG-A برجسته تر از CRG-D است. CRG-D حتی تا 0 نیز کاهش می یابد، اگرچه الگوی همتای آن پیچیده است ( شکل 9 ). با این حال، نه CRG و نه شاخص های ht نمی توانند به خوبی چگونگی تکامل الگوهای ساختمانی پیچیده را تعیین کنند. این به سادگی توسط دو جفت توزیع ساختمان، شماره 6–شماره نشان داده شده است. 29 و شماره 11 – شماره. 29، که در آن هر جفت دارای شاخص های CRG یا ht مشابه هستند اما الگوهای ساختاری متفاوتی دارند. علاوه بر این، نقاط پرت ظاهری مقادیر CRG (متون پررنگ در جدول 2 و مشخص شده با دایره های قرمز درشکل 9 ) برای شناسایی الگوهای مربوطه بسیار حساس به نظر می رسد. در نهایت، FD همچنین قادر به توصیف پیچیدگی به شیوه ای خوب نیست. برای مثال، با مقایسه شماره 3 و شماره 31، هر دو دارای مقادیر FD مشابه و همچنین تراکم ساخته شده هستند، اما درجه پیچیدگی آنها به طور قابل توجهی متفاوت است.
6. بحث
یک شاخص شکری مبتنی بر نمودار جدید (GFI) برای توصیف پیچیدگی توزیع ساختمان پیشنهاد شده است. این بر اساس تعریف دوم فراکتال ها و یک مدل یادگیری عمیق مبتنی بر GCN – DGCNN است. برای آزمایش شاخص جدید، از ردپای ساختمانهای بلوکهای خیابانی در سه منطقه لندن که به صورت سلسله مراتبی تودرتو بودند، استفاده شد: لندن بزرگ، منطقه میانی و منطقه هسته مرکزی. با توجه به توزیع آماری مقادیر GFI، پیچیدگیهای اکثر توزیعهای ساختمانی در این مناطق بسیار کم است که نشاندهنده سازههای ساده است. این ممکن است تا حدودی تعجب آور باشد، زیرا لندن به عنوان یک سیستم پیچیده یا یک کل ارگانیک ادعا شده است [ 14 ]]. با این حال، این شاخص نشان می دهد که هنوز هم از بسیاری از ساختارهای ساده و منظم تشکیل شده است که احتمالاً به دلیل برنامه ریزی فعال و عمدی در طول گسترش توسعه شهری است. با این وجود، انحرافات استاندارد GFI در سه ناحیه از ناحیه بزرگ لندن به سمت ناحیه هسته مرکزی میانی افزایش مییابد ( شکل 7 را ببینید.). به عبارت دیگر، نوسان GFI بیشتر نشان میدهد که چگونه توزیعهای ساختمان در هر منطقه متنوع است، از تنوع کم در منطقه لندن بزرگ تا تنوع بالا در منطقه میانی. این نشاندهنده یک الگوی در حال تحول فضایی جالب از ساختمانها از ناحیه مرکزی لندن تا حاشیه است، یعنی به تدریج و به طور طبیعی شامل تغییرات و جایگزینی ساختمانها در این منطقه در طول زمان میشود، در حالی که احتمالاً حومهها به طور ناگهانی از طریق ساخت همزمان بزرگتر توسعه یافتهاند. مناطق در مقیاس درشت تر در این راستا، پیچیدگی مورفولوژیکی کمی سازی شده بر حسب مقادیر GFI نیز می تواند تنوع توسعه شهری را در مقیاس شهر نشان دهد و ممکن است میزان حرکت انسان را در شرایط اجتماعی-اقتصادی بیشتر نشان دهد.
GFI نسبت به متریک های فراکتال قبلی FD، ht-index، و CRG در توصیف توزیع فضایی و آماری ساختمان ها مزیت چند برابری دارد. در تراکمهای ساختمانی بالا، نتایج نشان میدهد که FD نمیتواند میزان پیچیده بودن توزیع ساختمان در فضا را متمایز کند. یک توزیع با چگالی بالا می تواند دو الگوی کاملاً متضاد داشته باشد: یک الگوی شبکه مانند بسیار منظم یا یک الگوی بسیار بی نظم، که در آن هر دو FD به مقدار 2.0 نزدیک می شوند. این به این دلیل اتفاق میافتد که میزان پر شدن فضا، مانند تعداد جعبهها را به جای الگوهای توزیع فضایی اهداف به خودی خود اندازهگیری میکند. این یافته همچنین با گزارش توماس، فرانکهاوزر و بیرناکی همخوانی دارد [ 54] که FD به طور نمایی با چگالی همبستگی دارد. ht-index و CRG از سوی دیگر به توزیع اهداف روی می آورند و از این نظر، این شاخص ها مکمل FD هستند. با این حال، با توجه به ماهیت توزیع آماری، شاخص ht و CRG نمی توانند پیچیدگی توزیع ساختمان را به ترتیب از نظر مساحت و فواصل تعیین کنند. مثال های نشان داده شده در جدول 2 نشان می دهد که چه برای مساحت و چه برای مسافت، مقادیر مشابه از نظر شاخص ht و شاخص CRG لزوماً الگوی مشابهی از توزیع ساختمان را نشان نمی دهد. برای مثال ht-index با اعداد صحیح گسسته کار می کند تا تغییرات تدریجی را نتوان به خوبی نشان داد. علاوه بر این، توجه داشته باشید که CRG گاهی اوقات به شدت متفاوت رفتار میکند و نقاط دورافتاده عجیب و غریبی ایجاد میکند (نشان داده شده در شکل 9). به طور خاص، این شاخصهای پرت زمانی ظاهر میشوند که ht-index متناظر آنها برابر با 2 باشد. بنابراین با بررسی تعریف آن [ 31 ]، پیشنهاد میشود که در این شرایط، CRG باید برابر با 1 به جای مقادیر مشخصه میانگین اول باشد. GFI پیشنهادی هم توزیع فضایی و هم توزیع آماری یک گروه ساختمانی را برای مشخص کردن پیچیدگی آن در نظر میگیرد، جایی که توزیع از نظر بصری با GFI داده شده مطابقت دارد ( شکل 8 و جدول 2) .). از آنجایی که ایده اصلی در پشت چارچوب پیشنهادی بر اساس توصیف توزیع فضایی و آماری بنا شده است، به ترتیب با تعریف فرکتال دوم و سوم، GFI تکمیل کننده FD، ht-index و CRG است و توانایی توصیفی را به سمت فضایی برآورده میکند. پیچیدگی، به طور کلی علاوه بر این، تعداد ساختمانها در محله نشاندهنده رابطه مثبت ظاهری با مقادیر GFI است ( جدول 2 را ببینید.)، اما بررسی بیشتر بر اساس کل مجموعه داده بلوکهای محله در لندن نشان میدهد که تعداد ساختمانها به شدت با مقدار GFI همبستگی مثبت ندارند. برای گروههایی که تعداد ساختمانهای بیشتری دارند، مقادیر GFI آنها اساساً بیشتر است اما برعکس نیست. در این راستا، گروههایی که مقادیر GFI بالاتری دارند، میتوانند ساختمانهای کمتر یا بیشتر داشته باشند، اما همه ویژگیهای فضایی پیچیده از جمله تعداد ساختمانها را نشان میدهند.
چارچوب پیشنهادی در این کار، طبق دانش ما، اولین تلاش برای استفاده از مدلهای یادگیری عمیق و نظریههای فراکتال برای حل مشکل اندازهگیری پیچیدگی است. پدیده پیچیده توزیع ساختمان (یعنی از نظر مکانی و آماری) را می توان با نمودارها نشان داد و توسط مدل های یادگیری عمیق مبتنی بر GCN آموخت. توزیع های ساختمانی اساساً دارای سه ویژگی هستند: ویژگی ها، توزیع های فضایی، و روابط یا تعاملات بین همسایگان. همانطور که در نتایج نشان داده شده است، ساخت یک مدل خطی، مانند ht-index، CRG و FD، برای گنجاندن همه این عوامل به طور همزمان، کار دشواری است. از این رو، با استفاده از قدرت مدلهای GCN، دادههای غیرخطی مؤثر را میتوان توسط نورونهای محاسباتی متعدد نشان داد. یادگیری عمیق به دلیل غیرقابل توضیح بودن آن مورد انتقاد قرار گرفته است و به عنوان یک “جعبه سیاه” تلقی می شود. با این حال، اساسا یک تابع غیر خطی است که با چندین معادله رگرسیون خطی لایه به لایه ادغام شده است [35 ]، که در آن نورون های پنهان آن متغیرهای توابع رگرسیون و پارامترها ضرایب آموخته شده هستند. نورون های سازمان یافته ساختاری همچنین توانایی یادگیری خوبی برای ویژگی های فضایی در مقیاس های سلسله مراتبی مختلف حفظ می کنند. این ایده در راستای عملیات تبدیل فوریه گراف (یعنی سیگنال های گراف به سیگنال های سلسله مراتبی با فرکانس های مختلف تجزیه می شوند) است که توسط لایه های GCN پیاده سازی شده است. معرفی شده توسط مدل DCGNN، لایههای GCN سازمانیافته سلسله مراتبی و لایه مرتبسازی همراه با لایههای کانولوشنال سنتی نیز به خوبی این نقص را برطرف میکنند که مدلهای GCN قبلی نمیتوانند مجموعههای داده ناهمگن [ 46 ، 48 ]، مانند توزیعهای ساختمان را متمایز کنند.
انواع فراکتال مصنوعی معرفی شده توسط تئوری های فراکتال نیز امکان نمونه های نامحدود را در فرآیند آموزش فراهم می کند. در تعریف دوم فراکتال ها، نشان داده شده است که می توان انواع فراکتال را با برچسب ها با توجه به پیچیدگی فراکتالی آنها ترکیب کرد و مدل یادگیری عمیق آموزش دیده برای کمی کردن پیچیدگی توزیع های ساختمان به خوبی عمل می کند. توجه داشته باشید، در زمینه مقیاس های مختلف، گروه های ویژگی چند ضلعی مربوطه نیز باید تطبیق داده شوند. به عنوان مثال، اگر تمام ردپاهای ساختمان برای نشان دادن یک شهر در نظر گرفته شود، GFI بزرگ خواهد بود و تفاوت زیادی بین شهرها وجود ندارد. بدیهی است که ساختمان ها از نظر مساحت و مسافت در هر شهر در مقیاس شهری متنوع هستند. اما به جای ویژگی های ساختمان، بلوک های خیابان ممکن است کاندیدای بهتری باشند. در همین حال، از آنجایی که مجموعه داده مصنوعی توسط یک مفهوم کاملاً ریاضی از الگوهای فراکتال تولید می شود، برای مثال فرش Sierpinski، مدل به اندازه کافی کلی است به طوری که مستقل از هر سناریو جغرافیایی خاص است، که بیشتر توانایی تعمیم مدل را به یک به میزان زیادی چنین استراتژی، معضلات مربوط به دشواری در دستیابی به داده ها و توانایی تعمیم مدل را برای اکثر مدل های داده محور، که مورد انتقاد قرار گرفته و به عنوان یک گلوگاه در نظر گرفته شده اند، کاهش می دهد، یا اساساً از آن اجتناب می کند. این مدل به اندازه کافی کلی است به طوری که مستقل از هر سناریو جغرافیایی خاص است، که بیشتر توانایی تعمیم مدل را تا حد زیادی تضمین می کند. چنین استراتژی، معضلات مربوط به دشواری در دستیابی به داده ها و توانایی تعمیم مدل را برای اکثر مدل های داده محور، که مورد انتقاد قرار گرفته و به عنوان یک گلوگاه در نظر گرفته شده اند، کاهش می دهد، یا اساساً از آن اجتناب می کند. این مدل به اندازه کافی کلی است به طوری که مستقل از هر سناریو جغرافیایی خاص است، که بیشتر توانایی تعمیم مدل را تا حد زیادی تضمین می کند. چنین استراتژی، معضلات مربوط به دشواری در دستیابی به داده ها و توانایی تعمیم مدل را برای اکثر مدل های داده محور، که مورد انتقاد قرار گرفته و به عنوان یک گلوگاه در نظر گرفته شده اند، کاهش می دهد، یا اساساً از آن اجتناب می کند.58 ]. این در راستای این پیشنهاد است که شایسته است که الگوهای تولید شده نظری و ریاضی را با علم داده محور پیوند دهیم، به ویژه تحت پارادایم چهارم GIScience [ 59 ].
از نقطه نظر برنامه ریزی شهری عملی، این روش و همچنین ابزاری با کاربرد آسان در آینده می تواند به عنوان مثال برای مشاهده چگونگی ارتباط محیط های مختلف موجود با رفاه و سلامت مردم استفاده شود [ 60 ، 61 ]، یا اگر برخی از الگوها پیامدهایی برای جریان ترافیک، خطرات آتش سوزی و خدمات اضطراری نور آبی داشته باشند [ 62 ، 63 ]. این پتانسیل را دارد که به سناریوهای برنامه ریزی آینده با استفاده از رویکردهای مدل سازی what-if و VR کمک کند [ 64]. آن کاربردهای بالقوه با ویژگیهای ثمربخش یا با ابعاد بالا نیز میتواند به عنوان سیگنال فضایی در مدل GFI برای نشان دادن پیچیدگی الگوهای کشفشده و همچنین درک بهتر آنها نامزد شود. به عنوان مثال، تحت بافت شهری سه بعدی، همراه با ویژگی های اجزای انسانی، مانند تراکم جمعیت، طبقه ساختمان ها و کاربری زمین، GFI ممکن است ترسیم الگوهای توسعه اجتماعی-اقتصادی را تسهیل کند. مطالعه اخیر سوئدی توسط Amcoff [ 65 ، 66]، به عنوان مثال، اشاره می کند که استراتژی 50 ساله مسکن با درآمد مختلط در یک محله از نظر مبارزه با جداسازی نتیجه بسیار کمی داشته است. در عوض، شکل شهری و ارتباط بین بخشهای شهری شاخصهای بهتری برای تفکیک به نظر میرسد. از این رو رویکرد GFI ممکن است به عنوان یک ابزار ارزشمند برای توصیف چنین الگوهایی عمل کند. GFI علاوه بر چارچوب محاسباتی خود، همچنین امکانات جدیدی را برای اندازه گیری پیچیدگی در سناریوهای دیگر، به ویژه نسبت به اهداف فضایی، مانند پوشش زمین و آب و هوای شهری، یا حتی محتوای مرتبط با پزشکی، مانند تشخیص تومورها، باز می کند. علاوه بر این، برنامههای کاربردی متنوع ممکن است ویژگیهای جالب دیگری و حتی الگوهای فراکتال مناسب را به همراه داشته باشد.
7. نتیجه گیری
در این مطالعه، یک شاخص فراکتالیته مبتنی بر نمودار، GFI، بر اساس ترکیبی از نظریههای فراکتال و تکنیکهای یادگیری عمیق برای ارزشگذاری یا اندازهگیری پیچیدگی ویژگیهای فضایی، مانند ردپای ساختمان در یک منطقه معین، پیشنهاد شده است. آزمایشهای روی ردپای ساختمان، امکانسنجی این شاخص را برای متمایز کردن الگوهای پیچیده و همچنین نشان دادن کاستیهای شاخصهای قبلی، مانند بعد فراکتال، شاخص ht و CRG نشان دادهاند. ترکیب انواع فراکتال به شیوه ای سیستماتیک بر اساس تعریف دوم فراکتال ها همچنین به نظر می رسد تضمین کند که یادگیری عمیق آموزش دیده عینی است و تحت تأثیر سوگیری های بالقوه در مجموعه داده های آموزشی انتخاب شده تجربی قرار نمی گیرد. با استفاده از مفاهیم فراکتال، پیچیدگی فضایی را می توان تخمین زد و معیاری برای درک و مقایسه تنظیمات مختلف منطقه فراهم می کند. در این زمینه، مسئله پیچیدگی فضایی را می توان به مسئله کسری فضایی منتقل کرد. استفاده از GFI برای مطالعه پیچیدگی فضایی در محیط زندگی ما پتانسیل ارزیابی، حفظ و اصلاح توسعه انسانی پایدار و انعطاف پذیر را دارد. کاوش آینده ترکیبی از الگوهای مختلف فراکتال و الگوریتمهای یادگیری ماشینی در زمینههای مختلف موضوعی امیدوارکننده برای دانشگاه و صنعت خواهد بود و در کار آینده ما مورد توجه است.
بدون دیدگاه