1. مقدمه
شهر محصول جامعه انسانی در مرحله معینی از توسعه است. این یک سیستم باز، پیچیده و غول پیکر است [ 1 ]. اجزای مختلف شهرها به شکلها و شیوههای متفاوتی با یکدیگر تعامل دارند تا ساختارهای شهری مختلف از جمله ساختارهای اقتصادی، اجتماعی و فضایی را شکل دهند. ساختار فضایی به پیکربندی و توزیع امکانات در مناطق مختلف یک شهر اشاره دارد [ 2 ]. با ادامه رشد شهرها، ساختارهای فضایی آنها متنوع تر و پیچیده تر می شود [ 3 ]. طرح های برنامه ریزی توسعه یافته در روزهای اولیه شهر دیگر معقول نیستند. این امر منجر به مسائلی مانند تراکم ترافیک، تخریب محیط زیست، کمبود مسکن و تاخیر اضطراری شده است [ 4 ]]. به منظور حل مشکلات توسعه شهری، بهینه سازی چیدمان فضای شهری و بهبود بهره برداری کامل از منابع فضایی، تدوین مجدد طرح شهرسازی معقول ضروری است. در فرآیند تدوین برنامه برنامه ریزی شهری، وظیفه اصلی تعیین پهنه بندی عملکردی شهر است.
در اصل، شناسایی نواحی عملکردی شهری عمدتاً به بررسی ها و آمار متکی بود. با این حال، این به طور بالقوه ذهنی، محدود شده توسط آمار، و ناکارآمد است [ 5 ]. بنابراین، برخی از مطالعات به سمت استفاده از تصاویر سنجش از دور با وضوح بالا رفتند. این می تواند به طور دقیق ویژگی های سطح فیزیکی، مانند شکل، بافت و طیف را ثبت کند [ 6 ، 7 ، 8 ]. با این حال، این روش از دقت پایین و ارز داده ضعیف رنج می برد. علاوه بر این، مناطق عملکردی تحت تأثیر فعالیت های اجتماعی و اقتصادی انسان قرار می گیرند و تنها ویژگی های طبیعی را می توان از تصاویر سنجش از دور استخراج کرد. برای حل این مسائل، مفاهیم «ادراک اجتماعی» [ 9 ] و «محاسبات شهری» [ 10 ]] برای اندازه گیری فعالیت های اجتماعی و اقتصادی در فضای شهری به کار گرفته شده اند.
با توسعه حسگرها و فنآوری جمعآوری دادهها، حجم عظیمی از دادهها برای مطالعه محیط اجتماعی-اقتصادی و کشف الگوهای تعامل در عملکردهای شهری در دسترس قرار گرفتهاند. روشهای رایجتر برای شناسایی مناطق عملکردی شهری عمدتاً از نقاط مورد علاقه (POIs) [ 11 ، 12 ، 13 ، 14 ، 15 ]، رسانههای اجتماعی [ 16 ، 17 ، 18 ، 19 ، 20 ] و مسیرهای وسیله نقلیه [22،2] استفاده میکنند . ، 23 ، 24]. بنابراین، انواع مختلف دادههای بزرگ، کشف توزیع مناطق عملکردی شهری را به روشهایی که قبلاً امکانپذیر نبودند، ممکن کردهاند. هلدر تیاگو [ 19 ] از داده های عکس از رسانه های اجتماعی برای تأیید همبستگی بین فعالیت های گردشگری و توزیع عملکردی شهرها استفاده کرد. Xue [ 20 ] از عکسهای Tencent Street View برای تحلیل مسیرهای عابر پیاده و تحقیقات پیشرفته در شناسایی مناطق شهری کاربردی استفاده کرد. چن [ 21] از داده های GPS تاکسی برای شناسایی مناطق عملکردی شهر با تجزیه و تحلیل الگوهای حرکتی آنها استفاده کرد. با این حال، شناسایی مناطق عملکردی با استفاده از دادههای رسانههای اجتماعی و دادههای مسیر خودرو، تنها از فراوانی نقاط داده آنها به عنوان معیاری برای تعیین نوع منطقه کاربردی استفاده میکند و همبستگی فضایی درون مناطق شهری را در نظر نمیگیرد.
در میان منابع دادهای غنی در بالا، دادههای POI، امکانات، مؤسسات و مکانهای جغرافیایی در سطح شهر هستند که نزدیک به زندگی افراد مرتبط هستند که به عنوان موجودیتهای جغرافیایی نقطهای با اطلاعات مکانی و معنایی انتزاع میشوند. داده های POI را می توان برای مطالعه همبستگی فضایی و تعامل فضایی در شهرها استفاده کرد. به این دلیل است که پیکربندی POI در مناطق عملکردی مختلف متفاوت است. به عنوان مثال، مناطق صنعتی دارای شرکت ها، کارخانه ها و برخی زیرساخت ها مانند پارک ها، رستوران ها و مغازه ها هستند. داده های POI نیز با قابلیت دسترسی و ارائه مشخص می شوند. بنابراین، داده های POI به طور گسترده در شناسایی مناطق کاربردی شهری استفاده می شود. ما همچنین از داده های POI برای تحقیق خود استفاده کردیم.
در روزهای اولیه، شناسایی منطقه عملکردی شهری مبتنی بر POI بر تجزیه و تحلیل تعداد و تراکم انواع مختلف POI در واحدهای شهری اساسی متمرکز بود. به عنوان مثال، هو و همکاران. [ 11 ] از اطلاعات چگالی POI 250 متر مربعی برای شناسایی مناطق عملکردی در گوانگژو استفاده کرد. یوان و همکاران [ 12 ] دادههای POI را با استفاده از یک مدل موضوع احتمالی برای فعال کردن شناسایی ناحیه عملکردی در پکن استخراج کرد. یی و همکاران [ 13 ] داده های POI را به صورت کمی تجزیه و تحلیل کرد و از روش آزمون دقیق فیشر برای شناسایی مناطق عملکردی شهری استفاده کرد. گائو و همکاران [ 14] از فناوری مدلسازی موضوعی تخصیص دیریکله پنهان (LDA) برای استخراج POI و دادههای رسانههای اجتماعی برای دستیابی به همان هدف استفاده کرد. آنها با این واقعیت محدود می شوند که توابع فقط با توجه به فرکانس POI تعیین می شوند. این منجر به هدر رفتن بسیاری از اطلاعات مکانی POI می شود. این روش نمی تواند توضیح دهد که نقاط درون یک فضا با محیط اطرافشان تعریف می شوند و قانون اول جغرافیا را نقض می کنند [ 25 ]. بنابراین، دقت آنها باید بیشتر بهبود یابد.
برای حل مشکلات فوق، یائو و همکاران. [ 26 ] روشی را پیشنهاد کرد که مدل زبان، Word2vec و داده های POI را ترکیب می کند. کوتاه ترین توالی فاصله بین تمام POI ها در هر واحد تحقیقاتی مستقل و پایه برای ساخت مجموعه داده های آموزشی استفاده شد. سپس بردارهای ویژگی منطقه ای به دست آمد که امکان شناسایی مناطق عملکردی شهری را فراهم کرد. وو و همکاران [ 27] از یک مدل یادگیری عمیق Global Vectors (GloVe) استفاده کرد که همزمانی جهانی اطلاعات را هنگام انجام شناسایی منطقه عملکردی در نظر گرفت. در اینجا، توزیع فضایی POI با توالیهای زبان طبیعی توصیف شد و مدلهای زبانی برای کمی کردن رابطه بین POI و دستههای مختلف منطقه عملکردی شهری استفاده شد. این روش ها می توانند اطلاعات معنایی نهفته و اطلاعات جغرافیایی مربوط به توزیع فضایی POI را استخراج کنند. با این حال، توالی های زبان طبیعی [ 28 ] به صورت خطی برای سازماندهی داده های POI در بسته ها استفاده شد ( شکل 1)آ). این روش سازماندهی POI به طور کامل از اطلاعات مکانی POI ها بهره برداری نمی کند. به عنوان مثال، اطلاعات POI که در یک دنباله زبان طبیعی از هم دور هستند، اما از نظر مکانی نزدیک به یکدیگر هستند، نادیده گرفته خواهند شد. علاوه بر این، در فضاهای شهری، POI ها دارای توزیع پراکنده و همبستگی قوی با جاده های اطراف هستند. همچنین ارتباطات تعاملی بین بسته های مجاور وجود دارد که به طور قابل توجهی با توالی های زبان طبیعی متفاوت است. این باعث می شود که استفاده از رابطه خطی بین POI در بسته ها به طور بالقوه مشکل ساز شود و می تواند منجر به نتایج غیرمعنی مانند تقسیم POIهای مجاور در دو طرف خیابان شود. بنابراین، استخراج ویژگیهای تعامل فضایی بین بستهها میتواند با انجام این روش تضعیف شود. نکته بسیار مهم دیگری نیز وجود دارد: این نوع رویکرد نزدیکی POI ها را بر حسب فواصل اقلیدسی اندازه گیری می کند. با این حال، در واقعیت، ساختمان هایی وجود دارند که می توانند مانع باشند. بنابراین این اندازه گیری واقعی نیست.
در این مقاله، ما یک روش شناسایی منطقه عملکردی شهری را پیشنهاد میکنیم که رابطه فضایی غیرخطی بین POIها را در نظر میگیرد. این روش نه تنها مجاورت جغرافیایی، بلکه یکپارچگی ساختاری شهری را نیز در نظر می گیرد. این می تواند به طور جامع اطلاعات مجاورت POI و اطلاعات تعامل فضایی را مطابق با سناریوهای واقع بینانه استخراج کند. مجاورت فضایی POI ابتدا بر اساس شبکه های جاده ای ایجاد می شود ( شکل 1ب). هر POI را به عنوان مرکز انتخاب کنید و اطلاعات تمام نقاط همسایه را در آستانه همسایگی شبکه جاده آن بشمارید. سپس میتوان یک ماتریس هموقوع بهبودیافته ایجاد کرد و اطلاعات هموقوع جهانی POI را استخراج کرد. پس از این، از یک مدل GloVe برای آموزش استفاده میشود تا بردارهای دستهبندی POI، که اساس بردارهای ویژگی را تشکیل میدهند، به دست آورند. سپس از K-Means++ برای خوشهبندی بردارهای ویژگی استفاده میشود و خوشههای منطقهای با سه شاخص برای تعیین دستهبندی منطقه عملکردی شهری ارزیابی میشوند.
2. منطقه مطالعه و داده ها
منطقه مورد مطالعه شامل مناطق اصلی شهری شهر ژنگژو در چین است (یعنی مناطق زیر: Zhongyuan؛ Jinshui؛ Erqi؛ و Guancheng Huizu ( شکل 2 ). این مناطق در مجموع 801.1 کیلومتر مربع مساحت دارند . با توسعه اقتصادی عالی، ژنگژو با جمعیت زیاد مسکونی و شبکه جاده ای متراکم، شهری با پویایی زیاد است. این شهر مرکز سیاسی، اقتصادی و فرهنگی استان هنان است. در سال های اخیر، توسعه سریع شهری ساختار عملکردی مناطق اصلی شهری آن را بسیار ناهمگون کرده است. بنابراین، منطقه مورد مطالعه انواع مختلف عملکردی شهری، مانند مناطق مسکونی، علوم، امکانات آموزشی و فرهنگی، مناطق تجاری و تفریحی را در بر می گیرد.
داده های مورد استفاده در این مطالعه از نقشه تقسیم اداری شهری ژنگژو در سال 2020، داده های POI برای ژنگژو در 28 دسامبر 2021، داده های شبکه جاده از سال 2020، و داده های گرمای سیگنال تلفن همراه برای ساکنان ژنگژو در 3 ژوئن و 5 ژوئن 2020 به دست آمده است. داده های POI از طریق یک رابط برنامه نویسی کاربردی (API) ارائه شده توسط پلت فرم باز AutoNavi به دست آمد. در مجموع 216413 نقطه داده در منطقه مورد مطالعه وجود داشت. داده های شبکه جاده ای از وب سایت OpenStreetMap دانلود شد. داده های سیگنال تلفن همراه توسط China Unicom ارائه شده است. توضیحات داده های خاص در جدول 1 آورده شده است.
3. روش شناسی
از آنجایی که با در نظر گرفتن توزیع فضایی POI های شهری به عنوان یک کل می تواند به استخراج مناطق کاربردی شهری کمک کند، ما از یک مدل GloVe برای آموزش بردارهای دسته POI استفاده کردیم. روابط همروی POI باید بر اساس ساختار شهری واقعی باشد، بنابراین از شبکه جادهای برای ساخت یک ماتریس هموقوع استفاده شد. یک فلوچارت کلی برای روش پیشنهادی در شکل 3 نشان داده شده است. این پنج مرحله را پوشش می دهد: (1) ساخت قطعات (واحد تحقیقات پایه) با توجه به شبکه راه های شهری. (2) از منظری در سطح شهر، روابط مجاورت POI را بر اساس شبکه جاده ها و ایجاد یک ماتریس همزمانی ایجاد کنید. (3) از مدل GloVe برای آموزش بردارهای دسته POI استفاده کنید. (4) بردارهای ویژگی را برای هر بسته بسازید و خوشه بندی را انجام دهید. و (5) مناطق عملکردی را شناسایی و برچسب گذاری کنید. بقیه این بخش به طور مفصل این فرآیند را شرح می دهد.
3.1. ساخت بسته ها (واحدهای تحقیقاتی پایه)
در مطالعات موجود، مناطق تحقیقاتی عمدتاً بر اساس شبکههای [ 11 ]، دادههای کاداستر [ 26 ] و شبکههای راه [ 29 ] تقسیم میشوند. در روشهای شبکهای، بلوکهای شهری نامنظم به اشکال یکنواخت تبدیل میشوند که نشاندهنده کلان مورفولوژی ساختار شهری نیست. تقسیم بندی بر اساس داده های کاداستر خطر قطع اتصال بین مناطق را به همراه دارد. با این حال، تقسیم بندی بر اساس شبکه های جاده ای شهری به طور طبیعی نشان دهنده چگونگی سازماندهی واقعی شهرها است. بنابراین روش پیشنهادی از بزرگراهها، جادههای اولیه و جادههای فرعی به عنوان واحدهای تقسیم شهری استفاده میکند. مناطقی که توسط این تقسیمات تشکیل شده است به نام پارسل شناخته می شوند.
یک رویکرد مورفولوژیکی [ 30 ] برای ساخت بسته ها استفاده شد. همانطور که در شکل 4 الف نشان داده شده است، شبکه های جاده ای معمولا با جاده های چند خطی نشان داده می شوند که بر سازماندهی POI ها تأثیر می گذارد. بنابراین بهتر است شبکه های جاده ای تک خط تولید شود. این ابتدا شامل شطرنجی کردن شبکه اصلی جاده و ضخیم کردن جاده ها با استفاده از یک تابع گسترش مورفولوژیکی است که شکاف ها و فضاهای خالی بین جاده ها را پر می کند ( شکل 4 ب). سپس راه های توسعه یافته پالایش شدند و به منظور حفظ توپولوژی کلی شبکه اصلی راه، محور مرکزی هر جاده استخراج شد. این برای نشان دادن جاده استفاده شد ( شکل 4ج). در نهایت، مشها برای شبکه جادهای تک خطی برای تشکیل بستهها ساخته شدند ( شکل 4 د).
3.2. ساخت ماتریس همزمانی
توزیع انواع POI بر حسب تعداد، توزیع قانون قدرت است، به طوری که می توان از مدل های زبان طبیعی یادگیری عمیق استفاده کرد. تنها یکی از اینها GloVe است، یک مدل جاسازی کلمه که از اطلاعات آماری در سطح شهر استفاده می کند. می تواند یک فضای برداری با ابعاد بالا با تعداد کل کلمات را در یک فضای برداری پیوسته با ابعاد بسیار پایین تر جاسازی کند. سپس می توان کلمات را به بردارهایی که با اعداد نشان داده شده اند ترسیم کرد [ 31]. اطلاعات آماری مورد استفاده – فراوانی همزمان – اطلاعات بسیار مهمی در مورد ویژگیهای فضایی مناطق شهری است و به مدلسازی رابطه بین انواع POI و عملکردهای منطقه شهری کمک میکند. بنابراین مدل GloVe برای شناسایی مناطق کاربردی شهری انتخاب شد.
مدل GloVe اطلاعات آماری را در یک ماتریس همزمانی [ 32 ] ذخیره می کند. ماتریس همزمانی، ماتریسی است که از فراوانی دو رخداد همزمان دو کلمه در همه کلمات مختلف تشکیل شده است. می توان از آن برای سنجش شباهت معنایی بین کلمات بر اساس این اصل استفاده کرد که کلمات در یک زبان از نظر معنایی به همسایگان خود نزدیکتر هستند. در جغرافیا، قانون مشابهی نشان می دهد که هر چه فاصله بین دو جسم کمتر باشد، رابطه آنها نزدیکتر است (قانون اول جغرافیا) [ 25 ]. این ماتریس های همزمان را نیز برای استخراج اطلاعات معنایی POI در فضای شهری مناسب می کند.
ساخت یک ماتریس همزمانی در قلب مدل GloVe قرار دارد. مدل GloVe اصلی، ماتریس همرویداد را با لغزش روی هر جمله در پیکره (یعنی مجموعهای از متون در یک قالب مشخص [ 33 ) ساخته است.]) با استفاده از یک پنجره ثابت و شمارش تعداد دفعاتی که کلمات مختلف به طور همزمان در پنجره ظاهر می شوند. هنگام استفاده از آنها در مطالعات جغرافیایی، فواصل اقلیدسی معمولاً در گذشته برای محاسبه مجاورت بین اجسام استفاده می شد. آنها ابتدا از یک الگوریتم حریص برای مرتب کردن همه POIها در واحدهای تحقیقاتی پایه در یک دنباله از POI استفاده می کنند که کمترین فاصله را برآورده می کند. فرکانس وقوع همزمان با اشیاء همسایه سپس با لغزش روی هر دنباله POI از طریق یک پنجره ثابت به دست می آید. ماتریس همزمانی نهایی تشکیل می شود. این منطق برای تبدیل POI به اسناد متوالی از لحاظ نظری قانع کننده یا دقیق نیست. تبدیل دادههای مکانی به دادههای اسناد متوالی دارای محدودیتهایی از نظر استخراج ویژگیهای فضایی POI است. این به این دلیل است که توالی های طبیعی ذاتاً در ساختار متوالی هستند (ساختار خطی)، در حالی که POI ها در یک فضای جغرافیایی دو بعدی (ساختار غیر خطی) توزیع می شوند. این اجازه می دهد تا اطلاعات همزمان برای جفت های POI که از نظر مکان توالی POI از هم دور هستند، اما از نظر مکان مکانی نزدیک هستند، نادیده گرفته شود. به عنوان مثال، اجازه دهید دنباله POI را در نظر بگیریم: موسسات تحقیقاتی علمی، مراکز تناسب اندام، پارکینگ ها، کالج ها و دانشگاه ها، رستوران های چینی، خوابگاه ها، ورودی ها و خروجی ها. بگذارید اندازه پنجره 5 باشد. اصطلاح مرکزی کالج ها و دانشگاه ها است و اصطلاحات در طول 2 پله عبارتند از مراکز تناسب اندام، پارکینگ ها، رستوران های چینی و خوابگاه. با این حال، در واقعیت، کالجها و دانشگاهها بیشترین ارتباط را با مؤسسات تحقیقاتی علمی دارند. این امر روشن می کند که روابط مجاورت به دست آمده از این طریق ناقص و غیر واقعی هستند. افزایش اندازه پنجره تنها منجر به روابط مجاورت اضافی اضافی می شود. علاوه بر این، این رویکرد نسبت به ساخت قطعات (واحدهای تحقیقاتی پایه) کاملاً حساس است. این رویکرد فرض میکند که POIها فقط در یک منطقه مرتبط هستند، با نادیده گرفتن این واقعیت که POIهایی که در بستههای مختلف وجود دارند نیز به طور بالقوه مرتبط هستند. به عنوان مثال، وجود یک اداره امنیت عمومی و یک ایستگاه آتش نشانی در دو طرف جاده که از نظر جغرافیایی به یکدیگر نزدیک هستند، اما متعلق به دو قطعه مجاور هستند، اگر از این روش استفاده می شد، از نظر آماری مرتبط نبود. افزایش اندازه پنجره تنها منجر به روابط مجاورت اضافی اضافی می شود. علاوه بر این، این رویکرد نسبت به ساخت قطعات (واحدهای تحقیقاتی پایه) کاملاً حساس است. این رویکرد فرض میکند که POIها فقط در یک منطقه مرتبط هستند، با نادیده گرفتن این واقعیت که POIهایی که در بستههای مختلف وجود دارند نیز به طور بالقوه مرتبط هستند. به عنوان مثال، وجود یک اداره امنیت عمومی و یک ایستگاه آتش نشانی در دو طرف جاده که از نظر جغرافیایی به یکدیگر نزدیک هستند، اما متعلق به دو قطعه مجاور هستند، اگر از این روش استفاده می شد، از نظر آماری مرتبط نبود. افزایش اندازه پنجره تنها منجر به روابط مجاورت اضافی اضافی می شود. علاوه بر این، این رویکرد نسبت به ساخت قطعات (واحدهای تحقیقاتی پایه) کاملاً حساس است. این رویکرد فرض میکند که POIها فقط در یک منطقه مرتبط هستند، با نادیده گرفتن این واقعیت که POIهایی که در بستههای مختلف وجود دارند نیز به طور بالقوه مرتبط هستند. به عنوان مثال، وجود یک اداره امنیت عمومی و یک ایستگاه آتش نشانی در دو طرف جاده که از نظر جغرافیایی به یکدیگر نزدیک هستند، اما متعلق به دو قطعه مجاور هستند، اگر از این روش استفاده می شد، از نظر آماری مرتبط نبود. نادیده گرفتن این واقعیت که POI هایی که در بسته های مختلف وجود دارند نیز به طور بالقوه مرتبط هستند. به عنوان مثال، وجود یک اداره امنیت عمومی و یک ایستگاه آتش نشانی در دو طرف جاده که از نظر جغرافیایی به یکدیگر نزدیک هستند، اما متعلق به دو قطعه مجاور هستند، اگر از این روش استفاده می شد، از نظر آماری مرتبط نبود. نادیده گرفتن این واقعیت که POI هایی که در بسته های مختلف وجود دارند نیز به طور بالقوه مرتبط هستند. به عنوان مثال، وجود یک اداره امنیت عمومی و یک ایستگاه آتش نشانی در دو طرف جاده که از نظر جغرافیایی به یکدیگر نزدیک هستند، اما متعلق به دو قطعه مجاور هستند، اگر از این روش استفاده می شد، از نظر آماری مرتبط نبود.
در این مقاله، با توجه به اینکه POIها از نظر جغرافیایی توزیع شده اند، بر خلاف توزیع متوالی کلمات در اسناد، دیگر از روش اصلی ساخت ماتریس همزمانی استفاده نمی شود. علاوه بر این، به منظور کشف رابطه غیرخطی مکان و اطلاعات تعامل فضایی POI در فضای جغرافیایی، ما دیگر به بستهها تکیه نمیکنیم، بلکه دیدگاهی در سطح شهر داریم. ما متوجه شدیم که امکانات شهری معمولاً در امتداد کنارههای جادهها در دنیای واقعی چیده میشوند و حرکت فیزیکی در فضای شهری معمولاً توسط شبکه جادهها محدود میشود ( شکل 5 ). به عنوان مثال، راه رفتن از نقطه A به نقطه B در شکل 5، از آنجایی که در دو طرف جاده ساختمان هایی وجود دارد که موانعی ایجاد می کنند، نمی توانیم از خط قرمز (خط مستقیمی که از دو نقطه تشکیل شده است) راه برویم، فقط می توانیم در امتداد خط آبی (جاده) قدم برداریم. بنابراین می توان از شبکه جاده برای استخراج روابط همسایگی بین POI ها و ساخت یک ماتریس همزمانی استفاده کرد. روابط مجاورتی که توسط این روش استخراج میشود، نه تنها به واقعیت نزدیکتر، بلکه جامعتر نیز هستند. این روش به هیچ یک از سه وضعیت زیر منتج نمیشود: (1) اطلاعات جفتهای POI که در دنیای واقعی از هم دور هستند به اشتباه شمارش میشوند، زیرا آنها در یک بسته هستند و نقاط POI روی بسته کم هستند. (2) به دلیل محدودیت های بسته، اطلاعات مربوط به جفت های POI که در واقع نزدیک هستند نادیده گرفته می شود. (3) جفت های POI در یک بسته قرار دارند و در دنیای واقعی به یکدیگر نزدیک هستند. با این حال، به دلیل تعداد پنجره های تنظیم شده، اطلاعات مجاورت آنها محاسبه نمی شود.
برای به دست آوردن اطلاعات کافی، دسته بندی های کوچک POI بهتر است برای ساخت مجموعه داده آموزشی استفاده شوند. ماتریس همزمانی را می توان به صورت زیر بدست آورد:
-
شبکه جاده را به صورت نموداری انتزاع کنید، G = (N, E)، که در آن E مجموعه تمام جاده ها (مجموعه لبه) است، و N نشان دهنده تقاطع آنها (مجموعه گره) است.
-
از روش جستجوی نزدیکترین همسایه برای نگاشت موجودیت های جغرافیایی در لبه های شبکه جاده ها استفاده کنید و این موجودیت ها را به شکل یک تاپل نمایش دهید. ه، (پoس1، پoس2)〉، جایی که: e نزدیکترین همسایه هر موجود جغرافیایی است که از نقطه شروع و نقطه پایان هر یال کار می کند. پoس1نشان دهنده فاصله بین نقطه پیش بینی شده موجودیت جغرافیایی و نقطه شروع e است . و پoس2نشان دهنده فاصله بین نقطه پیش بینی شده موجودیت جغرافیایی و نقطه پایانی e است. بنابراین، موجودیت جغرافیایی D1در شکل 6 می توان به صورت 〈 (n1، n2)، 4.2، 2.1〉؛
-
جستجوی نزدیکترین همسایه را با توجه به محدودیت های شبکه جاده برای هر موجود جغرافیایی انجام دهید تا یک مجموعه نقطه همسایه را با تعیین آستانه فاصله بدست آورید. برای موجودیت جغرافیایی D1در شکل 6 ، مجموعه نقاط همسایه برابر است با ( ب1، سی1، سی2، آ1)
-
یک ماتریس همزمانی n × n بسازید، ایکس، که در آن n تعداد کل دسته های POI است. ارزش هر عنصر، ایکسمنj( i و j مقوله ها هستند)، در ماتریس با توجه به مجموعه نقاط همسایه به روز می شود. بنابراین، بر اساس مجموعه نقطه همسایه از D1، لازم است 1، 1، 2 در را اضافه کنید ایکسDآ، ایکسDبو ایکسDسی، به ترتیب. نتایج در جدول 2 نشان داده شده است.
آستانه فاصله نقطه همسایه را می توان با محاسبه مقدار متوسط فاصله شبکه بین هر موجود جغرافیایی و نزدیکترین موجودیت جغرافیایی همسایه به دست آورد [ 34 ، 35 ]. مقدار محاسبه شده در این مطالعه 150 متر بود.
3.3. ساخت وکتور دسته POI
نمایش ویژگی های منطقه ای به آموزش بردارهای دسته POI با استفاده از ماتریس همزمانی بستگی دارد. ماتریس همروی POI X است ، با عنصر X ij فراوانی همروی POI در دسته i و دسته j در بافت فضایی آنها. ایکسمن=∑کایکسمنکفراوانی وقوع همزمان هر دسته POI و دسته i است. پمن،j=پ(j|من)=ایکسمنj/ایکسمناین احتمال وجود دارد که دسته j در بافت فضایی دسته i ظاهر شود. هنگام آموزش بردارهای دسته POI، نسبت احتمال همزمانی بهتر از خود احتمال وقوع همزمان می تواند همبستگی بین دسته های POI را اندازه گیری کند. این کمک می کند تا دسته بندی های مختلف POI را متمایز کنید و به طور دقیق ویژگی های معنایی POI های مختلف را بیان کنید. با در نظر گرفتن یک مثال، اجازه دهید دستههای POI کوچک شامل کالجها و دانشگاهها، کتابخانهها، سوپرمارکتها، رستورانهای چینی، واحدهای شیمیایی متالورژی، پارکهای صنعتی و غیره باشند، و اجازه دهید i = کالجها و دانشگاهها، j = واحدهای شیمیایی متالورژی، و k= سایر دسته های POI. کتابخانهها در فضاهای شهری معمولاً نزدیک به کالجها و دانشگاهها هستند، در حالی که رابطه مجاورت بین کتابخانهها و واحدهای شیمیایی متالورژی ضعیف است. وقتی k = کتابخانه ها، مقدار پمن،ک/پj،کبزرگ خواهد بود. پارکهای صنعتی و دانشگاهها رابطه نزدیکی ضعیفتری دارند، در حالی که پارکهای صنعتی رابطه نزدیکی قویتری با واحدهای شیمیایی متالورژی دارند. وقتی k = پارک های صنعتی، مقدار پمن،ک/پj،ککوچک خواهد بود. علاوه بر این، سوپرمارکت هایی وجود دارد که در نزدیکی واحدهای شیمیایی متالورژی و دانشگاه ها توزیع شده اند. بنابراین، زمانی که k = سوپرمارکت ها، ارزش پمن،ک/پj،کنزدیک به 1 خواهد بود.
اگر POIها با استفاده از رویکرد خطی تشریح شده در بخش 3.2 سازماندهی شوند ، نسبتهای احتمال وقوع همزمان همبستگی امکانات شهری دنیای واقعی را نادرست نشان میدهد. به عنوان مثال، دو حالت زیر ممکن است رخ دهد: (1) از آنجایی که واحدهای شیمیایی متالورژی و مناطق پارک صنعتی به قطعات مختلف تعلق دارند. وقوع همزمان آنها محاسبه نمی شود و در نتیجه احتمال وقوع همزمان آنها کم است. (2) در مناطق حومه شهر با بسته های بزرگتر، کالج ها و دانشگاه ها ممکن است در همان محدوده پارک صنعتی باشند. این به اشتباه باعث میشود که آنها بیشتر اتفاق بیفتند و منجر به احتمال همزمانی بالاتر میشود. این دو مورد ارزش پمن،ک/پj،کدر عوض زمانی که k = پارک صنعتی بزرگتر است. این نسبت نشان دهنده همبستگی بیشتر بین شهرک صنعتی و مؤسسات آموزش عالی برخلاف واقعیت است.
با استفاده از سازماندهی غیرخطی POI ها در این مقاله، این دو حالت رخ نمی دهد. اگرچه واحدهای شیمیایی متالورژی و شهرکهای صنعتی در بستههای مختلف قرار دارند، اما به دلیل اینکه فاصله شبکه جادهای کمتر از آستانه است، شمارش همزمان آنها محاسبه میشود. دانشگاه ها و شهرک های صنعتی در یک قطعه قرار دارند، اما فاصله شبکه جاده ای آنها بیشتر است. شمارش همزمان آنها محاسبه نخواهد شد. سازماندهی غیرخطی POI در این مقاله، نسبتهای احتمال همزمانی را قادر میسازد تا به درستی همبستگی بین انواع POI را منعکس کنند.
از وضعیت مثال بالا، یک مدل تعمیم یافته از تابع ضرر برای مدل GloVe را می توان به صورت زیر بیان کرد:
جایی که، vمن، vj، و vکبردارهای ویژگی را برای دسته های POI i , j و k به ترتیب نشان می دهد. اگر عملیات نمایی برای (vمن-vj)تیvک، تابع ضرر تبدیل می شود:
برای ساده نگه داشتن مدل تابع ضرر تا حد امکان، این معادله باید ساده شود. انجام این کار مستلزم حفظ صورت و مخرج در دو طرف معادله با یکدیگر و حفظ تقارن در سمت راست است. بنابراین، شرایط انحراف بمنو بjباید در سمت چپ معادله اضافه شود:
بر اساس این اصل که هرچه فراوانی همزمانی دستههای POI بیشتر باشد، وزن بیشتر است، یک عبارت وزنی باید به تابع هزینه اضافه شود:
از آنجایی که ماتریس همزمانی یک ماتریس پراکنده است، لازم است مقدار تابع ضرر را زمانی که ایکسمن،j=0، برای اطمینان از اینکه وزن به طور قابل توجهی افزایش یا کاهش نمی یابد زمانی که فرکانس وقوع همزمان خیلی زیاد یا خیلی کوچک است. بنابراین تابع وزن باید به صورت زیر باشد:
به این دلیل که تعداد انواع POI کمتر از تعداد کلمات در فضای معنایی و فراوانی همزمانی بیشتر از تعداد همروی کلمات در فضای معنایی است. این ایکسمترآایکسمقدار در این مقاله باید بالاتر از مقدار 100 در مدل اصلی تنظیم شود که در نهایت پس از آزمایش های متعدد روی 400 تنظیم شد.
ابعاد بردارهای دسته POI پارامترهای کلیدی در مدل GloVe هستند. از آنجایی که تعداد دسته های POI به اندازه تعداد کلمات یک فضای معنایی نیست، ابعاد بردارهای دسته POI را می توان روی 70 تنظیم کرد ( جدول 3 ). برای تجزیه و تحلیل توزیع فضایی بردارهای دسته POI 70 بعدی، یک فناوری کاهش ابعاد داده، t-SNE، برای استخراج اطلاعات از دادههای ابعاد بالاتر استفاده شد. t-SNE تمام بردارهای دسته POI را در یک فضای معنایی سه بعدی، همانطور که در شکل 7 نشان داده شده است، نگاشت می کند. پس از کاهش ابعاد، دستههای POI با اطلاعات معنایی مکانی مشابه یا مرتبط به یکدیگر نزدیکتر خواهند شد. با نگاهی به مثال شکل 7الف، دسته بندی های POI مختلفی از جمله سازمان های دولتی، امکانات پزشکی و مراقبت های بهداشتی و امکانات ورزشی و تفریحی وجود دارد. این نوع منابع معمولاً در مناطق خدمات عمومی و مدیریت یک شهر قرار دارند. به طور خاص، از آنجایی که China Telecom و China Mobile شرکتهای مخابراتی با نقش یکسان در فضای شهری هستند، شعب آنها تقریباً در فضای معنایی سه بعدی همپوشانی دارند. دسته بندی های بزرگ POI در شکل 7ب شامل خدمات پذیرایی، خدمات خرید و امکانات عمومی می باشد. در سطح دستههای کوچکتر، سرویسهای بهداشتی، مکانهای غذاخوری معمولی، فروشگاههای Suning و فروشگاههای Gome همگی با هم در مراکز خرید ظاهر میشوند، جایی که نقش مشابهی در رفع نیازهای مردم برای اوقات فراغت و سرگرمی دارند. این نوع نگرانی های دقیق و ظریف است که استفاده از دسته بندی های کوچکتر POI را توجیه می کند.
3.4. بیان ویژگی های منطقه ای و خوشه بندی
برای اندازه گیری دقیق شباهت مناطق مختلف شهری، لازم است بردارهای ویژگی منطقه ای ساخته شوند. ویژگیهای منطقهای در این مطالعه در مقیاس پارسل ساخته شدهاند، بنابراین همه POI در هر بسته باید بهدست میآمدند. سپس از طریق خوشه بندی خوشه های عملکردی مختلف به دست آمد.
مطالعات قبلی از میانگین وزنی تمام بردارهای کلمه در یک متن برای اندازه گیری شباهت استفاده کرده اند [ 36 ، 37 ]. در اینجا، بردارهای دسته POI به دست آمده از طریق مدل GloVe در ابتدا به عنوان بردار کلمه در نظر گرفته شدند، با دسته بندی های POI در هر بسته به عنوان متن در نظر گرفته شد. سپس میانگین وزنی بردارهای کلمه برای به دست آوردن بردار ویژگی برای هر بسته محاسبه شد:
جایی که پآrجهلvهجمننشان دهنده بردار ویژگی i -امین بسته است. N تعداد کل POI در بسته است. و پمن،jبردار POI دسته j در بسته i -ام است.
پس از به دست آوردن بردارهای ویژگی Parcel، آنها با استفاده از الگوریتم K-means اصلاح شده، K-means++ خوشه بندی شدند. هنگام راهاندازی مراکز خوشه، آنها تا حد امکان دور از یکدیگر قرار گرفتند تا به یک راهحل بهینه جهانی دست یابند. پارامتر قبلی، K ، در یک الگوریتم K-means++، اثر خوشهبندی را تعیین میکند. برای انتخاب عینی مقدار K از روشهای ضریب آرنج و شبح استفاده شد . شاخص کلیدی در روش زانویی مجموع خطاهای مربعی (SSE) است. با افزایش K ، SSE ابتدا به شدت کاهش یافت، سپس صاف شد ( شکل 8 a). رابطه بین مقادیر K و SSE به شکل یک آرنج است که آرنج در آن قرار داردK = 5. در روش ضریب silhouette، هر چه مقدار بزرگتر باشد، اثر خوشه بندی بهتر است. همانطور که در شکل 8 ب نشان داده شده است، مقدار در K = 5 در بزرگترین مقدار بود. بنابراین، در این مطالعه، K = 5 به عنوان تعداد بهینه خوشه انتخاب شد.
3.5. شناسایی نواحی کاربردی شهری
پس از به دست آوردن خوشههای منطقهای با کارکردهای مشابه با خوشهبندی، باید یک معنای مکانی واقعی به هر یک از آنها نسبت داد تا مناطق عملکردی شناسایی شوند. روش های زیادی برای طبقه بندی مناطق کاربردی شهری وجود دارد. در اینجا، ما چشم انداز زندگی روزمره و فعالیت های اجتماعی مردم را در نظر گرفتیم. بنابراین، مناطق عملکردی شامل مواردی مانند مناطق تجاری، مناطق مسکونی، مناطق خدمات عمومی، مناطق صنعتی و نقاط دیدنی [ 38 ، 39 ] است. داده های موجود برای برچسب گذاری هر خوشه منطقه ای با توجه به سه شاخص زیر استفاده شد:
(1) نسبت دسته. چگالی فرکانس (FD) و نسبت دسته (CR) هر دسته POI بزرگ در هر خوشه منطقه ای برای به دست آوردن توزیع هر POI در خوشه های منطقه ای مختلف محاسبه شد. این با استفاده از موارد زیر اجرا شد:
جایی که i رده POI است. nمنتعداد رده POI i در خوشه منطقه ای است. نمنتعداد کل دسته POI i است . افDمنچگالی فرکانس دسته POI i در خوشه منطقه ای است. و سیآرمننشان دهنده نسبت چگالی فرکانس دسته POI i در خوشه منطقه ای به تمام POI ها است.
(2) عامل غنی سازی. از آنجایی که دسته بندی های POI خاصی اغلب در فضاهای شهری رخ می دهند، FD و CR از POI ها نمی توانند به طور کامل ویژگی های خوشه های منطقه ای را منعکس کنند. بنابراین لازم است برای هر دسته از POI یک ضریب غنی سازی (EF) اضافه شود. این را می توان به صورت زیر محاسبه کرد:
جایی که Eافمنjنشان دهنده EF دسته j POIs در i -امین خوشه منطقه ای است. نمنjتعداد POI های دسته j را در i -امین خوشه منطقه ای نشان می دهد. نمننشان دهنده تعداد تمام POI ها در i -امین خوشه منطقه ای است. نjتعداد POI های دسته j در کل منطقه مورد مطالعه است. و N نشان دهنده تعداد کل POI در منطقه مورد مطالعه است.
(3) ارزش گرمایی جمعیت. فعالیت های انسانی ارتباط تنگاتنگی با ساختار فضایی شهرها دارد. تغییر ویژگی های فعالیت فردی در شهر می تواند منعکس کننده عملکردهای شهری انجام شده توسط منطقه مورد مطالعه باشد. ارزش گرمایی جمعیت نشان دهنده تعداد افراد فعال در یک منطقه است که مبنایی برای تجزیه و تحلیل رفتار انسان است. مطالعه تغییرات آن در طول زمان می تواند به برچسب گذاری خوشه های مناطق به دست آمده پس از خوشه بندی کمک کند. می تواند خطاهای ناشی از برچسب گذاری مناطق عملکردی را فقط با استفاده از مقادیر EF و CR POI جبران کند و ماهیت علمی و منطقی را افزایش دهد. در منطقه تحت پوشش هر خوشه منطقه ای، مقادیر گرمایی جمعیت به صورت آماری برای 24 دوره زمانی در روزهای هفته و روزهای استراحت تجزیه و تحلیل می شود. نتایج می تواند منعکس کننده ویژگی های تجمع و توزیع جمعیت در دوره های زمانی مختلف باشد. هر چه این مقدار بیشتر باشد، تجمع جمعیت محلی در آن دوره بیشتر است و بالعکس. به عنوان مثال، در ساعات اوج صبح و عصر در روزهای کاری، تجمع در مناطق مسکونی بسیار زیاد بود. ارزش بالاتر از سایر دوره های زمانی بود.
4. نتایج
4.1. شناسایی منطقه عملکردی
روش پیشنهادی برای به دست آوردن نتایج خوشه بندی عملکردی برای 1017 بسته در شهر ژنگژو استفاده شد ( شکل 9 ). مقادیر CR و EF برای هر دسته POI در هر خوشه منطقه ای نیز به دست آمد ( جدول 4 )، همراه با مقادیر گرمای جمعیت برای یک روز کاری و یک آخر هفته ( شکل 10 و شکل 11 ). سپس خوشه های منطقه ای برچسب گذاری شدند و نتایج شناسایی تجزیه و تحلیل شدند:
از تجزیه و تحلیل مقادیر CR و EF POI، در مقایسه با سایر مناطق به صورت افقی، می توان دریافت که ارزش CR POI مسکونی تجاری در این خوشه منطقه ای بالاترین است. مقایسه طولی نشان می دهد که انواع مختلف POI به طور مساوی توزیع شده اند. این در راستای ویژگیهای توزیع فضایی مناطق مسکونی است که توسط پزشکی، ورزشی و تفریحی، اقامتی، رستورانها، خرید، مدارس و سایر زیرساختهایی که به ساکنان خدمات ارائه میکنند احاطه شدهاند. با نگاهی به مقادیر گرمایی جمعیت، از آنجایی که مناطق مسکونی مناطق اصلی را تشکیل میدهند که مردم در آن زندگی میکنند، ارزش کلی گرمای آنها بیشتر از سایر مناطق بود. در ساعات رفت و آمد بین 7:00 و 9:00 و 17:00 و 19:00 در روزهای هفته، ارزش گرما به ویژه بالا بود. در تعطیلات آخر هفته،
- (2)
-
سی1: حوزه های علم، آموزش و خدمات عمومی
ارزش CR POI نشان می دهد که مکان های علمی، آموزشی و فرهنگی متعددی در این خوشه منطقه ای وجود دارد، مانند دانشگاه ژنگژو، دانشگاه فناوری هنان، دانشگاه طب سنتی چینی هنان، و غیره. در عین حال، امکانات حمل و نقل، ورزشی و مکان های تفریحی، رستوران ها و خرید نیز ارزش بالایی دارند. با توزیع فضایی زیرساخت های اطراف مدرسه که نیازهای خرید، غذاخوری، ورزش و ترافیک دانش آموزان و اساتید مدرسه را برآورده می کند، سازگار است. ارزش گرمایی در این منطقه در طول روز از ساعت 8:00 تا 18:00 در روزهای هفته بالا بود و در ساعت 12:00 به اوج خود رسید که با آنچه در مورد رفتار روزانه دانش آموزان شناخته شده است موافق است. در آخر هفته، ارزش گرما به طور قابل توجهی کمتر بود.
- (3)
-
سی2: مناطق تجاری
مقادیر CR و EF برای خدمات خرید و POI رستوران ها در این خوشه منطقه ای بالا بود. این مناطق عمدتاً تحت تسلط مراکز خرید و ساختمانهای تجاری (ساختمانهای اداری) مانند شهر ژنگهنگ، بندر Xidi، واندا پلازا و ساختمان Zhongke هستند. در روزهای هفته، ارزش گرمایی این منطقه به ویژه از ساعت 17:00 تا 20:00 بالا بود، که با آنچه در مورد استفاده مردم از این امکانات پس از کار برای صرف غذا، خرید، تفریح و غیره شناخته شده است، مطابقت دارد. در روزهای استراحت نسبت به روزهای هفته، تمرکز جریان مردم به مناطق تجاری در تعطیلات آخر هفته را تأیید می کند.
- (4)
-
سی3: نقاط دیدنی طبیعی
POI سایت های توریستی در خوشه منطقه ای بالاترین مقادیر EF و CR را در مقایسه به صورت افقی و طولی داشتند. این مناطق شامل جاذبهها و پارکهای توریستی متعددی مانند پارک لونگهو، پارک دریاچه Xiliu، جنگل ژنگژو، پارک مردم و غیره میشد. امکانات اولیه خدمات توزیع ارزش گرمای جمعیت برای دوره های زمانی مختلف در روزهای کاری نسبتاً یکنواخت بود، اما مقدار آن در تعطیلات آخر هفته به طور کلی بالاتر بود. اوج مقدار بین ساعت 10:00 تا 16:00 در تعطیلات آخر هفته بود که با رفتار شناخته شده مردم در سفر در آخر هفته موافق است.
- (5)
-
سی4: مناطق صنعتی
از نظر مقادیر EF و CR، POIهای نوع شرکت بالاترین ارزش را در این خوشه منطقه ای دارند، در حالی که POIهایی مانند نوع منظره و نوع دولتی نیز مقادیر چندان پایینی ندارند. زیرا علاوه بر شرکت ها، کارخانه ها، مناطق کشاورزی، جنگلداری، دامپروری و ماهیگیری، مناطق صنعتی نیز شامل برخی از امکانات اولیه خدماتی مانند پارک ها، رستوران ها و فروشگاه های رفاه می باشد. در همان زمان، برخی از سازمان های دولتی برای تنظیم و کنترل صنایع در این نزدیکی بودند، بنابراین تعداد سازمان های دولتی نیز نسبتا زیاد بود. از نظر موقعیت جغرافیایی، این خوشه منطقه ای عمدتاً در حاشیه شهر پراکنده شده است که با پراکندگی واقعی نواحی صنعتی همخوانی دارد. از نظر ارزش گرمایی جمعیت،
- (6)
-
سی5: مناطق ناشناس
این نواحی در این مقاله به دلیل دادههای POI ناکافی، مقادیر حرارتی پایین کلی، و ناحیه کلی کوچک و بدون عملکرد خاص مورد تجزیه و تحلیل قرار نگرفتند.
4.2. اعتبار سنجی
برای ارزیابی دقت نتایجی که به دست آوردیم، نتایج شناسایی ناحیه عملکردی با نقشههای آنلاین Baidu و نمای خیابان Baidu مقایسه شد. جدول 5 مقایسه برخی از مناطق معمولی را نشان می دهد.
منطقه A در جدول 5 نقشه و نمای خیابان پارک تالاب Longhu را نشان می دهد که یک نقطه دیدنی است. نتیجه شناسایی همچنین این مکان را به عنوان یک نقطه دیدنی طبیعی طبقه بندی کرد ( سی3). منطقه B دانشگاه ژنگژو است که به رده مرتبط با علم، آموزش و فرهنگ تعلق دارد . باز هم، این با نتیجه شناسایی (C1) سازگار است . منطقه C تجارت بینالمللی گراند ویو، مرکز خرید تجارت جهانی و پلازا Silverbase است که مناطق مرتبط با خدمات تجاری است. از آنجایی که نتیجه شناسایی یک منطقه تجاری است ( C 2 )، این نیز دقیق است. منطقه D دارای چندین منطقه مسکونی است، مانند خانواده Zhengshang Goldfield و محله Wu Jian Xin. نتیجه شناسایی نیز منطقه مسکونی بود ( C 0). منطقه E شرکت های مختلفی را در خود جای داده است و حتی یک پارک سازمانی دارد. در اینجا، نتیجه شناسایی منطقه صنعتی ( C4 ) است که با واقعیت سازگار است.
این نتایج با هم نشان می دهد که روش پیشنهادی قادر به طبقه بندی دقیق مناطق عملکردی شهری شهر ژنگژو بود.
4.3. تحلیل مقایسه ای
برای ارزیابی مزایای نسبی رویکرد پیشنهادی ما در رابطه با سایر احتمالات، نتایج استفاده از مدل محبوب LDA ( شکل 12 الف)، مدل Word2Vec ( شکل 12 ب) و یک مدل سنتی GloVe ( شکل 12 ج) با نتایج استفاده از روش پیشنهادی از کارشناسان با پیشینه جغرافیایی دعوت شد تا هر بسته را از نظر عملکرد متفاوت برچسب گذاری کنند. انواع مناطق کاربردی شامل مناطق مسکونی، تحقیقات علمی، آموزش و خدمات عمومی، نقاط دیدنی، مناطق تجاری و مناطق صنعتی است. سپس نتایج چهار روش با طبقه بندی های دستی مقایسه شد ( شکل 12 e). ماتریس سردرگمی ( شکل 13دقت کلی و ضریب کاپا ( جدول 6 ) با استفاده از نتایج طبقه بندی جمعیت به عنوان معیار محاسبه می شود.
(1) نتایج شناسایی مدل LDA هم در مرکز شهری و هم در مناطق حومه شهری دارای انحراف زیادی است ( شکل 14 ). در ناحیه مرکز شهری، مناطق متعدد علوم، آموزش و خدمات عمومی به عنوان کاربری های مسکونی طبقه بندی می شوند. در همین حال، چندین سایت صنعتی در مناطق حومه شهر به درستی طبقه بندی نشده اند. از ماتریس سردرگمی، احتمال طبقه بندی صحیح برای هر دو ناحیه عملکردی کم است ( شکل 13)آ). این به این دلیل است که LDA یک مدل تولید احتمال موضوع یادگیری بدون نظارت است که از روش کیسه کلمات برای تولید موضوعات استفاده می کند که مستقل از ترتیب توزیع کلمات در سند است. از این رو، مدل اساساً نوع ناحیه عملکردی را با فراوانی POI قضاوت می کند و این معیار قضاوت دارای محدودیت هایی است. به طور خاص، تنها یک مدرسه در منطقه خدمات عمومی وجود دارد، در حالی که چندین خوابگاه و خانه خانوادگی وجود دارد. احتمال وقوع مناطق مسکونی بیشتر از اماکن علمی و آموزشی است. بنابراین مکان های علمی و آموزشی به اشتباه به عنوان منطقه مسکونی طبقه بندی می شوند. خدمات و زیرساخت های بسیاری در نزدیکی کارخانه ها در زمین های صنعتی وجود دارد که تعداد این امکانات از کارخانه ها بیشتر است.
(2) بر اساس مدل LDA که فقط فرکانس POI را در نظر می گیرد، مدل Word2Vec همبستگی فضایی POI را در نظر می گیرد. از میزان صحیح شناسایی هر ناحیه عملکردی در ماتریس سردرگمی ( شکل 13 ب) مشاهده می شود که این روش شناسایی ناحیه عملکردی را تا حدی افزایش می دهد. با این حال، از آنجایی که این مدل فقط در زمینههای محلی جداگانه آموزش داده میشود و نه بر روی تعداد همرویدادهای جهانی، آمارهای هموقوع مهم POI نادیده گرفته میشوند که منجر به شناسایی نادرست برخی از مناطق میشود. به عنوان مثال، منطقه A ( شکل 15 a) در نتایج شناسایی مدل Word2Vec، مکان مراکز خرید تجاری مانند شهر Zhenghong و Jianye Kaixuan Plaza است، در حالی که منطقه B ( شکل 15)ب) مرکز خرید بندر زیدی است. هر دو منطقه تجاری هستند اما به عنوان چنین طبقه بندی نمی شوند. با نگاهی به مناطق C ( شکل 15 ج) و د ( شکل 15 د)، که در آن چندین شرکت صنعتی ریختهگری فولاد و قطعات خودرو وجود دارد، اینها به دستههای مختلفی اختصاص داده شدهاند. ناحیه D صحیح است، اما ناحیه C صحیح نیست.
(3) مدل سنتی GloVe از اطلاعات همزمانی جهانی برای آموزش بردارهای نوع POI و همچنین دقت کلی و ضریب کاپا ( جدول 6 ) بالاتر از دو روش اول استفاده میکند. با این حال، هنگام سازماندهی روابط POI، فقط روابط مکان خطی POI در نظر گرفته می شود که منجر به خطا در آمار اطلاعات جهانی همزمان می شود. اثر تشخیص ناحیه عملکردی محدود است. مناطق A ( شکل 16 a) و B ( شکل 16ب) در مدل سنتی GloVe نتایج شناسایی به ترتیب مکانهای دانشگاه حفاظت از آب و برق آبی شمال چین و دانشگاه مالی و اقتصاد و دولت هنان است که هر دو حوزه تحقیقات علمی، آموزشی و خدمات عمومی هستند. با این حال، به آنها دسته بندی های مختلفی داده شده است. منطقه C ( شکل 16 ج) پارک دریاچه ژنگژو Xiliu و منطقه D ( تصویر 16 د) پارک تالاب Longhu است. هر دوی این مناطق مکانهای دیدنی معمولی هستند، اما در یک دسته قرار نگرفتهاند.
نتایج شناسایی برای روش پیشنهادی در شکل 12 d نشان داده شده است. همانطور که مشاهده می شود، مناطقی که در دو روش فوق به اشتباه طبقه بندی شده اند، همه به درستی طبقه بندی شده اند و نتایج بسیار بیشتر با مناطق عملکردی واقعی مطابقت دارد. از ماتریس سردرگمی ( شکل 13 د)، می توان دید که دقت روش پیشنهادی در همه دسته ها بیشتر از مدل سنتی GloVe بر اساس روابط فضایی خطی POI بود. دقت شناسایی برای مناطق علمی، آموزشی، فرهنگی و خدمات عمومی، مناطق صنعتی و مکانهای دیدنی بالا بود، اگرچه دقت برای مناطق تجاری کمی پایینتر است. از جدول 6مشاهده می شود که ضرایب کاپا و دقت کلی روش پیشنهادی به ترتیب 74/0 و 80/0 بوده که در هر دو حالت نسبت به سایر روش ها بهتر است. این نشان میدهد که میتوانیم با در نظر گرفتن محدودیتهای شبکه جادهای برای استخراج اطلاعات مجاورت POI، رابطه بین انواع POI و مناطق عملکردی را با دقت بیشتری مدل کنیم. این روش شناسایی ناحیه عملکردی، که رابطه مکان غیرخطی POI را در نظر می گیرد، می تواند اثر شناسایی ناحیه عملکردی را بهبود بخشد.
4.4. بحث
روش شناسایی مدل GloVe پیشنهادی، که رابطه مکان غیرخطی POI را در نظر میگیرد، میتواند به طور موثر مناطق کاربردی شهری را شناسایی کند. روش ما نه تنها اطلاعات همزمانی POI را از کل شهر استخراج می کند، بلکه اطلاعات تعامل POI بین بسته های مختلف را نیز در نظر می گیرد. می تواند مجاورت جغرافیایی و تداوم ساختاری را در نظر بگیرد. علاوه بر این، روش در این مقاله با مطالعات قبلی با استفاده از فاصله اقلیدسی برای استخراج رابطه مجاورت متفاوت است، اما از فاصله شبکه جادهای استفاده میکند که باعث میشود اطلاعات نزدیکی POI با واقعیت مرتبطتر باشد. به طور خلاصه، میتواند اطلاعات معنایی POI جامعتری را استخراج کند و نتیجه شناسایی ناحیه عملکردی مؤثرتری را ارائه دهد.
با این وجود، روش پیشنهادی بدون محدودیت نیست. از آنجایی که مناطق مرکزی شهری تمایل دارند ترکیبی غنی از چندین عملکرد مختلف داشته باشند، بین نتایج شناسایی برای ناحیه مرکزی ( شکل 17 الف) و مقوله های عملکردی واقعی ( شکل 17 ب) مقداری انحراف وجود دارد. دقت شناسایی برای مناطق تجاری به ویژه پایین است ( شکل 13 د). این عمدتا به دلیل این واقعیت است که مناطق تجاری به شدت در مناطق مرکزی متمرکز شده اند، جایی که اغلب با مناطق کاربردی دیگر مانند مناطق مسکونی و سازمان های دولتی مخلوط می شوند.
یکی دیگر از محدودیت های رویکرد در این مقاله این است که هم داده های بزرگ و هم مدل تنها ساده سازی شهر هستند. شناسایی مناطق عملکردی شهری یک فرآیند بسیار پیچیده است که شامل عوامل زیادی مانند رشد جمعیت، فعالیتهای اقتصادی و غیره است. این مقاله تنها از ارزش گرمایی جمعیت دادههای سیگنالینگ تلفن همراه برای منعکس کردن ویژگیهای تجمع و سفر جمعیت استفاده میکند. می تواند الگوی رفتاری ساکنان را تا حد معینی منعکس کند، اما به اندازه کافی جامع نیست، به این معنی که نتایج ممکن است دارای سوگیری باشند. تحقیقات بیشتر را می توان با ترکیب داده های مکانی-زمانی مانند داده های مسیر وسیله نقلیه شناور، داده های مترو و داده های رسانه های اجتماعی انجام داد.
5. نتیجه گیری ها
این مقاله یک مدل مبتنی بر GloVe برای شناسایی ناحیه عملکردی شهری پیشنهاد میکند که رابطه فضایی غیرخطی بین POIها را در نظر میگیرد. اطلاعات مجاورت POI بر اساس شبکه جاده برای ساخت یک ماتریس همزمانی استخراج شد و یک مدل GloVe برای آموزش بردارهای دسته POI کوچک استفاده شد. سپس بردارهای ویژگی بسته برای اندازه گیری شباهت بین مناطق مختلف ساخته شدند. پس از این، یک الگوریتم خوشه بندی برای تقسیم بسته ها به شش دسته استفاده شد. مقادیر گرمای CR، EF و جمعیت برای اختصاص عملکردهای مختلف به شش خوشه منطقه استفاده شد. این روش برای مناطق شهری در شهر ژنگژو اعمال شد و مناطق عملکردی مختلف شهر به دست آمد. سپس نتایج شناسایی با نقشه های Baidu برای تأیید صحت روش پیشنهادی مقایسه شد. عملکرد روش پیشنهادی نیز با LDA، Word2Vec و مدل سنتی GloVe مقایسه شد. مشخص شد که روش پیشنهادی از دقت شناسایی بالاتری برای مناطق عملکردی شهری برخوردار است. این نشان میدهد که اطلاعات هموقوع جهانی مبتنی بر استخراج شبکه جادهای به POI واقعی نزدیکتر است، که میتواند مدلسازی دقیقتری از رابطه بین انواع POI و عملکردهای شهری به دست آورد و شناسایی منطقه عملکردی را بهبود بخشد.
این مطالعه می تواند ابزار مفیدی برای ارزیابی تغییرات عملکرد مناطق ساخته شده در نتیجه فعالیت های اقتصادی انسان باشد. در عین حال، این مطالعه می تواند مکمل خوبی برای زمانی که به دست آوردن داده های کاداستر متعارف در برخی مناطق نسبتا دشوار است. یافته های این مطالعه منبع مرجعی برای شناسایی و درک ساختارهای فضایی پیچیده شهری و پیکربندی عملکردی آنها است. روش پیشنهادی همچنین میتواند به انتخاب مکانهای شهری برای عملکردهای مختلف، برنامهریزی جامع شهری و ساخت شهرهای هوشمند کمک کند.
در آینده، چندین داده مکانی و زمانی را با داده های سنتی به عنوان ابزاری برای شناسایی تغییرات عملکردی در مناطق ترکیب خواهیم کرد. از سوی دیگر، ما در این مطالعه تنها یک تابع واحد از منطقه را در نظر گرفتیم، بدون در نظر گرفتن اینکه مناطق مرکز شهر اغلب دارای ویژگی های عملکردی متفاوتی هستند. در کار بعدی، شدت عملکردی متفاوت مناطق نیز یک جهت تحقیقاتی است.
بدون دیدگاه