شناسایی مناطق عملکردی شهری (UFRs) برای برنامه ریزی شهری و توسعه پایدار مهم است. از آنجایی که این شامل مجموعه ای از فرآیندهای مرتبط با یکدیگر است، شناسایی UFR ها تنها با استفاده از منابع داده منفرد دشوار است. روش های ترکیب داده ها پتانسیل بهبود دقت شناسایی را دارند. با این حال، استفاده از روش‌های ترکیبی موجود در هنگام استخراج اطلاعات معنایی مشترک در بین منابع داده‌ای متعدد، چالش برانگیز است. به منظور پرداختن به این موضوع، ما یک روش فاکتورسازی ماتریس پیوند زمینه (CCMF) را پیشنهاد می‌کنیم که روابط متنی را در نظر می‌گیرد. این روش بر اساس این واقعیت طراحی شده است که روابط متنی تعبیه شده در همه داده ها به اشتراک گذاشته شده و مکمل یکدیگر هستند. یک مطالعه تجربی با ادغام داده‌های نقطه مورد علاقه (POI) و داده‌های مبدا-مقصد تاکسی (OD) در پکن، چین انجام شد. در CCMF سه مرحله وجود دارد. ابتدا، اطلاعات زمینه ای از داده های مسیر POI و تاکسی OD استخراج می شود. دوم، ادغام با استفاده از اطلاعات زمینه ای انجام می شود. در نهایت، خوشه بندی طیفی برای شناسایی مناطق عملکردی استفاده می شود. نتایج نشان می دهد که روش پیشنهادی به دقت کلی (OA) 90% و کاپا 0.88 در منطقه مورد مطالعه دست یافته است. نتایج با نتایج به‌دست‌آمده با استفاده از منابع منفرد داده‌های غیر ترکیبی و سایر روش‌های همجوشی به منظور اعتبارسنجی اثربخشی روش ما مقایسه شد. نتایج نشان می دهد که با استفاده از این روش می توان به بهبود OA حدود 5 درصد در مقایسه با روش مشابه در ادبیات دست یافت. چین. در CCMF سه مرحله وجود دارد. ابتدا، اطلاعات زمینه ای از داده های مسیر POI و تاکسی OD استخراج می شود. دوم، ادغام با استفاده از اطلاعات زمینه ای انجام می شود. در نهایت، خوشه بندی طیفی برای شناسایی مناطق عملکردی استفاده می شود. نتایج نشان می دهد که روش پیشنهادی به دقت کلی (OA) 90% و کاپا 0.88 در منطقه مورد مطالعه دست یافته است. نتایج با نتایج به‌دست‌آمده با استفاده از منابع منفرد داده‌های غیر ترکیبی و سایر روش‌های همجوشی به منظور اعتبارسنجی اثربخشی روش ما مقایسه شد. نتایج نشان می دهد که با استفاده از این روش می توان به بهبود OA حدود 5 درصد در مقایسه با روش مشابه در ادبیات دست یافت. چین. در CCMF سه مرحله وجود دارد. ابتدا، اطلاعات زمینه ای از داده های مسیر POI و تاکسی OD استخراج می شود. دوم، ادغام با استفاده از اطلاعات زمینه ای انجام می شود. در نهایت، خوشه بندی طیفی برای شناسایی مناطق عملکردی استفاده می شود. نتایج نشان می دهد که روش پیشنهادی به دقت کلی (OA) 90% و کاپا 0.88 در منطقه مورد مطالعه دست یافته است. نتایج با نتایج به‌دست‌آمده با استفاده از منابع منفرد داده‌های غیر ترکیبی و سایر روش‌های همجوشی به منظور اعتبارسنجی اثربخشی روش ما مقایسه شد. نتایج نشان می دهد که با استفاده از این روش می توان به بهبود OA حدود 5 درصد در مقایسه با روش مشابه در ادبیات دست یافت. ادغام با استفاده از اطلاعات زمینه ای انجام می شود. در نهایت، خوشه بندی طیفی برای شناسایی مناطق عملکردی استفاده می شود. نتایج نشان می دهد که روش پیشنهادی به دقت کلی (OA) 90% و کاپا 0.88 در منطقه مورد مطالعه دست یافته است. نتایج با نتایج به‌دست‌آمده با استفاده از منابع منفرد داده‌های غیر ترکیبی و سایر روش‌های همجوشی به منظور اعتبارسنجی اثربخشی روش ما مقایسه شد. نتایج نشان می دهد که با استفاده از این روش می توان به بهبود OA حدود 5 درصد در مقایسه با روش مشابه در ادبیات دست یافت. ادغام با استفاده از اطلاعات زمینه ای انجام می شود. در نهایت، خوشه بندی طیفی برای شناسایی مناطق عملکردی استفاده می شود. نتایج نشان می دهد که روش پیشنهادی به دقت کلی (OA) 90% و کاپا 0.88 در منطقه مورد مطالعه دست یافته است. نتایج با نتایج به‌دست‌آمده با استفاده از منابع منفرد داده‌های غیر ترکیبی و سایر روش‌های همجوشی به منظور اعتبارسنجی اثربخشی روش ما مقایسه شد. نتایج نشان می دهد که با استفاده از این روش می توان به بهبود OA حدود 5 درصد در مقایسه با روش مشابه در ادبیات دست یافت. نتایج با نتایج به‌دست‌آمده با استفاده از منابع منفرد داده‌های غیر ترکیبی و سایر روش‌های همجوشی به منظور اعتبارسنجی اثربخشی روش ما مقایسه شد. نتایج نشان می دهد که با استفاده از این روش می توان به بهبود OA حدود 5 درصد در مقایسه با روش مشابه در ادبیات دست یافت. نتایج با نتایج به‌دست‌آمده با استفاده از منابع منفرد داده‌های غیر ترکیبی و سایر روش‌های همجوشی به منظور اعتبارسنجی اثربخشی روش ما مقایسه شد. نتایج نشان می دهد که با استفاده از این روش می توان به بهبود OA حدود 5 درصد در مقایسه با روش مشابه در ادبیات دست یافت.

کلید واژه ها:

مناطق عملکردی شهری ; شناسایی ؛ فاکتورسازی ماتریسی ; داده های POI ؛ داده های مسیر OD

1. مقدمه

شناسایی مناطق عملکردی شهری (UFRs) اساس برنامه ریزی شهری است. شناسایی دقیق UFR برای حمایت از برنامه ریزی زیرساخت شهری و بهبود کیفیت زندگی بسیار مهم است. انواع زیادی از داده ها برای شناسایی UFR ها استفاده شده است، از پرسشنامه های اولیه و نقشه های وضعیت کاربری زمین [ 1 ] تا داده های نوظهور مانند نقاط مورد علاقه (POIs) [ 2 ]، داده های رسانه های اجتماعی [ 3 ]، و داده های مسیر [1]. 4]. با این حال، استفاده از تنها یک نوع داده دارای معایب اجتناب ناپذیری است، هم از نظر مکانی و هم از نظر معنایی. به عنوان مثال، داده های POI نمی توانند اندازه واقعی یک فضا را نشان دهند. پراکندگی داده های رسانه های اجتماعی ممکن است به دقت شناسایی پایین منجر شود. بنابراین، ادغام داده ها برای بهبود دقت شناسایی به یک موضوع تحقیقاتی داغ تبدیل شده است.
پیشرفت قابل توجهی در استفاده از روش های ترکیب داده ها برای شناسایی UFR ها حاصل شده است. روش های همجوشی مبتنی بر پلت فرم سنتی [ 5 ، 6 ] به طور گسترده در حالت جفت شل استفاده شده است. مزیت این روش درک آسان آن است. با این وجود، توانایی آن در به تصویر کشیدن ویژگی های عملکردی شهری ضعیف است. روش های همجوشی مبتنی بر ویژگی [ 7 ، 8 ، 9 ، 10 ] می توانند بردارهای ویژگی را برای نشان دادن ویژگی های اصلی هر نقطه داده ضبط کنند. این روش ها می توانند ویژگی های اضافی را حذف کرده و بسته به اطلاعات مرتبط، ویژگی های اصلی را حفظ کنند. به جای تمرکز بر روی خود داده ها، روش های همجوشی مبتنی بر تصمیم [ 11 ،12 ] برای ادغام تصمیمات مشتق شده از داده ها پیشنهاد شد. مکمل بودن چندین تصمیم قبلی در نظر گرفته شد، اما ناهمگونی بین تصمیمات ممکن است به دقت پایین شناسایی UFR منجر شود [ 13 ]. روش های مبتنی بر معنایی، مناطق عملکردی را بر اساس درک جامع از اطلاعات پشت داده ها شناسایی می کنند [ 14 ، 15 ، 16]. بنابراین، همه این روش‌ها می‌توانند مشخص کنند که هر قطعه از داده چه چیزی را نشان می‌دهد، چرا داده‌های مختلف می‌توانند ترکیب شوند و چگونه می‌توانند ویژگی‌های یکدیگر را افزایش دهند. با این حال، آنها اغلب اطلاعات مشترک یا مشترک را که نشان دهنده شباهت بین داده های مختلف است نادیده می گیرند. علاوه بر این، پراکندگی اطلاعات چالش دیگری در شناسایی دقیق است. بنابراین، استخراج و درگیر کردن اطلاعات به اشتراک گذاشته شده در بین منابع داده های متعدد به منظور بهبود دقت شناسایی UFR به یک موضوع جالب و یک موضوع تحقیقاتی داغ تبدیل شده است.
به منظور پرداختن به مسئله پراکندگی و استخراج اطلاعات رایج، یک روش ترکیب داده به نام فاکتورسازی ماتریس پیوند زمینه (CCMF) برای جبران مشکل پراکندگی اطلاعات با در نظر گرفتن روابط متنی بین منابع داده‌های متعدد پیشنهاد شد. اول، استخراج اطلاعات بر اساس داده‌های POI و داده‌های مسیر مبدا-مقصد تاکسی (OD) انجام می‌شود. اطلاعات معنایی از داده های POI مشتق شده است، در حالی که اطلاعات تعامل مکانی و زمان-فرکانس از داده های مسیر OD تاکسی استخراج می شود. ثانیا، روش CCMF برای استخراج اطلاعات مشترک در بین منابع داده استفاده می شود تا در داده های یکپارچه برای شناسایی UFR ها ترکیب شوند. در نهایت، خوشه‌بندی طیفی برای شناسایی UFRها اتخاذ شد.
مشارکت های این مقاله شامل دو جنبه اصلی است:
(1)
روش CCMF برای ترکیب داده ها برای دستیابی به دقت شناسایی بالاتر پیشنهاد شد. روابط متنی بین منابع داده به منظور استخراج اطلاعات مشترک برای ادغام داده ها در نظر گرفته شد.
(2)
کار تجربی برای تایید قابلیت استفاده از روش پیشنهادی در منطقه مورد مطالعه انجام شد. داده های مسیر POI و OD تاکسی برای استفاده در شناسایی UFR ترکیب شدند. با مقایسه دقت بین داده های ذوب شده و داده های منفرد، نتایج نشان می دهد که روش پیشنهادی به دقت بالاتری در شناسایی UFR ها دست یافته است.
ساختار باقیمانده این مطالعه به شرح زیر است. بخش 2 ادبیات موجود را مرور می کند. بخش 3 تعریفی از منطقه مورد مطالعه و داده ها را ارائه می دهد. بخش 4 روش شناسی و گردش کار را برای شناسایی منطقه عملکردی شهری با روش CCMF معرفی می کند. بخش 5 آزمایش ها و نتایج را شرح می دهد. بخش 6 بحثی در مورد سایر روش های همجوشی و تأثیر پارامترها ارائه می دهد. در نهایت، بخش 7 نتیجه‌گیری می‌کند.

2. کارهای مرتبط

2.1. رویکرد شناسایی منطقه عملکردی شهری

بسیاری از روش‌های شناسایی UFR، از بررسی‌های میدانی اولیه گرفته تا روش‌های آماری و روش‌های یادگیری ماشین، توسعه یافته‌اند. بررسی های میدانی [ 17 ] بسته به دانش محقق، ذهنی تر هستند. روش‌های آماری فرصت‌های جدیدی را برای اندازه‌گیری کمی معیارهای UFR فراهم می‌کنند، برای مثال روش تحلیل چگالی هسته [ 18 ]، k-means [ 19 ] و تخصیص دیریکله نهفته (LDA) [ 20 ].]. دقت آنها به ظرفیت آنها برای استخراج ویژگی ها از داده ها بستگی دارد. در همین حال، آنها در مدیریت روابط غیرخطی بین منابع داده ضعیف هستند. روش‌های یادگیری ماشینی فرصت استخراج اطلاعات و تا حدی بهبود دقت شناسایی روابط غیرخطی را با رویکرد جعبه سیاه فراهم می‌کنند [ 21 ، 22 ، 23 ]. برخی از روش‌های یادگیری ماشینی پرکاربرد عبارتند از GMM [ 5 ]، خوشه‌بندی فازی [ 24 ] و طبقه‌بندی‌کننده تصادفی جنگل [ 25 ]. اخیراً، فاکتورسازی ماتریس غیرمنفی (NMF)، که می تواند برای تشخیص تعاملات مکانی-زمانی در شهرها از منظرهای متعدد مورد استفاده قرار گیرد، توجه روزافزونی را به خود جلب کرده است [ 26 ، 27 ]]. با این حال، بیشتر کارهایی که در بالا توضیح داده شد، ترکیب را فقط برای یک نوع داده اعمال کردند. بنابراین، تحقیقات روش تلفیق داده ها باید بیشتر مورد توجه قرار گیرد.

2.2. روش های ترکیب داده ها برای شناسایی منطقه عملکردی شهری

اصل اساسی ترکیب داده ها ترکیب منابع داده های مختلف بر اساس معیارهای خاص [ 28 ] است. روش های ترکیب داده ها برای شناسایی UFR ها را می توان به روش های مبتنی بر پلت فرم، مبتنی بر ویژگی، مبتنی بر تصمیم و مبتنی بر معنایی طبقه بندی کرد [ 29 ].
روش‌های مبتنی بر پلت‌فرم طبق معماری لو و کی [ 30 ]، پایین‌ترین سطح ترکیب داده‌ها هستند. داده های جغرافیایی و تصاویر سنجش از دور برای ارزیابی تغییر کاربری زمین شهری [ 31 ] ادغام شده اند. اطلاعات در هر دو بعد فضا و زمان به منظور کشف مناطق عملکردی شهری در یک مدل آزاد استخراج شد، اما ویژگی‌های اجتماعی را در نظر نگرفت [ 32 ]. در کار اخیر، از رویکردی استفاده شد که ویژگی‌های اجتماعی را در POI و ویژگی‌های طبیعی را در تصاویر سنجش از دور با وضوح فضایی بالا برای ترسیم UFR‌ها ادغام می‌کند [ 33 ]. با این حال، ادغام داده ها در روش های مبتنی بر پلت فرم، مجموعه داده های مختلف را در مراحل مختلف درگیر می کند. بنابراین، هیچ الزامی برای سازگاری داده ها وجود ندارد [ 34].
روش های مبتنی بر ویژگی می توانند اطلاعات جامعی را به دست آورند. اصل اساسی روش های مبتنی بر ویژگی برابری است. بردارهای ویژگی به طور وابسته از منابع داده های مختلف استخراج می شوند و وزن آنها بر اساس اهمیت آنها در شناسایی UFR ها تنظیم می شود. بنابراین، روش های همجوشی وزنی به طور گسترده مورد استفاده قرار می گیرند. به عنوان مثال، یک روش ترکیب وزنی برای تصاویر خیابانی و داده های رسانه های اجتماعی به منظور کاهش پراکندگی داده های رسانه های اجتماعی استفاده شد [ 7 ]. چارچوبی برای ترکیب معیارهای چشم انداز و معیارهای فعالیت انسانی برای شناسایی UFR ها [ 35 ] ایجاد شد. در سال‌های اخیر، روش‌های یادگیری عمیق به طور فزاینده‌ای در ترکیب مبتنی بر ویژگی درگیر شده‌اند. یک مدل CNN بهبود یافته [ 36] برای تشخیص UFR ها استفاده شد، که می تواند به طور خودکار استخراج ویژگی را انجام دهد و داده های با ابعاد بالا را مدیریت کند. با توجه به محدودیت های مدل CNN در دقت و عدم قطعیت، توجه بیشتری باید به مدل های شبکه CNN معطوف شود [ 37 ].
روش‌های مبتنی بر تصمیم برای هر تصمیمی که از منابع داده‌های مختلف به دست می‌آید، یک تخمین مصنوعی انجام می‌دهند. برخلاف سایر روش‌های همجوشی، روش‌های مبتنی بر تصمیم به جای انواع داده‌ها، بر ترکیب‌های مصنوعی مختلف تصمیم‌ها تمرکز می‌کنند [ 38 ]. روش ادغام مبتنی بر تصمیم یک توصیفگر ویژگی ذوب شده ایجاد می کند که همه تصمیمات را با هم ترکیب می کند. بنابراین، توصیفگر قابلیت تفسیر قدرتمندی برای نتایج شناسایی UFR دارد. وزن به طور گسترده ای برای توصیف مشارکت های مختلف تصمیمات مختلف استفاده شده است [ 39 ]. روش‌های یادگیری ماشینی می‌توانند در تعیین وزن‌ها به منظور جلوگیری از سوگیری ذهنی مفید باشند [ 40]. به جز مکانیسم وزن، هوش مصنوعی (AI) به طور گسترده به عنوان یک رویکرد انتها به انتها استفاده شده است [ 41 ].
ادغام مبتنی بر معنایی یک روش ادغام داده در سطح بالا بر اساس اطلاعات معنایی داده ها است. عملیات ساده AND-OR اساساً نمی توانند آنها را به هم وصل کنند. روش‌های مبتنی بر معنایی، اطلاعات معنایی ذاتی را برای ارائه ویژگی‌های داده درگیر می‌کنند. افزایش حجم داده های مکانی-زمانی نیازمند تحقیقات بیشتری برای استخراج و توصیف اطلاعات معنایی است. یک روش فاکتورسازی تانسور غیر منفی برای گسترش نتایج به‌دست‌آمده برای شبکه‌های استاتیک به شبکه‌های متغیر با زمان پیشنهاد شده است، که اطلاعات معنایی مبتنی بر اطلاعات مکانی-زمانی را غنی می‌کند [ 42 ].]. در یک مدل چند سطحی، می‌توان از ویژگی‌های اجتماعی-اقتصادی یک فرد برای تخمین تأثیر آن‌ها بر تعیین عملکردی مناطق شهری استفاده کرد. با این حال، رابطه متقابل بین اطلاعات معنایی نادیده گرفته شده است [ 43 ]. مکانیسم همبستگی متقابل برای استخراج ویژگی‌های معنایی معرفی شد. مدل CC-FLU برای شناسایی UFR ها با ادغام ویژگی های معنایی و روابط متقابل بین آنها پیشنهاد شد [ 44 ].

3. منطقه مطالعه و مجموعه داده ها

3.1. منطقه مطالعه

پکن، پایتخت جمهوری خلق چین، به عنوان منطقه تحقیقاتی انتخاب شد. این شهر مدرن، شهرت جهانی و بین المللی است و ساختار فضایی پیچیده ای دارد. منطقه مورد مطالعه در داخل جاده کمربندی پنجم پکن است که شامل مناطق مختلف کاربردی شهری توسعه یافته است. نقشه منطقه مورد مطالعه در شکل 1 نشان داده شده است .

3.2. مجموعه داده ها و پردازش

منابع اصلی داده در کار ما OpenStreetMap (OSM)، مسیر OD تاکسی و داده‌های POI بودند.
(1) OpenStreetMap (OSM) یک برنامه کاربردی شناخته شده است که از داده های داوطلبانه اطلاعات جغرافیایی (VGI) استفاده می کند که منبع مهمی از داده های علم شهروندی است. یک شبکه نامنظم که توسط داده‌های شبکه جاده‌ای شکل می‌گیرد، واحد اساسی برای نشان دادن عملکردهای اجتماعی-اقتصادی در مدیریت و برنامه‌ریزی شهری است. در این مقاله، داده های جاده حلقه پنجم پکن در سال 2018 از وب سایت OpenStreetMap ( https://www.openstreetmap.org/ ، 18 مارس 2022) به دست آمد. شبکه نامنظم تولید شده توسط داده های شبکه راه، واحد اساسی است که عملکردهای اجتماعی-اقتصادی در مدیریت شهری و برنامه ریزی شهری را بیان می کند، و در تشخیص تأثیر بر عملکردهای شهری یکپارچه است [ 45 ، 46 ].
مقیاس و شکل واحدهای جغرافیایی ممکن است بر نتایج تحقیق تأثیر بگذارد. روش تقسیم شبکه های همگن نمی تواند تداوم انواع کاربری زمین در سلول ها را تضمین کند. انواع کاربری های زمین در سلول ها در محل اتصال انواع کاربری های مختلف بسیار مخلوط هستند.
داده‌های OSM اغلب برای تولید واحدهای فضایی پایه برای شناسایی UFR استفاده می‌کنند. این داده ها باید از قبل پردازش شوند تا از کیفیت داده ها اطمینان حاصل شود. واحد فضایی مورد استفاده در این تحقیق، ترکیبی از عملیات نرم‌افزار ArcGIS و تقسیم دستی است: به عنوان مثال، حذف نقاط برآمدگی در جاده و گسترش خط مستقل جاده برای اتصال آن به جاده مجاور و در نهایت، با حذف دستی جاده های غیر ضروری جامعه داخلی و خطوط میانی جاده ها. محدوده مورد مطالعه با در نظر گرفتن چهار سطح راه بزرگراه، اولیه، فرعی و جاده تنه شهری به 1260 واحد تقسیم شد.
مقیاس و شکل واحدهای جغرافیایی ممکن است بر نتایج تحقیق تأثیر بگذارد. روش تقسیم شبکه های همگن نمی تواند تداوم انواع کاربری زمین در سلول ها را تضمین کند. انواع کاربری های زمین در سلول ها در محل اتصال انواع کاربری های مختلف بسیار مخلوط هستند.
(2) داده‌های مسیر OD تاکسی شامل مسیرهای تاکسی است که توسط دستگاه‌های ردیابی سامانه ناوبری ماهواره‌ای جهانی (GNSS) ثبت شده است. فعالیت های روزانه ساکنان معنادار است و می توان آن را با داده های مسیر OD تاکسی به تصویر کشید. در کار ما، یک هفته از داده های مسیر OD تاکسی از منطقه جاده حلقه پنجم پکن در سال 2018 استفاده شد. این شامل حدود 25 تا 35 میلیون داده نقطه مسیر برای یک روز است. هر رکورد مبدأ عمدتاً شامل شناسه تاکسی، زمان، عرض جغرافیایی، طول جغرافیایی، سرعت، جهت و وضعیت است ( جدول 1 را ببینید ).
با توجه به ویژگی‌های عملکرد تاکسی، برخی از مکان‌های دورافتاده توزیع نقاط OD را ندارند، در حالی که برخی از مناطق محبوب دارای توزیع بیشتری هستند. بنابراین، داده های به دست آمده به طور مساوی توزیع نمی شوند. مقادیر از دست رفته یا صفر در ماتریس داده وجود خواهد داشت. به همین ترتیب، داده های مورد استفاده در این مقاله، داده های OD پکن برای یک هفته است. چرخه‌های داده کوتاه نیز داده‌ها را پراکنده می‌کند.
(3) داده‌های POI شامل داده‌های نقطه‌ای با اطلاعات جغرافیایی است که اشیاء دنیای واقعی را به تصویر می‌کشد، چه 2 بعدی یا سه بعدی، داخلی یا خارجی [ 47 ]. داده های POI معمولاً دارای دانه بندی فضایی خوبی هستند و به طور گسترده برای مشخص کردن فعالیت های افراد استفاده می شوند. ویژگی های POI شامل نام ها، دسته ها، عرض جغرافیایی و طول جغرافیایی است. تقریباً 147158 رکورد در مورد POI در سال 2018 از API نقشه Gaode ( https://lbs.amap.com/ ، 29 مارس 2022) جمع آوری شد که شامل 22 دسته و زیرمجموعه است. به دنبال مشخصات فنی چینی (GB50137-2011)، داده های POI مجدداً به عنوان داده های مسکونی، خدمات عمومی، تجاری و مالی، صنعتی، میدان سبز و داده های حمل و نقل طبقه بندی شدند ( جدول 2).). در کار ما، از داده های POI برای تعیین انواع UFR ها استفاده شد.

4. روش شناسی

با الهام از کار ژنگ و یی [ 34 ، 48 ]، CCMF برای ادغام داده های مسیر POI و OD تاکسی برای شناسایی UFR پیشنهاد شد. همانطور که در شکل 2 نشان داده شده است ، این چارچوب عمدتا از سه مرحله تشکیل شده است. در مرحله اول اطلاعات ویژگی استخراج می شود. در مرحله دوم، ماتریس های ویژگی تجزیه می شوند و یک ماتریس ذوب شده به دست می آید. در نهایت، از روش خوشه‌بندی طیفی برای شناسایی مناطق عملکردی استفاده می‌شود. روش های مرحله اول رایج تر هستند. بنابراین، بخش‌های زیر بر تشریح روش‌های مراحل 2 و 3 تمرکز دارند.

4.1. گردش کار استخراج اطلاعات ویژگی

در کار ما، داده های مسیر OD و POI به منظور شناسایی UFR ها ترکیب شدند. استخراج اطلاعات اساس روش CCMF پیشنهادی بود و نتایج به صورت ماتریس ذخیره شدند. روند کار به شرح زیر بود:
(1)
تعداد یک نوع خاص از POI در یک واحد فضایی تا حدی می تواند نوع عملکردی را تا حدی منعکس کند. عملیات فضایی همپوشانی بر روی داده‌های POI و واحدهای فضایی به منظور تولید یک ماتریس واحد فضایی POI، P انجام شد. ردیف‌های ماتریس P نشان‌دهنده یک نوع POI در این منطقه هستند و ستون‌ها مکان واحد را نشان می‌دهند. در نهایت، اطلاعات معنایی قدرتمندی به نوع تابع حاشیه نویسی ارائه می شود.
(2)
اطلاعات مکان داده های OD منعکس کننده تقاطعات بین مناطق است. یعنی نقاط مبدأ و مقصد که در یک واحد فضایی قرار می‌گیرند، برهمکنش آنها را نشان می‌دهند. با محاسبه مجموع نقاط OD در هر واحد فضایی، یک ماتریس تعامل OD، Q ، به دست می آید. ردیف‌های ماتریس Q نشان‌دهنده نقاط مبدا سوار شدن مسافران هستند و ستون‌ها نشان‌دهنده نقاط مقصد خروج هستند. مقدار عنصر ماتریس نشان دهنده بسامد سفر از مبدا تا نقطه مقصد است. از آن به عنوان داده اصلی استفاده می شود که عمدتاً از فراوانی تعاملات سفر ساکنان در هر واحد برای کشف عملکردهای بالقوه منطقه استفاده می کند.
(3)
توالی‌های فرکانس زمانی استخراج‌شده از داده‌های OD تاکسی، جریان‌های تاکسی یا الگوهای سفر ساکنان را برای دوره زمانی در این منطقه نشان می‌دهند. برای محاسبه توالی زمان-فرکانس از روش آماری معمولی استفاده شد. شباهت واحدهای فضایی برای شناسایی UFR بسیار مهم است. الگوریتم تاب خوردگی زمانی پویا (DTW) یک روش منظم سازی زمانی پرکاربرد برای اندازه گیری شباهت دو مجموعه داده سری زمانی است [ 49 ]]، و این الگوریتم نیز در کار ما برای به دست آوردن ماتریس شباهت زمان-فرکانس، R به کار گرفته شد. در همان زمان، ممکن است موقعیتی وجود داشته باشد که در آن تعداد برهمکنش های OD یکسان باشد اما توابع متفاوت باشند. به عنوان مثال، اگر منطقه اوج ساعت 6 تا 8 صبح و 6 تا 8 بعد از ظهر در روزهای هفته باشد، احتمالاً یک منطقه صنعتی یا مسکونی است، در حالی که در آخر هفته ها احتمالاً یک منطقه تجاری یا سبز است. بنابراین ویژگی های ساعتی به منظور جبران آن کمبود استخراج می شود.

4.2. فاکتورسازی ماتریس همراه با زمینه برای ترکیب داده ها

یک منبع داده تنها می تواند یک ویژگی کاربردی شهری را از یک منظر نشان دهد. شباهت هایی در توابع بین مناطق مختلف شهری وجود دارد، و وقتی می دانیم که دو منطقه در برخی معیارها مشابه هستند، شباهت بین داده ها می تواند به عنوان اطلاعات زمینه ای برای تقویت شباهت بین مناطق استفاده شود، زمانی که یکی از آنها توصیف ناقصی از داده ها باشد. ما ماهیت یا عملکرد مناطق را با هم با یادگیری شباهت های متناظر متعدد (محاسبه شده با استفاده از داده های مربوطه، که می توانند یکدیگر را تقویت کنند) توصیف می کنیم. بنابراین، ترکیب داده ها برای دستیابی به دقت شناسایی بالا باید رویکرد بهتری برای شناسایی UFR باشد. همانطور که با بررسی ادبیات مشخص شد، آثار موجود عمدتاً بر روش‌های مختلف همجوشی تمرکز دارند.
برای رفع این شکاف، روش CCMF، که روابط متنی را بین منابع داده در نظر می‌گیرد و به طور کامل آنها را در اندازه‌گیری ارتباط‌ها درگیر می‌کند، پیشنهاد شد. مفهوم اصلی CCMF فاکتورسازی مشترک ماتریس های ویژگی استخراج شده از منابع داده های متعدد است. اطلاعات متنی داده های مکانی به منظور بهبود دقت شناسایی برای درک مکانی و معنایی ضروری است. این داده ها شامل عوامل پنهان مشترکی است که می توانند مکمل یکدیگر باشند.
راه حل خاص کاهش محدودیت پراکندگی داده ها عمدتاً به دلیل این واقعیت است که آنها یک بعد مشترک دارند (1260 واحد فضایی). شباهت نواحی مختلف که از یک مجموعه داده به دست می‌آید، با فاکتورسازی ماتریس آگاه از زمینه به منظور جبران مقادیر از دست رفته، به مجموعه داده دیگری منتقل می‌شود. بنابراین می توان به دقت شناسایی بالایی دست یافت. در این مقاله، این امر با شباهت بین منطقه ای به دست آمده از مجموعه داده متراکم (ماتریس POI و ماتریس زمان-فرکانس OD) برای افزایش شباهت به دست آمده از ماتریس تعامل OD به دست آمد. یعنی شباهت انواع POI به‌دست‌آمده از ماتریس POI، فقدان معنایی ماتریس تعامل OD را جبران می‌کند. شباهت زمان‌های سفر ساکنان به‌دست‌آمده از ماتریس زمان-فرکانس OD، کمبود زمانی در ماتریس تعامل OD را جبران می‌کند. یک نمودار شماتیک در آورده شده استشکل 3 . یک عامل پنهان مشترک M برای ماتریس های P و Q وجود دارد. به همین ترتیب، یک عامل پنهان مشترک N برای ماتریس های Q و R وجود دارد. M شامل اطلاعات مشترک از داده های POI و اطلاعات تعامل است و N شامل شباهت واحدهای فضایی است. ویژگی‌های چندین منبع داده برای جبران پراکندگی داده‌ها ترکیب می‌شوند که برای حل مشکل سوگیری داده‌ها مفید است. بنابراین، دقت شناسایی را می توان بهبود بخشید.

همبستگی بین دو شیء از نظر مکانی نزدیک قویتر از همبستگی بین دو شیء دور است. تعامل OD، POI، و ماتریس های زمان فرکانس OD به طور همزمان تجزیه می شوند. سپس، ماتریس برهمکنش مشترک M برای معناشناسی ویژگی و ماتریس تعامل N برای تشابه ویژگی تشکیل می‌شوند. اطلاعات مشترک M بین ماتریس تعامل OD Q و ماتریس POI P شباهت نوع POI بین مناطق مختلف است. انواع POI می توانند به تعیین عملکرد شهری کمک کنند. ردیف های ماتریس Pنشان دهنده نوع POI در این منطقه، و ستون ها نشان دهنده مکان واحد هستند. سپس، دو ستون نشان دهنده شباهت نوع POI در مناطق مختلف است. از طریق ادغام، انواع POI به منظور جبران کمبود معنایی به اشتراک گذاشته می شوند. اطلاعات مشترک N توسط ماتریس برهمکنش OD Q و ماتریس زمان-فرکانس OD R شباهت زمان برهمکنش بین سلول ها است. یک ردیف از ماتریس R نشان دهنده یک واحد و یک ستون نشان دهنده تغییر فرکانس OD این واحد در طول زمان است. دو ستون در ماتریس Rنشان دهنده شباهت زمان فعالیت افراد بین واحدها است و شباهت زمان های تعامل بین واحدها را می توان پس از ادغام به اشتراک گذاشت. از طریق همجوشی، شباهت زمان‌های تعامل بین واحدها به اشتراک گذاشته می‌شود تا تفاوت زمان‌های فعالیت ساکنان جبران شود. فرمول به شرح زیر است [ 50 ]:

L(اچ،م،ن)=12||دبلیو(س-(منتی))||اف2+α2||پ-(ماچتی)||اف2+β2||آر-(ننتی)||اف2+γ2(||اچ||اف2+||م||اف2+||ن||اف2)

که در آن L نشان دهنده روش همجوشی داده ها است، W نشان دهنده ماتریس وزن در محدوده [0، 1]، αبرای تنظیم تأثیر اطلاعات برهمکنش OD و دسته POI در تشخیص استفاده می شود و M ماتریس مشترک پس از فاکتورسازی Q و P است (یعنی Q و P از طریق M برهم کنش می کنند) . به همین ترتیب، βبرای تنظیم تأثیر برهمکنش OD و اطلاعات زمان-فرکانس در تشخیص استفاده می شود، و N ماتریس مشترک پس از تجزیه Q و R است (یعنی Q و R از طریق N برهم کنش می کنند ). سه عبارت اول فرمول (1) برای کنترل فاکتورسازی ماتریس و آخرین عبارت برای جلوگیری از برازش بیش از حد استفاده می شود. با الهام از ادبیات [ 51 ]، روش نزولی گرادیان تصادفی (SGD) به منظور بهینه‌سازی فرمول (1) برای دقت بالاتر بر اساس اطلاعات زمینه‌ای در شباهت بین زمان-فرکانس و اطلاعات POI درگیر شد. الگوریتم فاکتورسازی ماتریس پیشنهادی در الگوریتم 1 نشان داده شده است.

الگوریتم 1: الگوریتم فاکتورسازی ماتریس جفت شده با زمینه.
ورودی: ماتریس برهمکنش OD Q ، ماتریس POI P ، ماتریس زمان-فرکانس OD، R ، آستانه خطا ε ، شماره تکرار T
خروجی: Q’= MNT، قدرت ارتباط بین سفر کاربر و POI
1       مقدار دهی اولیه تصادفی H ،م،ن، نرخ نزول گرادیان γ
2       t = 1 را تنظیم کنید
3       اگر (t <T و Lt – Lt + 1 > ε)
4      برای محاسبه از روش SGD استفاده کنید ∂L∂اچ،∂L∂م،∂L∂ن
5      تنظیم  γ= 1
6      در حالی که (( L ( Mt -γ∂L∂اچ, Ut -γ∂L∂م ،Vt -γ∂L∂ن) > L ( H , M , N )) انجام دهید
7                  تنظیم  γ= γ/2
8                  Mt + 1 = Mt -γ∂L∂اچ، Ut + 1 = Ut -γ∂L∂م، Vt + 1 = Vt -γ∂L∂ن
9                  t = t + 1 را تنظیم کنید
10      حلقه پایانی
11       پایان اگر
12       بازگشت Q’ = MN T

4.3. خوشه بندی طیفی برای شناسایی مناطق عملکردی شهری

خوشه بندی طیفی الگوریتمی است که از نظریه گراف تکامل یافته است [ 52 ]. کاربردهای زیادی در یادگیری ماشین، بینایی کامپیوتر و تجزیه و تحلیل داده ها دارد. خوشه بندی طیفی مسئله خوشه بندی را به تجزیه طیفی ماتریس شباهت تبدیل می کند [ 53 ]. ایده اصلی طبقه بندی بردارهای مشخصه به دست آمده از تجزیه ویژگی است. در خوشه بندی، شباهت نشان دهنده ویژگی های داده ها است. وظیفه خوشه بندی طیفی تقسیم اشیاء به زیرگراف های مختلف توسط یک ماتریس شباهت است که در آن اشیاء درون زیرگراف ها مشابه یکدیگر هستند.
هنگامی که ماتریس شباهت W را داریم، می توانیم پارتیشن بندی نمودار را از طریق مراحل زیر انجام دهیم:
(1)
ماتریس مورب T را محاسبه کنید. مقادیر ماتریس T در مورب، مجموع سطرها یا ستون های مربوطه ماتریس W است.
(2)
ماتریس لاپلاسی L را محاسبه کنید . این یک ماتریس متقارن است که با تفریق ماتریس شباهت W از ماتریس مورب T تشکیل شده است.
(3)
تقسیم گراف بدون جهت را انجام دهید. ماتریس ابتدا با در نظر گرفتن مناطق به عنوان اشیاء نمودار و در نظر گرفتن شباهت به عنوان وزن برای اتصال آنها به شکل نمودار تبدیل می شود ( شکل 4 ). در شکل، «Min cut» نشان‌دهنده تقسیم‌بندی با کوچک‌ترین لبه برش، و «برش عادی» نشان‌دهنده تقسیم‌بندی تقریباً به همان اندازه با کوچک‌ترین لبه برش است. با توجه به ایده برش نمودار، اولین مقادیر ویژه K ماتریس شباهت پیدا می‌شود و سپس بردارهای ویژه مربوطه پیدا می‌شوند.
(4)
روش خوشه بندی k-means را برای بردارهای ویژگی خوشه ای اعمال کنید. بسیاری از مطالعات از روش‌های خوشه‌بندی مبتنی بر فضایی برای تعیین مناطق مانند k-means و DBSCAN استفاده کرده‌اند. این روش ها بر مجاورت فضایی موجودیت ها تمرکز می کنند و شباهت ها و اطلاعات معنایی موجودات را نادیده می گیرند. با این حال، روش خوشه بندی طیفی می تواند این شکاف را برطرف کند. علاوه بر این، خوشه بندی طیفی برای داده های پراکنده بهتر است زیرا فقط بر روی یک ماتریس شباهت تمرکز می کند.

در خوشه بندی طیفی، ماتریس Q’ از روش CCMF به عنوان داده ورودی استفاده می شود. توزیع فضایی مناطق عملکردی شهری شناسایی شده است. با این حال، ویژگی معنایی هر منطقه کاربردی هنوز ناشناخته است. در کار ما، روش‌های پرکاربرد چگالی فرکانس ( FD ) و نسبت طبقه‌بندی ( CP ) [ 5 ] به کار گرفته شد. فرمول FD به شرح زیر است:

افDمن=nمننمن  من=1، 2، 3، …، 6

جایی که منبه نوع POI اشاره دارد، nمنبه تعداد POI از انواع اشاره دارد مندر واحد، نمنبه تعداد کل POI از نوع، و افDمنبه چگالی فرکانس نوع اشاره دارد منPOI در تعداد کل POI های آن نوع.

فرمول محاسبه نسبت انواع مختلف در رابطه (3) نشان داده شده است:

سیپمن=افمن∑من=16افمن×100%  من=1، 2، 3،…، ک

جایی که سیپمنبه چگالی فرکانس نوع POI اشاره دارد مندر این منطقه، و k به نوع خوشه اشاره دارد.

داده های POI دارای اطلاعات معنایی غنی برای شناسایی انواع UFR هستند. در کار ما از قانون حداکثر نسبت برای تعیین نوع عملکردی استفاده می شود. هنگامی که نسبت یک نوع POI بزرگتر از سایرین باشد، این عملکرد این واحد به عنوان این نوع POI تعریف می شود. برخلاف روش سنتی تعیین تجربه انسانی، اطلاعات معنایی قدرتمند داده‌های POI به صورت کمی مورد استفاده قرار گرفت. بنابراین می توان به دقت بهتری دست یافت.

4.4. معیارهای ارزیابی

نتایج شناسایی هم از نظر کمی و هم از نظر کیفی مورد ارزیابی قرار گرفت. عامل کاپا و دقت کلی (OA) برای تعیین کمیت دقت شناسایی استفاده شد [ 54 ، 55 ، 56]. مقدار OA به نسبت تعداد دسته بندی های صحیح به تعداد کل دسته ها اشاره دارد، اگرچه مقدار OA شاخص خوبی برای دقت طبقه بندی است. با این حال، برای ویژگی‌های چند طبقه با تعداد بسیار نامتعادل عناصر دسته، ارزش آن بیشتر تحت تأثیر دسته‌هایی با تعداد دسته‌های بالا قرار می‌گیرد، برای هر دسته از ویژگی‌ها به خوبی مشخص نمی‌شود و نسبت طبقه‌بندی به طبقه‌بندی کاملاً تصادفی را نشان می‌دهد. تولید کاهش خطا آنها ثبات در اندازه گیری دقت روش های شناسایی UFR را نشان دادند. با الهام از کارهای موجود [ 57]، حقیقت زمین به صورت دستی با نقشه Gaode و Gaode Image شناسایی شد. مقایسه نشان می‌دهد که آیا نتایج شناسایی با انواع حقیقت پایه سازگار است یا خیر.

5. نتایج

5.1. ترکیب داده ها با روش پیشنهادی CCMF

روش CCMF پیشنهادی برای ترکیب اطلاعات معنایی داده‌های POI و نشان دادن شباهت بین واحدهای فضایی استفاده شد. شکل 5 یک نمودار شماتیک از ترکیب داده ها را نشان می دهد. ماتریس Q’ نتیجه همجوشی تبدیل از ماتریس اصلی Q است. M’ فاکتورهای مشترک را با در نظر گرفتن اطلاعات معنایی POI در فاکتورسازی ماتریس نشان می دهد. N’ فاکتورهای مشترک را با در نظر گرفتن شباهت واحدهای فضایی نشان می دهد. پس از ادغام، مقداری صفر از ماتریس اصلی Q پر شد. بنابراین، کار ما به خوبی پراکندگی داده‌های تعامل OD را جبران می‌کند.

5.2. نتایج شناسایی UFR

روش CCMF پیشنهادی برای ترکیب داده‌های POI و OD تاکسی استفاده شد. برای خوشه بندی از روش CP استفاده شد. سپس، به دنبال بررسی میدانی کاربری زمین شهری در چین و مشخصات فنی چینی (GB50137-2011)، زمین شهری به شش خوشه تقسیم شد: مسکونی، خدمات عمومی، تجاری و مالی، صنعتی، میدان سبز و حمل و نقل. توزیع مناطق عملکردی در شکل 6 ترسیم شده است . جدول 3 مقادیر CP POI را در خوشه های مختلف نشان می دهد.
خوشه 1: این خوشه منطقه مقدار CP بالایی را برای دسته مربع سبز نشان می دهد (0.219440). مهمتر از آن، این خوشه شامل نقاط گردشگری معمولی است. بنابراین، خوشه 1 مربع سبز (سبز) در نظر گرفته شد.
خوشه 2: شرکت ها در این منطقه عملکردی دارای ارزش CP بالایی هستند (0.172115). علاوه بر این، واحدهای فضایی تحت پوشش این خوشه شامل دانشگاه پکن و تالار بزرگ مردم است. بنابراین، خوشه 2 به عنوان خدمات عمومی (Pub) در نظر گرفته شد.
خوشه 3: مقادیر CP در دسته حمل و نقل (0.217904) در خوشه 3 نسبت به سایر مناطق مقادیر بالاتری دارد. این منطقه خوشه ای مهم ترین قطب های حمل و نقل در منطقه مورد مطالعه، از جمله ایستگاه قطار پکن و ایستگاه راه آهن پکن را پوشش می دهد. بنابراین، خوشه 3 حمل و نقل (Trans) در نظر گرفته شد.
خوشه 4: ارزش رده مسکونی (0.202814) در خوشه 4 بیشتر از سایر مناطق است. واحدهای فضایی تحت پوشش این خوشه شامل جامعه گانجیاکو و جامعه فانگ چنگ یوان است. بنابراین، خوشه 4 مسکونی (Res) ارزیابی شد.
خوشه 5: ارزش رده صنعتی (0.175169) در این زمینه بالا است. این منطقه خوشه‌ای دارای نشانه‌هایی مانند Zhongguancun و Wangjing است. بنابراین، خوشه 5 صنعتی (Ind) ارزیابی شد.
خوشه 6: این خوشه منطقه ارزش CP بالاتری را برای دسته تجاری و مالی نشان می دهد (0.198671) و دارای نشانه هایی از جمله Xidan و Xihongmen است. بنابراین، خوشه 6 تجاری و مالی (Comm) ارزیابی شد.

5.3. نتایج تجزیه و تحلیل مقایسه دقت

به منظور اعتبارسنجی کامل دقت شناسایی UFR، سه آزمایش طراحی شد. اولین مورد تجزیه و تحلیل دقت روش CCMF پیشنهادی ما از دیدگاه کمی و کیفی بود. در آزمایش دوم، مقایسه دقت بین داده‌های CCMF ذوب شده و داده‌های منفرد غیر ذوب شده انجام شد. در نهایت با توجه به اهمیت روش های خوشه بندی در شناسایی UFR، مقایسه روش های مختلف خوشه بندی انجام شد.

5.3.1. تجزیه و تحلیل دقت با روش پیشنهادی CCMF

به منظور تأیید صحت تشخیص، تحلیل‌های کمی و کیفی انجام دادیم. تجزیه و تحلیل کمی شامل محاسبه مقادیر OA و کاپا بود. اینها با انتخاب تصادفی 30 واحد برای هر نوع منطقه عملکردی و مقایسه آنها با حقیقت زمینی به دست آمده از نقشه گاود محاسبه شد. جدول 4دقت شناسایی داده های ذوب شده را با توجه به روش CCMF پیشنهادی نشان می دهد. OA به 90% رسید و مقدار کاپا 0.88 بود. دقت کاربر (UA) نشان‌دهنده درصد شناسایی‌های صحیح در این دسته است، در حالی که دقت تولیدکننده (PA) نشان‌دهنده احتمال شناسایی صحیح داده‌های مرجع واقعی این دسته است. ارزش UA برای مسکونی 90٪، برای خدمات عمومی 90٪، برای تجاری و مالی 93٪، و برای میدان سبز 93٪ بود، در حالی که این ارزش برای هر دو صنعت و حمل و نقل 87٪ بود. در مورد PA، صنعتی 96 درصد، تجاری و مالی 97 درصد، حمل و نقل 96 درصد، مسکونی 82 درصد، خدمات عمومی 84 درصد و میدان سبز ارزش دارند. به ارزش 85 درصد.
تجزیه و تحلیل کیفی با استفاده از یک رویکرد تجسم تعاملی با نقشه Gaode و تصویر Gaode تایید شد. جدول 5 برخی از واحدهای فضایی معمولی را نشان می دهد. نتایج نشان می دهد که روش CCMF می تواند به طور موثر UFR ها را در پکن شناسایی کند.
نتایج اعتبار سنجی نشان داد که مدل فاکتورسازی ماتریس آگاه از زمینه دارای دقت شناسایی قوی است، اما هنوز برخی از خطاها وجود دارد. دلایل اصلی نتایج اشتباه در زیر توضیح داده شده است.
(1)
یکی از دلایل چند کارکردی بودن منطقه است. اولا، معمولاً داده های POI بسیار غنی از مناطق تجاری و مالی نزدیک به مسکونی وجود دارد. به همین ترتیب، معمولاً پارک ها یا میدان هایی در نزدیکی محله های مرتفع وجود دارد که ممکن است به اشتباه طبقه بندی شوند و در نتیجه تعداد مناطق مسکونی بسیار کمتر از داده های واقعی باشد. دوم، بر اساس وضعیت فعلی پکن، مراکز خرید بزرگی در بسیاری از ایستگاه‌های مترو وجود دارد، به طوری که هدف افراد با داده‌های POI و داده‌های OD به خوبی مشخص نمی‌شود.
(2)
دلیل دیگر این است که این منطقه قابل تملک نیست. داده‌های POI تمایل به انتزاع موجودیت‌های فضایی به‌عنوان نقاط بدون منطقه دارند، در حالی که در زندگی واقعی، مساحت موجودیت‌ها نیز یکی از عوامل مهم شناسایی مناطق عملکردی شهری است.
5.3.2. تجزیه و تحلیل دقیق داده های منفرد بدون فیوزینگ
آزمایشی برای مقایسه دقت شناسایی بین داده‌های ذوب شده و داده‌های منفرد غیر ذوب شده (داده‌های مسیر POI و تاکسی OD، به طور جداگانه) طراحی شد. برای داده‌های POI، تخمین چگالی هسته برای شناسایی مناطق فضایی کاربردی شهری و خوشه‌بندی DBSCAN برای تعیین نوع عملکردی معنایی آن‌ها استفاده شد. برای داده‌های OD تاکسی، روش فاصله DTW و خوشه‌بندی طیفی برای شناسایی UFR استفاده شد. برای آزمایش فیوژن، روش CCMF پیشنهادی ما بود و نتایج در بخش فرعی بالا نشان داده شده است.
نتایج در شکل 7 نشان داده شده است. شش ناحیه معمولی که با دایره‌ها برچسب‌گذاری شده و در شکل 7 شماره گذاری شده‌اند، برای اعتبارسنجی انتخاب شدند. جدول 6 نتایج مقایسه و دقت را با مقادیر OA و کاپا نشان می دهد. حقیقت زمین از نقشه Gaode بدست آمد. نتایج نشان می دهد که دقت شناسایی بر اساس یک منبع داده واحد کمتر از آن است که بر اساس داده های ترکیب شده است.
5.3.3. تجزیه و تحلیل دقت روش های مختلف خوشه بندی
یک آزمایش مقایسه برای تأیید اثربخشی خوشه‌بندی طیفی طراحی شد. روش های مرجع مورد استفاده k-means و DBSCAN بودند. نتایج در شکل 8 نشان داده شده است . شش منطقه معمولی که با دایره ها و اعداد برچسب گذاری شده بودند، برای اعتبار سنجی کیفی انتخاب شدند. نتایج شناسایی و دقت در جدول 7 ارائه شده است. نتایج نشان می دهد که روش خوشه بندی طیفی عملکرد بهتری نسبت به دو روش دیگر دارد.

6. بحث

6.1. مقایسه دقت شناسایی

(1) مقایسه دقت با داده های منفرد غیر ذوب شده.
همانطور که در جدول 6 نشان داده شده است ، دقت برای داده های ذوب شده بیشتر از داده های منفرد غیر ذوب شده بود. این نتیجه مورد انتظار بود، زیرا داده های ترکیبی آماده شده منجر به یک نتیجه شناسایی بهتر می شود.
علاوه بر این، این را می توان از ویژگی های داده نیز فهمید. یک منبع داده تنها می تواند یک دیدگاه از مناطق عملکردی شهری را بیان کند، به طوری که دقت پایین خواهد بود. داده‌های POI داده‌های ثابت با اطلاعات معنایی غنی هستند، در حالی که داده‌های OD پویا هستند و می‌توانند فعالیت‌های روزانه ساکنان شهر را مشخص کنند. برای داده‌های POI، هر POI فقط می‌تواند یک نقطه را نشان دهد و تأثیر ناحیه مجاور و مقیاس فضایی (مثلاً مساحت و طول) را در نظر نمی‌گیرد. همین امر برای داده‌های OD نیز صادق است، که می‌تواند فعالیت‌های ساکنان را تا حدی منعکس کند، هرچند بدون اطلاعات معنایی. ادغام این دو نوع داده نه تنها می تواند جامعیت داده ها را افزایش دهد، بلکه مقادیر از دست رفته را نیز پر می کند. بنابراین می توان به دقت بالایی دست یافت.
(2) مقایسه دقت با سایر روش های خوشه بندی.
از نظر اصول روش خوشه بندی، خوشه بندی طیفی روش مناسب تری برای داده های ما است. K-means، DBSCAN و خوشه بندی طیفی همه روش های طبقه بندی بدون نظارت هستند که برای طبقه بندی داده های مشابه به گروه ها استفاده می شوند. الگوریتم k-means عملکرد خوشه‌بندی خوبی برای داده‌های با توزیع گاوسی دارد، به طوری که الزامات داده‌ها سخت‌گیرانه است. DBSCAN یک روش خوشه‌بندی مبتنی بر چگالی است که برخلاف روش k-means از خوشه‌بندی شکل دلخواه برای داده‌های متراکم پشتیبانی می‌کند. با این حال، اگر چگالی داده ها یکنواخت نباشد، نتیجه خوشه بندی DBSCAN ضعیف است. خوشه بندی طیفی به جای توزیع فضایی بر ویژگی های مشابه ذاتی داده ها تمرکز دارد. بنابراین، این روش می تواند نگرانی داده ها را برطرف کند.
برای کار ما، داده های POI و مسیر تاکسی OD غیر گاوسی هستند و به شکل ماتریس ذخیره می شوند. توزیع فضایی ناهموار نیز قابل توجه است. تراکم داده ها در برخی مناطق تجاری و مالی و مربع سبز بیشتر است، در حالی که حجم داده ها در برخی مناطق مسکونی کمتر است. بنابراین، روش‌های خوشه‌بندی k-means و DBSCAN دقت تشخیص کمتری برای داده‌های ما دارند. از سوی دیگر، خوشه بندی طیفی تنها به یک ماتریس شباهت بین منابع داده نیاز دارد. بنابراین، این به عنوان بهترین رویکرد برای خوشه بندی مناطق انتخاب شد.

6.2. مقایسه با سایر روش های فیوژن

همانطور که در مطالعات دیگر [ 58 ، 59 ] مشخص شد، مقایسه دقت گزارش شده کار مشابه به طور گسترده به عنوان یک روش اعتبارسنجی دقت استفاده شد. بنابراین، برخی از مطالعات مشابه را، همانطور که در جدول 8 نشان داده شده است ، با توجه به حوزه موردی و روش شناسی انتخاب کردیم.
بر اساس این فرض که این روش ها به دقت مشابهی با انواع مختلف داده ها دست یافتند، ما دقت گزارش شده آنها را به عنوان متغیرهای مقایسه اتخاذ کردیم. جدول 8 روش های انتخاب شده و نتایج دقت را نشان می دهد. در آزمایش های مقایسه، پارامترهای فرمول (1) روش پیشنهادی ما به صورت تنظیم شد α= 0.1، β= 0.5 و γ= 0.01. نویسندگان [ 13 ] یک استراتژی همجوشی تصمیم را در جاده کمربندی پنجم پکن پیشنهاد کردند (خط اول جدول 8 )، که همان منطقه مورد مطالعه در کار ما است. با این حال، روش پیشنهادی ما به دقت بالاتری دست یافت. نویسندگان [ 44 ] یک مدل CC-FLU (خط دوم جدول 8 ) را بر اساس همان اصل روش پیشنهادی ما پیشنهاد کردند، اما دقت کار ما حدود 5 درصد بیشتر بود. سه روش دیگر در جدول 8 روش های همجوشی مبتنی بر پلت فرم [ 33 ]، مبتنی بر ویژگی [ 56 ] و مبتنی بر تصمیم [ 40 ] را نشان می دهند. نتایج ارائه شده در جدول 8نشان می دهد که روش ما مقدار OA کمی کمتر از روش مبتنی بر چارچوب یادگیری SOE دارد، اما ضریب کاپا بالاتری دارد. ضریب کاپا کمی بالاتر است، به این معنی که طبقه بندی این مقاله دقیق تر است. بنابراین، روش ما سازگاری طبقه بندی بالاتری را نشان می دهد. در این مقاله، توزیع تعداد مناطق عملکردی نامتعادل است. تعداد مناطق حمل و نقل بسیار کمتر از سایر مناطق کاربردی است، در حالی که تعداد مناطق مسکونی به طور قابل توجهی بیشتر از مناطق دیگر است. بنابراین، مقدار OA نشانه خوبی از برتری روش نیست. علاوه بر این، مقدار کمی کمتر OA ممکن است به دلیل پردازش داده باشد. به عنوان مثال، هنگام نزدیک شدن به مقصد، برخی از رانندگان دستگاه اندازه گیری را از قبل کار می کنند، تغییر مصنوعی وضعیت اشغال خودرو به خالی. برخی از ایستگاه های تاکسی در جاده هستند و در منطقه خاصی نیستند. پردازش ممکن است منجر به نقاط OD شود که با منطقه واقعی که در آن قرار دارند مطابقت ندارند. در آینده، ما از داده های مختلف استفاده خواهیم کرد و ابزارهای پیشرفته تری برای پردازش داده ها برای تحقیقات بیشتر به منظور بهبود دقت تشخیص اضافه خواهیم کرد. در مجموع، این نتایج نشان دهنده عملکرد خوب روش پیشنهادی ما است.

6.3. تاثیر پارامترها بر دقت

مزیت روش ما این است که می تواند اطلاعات معنایی، تعاملی و شباهت واحد فضایی POI را در خود جای دهد. مولفه های αو βاطلاعات ویژگی را از تعامل OD، POI، و ماتریس های زمان-فرکانس OD متعادل کنید. اگر α = 0 و β= 0، روش فقط داده های تعامل OD را استخراج می کند. اگر α= inf و β= 0، این نشان دهنده ادغام داده های تعامل POI و OD است. اگر α = inf و β= inf، سه نوع داده با فاکتورسازی ماتریسی ترکیب می شوند. بنابراین، ارزش های αو βتاثیر بسزایی در دقت شناسایی دارند. برای تعیین پارامترها از روش متغیر کنترل و روش اعتبار سنجی تکراری استفاده کردیم. α برای تنظیم اثر Q و P در تشخیص استفاده می شود و βبرای تنظیم اثر Q و R در تشخیص استفاده می شود. برای تعیین آنها می توان آنها را جداگانه مطالعه کرد. ابتدا، β روی مقدار 0 تنظیم می شود. در این زمان، فقط ادغام Q و P مورد مطالعه قرار می گیرد و اثر همجوشی زمانی بهتر است که مقدار α بعد از اعتبار سنجی تکراری 0.1 باشد. بنابراین، α روی 0.1 تنظیم می شود. همجوشی Q و R مورد مطالعه قرار می گیرد که تعیین مقدار بهینه β است. فرآیند فوق قابل تعویض است و به همین ترتیب می توان ابتدا β و سپس α را تعیین کرد. روشی که با استفاده از آموزش شبکه عصبی ممکن است بتواند به طور همزمان تعیین شود، که جهت تحقیقات آینده ما است. ماتریس سردرگمی برای محاسبه مقادیر OA و کاپا برای اعتبار سنجی روش پیشنهادی استفاده شد. شکل 9 روند دقت را با مقادیر مختلف این پارامترها نشان می دهد. همانطور که در شکل 9 الف نشان داده شده است، با افزایش αمقادیر کاپا و OA نیز افزایش یافت. چه زمانی αاز 0.1 فراتر رفت، دقت کاهش یافت. بنابراین 0.1 به عنوان مقدار انتخاب شد α. با استفاده از این به عنوان مبنا، مقدار آن را تعیین کردیم β. به طور مشابه، شکل 9 ب نشان می دهد که OA و کاپا با افزایش مقادیر افزایش یافته و سپس کاهش می یابند. β; زمانی که به بالاترین مقدار رسیدند β= 0.5. بدین ترتیب، α= 0.1 و β0.5 = به عنوان مقادیر پارامتر برای آزمایش در این مقاله انتخاب شد.

7. نتیجه گیری

در این مقاله، یک روش فاکتورسازی ماتریس همراه با زمینه (CCMF) برای ترکیب داده‌ها با در نظر گرفتن روابط متنی بین منابع داده‌های مختلف پیشنهاد شد. هدف از تحقیق ما ارائه روشی دقیق تر برای ترسیم مناطق عملکردی شهری بود. اصل روش ما استفاده از فاکتورسازی ماتریس برای شناسایی UFR ها است. این ایده به طور گسترده در تحقیقات توصیه شده استفاده شده است، اما به ندرت در شناسایی عملکرد شهری استفاده می شود. روش پیشنهادی با ترکیب داده‌های POI و OD تاکسی در پکن، چین تأیید شد. نتایج نشان‌دهنده عملکرد برتر در OA و در مقایسه با منابع داده منفرد غیر ترکیبی و سایر مدل‌های مشابه است. روش CCMF در مقایسه با روش مشابه در ناحیه مورد، دقت را حدود 5 درصد بهبود بخشید. با این حال، کار ما بر روش شناسی متمرکز بود. هنوز جای پیشرفت وجود دارد. به عنوان مثال، کار بعدی ما نواحی عملکردی مختلط را با دانه بندی خوب بررسی خواهد کرد.

منابع

  1. لیو، ی. وانگ، اف. شیائو، ی. گائو، جنوب. استفاده از زمین شهری و ترافیک “مناطق منبع غرق”: شواهد از داده های تاکسی مجهز به GPS در شانگهای. Landsc. طرح شهری. 2012 ، 106 ، 73-87. [ Google Scholar ] [ CrossRef ]
  2. هو، ی. Han, Y. شناسایی مناطق عملکردی شهری بر اساس داده های POI: مطالعه موردی منطقه توسعه اقتصادی و فناوری گوانگژو. پایداری 2019 ، 11 ، 1385. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  3. فریاس مارتینز، وی. فریاس مارتینز، E. خوشه بندی طیفی برای سنجش کاربری زمین شهری با استفاده از فعالیت توییتر. مهندس Appl. آرتیف. هوشمند 2014 ، 35 ، 237-245. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  4. جنرال الکتریک، پی. او، جی. ژانگ، اس. ژانگ، ال. She, J. یک چارچوب یکپارچه ترکیبی از ویژگی های چندگانه فعالیت انسانی برای طبقه بندی کاربری زمین. ISPRS Int. J. Geo-Inf. 2019 ، 8 ، 90. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  5. گائو، کیو. فو، جی. یو، ی. تانگ، X. شناسایی عملکردهای مناطق شهری در چنگدو، چین، بر اساس داده های مسیر خودرو. PLoS ONE 2019 , 14 , e0215656. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  6. شیائو، دی. ژانگ، ایکس. Hu, Y. روش شناسایی منطقه عملکردی شهری بر اساس داده های بزرگ موبایل. Xitong Fangzhen Xuebao/J. سیستم شبیه سازی 2019 ، 31 ، 2281-2288. [ Google Scholar ] [ CrossRef ]
  7. بله، سی. ژانگ، اف. مو، ال. گائو، ی. لیو، ی. تشخیص عملکرد شهری با ادغام رسانه های اجتماعی و تصاویر در سطح خیابان. محیط زیست طرح. ب مقعد شهری. علوم شهر 2021 ، 48 ، 1430-1444. [ Google Scholar ] [ CrossRef ]
  8. یوان، جی. ژنگ، ی. Xie, X. کشف مناطق با عملکردهای مختلف در یک شهر با استفاده از تحرک انسان و POI. در مجموعه مقالات هجدهمین کنفرانس بین المللی ACM SIGKDD در مورد کشف دانش و داده کاوی، پکن، چین، 12 تا 16 اوت 2012. ص 186-194. [ Google Scholar ] [ CrossRef ]
  9. یو، م. لی، جی. Lv، Y.; زینگ، اچ. وانگ، اچ. تشخیص ناحیه عملکردی و تجزیه و تحلیل شدت استفاده بر اساس داده‌های چند منبع: مطالعه موردی جینان، چین. ISPRS Int. J. Geo-Inf. 2021 ، 10 ، 640. [ Google Scholar ] [ CrossRef ]
  10. دای، پی. جینگ، سی. دو، م. Zhou، W. روشی مبتنی بر تحلیلگر فضایی برای تشخیص نقطه داغ رویدادهای مدیریت اجزای شهری. در مجموعه مقالات دومین کنفرانس بین المللی IEEE در سال 2015 در مورد داده کاوی مکانی و خدمات دانش جغرافیایی (ICSDM)، فوژو، چین، 8 تا 10 ژوئیه 2015؛ صص 55-59. [ Google Scholar ] [ CrossRef ]
  11. کیان، ز. لیو، ایکس. تائو، اف. ژو، تی. شناسایی مناطق عملکردی شهری با جفت کردن تصاویر ماهواره ای و مسیرهای GPS تاکسی. Remote Sens. 2020 , 12 , 2449. [ Google Scholar ] [ CrossRef ]
  12. منگ، تی. جینگ، ایکس. یان، ز. Pedrycz, W. نظرسنجی در مورد یادگیری ماشین برای ترکیب داده ها. Inf. فیوژن 2020 ، 57 ، 115-129. [ Google Scholar ] [ CrossRef ]
  13. جیا، ی. Ge، Y. لینگ، اف. گوا، ایکس. وانگ، جی. وانگ، ال. چن، ی. Li, X. نقشه‌برداری کاربری زمین شهری با ترکیب تصاویر سنجش از دور و داده‌های موقعیت‌یابی تلفن همراه. Remote Sens. 2018 , 10 , 446. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  14. زینگ، اچ. Meng, Y. ادغام معیارهای چشم انداز و ویژگی های اجتماعی-اقتصادی برای طبقه بندی منطقه عملکردی شهری. محاسبه کنید. محیط زیست سیستم شهری 2018 ، 72 ، 134-145. [ Google Scholar ] [ CrossRef ]
  15. ژو، جی. تائو، سی. لین، ایکس. پنگ، جی. هوانگ، اچ. چن، ال. وانگ، کیو. یک مدل مبتنی بر زیرفضاهای چندگانه: تفسیر مناطق عملکردی شهری با داده‌های بزرگ مکانی. ISPRS Int. J. Geo-Inf. 2021 ، 10 ، 66. [ Google Scholar ] [ CrossRef ]
  16. جینگ، سی. دونگ، ام. دو، م. زو، ی. Fu, J. دینامیک فضایی و زمانی گردشگران ورودی بر اساس عکس های دارای برچسب جغرافیایی: مطالعه موردی در پکن، چین. دسترسی IEEE 2020 ، 8 ، 28735–28745. [ Google Scholar ] [ CrossRef ]
  17. هرولد، ام. لیو، XH; Clarke، KC معیارهای فضایی و بافت تصویر برای نقشه برداری کاربری زمین شهری. فتوگرام مهندس Remote Sens. 2003 , 69 , 991-1001. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  18. وانگ، ی. وانگ، تی. Tsou، MH; لی، اچ. جیانگ، دبلیو. Guo, F. نقشه‌برداری از الگوهای پویای کاربری زمین شهری با رسانه‌های اجتماعی برچسب‌گذاری شده جغرافیایی جمع‌سپاری شده (Sina-Weibo) و مجموعه‌های تجاری در پکن، چین. Sustainability 2016 , 8 , 1202. [ Google Scholar ] [ CrossRef ][ Green Version ]
  19. پاپاداکیس، ای. گائو، اس. Baryannis، G. ترکیب الگوهای طراحی و مدل‌سازی موضوع برای کشف مناطقی که از عملکرد خاصی پشتیبانی می‌کنند. ISPRS Int. J. Geo-Inf. 2019 ، 8 ، 385. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  20. ژانگ، ایکس. دو، اس. وانگ، Q. شناخت معنایی سلسله مراتبی برای مناطق عملکردی شهری با تصاویر ماهواره ای VHR و داده های POI. ISPRS J. Photogramm. Remote Sens. 2017 ، 132 ، 170-184. [ Google Scholar ] [ CrossRef ]
  21. کائو، آر. تو، دبلیو. یانگ، سی. لی، کیو. لیو، جی. ژو، جی. ژانگ، Q. لی، کیو. کیو، جی. ادغام داده های سنجش از راه دور و اجتماعی مبتنی بر یادگیری عمیق برای تشخیص عملکرد منطقه شهری. ISPRS J. Photogramm. Remote Sens. 2020 , 163 , 82–97. [ Google Scholar ] [ CrossRef ]
  22. بائو، اچ. مینگ، دی. گوا، ی. ژانگ، ک. ژو، ک. تشخیص معنایی مبتنی بر DFCNN Du، S. از مناطق عملکردی شهری با ادغام داده‌های سنجش از دور و داده‌های POI. Remote Sens. 2020 , 12 , 1088. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  23. ژانگ، سی. سارجنت، آی. پان، X. لی، اچ. گاردینر، آ. هار، جی. اتکینسون، PM یک شبکه عصبی کانولوشن مبتنی بر شی (OCNN) برای طبقه‌بندی کاربری زمین شهری. سنسور از راه دور محیط. 2018 ، 216 ، 57-70. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  24. پی، تی. سوبولفسکی، اس. راتی، سی. شاو، اس ال. لی، تی. ژو، سی. بینشی جدید در طبقه بندی کاربری زمین بر اساس داده های تلفن همراه جمع آوری شده است. بین المللی جی. جئوگر. Inf. علمی 2014 ، 28 ، 1988-2007. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  25. Toole، JL; اولم، ام. گونزالس، ام سی؛ بائر، دی. استنباط کاربری زمین از فعالیت تلفن همراه. در مجموعه مقالات کارگاه بین المللی ACM SIGKDD در محاسبات شهری، پکن، چین، 12 اوت 2012. صص 1-8. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  26. کانگ، سی. شی، ال. وانگ، اف. لیو، ی. گروه‌های اجتماعی چگونه از مکان‌های شهری بازدید می‌کنند؟ شواهدی از فاکتورسازی ماتریس روی داده های تلفن همراه ترانس. GIS 2020 ، 24 ، 1504-1525. [ Google Scholar ] [ CrossRef ]
  27. کانگ، سی. Qin، K. درک رفتارهای عملیاتی تاکسی ها در شهرها با فاکتورسازی ماتریسی. محاسبه کنید. محیط زیست سیستم شهری 2016 ، 60 ، 79-88. [ Google Scholar ] [ CrossRef ]
  28. ژانگ، پی. لی، تی. وانگ، جی. لو، سی. چن، اچ. ژانگ، جی. وانگ، دی. یو، زی. تلفیق اطلاعات چند منبعی بر اساس نظریه مجموعه‌های خشن: یک بررسی. Inf. فیوژن 2021 ، 68 ، 85-117. [ Google Scholar ] [ CrossRef ]
  29. بایوض، ک. کنانی، ر. حمدایی، ف. Mtibaa، A. نظرسنجی در مورد یادگیری عمیق چندوجهی برای بینایی کامپیوتر: پیشرفت‌ها، گرایش‌ها، برنامه‌ها و مجموعه داده‌ها. Vis. محاسبه کنید. 2021 ، 1-32. [ Google Scholar ] [ CrossRef ]
  30. استبان، ج. استار، ا. ویلتز، آر. هانا، پی. Bryanston-Cross, P. مروری بر مدل‌ها و معماری‌های ترکیب داده‌ها: به سوی دستورالعمل‌های مهندسی. محاسبات عصبی Appl. 2005 ، 14 ، 273-281. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  31. شیائو، جی. شن، ی. جی، جی. تطیشی، ر. تانگ، سی. لیانگ، ی. Huang، Z. ارزیابی گسترش شهری و تغییر کاربری زمین در شیجیاژوانگ، چین، با استفاده از GIS و سنجش از دور. Landsc. طرح شهری. 2006 ، 75 ، 69-80. [ Google Scholar ] [ CrossRef ]
  32. عاصم، اچ. خو، ال. بودا، تی اس؛ O’Sullivan، D. رویکرد خوشه بندی فضایی-زمانی برای تشخیص مناطق عملکردی در شهرها. در مجموعه مقالات بیست و هشتمین کنفرانس بین المللی IEEE 2016 در مورد ابزارهای با هوش مصنوعی (ICTAI)، سن خوزه، کالیفرنیا، ایالات متحده آمریکا، 6 تا 8 نوامبر 2016؛ صص 370-377. [ Google Scholar ] [ CrossRef ]
  33. آهنگ، جی. لین، تی. لی، ایکس. پریشچپوف، نقشه برداری AV مناطق عملکردی شهری با ادغام تصاویر سنجش از دور با وضوح بسیار بالا و نقاط مورد علاقه: مطالعه موردی Xiamen، چین. Remote Sens. 2018 ، 10 ، 1737. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  34. ژنگ، ی. روش‌شناسی برای تلفیق داده‌های متقابل دامنه: یک مرور کلی. IEEE Trans. کلان داده 2015 ، 1 ، 16-34. [ Google Scholar ] [ CrossRef ]
  35. تو، دبلیو. هو، ز. لی، ال. کائو، جی. جیانگ، جی. لی، کیو. لی، کیو. به تصویر کشیدن مناطق عملکردی شهری با جفت کردن تصاویر سنجش از دور و داده‌های سنجش انسان. Remote Sens. 2018 , 10 , 141. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  36. ژو، دبلیو. مینگ، دی. Lv، X.; ژو، ک. بائو، اچ. Hong, Z. SO-CNN بر اساس تقسیم بندی دقیق منطقه عملکردی شهری با تصویر سنجش از دور VHR. سنسور از راه دور محیط. 2020 ، 236 ، 111458. [ Google Scholar ] [ CrossRef ]
  37. ژای، ی. یائو، ی. گوان، کیو. لیانگ، ایکس. لی، ایکس. پان، ی. یو، اچ. یوان، ز. ژو، جی. شبیه سازی تغییر کاربری زمین شهری با ادغام یک شبکه عصبی کانولوشنال با اتوماتای ​​سلولی مبتنی بر برداری. بین المللی جی. جئوگر. Inf. علمی 2020 ، 34 ، 1475-1499. [ Google Scholar ] [ CrossRef ]
  38. کائو، ک. گوا، اچ. ژانگ، ی. مقایسه رویکردهای طبقه‌بندی مناطق عملکردی شهری بر اساس داده‌های چندمنبعی جغرافیایی: مطالعه موردی در منطقه یوژونگ، چونگ کینگ، چین. پایداری 2019 ، 11 ، 660. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  39. یو، بی. وانگ، ز. مو، اچ. سان، ال. هو، اف. شناسایی مناطق عملکردی شهری بر اساس داده‌های مسیر خودروی شناور و داده‌های POI. پایداری 2019 ، 11 ، 6541. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  40. فنگ، ی. هوانگ، ز. وانگ، ی. وان، ال. لیو، ی. ژانگ، ی. شان، ایکس. یک چارچوب آموزشی مبتنی بر SOE با استفاده از داده های بزرگ چند منبعی برای شناسایی مناطق عملکردی شهری. IEEE J. Sel. بالا. Appl. زمین Obs. Remote Sens. 2021 , 14 , 7336–7348. [ Google Scholar ] [ CrossRef ]
  41. سریواستاوا، اس. بارگاس-مونوز، جی. Tuia، D. درک استفاده از زمین شهری از دیدگاه های بالا و زمین: یک یادگیری عمیق، راه حل چندوجهی. سنسور از راه دور محیط. 2019 ، 228 ، 129-143. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  42. گووین، ال. پانیسون، آ. کاتتوتو، سی. تشخیص ساختار جامعه و الگوهای فعالیت شبکه های زمانی: یک رویکرد فاکتورسازی تانسور غیر منفی. PLoS ONE 2014 ، 9 ، e86028. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  43. ژانگ، دبلیو. جی، سی. یو، اچ. ژائو، ی. Chai، Y. تغییرات بین فردی و درون فردی در الگوهای فعالیت روزانه سفر: تحلیل فضایی و زمانی شبکه ای. ISPRS Int. J. Geo-Inf. 2021 ، 10 ، 148. [ Google Scholar ] [ CrossRef ]
  44. ژانگ، ی. لی، کیو. تو، دبلیو. مای، ک. یائو، ی. چن، ی. تشخیص کاربری زمین شهری کاربردی با ادغام داده‌های مکانی چند منبعی و همبستگی‌های متقابل. محاسبه کنید. محیط زیست سیستم شهری 2019 ، 78 ، 101374. [ Google Scholar ] [ CrossRef ]
  45. وانگ، جی. بله، ی. Fang, F. مطالعه منطقه‌بندی عملکردی شهری بر اساس داده‌های چگالی و همجوشی هسته‌ای. Geogr. Geo-Inf. علمی 2019 ، 35 ، 66-71. [ Google Scholar ] [ CrossRef ]
  46. ژو، بی. ژائو، بی. شیائو، ایکس. لی، جی. Xie، X. رن، دبلیو. یک مطالعه مبتنی بر داده‌های پوی در مناطق عملکردی شهری شهر مبتنی بر منابع: مطالعه موردی بنشی، لیائونینگ. هوم Geogr. 2020 ، 35 ، 81-90. [ Google Scholar ] [ CrossRef ]
  47. کیم، ک. لی، ک. رسیدگی به نقاط مورد علاقه (POIs) در یک سرویس نقشه وب تلفن همراه مرتبط با اشیاء فضایی داخلی: مطالعه موردی. ISPRS Int. J. Geo-Inf. 2018 ، 7 ، 216. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  48. یی، بی. شن، ایکس. لیو، اچ. ژانگ، ز. ژانگ، دبلیو. لیو، اس. Xiong، N. فاکتورسازی ماتریس عمیق با تعبیه بازخورد ضمنی برای سیستم توصیه. IEEE Trans. Ind. اطلاع رسانی. 2019 ، 15 ، 4591-4601. [ Google Scholar ] [ CrossRef ]
  49. شکوهی یکتا، م. هو، بی. جین، اچ. وانگ، جی. Keogh, E. تعمیم DTW به حالت چند بعدی نیاز به یک رویکرد تطبیقی ​​دارد. حداقل داده بدانید. کشف کنید. 2016 ، 31 ، 1-31. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  50. ما، اچ. یانگ، اچ. لیو، ام آر؛ King, I. SoRec: توصیه اجتماعی با استفاده از فاکتورسازی ماتریس احتمالی. در مجموعه مقالات هفدهمین کنفرانس ACM در مدیریت اطلاعات و دانش، دره ناپا، کالیفرنیا، ایالات متحده آمریکا، 26 تا 30 اکتبر 2008. ص 931-940. [ Google Scholar ] [ CrossRef ]
  51. دو، آر. لو، جی. Cai, H. الگوریتم پیشنهاد فاکتورسازی ماتریس منظم سازی دوگانه. IEEE Access 2019 ، 7 ، 139668–139677. [ Google Scholar ] [ CrossRef ]
  52. فیدلر، ام. اتصال جبری نمودارها. چکسلوف ریاضی. J. 1973 , 23 , 298-305. [ Google Scholar ] [ CrossRef ]
  53. شی، ج. Malik, J. برش های عادی و تقسیم بندی تصویر. IEEE Trans. الگوی مقعدی ماخ هوشمند 2000 ، 22 ، 888-905. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  54. ژو، ام. لو، ال. گوا، اچ. ونگ، کیو. کائو، اس. ژانگ، اس. لی، کیو. پراکندگی شهری و تغییرات در بهره وری استفاده از زمین در منطقه پکن-تیانجین-هبی، چین از سال 2000 تا 2020: تجزیه و تحلیل مکانی-زمانی با استفاده از داده های مشاهده زمین. Remote Sens. 2021 , 13 , 2850. [ Google Scholar ] [ CrossRef ]
  55. سان، ز. جیائو، اچ. وو، اچ. پنگ، ز. Liu, L. Block2vec: رویکردی برای شناسایی مناطق عملکردی شهری با ادغام مدل جاسازی جمله و نقاط مورد علاقه. ISPRS Int. J. Geo-Inf. 2021 ، 10 ، 339. [ Google Scholar ] [ CrossRef ]
  56. او، X. یوان، ایکس. ژانگ، دی. ژانگ، آر. لی، ام. ژو، سی. تعیین مرز تراکم شهری بر اساس ترکیب داده های بزرگ چند منبعی – مطالعه موردی منطقه خلیج بزرگ گوانگدونگ-هنگ کنگ-ماکائو (GBA). Remote Sens. 2021 , 13 , 1801. [ Google Scholar ] [ CrossRef ]
  57. لیو، ایکس. تیان، ی. ژانگ، ایکس. Wan, Z. شناسایی مناطق عملکردی شهری در چنگدو بر اساس داده‌های سری زمانی مسیر تاکسی. ISPRS Int. J. Geo-Inf. 2020 ، 9 ، 158. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  58. دو، اس. دو، اس. لیو، بی. ژانگ، ایکس. Zheng, Z. نقشه‌برداری منطقه عملکردی شهری در مقیاس بزرگ با ادغام تصاویر سنجش از دور و داده‌های اجتماعی باز. GIScience Remote Sens. 2020 ، 57 ، 411-430. [ Google Scholar ] [ CrossRef ]
  59. ژونگ، ی. سو، ی. وو، اس. ژنگ، ز. ژائو، جی. ما، ا. زو، س. بله، آر. لی، ایکس. پلیککا، پ. و همکاران نقشه‌برداری کاربری زمین شهری مبتنی بر داده‌های منبع باز با ادغام اشیاء معنایی نقطه-خط-چند ضلعی: مطالعه موردی شهرهای چین. سنسور از راه دور محیط. 2020 , 247 , 111838. [ Google Scholar ] [ CrossRef ]
شکل 1. منطقه مطالعه در جاده کمربندی پنجم پکن، چین.
شکل 2. فلوچارت برای شناسایی مناطق عملکردی شهری.
شکل 3. فاکتورسازی ماتریس همراه با زمینه.
شکل 4. تقسیم گراف بدون جهت خوشه بندی طیفی: برش حداقل و برش نرمال شده.
شکل 5. نتایج ادغام داده ها.
شکل 6. نقشه نتایج شناسایی UFR.
شکل 7. نتایج شناسایی به‌دست‌آمده با استفاده از منابع داده منفرد (یعنی بدون ترکیب داده): ( الف ) نتایج POI و ( ب ) نتایج تاکسی. و ( ج ) نتایج به دست آمده با استفاده از داده های ذوب شده. (دایره های مختلف 6 ناحیه معمولی را برای اعتبار سنجی کیفی نشان می دهد. نتایج در جدول 6 نشان داده شده است ).
شکل 8. نتایج شناسایی روش های خوشه بندی: ( الف ) k-means، ( ب ) DBSCAN، و ( c ) خوشه بندی طیفی. (دایره های مختلف نشان دهنده 6 منطقه معمولی برای اعتبار سنجی کیفی است. نتایج در جدول 7 نشان داده شده است ).
شکل 9. تأثیر پارامترها بر دقت کلی و مقدار کاپا: ( الف ) پارامتر α; ( ب ) پارامتر β

بدون دیدگاه

دیدگاهتان را بنویسید