1. مقدمه
شهرها از کارکردهای مختلفی تشکیل شدهاند که فعالیتهای اجتماعی انسان و اشتغال آنها به زمین را توصیف میکنند [ 1 ، 2 ]، و میتوانند به مناطق عملکردی مختلفی مانند تجاری، مسکونی، صنعتی و فضای باز تقسیم شوند. مناطق عملکردی شهری ارتباط نزدیکی با بسیاری از مطالعات ساختار شهری دارند، مانند سرزندگی محله [ 3 ، 4 ]، توزیع سفر [ 5 ]، حمل و نقل انبوه شهری [ 6 ] و مصرف انرژی شهری [ 7 ]]. با شهرنشینی سریع در سال های اخیر، ساختار عملکرد شهری به طور فزاینده ای متنوع و پیچیده شده است. علاوه بر این، تکامل عملکرد واقعی منطقه ممکن است با قصد برنامه ریزی زمین ناسازگار باشد [ 8 ، 9 ، 10 ]. بنابراین، شناسایی سریع و دقیق مناطق عملکردی شهری برای بهبود برنامه ریزی و مدیریت شهری ضروری است [ 11 ، 12 ، 13 ].
نقشههای کاداستر و دادههای سرشماری منابع ارزشمندی از دادههای کاربری زمین هستند، زیرا به صراحت استفاده از زمین را منعکس میکنند و به مدیریت کاربری اراضی کمک میکنند. با این حال، الزامات بسیار سختگیرانه ای برای سرعت به روز رسانی و فرکانس به روز رسانی آن وجود دارد، که بدیهی است که برای درک زمان واقعی ما از ساختار کاربری زمین شهری مناسب نیست. تصاویر سنجش از دور [ 14 ، 15 ، 16 ، 17 ] و رادار/لیدار [ 18 ، 19 ، 20 ]] به طور مؤثری برای طبقه بندی کاربری و پوشش زمین استفاده شده اند، زیرا می توانند ویژگی های طیفی و بافتی زمین را به تصویر بکشند. با این حال، تشخیص مقولههایی که نزدیک به فعالیتهای اجتماعی انسانی هستند، ممکن است برای آنها دشوار باشد، زیرا این دادهها نمیتوانند الگوی تعامل عملکردی را به تصویر بکشند، و همچنین نمیتوانند محیطهای اجتماعی-اقتصادی را درک کنند [ 21 ، 22 ، 23 ، 24 ، 25 ]. بنابراین، دسته بندی پوشش زمین برای سطوح غیرقابل نفوذ معمولاً شامل زمین های تجاری، مسکونی و صنعتی است.
برای نظارت و درک اطلاعات بالقوه در مورد فعالیتهای اجتماعی انسانی، دادههای جغرافیایی چند منبعی برای درک فعالیتهای اجتماعی انسانی و استنتاج بیشتر کارکردهای مناطق، مانند دادههای تلفن همراه بررسی شده است [ 23 ، 26 ، 27 ، 28 ، 29 ، 30 ]، داده های مسیر GPS [ 31 ، 32 ، 33 ]، داده های کارت هوشمند [ 1 ، 34 ]، داده های رسانه های اجتماعی [ 25 ، 35 ، 36 ] و داده های نقطه علاقه (POI) [ 2 ، 9 ، 10 ], 33 , 34 , 36 , 37 , 38 ]. در آن، داده های POI، به عنوان ارزان و سریع به دست آوردن آن از اینترنت، دارای مزیت مهمی در ارائه اطلاعات قابل اعتماد در مورد مکان و نوع فعالیت های شهری (به عنوان مثال، خرید، سرگرمی و رستوران) است [ 9 ، 39 ]. علاوه بر این، داده های POI می توانند به صراحت اطلاعات معنایی را در مورد محیط ساخته شده شهری بیان کنند.
مجموعه رو به رشدی از ادبیات با استفاده از داده های POI برای شناسایی مناطق عملکردی شهری وجود دارد. با در نظر گرفتن روابط قوی بین مناطق عملکردی با فعالیت های اجتماعی-اقتصادی، لیو و لانگ [ 38 ] تلاش کردند تا الگوهای عملکردی را در سطح بسته با تولید شاخص های مختلف بر اساس فراوانی داده های POI ترسیم کنند. یوان و همکاران [ 40 ] مناطق عملکردی شهری را با استفاده از داده های POI و داده های مسیر تاکسی در پکن شناسایی کرد. با این حال، به دلیل پیچیدگی ساختار فضایی شهری، تحلیل الگوهای عملکردی تنها با استفاده از فرکانسهای POI کافی نیست. چندین روش فرآیند زبان عصبی (NLP) برای استنتاج مناطق عملکردی شهری به کار گرفته شده است. در گائو و همکاران. [ 2]، مدل موضوعی تخصیص دیریکله پنهان (LDA) برای استنتاج مناطق عملکردی شهری با استفاده از دادههای فعالیتهای POI و ورود کاربر استفاده شد. چن و همکاران [ 41 ] سازمان فضایی 25 شهر را بر اساس روش کاوی الگوهای هم مکان مقایسه کردند. الگوریتم Word2vec برای استنتاج رابطه فضایی POI از نظر طبقه بندی منطقه عملکردی شهری [ 10 ] استفاده شد. الگوریتم Place2vec، که زمینه فضایی را بر اساس قانون اول جغرافیا [ 42 ] در نظر می گیرد، برای شناسایی مناطق عملکردی شهری در Wuxi، چین [ 8 ] استفاده شد.]. برعکس، رابطه فضایی نه تنها بین نقاط تسهیلات (مانند POI) بلکه بین بسته ها نیز وجود دارد. به عبارت دیگر، از آنجایی که POI بیشتر با سایر POI هایی که از نظر جغرافیایی به آن نزدیک هستند مطابق قانون اول جغرافیا [ 8 ، 43 ] مرتبط است، یک بسته نیز بیشتر به بسته هایی مرتبط است که از نظر جغرافیایی به آن نزدیک تر هستند. با این حال، روشهای فوق روشهای جاسازی کلمه هستند که فقط رابطه فضایی بین هر POI را در نظر میگیرند و مطالعات کمی به طور صریح به روابط متقابل فضایی بین بستهها پرداختهاند.
برای رسیدگی به شکاف ها، یک رویکرد مبتنی بر بسته، به نام Block2vec، برای استخراج اطلاعات فضایی بین بسته ها با الهام از روش های جاسازی جمله پیشنهاد شد [ 44 ، 45 ]. بر اساس روش نزدیکترین همسایه، توالی POI و گروه توالی بیشتر برای هر بسته در Block2vec ساخته شد. سپس مدل استخراج ویژگی معنایی پنهان با استفاده از چارچوب skip-gram ساخته شد. در اینجا، شبکه حافظه کوتاه مدت بلند مدت (LSTM) [ 46 ] برای ساخت مدل Block2vec، که یک مدل یک به چند (بسته های بسته مرکزی به پس زمینه) و مدل سلسله مراتبی بود، مستقر شد. در نهایت، مدل Block2vec توسط یک مطالعه موردی در ووهان، چین آزمایش و تأیید شد.
ساختار باقی مانده مقاله به صورت زیر است: بخش 2 منطقه مورد مطالعه، مجموعه داده را ارائه می کند. سپس بخش 3 روش مدل Block2vec را معرفی می کند. بخش 4 مقایسه با نتایج تجربی را شرح می دهد. بخش 5 مزایا و محدودیت های روش پیشنهادی را مورد بحث قرار می دهد. در نهایت، بخش 6 نتیجه گیری و کار آینده را ارائه می دهد.
2. منطقه مطالعه و مجموعه داده
2.1. منطقه مطالعه
منطقه مورد مطالعه این تحقیق منطقه اصلی شهری ووهان مرکز استان هوبی چین است. این منطقه شامل منطقه ای در داخل جاده حلقه سوم، Zhuankou، Wugang و Miaoshan است که مساحتی به وسعت 678 کیلومتر مربع را پوشش می دهد . این شهر که توسط یانگ تسه تقسیم شده است، به عنوان “سه شهر ووهان” با هانکو و هانیانگ در کرانه غربی و ووچانگ در شرق شناخته می شود. برای این مطالعه، منطقه بر اساس داده های شبکه راه به 2385 قطعه تقسیم شد. شکل 1 منطقه اصلی شهری و توزیع POI در ووهان را نشان می دهد.
2.2. مجموعه داده
دادههای POI مورد استفاده در این مطالعه از طریق پلتفرم توسعه AutoNavi (ADP) ( https://lbs.amap.com/api/webservice/guide/api/search ، دسترسی به 29 دسامبر 2016) بهدست آمد. برای منطقه مورد مطالعه، 537,375 رکورد POI در دسامبر 2016 جمعآوری شد. هر رکورد POI شامل طول و عرض جغرافیایی POI و یک دسته طبقهبندی از سطوح چندگانه است که 20 دسته اصلی از سطح بالا و بیش از 500 زیرمجموعه سوم وجود دارد. -مرحله. به عنوان مثال، به عنوان یک دبستان، دسته اولیه آن خدمات فرهنگی علمی و آموزشی، رده متوسطه مدرسه و رده سوم ابتدایی است. دسته بندی دقیق POI را می توان از طریق وب سایت به دست آورد ( https://lbs.amap.com/api/webservice/download، مشاهده شده در 14 فوریه 2017). از میان همه دستهها، آدرس/مکان در مطالعه بعدی حذف شد زیرا نمیتوانست به صراحت برخی از فعالیتهای اجتماعی انسانی را بیان کند. در جدول 1 ، به استثنای آدرس و مکان، دستههایی که بیشترین تعداد POI را دارند، مرکز خرید، خدمات پذیرایی و خدمات زندگی هستند.
3. روش شناسی
گردش کار کلی رویکرد پیشنهادی در شکل 2 نشان داده شده است. هدف اصلی رویکرد پیشنهادی استخراج اطلاعات معنایی از POI در یک بسته، برای شناسایی بهتر عملکرد مناطق است. ابتدا، دادههای POI و بستهها برای تولید دنباله معنایی POI برای هر بسته استفاده شد. در مرحله دوم، توالی معنایی POI بر اساس بستهها با استفاده از روش نزدیکترین همسایه گروهبندی شد. ثالثاً، مدل استخراج ویژگی معنایی پنهان با استفاده از شبکه LSTM ایجاد شد. این مدل با استفاده از گروههای توالی معنایی POI آموزش داده شد و سپس توالی معنایی را در یک بردار معنایی پنهان با ابعاد بالا ترسیم کرد. سپس از الگوریتم K-Means برای تأیید تمایز و اعتبار ویژگیهای معنایی نهفته و الگوریتم جنگل تصادفی (RFA) برای طبقهبندی مناطق عملکردی شهری استفاده شد. سرانجام،
3.1. ساخت دنباله معنایی برای هر بسته
عملکرد یک منطقه به ادغام انواع فعالیت ها در آنجا مربوط می شود [ 2 ]. به طور کلی، چندین امکانات خدماتی در یک بسته وجود دارد و مکانهای مختلف در بسته فرصتهای تماس فضایی متفاوتی دارند. با توجه به مکانهای مختلف، POIها را میتوان به دو بخش تقسیم کرد، شامل قسمتی که نزدیکتر به جاده قرار دارد و قسمت دیگر واقع در بسته. اولی به جمعیت در بسته های مجاور خدمات می دهد، در حالی که دومی عمدتاً به جمعیت در این بسته خدمات می دهد.
در این مطالعه، توالی معنایی POI با ترتیب خاص برای بیان فرصتهای تماس فضایی مختلف در یک بسته ساخته شد. با توجه به تفاوت فضایی POI های بالا، POI ها در یک بسته را می توان بر اساس ترتیب فاصله مکانی از هر POI تا مرکز بسته مرتب کرد. به عنوان مثال، در شکل 3 a، در حال حاضر شش POI در بسته i- ام وجود دارد ، که در آن پ1نزدیکترین به نقطه مرکزی است و پ6نزدیکترین به جاده است بر اساس فاصله تا نقطه مرکزی، دنباله معنایی اسمنبه صورت { پ1، پ2، پ3، پ5، پ4، پ6}. در عمل، بسته ها می توانند تعداد POI های متفاوتی داشته باشند، به این معنی که توالی POI آنها می تواند طول های متفاوتی داشته باشد. در مطالعه بعدی، لایه LSTM به تعداد ثابتی نورون ورودی نیاز دارد. بنابراین، دنبالههای POI با طولهای مختلف باید ادامه پیدا کنند تا دنبالهای با طول ثابت داشته باشند. در این مقاله، طول ثابت به طولی تنظیم شده است که درصد آن را 90 درصد جمع می کند. یعنی، اگر طول POI از طول ثابت در یک بسته بیشتر شود، POI های اضافی حذف خواهند شد. در حالی که اگر طول کمتر از طول ثابت باشد، کاراکترهای خاص پر می شوند.
برای استخراج کامل روابط معنایی فضایی در دادههای POI، لازم است نه تنها رابطه فضایی بین POIها بلکه بین بستههای مجاور نیز در نظر گرفته شود. در پردازش زبان طبیعی، یک کلمه یا یک جمله دارای دو رابطه متنی، جلو و عقب است. با این حال، در زمین فضایی، چندین زمینه جهتی متفاوت وجود خواهد داشت. برای سادهسازی این مشکل، رابطه متنی چهار قطعه مجاور بهعنوان یک بلوک در نظر گرفته شد که میتوان آن را به عنوان یک رابطه متنی در نظر گرفت. توزیع فضایی معمولی یک بلوک در شکل 3 ب نشان داده شده است، که در آن چهار نزدیکترین بسته ( سی1، سی2، سی3، سی4) اطراف بسته مرکزی i به عنوان بسته های زمینه در نظر گرفته شد. بنابراین، گروه دنباله معنایی برای بسته i به صورت [ اسمن، ( اسمن،ج1، اسمن،ج2، اسمن،ج3، اسمن،ج4)].
3.2. مدل استخراج ویژگی معنایی پنهان
مطالعات قبلی نشان دادهاند که مدل seq2seq میتواند به طور موثر ویژگیهای نهفته یک جمله را با استفاده از اطلاعات بافت آن استخراج کند [ 44 ، 45 ، 47 ، 48 ]. متفاوت از روش جاسازی کلمه، روش جاسازی جمله که توسط مدلهای seq2seq نشان داده میشود ، میتواند وظیفه جاسازی جمله را بهتر انجام دهد، زیرا میتواند ویژگیهای مرتبط کلمات مختلف را در سطح جمله به طور جامع به تصویر بکشد، نه اینکه آنها را در سطح کلمات درک کند. . با الهام از مدل بالا، دنباله POI در یک بسته می تواند به عنوان یک جمله با k در نظر گرفته شود.نزدیکترین بسته ها در زمین فضایی آن به عنوان بسته های بافت آن. همانطور که در شکل 3 ب نشان داده شده است، مجاورترین مقدار k روی 4 تنظیم شد.
در این مطالعه، مدل Skip-Gram، که در مدل بردارهای فکر پرش [ 44 ] استفاده شده است، برای ایجاد مدل استخراج ویژگی معنایی نهفته استفاده شد که میتواند توسط سه بخش رمزگذار، رمزگشا و تابع هدف توصیف شود. . همانطور که در شکل 4 نشان داده شده است ، از یک رمزگذار برای نگاشت توالی POI بسته مرکزی به یک ویژگی معنایی پنهان استفاده شده است، و رمزگشاهای متعدد برای تولید دنباله های POI از بسته های زمینه استفاده شده است.
لایه های LSTM برای ساخت رمزگذار مدل استفاده شد. برای بسته من ، اجازه دهید { ایکس1، ایکس2،…،ایکسn}دنباله POI در اسمندنباله، که در آن n تعداد POI در دنباله است اسمن. برای هر مرحله محاسبه، رمزگذار یک ویژگی لایه پنهان را محاسبه می کند ساعتتی، که می تواند به عنوان یک عبارت پنهان برای دنباله { در نظر گرفته شود ایکس1، ایکس2،…،ایکستی}. حالت پنهان ساعتnبنابراین کل دنباله، یعنی بردار ویژگی معنایی نهفته را نشان می دهد اسمن. برای رمزگذاری دنباله اسمن، معادلات زیر را از اولین POI در دنباله POI تکرار کنید:
جایی که، منتیدروازه ورودی است، fتیدروازه فراموشی است، gتیگیت آپدیت است و oتیدروازه خروجی است، جتیحالت سلولی است و ساعتتیحالت پنهان رمزگذار در مرحله t است.
چهار لایه LSTM به ترتیب برای ایجاد رمزگشای مدل اتخاذ شد. ساختار شبکه هر رمزگشا شبیه به رمزگذار است. با دولت ساعتnبه عنوان یک شرط، چهار رمزگشا، دنباله های POI بسته های زمینه را تولید می کنند.
با توجه به یک گروه توالی POI [ اسمن، ( اسمن،ج1، اسمن،ج2، اسمن،ج3، اسمن،ج4)]، تابع هدف بهینه سازی مجموع احتمالات لگاریتم برای توالی های معنایی زمینه مشروط به نمایش رمزگذار است:
جایی که ساعتمنحالت پنهان دنباله را نشان می دهد اسمن، ایکسجتینشان دهنده مقدار پیش بینی شده برای بسته c در مرحله t است.
در فرآیند آموزش مدل، هدف کل به حداقل رساندن مجموع توابع هدف بهینه سازی فوق در تمام گروه های توالی بود.
3.3. شناسایی مناطق کارکردی شهری بر اساس معناشناسی نهفته
پس از آموزش مدل فوق، رمزگذار با وزن های آموخته شده به عنوان استخراج کننده ویژگی برای نگاشت معنایی توالی POI هر بسته به یک ویژگی معنایی پنهان استفاده شد. ساعتn. از نظر تئوری، هر چه عملکرد معنایی POI بین بسته ها و محیط اطراف آنها شبیه تر باشد، بیشتر در فضای معنایی نهفته جمع می شوند. بنابراین، چندین طبقهبندیکننده را میتوان برای تشخیص توابع مناطق مختلف آموزش داد. همانطور که در شکل 5 نشان داده شده است ، K-Means و الگوریتم جنگل تصادفی (RFA) برای طبقه بندی قطعات با ویژگی های معنایی پنهان مختلف به کار گرفته شدند.
3.3.1. K-Means-Based Parcel Aggregation
برای تأیید تمایز و اعتبار ویژگیهای معنایی پنهان، از الگوریتم K-Means برای جمعآوری بستههای تحقیق با توجه به این ویژگیها استفاده شد. فاصله تشابه در فضای برداری را می توان با روش های مختلف محاسبه فاصله فضایی، مانند فاصله اقلیدسی و فاصله کسینوس اندازه گیری کرد. از آنجایی که بعد ویژگی فضای معنایی نهفته به دست آمده در این مقاله زیاد است، فاصله کسینوس برای اندازه گیری بردارهای ویژگی معنایی نهفته اتخاذ شد. در نتیجه، الگوریتم خوشهبندی K-Means مبتنی بر فاصله کسینوس برای جمعآوری آن بستهها اعمال شد.
سپس امتیاز silhouette [ 49 ] برای ارزیابی اینکه چگونه اشیاء مناسب در خوشه خود قرار دارند استفاده شد. برای نمونه P i ، میانگین فاصله بین P i و سایر نمونهها در همان خوشه به صورت a و میانگین فاصله بین P i و نمونههای درون خوشههای دیگر به صورت b تعریف میشود ، سپس امتیاز شبح به صورت زیر محاسبه میشود:
از فرمول بالا می توان دریافت که مقدار امتیاز silhouette بین [-1، 1] در نوسان است و هر چه به 1 نزدیک تر باشد عملکرد خوشه بندی بهتر است. بنابراین، ما میانگین امتیاز شبح تمام نمونهها را به عنوان ارزیابی خوشهبندی K-Means محاسبه میکنیم.
3.3.2. طبقه بندی بسته مبتنی بر RFA
با این حال، تجزیه و تحلیل خوشهبندی بدون نظارت، تنها دستهها را بر اساس تفاوتهای بین ویژگیهای معنایی پنهان POI بستههای مختلف طبقهبندی میکند. به دلیل غیرقابل توضیح معنایی نهفته POI استخراج شده، تخصیص و تعریف مقولههایی که توسط تحلیل خوشهای خوشهبندی میشوند، دشوار است. بنابراین، روش طبقهبندی نظارت شده بر اساس نمونههای آموزشی موجود، بخش مهمی از توجه ما است.
در میان آنها، RFA به طور گسترده در طبقه بندی نظارت شده استفاده می شود، زیرا سازگاری خوب با ویژگی های ابعادی بالا و دشواری در نصب بیش از حد، و توانایی قوی ضد نویز [ 50 ، 51 ]. اجازه دهید اچمنj( i ∈ [1, M ], j ∈ [1, N ]) و Yک( k ∈ [1, K ]) ویژگی های پنهان و انواع کاربری زمین قطعه i باشد که M تعداد کل قطعات و N ابعاد ویژگی ها و K تعداد کل انواع توابع مناطق است. . با استفاده از روش کیسهبندی، نمونههایی با ویژگیهای n ( n≤ N ) به طور تصادفی از بین ویژگیهای N انتخاب شدند و سپس برای ساخت درخت تصمیم استفاده شدند. با ترکیب تصادفی k ویژگی، Cدرختان تصمیم بارها و بارها بدون عملیات هرس ساخته شدند. هر درخت تصمیم به طور جداگانه نتیجه را پیش بینی می کرد و سپس همه نتایج یکپارچه شدند. حتی اگر یک درخت تصمیم منفرد ممکن است بیش از حد مناسب باشد، این خطر را می توان با ادغام نتایج همه درختان تصمیم کاهش داد. در این مقاله، پیادهسازی مدل RFA همه نتایج را با میانگینگیری پیشبینی احتمالی آنها ترکیب میکند، بهجای اینکه اجازه دهد هر درخت تصمیم به یک کلاس رأی دهد.
همانطور که در بالا ذکر شد، عملکرد واقعی منطقه ممکن است با قصد هواپیماسازان سازگار نباشد. در این مطالعه، نمونهها با استفاده از اطلاعات قبلی از منابع متعدد از جمله نقشههای آمایش سرزمین شهری، تصاویر سنجش از دور و نقشههای آنلاین انتخاب شدند. نقشه های آمایش شهری را می توان از طریق وب سایت ( https://zrzyhgh.wuhan.gov.cn/zwgk_18/fdzdgk/ghjh/zzqgh/202001/t20200107_602858.shtml، مشاهده شده در 12 مه 2017). این نمونه ها شامل پنج نوع عملکرد است: مناطق مسکونی، مناطق تجاری، مناطق تجاری، فضای سبز باز و مناطق صنعتی. نمونه های آموزشی به طور تصادفی به دو زیرمجموعه با اندازه مساوی تقسیم شدند که یکی برای آموزش و دیگری برای آزمون استفاده می شود. سپس مدل با استفاده از نمونه های آموزشی آموزش داده شد و از نمونه های آزمایشی برای ارزیابی دقت مدل های آموزش دیده استفاده شد. برای اطمینان از استحکام طبقهبندی، طبقهبندی تصادفی جنگلها 100 بار تکرار شد و سپس از میانگین دقت به عنوان نتیجه ارزیابی نهایی استفاده شد. علاوه بر این، چندین روش استخراج معنایی POI پیشرفته، مانند فرکانس معکوس فرکانس سند (TF-IDF) [ 9 ]، تخصیص دیریکله پنهان (LDA) [52 ] و Word2vec [ 10 ] برای مقایسه با روش پیشنهادی ما استفاده شد.
4. نتایج
در این مطالعه، 2315 بسته تحقیقاتی شامل 537375 داده POI بود، در حالی که Tianxingzhou و چند بسته بدون POI حذف شدند. سپس، طبقهبندی سه سطحی انواع POI (در مجموع 496 نوع) برای ساخت دنبالههای POI برای بستهها، که میتوانند طولهای متفاوتی داشته باشند، استفاده شد. شکل 6 توزیع طول توالی POI بسته را نشان می دهد. مشاهده می شود که طول توالی POI اکثر بسته ها کوچکتر است. وقتی طول تا 500 باشد، درصد تجمعی به 91.69٪ می رسد. بنابراین، این مطالعه طول ثابت دنباله را 500 تعیین می کند. در نهایت، گروه های توالی برای هر بسته همانطور که در بخش 3.1 توضیح داده شد ساخته شد .
چندین ماژول، مانند ماژول scikit-learn (ابزار یادگیری ماشینی منبع باز، https://scikit-learn.org/stable/ ، قابل دسترسی در 10 مه 2019)، ماژول PyTorch (یک یادگیری ماشین منبع باز و چارچوب یادگیری عمیق، https://pytorch.org/ ، قابل دسترسی در 2 آگوست 2018) و ماژول Gensim (یک چارچوب مدلسازی مبحث منبع باز، https://radimrehurek.com/gensim/ ، در تاریخ 23 سپتامبر 2019) برای ساخت و آموزش مدل استخراج معنایی بالقوه منطقه ای شرح داده شده در بخش 3.2 اتخاذ شدند. ساختار LSTM برای مدل استخراج ویژگی معنایی نهفته اتخاذ شد. در این مدل تعداد لایه های LSTM ها 1، بعد ویژگی معنایی پنهان 200، mini-batch روی 64 و تعداد تکرارها 100 تنظیم شد.
4.1. شناسایی مناطق کاربردی شهری
4.1.1. تجمیع مناطق تابعی شهری با الگوریتم K-Means
همانطور که در بالا نشان داده شد، به دلیل معنایی نهفته مشابه توالی های فضایی POI آنها، بسته هایی با معنای عملکردی یکسان در فضای معنایی نهان نسبت به سایر بسته های عملکردی بسته تر خواهند بود. سپس الگوریتم خوشهبندی K-Means مبتنی بر فاصله کسینوس برای تأیید تمایز و اعتبار ویژگیهای معنایی پنهان انجام شد. همانطور که در شکل 7 نشان داده شده است ، هنگامی که خوشه بندی دو نوع است، امتیاز silhouette بالاترین است، سپس با افزایش تعداد خوشه ها، امتیاز silhouette به تدریج کاهش می یابد. در نتیجه، هنگامی که k = [2، 3، 4]، امتیاز شبح می تواند به مقادیر بالای 3 برسد. علاوه بر این، حداکثر محلی زمانی به دست می آید که تعداد خوشه های k 6، 8 و 12 باشد.
شکل 8 نتایج خوشه بندی K-Means را با مقادیر مختلف k ترسیم می کند:
هنگامی که k = 2، با مقایسه با نقشه سنجش از دور و نقشه کاربری اراضی برنامه ریزی جامع در ووهان، می توانیم دریابیم که ساختار دایره آشکار را می توان در شکل 8 a مشاهده کرد. علاوه بر این، نتایج خوشهبندی، عملکرد فضایی شهری را به یک منطقه مرکزی و یک ناحیه لبه تقسیم میکند که ممکن است با عملکرد و سطح توسعه منطقه شهری در مرکز و حومه مرتبط باشد.
هنگامی که k = 3، تقسیم بیشتر در مقایسه با k = 2 انجام می شود، و ساختار دایره هنوز در شکل 8 ب وجود دارد. نه تنها این، بلکه رده کلاس 2 در این زمان بیشتر در منطقه مرکز شهر متمرکز است، در حالی که کلاس 3 در حاشیه شهر / منطقه پیرامونی متمرکز است. از طریق مقایسه نقشه های سنجش از دور و نقشه های کاربری اراضی برنامه ریزی جامع در ووهان، توزیع کلاس 3 با طرح واقعی مناطق مختلف صنعتی در ووهان مطابقت دارد.
وقتی k = 4، نقشه خوشهبندی در شکل 8 c عمدتاً برای طبقهبندی مجدد کلاس 2 و کلاس 3 زمانی که k = 3 است، کلاس 1، کلاس 3 و کلاس 4 را در این زمان تولید میکند. علاوه بر این، کلاس 2 در شکل 8 c اساساً با کلاس 1 در شکل 8 b سازگار است. در میان آنها، کلاس 1 متمرکزتر است، و توزیع جزئی و نقطه مانند را نشان می دهد. در عین حال، از طریق مقایسه نقشههای سنجش از دور و نقشههای کاربری اراضی شهری برنامهریزی جامع، مشخص شد که توزیع دستههای کلاس 1 با توزیع مناطق تجاری در ووهان مطابقت دارد.
4.1.2. شناسایی مناطق عملکردی شهری بر اساس الگوریتم جنگل تصادفی
با استفاده از روش خوشهبندی بدون نظارت K-Means، میتوان مشاهده کرد که روش پیشنهادی میتواند به طور موثر ویژگیهای معنایی پنهان دنبالههای POI را استخراج کند. با این حال، روش بدون نظارت نمی تواند تعریف صریحی از دسته بندی های طبقه بندی شده ارائه دهد، بنابراین روش طبقه بندی نظارت شده بر اساس نمونه های آموزشی موجود ابزار ضروری است که باید اتخاذ شود.
بر اساس بردارهای ویژگی معنایی پنهان استخراج شده از مدل فوق، این مقاله از الگوریتم جنگل تصادفی برای طبقهبندی مناطق عملکردی شهری استفاده میکند. در عین حال 96 نمونه به صورت تصادفی انتخاب شده است. علاوه بر این، برخی از روشهای پیشرفته، از جمله TF-IDF [ 9 ]، LDA [ 2 ] و Word2vec [ 43 ]، برای مقایسه با روشهای ما استفاده میشوند.
مدل RFA ارائه شده توسط کتابخانه ماژول scikit-learn ( https://scikit-learn.org/stable/ ، دسترسی به 10 مه 2019) برای طبقه بندی مناطق عملکردی شهری، که در آن تعداد C درخت های تصمیم روی 200 تنظیم شده است، به کار گرفته شد. پیادهسازی مدلهای Word2vec، LDA و TF-IDF برای آزمایشهای مقایسه با استفاده از ماژول ارائهشده توسط کتابخانه ماژول genism ( https://radimrehurek.com/gensim/index.html ، قابل دسترسی در 23 سپتامبر 2019) انجام شد. تنظیمات پارامتر مدل برای هر روش مطابق با ادبیات قبلی حفظ می شود.
برای اطمینان از پایداری نتایج، هر روش 100 بار تکرار شد. جدول 2 ارزیابی دقیقی از طبقه بندی مناطق عملکردی شهری با استفاده از روش های مختلف ارائه می دهد و شکل 9 نتایج نقشه برداری طبقه بندی مناطق عملکردی شهری را با استفاده از روش های مختلف نشان می دهد.
برخلاف مطالعات قبلی، اگرچه روش TF-IDF فقط ویژگیهای کمی POI در منطقه را در نظر میگیرد، اما همچنان به دقت طبقهبندی نسبتاً خوبی در مقایسه با مدل LDA دست مییابد. مدل Word2vec که هم ویژگیهای کمی و هم ویژگیهای توزیع فضایی POI را در نظر میگیرد، دقت طبقهبندی بالاتری نسبت به TF-IDF و LDA دارد زیرا هم ویژگیهای فرکانس POI و هم رابطه فضایی بین POI را در نظر میگیرد. در مقایسه با نتایج فوق، Block2vec پیشنهادی بالاترین دقت طبقهبندی و امتیاز کاپا را به دست آورد.
شکل 10 ماتریس های سردرگمی طبقه بندی مناطق عملکردی شهری را با روش های مختلف نشان می دهد. در مقایسه با روشهای دیگر، روش پیشنهادی ( شکل 10 د) دارای بالاترین دقت در طبقهبندی مناطق مسکونی، تجاری و صنعتی و بالاترین دقت در طبقهبندی مشاغل است. روش Word2Vec ( شکل 10الف) در طبقه بندی مشاغل و فضای باز دارای بیشترین دقت و در طبقه بندی مسکونی و صنعتی کمتر است. نتایج نشان میدهد که با در نظر گرفتن رابطه فضایی بستهها، مدل استخراج ویژگی میتواند به طور موثری دقت طبقهبندی واحدهای مسکونی، تجاری و صنعتی را بهبود بخشد، اما نمیتواند دقت طبقهبندی فضای باز را بهبود بخشد.
برای تأیید بیشتر نتایج طبقهبندی بر اساس مدل پیشنهادی، سه منطقه محلی با نقشه گوگل و نقشه کاربری اراضی برنامهریزی جامع در ووهان مقایسه شد. شکل 11 a منطقه مرکزی شهر است و نوع عملکرد واقعی آن عمدتا بر اساس مناطق تجاری و تجاری است. نتایج نشان می دهد که توزیع طبقه بندی مدل پیشنهادی با توزیع نقشه های برنامه ریزی مطابقت دارد. شکل 11 ب یکی دیگر از مناطق مرکزی شهر است و مقیاس تجاری آن کوچکتر از شکل 11 الف است. کسب و کار در نقشه برنامه ریزی این منطقه از شمال به جنوب و نتایج طبقه بندی مدل پیشنهادی از شرق به غرب اختصاص یافته است. شکل 11ج یک منطقه تجاری و صنعتی در جنوب شرقی شهر است. مشاهده می شود که نتایج طبقه بندی مدل پیشنهادی کاملاً با نقشه برنامه ریزی مغایرت دارد. از طریق مقایسه با نقشه های آنلاین، توزیع طبقه بندی مدل پیشنهادی واقعی تر است. اگرچه بیشتر مناطق در شکل 11 ج به عنوان زمین صنعتی برنامه ریزی شده است، با ورود تعداد زیادی از شرکت های فناوری نرم افزار، عملکرد این مناطق به تدریج به کارکردهای تجاری و تجاری در این منطقه تبدیل شده است. این امر تحقیقات قبلی را تأیید می کند که تکامل عملکرد واقعی منطقه ممکن است با قصد هواپیماسازان سازگار نباشد.
4.2. تأثیر اندازه ویژگی های معنایی پنهان
مدل ویژگی معنایی پنهان مورد استفاده در این مقاله، توالی POI را در یک بلوک به فضای ویژگی معنایی پنهان با ابعاد بالا ترسیم میکند، بنابراین بعد ویژگی معنایی پنهان به طور مستقیم غنای معنایی ویژگی پنهان را تعیین میکند. اگر بعد ویژگی معنایی پنهان خیلی کم باشد، به دست آوردن معنایی توالی POI غنی دشوار است و منجر به از دست دادن اطلاعات می شود. با این حال، ابعاد بیش از حد بالا ممکن است منجر به افزونگی اطلاعات شود. از این رو در این بخش سعی شده است توانایی ویژگی های معنایی پنهان اندازه های مختلف در شناسایی و تمایز مناطق عملکردی شهری مورد تجزیه و تحلیل قرار گیرد.
شکل 12 تغییرات ارزیابی دقت طبقه بندی مناطق عملکردی شهری را هنگامی که مدل در ابعاد مختلف تنظیم می شود نشان می دهد. مشاهده می شود که وقتی اندازه لایه پنهان بین 100-10 است، با افزایش اندازه لایه پنهان، معنای نهفته به دست آمده بیشتر و بیشتر می شود و دقت طبقه بندی بیشتر می شود. هنگامی که اندازه لایه پنهان بین 100 تا 250 باشد، تغییر دقت طبقه بندی آشکار نیست زیرا اندازه بهبود می یابد. هنگامی که بعد لایه پنهان تا 300 افزایش می یابد، دقت طبقه بندی به دلیل ابعاد بسیار بالای ویژگی های نهفته کاهش می یابد. بنابراین، مناسب است که اندازه ویژگی معنایی پنهان لایه پنهان را در این مقاله 200 قرار دهیم.
5. بحث
نقشه مناطق کارکردی شهری به موقع و دقیق برای مدیریت شهری و برنامه ریزی شهری مفید است. این مطالعه با استخراج ویژگیهای معنایی نهفته POI در بستهها، رویکردی مؤثر برای شناسایی مناطق عملکردی شهری پیشنهاد میکند. رویکرد پیشنهادی روابط فضایی زیر را در نظر می گیرد: (1) رابطه فضایی POI در یک بسته: یک رابطه متقابل و رقابتی بین POIهای مجاور در فضای جغرافیایی وجود دارد [ 53]. (2) دسترسی فضایی در مناطق مختلف یک بسته متفاوت است: به طور کلی، به دلیل دسترسی زیاد برای تماس خارجی، امکانات عمومی بیشتری در مناطق نزدیک به خیابان ها وجود دارد، در حالی که مناطق نزدیک به داخل بسته دارای برخی از امکانات منحصر به فرد هستند. . (3) رابطه بین بسته ها: بسته هایی با عملکردهای مختلف به دلیل روابط متقابل یا رقابتی آنها اغلب نزدیک یا دور از یکدیگر هستند.
این مطالعه با مطالعات قبلی مطابقت دارد [ 2 ، 9 ، 10 ، 42] که پردازش زبان طبیعی (NLP) مزیت خوبی در استخراج ویژگیهای معنایی POI دارد. با این حال، مطالعات کمی به طور صریح به همبستگی های فضایی بین بسته ها پرداخته اند. در این مطالعه، با توجه به روابط موجود بین POI، توالی معنایی POI با نظم خاصی ساخته شد. سپس گروه توالی با در نظر گرفتن روابط موجود بین بسته ها (پارسل مرکزی و قطعه زمینه) ساخته شد. شبکه LSTM برای استخراج اولی استفاده شد، در حالی که ساختار Encoder-Decoder برای استخراج دومی استفاده شد. در نتیجه، نتایج به بالاترین دقت (OA = 0.7186، Kappa = 0. 6429) دست یافت که نشان میدهد مدل ما میتواند به طور موثر ویژگیهای نهفته را برای طبقهبندی دقیقتر مناطق عملکردی شهری استخراج کند. علاوه بر این، نتیجه ماتریس سردرگمی نشان می دهد که روش پیشنهادی می تواند به طور موثری دقت طبقه بندی مناطق مسکونی، تجاری و صنعتی را بهبود بخشد. این نشان میدهد که آن نوع بستهها همبستگیهای فضایی نزدیک دارند، در حالی که از نظر فضایی کمتر به زمین فضای باز متصل هستند. علاوه بر این، مقایسه نتایج طبقهبندی مناطق محلی تأیید کرد که تکامل عملکرد واقعی منطقه ممکن است با قصد طراحان سازگار نباشد.
دقت طبقه بندی برای چهار روش با استفاده از داده های POI از 0.5972 تا 0.7186 بود که نزدیک به دقت مطالعات مربوطه بود [ 8 ، 30 ، 35 ]. با این حال، این ها کمتر از طبقه بندی کاربری زمین سنجش از دور بود. دلیل اصلی این است که تصاویر سنجش از دور عمدتاً زمین را بر اساس ویژگیهای فیزیکی زمین طبقهبندی میکنند و تعداد زیادی مجموعه داده برچسبگذاری شده را جمعآوری کرده است. متفاوت از این، طبقه بندی بر اساس POI با استفاده از نمونه های انتخاب شده توسط خودمان، با حجم نمونه کوچک و تحت تأثیر ذهنی آموزش داده شد. در عین حال، عملکرد برخی از مناطق تحت تأثیر فعالیت های اجتماعی متعدد انسانی قرار می گیرد.
لازم به ذکر است که این مطالعه تنها در محدوده شهری که امکانات خدماتی فراوانی وجود دارد مورد بررسی قرار گرفته است. بنابراین، ممکن است انتقال این رویکرد به مناطق با POI کمتر، مانند حومه و مناطق روستایی دشوار باشد. علاوه بر این، نوع تابع ترکیبی ذکر نشده است زیرا تعریف مصنوعی این نوع دشوار است [ 41 ، 43 ]. با این وجود، این مقاله به طور مبتکرانه یک روش استخراج معنایی مبتنی بر بسته را پیشنهاد کرد که از نظر توانایی آن در استخراج معنایی POI از سایر روشهای پیشرفته گزارششده در مقاله بهتر عمل کرد.
علاوه بر این، تحقیق در این مقاله، قطعات را به پنج نوع منطقه کاربردی طبقهبندی کرد که ممکن است با طبقهبندی استاندارد کاربری زمین شهری در تضاد باشد. برخی از انواع استاندارد کاربری اراضی ترکیبی از فعالیتهای اجتماعی مختلف انسانی هستند که ممکن است دقیقاً مطابق با انواع کاربری زمین نباشد. همچنین هیچ استاندارد تعریف واحدی در مطالعات مربوطه وجود ندارد [ 8 ، 32 ، 36]. با این حال، این مقاله تلاشی برای استفاده از روش پیشنهادی برای تعریف انواع برای جایگزینی انواع کاربری استاندارد شهری ندارد. هدف این تحقیق ارائه یک روش داده محور بهتر برای شناسایی سریع و دقیق توابع منطقه ای از داده های POI است. بنابراین برنامه ریزان و مدیریت دولتی می توانند از این روش برای مشاهده و نظارت مستمر و موثر بر تغییرات عملکردهای منطقه ای در شهر استفاده کنند.
علاوه بر این، برخی از مناطق عملکردی را می توان تقسیم کرد. به عنوان مثال، محل سکونت را می توان به زمین های مسکونی کم تراکم و متراکم بالا تقسیم کرد، که می تواند با داده های سنجش از دور شناسایی شود [ 14 ]. با این حال، تشخیص آنها به تنهایی توسط POI دشوار است. ترکیب دادههای دیگر، مانند تصاویر سنجش از راه دور با وضوح بالا و دادههای رسانههای اجتماعی، میتواند به طور موثر توانایی تمایز بین انواع مختلف مناطق کاربردی شهری را بهبود بخشد.
6. نتیجه گیری و کار آینده
با شهرنشینی سریع، ساختار فضایی شهری مناطق عملکردی شهری به طور فزاینده ای متنوع و پیچیده شده است. بنابراین تهیه نقشه منطقه عملکردی شهری به موقع و دقیق برای مدیریت شهری و برنامه ریزی شهری ضروری است. این مطالعه یک رویکرد موثر به نام Block2vec را برای شناسایی مناطق عملکردی شهری با استخراج ویژگیهای معنایی پنهان POI در بستهها پیشنهاد کرد. ابتدا، یک توالی POI و گروه توالی بیشتر برای هر بسته ساخته شد. سپس، توالی POI با ساخت یک مدل Block2vec به فضایی با ابعاد بالا نگاشت شد. علاوه بر این، خوشهبندی K-Means و طبقهبندی RFA برای آشکارسازی ساختارهای شهری و شناسایی انواع عملکردی به کار گرفته شد. در مقایسه با سایر روش های پیشرفته (TF-IDF، LDA و Word2vec)، روش Block2vec می تواند بالاترین دقت را به دست آورد (OA = 0.7186، Kappa = 0.6429). علاوه بر این، روش پیشنهادی بهبود قابل توجهی در دقت طبقهبندی زمینهای مسکونی، تجاری و صنعتی دارد. روش پیشنهادی می تواند به مدیریت شهری و برنامه ریزان شهری کمک کند تا توزیع مناطق عملکردی شهری را به موقع و دقیق درک کنند. در همان زمان، این مطالعه همچنین پتانسیل مدل فرآیند زبان عصبی را در استخراج اطلاعات معنایی POI تأیید کرد. روش پیشنهادی می تواند به مدیریت شهری و برنامه ریزان شهری کمک کند تا توزیع مناطق عملکردی شهری را به موقع و دقیق درک کنند. در همان زمان، این مطالعه همچنین پتانسیل مدل فرآیند زبان عصبی را در استخراج اطلاعات معنایی POI تأیید کرد. روش پیشنهادی می تواند به مدیریت شهری و برنامه ریزان شهری کمک کند تا توزیع مناطق عملکردی شهری را به موقع و دقیق درک کنند. در همان زمان، این مطالعه همچنین پتانسیل مدل فرآیند زبان عصبی را در استخراج اطلاعات معنایی POI تأیید کرد.
برای کارهای آینده، انباشتن مناطق مطالعه بیشتر به ما کمک می کند تا نمونه های آموزشی بیشتری از مناطق عملکردی به دست آوریم. آخرین اما نه کماهمیت، ترکیب دادههای دیگر، مانند تصاویر سنجش از راه دور با وضوح بالا و دادههای رسانههای اجتماعی، میتواند به طور موثر توانایی تمایز بین انواع بیشتری از مناطق کاربردی شهری را بهبود بخشد.
بدون دیدگاه