چکیده

مناطق عملکردی شهری اطلاعات ضروری در تجزیه ساختار فضایی شهری هستند. شناسایی سریع و دقیق مناطق عملکردی شهری برای بهبود برنامه ریزی و مدیریت شهری مهم است. به دلیل هزینه کم و ویژگی های به روز رسانی سریع داده، نقطه مورد علاقه (POI) یکی از رایج ترین انواع داده های دسترسی باز است. عمدتاً مناطق عملکردی شهری را با تجزیه و تحلیل همبستگی بالقوه بین داده‌های POI و مناطق شناسایی می‌کند. حتی اگر این یک جلوه مهم از منطقه عملکردی است، همبستگی فضایی بین مناطق به ندرت در مطالعات قبلی در نظر گرفته شده است. به منظور استخراج اطلاعات معنایی مکانی در بین مناطق، مدل جدیدی به نام Block2vec با استفاده از ایده چارچوب Skip-gram پیشنهاد شده است. مدل Block2vec همبستگی فضایی بین POIها و همچنین مناطق را به یک بردار با ابعاد بالا ترسیم می‌کند که در آن طبقه‌بندی مناطق عملکردی شهری می‌تواند بهتر انجام شود. نتایج حاصل از تحلیل خوشه ای نشان داد که بردار با ابعاد بالا استخراج شده می تواند به خوبی مناطق با عملکردهای مختلف را متمایز کند. نتیجه طبقه‌بندی جنگل‌های تصادفی (دقت کلی = 0.7186، کاپا = 0.6429) اثربخشی روش پیشنهادی را نشان می‌دهد. این مطالعه همچنین پتانسیل مدل جاسازی جمله را در استخراج اطلاعات معنایی POI تأیید کرد. نتایج حاصل از تحلیل خوشه ای نشان داد که بردار با ابعاد بالا استخراج شده می تواند به خوبی مناطق با عملکردهای مختلف را متمایز کند. نتیجه طبقه‌بندی جنگل‌های تصادفی (دقت کلی = 0.7186، کاپا = 0.6429) اثربخشی روش پیشنهادی را نشان می‌دهد. این مطالعه همچنین پتانسیل مدل جاسازی جمله را در استخراج اطلاعات معنایی POI تأیید کرد. نتایج حاصل از تحلیل خوشه ای نشان داد که بردار با ابعاد بالا استخراج شده می تواند به خوبی مناطق با عملکردهای مختلف را متمایز کند. نتیجه طبقه‌بندی جنگل‌های تصادفی (دقت کلی = 0.7186، کاپا = 0.6429) اثربخشی روش پیشنهادی را نشان می‌دهد. این مطالعه همچنین پتانسیل مدل جاسازی جمله را در استخراج اطلاعات معنایی POI تأیید کرد.

کلید واژه ها: 

مناطق عملکردی شهری ; نقطه مورد علاقه جاسازی جمله ; معناشناسی فضایی ; جنگل تصادفی

1. مقدمه

شهرها از کارکردهای مختلفی تشکیل شده‌اند که فعالیت‌های اجتماعی انسان و اشتغال آن‌ها به زمین را توصیف می‌کنند [ 1 ، 2 ]، و می‌توانند به مناطق عملکردی مختلفی مانند تجاری، مسکونی، صنعتی و فضای باز تقسیم شوند. مناطق عملکردی شهری ارتباط نزدیکی با بسیاری از مطالعات ساختار شهری دارند، مانند سرزندگی محله [ 3 ، 4 ]، توزیع سفر [ 5 ]، حمل و نقل انبوه شهری [ 6 ] و مصرف انرژی شهری [ 7 ]]. با شهرنشینی سریع در سال های اخیر، ساختار عملکرد شهری به طور فزاینده ای متنوع و پیچیده شده است. علاوه بر این، تکامل عملکرد واقعی منطقه ممکن است با قصد برنامه ریزی زمین ناسازگار باشد [ 8 ، 9 ، 10 ]. بنابراین، شناسایی سریع و دقیق مناطق عملکردی شهری برای بهبود برنامه ریزی و مدیریت شهری ضروری است [ 11 ، 12 ، 13 ].
نقشه‌های کاداستر و داده‌های سرشماری منابع ارزشمندی از داده‌های کاربری زمین هستند، زیرا به صراحت استفاده از زمین را منعکس می‌کنند و به مدیریت کاربری اراضی کمک می‌کنند. با این حال، الزامات بسیار سختگیرانه ای برای سرعت به روز رسانی و فرکانس به روز رسانی آن وجود دارد، که بدیهی است که برای درک زمان واقعی ما از ساختار کاربری زمین شهری مناسب نیست. تصاویر سنجش از دور [ 14 ، 15 ، 16 ، 17 ] و رادار/لیدار [ 18 ، 19 ، 20 ]] به طور مؤثری برای طبقه بندی کاربری و پوشش زمین استفاده شده اند، زیرا می توانند ویژگی های طیفی و بافتی زمین را به تصویر بکشند. با این حال، تشخیص مقوله‌هایی که نزدیک به فعالیت‌های اجتماعی انسانی هستند، ممکن است برای آنها دشوار باشد، زیرا این داده‌ها نمی‌توانند الگوی تعامل عملکردی را به تصویر بکشند، و همچنین نمی‌توانند محیط‌های اجتماعی-اقتصادی را درک کنند [ 21 ، 22 ، 23 ، 24 ، 25 ]. بنابراین، دسته بندی پوشش زمین برای سطوح غیرقابل نفوذ معمولاً شامل زمین های تجاری، مسکونی و صنعتی است.
برای نظارت و درک اطلاعات بالقوه در مورد فعالیت‌های اجتماعی انسانی، داده‌های جغرافیایی چند منبعی برای درک فعالیت‌های اجتماعی انسانی و استنتاج بیشتر کارکردهای مناطق، مانند داده‌های تلفن همراه بررسی شده است [ 23 ، 26 ، 27 ، 28 ، 29 ، 30 ]، داده های مسیر GPS [ 31 ، 32 ، 33 ]، داده های کارت هوشمند [ 1 ، 34 ]، داده های رسانه های اجتماعی [ 25 ، 35 ، 36 ] و داده های نقطه علاقه (POI) [ 2 ، 9 ، 10 ]33 , 34 , 36 , 37 , 38 ]. در آن، داده های POI، به عنوان ارزان و سریع به دست آوردن آن از اینترنت، دارای مزیت مهمی در ارائه اطلاعات قابل اعتماد در مورد مکان و نوع فعالیت های شهری (به عنوان مثال، خرید، سرگرمی و رستوران) است [ 9 ، 39 ]. علاوه بر این، داده های POI می توانند به صراحت اطلاعات معنایی را در مورد محیط ساخته شده شهری بیان کنند.
مجموعه رو به رشدی از ادبیات با استفاده از داده های POI برای شناسایی مناطق عملکردی شهری وجود دارد. با در نظر گرفتن روابط قوی بین مناطق عملکردی با فعالیت های اجتماعی-اقتصادی، لیو و لانگ [ 38 ] تلاش کردند تا الگوهای عملکردی را در سطح بسته با تولید شاخص های مختلف بر اساس فراوانی داده های POI ترسیم کنند. یوان و همکاران [ 40 ] مناطق عملکردی شهری را با استفاده از داده های POI و داده های مسیر تاکسی در پکن شناسایی کرد. با این حال، به دلیل پیچیدگی ساختار فضایی شهری، تحلیل الگوهای عملکردی تنها با استفاده از فرکانس‌های POI کافی نیست. چندین روش فرآیند زبان عصبی (NLP) برای استنتاج مناطق عملکردی شهری به کار گرفته شده است. در گائو و همکاران. [ 2]، مدل موضوعی تخصیص دیریکله پنهان (LDA) برای استنتاج مناطق عملکردی شهری با استفاده از داده‌های فعالیت‌های POI و ورود کاربر استفاده شد. چن و همکاران [ 41 ] سازمان فضایی 25 شهر را بر اساس روش کاوی الگوهای هم مکان مقایسه کردند. الگوریتم Word2vec برای استنتاج رابطه فضایی POI از نظر طبقه بندی منطقه عملکردی شهری [ 10 ] استفاده شد. الگوریتم Place2vec، که زمینه فضایی را بر اساس قانون اول جغرافیا [ 42 ] در نظر می گیرد، برای شناسایی مناطق عملکردی شهری در Wuxi، چین [ 8 ] استفاده شد.]. برعکس، رابطه فضایی نه تنها بین نقاط تسهیلات (مانند POI) بلکه بین بسته ها نیز وجود دارد. به عبارت دیگر، از آنجایی که POI بیشتر با سایر POI هایی که از نظر جغرافیایی به آن نزدیک هستند مطابق قانون اول جغرافیا [ 8 ، 43 ] مرتبط است، یک بسته نیز بیشتر به بسته هایی مرتبط است که از نظر جغرافیایی به آن نزدیک تر هستند. با این حال، روش‌های فوق روش‌های جاسازی کلمه هستند که فقط رابطه فضایی بین هر POI را در نظر می‌گیرند و مطالعات کمی به طور صریح به روابط متقابل فضایی بین بسته‌ها پرداخته‌اند.
برای رسیدگی به شکاف ها، یک رویکرد مبتنی بر بسته، به نام Block2vec، برای استخراج اطلاعات فضایی بین بسته ها با الهام از روش های جاسازی جمله پیشنهاد شد [ 44 ، 45 ]. بر اساس روش نزدیکترین همسایه، توالی POI و گروه توالی بیشتر برای هر بسته در Block2vec ساخته شد. سپس مدل استخراج ویژگی معنایی پنهان با استفاده از چارچوب skip-gram ساخته شد. در اینجا، شبکه حافظه کوتاه مدت بلند مدت (LSTM) [ 46 ] برای ساخت مدل Block2vec، که یک مدل یک به چند (بسته های بسته مرکزی به پس زمینه) و مدل سلسله مراتبی بود، مستقر شد. در نهایت، مدل Block2vec توسط یک مطالعه موردی در ووهان، چین آزمایش و تأیید شد.
ساختار باقی مانده مقاله به صورت زیر است: بخش 2 منطقه مورد مطالعه، مجموعه داده را ارائه می کند. سپس بخش 3 روش مدل Block2vec را معرفی می کند. بخش 4 مقایسه با نتایج تجربی را شرح می دهد. بخش 5 مزایا و محدودیت های روش پیشنهادی را مورد بحث قرار می دهد. در نهایت، بخش 6 نتیجه گیری و کار آینده را ارائه می دهد.

2. منطقه مطالعه و مجموعه داده

2.1. منطقه مطالعه

منطقه مورد مطالعه این تحقیق منطقه اصلی شهری ووهان مرکز استان هوبی چین است. این منطقه شامل منطقه ای در داخل جاده حلقه سوم، Zhuankou، Wugang و Miaoshan است که مساحتی به وسعت 678 کیلومتر مربع را پوشش می دهد . این شهر که توسط یانگ تسه تقسیم شده است، به عنوان “سه شهر ووهان” با هانکو و هانیانگ در کرانه غربی و ووچانگ در شرق شناخته می شود. برای این مطالعه، منطقه بر اساس داده های شبکه راه به 2385 قطعه تقسیم شد. شکل 1 منطقه اصلی شهری و توزیع POI در ووهان را نشان می دهد.

2.2. مجموعه داده

داده‌های POI مورد استفاده در این مطالعه از طریق پلتفرم توسعه AutoNavi (ADP) ( https://lbs.amap.com/api/webservice/guide/api/search ، دسترسی به 29 دسامبر 2016) به‌دست آمد. برای منطقه مورد مطالعه، 537,375 رکورد POI در دسامبر 2016 جمع‌آوری شد. هر رکورد POI شامل طول و عرض جغرافیایی POI و یک دسته طبقه‌بندی از سطوح چندگانه است که 20 دسته اصلی از سطح بالا و بیش از 500 زیرمجموعه سوم وجود دارد. -مرحله. به عنوان مثال، به عنوان یک دبستان، دسته اولیه آن خدمات فرهنگی علمی و آموزشی، رده متوسطه مدرسه و رده سوم ابتدایی است. دسته بندی دقیق POI را می توان از طریق وب سایت به دست آورد ( https://lbs.amap.com/api/webservice/download، مشاهده شده در 14 فوریه 2017). از میان همه دسته‌ها، آدرس/مکان در مطالعه بعدی حذف شد زیرا نمی‌توانست به صراحت برخی از فعالیت‌های اجتماعی انسانی را بیان کند. در جدول 1 ، به استثنای آدرس و مکان، دسته‌هایی که بیشترین تعداد POI را دارند، مرکز خرید، خدمات پذیرایی و خدمات زندگی هستند.

3. روش شناسی

گردش کار کلی رویکرد پیشنهادی در شکل 2 نشان داده شده است. هدف اصلی رویکرد پیشنهادی استخراج اطلاعات معنایی از POI در یک بسته، برای شناسایی بهتر عملکرد مناطق است. ابتدا، داده‌های POI و بسته‌ها برای تولید دنباله معنایی POI برای هر بسته استفاده شد. در مرحله دوم، توالی معنایی POI بر اساس بسته‌ها با استفاده از روش نزدیک‌ترین همسایه گروه‌بندی شد. ثالثاً، مدل استخراج ویژگی معنایی پنهان با استفاده از شبکه LSTM ایجاد شد. این مدل با استفاده از گروه‌های توالی معنایی POI آموزش داده شد و سپس توالی معنایی را در یک بردار معنایی پنهان با ابعاد بالا ترسیم کرد. سپس از الگوریتم K-Means برای تأیید تمایز و اعتبار ویژگی‌های معنایی نهفته و الگوریتم جنگل تصادفی (RFA) برای طبقه‌بندی مناطق عملکردی شهری استفاده شد. سرانجام،

3.1. ساخت دنباله معنایی برای هر بسته

عملکرد یک منطقه به ادغام انواع فعالیت ها در آنجا مربوط می شود [ 2 ]. به طور کلی، چندین امکانات خدماتی در یک بسته وجود دارد و مکان‌های مختلف در بسته فرصت‌های تماس فضایی متفاوتی دارند. با توجه به مکان‌های مختلف، POIها را می‌توان به دو بخش تقسیم کرد، شامل قسمتی که نزدیک‌تر به جاده قرار دارد و قسمت دیگر واقع در بسته. اولی به جمعیت در بسته های مجاور خدمات می دهد، در حالی که دومی عمدتاً به جمعیت در این بسته خدمات می دهد.
در این مطالعه، توالی معنایی POI با ترتیب خاص برای بیان فرصت‌های تماس فضایی مختلف در یک بسته ساخته شد. با توجه به تفاوت فضایی POI های بالا، POI ها در یک بسته را می توان بر اساس ترتیب فاصله مکانی از هر POI تا مرکز بسته مرتب کرد. به عنوان مثال، در شکل 3 a، در حال حاضر شش POI در بسته i- ام وجود دارد ، که در آن پ1نزدیکترین به نقطه مرکزی است و پ6نزدیکترین به جاده است بر اساس فاصله تا نقطه مرکزی، دنباله معنایی اسمنبه صورت { پ1، پ2، پ3، پ5، پ4، پ6}. در عمل، بسته ها می توانند تعداد POI های متفاوتی داشته باشند، به این معنی که توالی POI آنها می تواند طول های متفاوتی داشته باشد. در مطالعه بعدی، لایه LSTM به تعداد ثابتی نورون ورودی نیاز دارد. بنابراین، دنباله‌های POI با طول‌های مختلف باید ادامه پیدا کنند تا دنباله‌ای با طول ثابت داشته باشند. در این مقاله، طول ثابت به طولی تنظیم شده است که درصد آن را 90 درصد جمع می کند. یعنی، اگر طول POI از طول ثابت در یک بسته بیشتر شود، POI های اضافی حذف خواهند شد. در حالی که اگر طول کمتر از طول ثابت باشد، کاراکترهای خاص پر می شوند.
برای استخراج کامل روابط معنایی فضایی در داده‌های POI، لازم است نه تنها رابطه فضایی بین POIها بلکه بین بسته‌های مجاور نیز در نظر گرفته شود. در پردازش زبان طبیعی، یک کلمه یا یک جمله دارای دو رابطه متنی، جلو و عقب است. با این حال، در زمین فضایی، چندین زمینه جهتی متفاوت وجود خواهد داشت. برای ساده‌سازی این مشکل، رابطه متنی چهار قطعه مجاور به‌عنوان یک بلوک در نظر گرفته شد که می‌توان آن را به عنوان یک رابطه متنی در نظر گرفت. توزیع فضایی معمولی یک بلوک در شکل 3 ب نشان داده شده است، که در آن چهار نزدیکترین بسته ( سی1، سی2، سی3، سی4) اطراف بسته مرکزی i به عنوان بسته های زمینه در نظر گرفته شد. بنابراین، گروه دنباله معنایی برای بسته i به صورت [ اسمن، ( اسمن،ج1،  اسمن،ج2،  اسمن،ج3،  اسمن،ج4)].

3.2. مدل استخراج ویژگی معنایی پنهان

مطالعات قبلی نشان داده‌اند که مدل seq2seq می‌تواند به طور موثر ویژگی‌های نهفته یک جمله را با استفاده از اطلاعات بافت آن استخراج کند [ 44 ، 45 ، 47 ، 48 ]. متفاوت از روش جاسازی کلمه، روش جاسازی جمله که توسط مدل‌های seq2seq نشان داده می‌شود ، می‌تواند وظیفه جاسازی جمله را بهتر انجام دهد، زیرا می‌تواند ویژگی‌های مرتبط کلمات مختلف را در سطح جمله به طور جامع به تصویر بکشد، نه اینکه آنها را در سطح کلمات درک کند. . با الهام از مدل بالا، دنباله POI در یک بسته می تواند به عنوان یک جمله با k در نظر گرفته شود.نزدیکترین بسته ها در زمین فضایی آن به عنوان بسته های بافت آن. همانطور که در شکل 3 ب نشان داده شده است، مجاورترین مقدار k روی 4 تنظیم شد.
در این مطالعه، مدل Skip-Gram، که در مدل بردارهای فکر پرش [ 44 ] استفاده شده است، برای ایجاد مدل استخراج ویژگی معنایی نهفته استفاده شد که می‌تواند توسط سه بخش رمزگذار، رمزگشا و تابع هدف توصیف شود. . همانطور که در شکل 4 نشان داده شده است ، از یک رمزگذار برای نگاشت توالی POI بسته مرکزی به یک ویژگی معنایی پنهان استفاده شده است، و رمزگشاهای متعدد برای تولید دنباله های POI از بسته های زمینه استفاده شده است.
لایه های LSTM برای ساخت رمزگذار مدل استفاده شد. برای بسته من ، اجازه دهید { ایکس1، ایکس2،،ایکسn}دنباله POI در اسمندنباله، که در آن n تعداد POI در دنباله است اسمن. برای هر مرحله محاسبه، رمزگذار یک ویژگی لایه پنهان را محاسبه می کند ساعتتی، که می تواند به عنوان یک عبارت پنهان برای دنباله { در نظر گرفته شود ایکس1، ایکس2،،ایکستی}. حالت پنهان ساعتnبنابراین کل دنباله، یعنی بردار ویژگی معنایی نهفته را نشان می دهد اسمن. برای رمزگذاری دنباله اسمن، معادلات زیر را از اولین POI در دنباله POI تکرار کنید:

منتی=σ(دبلیومنمنایکستی+بمنمن+دبلیوساعتمنساعت(تی1)+بساعتمن)،
fتی=σ(دبلیومنfایکستی+بمنf+دبلیوساعتfساعت(تی1)+بساعتf)،
gتی=برنزهساعت(دبلیومنgایکستی+بمنg+دبلیوساعتgساعت(تی1)+بساعتg)،
oتی=σ(دبلیومنoایکستی+بمنo+دبلیوساعتoساعت(تی1)+بساعتo)،
جتی=fتیج(تی1)+منتیgتی،
ساعتتی=oتیبرنزهساعت(جتی)،

جایی که، منتیدروازه ورودی است، fتیدروازه فراموشی است، gتیگیت آپدیت است و oتیدروازه خروجی است، جتیحالت سلولی است و ساعتتیحالت پنهان رمزگذار در مرحله t است.

چهار لایه LSTM به ترتیب برای ایجاد رمزگشای مدل اتخاذ شد. ساختار شبکه هر رمزگشا شبیه به رمزگذار است. با دولت ساعتnبه عنوان یک شرط، چهار رمزگشا، دنباله های POI بسته های زمینه را تولید می کنند.
با توجه به یک گروه توالی POI [ اسمن، ( اسمن،ج1،  اسمن،ج2،  اسمن،ج3،  اسمن،ج4)]، تابع هدف بهینه سازی مجموع احتمالات لگاریتم برای توالی های معنایی زمینه مشروط به نمایش رمزگذار است:

Oاس=ج=ج1،ج2،ج3،ج4تیلogپ(ایکسجتی|ایکسج<تی،ساعتمن)،

جایی که ساعتمنحالت پنهان دنباله را نشان می دهد اسمن، ایکسجتینشان دهنده مقدار پیش بینی شده برای بسته c در مرحله t است.

در فرآیند آموزش مدل، هدف کل به حداقل رساندن مجموع توابع هدف بهینه سازی فوق در تمام گروه های توالی بود.

3.3. شناسایی مناطق کارکردی شهری بر اساس معناشناسی نهفته

پس از آموزش مدل فوق، رمزگذار با وزن های آموخته شده به عنوان استخراج کننده ویژگی برای نگاشت معنایی توالی POI هر بسته به یک ویژگی معنایی پنهان استفاده شد. ساعتn. از نظر تئوری، هر چه عملکرد معنایی POI بین بسته ها و محیط اطراف آنها شبیه تر باشد، بیشتر در فضای معنایی نهفته جمع می شوند. بنابراین، چندین طبقه‌بندی‌کننده را می‌توان برای تشخیص توابع مناطق مختلف آموزش داد. همانطور که در شکل 5 نشان داده شده است ، K-Means و الگوریتم جنگل تصادفی (RFA) برای طبقه بندی قطعات با ویژگی های معنایی پنهان مختلف به کار گرفته شدند.

3.3.1. K-Means-Based Parcel Aggregation

برای تأیید تمایز و اعتبار ویژگی‌های معنایی پنهان، از الگوریتم K-Means برای جمع‌آوری بسته‌های تحقیق با توجه به این ویژگی‌ها استفاده شد. فاصله تشابه در فضای برداری را می توان با روش های مختلف محاسبه فاصله فضایی، مانند فاصله اقلیدسی و فاصله کسینوس اندازه گیری کرد. از آنجایی که بعد ویژگی فضای معنایی نهفته به دست آمده در این مقاله زیاد است، فاصله کسینوس برای اندازه گیری بردارهای ویژگی معنایی نهفته اتخاذ شد. در نتیجه، الگوریتم خوشه‌بندی K-Means مبتنی بر فاصله کسینوس برای جمع‌آوری آن بسته‌ها اعمال شد.
سپس امتیاز silhouette [ 49 ] برای ارزیابی اینکه چگونه اشیاء مناسب در خوشه خود قرار دارند استفاده شد. برای نمونه i ، میانگین فاصله بین i و سایر نمونه‌ها در همان خوشه به صورت a و میانگین فاصله بین i و نمونه‌های درون خوشه‌های دیگر به صورت b تعریف می‌شود ، سپس امتیاز شبح به صورت زیر محاسبه می‌شود:

اسجorهپمن=بآحداکثر(آ،ب)
از فرمول بالا می توان دریافت که مقدار امتیاز silhouette بین [-1، 1] در نوسان است و هر چه به 1 نزدیک تر باشد عملکرد خوشه بندی بهتر است. بنابراین، ما میانگین امتیاز شبح تمام نمونه‌ها را به عنوان ارزیابی خوشه‌بندی K-Means محاسبه می‌کنیم.
3.3.2. طبقه بندی بسته مبتنی بر RFA
با این حال، تجزیه و تحلیل خوشه‌بندی بدون نظارت، تنها دسته‌ها را بر اساس تفاوت‌های بین ویژگی‌های معنایی پنهان POI بسته‌های مختلف طبقه‌بندی می‌کند. به دلیل غیرقابل توضیح معنایی نهفته POI استخراج شده، تخصیص و تعریف مقوله‌هایی که توسط تحلیل خوشه‌ای خوشه‌بندی می‌شوند، دشوار است. بنابراین، روش طبقه‌بندی نظارت شده بر اساس نمونه‌های آموزشی موجود، بخش مهمی از توجه ما است.
در میان آنها، RFA به طور گسترده در طبقه بندی نظارت شده استفاده می شود، زیرا سازگاری خوب با ویژگی های ابعادی بالا و دشواری در نصب بیش از حد، و توانایی قوی ضد نویز [ 50 ، 51 ]. اجازه دهید اچمنji ∈ [1, M ], j ∈ [1, N ]) و Yکk ∈ [1, K ]) ویژگی های پنهان و انواع کاربری زمین قطعه i باشد که M تعداد کل قطعات و N ابعاد ویژگی ها و K تعداد کل انواع توابع مناطق است. . با استفاده از روش کیسه‌بندی، نمونه‌هایی با ویژگی‌های n ( n≤ N ) به طور تصادفی از بین ویژگی‌های N انتخاب شدند و سپس برای ساخت درخت تصمیم استفاده شدند. با ترکیب تصادفی k ویژگی، Cدرختان تصمیم بارها و بارها بدون عملیات هرس ساخته شدند. هر درخت تصمیم به طور جداگانه نتیجه را پیش بینی می کرد و سپس همه نتایج یکپارچه شدند. حتی اگر یک درخت تصمیم منفرد ممکن است بیش از حد مناسب باشد، این خطر را می توان با ادغام نتایج همه درختان تصمیم کاهش داد. در این مقاله، پیاده‌سازی مدل RFA همه نتایج را با میانگین‌گیری پیش‌بینی احتمالی آنها ترکیب می‌کند، به‌جای اینکه اجازه دهد هر درخت تصمیم به یک کلاس رأی دهد.
همانطور که در بالا ذکر شد، عملکرد واقعی منطقه ممکن است با قصد هواپیماسازان سازگار نباشد. در این مطالعه، نمونه‌ها با استفاده از اطلاعات قبلی از منابع متعدد از جمله نقشه‌های آمایش سرزمین شهری، تصاویر سنجش از دور و نقشه‌های آنلاین انتخاب شدند. نقشه های آمایش شهری را می توان از طریق وب سایت ( https://zrzyhgh.wuhan.gov.cn/zwgk_18/fdzdgk/ghjh/zzqgh/202001/t20200107_602858.shtml، مشاهده شده در 12 مه 2017). این نمونه ها شامل پنج نوع عملکرد است: مناطق مسکونی، مناطق تجاری، مناطق تجاری، فضای سبز باز و مناطق صنعتی. نمونه های آموزشی به طور تصادفی به دو زیرمجموعه با اندازه مساوی تقسیم شدند که یکی برای آموزش و دیگری برای آزمون استفاده می شود. سپس مدل با استفاده از نمونه های آموزشی آموزش داده شد و از نمونه های آزمایشی برای ارزیابی دقت مدل های آموزش دیده استفاده شد. برای اطمینان از استحکام طبقه‌بندی، طبقه‌بندی تصادفی جنگل‌ها 100 بار تکرار شد و سپس از میانگین دقت به عنوان نتیجه ارزیابی نهایی استفاده شد. علاوه بر این، چندین روش استخراج معنایی POI پیشرفته، مانند فرکانس معکوس فرکانس سند (TF-IDF) [ 9 ]، تخصیص دیریکله پنهان (LDA) [52 ] و Word2vec [ 10 ] برای مقایسه با روش پیشنهادی ما استفاده شد.

4. نتایج

در این مطالعه، 2315 بسته تحقیقاتی شامل 537375 داده POI بود، در حالی که Tianxingzhou و چند بسته بدون POI حذف شدند. سپس، طبقه‌بندی سه سطحی انواع POI (در مجموع 496 نوع) برای ساخت دنباله‌های POI برای بسته‌ها، که می‌توانند طول‌های متفاوتی داشته باشند، استفاده شد. شکل 6 توزیع طول توالی POI بسته را نشان می دهد. مشاهده می شود که طول توالی POI اکثر بسته ها کوچکتر است. وقتی طول تا 500 باشد، درصد تجمعی به 91.69٪ می رسد. بنابراین، این مطالعه طول ثابت دنباله را 500 تعیین می کند. در نهایت، گروه های توالی برای هر بسته همانطور که در بخش 3.1 توضیح داده شد ساخته شد .
چندین ماژول، مانند ماژول scikit-learn (ابزار یادگیری ماشینی منبع باز، https://scikit-learn.org/stable/ ، قابل دسترسی در 10 مه 2019)، ماژول PyTorch (یک یادگیری ماشین منبع باز و چارچوب یادگیری عمیق، https://pytorch.org/ ، قابل دسترسی در 2 آگوست 2018) و ماژول Gensim (یک چارچوب مدل‌سازی مبحث منبع باز، https://radimrehurek.com/gensim/ ، در تاریخ 23 سپتامبر 2019) برای ساخت و آموزش مدل استخراج معنایی بالقوه منطقه ای شرح داده شده در بخش 3.2 اتخاذ شدند. ساختار LSTM برای مدل استخراج ویژگی معنایی نهفته اتخاذ شد. در این مدل تعداد لایه های LSTM ها 1، بعد ویژگی معنایی پنهان 200، mini-batch روی 64 و تعداد تکرارها 100 تنظیم شد.

4.1. شناسایی مناطق کاربردی شهری

4.1.1. تجمیع مناطق تابعی شهری با الگوریتم K-Means

همانطور که در بالا نشان داده شد، به دلیل معنایی نهفته مشابه توالی های فضایی POI آنها، بسته هایی با معنای عملکردی یکسان در فضای معنایی نهان نسبت به سایر بسته های عملکردی بسته تر خواهند بود. سپس الگوریتم خوشه‌بندی K-Means مبتنی بر فاصله کسینوس برای تأیید تمایز و اعتبار ویژگی‌های معنایی پنهان انجام شد. همانطور که در شکل 7 نشان داده شده است ، هنگامی که خوشه بندی دو نوع است، امتیاز silhouette بالاترین است، سپس با افزایش تعداد خوشه ها، امتیاز silhouette به تدریج کاهش می یابد. در نتیجه، هنگامی که k = [2، 3، 4]، امتیاز شبح می تواند به مقادیر بالای 3 برسد. علاوه بر این، حداکثر محلی زمانی به دست می آید که تعداد خوشه های k 6، 8 و 12 باشد.
شکل 8 نتایج خوشه بندی K-Means را با مقادیر مختلف k ترسیم می کند:
هنگامی که k = 2، با مقایسه با نقشه سنجش از دور و نقشه کاربری اراضی برنامه ریزی جامع در ووهان، می توانیم دریابیم که ساختار دایره آشکار را می توان در شکل 8 a مشاهده کرد. علاوه بر این، نتایج خوشه‌بندی، عملکرد فضایی شهری را به یک منطقه مرکزی و یک ناحیه لبه تقسیم می‌کند که ممکن است با عملکرد و سطح توسعه منطقه شهری در مرکز و حومه مرتبط باشد.
هنگامی که k = 3، تقسیم بیشتر در مقایسه با k = 2 انجام می شود، و ساختار دایره هنوز در شکل 8 ب وجود دارد. نه تنها این، بلکه رده کلاس 2 در این زمان بیشتر در منطقه مرکز شهر متمرکز است، در حالی که کلاس 3 در حاشیه شهر / منطقه پیرامونی متمرکز است. از طریق مقایسه نقشه های سنجش از دور و نقشه های کاربری اراضی برنامه ریزی جامع در ووهان، توزیع کلاس 3 با طرح واقعی مناطق مختلف صنعتی در ووهان مطابقت دارد.
وقتی k = 4، نقشه خوشه‌بندی در شکل 8 c عمدتاً برای طبقه‌بندی مجدد کلاس 2 و کلاس 3 زمانی که k = 3 است، کلاس 1، کلاس 3 و کلاس 4 را در این زمان تولید می‌کند. علاوه بر این، کلاس 2 در شکل 8 c اساساً با کلاس 1 در شکل 8 b سازگار است. در میان آنها، کلاس 1 متمرکزتر است، و توزیع جزئی و نقطه مانند را نشان می دهد. در عین حال، از طریق مقایسه نقشه‌های سنجش از دور و نقشه‌های کاربری اراضی شهری برنامه‌ریزی جامع، مشخص شد که توزیع دسته‌های کلاس 1 با توزیع مناطق تجاری در ووهان مطابقت دارد.
4.1.2. شناسایی مناطق عملکردی شهری بر اساس الگوریتم جنگل تصادفی
با استفاده از روش خوشه‌بندی بدون نظارت K-Means، می‌توان مشاهده کرد که روش پیشنهادی می‌تواند به طور موثر ویژگی‌های معنایی پنهان دنباله‌های POI را استخراج کند. با این حال، روش بدون نظارت نمی تواند تعریف صریحی از دسته بندی های طبقه بندی شده ارائه دهد، بنابراین روش طبقه بندی نظارت شده بر اساس نمونه های آموزشی موجود ابزار ضروری است که باید اتخاذ شود.
بر اساس بردارهای ویژگی معنایی پنهان استخراج شده از مدل فوق، این مقاله از الگوریتم جنگل تصادفی برای طبقه‌بندی مناطق عملکردی شهری استفاده می‌کند. در عین حال 96 نمونه به صورت تصادفی انتخاب شده است. علاوه بر این، برخی از روش‌های پیشرفته، از جمله TF-IDF [ 9 ]، LDA [ 2 ] و Word2vec [ 43 ]، برای مقایسه با روش‌های ما استفاده می‌شوند.
مدل RFA ارائه شده توسط کتابخانه ماژول scikit-learn ( https://scikit-learn.org/stable/ ، دسترسی به 10 مه 2019) برای طبقه بندی مناطق عملکردی شهری، که در آن تعداد C درخت های تصمیم روی 200 تنظیم شده است، به کار گرفته شد. پیاده‌سازی مدل‌های Word2vec، LDA و TF-IDF برای آزمایش‌های مقایسه با استفاده از ماژول ارائه‌شده توسط کتابخانه ماژول genism ( https://radimrehurek.com/gensim/index.html ، قابل دسترسی در 23 سپتامبر 2019) انجام شد. تنظیمات پارامتر مدل برای هر روش مطابق با ادبیات قبلی حفظ می شود.
برای اطمینان از پایداری نتایج، هر روش 100 بار تکرار شد. جدول 2 ارزیابی دقیقی از طبقه بندی مناطق عملکردی شهری با استفاده از روش های مختلف ارائه می دهد و شکل 9 نتایج نقشه برداری طبقه بندی مناطق عملکردی شهری را با استفاده از روش های مختلف نشان می دهد.
برخلاف مطالعات قبلی، اگرچه روش TF-IDF فقط ویژگی‌های کمی POI در منطقه را در نظر می‌گیرد، اما همچنان به دقت طبقه‌بندی نسبتاً خوبی در مقایسه با مدل LDA دست می‌یابد. مدل Word2vec که هم ویژگی‌های کمی و هم ویژگی‌های توزیع فضایی POI را در نظر می‌گیرد، دقت طبقه‌بندی بالاتری نسبت به TF-IDF و LDA دارد زیرا هم ویژگی‌های فرکانس POI و هم رابطه فضایی بین POI را در نظر می‌گیرد. در مقایسه با نتایج فوق، Block2vec پیشنهادی بالاترین دقت طبقه‌بندی و امتیاز کاپا را به دست آورد.
شکل 10 ماتریس های سردرگمی طبقه بندی مناطق عملکردی شهری را با روش های مختلف نشان می دهد. در مقایسه با روش‌های دیگر، روش پیشنهادی ( شکل 10 د) دارای بالاترین دقت در طبقه‌بندی مناطق مسکونی، تجاری و صنعتی و بالاترین دقت در طبقه‌بندی مشاغل است. روش Word2Vec ( شکل 10الف) در طبقه بندی مشاغل و فضای باز دارای بیشترین دقت و در طبقه بندی مسکونی و صنعتی کمتر است. نتایج نشان می‌دهد که با در نظر گرفتن رابطه فضایی بسته‌ها، مدل استخراج ویژگی می‌تواند به طور موثری دقت طبقه‌بندی واحدهای مسکونی، تجاری و صنعتی را بهبود بخشد، اما نمی‌تواند دقت طبقه‌بندی فضای باز را بهبود بخشد.
برای تأیید بیشتر نتایج طبقه‌بندی بر اساس مدل پیشنهادی، سه منطقه محلی با نقشه گوگل و نقشه کاربری اراضی برنامه‌ریزی جامع در ووهان مقایسه شد. شکل 11 a منطقه مرکزی شهر است و نوع عملکرد واقعی آن عمدتا بر اساس مناطق تجاری و تجاری است. نتایج نشان می دهد که توزیع طبقه بندی مدل پیشنهادی با توزیع نقشه های برنامه ریزی مطابقت دارد. شکل 11 ب یکی دیگر از مناطق مرکزی شهر است و مقیاس تجاری آن کوچکتر از شکل 11 الف است. کسب و کار در نقشه برنامه ریزی این منطقه از شمال به جنوب و نتایج طبقه بندی مدل پیشنهادی از شرق به غرب اختصاص یافته است. شکل 11ج یک منطقه تجاری و صنعتی در جنوب شرقی شهر است. مشاهده می شود که نتایج طبقه بندی مدل پیشنهادی کاملاً با نقشه برنامه ریزی مغایرت دارد. از طریق مقایسه با نقشه های آنلاین، توزیع طبقه بندی مدل پیشنهادی واقعی تر است. اگرچه بیشتر مناطق در شکل 11 ج به عنوان زمین صنعتی برنامه ریزی شده است، با ورود تعداد زیادی از شرکت های فناوری نرم افزار، عملکرد این مناطق به تدریج به کارکردهای تجاری و تجاری در این منطقه تبدیل شده است. این امر تحقیقات قبلی را تأیید می کند که تکامل عملکرد واقعی منطقه ممکن است با قصد هواپیماسازان سازگار نباشد.

4.2. تأثیر اندازه ویژگی های معنایی پنهان

مدل ویژگی معنایی پنهان مورد استفاده در این مقاله، توالی POI را در یک بلوک به فضای ویژگی معنایی پنهان با ابعاد بالا ترسیم می‌کند، بنابراین بعد ویژگی معنایی پنهان به طور مستقیم غنای معنایی ویژگی پنهان را تعیین می‌کند. اگر بعد ویژگی معنایی پنهان خیلی کم باشد، به دست آوردن معنایی توالی POI غنی دشوار است و منجر به از دست دادن اطلاعات می شود. با این حال، ابعاد بیش از حد بالا ممکن است منجر به افزونگی اطلاعات شود. از این رو در این بخش سعی شده است توانایی ویژگی های معنایی پنهان اندازه های مختلف در شناسایی و تمایز مناطق عملکردی شهری مورد تجزیه و تحلیل قرار گیرد.
شکل 12 تغییرات ارزیابی دقت طبقه بندی مناطق عملکردی شهری را هنگامی که مدل در ابعاد مختلف تنظیم می شود نشان می دهد. مشاهده می شود که وقتی اندازه لایه پنهان بین 100-10 است، با افزایش اندازه لایه پنهان، معنای نهفته به دست آمده بیشتر و بیشتر می شود و دقت طبقه بندی بیشتر می شود. هنگامی که اندازه لایه پنهان بین 100 تا 250 باشد، تغییر دقت طبقه بندی آشکار نیست زیرا اندازه بهبود می یابد. هنگامی که بعد لایه پنهان تا 300 افزایش می یابد، دقت طبقه بندی به دلیل ابعاد بسیار بالای ویژگی های نهفته کاهش می یابد. بنابراین، مناسب است که اندازه ویژگی معنایی پنهان لایه پنهان را در این مقاله 200 قرار دهیم.

5. بحث

نقشه مناطق کارکردی شهری به موقع و دقیق برای مدیریت شهری و برنامه ریزی شهری مفید است. این مطالعه با استخراج ویژگی‌های معنایی نهفته POI در بسته‌ها، رویکردی مؤثر برای شناسایی مناطق عملکردی شهری پیشنهاد می‌کند. رویکرد پیشنهادی روابط فضایی زیر را در نظر می گیرد: (1) رابطه فضایی POI در یک بسته: یک رابطه متقابل و رقابتی بین POIهای مجاور در فضای جغرافیایی وجود دارد [ 53]. (2) دسترسی فضایی در مناطق مختلف یک بسته متفاوت است: به طور کلی، به دلیل دسترسی زیاد برای تماس خارجی، امکانات عمومی بیشتری در مناطق نزدیک به خیابان ها وجود دارد، در حالی که مناطق نزدیک به داخل بسته دارای برخی از امکانات منحصر به فرد هستند. . (3) رابطه بین بسته ها: بسته هایی با عملکردهای مختلف به دلیل روابط متقابل یا رقابتی آنها اغلب نزدیک یا دور از یکدیگر هستند.
این مطالعه با مطالعات قبلی مطابقت دارد [ 2 ، 9 ، 10 ، 42] که پردازش زبان طبیعی (NLP) مزیت خوبی در استخراج ویژگی‌های معنایی POI دارد. با این حال، مطالعات کمی به طور صریح به همبستگی های فضایی بین بسته ها پرداخته اند. در این مطالعه، با توجه به روابط موجود بین POI، توالی معنایی POI با نظم خاصی ساخته شد. سپس گروه توالی با در نظر گرفتن روابط موجود بین بسته ها (پارسل مرکزی و قطعه زمینه) ساخته شد. شبکه LSTM برای استخراج اولی استفاده شد، در حالی که ساختار Encoder-Decoder برای استخراج دومی استفاده شد. در نتیجه، نتایج به بالاترین دقت (OA = 0.7186، Kappa = 0. 6429) دست یافت که نشان می‌دهد مدل ما می‌تواند به طور موثر ویژگی‌های نهفته را برای طبقه‌بندی دقیق‌تر مناطق عملکردی شهری استخراج کند. علاوه بر این، نتیجه ماتریس سردرگمی نشان می دهد که روش پیشنهادی می تواند به طور موثری دقت طبقه بندی مناطق مسکونی، تجاری و صنعتی را بهبود بخشد. این نشان می‌دهد که آن نوع بسته‌ها همبستگی‌های فضایی نزدیک دارند، در حالی که از نظر فضایی کمتر به زمین فضای باز متصل هستند. علاوه بر این، مقایسه نتایج طبقه‌بندی مناطق محلی تأیید کرد که تکامل عملکرد واقعی منطقه ممکن است با قصد طراحان سازگار نباشد.
دقت طبقه بندی برای چهار روش با استفاده از داده های POI از 0.5972 تا 0.7186 بود که نزدیک به دقت مطالعات مربوطه بود [ 8 ، 30 ، 35 ]. با این حال، این ها کمتر از طبقه بندی کاربری زمین سنجش از دور بود. دلیل اصلی این است که تصاویر سنجش از دور عمدتاً زمین را بر اساس ویژگی‌های فیزیکی زمین طبقه‌بندی می‌کنند و تعداد زیادی مجموعه داده برچسب‌گذاری شده را جمع‌آوری کرده است. متفاوت از این، طبقه بندی بر اساس POI با استفاده از نمونه های انتخاب شده توسط خودمان، با حجم نمونه کوچک و تحت تأثیر ذهنی آموزش داده شد. در عین حال، عملکرد برخی از مناطق تحت تأثیر فعالیت های اجتماعی متعدد انسانی قرار می گیرد.
لازم به ذکر است که این مطالعه تنها در محدوده شهری که امکانات خدماتی فراوانی وجود دارد مورد بررسی قرار گرفته است. بنابراین، ممکن است انتقال این رویکرد به مناطق با POI کمتر، مانند حومه و مناطق روستایی دشوار باشد. علاوه بر این، نوع تابع ترکیبی ذکر نشده است زیرا تعریف مصنوعی این نوع دشوار است [ 41 ، 43 ]. با این وجود، این مقاله به طور مبتکرانه یک روش استخراج معنایی مبتنی بر بسته را پیشنهاد کرد که از نظر توانایی آن در استخراج معنایی POI از سایر روش‌های پیشرفته گزارش‌شده در مقاله بهتر عمل کرد.
علاوه بر این، تحقیق در این مقاله، قطعات را به پنج نوع منطقه کاربردی طبقه‌بندی کرد که ممکن است با طبقه‌بندی استاندارد کاربری زمین شهری در تضاد باشد. برخی از انواع استاندارد کاربری اراضی ترکیبی از فعالیت‌های اجتماعی مختلف انسانی هستند که ممکن است دقیقاً مطابق با انواع کاربری زمین نباشد. همچنین هیچ استاندارد تعریف واحدی در مطالعات مربوطه وجود ندارد [ 8 ، 32 ، 36]. با این حال، این مقاله تلاشی برای استفاده از روش پیشنهادی برای تعریف انواع برای جایگزینی انواع کاربری استاندارد شهری ندارد. هدف این تحقیق ارائه یک روش داده محور بهتر برای شناسایی سریع و دقیق توابع منطقه ای از داده های POI است. بنابراین برنامه ریزان و مدیریت دولتی می توانند از این روش برای مشاهده و نظارت مستمر و موثر بر تغییرات عملکردهای منطقه ای در شهر استفاده کنند.
علاوه بر این، برخی از مناطق عملکردی را می توان تقسیم کرد. به عنوان مثال، محل سکونت را می توان به زمین های مسکونی کم تراکم و متراکم بالا تقسیم کرد، که می تواند با داده های سنجش از دور شناسایی شود [ 14 ]. با این حال، تشخیص آنها به تنهایی توسط POI دشوار است. ترکیب داده‌های دیگر، مانند تصاویر سنجش از راه دور با وضوح بالا و داده‌های رسانه‌های اجتماعی، می‌تواند به طور موثر توانایی تمایز بین انواع مختلف مناطق کاربردی شهری را بهبود بخشد.

6. نتیجه گیری و کار آینده

با شهرنشینی سریع، ساختار فضایی شهری مناطق عملکردی شهری به طور فزاینده ای متنوع و پیچیده شده است. بنابراین تهیه نقشه منطقه عملکردی شهری به موقع و دقیق برای مدیریت شهری و برنامه ریزی شهری ضروری است. این مطالعه یک رویکرد موثر به نام Block2vec را برای شناسایی مناطق عملکردی شهری با استخراج ویژگی‌های معنایی پنهان POI در بسته‌ها پیشنهاد کرد. ابتدا، یک توالی POI و گروه توالی بیشتر برای هر بسته ساخته شد. سپس، توالی POI با ساخت یک مدل Block2vec به فضایی با ابعاد بالا نگاشت شد. علاوه بر این، خوشه‌بندی K-Means و طبقه‌بندی RFA برای آشکارسازی ساختارهای شهری و شناسایی انواع عملکردی به کار گرفته شد. در مقایسه با سایر روش های پیشرفته (TF-IDF، LDA و Word2vec)، روش Block2vec می تواند بالاترین دقت را به دست آورد (OA = 0.7186، Kappa = 0.6429). علاوه بر این، روش پیشنهادی بهبود قابل توجهی در دقت طبقه‌بندی زمین‌های مسکونی، تجاری و صنعتی دارد. روش پیشنهادی می تواند به مدیریت شهری و برنامه ریزان شهری کمک کند تا توزیع مناطق عملکردی شهری را به موقع و دقیق درک کنند. در همان زمان، این مطالعه همچنین پتانسیل مدل فرآیند زبان عصبی را در استخراج اطلاعات معنایی POI تأیید کرد. روش پیشنهادی می تواند به مدیریت شهری و برنامه ریزان شهری کمک کند تا توزیع مناطق عملکردی شهری را به موقع و دقیق درک کنند. در همان زمان، این مطالعه همچنین پتانسیل مدل فرآیند زبان عصبی را در استخراج اطلاعات معنایی POI تأیید کرد. روش پیشنهادی می تواند به مدیریت شهری و برنامه ریزان شهری کمک کند تا توزیع مناطق عملکردی شهری را به موقع و دقیق درک کنند. در همان زمان، این مطالعه همچنین پتانسیل مدل فرآیند زبان عصبی را در استخراج اطلاعات معنایی POI تأیید کرد.
برای کارهای آینده، انباشتن مناطق مطالعه بیشتر به ما کمک می کند تا نمونه های آموزشی بیشتری از مناطق عملکردی به دست آوریم. آخرین اما نه کم‌اهمیت، ترکیب داده‌های دیگر، مانند تصاویر سنجش از راه دور با وضوح بالا و داده‌های رسانه‌های اجتماعی، می‌تواند به طور موثر توانایی تمایز بین انواع بیشتری از مناطق کاربردی شهری را بهبود بخشد.

منابع

  1. ژونگ، سی. هوانگ، ایکس. مولر آریسونا، اس. اشمیت، جی. باتی، ام. استنتاج توابع ساختمان از یک مدل احتمالی با استفاده از داده های حمل و نقل عمومی. محاسبه کنید. محیط زیست سیستم شهری 2014 ، 48 ، 124-137. [ Google Scholar ] [ CrossRef ]
  2. گائو، اس. یانوویچ، ک. کوکللیس، اچ. استخراج مناطق عملکردی شهری از نقاط مورد علاقه و فعالیت های انسانی در شبکه های اجتماعی مبتنی بر مکان. ترانس. GIS 2017 ، 21 ، 446-467. [ Google Scholar ] [ CrossRef ]
  3. جین، ایکس. لانگ، ی. سان، دبلیو. لو، ی. یانگ، ایکس. تانگ، جی. ارزیابی سرزندگی شهرها و شناسایی شهرهای ارواح در چین با داده های جغرافیایی در حال ظهور. شهرها 2017 ، 63 ، 98-109. [ Google Scholar ] [ CrossRef ]
  4. یو، ی. ژوانگ، ی. بله، پیش از این؛ زی، جی. Ma، CL; لی، QQ اندازه گیری استفاده مختلط مبتنی بر POI و روابط آنها با سرزندگی محله. بین المللی جی. جئوگر. Inf. علمی 2017 ، 31 ، 658-675. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  5. فرقانی، م. کریمی پور، ف. تعامل بین جوامع شهری و تحرک انسان-جمعیت: مطالعه ای با استفاده از منابع داده های جغرافیایی ارائه شده. ترانس. GIS 2018 ، 22 ، 1008-1028. [ Google Scholar ] [ CrossRef ]
  6. یو، م. کانگ، سی. آندریس، سی. Qin، K. لیو، ی. منگ، کیو. درک تعامل بین پویایی اتوبوس، مترو و تاکسی سواری در شنژن، چین. ترانس. GIS 2018 ، 22 ، 855-871. [ Google Scholar ] [ CrossRef ]
  7. ژانگ، ام. ژائو، پی. تأثیر ترکیب کاربری زمین بر مصرف انرژی سفر ساکنان: شواهد جدید از پکن. ترانسپ Res. قسمت D Transp. محیط زیست 2017 ، 57 ، 224-236. [ Google Scholar ] [ CrossRef ]
  8. ژای، دبلیو. بای، ایکس. شی، ی. هان، ی. پنگ، Z.-R. Gu, C. Beyond Word2vec: رویکردی برای استخراج و شناسایی منطقه عملکردی شهری با ترکیب Place2vec و POI. محاسبه کنید. محیط زیست سیستم شهری 2019 ، 74 ، 1-12. [ Google Scholar ] [ CrossRef ]
  9. یوان، جی. ژنگ، ی. Xie, X. کشف مناطق با عملکردهای مختلف در یک شهر با استفاده از تحرک انسان و POI. در مجموعه مقالات هجدهمین کنفرانس بین المللی ACM SIGKDD در مورد کشف دانش و داده کاوی—KDD ’12، پکن، چین، 12 تا 16 اوت 2012. [ Google Scholar ]
  10. یائو، ی. لی، ایکس. لیو، ایکس. لیو، پی. لیانگ، ز. ژانگ، جی. Mai، K. سنجش توزیع فضایی کاربری زمین شهری با ادغام نقاط مورد علاقه و مدل Google Word2Vec. بین المللی جی. جئوگر. Inf. علمی 2017 ، 31 ، 825-848. [ Google Scholar ] [ CrossRef ]
  11. ماات، ک. ون وی، بی. استد، د. استفاده از زمین و رفتار سفر: اثرات مورد انتظار از دیدگاه تئوری مطلوبیت و نظریه‌های مبتنی بر فعالیت. محیط زیست طرح. B طرح. دس 2005 ، 32 ، 33-46. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  12. الیس، ای. پونتیوس، آر. تغییر کاربری و پوشش زمین. دایره المعارف زمین. 2007. در دسترس آنلاین: https://ecotope.org/people/ellis/papers/ellis_eoe_lulcc_2007.pdf (در 30 سپتامبر 2016 قابل دسترسی است).
  13. لا روزا، دی. خصوصیات مناطق غیر شهری برای برنامه ریزی کاربری اراضی زیرساخت های کشاورزی و سبز در بافت های شهری. Landsc. طرح شهری. 2013 ، 109 ، 94-106. [ Google Scholar ] [ CrossRef ]
  14. هان، ایکس. ژونگ، ی. ژائو، بی. Zhang، L. طبقه بندی صحنه بر اساس یک رمزگذار خودکار پراکنده سلسله مراتبی برای تصاویر با وضوح فضایی بالا. بین المللی J. Remote Sens. 2017 , 38 , 514–536. [ Google Scholar ] [ CrossRef ]
  15. ژونگ، ی. فی، اف. لیو، ی. ژائو، بی. جیائو، اچ. Zhang، L. SatCNN: طبقه‌بندی مجموعه داده‌های تصویر ماهواره‌ای با استفاده از شبکه‌های عصبی کانولوشنال چابک. سنسور از راه دور Lett. 2017 ، 8 ، 136-145. [ Google Scholar ] [ CrossRef ]
  16. تائو، سی. پان، اچ. لی، ی. Zou, Z. یادگیری ویژگی های طیفی-فضایی بدون نظارت با رمزگذار خودکار پراکنده روی هم برای طبقه بندی تصاویر فراطیفی. IEEE Geosci. سنسور از راه دور Lett. 2015 ، 12 ، 2438-2442. [ Google Scholar ] [ CrossRef ]
  17. لی، جی. هوانگ، ایکس. Zhang، L. طبقه‌بندی بازآموزی پراکنده نیمه نظارت شده برای تصاویر سنجش از دور با وضوح بالا. در مجموعه مقالات سمپوزیوم بین المللی علوم زمین و سنجش از دور (IGARSS)، پکن، چین، 10 تا 15 ژوئیه 2016. [ Google Scholar ]
  18. محمدی منش، ف. صالحی، ب. مهدیان پری، م. گیل، ای. مولینیر، ام. یک شبکه عصبی کاملاً پیچیده جدید برای تقسیم معنایی تصاویر SAR قطبی در اکوسیستم پوشش زمین پیچیده. ISPRS J. Photogramm. Remote Sens. 2019 , 151 , 223–236. [ Google Scholar ] [ CrossRef ]
  19. لی، ی. چن، ی. لیو، جی. Jiao, L. یک شبکه جدید کاملاً پیچیده برای طبقه بندی تصاویر PolSAR. Remote Sens. 2018 ، 10 ، 1984. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  20. تائو، سی. چن، اس. لی، ی. طبقه‌بندی پوشش زمین Xiao، S. PolSAR بر اساس ویژگی‌های قطبی نامتغیر رول و انتخاب شده پنهان در حوزه چرخش. Remote Sens. 2017 , 9 , 660. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  21. تو، دبلیو. کائو، جی. یو، ی. شاو، اس ال. ژو، ام. وانگ، ز. چانگ، ایکس. خو، ی. لی، کیو. اتصال داده های تلفن همراه و رسانه های اجتماعی: رویکردی جدید برای درک عملکردهای شهری و الگوهای روزانه. بین المللی جی. جئوگر. Inf. علمی 2017 ، 30 ، 2331-2358. [ Google Scholar ] [ CrossRef ]
  22. لیو، ی. لیو، ایکس. گائو، اس. گونگ، ال. کانگ، سی. ژی، ی. چی، جی. شی، ال. حس اجتماعی: رویکردی جدید برای درک محیط های اجتماعی-اقتصادی ما. ان دانشیار صبح. Geogr. 2015 ، 105 ، 512-530. [ Google Scholar ] [ CrossRef ]
  23. پی، تی. سوبولفسکی، اس. راتی، سی. شاو، اس ال. لی، تی. ژو، سی. بینشی جدید در طبقه بندی کاربری زمین بر اساس داده های تلفن همراه جمع آوری شده است. بین المللی جی. جئوگر. Inf. علمی 2014 ، 28 ، 1988-2007. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  24. جیا، ی. Ge، Y. لینگ، اف. گوا، ایکس. وانگ، جی. وانگ، ال. چن، ی. Li, X. نقشه‌برداری کاربری زمین شهری با ترکیب تصاویر سنجش از دور و داده‌های موقعیت‌یابی تلفن همراه. Remote Sens. 2018 , 10 , 446. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  25. لیو، ایکس. او، جی. یائو، ی. ژانگ، جی. لیانگ، اچ. وانگ، اچ. Hong, Y. طبقه بندی کاربری زمین شهری با ادغام داده های سنجش از دور و رسانه های اجتماعی. بین المللی جی. جئوگر. Inf. علمی 2017 ، 31 ، 1675-1696. [ Google Scholar ] [ CrossRef ]
  26. Toole، JL; اولم، ام. گونزالس، ام سی؛ بائر، دی. استنباط کاربری زمین از فعالیت تلفن همراه. در مجموعه مقالات کارگاه بین المللی ACM SIGKDD در محاسبات شهری، پکن، چین، 12 اوت 2012. صص 1-8. [ Google Scholar ]
  27. ریوس، SA; Muñoz، R. تشخیص استفاده از زمین با داده‌های تلفن همراه با استفاده از مدل‌های موضوعی: Case Santiago، شیلی. محاسبه کنید. محیط زیست سیستم شهری 2017 ، 61 ، 39-48. [ Google Scholar ] [ CrossRef ]
  28. تو، دبلیو. هو، ز. لی، ال. کائو، جی. جیانگ، جی. لی، کیو. لی، کیو. به تصویر کشیدن مناطق عملکردی شهری با جفت کردن تصاویر سنجش از دور و داده‌های سنجش انسان. Remote Sens. 2018 , 10 , 141. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  29. مائو، اچ. Ahn، YY; بهادوری، بی. تاکور، جی. بهبود استنتاج کاربری زمین با فاکتورسازی ماتریس فعالیت تماس تلفن همراه. J. کاربری زمین علمی. 2017 ، 12 ، 138-153. [ Google Scholar ] [ CrossRef ]
  30. کاسرس، ن. بنیتز، FG استنتاج استفاده از زمین تحت نظارت از الگوهای تحرک. J. Adv. ترانسپ 2018 ، 2018 ، 8710402. [ Google Scholar ] [ CrossRef ]
  31. پان، جی. چی، جی. وو، زی. ژانگ، دی. Li, S. طبقه بندی کاربری زمین با استفاده از ردیابی GPS تاکسی. IEEE Trans. هوشمند ترانسپ سیستم 2013 ، 14 ، 113-123. [ Google Scholar ] [ CrossRef ]
  32. لیو، ایکس. کانگ، سی. گونگ، ال. لیو، ی. ترکیب الگوهای تعامل فضایی در طبقه بندی و درک کاربری زمین شهری. بین المللی جی. جئوگر. Inf. علمی 2016 ، 30 ، 334-350. [ Google Scholar ] [ CrossRef ]
  33. وانگ، ی. گو، ی. دو، م. Qiao, M. استفاده از معناشناسی فضایی و تعاملات برای شناسایی مناطق عملکردی شهری. ISPRS Int. J. Geo Inf. 2018 ، 7 ، 130. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  34. لانگ، ی. Shen, Z. کشف مناطق عملکردی با استفاده از داده های کارت هوشمند اتوبوس و نقاط مورد علاقه در پکن. در تجزیه و تحلیل جغرافیایی برای حمایت از برنامه ریزی شهری در پکن ; Springer: Cham, Switzerland, 2015; جلد 116، صص 193–217. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  35. فریاس مارتینز، وی. فریاس مارتینز، E. خوشه بندی طیفی برای سنجش کاربری زمین شهری با استفاده از فعالیت توییتر. مهندس Appl. آرتیف. هوشمند 2014 ، 35 ، 237-245. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  36. ژانگ، ی. لی، کیو. تو، دبلیو. مای، ک. یائو، ی. چن، ی. تشخیص کاربری زمین شهری کاربردی با ادغام داده‌های مکانی چند منبعی و همبستگی‌های متقابل. محاسبه کنید. محیط زیست سیستم شهری 2019 ، 78 ، 101374. [ Google Scholar ] [ CrossRef ]
  37. جیانگ، اس. آلوز، آ. رودریگز، اف. فریرا، جی. Pereira، FC داده های نقطه مورد علاقه استخراج از شبکه های اجتماعی برای طبقه بندی و تفکیک کاربری زمین شهری. محاسبه کنید. محیط زیست سیستم شهری 2015 ، 53 ، 36-46. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  38. لیو، ایکس. Long, Y. شناسایی و خصوصیات خودکار بسته ها با OpenStreetMap و نقاط مورد علاقه. محیط زیست طرح. B طرح. دس 2016 ، 43 ، 341-360. [ Google Scholar ] [ CrossRef ]
  39. یو، ز. کاپرا، ال. ولفسون، او. یانگ، اچ. محاسبات شهری: مفاهیم، ​​روش‌شناسی و کاربردها. ACM Trans. هوشمند سیستم تکنولوژی 2014 ، 5 ، 1-55. [ Google Scholar ] [ CrossRef ]
  40. یوان، نیوجرسی؛ ژنگ، ی. Xie، X. وانگ، ی. ژنگ، ک. Xiong، H. کشف مناطق عملکردی شهری با استفاده از مسیرهای فعالیت نهفته. IEEE Trans. بدانید. مهندسی داده 2015 ، 27 ، 712-725. [ Google Scholar ] [ CrossRef ]
  41. چن، ی. لیو، ایکس. لی، ایکس. لیو، ایکس. یائو، ی. در آغوش گرفتن.؛ خو، X. Pei، F. ترسیم مناطق عملکردی شهری با داده‌های رسانه‌های اجتماعی در سطح ساختمان: یک روش K-medoids مبتنی بر فاصله زمانی پویا (DTW). Landsc. طرح شهری. 2017 ، 160 ، 48-60. [ Google Scholar ] [ CrossRef ]
  42. یان، بی. مای، جی. یانوویچ، ک. Gao, S. از ITDL تا Place2Vec – استدلال در مورد شباهت و ارتباط نوع مکان با یادگیری جاسازی‌ها از زمینه‌های فضایی تقویت‌شده. در مجموعه مقالات سمپوزیوم بین‌المللی GIS ACM درباره پیشرفت‌ها در سیستم‌های اطلاعات جغرافیایی، ردوندو بیچ، کالیفرنیا، ایالات متحده آمریکا، 7 تا 10 نوامبر 2017. [ Google Scholar ]
  43. یائو، ی. لیانگ، اچ. لی، ایکس. ژانگ، جی. او، جی. با ادغام Google Tensorflow و مدل‌های طبقه‌بندی صحنه، الگوهای کاربری زمین شهری را حس می‌کند. بین المللی قوس. فتوگرام Remote Sens. Spatial Inf. علمی 2017 ، XLII-2/W7 ، 981–988. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  44. کیروس، آر. زو، ی. سالاخوتدینوف، ر. زمل، آر اس؛ تورالبا، ا. اورتاسون، ر. Fidler, S. بردارهای فکری پرش. در مجموعه مقالات NIPS’15: بیست و هشتمین کنفرانس بین المللی سیستم های پردازش اطلاعات عصبی، مونترال، QC، کانادا، 8 تا 13 دسامبر 2014. انتشارات MIT: کمبریج، MA، ایالات متحده آمریکا، 2015. [ Google Scholar ]
  45. سوتسکور، آی. وینیالز، او. Le، QV توالی برای یادگیری توالی با شبکه های عصبی. در مجموعه مقالات NIPS’15: بیست و هشتمین کنفرانس بین المللی سیستم های پردازش اطلاعات عصبی، مونترال، QC، کانادا، 8 تا 13 دسامبر 2014. انتشارات MIT: کمبریج، MA، ایالات متحده آمریکا، 2015. [ Google Scholar ]
  46. ساندرمایر، ام. شلوتر، آر. Ney, H. LSTM شبکه های عصبی برای مدل سازی زبان. در مجموعه مقالات سیزدهمین کنفرانس سالانه انجمن بین المللی ارتباطات گفتار، INTERSPEECH 2012، پورتلند، OR، ایالات متحده آمریکا، 9 تا 13 سپتامبر 2012. [ Google Scholar ]
  47. چو، ک. ون مرینبور، بی. گلچهره، سی. بهداناو، د. بوگارس، اف. شونک، اچ. Bengio، Y. آموزش نمایش عبارات با استفاده از رمزگذار-رمزگشا RNN برای ترجمه ماشینی آماری. در مجموعه مقالات کنفرانس EMNLP 2014 در مورد روشهای تجربی در پردازش زبان طبیعی، دوحه، قطر، 25 تا 29 اکتبر 2014. [ Google Scholar ]
  48. وانگ، اس. کائو، جی. چن، اچ. پنگ، اچ. Huang, Z. SeqST-GAN: شبکه های متخاصم مولد Seq2Seq برای پیش بینی جریان جمعیت شهری چند مرحله ای. ACM Trans. تف کردن سیستم الگوریتم 2020 ، 6 ، 22. [ Google Scholar ] [ CrossRef ]
  49. Rousseeuw, PJ Silhouettes: کمکی گرافیکی برای تفسیر و اعتبارسنجی تحلیل خوشه‌ای. جی. کامپیوتر. Appl. ریاضی. 1987 ، 20 ، 53-65. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  50. بریمن، ال. رندوم فارست. ماخ فرا گرفتن. 2001 ، 45 ، 5-32. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  51. Biau, G. تجزیه و تحلیل یک مدل جنگل های تصادفی. جی. ماخ. فرا گرفتن. Res. 2012 ، 13 ، 1063-1095. [ Google Scholar ]
  52. لینو، ام. مایتر، اچ. Datcu، M. حاشیه نویسی معنایی تصاویر ماهواره ای با استفاده از تخصیص دیریکله نهفته. IEEE Geosci. سنسور از راه دور Lett. 2010 ، 7 ، 28-32. [ Google Scholar ] [ CrossRef ]
  53. لیو، ایکس. آندریس، سی. رحیمی، س. طاقچه مکان و تنوع منطقه ای آن: اندازه گیری الگوهای بافت فضایی برای نقاط مورد علاقه با یادگیری بازنمایی. محاسبه کنید. محیط زیست سیستم شهری 2019 ، 75 ، 146-160. [ Google Scholar ] [ CrossRef ]
شکل 1. مکان، مناطق اداری و توزیع POI ووهان. منطقه شهری اصلی از وب‌سایت اداره منابع طبیعی و برنامه‌ریزی ووهان ( https://zrzyhgh.wuhan.gov.cn/zwgk_18/fdzdgk/ghjh/zzqgh/202001/t20200107_602852.shtml ، در تاریخ مه 2017) به دست آمده است.
شکل 2. گردش کار طبقه بندی منطقه عملکردی شهری.
شکل 3. گروه توالی معنایی برای بسته مرکزی i .
شکل 4. مدل استخراج ویژگی معنایی پنهان.
شکل 5. نمودار طبقه بندی بر اساس رمزگذار آموزش دیده.
شکل 6. توزیع طول توالی POI بسته. طول دنباله POI تعداد POI در بسته است.
شکل 7. امتیاز سیلوئت خوشه بندی K-Means با مقادیر k مختلف (k تعداد خوشه ها را در تحلیل خوشه ای نشان می دهد).
شکل 8. نتایج تحلیل خوشه‌بندی K-Means بلوک‌ها با استفاده از ویژگی‌های معنایی پنهان POI (k = 2،3،4).
شکل 9. طبقه بندی مناطق عملکردی شهری از طریق روش های مختلف نتایج حاصل می شود.
شکل 10. ماتریس های سردرگمی نتایج طبقه بندی از طریق ( a ) Word2Vec، ( b ) TF-IDF، ( c ) LDA و ( d ) روش پیشنهادی.
شکل 11. مقایسه نتایج طبقه بندی مناطق محلی. ( الف ) منطقه مرکزی در Wuchang. ( ب ) منطقه مرکزی در هانیانگ؛ ( ج ) منطقه جنوب شرقی Wuchang (نقشه‌های آنلاین Google در سمت چپ، نقشه‌های برنامه‌ریزی در وسط و نتایج طبقه‌بندی ما در سمت راست هستند).
شکل 12. تغییرات در دقت طبقه بندی منطقه عملکردی شهری تحت ویژگی های معنایی پنهان مختلف.

بدون دیدگاه

دیدگاهتان را بنویسید