1. معرفی
جریان مبدا-مقصد (OD) شناسایی معنایی و استخراج ویژگی داده های مسیر پیچیده است. این به وضوح اطلاعات جغرافیایی مبدا و نقاط مقصد مسیر واقعی، جهت جریان مسیر ضمنی و فاصله، و همچنین ویژگیهای موضوعی خاص (مانند مهاجرت جمعیت، تدارکات و جریان بار، جریان ترافیک و غیره) را بیان میکند [ 1 ] . با این حال، با رایج شدن موقعیت یابی GPS و افزایش سنسورهای اینترنت اشیا، داده های عظیم مسیر موبایل نیز ظاهر شده است. نحوه یافتن الگوی جریان و بررسی تعامل انسان و زمین در داده های متراکم مسیر OD یک موضوع مهم در داده کاوی مسیر سیار است [ 2 ، 3 ].
برخی از محققان از روش های تجزیه و تحلیل بصری مانند دسته بندی لبه ها، خوشه بندی نقطه OD برای حل پدیده همپوشانی و نمایش آشفتگی لبه ها استفاده می کنند [ 1 ، 4 ، 5 ، 6 ]، بنابراین جریان بزرگتر خوشه های OD را برجسته می کنند. برخی از محققان همچنین از خوشه بندی فضایی برای تشخیص الگو توسط خوشه بندی نقطه O، خوشه بندی نقطه D، خوشه بندی نقطه OD، و خوشه بندی جریان OD (لبه) برای سناریوهای کاربردی مختلف استفاده می کنند [ 7 ، 8 ، 9 ، 10 ، 11 .]. از نظر ایده های پژوهشی و روش های خوشه بندی جریان OD، اکثر محققان داده های جریان OD را مجموعه ای از نقاط O و D می دانند. با توجه به ویژگی های فضایی نقاط OD، الگوریتم خوشه بندی نقطه ای برای تحقق خوشه بندی جریان OD از طریق تکرار مضاعف استفاده می شود [ 12 ، 13 ، 14 ، 15 ]. این الگوریتم های خوشه بندی جریان OD به راحتی توسط توزیع فضایی نقاط OD و تنظیم شعاع جستجو یا پارامترهای اتصال داخلی محدود می شوند. آنها توانایی کشف خوشه های جریان نامنظم را به طور فعال ندارند.
روشهای خوشهبندی موجود جریان OD جغرافیایی بر ویژگیهای واحدهای جغرافیایی و مناطق عملکردی تکیه میکنند و دادههای کاربری ذاتی زمین مبدا و مقصد را با رفتار جریان جغرافیایی پویا پیوند بسیار نزدیکی میدهند. در روش خوشهبندی جریان مبتنی بر مدل، الگوهای جریان کشفشده کلاسیکتر هستند و از عوامل مکان سنتی و عوامل دینامیکی استنباط میشوند و ارزش ذاتی دادههای مسیر OD را بهطور کامل استخراج نمیکنند. نحوه استفاده کامل از «هر داده با ارزش و واقعی» با ایده روشهای مبتنی بر داده، و نحوه استفاده از نمایش دادههای جریان OD برای استخراج الگوی جریان جغرافیایی برای تأیید، بهروزرسانی، تکمیل و اصلاح واحد جغرافیایی ، نوع کاربری زمین و تقسیم بندی عملکردی،
با مواجهه با مشکلات تاخیر زمانی و غیر دینامیک ناشی از وابستگی واحدهای جغرافیایی ذاتی در کاوی الگوی جریان جغرافیایی، این مقاله یک روش خوشهبندی جریان OD را بر اساس محدودیتهای برداری پیشنهاد میکند. ما قصد داریم حالت تعامل پویا فضای جریان را از طریق ویژگی های داده جریان جغرافیایی استخراج کنیم و ابزار جدیدی برای استخراج الگوهای جریان پیچیده و نامنظم ارائه کنیم.
در این مطالعه، ویژگیهای مکانی و هندسی (رفتار) جریان OD با تعریف نقطه رویداد جریان OD و بردار جریان OD بیان میشود، سپس مختصات بردار جریان OD با خوشهبندی فضایی نقطه رویداد عادی میشود. بر این اساس، خوشههای جریان OD با الگوهای جریان مشابه توسط خوشهبندی بردار جریان OD یافت میشوند. در نهایت، با در نظر گرفتن دادههای OD تاکسی پکن به عنوان مثال، این مطالعه از روشی برای یافتن جوامع جریان ترافیک تاکسی و خوشههای شکل نامنظم با الگوی جریان یکسان استفاده میکند.
2. تحقیقات مرتبط
2.1. تجسم جریان OD
روش های تجسم داده های جریان OD عمدتاً شامل نقشه جریان [ 16 ، 17 ، 18 ، 19 ، 20 ، 21 ]، ماتریس OD و نقشه OD [ 22 ، 23 ، 24 ، 25 ] است. در میان آنها، نقشه جریان ویژگی های فضایی داده های OD را بهتر منعکس می کند. اما برخی مشکلات نیز در آن روش وجود دارد، مانند مشکل بهم ریختگی بصری، مشکل واحد منطقه قابل تغییر، مشکل عادی سازی، سوگیری برجسته و غیره [ 1 ، 8 ، 11 ]. به منظور حل این مشکلات، محققان تغییر مسیر یال را پیشنهاد کرده اند [26 ]، دسته بندی لبه [ 27 ، 28 ]، ماتریس های نقشه های متعدد [ 24 ، 29 ] و سایر ابزارها برای کاهش بهم ریختگی، اما منجر به از دست رفتن اطلاعات مکانی نقاط OD می شود و رابطه بین جریان های OD دشوار است. درک شود. مکان نقاط OD با استفاده از خوشهبندی فضایی و تقسیمبندی نمودار [ 17 ، 30 ] جمعآوری میشود، اما خوشهبندی دلخواه منجر به از دست دادن وضوح فضایی و بیمعنای الگوهای خوشهبندی میشود. با استفاده از واحدهای جغرافیایی پیشفرض یا خوشهبندی چند مقیاسی [ 31]، تفاوت مقیاس و انحراف قابل توجه را می توان حل کرد. با این حال، جریانهای OD بین مقیاسهای مختلف را نمیتوان از نظر کمی با یکدیگر مقایسه کرد، زمانی که مقیاس، دامنه، و دقت نمونهگیری مجموعههای داده به طور قابلتوجهی متفاوت است، و الگوهای موجود در نمودارهای جریان معمولاً توسط جریانهایی با فواصل جغرافیایی طولانیتر کنترل میشوند. به منظور حل همه جانبه این مشکلات، برخی از محققان روش جدیدی را برای تعمیم نقشه جریان [ 1 ] پیشنهاد کرده اند که می تواند برای مقابله با مجموعه داده های جریان در مقیاس مختلف مورد استفاده قرار گیرد. ایده این روش حل مشکل تجسم جریان OD از طریق توزیع چگالی مجموعه نقطه نقاط OD است.
2.2. خوشه بندی جریان OD
خوشه بندی ابزار مهمی برای کشف الگو است. پس از توسعه طولانی مدت، انواع الگوریتم های خوشه بندی ایجاد و بهینه شده است، مانند خوشه بندی سلسله مراتبی، خوشه بندی مبتنی بر چگالی، خوشه بندی مبتنی بر مدل، خوشه بندی مبتنی بر پارتیشن، و خوشه بندی مبتنی بر شبکه [ 32 ] (ص 2- 19). الگوریتمهای خوشهبندی جدید شامل خوشهبندی نیمه نظارت شده [ 32 ] (ص 136-155)، خوشهبندی طیفی، و خوشهبندی بر اساس عاملبندی ماتریس غیرمنفی [ 32 ] (صص 157-213)، و همچنین خوشهبندی دادههای با ابعاد بالا است. [ 33 ]، خوشهبندی نمودار [ 34 ، 35 ]، خوشهبندی دادههای نامشخص، و خوشهبندی دادههای مرتبط با چند منبع برای مسائل پیچیده [ 36 ]، 37 ]. با این حال، مهم نیست که چگونه الگوریتم خوشه بندی تحت داده محور یا الگوریتم محور توسعه می یابد، شباهت مسئله اصلی الگوریتم خوشه بندی است. از طریق بررسی ادبیات، ایدههای طراحی الگوریتم خوشهبندی جریان OD به دو دسته طبقهبندی میشوند، خوشهبندی جریان OD مبتنی بر نقطه و خوشهبندی جریان OD مبتنی بر خط.
خوشه بندی جریان OD مبتنی بر نقطه، شاخص شباهت را به عنوان اندازه گیری شباهت بر اساس نقاط OD تعریف می کند. معیارهای تشابه زیادی مانند فاصله اقلیدسی، فاصله منهتن، فاصله چبیشف و غیره وجود دارد. در فرآیند خوشهبندی جریان OD، معمولاً از طریق الگوریتم خوشهبندی نقطه تو در تو OD انجام میشود. برخی از محققان یک الگوریتم خوشهبندی خط ساده را برای یافتن نزدیکترین رابطه فضایی با جستجوی خطوط مجاور سفر OD در یک شعاع معین پیشنهاد کردهاند [ 15 ]. با این حال، در الگوریتم خاص، شعاع جستجو بر اساس نقاط OD اتخاذ شده است که به شباهت نقاط به تکرار بستگی دارد. برخی از محققان یک روش آماری اسکن فضایی را بر اساس بهینهسازی کلنی مورچهها برای تشخیص خوشههای OD با شکل دلخواه پیشنهاد کردند [ 38]. تعریف خوشه های OD به اتصال داخلی نقاط OD نیز بستگی دارد. بنابراین، در این مقاله، این نوع الگوریتم به عنوان خوشه بندی جریان OD بر اساس ایده نقطه در نظر گرفته شده است.
خوشه بندی جریان OD مبتنی بر خط یک الگوریتم خوشه بندی است که بر اساس شباهت خط (مسیر) است. در سنتز نقشه، خوشه بندی سری های زمانی و خوشه بندی مسیر، پارامترهای اندازه گیری زیادی برای تشابه خطوط اندازه گیری وجود دارد. برای مسیرهای پیچیده (خطوط چند بخش)، فاصله DTW، حداقل فاصله مستطیل برون سپاری، طولانی ترین فاصله متوالی مشترک، فاصله ویرایش، فاصله Frechet و غیره وجود دارد [ 39 ]. برای سنتز گروه خط، از نظر ماکروسکوپی به عنوان ویژگی های هندسی مشابه، روابط فضایی مشابه، و ویژگی های مشابه (معناشناسی) تعریف می شود [ 40]، به طور خاص، از جمله شباهت توپولوژیکی، میانگین جهت، واریانس دایرهای، طول متوسط، ضریب پیچخوردگی، چگالی گروه خط و غیره. هنگام تحقیق در مورد شباهت نوع خط ساده (جریان OD اولیه) و زیرمسیر، شاخص تشابه محدودیتهای هندسی [ 41 و 42 ] در نظر گرفته شده است. برای مثال، فاصله تشابه مسیر فرعی در الگوریتم خوشهبندی مسیر TR-OPTICS به صورت فاصله افقی، فاصله عمودی و فاصله زاویه اندازهگیری میشود [ 43 ].
جریان OD یک شکل خطی ساده در هندسه است که از نقاط O و D تشکیل شده است. بنابراین، هنگام مطالعه خوشهبندی جریان OD، میتوانیم از نقاط OD برای تکرار خوشهبندی استفاده کنیم و از شباهت نقطهای با ابعاد پایین برای محدود کردن شباهت جریان OD استفاده کنیم. اگرچه داده های با ابعاد بالا را می توان توسط الگوریتم های کاهش ابعاد خاص پردازش کرد، ویژگی های ذاتی آن ضعیف شده یا نادیده گرفته می شود [ 32 ] (ص 216-220). جهت جریان، فاصله جریان، و فضای جریان جریان OD، که محققان بیشتر نگران آن هستند، به طور شهودی منعکس نمی شوند. دشواری الگوریتم خوشهبندی جریان مبتنی بر خط، تعریف تابع شباهت مناسب برای خوشهبندی جریان OD با توجه به ویژگیهای مکانی و ویژگیهای جریان OD است.
3. روش خوشه بندی جریان OD بر اساس محدودیت های برداری
این بخش روش خوشه بندی جریان OD را بر اساس محدودیت های برداری معرفی می کند. این روش در سه جنبه زیر شرح داده شده است: تعریف مفاهیم مرتبط، پارامترهای مدل (تعداد خوشهبندی و تابع فاصله)، و جزئیات فرآیند خوشهبندی. اجزای روش در شکل 1 نشان داده شده است.
3.1. تعریف
3.1.1. نقطه رویداد جریان OD
جایی که ایکسOو YOمختصات جغرافیایی نقطه مبدا (O-point)، و ایکسDو YDمختصات جغرافیایی نقطه مقصد (نقطه D) هستند. طبق رابطه (1) پoدنقطه میانی خط هندسی جریان OD است. با در نظر گرفتن دادههای مسیر OD تاکسی به عنوان مثال، جریان OD دادههای مسیر تاکسی است که حاوی اطلاعات معنایی موقعیتهای سوار و پیاده شدن مسافران است. تولید یک جریان OD رفتار مسافرتی مسافر با تاکسی را نشان می دهد. برخی از محققان یک مدل فرآیند نقطه مکانی-زمانی پیشنهاد کرده اند که نقطه شروع و پایان تاکسی را به عنوان دو فرآیند نقطه متفاوت در نظر می گیرد [ 44 ، 45 ].]. اگر بر اساس اطلاعات معنایی گره های جریان OD قضاوت کنیم، جریان OD یک فرآیند نقطه ای با دو ویژگی متفاوت است. اگر از منبع جمعآوری دادهها، یعنی دادههای GPS تاکسی با رویدادهای مسافرتی (ویژگیها) قضاوت کنیم، جریان OD یک رویداد با معناشناسی مسافر در فرآیند عملیات تاکسی است که به عنوان یک فرآیند نقطهای در نظر گرفته میشود. در این تحقیق می توان خط را به عنوان یک نقطه بر اساس تعمیم نقشه در مقیاس کوچک و متوسط انتزاع کرد و بیشتر از منظر فرآیند نقطه ای مکانی و زمانی تفسیر کرد. جریان OD به عنوان یک رویداد از فعالیت جمعیت شهری در نظر گرفته می شود و به عنوان یک فرآیند نقطه ای انتزاع می شود. ویژگی های فضایی آن با نقطه میانی خط هندسی جریان OD نشان داده می شود. بنابراین تعریف می کنیم پoدبه عنوان نقطه رویداد جریان OD که دارای ویژگی فضایی جریان OD است. لازم به تاکید است که هدف اصلی استفاده از مختصات نقطه ای برای نشان دادن مکان فضایی جریان OD این است که جریان OD را به عنوان یک کل و به عنوان یک شی خط در نظر بگیریم و سپس از نقاط رویداد جریان OD برای نشان دادن ویژگی های مکان مکانی کلی استفاده کنیم. جریان OD.
3.1.2. بردار جریان OD
معادله (2) نشان می دهد که OD→بردار هندسی جریان OD است. با در نظر گرفتن دادههای مسیر OD تاکسی به عنوان مثال، O-point موقعیت GPS تاکسی در هنگام وقوع حادثه سوار شدن مسافر است و D-point موقعیت GPS تاکسی در هنگام وقوع حادثه سقوط مسافر است. جریان OD یک قطعه خط جهت دار است. به عنوان یک استخراج معنایی داده های مسیر پیچیده، جریان OD در فضای جغرافیایی معنایی ندارد، اما جریان مسافر را در فضای جغرافیایی در فضای معنایی نشان می دهد. اگرچه هیچ مسیر واقعی بر اساس شبکه جاده ای در جریان OD وجود ندارد، اما جهت روشنی از فعالیت جمعیت و فواصل مکانی و زمانی بین OD وجود دارد. در این مطالعه، جریان های OD به عنوان بردارهای هندسی در نظر گرفته می شوند. اندازه و جهت جریان های OD با مدول و جهت جریان های OD بیان می شود.
3.1.3. معناشناسی جریان OD
معناشناسی جریان OD را می توان به عنوان رویدادهای فعالیت های جمعیت شهری در نظر گرفت که معمولاً از معنایی نقاط OD [ 46 ] استنباط می شود.] (صص 130-158). به عنوان مثال، از منطقه مسکونی به اداری به عنوان رفت و آمد در نظر گرفته می شود، از محل مسکونی به محل تجاری به عنوان خرید در نظر گرفته می شود. بر این اساس، اطلاعات معنایی جریان های OD به شدت به دقت و دانه بندی داده های نقطه مورد علاقه (POI) بستگی دارد. در این مطالعه، اطلاعات معنایی نقاط OD بر اساس مناطق عملکردی شهری و قوانین سفر شهری از قبل استخراج و تجمیع نشده است. هیچ روند خوشهبندی برای دادههای با ابعاد بالا در کل فضا وجود ندارد. فضای معنایی و فضای جغرافیایی لزوماً شباهت خوبی در خوشهبندی جریانهای OD ندارند. بنابراین، در این مقاله به خوشهبندی مشابه ویژگیهای معنایی خاص جریانهای OD توجهی نمیشود. امید است که بتوان از خوشه بندی فضایی جریان های OD برای استخراج قوانین جریان و الگوهای بالقوه جریان های OD استفاده کرد.
3.1.4. مجموعه مشخصه جریان OD
بدون در نظر گرفتن شباهت معنایی، برخی از محققان پیشنهاد کرده اند که ویژگی های هدف گروه خط فضایی را می توان به عنوان مجموعه ای از روابط فضایی (روابط توپولوژیکی فضایی، روابط جهت فضایی و روابط فاصله فضایی) و مجموعه ای از ویژگی های هندسی (طول خط) خلاصه کرد. و طول متوسط، ضریب پیچ در پیچ و چگالی گروه خط) [ 40 ]. با توجه به خاص بودن ساختار خط OD، توجه به رابطه توپولوژیکی و ضریب پرپیچ و خم OD ضروری نیست [ 40 ، 43 ]]. جهت جریان OD با زاویه جهت محاسبه نمی شود بلکه با ویژگی بردار هندسی بیان می شود. توزیع فضایی و فاصله جریان OD با چگالی توزیع و فاصله نقاط رویداد جریان OD جایگزین می شود. بنابراین، ما ساختار داده جریان OD را به صورت زیر تعریف می کنیم:
3.2. پارامتر
3.2.1. انتخاب الگوریتم خوشه بندی پایه
در تحقیق تشخیص الگوی فضایی خوشهبندی جریان OD، سه روش اصلی برای شناسایی توزیع فضایی وجود دارد [ 38 ]]. در میان آنها، دو نوع اصلی از الگوریتم خوشه بندی کلاسیک بهبود یافته وجود دارد، الگوریتم خوشه بندی سلسله مراتبی برای جریان OD و الگوریتم خوشه بندی چگالی بر اساس نقاط مبدا و مقصد. مزیت الگوریتم خوشهبندی سلسله مراتبی این است که ساختار نتایج خوشهبندی درختی است و میتوان آن را با خوشهبندی چند مقیاسی بیان کرد. مزیت الگوریتم خوشهبندی مبتنی بر چگالی این است که پتانسیل استخراج خوشههای فضایی از نقاط OD با اشکال دلخواه را با اتصال موجودیتهای فضایی با چگالی بالا با فضاهای پیوسته به خوشهها دارد. روش سوم بر گسترش روش آماری فضایی سنتی برای شناسایی ناهنجاریهای خوشهبندی جریان OD با تعریف شباهت جریان OD جدید تمرکز دارد. محدودیتهای الگوریتمهای خوشهبندی سلسله مراتبی و خوشهبندی چگالی به شرح زیر است: اول، تعریف فاصله و اندازه مقدار نامشخص است و ثانیاً، محدودیت کشف خوشههایی با شکل دلخواه به دلیل شکافتن نقاط OD در جریانهای OD. محدودیت اصلاح بر اساس الگوریتم آماری فضایی در از دست دادن اطلاعات جریان OD ناشی از کاهش ابعاد تعریف شباهت جریان OD نهفته است.
این تحقیق از الگوریتم خوشهبندی K-means استفاده میکند که دلیل اصلی آن تعریف و انتخاب خوشهها است [ 47 ، 48 ]. الگوریتمهای خوشهبندی مختلف به دلیل منطق متفاوت، تعاریف و تواناییهای استخراج متفاوتی برای خوشهها دارند. نتیجه خوشهبندی مورد انتظار از این الگوریتم، جریان OD با رابطه فضایی نزدیک و شکل هندسی مشابه درون خوشهها است، بنابراین برای روش خوشهبندی مبتنی بر پارتیشن که مبتنی بر تعریف خوشه مرکزی است، مناسبتر است.
3.2.2. اندازه و انتخاب K
انتخاب نقاط بذر مرحله مهمی در خوشه بندی K-means است. اندازه K تعداد خوشه ها را تعیین می کند. انتخاب K بر کارایی تکرار تأثیر می گذارد. در مطالعات قبلی، روش آرنج و ضریب silhouette شاخصهای کلاسیک برای ارزیابی اثر خوشهبندی هستند [ 49 ، 50 ]. با پیمایش K، مجموع مربعات خطا (SSE) و ضرایب شبح تحت مقادیر مختلف K محاسبه میشود و گرههای زانویی منحنی SSE و ضرایب شبح بزرگتر مربوطه پیدا میشوند. در مطالعات قبلی اغلب از قضاوت چشم غیر مسلح استفاده می شد. در طراحی الگوریتم این مطالعه، نقاط مهم ادراکی (PIP) برای شناسایی خودکار نقاط آرنج SSE [ 51 ] اتخاذ شده است.] و برای بررسی از ضریب silhouette استفاده می شود.
با محاسبه SSE، از روش زانویی برای یافتن رابطه بین مقدار K و عدد خوشهبندی واقعی استفاده میشود.
جایی که سیمنهست منخوشه ام، پنقطه نمونه در است سیمن، و مترمنمیانگین تمام نمونه ها در است سیمن. وقتی K کمتر از عدد خوشهبندی واقعی باشد، افزایش K منجر به کاهش قابل توجهی در آن میشود SSEو هنگامی که K به عدد خوشه بندی واقعی می رسد، بهره اثر خوشه بندی به سرعت با افزایش K کاهش می یابد. بنابراین، مقدار K مربوط به نقطه عطف زانویی منحنی SSE، تعداد واقعی خوشه بندی داده ها است.
ضریب سیلوئت یک روش ارزیابی خوشهبندی است که انسجام و جدایی را ترکیب میکند. برای هر بردار من، ضریب شبح آن است:
جایی که آ(من)میانگین فاصله از بردار است منبه تمام نقاط دیگر در خوشه ای که به آن تعلق دارد، و ب(من)حداقل فاصله از بردار است منبه تمام نقاط خوشه که به آن تعلق ندارد. میانگین تمام ضرایب شبح، مجموع ضرایب شبح نتایج خوشه بندی است. هر چه ضریب silhouette به 1 نزدیکتر شود، انسجام و جدایی بهتر است. اما ضریب silhouette یک شاخص ارزیابی نسبی است. ضریب silhouette با تغییر K در نوسان است. این منحنی غیر محدب است. راه حل های بهینه محلی زیادی وجود دارد. معمولاً برای کمک به روش زانویی نیاز است و مقدار K مربوط به حداکثر محلی ضریب شبح به عنوان عدد خوشهبندی بهینه انتخاب میشود.
هنگام تعیین اندازه K، روش آرنج تحت تأثیر عوامل ذهنی قرار می گیرد و مقادیر حداکثر محلی متعددی با استفاده از ضریب silhouette وجود دارد. بنابراین، الگوریتم نقاط مهم ادراکی SSE با در نظر گرفتن ضرایب silhouette (SSEPIP) برای استخراج خودکار عدد خوشهبندی بهینه اتخاذ میشود. فرآیند SSEPIP به شرح زیر است.
منحنی SSE به عنوان دنباله P تعریف می شود، که در آن دو PIP اول اولین و آخرین نقطه P هستند و PIP بعدی نقطه P با حداکثر فاصله تا دو PIP اول است. فاصله به عنوان فاصله عمودی بین نقطه آزمایش P 3 و خط مستقیمی که دو PIP مجاور را به هم متصل می کند، تعریف می شود ( شکل 2 ):
جایی که ایکسج=ایکس3. الگوریتم PIP اغلب برای فشرده سازی داده ها استفاده می شود، بنابراین تعداد PIP با الزامات تجربی تغییر می کند. در این آزمایش، دنباله P (SSE) یک منحنی یکنواخت است و نقاط عطفی در اطراف PIP سوم وجود دارد و بنابراین فقط یک بار تشخیص PIP مورد نیاز است، همانطور که در شکل 3 نشان داده شده است.
الگوریتم PIP به طور کلی برای فشرده سازی داده های ایستا استفاده می شود و نمی تواند توالی با طول متغیر را به طور پایدار حل کند. با تغییر نقطه دم، PIP سوم اندکی در اطراف نقطه عطف نوسان می کند، بنابراین، حداکثر نقطه محلی ضریب شبح به عنوان شرط محدودیت برای کمک به انتخاب بهترین مقدار K استفاده می شود. به منظور بهتر نشان دادن فرآیند تشخیص، دنباله SSE و دنباله ضریب شبح استاندارد شده اند. شکل 4 نتایج گام به گام استفاده از ضریب silhouette را برای کمک به شناسایی نقاط عطف SSE نشان می دهد. خط سیاه نشان دهنده دنباله SSE و خط آبی نشان دهنده دنباله ضریب شبح است.
در فرآیند پیمایش مقدار K، هر موقعیت جدید باید انتخاب شود. به منظور بهینهسازی کارایی الگوریتم خوشهبندی در هر چرخه، میانگین ضرایب شبح هر خوشه فضایی را ارزیابی کرده و نقاط بذر جدیدی در محدوده خوشه فضایی با کوچکترین ضرایب شبح برای دور بعدی محاسبه ایجاد میکنیم. فرآیند خاص در شکل 5 نشان داده شده است .
3.2.3. تعریف فاصله
در تحقیق روش های آمار فضایی جریان OD، برخی از محققان فاصله جریان OD را با جمع وزنی فاصله نقطه O و فاصله نقطه D به دست آوردند [ 52 ]. برخی از محققان فاصله جریان OD را با جمع وزنی مختصات برداری و متغیرهای ویژگی جریان OD به دست آوردند [ 53]. در این مطالعه، جریان OD را به عنوان یک شی کل در نظر می گیریم و سعی می کنیم تابع فاصله مربوطه را از طریق ویژگی های مکانی و هندسی جریان OD بسازیم. با این حال، در تجزیه و تحلیل داده های با ابعاد بالا، داده ها از ابعاد مختلف را نمی توان به طور مستقیم مقایسه و محاسبه کرد. هنگام ساخت تابع فاصله، تخصیص وزن دارای ذهنیت قوی است. در این مطالعه، خوشهبندی دو مرحلهای بر اساس شباهت ابعاد فضایی و تشابه ویژگی هندسی انجام شده است، در حالی که فاصله اقلیدسی و شباهت کسینوس تعدیلشده بهعنوان تابع فاصله فضایی و تابع فاصله ویژگی هندسی استفاده میشود.
فاصله مشخصه فضایی جریان OD به عنوان فاصله اقلیدسی جغرافیایی نقاط رویداد جریان OD تعریف می شود.
فاصله مشخصه هندسی جریان OD به عنوان عدم تشابه کسینوس تنظیم شده تعریف می شود. R میانگین درون خوشه ای در یک بعد معین است. تشابه کسینوس تعدیل شده ابعاد مختلف را با توجه به تفاوت زوایای بردار نرمال می کند، به طور غیرمستقیم عوامل تأثیر مدول بردار را در نظر می گیرد و به صورت مصنوعی شباهت اندازه و جهت بردار را اندازه می گیرد [ 54 ]. از آنجایی که دامنه شباهت [-1،1] است، تابع فاصله، عدم تشابه محاسبه شده توسط تفاوت است.
3.3. فرآیند خوشه بندی
در مقایسه با خوشهبندی سنتی، دشواری خوشهبندی خطوط و حتی خوشهبندی با ابعاد بالا نحوه برخورد با اطلاعات با ابعاد بالا است. از نقطه نظر دیفرانسیل، یک خط مستقیم از نقاط بی شماری ساخته می شود، بنابراین مدل نقطه فرآیند برای توصیف داده های فضای جریان مناسب است. وکتور بهترین ویژگی های توصیفی شکل خط است. اندازه و جهت بردارها طول و زاویه خط را توصیف می کند، بنابراین فاصله و جهت جریان را بیان می کند. اما ویژگی های برداری نمی توانند اطلاعات ابعاد فضایی را توصیف کنند. بنابراین از نقاط رویداد برای بیان اطلاعات مکانی جریان استفاده می کنیم. هر جسم با ابعاد بالا را می توان به یک جسم نقطه ای در فضای دو بعدی نگاشت. در این مطالعه، ویژگی های فضایی نقاط رویداد جریان OD برای منعکس کردن ویژگی های فضایی جریان استفاده می شود. به این ترتیب هر جسم جریانی را از طریق نقاط رویداد و بردارهای جریان بیان می کنیم و از بعد مکانی و بعد هندسی در دو مرحله خوشه می کنیم.
منطق خوشه بندی در شکل 6 نشان داده شده است .
شکل 6فرآیند تبدیل دادههای جریان OD از فضای نقطهای به فضای جریان و سپس به فضای برداری در منطق الگوریتم خوشهبندی را نشان میدهد. نقطههای سفید نشاندهنده دادههای اصلی GPS تاکسی، نقاط آبی نشاندهنده موقعیت سوار شدن مسافر، نقطههای زرد نشاندهنده موقعیت خروج مسافر و نقاط قرمز نشاندهنده نقطه رویداد جریان OD هستند. الگوریتم پیشنهادی را می توان به دو مرحله زیر تقسیم کرد: مرحله اول محدود کردن سیستم مختصات برداری با خوشه بندی فضایی نقاط رویداد جریان OD است و مرحله دوم محدود کردن ویژگی های بردار جریان OD با خوشه بندی شباهت بردارهای هندسی است. . داده های OD اصلی در فضای نقطه مسیر GPS گسسته وجود دارد. در مطالعات قبلی، داده های مجموعه نقطه OD زوجی با استخراج معنایی به دست آمد. در این صفحه، ما مجموعه داده جریان OD را با محاسبه نقاط رویداد جریان OD و بردار جریان OD جفت نقطه OD می سازیم و فضای مجموعه نقطه OD را به فضای جریان OD تبدیل می کنیم. در فضای جریان OD، بیان دادههای جریان OD را به عنوان دو بعد توصیف میکنیم، یعنی بعد فضایی و بعد ویژگی هندسی، و تعریف میکنیم که عناصر در خوشه جریان OD باید هم شباهت بعد فضایی و هم شباهت بعد ویژگی هندسی را برآورده کنند. به این ترتیب فرآیند خوشه بندی جریان OD با روش خوشه بندی دو مرحله ای محقق می شود. اولین مورد فرآیند “تقسیم فضا” است. در تجزیه و تحلیل مقیاس کوچک یا چند مقیاسی، ویژگیهای موقعیت مکانی جریان OD توسط نقاط رویداد جریان OD بیان میشود. بنابراین، جریان OD با استفاده از خوشهبندی نقطه رویداد جریان OD به چند خوشه فضایی در فضای جریان تقسیم میشود. اندازه و جهت جریان OD در هر خوشه فضایی متفاوت است، در حالی که رابطه مکان فضایی بین جریان های OD نسبتا نزدیک است. سپس، این فرآیند “خوشه بندی برداری” است. در این فرآیند، تنها با در نظر گرفتن ویژگیهای هندسی جریانهای OD در هر خوشه فضایی، شباهت کسینوس تعدیلشده توسط بردارهای جریان OD محاسبه و خوشهبندی میشود. فرض ضمنی این است که جریانهای OD در هر خوشه فضایی قبل از خوشهبندی ویژگیهای هندسی ترجمه میشوند، و تفاوتهای مکان فضایی خوشههای OD در همان خوشه فضایی را نادیده میگیرند، و سپس سیستم مختصات بردار جریان OD یکپارچه میشود. بنابراین، پس از “پارتیشن بندی فضا”، هر خوشه فضایی در فضای جریان OD به یک فضای برداری مستقل تبدیل می شود و همه فرآیندهای خوشه بندی برداری به صورت موازی اجرا می شوند. در حالی که رابطه مکان فضایی بین جریان های OD نسبتا نزدیک است. سپس، این فرآیند “خوشه بندی برداری” است. در این فرآیند، تنها با در نظر گرفتن ویژگیهای هندسی جریانهای OD در هر خوشه فضایی، شباهت کسینوس تعدیلشده توسط بردارهای جریان OD محاسبه و خوشهبندی میشود. فرض ضمنی این است که جریانهای OD در هر خوشه فضایی قبل از خوشهبندی ویژگیهای هندسی ترجمه میشوند، و تفاوتهای مکان فضایی خوشههای OD در همان خوشه فضایی را نادیده میگیرند، و سپس سیستم مختصات بردار جریان OD یکپارچه میشود. بنابراین، پس از “پارتیشن بندی فضا”، هر خوشه فضایی در فضای جریان OD به یک فضای برداری مستقل تبدیل می شود و همه فرآیندهای خوشه بندی برداری به صورت موازی اجرا می شوند. در حالی که رابطه مکان فضایی بین جریان های OD نسبتا نزدیک است. سپس، این فرآیند “خوشه بندی برداری” است. در این فرآیند، تنها با در نظر گرفتن ویژگیهای هندسی جریانهای OD در هر خوشه فضایی، شباهت کسینوس تعدیلشده توسط بردارهای جریان OD محاسبه و خوشهبندی میشود. فرض ضمنی این است که جریانهای OD در هر خوشه فضایی قبل از خوشهبندی ویژگیهای هندسی ترجمه میشوند، و تفاوتهای مکان فضایی خوشههای OD در همان خوشه فضایی را نادیده میگیرند، و سپس سیستم مختصات بردار جریان OD یکپارچه میشود. بنابراین، پس از “پارتیشن بندی فضا”، هر خوشه فضایی در فضای جریان OD به یک فضای برداری مستقل تبدیل می شود و همه فرآیندهای خوشه بندی برداری به صورت موازی اجرا می شوند. تنها با در نظر گرفتن ویژگیهای هندسی جریانهای OD در هر خوشه فضایی، شباهت کسینوس تنظیمشده توسط بردارهای جریان OD محاسبه و خوشهبندی میشود. فرض ضمنی این است که جریانهای OD در هر خوشه فضایی قبل از خوشهبندی ویژگیهای هندسی ترجمه میشوند، و تفاوتهای مکان فضایی خوشههای OD در همان خوشه فضایی را نادیده میگیرند، و سپس سیستم مختصات بردار جریان OD یکپارچه میشود. بنابراین، پس از “پارتیشن بندی فضا”، هر خوشه فضایی در فضای جریان OD به یک فضای برداری مستقل تبدیل می شود و همه فرآیندهای خوشه بندی برداری به صورت موازی اجرا می شوند. تنها با در نظر گرفتن ویژگیهای هندسی جریانهای OD در هر خوشه فضایی، شباهت کسینوس تنظیمشده توسط بردارهای جریان OD محاسبه و خوشهبندی میشود. فرض ضمنی این است که جریانهای OD در هر خوشه فضایی قبل از خوشهبندی ویژگیهای هندسی ترجمه میشوند، و تفاوتهای مکان فضایی خوشههای OD در همان خوشه فضایی را نادیده میگیرند، و سپس سیستم مختصات بردار جریان OD یکپارچه میشود. بنابراین، پس از “پارتیشن بندی فضا”، هر خوشه فضایی در فضای جریان OD به یک فضای برداری مستقل تبدیل می شود و همه فرآیندهای خوشه بندی برداری به صورت موازی اجرا می شوند. فرض ضمنی این است که جریانهای OD در هر خوشه فضایی قبل از خوشهبندی ویژگیهای هندسی ترجمه میشوند، و تفاوتهای مکان فضایی خوشههای OD در همان خوشه فضایی را نادیده میگیرند، و سپس سیستم مختصات بردار جریان OD یکپارچه میشود. بنابراین، پس از “پارتیشن بندی فضا”، هر خوشه فضایی در فضای جریان OD به یک فضای برداری مستقل تبدیل می شود و همه فرآیندهای خوشه بندی برداری به صورت موازی اجرا می شوند. فرض ضمنی این است که جریانهای OD در هر خوشه فضایی قبل از خوشهبندی ویژگیهای هندسی ترجمه میشوند، و تفاوتهای مکان فضایی خوشههای OD در همان خوشه فضایی را نادیده میگیرند، و سپس سیستم مختصات بردار جریان OD یکپارچه میشود. بنابراین، پس از “پارتیشن بندی فضا”، هر خوشه فضایی در فضای جریان OD به یک فضای برداری مستقل تبدیل می شود و همه فرآیندهای خوشه بندی برداری به صورت موازی اجرا می شوند.
در این مطالعه، فاصله فضایی و فاصله مورفولوژیکی در یک تابع فاصله جریان مرکب ادغام نشدهاند. دلیل آن این است که آمیختگی فاصله مکانی و فاصله مورفولوژیکی بسیار پیچیده است و این دو ویژگی به یکدیگر وابسته هستند و بر یکدیگر تأثیر می گذارند. برخی از مطالعات سعی کردند از تابع فاصله وزنی برای بیان فاصله جریان استفاده کنند، اما مشکل بیان چند مقیاسی و عادی سازی جهانی را نمی توان به خوبی حل کرد [ 52 ، 53]. از دیدگاه جهانی، تفاوتهای مقیاس ناشی از طولها، زاویهها و مکانهای مکانی متفاوت را نمیتوان به خوبی حل کرد. از نقطه نظر محلی، توزیع چگالی ابعاد مختلف تاثیر بسزایی بر نتایج خوشه بندی دارد، بنابراین راه حل بهینه جهانی را نمی توان به دست آورد. بنابراین، این مطالعه سعی میکند توزیع جهانی را از طریق تقسیمبندی ابعادی، ابتدا از طریق خوشهبندی فضایی، حل کند تا مجموعهای خوشهای با روابط فضایی نزدیک در درون خوشه بهدست آید و فرض کنیم که هر خوشه فضایی در یک سیستم مختصات فضای برداری جداگانه و یکپارچه وجود دارد. سپس، خوشهبندی با فاصله ویژگی هندسی در خوشه فضایی انجام میشود تا مشکل تراکم ویژگی محلی ناهموار حل شود. و خوشه های برداری نماینده به ترتیب در خوشه های فضایی مختلف به دست می آیند. مراحل مشخص به شرح زیر است:
مرحله 1 در حال حاضر، بیشتر فرم های ذخیره سازی داده جریان OD مختصات نقطه O (X O , Y O )، مختصات نقطه D (X D , Y D ) و ویژگی های موضوعی هستند. بنابراین، استخراج نقاط رویداد جریان OD و محاسبه بردارهای جریان برای به دست آوردن مجموعه ویژگی های جریان OD ضروری است.
مرحله 2 K-به معنای خوشه بندی بر اساس فاصله مکانی نقاط رویداد است. مقدار KS از 2 به تعداد بهینه خوشه های فضایی حل شده توسط SSEPIP افزایش می یابد .
مرحله 3 برای هر خوشه فضایی (تعداد N)، خوشه بندی K-means بر اساس فاصله ویژگی هندسی بردارهای جریان OD انجام می شود. مقدار K VN از 2 به تعداد بهینه خوشه های برداری که توسط SSEPIP حل شده اند افزایش می یابد.
مرحله 4 با محاسبه میانگین نقاط رویداد جریان OD و بردارهای جریان OD در خوشه ها، می توانیم جریان های نماینده خوشه ها را به دست آوریم و آنها را تجسم کنیم ( جهت جریان های OD را با نقاط متحرک بیان کنیم).
روش محدودیت های بردار خوشه بندی جریان مبدا-مقصد (ODFCVC) برای محیط محاسباتی توزیع شده مناسب است، به ویژه برای مرحله سوم الگوریتم، هر خوشه فضایی عملیات خوشه بندی ویژگی هندسی را به طور مستقل انجام می دهد.
نمودار جریان روش خوشه بندی در شکل 7 نشان داده شده است .
سیاسنN-امین خوشه فضایی بر اساس نقاط رویداد جریان OD است، ن=1،2،……،کاس. کاسراه حل بهینه ارزش K خوشه فضایی جهانی است.سیاسنVمخوشه برداری M ام موجود در خوشه فضایی N است، م=1،2،……،کVن. کVنراه حل بهینه مقدار K خوشه برداری بر اساس شباهت کسینوس تنظیم شده در خوشه فضایی N-ام است.
با فرض اینکه ماتریس فاصله یک ماتریس متقارن است. آ 2∗n∗nماتریسی با قطر 0 با خوشه بندی نقاط O و D برای n جریان OD در روش های خوشه بندی جریان قبلی ساخته می شود. با این حال، در روش ODFCVC، اندازه ماتریس فاصله:
هنگام ساخت فاصله جریان مرکب، ماتریس ویژگی بعد کامل، افزونگی غیر ضروری ایجاد می کند، زیرا زمانی که اختلاف بین یک بعد خیلی زیاد باشد، نیازی به در نظر گرفتن شباهت ابعاد دیگر نیست. بنابراین، از طریق خوشهبندی تدریجی ابعاد مختلف، ابتدا بر روی بعد ویژگی فضایی، گروهبندی جریانهای OD بر اساس خوشههای فضایی و یکسان سازی سیستمهای مختصات برداری، خوشهبندی میکنیم. سپس، ما بر روی بعد ویژگی هندسی خوشهبندی میکنیم و ویژگیهای بردار نماینده را از طریق تشابه کسینوس تنظیمشده در هر خوشه فضایی استخراج میکنیم. این روش همچنین خطای عادی سازی و از دست دادن ویژگی محلی ناشی از انجماد ویژگی های برداری را در چهار یا هشت جهت در مطالعات قبلی بهبود می بخشد [ 55 , 56 ]].
4. آزمایش ها و تجزیه و تحلیل
بخش 4 نمونه ای از استخراج الگوی جریان ترافیک با استفاده از روش ODFCVC را معرفی می کند. این بخش شامل سه آزمایش است. اولین آزمایش، تجزیه و تحلیل داده های OD تاکسی ها در پکن با استفاده از روش ODFCVC است. آزمایش دوم و سوم برای تجزیه و تحلیل خوشه فضایی و خوشه برداری تولید شده توسط خوشه بندی است.
4.1. خوشه بندی جریان OD تاکسی بر اساس ODFCVC
جریان OD تاکسی نوعی مسیر با اطلاعات موقعیت مکانی مسافران تاکسی است که سوار و پیاده می شوند با استخراج معنایی از داده های مسیر تاکسی تولید شده توسط موقعیت یابی GPS. در مقایسه با مسیر واقعی پیچیده، جریان OD به طور کامل به داده های شبکه جاده واقعی بستگی ندارد و می تواند به طور مستقیم ویژگی های سفر ساکنان شهری را منعکس کند. این یک منبع داده مهم برای استخراج فعالیت های مکانی و زمانی جمعیت شهری است [ 46] (ص 60-61). داده هایی که ما در آزمایش استفاده کردیم، برخی از داده های مسیر GPS تاکسی (بیش از 12150 قطعه) از ساعت 6 صبح تا 9 صبح در 11 ژانویه 2008 در پکن است. فرمت داده ساختار داده خط سیر GPS تاکسی خام است، از جمله شماره رمزگذاری تاکسی، زمان بازخورد GPS، طول و عرض جغرافیایی بلادرنگ، وضعیت سواری، رویدادهای سواری، سرعت، زاویه جهت، و سایر زمینه ها [ 46 ] (ص 76). -79). به منظور تسهیل تجسم نتایج خوشهبندی، از فناوری توسعه وب جلویی JavaScript + HTML + CSS برای انجام تمام آزمایشها و استفاده از زبان جاوا اسکریپت برای نوشتن روشهای خوشهبندی و تجسم استفاده میکنیم. تجسم جریان OD تاکسی بدون تجزیه و تحلیل خوشه بندی در شکل 8 نشان داده شده است .
از طریق تعیین و آزمایش خودکار مقدار K بهینه، مقدار K خوشه فضایی بر اساس نقاط رویداد جریان OD 4 است و مقدار K خوشه برداری موجود در هر خوشه فضایی 4، 4، 5 و 4 است. ، به ترتیب.
به منظور تأیید اهمیت تعداد k نتایج خوشهبندی حل شده توسط SSEPIP، از ثبات خوشهبندی به عنوان معیار ارزیابی استفاده میکنیم [ 57 ]. روش ترسیم یک نمونه فرعی تصادفی از مجموعه داده های اصلی بدون جایگزینی برای تولید نسخه های آشفته (p1، p2، p3) از مجموعه داده استفاده می شود و نرخ نمونه برداری 0.8 است. تابع فاصله از حداقل فاصله تطبیق استفاده می کند. نتایج تجربی پایداری خوشهبندی در فرآیند «تقسیم فضا» و «خوشهبندی برداری» در جدول 1 نشان داده شده است. شاخص پایداری اثربخشی SSEPIP برای حل خودکار تعداد خوشهبندی بهینه را نشان میدهد.
خوشه فضایی جریان OD تولید شده در فرآیند خوشه بندی در شکل 9 نشان داده شده است و نتیجه خوشه بندی نهایی در شکل 10 نشان داده شده است . به منظور مشاهده روند کلی جریان 17 خوشه، میانگین نقطه رویداد جریان OD و میانگین بردار جریان OD انواع خوشه ها را به عنوان شاخص های توصیفی تجسم نماینده محاسبه می کنیم. نتایج تجسم در نمای تودرتو در شکل 10 نشان داده شده است.
4.2. تجزیه و تحلیل خوشه فضایی خوشه بندی جریان OD تاکسی
شکل 9 نتیجه تجسم خوشه بندی فضایی نقطه رویداد جریان OD بر اساس استخراج شاخص پارتیشن فضایی پس از روش ODFCVC است. با مقایسه با شکل 10، می بینیم که محصول خوشه ای مرحله اول خوشه بندی “پارتیشن فضایی” محدودیت سیستم مختصات بردار جریان OD است و خوشه جریان OD آشکارا به چهار خوشه فضایی تقسیم می شود که هر کدام خوشه های برداری متفاوتی را محدود می کنند. این مدل جریان ترکیبی عمدتاً تحت تأثیر محاسبه نقاط رویداد جریان OD است. جریان OD یک مسیر واقعی نیست و هیچ نقطه میانی از مسیر وجود ندارد. با تعریف نقطه رویداد جریان OD، نقطه میانی جریان OD به عنوان انتزاع فضایی جریان OD در نظر گرفته می شود. بنابراین، نقطه میانی جریان OD اهمیت فیزیکی خاصی در تجزیه و تحلیل خوشهبندی و تشخیص الگو دارد.
هدف اصلی خوشهبندی فضایی بر اساس نقاط رویداد جریان OD، از یک سو، برآوردن شرایط شباهت در خوشههای جریان OD در بعد فضایی، و از سوی دیگر، سادهسازی مقدار دادهها هنگام محاسبه شباهت هندسی و افزایش است. بیان تفاوت ویژگی های محلی با این حال، اینکه آیا خوشه فضایی جریان OD اهمیت فیزیکی دارد یا خیر ارزش بررسی عمیق ما را دارد. بنابراین، ما از الگوریتم کشف جامعه در تحلیل شبکه برای تحقق جوامع جریان OD بر اساس واحدهای جغرافیایی مختلف استفاده میکنیم و سعی میکنیم اهمیت فیزیکی خوشه فضایی جریان OD تاکسی را از طریق تحلیل مقایسهای درک کنیم.
ما جوامعی را در نمودار مییابیم که توسط جریان OD با استفاده از حداکثرسازی مدولاریته حریصانه Clauset-Newman-Moore (CNM) ساخته شدهاند [ 58 ، 59 ]. فرآیند مربوطه در شکل 11 نشان داده شده است . تابع تجزیه و تحلیل شبکه توسط بسته نرم افزاری NetworkX و تجسم جامعه توسط ArcMap تحقق می یابد. شبکه جریان OD تاکسی با در نظر گرفتن منطقه ترافیکی پکن و واحد خیابان پکن به عنوان گره ساخته شده است [ 60]. از طریق تحلیل همپوشانی واحدهای جغرافیایی مختلف و جریان OD، نمودار تعاملی OD سفر تاکسی بر اساس واحدهای جغرافیایی به دست میآید. سپس، ما از کلاسیکترین الگوریتم کشف جامعه مبتنی بر ماژول CNM برای دریافت جامعه جریان OD بدون محدودیت فضای جغرافیایی و نمایش بصری روی نقشه استفاده میکنیم. شکل 12 توزیع جامعه شبکه جریان OD تاکسی را به ترتیب با منطقه ترافیک و بلوک (واحد خیابان) به عنوان گره نشان می دهد. ما شش انجمن اصلی را حاشیه نویسی می کنیم (تعداد گره ها در جامعه بیش از 10٪ از کل گره ها است)، که با ①–⑥ نشان داده می شود.
با مقایسه شکل 9 و شکل 12 ، ما رابطه و تفاوت بین خوشه فضایی جریان OD استخراج شده با روش ODFCVC و جامعه شبکه جریان OD به دست آمده توسط الگوریتم جامعه شبکه کلاسیک را تجزیه و تحلیل می کنیم. اول از همه، با مقایسه جوامع شبکه استخراج شده توسط الگوریتم CNM بر روی دانه بندی های مختلف واحدهای جغرافیایی، شباهت ها و تفاوت هایی بین آنها وجود دارد.
از نظر شباهت ها، سه اجتماع اصلی جریان ترافیک وجود دارد که منطقه مرکزی پکن را پوشش می دهد. این جوامع در شمال، جنوب غربی و جنوب شرقی ناحیه مرکزی شهری پکن واقع شده اند. هر جامعه دارای درجه مشخصی از اتصال مکانی جغرافیایی است. از نظر تفاوت، به دلیل تقسیم بندی دقیق تر مناطق ترافیکی، جامعه تشکیل شده نیز پراکنده تر است و شکاف های جغرافیایی در داخل جامعه وجود دارد. تضادهای مرزی جامعه در غرب، شمال شرق و جنوب منطقه مرکزی پکن وجود دارد.
سپس با شکل 9 و شکل 12 مقایسه شد، می توان دریافت که نتایج پارتیشن فضایی بر اساس خوشه بندی مرحله اول روش ODFCVC شباهت زیادی با کاوی جامعه شبکه دارد و پدیده های جالبی یافت می شود. تعداد خوشههای فضایی بهدستآمده از خوشهبندی 4 است. از آنجایی که نتایج خوشهبندی بر اساس الگوریتم K-means است، خوشههای فضایی ویژگیهای جهانی دارند و ناهنجاریهای محلی را نادیده میگیرند، بنابراین، خوشههای فضایی با خوشهبندی فاصله اقلیدسی نقاط رویداد جریان OD بهدست میآیند. تداوم درونی دارند. خوشه فضایی (a) مربوط به شمال جامعه شبکه ②، خوشه فضایی (ب) مربوط به شرق جامعه شبکه ⑤ و جنوب جامعه ② و ③، خوشه فضایی (c) مربوط به تقاطع جامعه شبکه ⑥ و جامعه ③ و جامعه ④، و خوشه فضایی (d) مربوط به جامعه شبکه ① است. مشاهده میشود که خوشه فضایی جریان OD بهدستآمده از خوشهبندی اهمیت عملی خاصی دارد. در جنوب پکن، جایی که جامعه شبکه بحث برانگیز است، خوشه فضایی جدید (b) به دست آمده با روش ODFCVC برای توضیح و متحد کردن جامعه شبکه به دست آمده توسط واحدهای جغرافیایی مختلف مفید است.
استفاده از نقطه میانی جریان OD به عنوان نقطه رویداد برای یافتن حالت خوشهبندی جریان آسانتر است. اهمیت فیزیکی خوشه جریان OD تاکسی به دلیل جذابیت مناطق عملکردی شهری و تعامل اجتماعی محورهای حمل و نقل است که منجر به ایجاد خوشه جریان ترافیک با تقسیم فضایی آشکار می شود. از آنجا که شکلگیری جامعه جریان ترافیک به مرکز ترافیک شهری وابسته است، ما نتیجه خوشهای را با توزیع فضایی مرکز ترافیک پکن مقایسه میکنیم [ 61 ]] و دریافت که این دو همبستگی فضایی آشکاری دارند (مرکز حمل و نقل (الف) شامل ایستگاه راه آهن غرب پکن و مرکز حمل و نقل مسافر لیولیچیائو است. مرکز حمل و نقل (ب) شامل ایستگاه راه آهن جنوبی پکن، مرکز حمل و نقل Songjiazhuang و فرودگاه نانیوان است. مرکز حمل و نقل (ج) ) شامل ایستگاه راه آهن پکن، مرکز حمل و نقل عمومی سیهوی، و فرودگاه بین المللی پایتخت پکن است. مرکز حمل و نقل (د) شامل مرکز حمل و نقل Xiyuan است. از طریق رفتار خودانگیخته فعالیتهای سفر مردم شهری، مراکز ترافیک شهری را میتوان بدون تأثیر مناطق عملکردی نقاط مبدا-مقصد شناسایی کرد. همچنین می توان دریافت که هاب حمل و نقل نه تنها به عنوان مرکز توزیع جریان مسافر عمل می کند، بلکه تعامل ترافیک اطراف خود را نیز جذب می کند. از این رو،
4.3. تجزیه و تحلیل خوشه ای بردار خوشه بندی جریان OD تاکسی
بر اساس تشخیص خوشه فضایی نقطه رویداد جریان OD، این روش خوشهبندی میتواند خوشههای ویژگی هندسی نماینده با شکل دلخواه را پیدا کند. در مطالعات قبلی، شباهت نقاط OD اغلب با تعریف فضای جستجوی منظم، یا پارتیشن واحد جغرافیایی اضافی، یا فضای چگالی پیوسته یکنواخت، محدود میشود تا خوشههای قانون با هندسه مشابه، یا خوشههای نامنظم با ویژگیهای معنایی مشابه یا چگالی یکنواخت به دست آیند. از نقاط OD ساختار مورفولوژیکی این خوشه ها به تعاریف پارامترهای الگوریتم های خوشه بندی سلسله مراتبی و مبتنی بر چگالی بستگی دارد. با این حال، به دلیل انجماد شعاع جستجو، اتصال درون خوشهای و سایر پارامترها، الگوریتمهای تجمع موجود نمیتوانند به خوبی با چگالی جهانی مجموعههای خطوط غیریکنواخت مقابله کنند.
روشهای سنتی بیشتر به «جذب جغرافیایی» به «رفتار جریان» توجه میکنند [ 46] (ص 111-114)، اما روش ODFCVC برعکس است. برای تجزیه و تحلیل مسیر OD تاکسی، موقعیت مکانی و ویژگیهای موضوعی نقاط OD مسائل ژئومسائل ایستا هستند، و مسیر مکانی-زمانی تولید شده توسط فعالیتهای تاکسی مشکلی از پویایی شهری است. در گذشته، مدلسازی و تحلیل مکانی-زمانی پویای افراد بیشتر بر استنتاج علّی دقیق متمرکز بود. از آنجایی که ویژگی های ناحیه عملکردی نقطه OD با قانون فعالیت شهری مطابقت دارد، رفتار سفر مربوطه را ایجاد می کند. بنابراین، زمانی که رفتار سفر دارای نقاط OD مشابه باشد، این نوع رفتار سفر همان حالت است. این نوع روش تحلیل که ابتدا دارای «جاذبه جغرافیایی» و سپس «رفتار جریان» است، وابستگی زیادی به دقت دادههای OD دارد و توسط عوامل مناطق عملکردی شهری و بهروزرسانی دادههای POI محدود میشود. پیش فرض ابتکار کشف الگوهای جدید را ندارد. در روش مبتنی بر داده، روش پیشنهادی سعی میکند شباهت جغرافیایی جذب چنین رفتاری را با تجزیه و تحلیل رفتار جریان پیدا کند و تعامل زیرفضای شهری را تحت پارادایم جدید علوم شهری کاوش کند.
کل فرآیند الگوریتم نیازی به پارامترهای از پیش تعیین شده ندارد. فقط باید مقدار K بهینه خوشه فضایی و خوشه هندسی را به ترتیب با ضریب شبح، مجموع مربعات خطاها و سایر شاخص ها محاسبه کند. اولین مرحله خوشهبندی فضایی و تشابه کسینوس تنظیمشده تا آنجا که ممکن است، از دست دادن ویژگی ناشی از عادیسازی دادههای جهانی را حل میکند. علاوه بر این، به دلیل محدودیتهای هندسی، روش از محدودیتهای دو نقطهای معمولی استفاده نمیکند و تنها تحتتاثیر مقدار K خوشه هندسی بر اساس بهینهسازی خوشه فضایی و تشابه کسینوس تنظیمشده قرار میگیرد، بنابراین، جریانهای OD خوشههایی با توزیع نامنظم پیدا میکنند. بنابراین، روش ODFCVC نه تنها خوشه هایی از الگوهای مشابه با اشکال منظم را تشخیص می دهد، بلکه خوشه هایی با الگوهای همگرایی و واگرایی. همانطور که در نشان داده شده استشکل 10 ج، نقاط مبدأ الگوی همگرایی و نقاط مقصد الگوی تخلیه تحت تأثیر مرکز ترافیک، ویژگیهای شباهت نقطهای را در روش خوشهبندی سنتی ندارند، یعنی چگالی اتصال یکنواخت یا فاصله فضایی مشابهی ندارند. با این حال، با استفاده از روش ODFCVC، ما واگرایی و همگرایی جریان ترافیک اصلی را بر اساس تأثیر فرودگاه بینالمللی پایتخت پیدا میکنیم.
از آنجایی که روش ODFCVC می تواند حالت همگرایی و واگرایی خوشه های جریان را بیابد، ما همچنین سعی می کنیم آن را با توزیع چگالی مجموعه نقطه ای در فضای برداری توضیح دهیم. شکل 13 و شکل 14 توزیع چگالی هسته داده های نقطه OD را در فضای جغرافیایی و فضای برداری نشان می دهد. تجزیه و تحلیل تراکم هسته و تجسم نتیجه توسط ArcMap انجام می شود.
ثبات چگالی یک معیار مهم برای ارزیابی نتایج خوشه بندی است. در خوشهبندی مبتنی بر چگالی، جریانهای OD با نقاط OD در فضای چگالی یکسان به عنوان یک الگو در نظر گرفته میشوند. در فضای جغرافیایی، نقطه O از حالت واگرایی جریان ترافیک و نقطه D از حالت همگرایی جریان ترافیک در فضای با چگالی بالا هستند، در حالی که نقطه D از حالت واگرایی جریان ترافیک و نقطه O از حالت همگرایی جریان ترافیک. در فضای کم تراکم قرار دارند. شکل 13 ب ناهمگنی توزیع چگالی نقاط OD را در فضای جغرافیایی نشان می دهد. بنابراین، یافتن این الگوها به طور خودکار با استفاده از روشهای سنتی خوشهبندی چگالی و شاخص اتصال ساده دشوار است.
در جریان الگوریتم پیشنهادی در این مقاله، جریان OD به فضای برداری نگاشت میشود و موقعیت جغرافیایی نسبی نقاط OD با تجمع نقاط رویداد جریان OD تغییر میکند. از آنجایی که در سیستم مختصات برداری فقط جهت و اندازه بردار در نظر گرفته می شود، می توانیم نقطه رویداد جریان OD را به عنوان نقطه تقاطع تنظیم کنیم و موقعیت نسبی بردار جریان OD را جابجا کنیم. می توان دریافت که توزیع چگالی نقاط OD نسبتاً همگن است. شکل 14 ب همگنی توزیع چگالی نقاط OD را در فضای برداری نشان می دهد.
5. نتیجه گیری و بحث
در این مقاله، یک روش خوشهبندی دو مرحلهای برای دادههای OD پیشنهاد شده است. ویژگی های الگوی جریان OD توسط نقاط رویداد جریان OD و بردار جریان OD نشان داده می شود و داده های OD از فضای مجموعه نقطه عظیم به فضای ویژگی بردار مستقل نگاشت می شوند. این روش پیچیدگی محاسبه شباهت جریان OD را ساده می کند و به توزیع فضایی کلی و روند حرکت جریان OD توجه بیشتری می کند. در مقایسه با مطالعات قبلی، روش پیشنهادی از ایده خوشهبندی خطی مبتنی بر خوشهبندی دو نقطهای جدا میشود، به شباهت کلی (بعدی بالا) جریانهای OD توجه بیشتری میکند، بعد ماتریس ویژگی را در فرآیند خوشهبندی بهینه میکند. و محاسبه اعداد خوشه بندی بهینه خودکار را بدون هیچ پارامتری به دست می آورد.
روش ODFCVC را می توان با تحقیقات موجود ترکیب کرد [ 15 ، 38 ]. از یک سو می توان آن را با نتایج الگوریتم های قبلی برای ارزیابی ویژگی های ناحیه عملکردی پویا واحدهای جغرافیایی مقایسه کرد. از سوی دیگر، میتوان آن را با الگوریتم مبتنی بر چگالی و الگوریتم مبتنی بر پارتیشن ترکیب کرد تا توانایی تشخیص شدت دامنه چگالی را تقویت کند و نتایج خوشهبندی چند مقیاسی را با حفظ ویژگیهای جریان ایجاد کند.
از طریق آزمایش دادههای پکن تاکسی OD، این روش مراکز مهم ترافیکی و جوامع جریان ترافیک تحتتاثیر قطبهای ترافیکی در پکن را بدون تکیه بر واحدهای جغرافیایی استخراج میکند، که با استفاده از ظرفیت حملونقل، کمبود مهندسی ترافیک سنتی و برنامهریزی شهری را جبران میکند. ، جریان مسافر، مقیاس ساخت و ساز، دسترسی فضایی و سایر شاخص ها برای ارزیابی اهمیت محورهای ترافیکی. علاوه بر این، این روش از محدودیتهای حالت تجربه «خط موازی» در الگوکاوی قبلی عبور میکند و حالت خوشهای (نقاط OD به ترتیب مشابه)، حالت واگرایی (نقاط O مشابه هستند) و حالت همگرایی (D) را پیدا میکند. نقاط مشابه) جریان ترافیک در همان زمان، که برای جریان ترافیک واقعی مناسب تر است.
از طریق تجزیه و تحلیل چگالی هسته نقاط OD در فضای جغرافیایی و فضای برداری، دریافتیم که روش ODFCVC میتواند با استفاده از روش محدودیتهای هندسی، جریان OD الگوی شکل نامنظم را به فضای برداری با چگالی نقطه همگن OD ترسیم کند. شرایط خوشه بندی چگالی جریان OD سنتی بنابراین، روش مبتنی بر خوشه بندی چگالی را می توان برای الگوبرداری از جریان OD در فضای برداری نیز به کار برد.
هدف اصلی الگوی جریان ترافیک و استخراج الگوی جریان OD صرفاً از داده به الگو نیست، توابع اندازهگیری مختلف و شاخصهای مختلف میتوانند الگوهای جریان مختلفی را تولید کنند. با این حال، چگونگی استفاده معقول از الگوهای یافت شده توسط الگوریتم خوشه بندی و اعمال آنها در برنامه ریزی ترافیک، برنامه ریزی شهری و سایر زمینه ها، ارزش تحقیق است. الگوریتمهای خوشهبندی قبلی به شدت بر این ایده متکی هستند که «نقاط OD مشابه هستند، بنابراین جریانهای OD مشابه هستند» و به طور عمیق شاخصهای اندازهگیری مختلف مانند شباهت فضایی، شباهت موضوعی و شباهت نوع کاربری زمین نقاط OD را مطالعه میکنند [ 8 ، 39 ]]. روش ODFCVC به شاخص شباهت نقاط OD متکی نیست و می تواند الگوهای جریان نماینده را حفاری کند. این ارتباط درونی بین نقاط OD با شباهت فضایی غیرجغرافیایی را در همان الگو بررسی میکند و از “مشاهده جریان فعالیتهای انسانی” به “مشاهده نقاط انواع کاربری زمین” به روز و تکرار میشود. همچنین ابزار جدیدی برای تحقیق در مورد نوسازی کاربری زمین شهری، استخراج ناحیه تابع پویای شهری، تعامل فضای داخلی شهری، برنامه ریزی منطقه ترافیکی چند مقیاسی و غیره فراهم می کند.
استخراج اطلاعات یک مانع مهم برای خدمات و برنامه های کاربردی اطلاعات ترافیک است. تقسیم مناطق ترافیکی (جوامع) جزء مهمی از بررسی های ترافیکی، پیش بینی تقاضای سفر، تولید سفر و توزیع سفر است [ 62 ]. روش سنتی تقسیم منطقه ترافیک نمی تواند جدیدترین یا واقعی ترین الگوهای ترافیکی و ویژگی های ثابت در یک منطقه ترافیکی را منعکس کند و تحرک و ویژگی های جامعه رفتار ترافیکی را نادیده می گیرد [ 62 ، 63 ].]. تحقیق ما از روش ODFCVC برای جریان OD ترافیکی استفاده میکند، که میتواند جوامع جریان ترافیک را با تعاملات داخلی مکرر و رفتارهای تعامل منطقهای با الگوهای سفر معمولی شناسایی کند. ابزار جدیدی برای تقسیم مناطق ترافیکی و آشکار ساختن ویژگیهای ساختار فضایی فراهم میکند.
این روش همچنین دارای قابلیت انبساط قوی است. اول، تابع تشابه، یعنی توابع فاصله های مختلف را می توان با توجه به الزامات تحقیق در هنگام اندازه گیری شباهت روابط فضایی و ویژگی های هندسی جریان ها جایگزین کرد. ثانیاً، الگوریتم خوشهبندی اولیه، یعنی تا زمانی که منطق خوشهبندی چند مرحلهای مبتنی بر ساختارشکنی ابعاد مطرح است، هر مرحله میتواند با یک الگوریتم خوشهبندی جایگزین شود که به مراکز مختلف خوشهبندی برای رفع نیازهای محققین متکی است. ثالثاً، بعد موضوع تحقیق و تجزیه و تحلیل، یعنی برای دادههای جریان OD، این مقاله فقط بعد فضایی و بعد ویژگی پویا را تجزیه و تحلیل میکند اما تأثیر بعد زمانی را در نظر نمیگیرد. می تواند تجزیه و تحلیل داده های چند بعدی را با خوشه بندی مرحله ای گسترش دهد. برای هر فرم هندسی با ابعاد بالا مانند داده های مساحت و داده های حجمی، می توان از مرکز هندسی و بردارهای هندسی با ابعاد بالا برای بیان ویژگی های فضایی و مورفولوژیکی استفاده کرد. در نهایت، محیط محاسباتی، یعنی به دلیل اینکه کل فرآیند عملیات روش یک الگوی انتشار درخت مانند را ارائه میدهد، تجزیه و تحلیل خوشهبندی هر بعد را میتوان بر اساس نتایج مرحله خوشهبندی قبلی محاسبه کرد.
با این حال، این روش هنوز دارای کاستی هایی در بیان ساختار چندسطحی و قضاوت شباهت است. روش ODFCVC پیچیدگی خوشهبندی جریان OD را از منظر موقعیت مکانی و بردارهای هندسی در نظر میگیرد، اما هیچ پارتیشن و الگوکاوی چند مقیاسی برای هر فضای تک بعدی وجود ندارد، که عمدتاً به دلیل محدودیتهای الگوریتم K-means است. در جنبه آستانه تشابه، ما ضریب شبح سنتی و SSE را برای به دست آوردن خودکار مقدار K بهینه اتخاذ می کنیم. با این حال، این پارامترها راهحل بهینه خوشهبندی فضایی برای کل نمونه و راهحل بهینه خوشهبندی ویژگی هندسی فضای برداری برای خوشه فضایی هستند که فاقد محدودیت قبلی برای شباهت هستند.
بدون دیدگاه