1. مقدمه
اگرچه اقتصاد اشتراک گذاری در سرتاسر جهان در حال افزایش است، اما محدودیتی برای گسترش اشتراک گذاری وسایل نقلیه به دلیل مسائل حمل و نقل و محیط زیست در شهرهای شلوغ وجود دارد. بر این اساس، اشتراک دوچرخه، که باعث کاهش انتشار وسایل نقلیه و بهبود تحرک شهری می شود، یک جایگزین جذاب است [ 1 ]. در حال حاضر، بیش از 2000 شهر، سیستمهای اشتراک دوچرخه را اجرا میکنند که ابزاری انعطافپذیر برای انجام سفرهای کوتاه مدت و تبادل بین روشهای مختلف حملونقل در اختیار کاربران قرار میدهد [ 2 ]. اشتراک دوچرخه یک حالت حمل و نقل قابل توجه است زیرا اغلب در مراحل شروع و پایان زنجیره های سفر قرار دارد [ 3 ، 4 ، 5 ]]. اشتراکگذاری شناور رایگان، که رشد قابلتوجهی را در بازارهای شهری اروپا و آمریکا تجربه کرده است، سیستمی است که به کاربران اجازه میدهد آزادانه وسایل نقلیه مشترک را از طریق تلفنهای هوشمند در پارکینگهای عمومی شرکتکننده اجاره کنند [ 6 ، 7 ]]. در این زمینه، اشتراک دوچرخه کاربران را قادر می سازد تا بین نقاط عزیمت خود و پارکینگ های ابتدایی و بین پارکینگ های انتهایی و مقصد خود ارتباط برقرار کنند. این خدمات به اشتراک گذاری وسیله نقلیه را گسترش می دهد، با افزایش اشتراک دوچرخه منجر به افزایش استفاده از وسایل نقلیه مشترک و همچنین سایر حالت های حمل و نقل عمومی می شود. این سناریو یک اقدام متقابل موثر در برابر تراکم ترافیک شهری ارائه می دهد. سفرهای غیرموتوری (پیادهروی و دوچرخهسواری) جریان «مویرگی» در مقیاسهای ظریفتر را در شهرها به حساب میآورند که ماهیت کامل جریانهای حملونقل شهری را آشکار میکند [ 3 ، 8 ]. بسیاری از مطالعات الگوهای حرکت مشترک دوچرخه را برای درک بهتر پویایی شهری تجزیه و تحلیل کرده اند [ 1 ، 3 ، 9 ]]، در حالی که دیگران بر بررسی تغییرپذیری کاربری زمین تمرکز کرده اند [ 10 ، 11 ]. ژائو و همکاران [ 10 ] از داده های اشتراک دوچرخه به عنوان مبنای اصلی برای شناسایی ویژگی های کاربری زمین استفاده کرد.
مطالعه حاضر به جای تجزیه و تحلیل ساده الگوهای حرکت دوچرخه-اشتراک، که بیشتر مربوط به «مکان» ترافیک است، بر «چرا» ترافیک متمرکز شد. مورد دوم فقط به تحرک شهری می پردازد، در حالی که اولی امکان استنباط در مورد اهداف سفرها و تعیین علل حرکت شهری را فراهم می کند. 12 ].]. با این وجود، دلیل یک پدیده و نتیجه آن بیشتر برای تصمیم گیری معنادار است تا مشاهده صرف آن پدیده. به عنوان مثال، به جای مشاهده صرفاً بسیاری از اتومبیل ها در یک منطقه خاص بعد از ساعت 6 بعد از ظهر (تحلیل الگوی حرکت)، درک علت مشاهده، یعنی حرکت ساعات شلوغی افراد از محل کار خود به محل سکونت، مهم تر است. استنتاج هدف سفر). این امر رانندگان را قادر می سازد تا در آن زمان از جاده های منتهی به مناطق مسکونی اجتناب کنند.
استنتاج هدف ترافیک برای درک رفتار ترافیک برای برنامه ریزی ترافیک، تصمیم گیری سرمایه گذاری و برآورد تقاضای ترافیک ضروری است [ 13 ]. با این حال، در میان مطالعات مربوط به ویژگی های ترافیک، پیش بینی هدف سفر به طور قابل توجهی کمتر مورد توجه قرار گرفته است [ 14 ، 15 ، 16 ]. داده های تاریخچه ترافیک برای پیش بینی هدف سفر مورد نیاز است. با این حال، تنها چند داده دقیق حاوی اطلاعات در مورد تصمیم گیری انسانی وجود دارد. بنابراین، تحلیلهای استنتاج هدف سفر سنتی بر نظرسنجیهای مستقیم کاربران تکیه میکنند [ 1]. نظرسنجی های مستقیم کاربر برای اهداف ترافیک حاوی داده های درستی زمینی هستند و بنابراین مجموعه داده های مناسبی برای به کارگیری الگوریتم های استنتاج هستند. با این حال، اهداف محدود و محدودیت های مربوط به هزینه وجود دارد.
نگوین و همکاران [ 17 ] 25 مطالعه را از نظر تعیین هدف سفر بررسی کرد و آنها را در دو زمینه گسترده، یعنی علوم حمل و نقل (TS) و جغرافیای انسانی (HG) طبقه بندی کرد. آنها نشان دادند که محققان همیشه خود را در این دو موقعیت در دنیای واقعی خواهند یافت. به عبارت دیگر، محققان یک مجموعه داده پس از جمع آوری را تجزیه و تحلیل می کنند یا یک نظرسنجی برای ایجاد یک مدل استنتاج پیشرفته طراحی می کنند. بنابراین تاکید میشود که هدفگذاری دقیق حوزههای پژوهشی بسیار مهم است. مطالعات مربوط به TS بر روشهای استخراج اشیا از دادههای GPS تمرکز دارند، در حالی که مطالعات مرتبط با HG بر غنیسازی معنایی مسیرهای GPS متمرکز هستند. مورد دوم به جای روش شناسی دقیق، بر کسب دانش عمومی در مورد تحرک و مکان فعالیت ها تمرکز دارد [ 17 ]].
برای اطلاعات GPS جمعآوریشده از طریق دستگاههای داخلی که حاوی دادههای حقیقت زمینی نیستند، مطالعات مختلف از تلفیقی از دادههای نظرسنجی (مانند دادههای بررسی سفرهای خانگی)، دادههای نقطهنظر (POI) و دادههای رسانههای اجتماعی برای اهداف سفر استفاده کردهاند. استنباط [ 13 ، 14 ، 18 ]. با این حال، این موارد تنها درصد کمی از کارهای مرتبط را تشکیل میدهند و تحقیقات در مورد پیشبینی هدف سفرهای مرتبط با دوچرخه کافی نیست [ 2 ]. بائو و همکاران [ 1 ] و زینگ و همکاران. [ 2 ] هدف سفر با دوچرخه را با استفاده از داده های POI استنباط کرد، با توجه به اینکه هدف سفر با استفاده از زمین در مقصد مرتبط است [ 18 ، 19 ، 20 ]]. با این حال، این مطالعات تأثیر کاربری مختلط زمین در مناطق شهری را در نظر نگرفت. بائو و همکاران [ 1 ] اهداف سفر را با خوشه بندی تنها بر اساس تعداد فرکانس ساده از نوع POI در نزدیکی ایستگاه های دوچرخه طبقه بندی کرد. زینگ و همکاران [ 2 ] زمینه مبدأ و مقصد استفاده از دوچرخه را از طریق داده های POI افزایش داد، اما هدف سفر خاص را برای یک مکان یکپارچه مانند یک مرکز خرید در نظر نگرفت. با این حال، وقوع فزاینده استفاده از زمین مخلوط در مناطق شهری و POI یکپارچه مانند ساختمان ها باید در نظر گرفته شود [ 21 ، 22 ].
بنابراین، مطالعه حاضر با استفاده از فناوری تعبیه POI، با هدف حل مشکل کاربری ترکیبی زمین در زمینه مبدا-مقصد، که کلید استنتاج هدف سفر است، انجام میشود. POI ابزار مفیدی برای تعریف معنای مکان است. با این حال، به دلیل سلسله مراتب انواع POI، بسیاری از عوامل نادیده گرفته می شوند که منجر به از دست رفتن اطلاعات می شود [ 23 ]. به عنوان مثال، آپارتمانها و پارکها به دلیل دستهبندیهای متفاوتشان بهعنوان POI کاملاً نامرتبط در نظر گرفته میشوند، اما مناطق مسکونی و پارکهای شهری عموماً بسیار نزدیک به یکدیگر قرار دارند. اخیراً تحقیقاتی در مورد معنای POI با توجه به همبستگی های فضایی آن انجام شده است [ 23 ، 24 ، 25]. این ممکن است شامل کاربرد فناوری جاسازی کلمه در حوزه پردازش زبان طبیعی [ 26 ] باشد، همانطور که برای طبقه بندی مناطق عملکردی شهری [ 25 ، 27 ] استفاده شده است. از آنجایی که نواحی عملکردی شهری به شدت با فعالیتهای اجتماعی-اقتصادی داخلی در فضاها مرتبط هستند، شناسایی آنها از روی تصاویر سنجش از دور خالص آسان نیست [ 21 ].]. بنابراین، داده های POI به عنوان یک اندازه گیری تکمیلی استفاده می شوند، اما محدودیت سلسله مراتب انواع POI مستلزم استفاده از فناوری جاسازی برای تعریف نوع POI است. در نتیجه، در مطالعه حاضر، انواع POI سفارشی شده برای سفرهای دوچرخه، با تعبیه نوع POI بر اساس هدف سفر با دوچرخه استفاده شد. این یک راه حل برای مشکل کاربری اراضی مختلط شهری است.
این کار با مطالعات استنتاج هدف سفر موجود مرتبط با TS با تمرکز بر دقت روش متفاوت است. از این جهت متفاوت است که بر کسب دانش عمومی در مورد تحرک دوچرخه و محل فعالیتها با استفاده از فرآیندهای تقویتکننده معنا که منعکسکننده دنیای واقعی هستند، تمرکز دارد. برای ارزیابی روش پیشنهادی، ما همچنین با استفاده از دادههای تلفن همراه و دادههای POI، دادههای حقیقت زمینی را ایجاد میکنیم. کمک های این کار به حوزه و جامعه به شرح زیر است. ابتدا، این کار روشی را برای اعمال تکنیکهای جاسازی POI برای استنتاج هدف سفر با دوچرخه پیشنهاد میکند. فناوری جاسازی POI یک کاربرد فناوری در زمینه پردازش زبان طبیعی (NLP) است. در زمینه تحلیل فضایی، تنها برای طبقه بندی مناطق عملکردی شهری استفاده شده است [ 25 ,27 ] و توصیه POI [ 26]. با بهترین دانش ما، این مطالعه اولین مطالعهای است که تکنیکهای جاسازی POI را برای استنتاج هدف سفر به کار میگیرد. دوم، تحرک شخصی، و همچنین شیوه های حمل و نقل موجود مانند اتوبوس و تاکسی، اخیراً در سراسر جهان به سرعت در حال افزایش است. با توجه به این سناریو، روش پیشنهادی را می توان با توجه به حالت مربوطه هنگام استنباط هدف سفر برای تحرک شخصی سفارشی کرد. سوم، دادههای سفر مربوط به تحرک شخصی، از جمله دوچرخههای مشترک، به ما امکان میدهد تا جریان ظریف حرکت شخصی در شهرها را که نمیتوان از الگوهای حرکت اتوبوسها یا مترو مشاهده کرد، بدانیم. بنابراین، استفاده از روش استنتاج پیشنهادی برای دادههای دنیای واقعی برای تجزیه و تحلیل هدف سفر، منجر به درک بهتر علل حرکت شخصی در شهرها میشود.
ادامه این مقاله به شرح زیر سازماندهی شده است. بخش 2 مطالعات قبلی مربوط به استنتاج هدف سفر و جاسازی POI را مرور می کند. بخش 3 روش پیشنهادی را برای استنباط هدف سفر با دوچرخه ارائه می کند. در بخش 4 ، ما یک آزمایش استنتاج هدف سفر با دوچرخه را که با استفاده از 87 ایستگاه دوچرخه در Seocho-gu، سئول انجام شد، توصیف میکنیم. در نهایت، بخش 5 نتیجه گیری و محدودیت های مطالعه و جهت گیری های تحقیقات آینده را ارائه می دهد.
2. آثار مرتبط
2.1. مطالعات در مورد استنتاج هدف سفر
در میان مطالعات مرتبط با ترافیک، هدف سفر نسبتاً کمتر مورد توجه قرار گرفته است [ 14 ، 15 ، 16 ]. این به دلیل پیچیدگی مکانی-زمانی فعالیتهای انسانی مورد نیاز برای پیشبینی هدف سفر است [ 13 ، 28 ]. مطالعات در مورد استنباط هدف سفر را می توان بر اساس شیوه های اصلی سفر طبقه بندی کرد. بیشترین جنبه مورد مطالعه بر سفرهای انسان بدون مشخص کردن نحوه حمل و نقل متمرکز است. در این مورد، هدف سفر بیشتر بر اساس نظرسنجیها پیشبینی میشود، با توسعه فناوریهای مرتبط که امکان تحقیقات گسترده را فراهم میکند، از جمله افزودن دادههای GPS که مسیرهای سفر را فراهم میکند [ 15 ، 29 ]]. علاوه بر این، تجزیه و تحلیل دادههای پیچیده مکان و زمان از طریق ادغام دادههای ناهمگن مانند دادههای رسانههای اجتماعی (به عنوان مثال، توییتها) و دادههای POI (مانند Google API) پیچیدهتر شده است [ 14 ، 29 ، 30 ]. با این حال، پیشبینی هدف سفر تنها از طریق نظرسنجی مستقیم مسافران، تحقیقات موجود را به شدت محدود کرده است.
همچنین مطالعاتی در مورد استنباط هدف سفر با توجه به نحوه حمل و نقل انجام شده است. بیشترین جنبه مورد مطالعه در این مورد، حالت حمل و نقل عمومی مانند مترو است که با توسعه کارت های هوشمند، تنوع حاصل شده است. با این حال، تنها تعداد کمی از این مطالعات بر پیشبینی هدف سفر متمرکز شدهاند، زیرا کارت هوشمند شامل «هدف سفر» نیست، که نیاز به تصمیمگیری توسط مسافر دارد. السگر و همکاران [ 18 ] این موضوع را با استنباط هدف سفر از طریق جمع آوری داده های بررسی سفر خانواده (HTS) مورد بررسی قرار داد. مدلسازی مبتنی بر قانون برای دادههای HTS، که از طریق نظرسنجیهای مسافران بهدست آمد، اعمال شد و هدف سفر بر اساس ویژگیهای مکانی، زمانی و فرکانس استنباط شد.
در مطالعات مرتبط با دوچرخه، تجزیه و تحلیل الگوهای اشتراک گذاری سنتی یا اهداف سفر اغلب بر اساس نظرسنجی های رضایت مسافران است [ 13 ، 14 ، 29 ، 31 ، 32 ، 33 ]. اخیراً، فراوانی فزاینده داده های اشتراک دوچرخه برای استنباط هدف سفر مورد استفاده قرار گرفته است. به طور خاص، هدف سفر بسیار با کاربری زمین در مقصد مرتبط است. بنابراین، با افزایش پیچیدگی دادههای POI، بسیاری از محققان تلاش کردهاند تا یک تحلیل مکانی-زمانی از ادغام دادههای اشتراک دوچرخه و دادههای POI انجام دهند. بائو و همکاران [ 1] الگوهای سفر با دوچرخه و هدف سفر را با استفاده از داده های Citi Bike در نیویورک، ایالات متحده تجزیه و تحلیل کرد. از طریق خوشه بندی k-means، آنها ایستگاه های دوچرخه را بر اساس داده های POI اطراف طبقه بندی کردند و یک مدل الگوی سفر دوچرخه را با استفاده از روش تخصیص نهفته دیریکله (LDA) توسعه دادند. با این حال، این مطالعه دارای محدودیتهایی بود، مانند خوشهبندی اهداف سفر با دوچرخه فقط با استفاده از فرکانسهای ساده انواع POI در اطراف مقصد. زینگ و همکاران [ 2 ] از دادههای Mobike و دادههای اشتراک دوچرخه بدون اسکله برای شانگهای، چین و مشابه بائو و همکاران استفاده کرد. [ 1]، آنها داده های اشتراک دوچرخه و داده های POI را برای تجزیه و تحلیل الگوها و اهداف سفر کاربر ترکیب کردند. بهویژه، آنها زمینههای مبدا و مقصد سفر را با استخراج اطلاعات در مورد پیکربندیهای POI نزدیک، غنیتر کردند. این با رویکرد بائو و همکاران متفاوت است. [ 1 ]، که فقط فرکانس های انواع POI را در نظر گرفت. با این حال، فقط نوع POI و نقطه دوچرخه برای ساختن زمینه استفاده شد و دادههایی که در طول زمان تغییر میکردند حذف شدند. علاوه بر این، این روش به دلیل ناتوانی در در نظر گرفتن POI یکپارچه مانند مراکز خرید محدود شده است.
چن و همکاران [ 34 ] هدف سفر را برای کاربران تاکسی پیش بینی کرد. این مطالعه قابل توجه بود زیرا مقدار زیادی از داده های شخصیت سفر در یک مقدار برداری ادغام شد و از جاسازی برای استنتاج هدف سفر استفاده شد. دادههای مسیر تاکسی مورد استفاده و دادههای POI در شهر نیویورک، ایالات متحده آمریکا تولید شدند. برای توضیح بیشتر در زمینه مبدا و مقصد تاکسی، محبوبیت، منحصربهفرد بودن، و فاصله تا POI از طریق اطلاعات زمانی و دادههای چک در چهار ضلعی در نظر گرفته شد. سه زمینه (زمان، مبدا و مقصد) سفر تاکسی از طریق رمزگذار خودکار ساخته و عمیقاً تعبیه شد. در نهایت، هدف سفر تاکسی با خوشه بندی مقادیر تعبیه شده استخراج شد.
بررسی فوق نشان میدهد که مطالعات سنتی مربوط به استنتاج هدف سفر عمدتاً از نظرسنجیهای مبتنی بر GPS از سفرهای انسانی استفاده کردهاند. با این حال، برخی از کارهای استنتاج هدف سفر اخیر از داده های بزرگ به دست آمده توسط کارت های هوشمند یا خدمات اشتراک دوچرخه عمومی استفاده کرده اند. با این وجود، اگر مجموعه داده بر اساس نظرسنجی مسافرتی نباشد، اندازه گیری دقت مدل استنتاج دشوار است. بسیاری از این مطالعات قبلی تلاش کردند تا هدف سفر را از دادههای تاریخچه سفر و دادههای POI استنتاج کنند، اما تولید دادههای حقیقت زمینی آسان نبود. بنابراین، هنگامی که داده های بزرگ استفاده می شود، آنها با داده های نظرسنجی ترکیب می شوند یا نتایج به دست آمده توسط مدل های استنتاج برای اهداف ترافیکی مناسب خوشه بندی و برچسب گذاری می شوند.
جدول 1 مطالعات مختلف مربوط به استنباط هدف سفر انجام شده در سه سال گذشته را با هم مقایسه می کند که از آنها می توان روندهای اخیر را مشاهده کرد. برخلاف مطالعات موجود، این مطالعه روشی را برای استنباط اهداف سفر با دوچرخه با هدف کسب دانش عمومی در مورد مکانهای تحرک و فعالیت دوچرخه پیشنهاد میکند. علاوه بر این، این مطالعه روش پیشنهادی را با تولید داده های حقیقت زمینی با استفاده از داده های تلفن همراه و داده های POI ارزیابی می کند.
2.2. مطالعات مربوط به جاسازی POI
با توسعه فناوری هایی مانند Word2vec برای بردار سازی اطلاعاتی که تعیین کمیت آن در زبان های طبیعی دشوار است، مطالعاتی به طور فعال برای کمی سازی اطلاعات در زمینه های مختلف انجام می شود [ 26 ، 35 ، 36 ، 37 ]. یان و همکاران [ 24 ] مدل Place2vec را توسعه داد که برای جاسازی نوع POI استفاده میشود و فاصله جغرافیایی و محبوبیت POI را برای کمی کردن اطلاعات POI توزیع شده در یک فضای جغرافیایی در نظر میگیرد. Place2vec با روش های قبلی متفاوت است، که همبستگی های فضایی داخلی را در نظر نمی گیرند و فقط از فرکانس POI برای تعیین نوع عملکردی منطقه مورد نظر استفاده می کنند [ 25 ].
یائو و همکاران [ 27 ] و ژای و همکاران. [ 25 ] به اندازهگیری شباهت و ارتباط انواع مکانها ادامه داد. این مطالعات تلاش کردند تا کاربری زمین را از نتایج تعبیه POI استخراج کنند. ژای و همکاران [ 25 ] نتایج به دست آمده توسط یان و همکاران را ساده کرد. [ 24 ] و از آنها برای تقویت داده ها فقط بر اساس فاصله بین POI استفاده کرد. نوع عملکردی منطقه شهری از نتایج تعبیه استخراج شد. علاوه بر این، برای شناسایی دقیق نتایج استخراج، حاشیه نویسی هر منطقه توسط داده های تلفن همراه و داده های مبدا-مقصد کامیون (OD) پشتیبانی می شود.
لیو و همکاران [ 38 ] و لیو و همکاران. [ 23 ] انواع POI را برای جلوگیری از از دست رفتن اطلاعات به دلیل سلسله مراتب تقسیم بندی کرد. به عنوان مثال، لیو و همکاران. [ 23 ] 488 نوع POI را مشخص کرد و یک ارتباط بین داروخانه ها، فروشگاه های رفاه و آرایشگاه ها مشاهده کرد. این انواع POI معمولاً نزدیک به یکدیگر قرار دارند، اما سلسله مراتب این انواع POI ممکن است همبستگی آنها را مبهم کند. علاوه بر تقسیمبندی نوع POI، همبستگیهای مختلف ممکن است هنگام ساختن تاپلها جفت شوند. برای مثال، جین و همکاران. [ 39 ] انواع فروشگاه را به جای انواع POI جاسازی کرد و با ساخت جفت هایی از نوع فروشگاه و اقلام فروخته شده توسط فروشگاه، داده ها را افزایش داد.
جدول 2مطالعات مختلف در مورد جاسازی POI را مقایسه می کند. در اکثر مطالعات، نوع POI از طریق افزایش داده ها بر اساس فاصله POI در فضای جغرافیایی تعریف می شد. نزدیکترین k یا یک بافر برای تولید چند تایی بین POIها و Word2vec skip-gram عمدتاً برای جاسازی استفاده شد. مطالعه حاضر جریان این مطالعات قبلی را با توجه به ترکیب چند تایی و استفاده از Word2vec دنبال کرد، اما یک روش جاسازی POI جدید برای استخراج کاربری زمین مخصوص یک سفر با دوچرخه استفاده شد. انواع POI بر اساس هدف سفر با دوچرخه با مراجعه به مطالعات مرتبط طبقه بندی شدند. به طور خاص، انواع POI مربوط به اوقات فراغت دوچرخه برای جلوگیری از از دست دادن اطلاعات به دلیل سلسله مراتب انواع POI به طور جداگانه طبقه بندی شدند.
3. روش ها
ما روشی را برای استنباط هدف سفرهای عمومی دوچرخه بر اساس داده های اشتراک دوچرخه و داده های POI ایجاد کردیم. این روش شامل استخراج ویژگی هایی است که بر هدف سفر تأثیر می گذارد از داده ها و استفاده از آنها برای یادگیری ماشینی برای استنباط هدف سفر نهایی. هنگام انتخاب ویژگیهای مورد استفاده، اطلاعات کاربری زمین در نقاط شروع و پایان سفر با دوچرخه با جاسازی و خوشهبندی دادههای POI برای منطقه اطراف ایستگاه دوچرخه تعیین شد. علاوه بر این، برای ایجاد داده های حقیقت زمینی برای تعیین هدف سفر، داده های تحرک را برای هر دوره زمانی در یک فرم مش استاندارد کردیم و آن را همراه با داده های POI استخراج کردیم. روش کلی در شکل 1 نشان داده شده است .
3.1. استخراج ویژگی برای استنتاج هدف سفر
برخلاف پیشبینی تقاضای سفر که تحت تأثیر عوامل مختلفی مانند آب و هوا و جمعیت شناور است، هدف سفر را میتوان به طور کلی به اطلاعات زمانی و مکانی تقسیم کرد. زمان دوچرخه سواری و کاربری های زمین در نقطه عزیمت و مقصد به طور قابل توجهی نشان دهنده هدف سفر است. چن و همکاران [ 34 ] سه زمینه برای زمان، مبدا و مقصد ایجاد کرد و از جاسازی برای استنباط هدف سفر تاکسی استفاده کرد. السگر و همکاران [ 18 ] هدف سفر را با کمک کارت هوشمند، با استفاده از کاربری زمین مقصد، زمان شروع و مدت فعالیت به عنوان ویژگیهای مهم استنباط کرد.
در مطالعه حاضر، ویژگیهایی که بر اهداف سفر عمومی دوچرخه تأثیر میگذارند عبارتند از: روز سواری، زمان حرکت، کاربری زمین نقطه عزیمت، زمان رسیدن، کاربری زمین مقصد، زمان سفر، مسافت سفر و فاصله بین ایستگاههای دوچرخه. با توجه به عدم احتمال استفاده از دوچرخه عمومی اجاره ای برای بیش از 24 ساعت، روز سواری به عنوان تاریخ اجاره در نظر گرفته شد. روز سواری با 1 برای یک روز کاری و 0 برای یک روز غیر کاری نشان داده می شد. زمان حرکت و رسیدن بین 0 تا 23 بود که فقط از اطلاعات منطقه زمانی استفاده شد و جزئیات دقیقه و ثانیه نادیده گرفته شد. برای در نظر گرفتن عوامل زمانی و مکانی کل سفر، زمان سفر و مسافت سفر به طور جداگانه وارد شد. فاصله بین ایستگاه های خروج و رسیدن به دلیل ویژگی های دوچرخه های مورد استفاده برای مقاصد تفریحی مانند پارک سواری، یک ویژگی مهم در نظر گرفته شد. به عنوان مثال، در مورد یک سفر تفریحی، حتی اگر کل زمان یا مسافت سفر طولانی باشد، ممکن است ایستگاه های عزیمت و مقصد یکسان باشند.
هنگامی که ویژگی های فوق با استفاده از داده های اشتراک دوچرخه ساخته می شوند، داده های POI برای مناطق اطراف ایستگاه ها باید برای استخراج کاربری زمین در نقطه عزیمت و مقصد استفاده شوند. با توجه به فاصله بین ایستگاه های دوچرخه عمومی و تراکم جمعیت شهر سئول، شعاع جستجو برای هر ایستگاه مانند مطالعات قبلی 250 متر تعیین شد [ 1 ، 40 ]. برای استنتاج دقیق، POI ها با دسته بندی بر اساس اهداف سفرهای دوچرخه به انواع سفارشی طبقه بندی شدند. طبقه بندی هدف سفرهای مورد استفاده در مطالعات قبلی در جدول 3 ارائه شده است .
در این مطالعه، هشت مقوله هدف سفر با دوچرخه، یعنی خانه، محل کار، تحصیل، حمل و نقل، ناهار خوری، خرید و خدمات، اوقات فراغت و اوقات فراغت دوچرخه در نظر گرفته شد. طبقه بندی با مراجعه به Bao و همکاران انجام شد. [ 1 ] که از دوچرخه به عنوان شیء اصلی استفاده می کرد و “کار” اضافه شد. علاوه بر این، POI در پارکها و پارکهای تفریحی مخصوص ترافیک دوچرخه بهعنوان «تفریح دوچرخه» شناسایی شدند. بعلاوه، POIهای مربوط به “فرغت دوچرخه” در شعاع جستجو با هر چیزی در 1000 متری ایستگاه دوچرخه به جای 250 متر استاندارد مقایسه شد. شناسایی کاربری زمین با استفاده از داده های POI برای مناطق اطراف ایستگاه های دوچرخه در زیربخش بعدی مورد بحث قرار می گیرد.
3.2. شناسایی کاربری زمین در سفرهای دوچرخه سواری
3.2.1. تعبیه نوع POI مربوط به هدف سفر با دوچرخه
مطالعات بر روی جاسازی انواع POI در سه سال گذشته در زمینه های مختلف انجام شده است که با کار یان و همکاران آغاز شده است. [ 23 ، 24 ، 25 ، 38 ]. در مطالعه حاضر، ما یک روش جاسازی POI را به طور خاص برای سفرهای دوچرخه ایجاد کردیم. نوع POI با در نظر گرفتن هدف سفر با دوچرخه طبقهبندی شد، در حالی که فاصله جغرافیایی بین POI و تعداد دوچرخههای اجارهای در هر ایستگاه برای افزایش تاپلهای POI برای جاسازی استفاده شد.
تعبیه نوع POI برای استنباط هدف سفر با دوچرخه اساساً جاسازی کلمه بود که با در نظر گرفتن مکان کلمه مرکزی و کلمات متن برای معنی دادن به یک کلمه استفاده می شود. این روش مفهوم جاسازی کلمه را در یک POI یا مکان اعمال می کند. شکل 2 Word2vec مبتنی بر اندازه پنجره و مفهوم تعبیه نوع POI را مقایسه می کند. از آنجا که جاسازی کلمه (skip-gram) بر اساس اندازه پنجره است، اگر اندازه پنجره 1 باشد، همانطور که در شکل 2 نشان داده شده است.آموزش با انتخاب “سریع” و “برای” به عنوان کلمات متنی کلمه مرکزی “قهوه ای” انجام می شود. این روش برای پیش بینی کلمات متنی بر اساس یک کلمه مرکزی استفاده می شود. برعکس، تعبیه نوع POI از مکان POI استفاده می کند. اگر POI در 100 متری POI مرکزی، “آپارتمان” واقع شده باشد، به عنوان POI زمینه (به عنوان مثال، سوپرمارکت، داروخانه یا پارک) شناخته می شود و یک تاپل تولید می شود.
ما یک روش جاسازی نوع POI به طور خاص برای سفرهای دوچرخه سواری بر اساس Yan et al. [ 24 ]. یک مدل پرش گرم برای پیشبینی کلمات زمینه از کلمه مرکزی که توسط مدلهای Word2vec به دست آمده است، استفاده شد و تفاوت بین احتمال آموزشدیده شده و احتمال واقعی با آنتروپی متقاطع اندازهگیری شد. مدل به صورت زیر بیان می شود.
جایی که y^توزیع احتمال آموخته شده، y توزیع احتمال واقعی، c شاخص نوع، و y^ج احتمال وقوع m POI است ( تی1، تی2، تی3،… تیمتربا معادله (2) به دست می آید.
جایی که تیجمرکز POI است. هنگامی که فرض ساده بیز در محاسبه احتمال اعمال می شود، yج همیشه 1 است.
در نهایت با تبدیل امتیاز به احتمال با استفاده از تابع softmax می توان نوع POI را به صورت برداری بیان کرد. تابع هدف توسط،
جایی که توتیبردارهای نوع مکان را نشان می دهد، vجنشان دهنده بردارهای نوع مرکز مکان و |تی|اصلی بودن نوع POI است.
Yan et al. [ 24 ] پیشنهاد افزایش تعداد حضور تاپل های آموزشی ( تیجهnتیهr، تیجonتیهایکستی) توسط یک عامل β . آنها سه مفهوم را ارائه کردند: (1) بافت فضایی ساده، (2) بافت فضایی ساده افزوده شده که ایده محبوبیت و فاصله تا یک مکان را در خود جای داده است، و (3) زمینه فضایی که با تئوری اطلاعات، با تاخیر فاصله (ITDL) تقویت شده است.
روش ساده بافت فضایی تقویت شده برای مطابقت با هدف تحقیق اصلاح شد. این به طور خاص برای افزایش محبوبیت POI های فردی با بررسی داده های Yelp استفاده شد. این به این دلیل بود که تعداد بررسیها نشاندهنده محبوبیت یا تسلط نسبی POI است. بنابراین، عامل β را می توان در رابطه (4) زیر تعریف کرد، جایی که پلjتعداد کل ورود به POI است لj. در این مطالعه، به جای داده های بررسی Yelp توسط یان و همکاران. [ 24 ]، ما تاپل های POI را با تخصیص تعداد اجاره ها در هر ایستگاه دوچرخه در میان POI ها در شعاع تعیین شده ایستگاه با توجه به فواصل مربوطه آنها افزایش دادیم. به عنوان مثال، اگر 100 داده ورود دوچرخه در ایستگاه A وجود داشته باشد، آنها به طور مساوی بین تمام POI های مجاور توزیع می شوند. با این حال، سهمیه آنها متناسب با فاصله آنها از ایستگاه خواهد بود.
این امر با افزایش بر اساس فاصله POI دنبال شد. اصل اساسی تعبیه نوع POI اعمال شد، به عنوان مثال، هر چه فاصله کوتاه تر باشد، رابطه بین POI عمیق تر می شود. فاکتور β مربوط به فاصله به صورت زیر تعریف می شود.
کجا | L | تعداد کل POI است، د(لمن، لj)فاصله بین POI است لمنو POI لjو α ضریب فاصله معکوس است که در این مطالعه 1 تنظیم شد. ما فاکتور افزایش فاصله مورد استفاده توسط Yan et al را اعمال کردیم. [ 24 ]. فاکتور β ، که به طور جامع نشان دهنده محبوبیت یک POI بر اساس مفهوم فاصله است، به صورت زیر تعریف شد.
بر اساس روش پیشنهادی یان و همکاران. [ 24 ]، روش پیشنهادی تعبیه نوع POI برای استنتاج هدف سفر با دوچرخه به شرح زیر است. ابتدا، یک تاپل برای POIهایی که در شعاع 250 متری ایستگاه دوچرخه قرار دارند (1000 متر در مورد POI های مربوط به اوقات فراغت دوچرخه) تشکیل می شود. تاپل ایجاد شده با استفاده از یک عامل تقویت کننده β که محبوبیت و فاصله بین POI ها را در نظر می گیرد، تقویت می شود. شکل 3 پیکربندی تمام تاپل های اطراف ایستگاه های دوچرخه و تقویت آنها را نشان می دهد. همانطور که در جدول سمت راست شکل 3 نشان داده شده است، اگر kدر طول پیکربندی K-نزدیکترین تابع 3 است، تاپل ها با گروه بندی مجموعه ای از سه POI نزدیک به هر POI تشکیل می شوند و همه POI در ایستگاه دوچرخه گنجانده می شوند. در این مورد، به دلیل اینکه فاصله بین تاپل ها کوتاهتر است و تعداد اجاره ها افزایش می یابد ، همانطور که توسط Yan و همکاران پیشنهاد شده است، می توان با استفاده از فاکتور β ، افزایش را انجام داد. [ 24 ]. اعداد داخل پرانتز زیر POI در شکل 3مقادیری هستند که با توزیع تعداد کل دوچرخه های کرایه شده (در اینجا 1000 برابر فرض می شود) بین POI متناسب با فاصله آنها از ایستگاه به دست می آید. این نشان می دهد که POI های نزدیک تر به ایستگاه های دوچرخه محبوبیت بیشتری دارند. علاوه بر این، از آنجایی که تعداد دوچرخههای کرایهای بین ایستگاههای دوچرخه متفاوت است (برای مثال، تعداد دوچرخههای کرایهای در ایستگاه A ممکن است 1000 باشد، در حالی که در ایستگاه B ممکن است 50 باشد)، این روش میتواند بهطور متفاوتی در بین ایستگاهها اعمال شود. تاپل های ایجاد شده در این روش با استفاده از TensorFlow آموزش داده شدند و تعداد ابعاد تعبیه شده روی 70 تنظیم شد و مانند مطالعات قبلی اعمال شد.
3.2.2. استخراج کاربری زمین در هر ایستگاه
روش استخراج کاربری زمین در هر ایستگاه دوچرخه بر اساس مقدار به دست آمده با تعبیه نوع POI بر اساس روش های ارائه شده توسط Zhai و همکاران است. [ 25 ] و یائو و همکاران. [ 27 ]. ابتدا، مقادیر جاسازی نوع POI هر ایستگاه با استفاده از معادله (7)، در یکی ترکیب میشوند. پOمنتیyپه(vمن، ک)مقدار برداری k امین نوع POI در ایستگاه دوچرخه است و N تعداد کل POI در تمام ایستگاه های دوچرخه است.
بر اساس مقادیر استخراجشده، خوشهبندی برای ایستگاههای دوچرخه، با الگوریتم k-means برای استخراج کاربری زمین در ایستگاهها انجام میشود. مقادیر جاسازی ایستگاههای دوچرخه فردی متشکل از بردارهای با ابعاد بالا برای انواع کاربری مشابه با تجزیه و تحلیل خوشهبندی گروهبندی میشوند. k _مقدار، که تعداد خوشهها در الگوریتم k-means است، باید از قبل بهعنوان مقدار زانو یا شبح تعیین شود. فرآیند با معادله (8) بیان می شود. در این تحقیق به دلیل اینکه خروجی نهایی یک ارزش کاربری دقیق زمین نیست، ارزش کاربری زمین مانند مطالعات قبلی با استفاده از شاخص های اضافی مشخص نشده است. در عوض، نتایج خوشهبندی بهعنوان متغیرهایی از ویژگیهای کاربری زمین در مبدا و مقصد برای استنباط هدف سفر با دوچرخه استفاده شد.
3.3. ایجاد داده های حقیقت زمینی مرتبط با هدف سفر
3.3.1. استانداردسازی داده های مش
از آنجایی که داده های حقیقت زمینی برای هدف سفر منعکس کننده تصمیم گیری مسافران است، به دست آوردن آنها آسان نیست. در برخی از مطالعات قبلی، داده ها توسط یک نظرسنجی مسافر جمع آوری شد [ 13 ، 14 ، 29 ]. با این وجود، با ظهور انواع مختلف دادههای مرتبط با ترافیک مبتنی بر GPS، دادههای بزرگی که دادههای واقعی را منعکس نمیکنند، پدیدار شدند. نگوین و همکاران [ 17 ] مطالعاتی را طبقه بندی کرد که هدف سفر را با استفاده از این نوع داده ها استنباط می کند، مانند مطالعات مربوط به HG. در مطالعات استنتاج با هدف ترافیک مرتبط با HG، داده های حقیقت زمینی اختیاری هستند زیرا عقل سلیم یا الگوهای سفر از نظرسنجی های قبلی برای اعتبارسنجی کافی هستند [ 17 ]]. علاوه بر این، به جای تمرکز بر دقت در سطوح فردی، هدف آنها غنی سازی معنایی مسیر و کشف الگوهای کلی فعالیت است. از آنجا که فعالیت های حاشیه نویسی با تقریب مجاز است، اکثر مطالعات مرتبط با HG نتایج هدف سفر را با یادگیری بدون نظارت، مانند خوشه بندی نتایج بدون داده های درستی زمینی دقیق، استنباط می کنند [ 1 ، 2 ، 34 ].
با این حال، این مطالعه تکنیکی را برای تولید دادههای حقیقت زمینی برای ارزیابی دقت روششناسی ما به شیوهای واقعبینانه پیشنهاد میکند – این تکنیک شامل کمی کردن هدف سفر با دوچرخه در سطح عقل سلیم است، زمانی که کاربر دوچرخه در یک زمان خاص پیاده میشود و محل. این معنی دار است زیرا تحقیقات مرتبط با HG با هدف به دست آوردن دانش عمومی در مورد تحرک و محل فعالیت ها انجام می شود. نرخ مالکیت گوشی هوشمند در کره جنوبی 95 درصد است [ 41]؛ بنابراین، ما از داده های انباشته سیار از دیدگاه جمعیت خدمات یا جمعیت زنده استفاده می کنیم که با جمعیت ساکن متفاوت است. بنابراین، دادههای حقیقت زمینی هدف سفر برای اشتراکگذاری ناشناس دوچرخه بر اساس این فرض ایجاد میشود که اکثر مردم وقتی در مکان و زمان خاصی بودند، انتخابهای خاصی انجام میدادند. بنابراین، جهان واقعی را منعکس میکند، البته نه دادههای کامل حقیقت زمین.
از این منظر، این مطالعه از داده های تلفن همراه و داده های POI برای تولید داده های حقیقت زمینی برای اهداف سفر با دوچرخه استفاده می کند. این امر مستلزم استانداردسازی اطلاعات مکانی موجود بود. داده های تلفن همراه بلادرنگ مورد استفاده شامل داده های جمعیت ارائه شده توسط شهر سئول بود. واحد اطلاعات مکانی منطقه خروجی بود که حداقل منطقه شمارش آماری ساخته شده برای در نظر گرفتن اندازه جمعیت (بهینه 500 نفر)، همگنی اجتماعی-اقتصادی (نوع مسکن، قیمت زمین) و شکل زمین بر اساس یک منطقه آماری پایه است. [ 42 ]. بر این اساس، اداره ملی آمار در کره دادههای سرشماری را در واحدهای کوچک منطقه (مساحت خروجی) که کوچکتر از واحدهای اداری هستند، جمعآوری و ارائه میکند. همانطور که در شکل 4 نشان داده شده استواحد استاندارد شده به عنوان داده مش (50 × 50 متر) برای مطابقت با واحد فضایی داده های تلفن همراه که می تواند برای تعیین جمعیت شناور با توجه به زمان استفاده شود، متحد شد. داده ها در یک منطقه بافر که شامل POI در 250 متر از هر ایستگاه دوچرخه است، اعمال شد.
برای استاندارد کردن واحد سطح خروجی به دادههای مش، وزن مش با استفاده از دادههای مساحت کف ساختمان تعیین شد. این داده ها برای در نظر گرفتن منطقه ای که جمعیت واقعی در فضای جغرافیایی در آن زندگی می کنند استفاده شد. در شکل 5 ، داده های مش (واحد استاندارد)، داده های مساحت طبقه ساختمان و داده های سطح خروجی در همان فضا ارائه شده است. ابتدا نقاط در فواصل 5 متری در چند ضلعی ساختمان چیده شدند و سپس مساحت طبقه ساختمان در هر نقطه به طور مساوی تقسیم شد تا مقادیر ویژگی آنها به دست آید. به عنوان مثال ساختمان A که در شکل 5 نشان داده شده است، دارای زیربنای ساختمان 1000; اگر تعداد نقاط 100 باشد، وزن هر نقطه 10 خواهد بود. اگر این مقدار در یک شبکه توزیع شود، هر شبکه اطراف ساختمان A (که با خطوط چین قرمز مشخص شده است) وزن متفاوتی خواهد داشت. مرحله بعدی تعیین نواحی خروجی است که نقاط مش شماره گذاری شده به آن تعلق دارند. این مرحله برای تطبیق یک ناحیه مش و یک ناحیه خروجی بر اساس نقاط استفاده می شود.
در بیشتر موارد، محدوده ناحیه خروجی وسیع تر از مش است. بنابراین، اولی را می توان با تقسیم مناطق خروجی به مش محاسبه کرد. با این حال، مشابه آنچه در مرکز شکل 5 وجود دارد (که با رنگ زرد مشخص شده است)، یک مش ممکن است دارای چندین ناحیه خروجی باشد و بنابراین، واحد باید بر اساس مقدار نقطه استاندارد شود. به این ترتیب، داده های تلفن همراه برای هر دوره زمانی ساخته شده در واحدهای ناحیه خروجی را می توان در واحدهای مش استاندارد کرد.
3.3.2. استخراج هدف سفر با دوچرخه
روش برای استنباط هدف سفر با دوچرخه با استفاده از داده های تلفن همراه استاندارد شده در واحدهای مش و داده های POI در اطراف ایستگاه های دوچرخه به شرح زیر است. ابتدا، منطقه حائل با شعاع 250 متری ایستگاه دوچرخه در واحدهای مش استاندارد شده است. همانطور که در شکل 6 نشان داده شده است ، جمعیت شناور استنباط شده از داده های تلفن همراه به هر مش اختصاص داده شده است. هرچه مش تیره تر باشد، جمعیت شناور اختصاص داده شده بالاتر است. محاسبه با تقسیم جمعیت شناور بین داده های POI هر مش انجام می شود. به عنوان مثال، ناحیه مش در شکل 6مشخص شده با خطوط چین قرمز دارای دو POI مربوط به خرید و خدمات و حمل و نقل است و جمعیت شناور در این شبکه به هر یک از این انواع POI اختصاص داده می شود. به عبارت دیگر، POI ها دارای مقادیری هستند که از جمعیت شناور تخصیص داده شده اند، و زمانی که این ها برای هر ایستگاه دوچرخه ترکیب شوند، می توان نوع با بیشترین مقدار را به عنوان هدف سفر دوچرخه برای آن ایستگاه استنتاج کرد. بر این اساس، می توان استنباط کرد که هدف سفر با دوچرخه برای ایستگاه در شکل 6 ، خرید و خدمات است. از آنجایی که داده های تلفن همراه در یک منطقه زمانی ساخته شده اند، این روش ساخت مقدار زیادی از داده های واقعی زمینی را امکان پذیر می کند.
3.4. آموزش برای یادگیری ماشین
هنگامی که داده های ترافیک ایجاد می شوند، سه نوع روش برای استفاده از داده ها برای استنتاج هدف سفر وجود دارد، یعنی روش های مبتنی بر قانون، آماری و یادگیری ماشین و شبکه های عصبی [ 14 ، 15 ].]. روشهای مبتنی بر قانون بهطور سنتی به کار گرفته میشوند، با قوانین مورد استفاده نماینده، جداول تطبیق کاربری و هدف، و نزدیکترین تطابق با POI. روش های آماری برای محاسبه احتمال هر هدف سفر با ادغام اطلاعات شخصی یا اطلاعات مکان پاسخ دهنده با استفاده از یک مدل لاجیت چند جمله ای یا محاسبه احتمال مبتنی بر فاصله استفاده می شود. روشهای یادگیری ماشین و شبکه عصبی برای مقادیر بیشتر داده مناسبتر هستند و برای ساخت مدلهای طبقهبندی و تشخیص الگوی پیچیده و محاسباتی استفاده میشوند. مطالعات اخیر تمایل به استفاده از روش های آماری یا یادگیری ماشینی (و شبکه عصبی) دارند [ 14 ].
استنتاج هدف سفر در این مطالعه از یک مدل یادگیری ماشینی استفاده کرد که ساخت یک مدل پیچیدهتر را در مقایسه با استفاده از روشهای مبتنی بر قانون یا آماری امکانپذیر کرد. این به این دلیل است که امکان یادگیری نظارت شده از طریق ساخت داده های حقیقت زمینی از داده های فراوان تری نسبت به بررسی های سفر استفاده می کند. با توجه به نیاز به یک مدل طبقهبندی برای کلاسهای چندگانه با هدف سفرهای عمومی دوچرخهسواری، ما یادگیری را با استفاده از مدلهای درخت تصمیم و جنگل تصادفی پیادهسازی کردیم، که نشان داده شده است عملکرد نسبتاً خوبی دارند [ 14 ، 16 ، 20 ، 43 ، 44 , 45 , 46 ].
الگوریتمهای درخت تصمیم برای یادگیری نظارت شده به عنوان ابزار تحلیلی برای طبقهبندی دادهها در گروههای مختلف و پیشبینی از طریق قوانین تصمیمگیری که در یک ساختار درختی نمایش داده میشوند، مفید هستند. کلید آموزش درختان تصمیم گیری یادگیری به روشی است که ناخالصی طبقه بندی را به حداقل برساند که با استفاده از شاخص هایی مانند شاخص جینی و آنتروپی اندازه گیری می شود. مزیت الگوریتم های درخت تصمیم توانایی آنها در تفسیر نتایج آنهاست. معیارهای تقسیم بندی درخت تصمیم تولید شده نشان می دهد که کدام ویژگی ها به عنوان معیارهای طبقه بندی استفاده می شوند و مقادیر معیار چه هستند.
جنگل تصادفی یک روش مجموعه ای است که پیش بینی ها را با استفاده از مدل های درخت تصمیم چندگانه جمع می کند. دادههای آموزشی متعددی برای ساخت درختهای تصمیم فردی برای هر مجموعه داده و انتخاب تصادفی متغیرها برای ساخت یک مدل درخت تصمیم تولید میشوند. جنگل تصادفی این مزیت را دارد که ساخت سریع یک مدل را امکانپذیر میکند، و حتی زمانی که اندازه دادههای مدل پایه بزرگ است، میتوان یک مدل درخت تصمیم گسترده بدون نیاز به توزیع داده ساخت. بر این اساس، جنگل تصادفی اطلاعاتی در مورد اهمیت متغیرهای فردی ارائه نمی دهد، مانند مدل های رگرسیون خطی یا لجستیک، اما به طور غیرمستقیم اهمیت متغیرها را تعیین می کند، به عنوان مثال، از طریق تخمین های خارج از کیسه [ 47 ].
نتایج آموزش توسط یادگیری ماشین با استفاده از ماتریس سردرگمی در جدول 4 ارزیابی شده است. برای ارزیابی عملکرد مدل از دو معیار ارزیابی، یعنی دقت و امتیاز F 1 بر اساس معادلات (9) و (10) استفاده شد. دقت می تواند به طور مستقیم عملکرد مدل را نشان دهد، در حالی که امتیاز F 1 یک معیار عملکرد مفید است زمانی که طبقه بندی داده ها نامتعادل است.
4. آزمایش ها و نتایج
4.1. داده ها
منطقه آزمایشی در Seocho-gu واقع در سمت جنوبی رودخانه هان که از مرکز سئول، جمهوری کره می گذرد، قرار دارد. Seocho-gu دارای یک سیستم حمل و نقل مناسب است و یک منطقه تجاری نماینده در سئول، همراه با Gangnam-gu است. منطقه آزمایشی خاص، یک منطقه مسکونی به خوبی توسعه یافته است که در مجاورت محیط های طبیعی، مانند رودخانه هان و جنگل شهروند یانگجائه، در مقایسه با سایر مناطق دولتی محلی در سئول، میزان استفاده بالایی از دوچرخه های عمومی را به همراه دارد. دوره آزمایش 1 تا 30 ژوئن 2019 بود. تعداد کل ایستگاه های دوچرخه در Seocho-gu 87 بود.
دادههای اشتراک دوچرخه مورد استفاده شامل دادههای عمومی در دسترس از پلازای باز دادههای سئول ( https://data.seoul.go.kr ، در 4 مارس 2021) بود. داده ها شامل تعداد دوچرخه، تاریخ و زمان اجاره، شماره محل اجاره، نام مکان اجاره، تعداد اسکله های اجاره، تاریخ و زمان بازگشت، شماره محل بازگشت، نام مکان بازگشت، تعداد اسکله های بازگشت، زمان استفاده و مسافت طی شده بود. . به طور کلی، 132788 واحد مبنا وجود داشت.
دادههای POI مورد استفاده از نقشههای تجاری که در حال حاضر در بازار کره برای CNS استفاده میشوند، بهدست آمدند. داده ها برای بررسی کاربری زمین در اطراف ایستگاه های دوچرخه استفاده شد. در مجموع، 19358 واحد داده POI برای Seocho-gu استفاده شد. انواع POI اصلی در دادهها برای تناسب با هدف این مطالعه، یعنی استنتاج هدف سفر با دوچرخه، اصلاح شدند. انواع POI اصلاح شده در جدول 5 ارائه شده است. POI در 250 متری ایستگاه دوچرخه برای تعیین کاربری زمین انتخاب شدند، به استثنای موارد اوقات فراغت دوچرخه، که شعاع 1000 متر برای آن استفاده شد.
دادههای تلفن همراه مورد استفاده برای تولید دادههای حقیقت پایه نیز دادههای عمومی بهدستآمده از سئول Open Data Plaza ( https://data.seoul.go.kr ، در 4 مارس 2021) بود. برای این منظور، تعداد افراد در یک واحد فضایی خاص در یک زمان خاص در یک روز مشخص بر اساس سیگنالهای تلفن همراه KT که از 6000 ایستگاه پایه در سراسر سئول گرفته شده بود، برآورد شد. این روش برای شناسایی جمعیت شناور مفید است، نه جمعیت مسکونی، زیرا جمعیت منطقه خروجی که کوچکترین واحد آماری است، با منطقه زمانی مطابقت دارد.
4.2. استفاده از زمین در ایستگاه های دوچرخه توسط جاسازی نوع POI
انواع POI مرتبط با هشت هدف سفر با دوچرخه بر اساس کار یان و همکاران تعبیه شده است. [ 24 ] از طریق کاربرد مفاهیم محبوبیت و فاصله. در پیکربندی تاپلهای POI، مقدار k نزدیکترین تابع k روی 10 تنظیم شد، که منجر به ایجاد گروههایی از 10 نزدیکترین نقطه نقطه به ازای هر POI شد. تاپل ها با استفاده از پارامتر افزوده شدند βجoمتربمنnهدلjارائه شده توسط یان و همکاران. [ 24 ]، و محبوبیت یک POI بر اساس تعداد دوچرخه های اجاره ای در ایستگاهی که POI به آن تعلق دارد محاسبه شد. تعداد نهایی تاپل های POI به دست آمده با افزایش داده ها 323184 بود. آزمایشهای جاسازی نوع POI در پایتون 3.7.7 و TensorFlow 2.0.0 انجام شد. تعداد ابعاد تعبیه شده روی 70 و تعداد تکرارها 20000 تنظیم شد. مقادیر جاسازی بر اساس نوع POI محاسبه شده از طریق آموزش در جدول 6 ارائه شده است.
مقادیر تعبیهشده نوع POI محاسبهشده برای هر ایستگاه دوچرخه جمعآوری شد و تجزیه و تحلیل خوشهبندی k-means سپس انجام شد. از آنجایی که از خوشه بندی k-means برای تعیین مرکز خوشه برای به حداقل رساندن مجموع مربعات خطا (SSE) استفاده می شود، مقدار بهینه Cluster k با استفاده از تکنیک elbow با بررسی SSE تعیین می شود. در آزمایش های حاضر، SSE در حداقل مقدار برای k = 4 بود، همانطور که در شکل 7 نشان داده شده است.
نتایج نهایی خوشه بندی در شکل 8 نشان داده شده است. برای تجسم عناصر جغرافیایی منطقه آزمایشی، یک لایه ارائه شده توسط OpenStreetMap ( https://www.openstreetmap.org ، دسترسی به 4 مارس 2021) به عنوان نقشه پس زمینه استفاده شد. یک تجزیه و تحلیل نوع POI ساده از نتایج خوشهای انجام شد. مشخص شد که خوشه 1 مرکز کار، حمل و نقل و خرید است، در حالی که خوشه 2 منطقه ای با مقدار نسبتاً بالایی از امکانات تفریحی مرتبط با دوچرخه مانند جنگل های مجاور، زمین های بازی و پارک ها بود. مشاهده شد که خوشه 3 یک منطقه مسکونی است که در آن مدارس و آکادمی ها غالب بودند، و خوشه 4 منطقه ای با POI های کم و نسبتاً ناچیز مشاهده شد.
برای تأیید توزیع POI در خوشه های مهم، مناطق A و B در شکل 8 بزرگنمایی شده و در شکل 9 نشان داده شده است.. از آنجا که منطقه A با خوشه های 1، 2 و 3 متراکم است، ویژگی ها را می توان برای هر خوشه مقایسه کرد. خوشه 1 (که با رنگ قرمز مشخص شده است) مرکز کار، حمل و نقل و خرید است، با POI های مختلف در امتداد جاده متمرکز شده است. خوشه 2 (که با رنگ نارنجی مشخص شده است) دارای POIهای نسبتاً کمتری است اما بسیار تحت تأثیر POIهای مربوط به اوقات فراغت دوچرخه مانند پارک ها و زمین های بازی است. POI های اوقات فراغت دوچرخه به گونه ای طراحی شده اند که بردی معادل 1000 متر از مرکز یک ایستگاه دوچرخه داشته باشند. بنابراین، POIهای خارج از محدوده بافر نیز در محدوده این خوشه قرار دارند. در نتیجه، نه تنها مجموعه ورزشی Banpo در خوشه 2، بلکه پارک Puleun و پارک کودکان Seorae نیز در محدوده کلاستر 2 قرار دارند. خوشه 3 (که با رنگ زرد مشخص شده است) یک منطقه مسکونی است که در آن POI های مسکونی در پایین شکل مشخص شده اند. منطقه B در دامنه یک کوه قرار دارد و بنابراین دارای POI های نسبتاً کمتری است. خوشه 4 (با رنگ سبز مشخص شده است) ویژگی های سبزه را منعکس می کند و خوشه 2 تحت تأثیر پارک کودکان Wissaem در خارج از محدوده بافر، مشابه منطقه A است. این تأیید می کند که طراحی تعبیه شده از نوع POI ما به خوبی برای سفرهای دوچرخه در هنگام پیکربندی خوشه ها سفارشی شده است.
اگر این روش بر روی نتایج کارهای موجود اعمال شود، نتایج مطالعه را بهبود می بخشد. در این مطالعه فقط اطلاعات نوع در جاسازی POI استفاده می شود. با این حال، اطلاعات مربوط به اندازه یا زمان باز بودن POI نیز می تواند مورد استفاده قرار گیرد [ 48 ]. تأثیر یک POI تفریحی دوچرخه، مانند پارکی که بر ترافیک دوچرخه تأثیر می گذارد، ممکن است بسته به اندازه آن متفاوت باشد. ما از یک بافر 250 متری برای طراحی محدودهای استفاده کردیم که در حال حاضر بر ایستگاههای دوچرخه تأثیر میگذارد – اگر از فاصله شبکه استفاده شود یا یک منطقه خدماتی اعمال شود، این نتایج واقعیتر تعبیهسازی را ارائه میدهد [ 24 ]. اگر از دادههای اضافی برای اعتبارسنجی نتایج خوشهبندی فعلی استفاده شود، میتوان نتایج را آسانتر تفسیر کرد. ژای و همکاران [ 25] مناطق عملکردی شهری را با استفاده از جاسازی POI استخراج کرد و نتایج استخراج را با استفاده از دادههای OD کامیون برای تفسیر نتایج خوشهبندی شده تأیید کرد.
4.3. نتایج استنتاج هدف سفر با دوچرخه عمومی
مجموعه داده نهایی شامل ویژگی های مربوط به هدف سفر با دوچرخه است که از داده های اشتراک دوچرخه و ویژگی های کاربری زمین محاسبه شده با تعبیه نوع POI به دست آمده است. همانطور که در جدول 7 نشان داده شده است، در مجموع هشت ویژگی وجود دارد. داده های حقیقت زمینی با استفاده از مقادیر هدف سفر محاسبه شده از داده های تلفن همراه و داده های POI به دست آمد. در میان ویژگیها، مقادیر کاربری زمین مبدا و مقصد سفر که با تعبیه نوع POI محاسبه میشود، همانطور که در بخش قبل مورد بحث قرار گرفت، برای مقادیر خوشهبندی بهدستآمده اعمال شد. پس از آن، به دلیل ماهیت طبقهبندی دادهها، رمزگذاری تک داغ انجام شد. از 132788 واحد داده اشتراک دوچرخه استفاده شده برای Seocho-gu، سئول، برای ماه ژوئن 2019، واحدهای مربوط به 1 تا 20 ژوئن به عنوان داده های آموزشی طبقه بندی شدند، و واحدهای مربوط به 21-30 ژوئن به عنوان داده های آزمایشی برای آزمایش طبقه بندی شدند.
الگوریتم درخت تصمیم و جنگل تصادفی برای استنتاج سفر با دوچرخه استفاده شد. ما اعتبارسنجی متقابل k-fold را انجام دادیم، که در آن دادهها به طور مکرر برای آموزش مدلهای متعدد و اندازهگیری عملکرد تعمیم تقسیم شدند. درخت تصمیم و جنگل تصادفی نیاز به تنظیم فراپارامتر برای متغیرهای بحرانی دارند و برای انتخاب فراپارامترهای بهینه با عملکرد پیشبینی بالا با استفاده از ماژول GridSearchCV Python از Scikit-learn استفاده شدند.
نتایج تجربی نشان داد که عملکرد بهینه (معیار دقت) اندازهگیری شده توسط یادگیری ماشین 78.95 درصد برای درخت تصمیم و 74.08 درصد برای جنگل تصادفی بود. مدل درخت تصمیم نیز عملکرد بهتری از نظر امتیاز F1 نشان داد، یعنی 66.43٪ همانطور که توسط ماتریس سردرگمی تعیین می شود. نتایج تجربی برای سفرهای مختلف با دوچرخه در جدول 8 ارائه شده است، که از آن می توان پیش بینی دقیقی به خصوص برای خرید و خدمات، کار و ترانزیت مشاهده کرد. هدف آموزشی برای یک سفر با دوچرخه نسبتا کمتر قابل پیش بینی است، که به تعداد نسبتاً زیادی از POIهای خرید و خدمات در Seocho-gu نسبت داده می شود. علاوه بر این، ویژگیهای POI برای خرید و خدمات با ویژگیهای انواع مختلف POI دیگر ترکیب میشوند، زیرا POIهای خرید و خدمات به تنهایی قرار ندارند و به طور مشابه بر سایر اهداف سفر تأثیر میگذارند. این مشکل را می توان با تفکیک طبقه بندی انواع POI حل کرد.
علاوه بر این، برای بهبود دقت کلی، استفاده از الگوریتم های یادگیری عمیق ممکن است یک جایگزین باشد، که در آن ویژگی های کاربر دوچرخه (به عنوان مثال، جنسیت، سن) می تواند به عنوان ویژگی اضافه شود. در میان مطالعات مربوط به استنتاج هدف سفر، مطالعات با استفاده از یادگیری عمیق دقت بالاتری را نشان دادهاند [ 13 ، 29 ]. از آنجایی که یادگیری عمیق برای داده های بزرگ به خوبی کار می کند، لازم است با افزایش دامنه مکانی و زمانی مطالعه، و همچنین ویژگی هایی که بر هدف سفر تأثیر می گذارد، داده ها ساخته شوند. علاوه بر این، کل مجموعه دادهها باید با ترکیب دادههای مختلف تولید شده توسط کاربر، مانند دادههای بررسی که توسط کاربران واقعی دوچرخه ساخته شدهاند، ساخته شوند.
5. بحث و نتیجه گیری
این مقاله روشی را برای استنباط هدف سفرهای دوچرخه از دادههای تاریخی دوچرخههای مشترک پیشنهاد میکند. بررسیهای اشتراک دوچرخه، نگاه دقیقتری به تحرک شهری، بهویژه اولین و آخرین مایل حملونقل عمومی را تسهیل میکند. بنابراین، تصمیم گیری در مورد مسائل مختلف شهری را می توان با استنباط هدف از سفرهای با دوچرخه پشتیبانی کرد. یک عامل اساسی در استنتاج هدف سفر، استفاده از زمین مقاصد است [ 18 ، 19 ، 20 ]]. بر اساس این واقعیت، این مطالعه مشکل کاربری ترکیبی شهری را با استفاده از فناوری تعبیه POI حل کرد. تاریخ سفر با دوچرخه، زمان حرکت، زمان رسیدن، زمان کل، مسافت کل سفر و فاصله بین ایستگاهها به عنوان ویژگیهای مرتبط از دادههای اشتراک دوچرخه استفاده شد. از دادههای POI برای استخراج کاربریهای زمین در مبدا و مقصد استفاده شد که به طور قابلتوجهی هدف سفر را منعکس میکند. POI در شعاع 250 متری از ایستگاه های دوچرخه (1000 متر برای POI های مربوط به اوقات فراغت دوچرخه) برای استخراج کاربری زمین از طریق تعبیه نوع POI، روشی که توسط Yan et al. [ 24]، با انواع POI که برای علاقه فعلی به سفرهای دوچرخهسواری دوباره تعریف شدهاند. فاصله جغرافیایی POI و تعداد دوچرخههای اجارهای در هر ایستگاه بهعنوان فاکتورهای افزایش چندگانه برای تعبیه نوع POI در نظر گرفته شد. با این حال، اگر صدها POI برای هر ایستگاه دوچرخه وجود داشته باشد، اطلاعات نوع POI به تنهایی نمیتواند اولویتهای دوچرخهسوار را برای بازدید از منطقه نشان دهد. بنابراین، تعداد دوچرخه های اجاره ای در هر ایستگاه برای به دست آوردن اطلاعات محبوبیت برای هر POI توزیع شد. ما همچنین روشی را برای استفاده از دادههای تلفن همراه موقت و دادههای POI برای استخراج دادههای حقیقت زمین برای اهداف سفر با دوچرخه ایجاد کردیم.
آزمایشات این مطالعه 87 ایستگاه دوچرخه را در Seocho-gu، سئول در نظر گرفت. دوره مطالعه 1 تا 31 ژوئن 2019 بود، و در مجموع، 132788 واحد داده عمومی اشتراک دوچرخه مورد استفاده قرار گرفت. درخت تصمیم و جنگل تصادفی برای یادگیری ماشین برای استنتاج هدف سفر با دوچرخه، با پارامترهای فراپارامتر برای عملکرد بهینه تنظیم شدند. کاربری های زمین در ایستگاه های دوچرخه استنباط شده توسط تعبیه نوع POI به چهار خوشه تقسیم شدند که درخت تصمیم عملکرد بهتری داشت و دقت 78.95٪ و امتیاز F1 66.43٪ داشت.
نتایج حاصل از تعبیه نوع POI نسبتاً به خوبی استفاده از زمین مبدا و مقصد را برای سفرهای دوچرخهسواری پیشنهاد شده در این مطالعه نشان داد. یک ایستگاه دوچرخه به طور متوسط شامل 70 تا 100 POI در یک منطقه حائل 250 متری است. با این حال، خوشه های مربوط به این کاربری های مخلوط به خوبی در این مطالعه طبقه بندی شدند. به طور خاص، در مورد POI اوقات فراغت دوچرخه، که بر سفرهای دوچرخهسواری تأثیر میگذارد، محدوده تأثیر از مرکز ایستگاه دوچرخه تا 1000 متر تنظیم شد و نتایج خوشهای ( شکل 9 ) نشان داد که جزئیات به خوبی منعکس شدهاند. علاوه بر این، نتایج استنتاج هدف سفر بهدستآمده از طریق یادگیری ماشین نشان داد که پیشبینیهای نسبتاً دقیقی برای هر هشت هدف ترافیکی انجام میشود. جدول 8). در مطالعات قبلی مربوط به استنتاج هدف سفر، دقت 60 تا 90 درصد تنها از طریق استفاده از دادههای نظرسنجی به دست آمد. این مطالعه به عنوان اولین گام به سمت استفاده از یادگیری ماشین بر روی دادههای مکانی – نه دادههای نظرسنجی – برای استنتاج هدف سفر اهمیت دارد.
نتایج این مطالعه نه تنها برای دوچرخهها بلکه برای افزایش اخیر در استنباط هدف سفرهای حرکتی شخصی نیز میتواند مفید باشد. تکنیک جاسازی POI ویژه دوچرخه پیشنهاد شده در این مطالعه را می توان با توجه به تحرک مربوطه سفارشی کرد و برای استنتاج هدف سفر آن استفاده کرد. این مطالعه منبع خوبی برای تصمیمگیری در مورد مسائل شهری برای سیاستگذاران ارائه میدهد، و ابزاری را برای استنتاج هدف سفر با دوچرخه با استفاده از دادههای اشتراک دوچرخه و دادههای POI در دسترس عموم ارائه میدهد. استنباط اهداف سفر با استفاده از روش شناسی پیشنهادی در این مطالعه و تحلیل الگوهای آن به درک بهتر علل حرکت شخصی در داخل شهرها منجر می شود.
این مطالعه با کارهای مربوط به استنباط هدف سفر با استفاده از دادههای نظرسنجی متفاوت است، زیرا بر کسب دانش عمومی در مورد تحرک دوچرخه و مکان فعالیتها با استفاده از فرآیندهای تقویتکننده معنا که منعکسکننده دنیای واقعی هستند به جای بهبود دقت استنتاج از یک ترافیک تمرکز میکند. -دیدگاه مهندسی برای افزایش معنایی دادههای اشتراکگذاری دوچرخه، استفاده از زمین در مبدا و مقصد با استفاده از فناوری جاسازی POI استخراج شد. علاوه بر این، این مطالعه روش پیشنهادی را با تولید دادههای حقیقت زمینی با استفاده از دادههای تلفن همراه و دادههای POI برای استنباط هدف سفر با دوچرخه در سطح عقل سلیم ارزیابی کرد.
با این حال، این مطالعه دارای محدودیت است که روش پیشنهادی برای تولید داده های حقیقت زمینی از داده های انباشته استفاده می کند و نه داده ها در سطح تفکیک شده. با این وجود، این نشان دهنده دشواری بررسی سفر از افراد از دیدگاه واقع بینانه است. ما معتقدیم که نتایج این مطالعه از نظر جغرافیای انسانی معنادار است، که هدف آن غنی سازی معنایی و کشف الگوهای عمومی تحرک به جای تمرکز بر دقت در سطوح فردی است. علاوه بر این، یک مشکل وجود دارد که ویژگیهای فردی کاربران دوچرخه را نمیتوان در هنگام انتخاب ویژگیها برای استنتاج هدف سفر در نظر گرفت. زیرا سطح دادههای ارائهشده فقط اطلاعات مربوط به مبدا و نه کل دادههای OD را برای محافظت از حریم خصوصی کاربران ارائه میکند.
از منظر روش شناختی، ما نوع POI را به هشت در طول جاسازی POI محدود کردیم و فقط از اطلاعات نوع برای تقویت داده ها استفاده کردیم. این محدودیت را می توان با تقسیم بندی نوع POI و طراحی مجدد الگوریتم برای افزایش داده ها با استفاده از اطلاعات مختلف مانند اندازه یا زمان باز بودن POI در طول جاسازی POI برطرف کرد. علاوه بر این، نتایج را می توان با همگرایی داده های مختلف مانند رسانه های اجتماعی و داده های تلفن همراه برای تقویت معنای خوشه استخراج شده تأیید کرد. الگوریتم های یادگیری عمیق که ثابت شده است نتایج استنتاج نسبتا خوبی را ارائه می دهند می توانند برای بهبود دقت استنتاج هدف سفر مورد استفاده قرار گیرند. از آنجایی که یادگیری عمیق تنها برای مجموعه داده های بزرگ نتایج خوبی به همراه دارد، محدوده مکانی و زمانی سایت های آزمایشی باید بهبود یابد.
بدون دیدگاه