1. مقدمه
تلفنهای همراه و حتی بیشتر، تلفنهای هوشمند، اکنون بخشهای اساسی زندگی ما هستند، آنها عملاً، همیشه با ما هستند، هر کجا که میرویم، تقریباً انگار بخشی از بدن ما هستند. ارتباط مداوم بین یک دستگاه و شبکه های تلفن همراه، ردپایی را در سیستم اپراتور از عادت های حرکتی ما به جا می گذارد. از طریق این دستگاهها، شبکه تلفن همراه میتواند حرکات ما را «احساس» کند، که اساس مفهوم «شهر هوشمند» [ 1 ] است. تعداد فزایندهای از آثار علمی منتشر شده در دو دهه اخیر، پتانسیل توصیف حرکت انسان را با استفاده از Call Detail Records (CDR) نشان میدهد [ 2 ، 3 ، 4 ، 5 ، 6 .] – در میان سایر زمینه ها – در اپیدمیولوژی، جامعه شناسی و برنامه ریزی شهری.
تجزیه و تحلیل تحرک انسانی می تواند بر روی افراد یا گروه ها کار کند. گروه بندی با هر یک از ویژگی های افراد امکان پذیر است. به عنوان مثال، با استفاده از مکانهای (تخمینی) خانه، الگوهای حرکتی افرادی که در همان منطقه زندگی میکنند را میتوان با ساکنان یک منطقه دیگر مقایسه کرد. سپس با استفاده از منبع داده های خارجی مانند قیمت املاک مناطق شهر، می توان به گروه بندی بر اساس وضعیت مالی افراد دست یافت، با این فرض که قیمت دارایی منزل شخصی می تواند وضعیت مالی آنها را به درستی توصیف کند. در این مقاله، دادههای قیمت املاک با دادههای CDR ترکیب میشوند تا تأثیر وضعیت مالی بر گمرکات تحرک را ارزیابی کنند.
تجزیه و تحلیل الگوهای حرکت انسان بر اساس دادههای CDR، که امکان بررسی جمعیت بسیار بزرگ را به صورت مقرونبهصرفه ممکن میسازد، منجر به تعدادی اکتشاف در مورد پویایی انسان شد. این آثار معمولاً جمعیت را به عنوان یک گروه همگن در نظر می گیرند و طبقه بندی بر اساس برخی از شاخص های تحرک [ 6 ] است. به منظور گسترش بررسی به سایر ویژگی های جمعیت، گام بعدی افزودن منابع داده خارجی به داده های شبکه تلفن همراه بود. اغلب، این منبع خارجی برای طبقه بندی داده ها (به عنوان مثال، بر اساس جنسیت) و برای تجزیه و تحلیل طبقات، با استفاده از شاخص های تحرک معرفی شده قبلی استفاده می شود. از جمله: داده های شبکه اجتماعی [ 7 ]، داده های حمل و نقل [ 8 ]، سفرهای تاکسی [ 9 ]]، شاخص های اجتماعی-اقتصادی (درآمد سرانه، نرخ تحصیلات، نرخ بیکاری و شاخص محرومیت) [ 10 ]، قیمت فروش املاک مسکونی [ 11 ]. بله، این کار نیز با استفاده از قیمت فروش املاک، با روندها مطابقت دارد.
در این مقاله به بررسی روابط بین شاخصهای تلفن همراه و معیارهای وضعیت اجتماعی-اقتصادی بر اساس قیمت مسکن میپردازیم. در انجام این کار، ما تجزیه و تحلیل آماری را بر روی شاخص های تحرک به دست آمده از مجموعه داده های CDR و اطلاعات قیمت املاک در بوداپست انجام می دهیم. با فرض اینکه قیمت مسکن در سطح معینی وضعیت اجتماعی-اقتصادی را مشخص می کند، در حال بررسی رابطه بین قیمت بازار املاک در محله ای که ساکنان در آن زندگی می کنند یا کار می کنند و شاخص های تحرک را بررسی می کنیم. فرضیه ما این است که شاخصهای تلفن همراه انواع مختلفی از تغییرات مکانی را برای مجموعههای مختلف قیمت مسکن نشان میدهند و بنابراین الگوها و همبستگیهای پنهان را میتوان آشکار کرد.
این مقاله به شرح زیر سازماندهی شده است: بخش 2 خلاصه ای از ادبیات مربوطه را ارائه می دهد. بخش 3 داده های مورد استفاده در این مطالعه را تشریح می کند. بخش 4 ، روش مورد استفاده و شاخص ها و معیارهای تولید شده را شرح می دهد. شاخص های تحرک به دست آمده از مجموعه داده های ثبت شده توسط اپراتور تلفن همراه با مقایسه با گزارش های سرشماری کوچک ملی ( بخش 5 ) اعتبارسنجی شده است. سپس، نتایج تجزیه و تحلیل آماری در بخش 7 مورد بحث قرار گرفته است . خلاصه یافته ها در بخش 8 آورده شده است.
2. بررسی ادبیات
درک حرکات انسان و شناخت الگوهای رفتاری که در طول زندگی روزمره، در مناطق شهری رخ میدهد، مستلزم تحلیل سیستماتیک آن تحرک انسان است. ارزیابی سفر انسان بر اساس مشاهدات در سطوح فردی و گروهی است. در دهههای گذشته، چندین مجموعه داده جدید، بر اساس سوابق GPS خودرو و شبکه تلفن همراه یا اطلاعات رسانههای اجتماعی، در دسترس قرار گرفتند که توصیف دقیقتر و پیچیدهتری از حرکات افراد ارائه میکردند. گونزالس و همکاران از مجموعه داده ای استفاده کرد که شامل 100000 پرونده تلفن همراه کاربر بود که به مدت نیم سال به دست آمد و نشان داد که ساکنان معمولاً از برخی مکان های پر رفت و آمد بازدید می کنند [ 2 ]]. سونگ و همکاران مجموعه داده ای را که نشان دهنده 50000 کاربر تلفن همراه ثبت شده به مدت سه ماه ارزیابی کرد. حرکات انسانی که از اطلاعات سلولی مجموعه داده به دست میآید بسیار قابل پیشبینی است [ 12 ]. شاخصهای عددی (یعنی متریکهای مبتنی بر آنتروپی، شعاع چرخش) برای تعیین کمیت توزیع زمانی مکانی افراد و حرکات آنها محاسبه شدهاند. پریجا و همکاران [ 13] الگوریتم صفحهبندی مبتنی بر نمایه را بر روی CDRها به منظور کشف الگوهای تحرک شخصی انسان اعمال کرد. نتایج نشان میدهد که الگوریتم پیشنهادی سه برابر کارآمدتر از صفحهبندی معمولی و دو برابر مؤثرتر از سایر الگوریتمهای صفحهبندی هوشمند دیگر است. این تحقیقات ویژگیهای پنهان حرکات فردی را نشان داد و برای تلاشهای علمی بیشتر رونق محسوسی ایجاد کرد.
به نظر می رسد معیارهای جمعیت شناختی و وضعیت اجتماعی-اقتصادی (SES) رابطه معناداری با رفتار سفر فردی دارند. مطالعات اولیه با هدف بررسی همبستگی ویژگی های سفر انسان و SES [ 14 ، 15 ] انجام شد. Cottineau و Vanhoof [ 16 ] مدلی را برای بررسی رابطه بین داده های تلفن همراه و اطلاعات اجتماعی-اقتصادی سنتی از سرشماری ملی در شهرهای فرانسه ایجاد کردند. شاخص های تلفن همراه از شش ماه سوابق جزئیات تماس تخمین زده می شود، در حالی که داده های سرشماری و اداری برای توصیف سازمان اجتماعی-اقتصادی شهرهای فرانسه استفاده می شود. یافتهها نشان میدهد که برخی از شاخصهای تلفن همراه با سازمانهای اقتصادی-اجتماعی مختلف شهرها ارتباط معناداری دارد. پخریال و همکاران [17 ] از یک چارچوب محاسباتی برای پیش بینی دقیق شاخص جهانی فقر چند بعدی (MPI) در سنگال بر اساس داده های محیطی و CDR استفاده کرد. این روش پیش بینی دقیق ابعاد مهم فقر را فراهم می کند: بهداشت، آموزش، و استاندارد زندگی (برآوردها با استفاده از محرومیت های محاسبه شده از سرشماری تایید شده اند).
در دهه گذشته، CDR ها به یک منبع اطلاعاتی استاندارد برای تجزیه و تحلیل ویژگی های اجتماعی تحرک انسان تبدیل شده اند. یک کار تحقیقاتی [ 18 ] که فعالیت های روزانه مردم را در شنژن، چین بررسی کرد. نتایج بهاصطلاح تفاوتهای «شمال-جنوب» در فعالیتهای انسانی را شناسایی کرد که یافتهها با شکاف اجتماعی-اقتصادی در شهر مطابقت دارد.
برخی از تحقیقات نشان می دهد که داده های تلفن همراه را می توان برای پیش بینی SES فردی [ 19 ] یا ویژگی های اجتماعی-اقتصادی منطقه ای [ 20 ] استفاده کرد. خو و همکاران [ 11] از یک چارچوب تحلیلی در مقیاس بزرگ تلفن همراه و مجموعه داده های اجتماعی-اقتصادی شهری برای ارزیابی الگوهای تحرک و SES استفاده کرد. شش شاخص تحرک، قیمت مسکن و درآمد سرانه در سنگاپور و بوستون برای تجزیه و تحلیل طبقات اجتماعی-اقتصادی استفاده شده است. مشخص شد که کاربران تلفن که عموماً ثروتمندتر هستند، در سنگاپور مسافت های کوتاه تری را طی می کنند، اما در بوستون طولانی تر. این تحقیق یافتههای جالبی را به ارمغان آورد، اما همچنین نشان داد که رابطه بین تحرک و وضعیت اجتماعی-اقتصادی ارزش بررسی در سایر شهرها و کشورها نیز دارد.
کاستیو و همکاران شاخص توسعه انسانی را برای دادههای محلی موجود برای اکوادور برای توصیف وضعیت اجتماعی-اقتصادی محاسبه کرد و در مقایسه با رویکرد مبتنی بر تلفن همراه آنها استفاده کرد [ 21 ]. باربودا و همکاران تفاوت های قابل توجهی در میانگین مسافت سفر بین گروه های کم درآمد و پردرآمد در برزیل پیدا کرد [ 22 ]. این مطالعه با این روند مطابقت دارد و بر پایتخت اروپای مرکزی، بوداپست تمرکز دارد.
اپیدمیولوژی به عنوان یک کاربرد بالقوه از مطالعات تحرک انسانی، با برخی کاربردها مانند [ 23 ] استفاده می شود، اما همه گیر COVID-19 ارتباط بین تجزیه و تحلیل تحرک مبتنی بر تلفن همراه و اپیدمیولوژی را در اولویت قرار داد. اصطلاح “اپیدمیولوژی دیجیتال” را می توان در هنگام کار با داده هایی استفاده کرد که با هدف اولیه مطالعات اپیدمیولوژیک تولید نشده اند [ 24 ].
ویلبرگ و همکاران کاهش قابل توجهی از حضور جمعیت در بزرگترین شهرهای فنلاند پس از قرنطینه در مقایسه با یک هفته معمولی شناسایی کرد [ 25 ]. بوشمن و همکاران انطباق با فاصله گذاری اجتماعی در ایالات متحده را با استفاده از داده های تلفن همراه تجزیه و تحلیل کرد [ 26 ]. گائو و همکاران همبستگی منفی در فاصله گذاری در خانه و میزان افزایش COVID-19 یافت شد [ 27 ]. WD Lee و همکاران تأثیر SES بر تغییرات تحرک در طول قرنطینه را بررسی کرد و دریافت که تحرک مشترکان ثروتمندتر به طور قابل توجهی در انگلستان کاهش یافته است [ 28 ].
دادههایی که در این مطالعه استفاده شد، مربوط به همهگیری COVID-19 است و صرفاً بر زندگی عادی بوداپست تمرکز دارد و تأثیر وضعیت مالی را بر آداب و رسوم حملونقل ارزیابی میکند.
3. کاوش در داده ها
مجموعه داده های مورد استفاده در این مطالعه توسط Vodafone مجارستان ارائه شده است. داده های CDR از بوداپست، پایتخت مجارستان و شهرستان اطراف جمع آوری شد. Vodafone مجارستان یکی از سه اپراتور تلفن همراه ارائه دهنده خدمات در مجارستان است. سهم بازار سه اپراتور بزرگ در مجارستان در چند سال گذشته تغییر قابل توجهی نداشته است. Vodafone مجارستان در سه ماهه دوم سال 2017 در سراسر کشور 25.5% داشت [ 29 ].
ارتباط بین یک دستگاه تلفن همراه و شبکه تلفن همراه را می توان به دو دسته تقسیم کرد: (i) یک ارتباط اداری که ارتباط با سرویس را حفظ می کند، برای مثال، ثبت سوئیچینگ سلولی که می توان آن را ارتباط غیرفعال نامید. (ii) هنگامی که دستگاه بطور فعال از شبکه برای تماس های صوتی، پیام یا انتقال داده استفاده می کند، می توان آن را ارتباط فعال نامید. داده های موجود فقط شامل ارتباط فعال است که پراکنده تر است، بنابراین نمی توان از آن برای ردیابی حرکات مداوم استفاده کرد.
دادههای خام CDR حاوی نوعی برچسب هش برای شناسایی سیمکارت (ماژول هویت مشترک)، یک مهر زمانی است که به 10 ثانیه کوتاه شده است، و یک شناسه سلول، بنابراین، یک مشترک را میتوان به یک مکان جغرافیایی در یک مکان مشخص نگاشت کرد. زمان. این موارد با نوع مشتری (کسب و کار، مصرف کننده)، نوع اشتراک (پیش پرداخت، پس پرداخت)، سن و جنسیت مشترک و کد تخصیص نوع (TAC) دستگاه گسترش می یابد. TAC هشت رقم اول شماره IMEI (شناسه بین المللی تجهیزات موبایل) است که به سازنده و مدل دستگاهی که سیم کارت در آن فعال است اشاره دارد. این مقادیر نیز در هر رکورد وجود دارد، بنابراین به عنوان مثال می توان تغییرات دستگاه را نیز ردیابی کرد.
در مورد سلول ها، جدول جداگانه ای با شناسه سلول، موقعیت جغرافیایی مرکز سلول، مساحت سلول و فاصله بین مرکز و ایستگاه پایه ارائه شد. این مقادیر تخمینی بر اساس یک حالت لحظه ای هستند، به ویژه با سلول های UMTS به دلیل مکانیسم تنفسی آنها، که می تواند اندازه جغرافیایی منطقه خدمات را برای متعادل کردن بار تغییر دهد. سلول های به شدت بارگذاری شده کوچک می شوند و سلول های مجاور برای جبران رشد می کنند [ 30 ].
منطق این قالب “گسترده” ممکن است این باشد که داده های مشترک و دستگاه را می توان در دوره مشاهده تغییر داد. این اتفاق در حدود 3000 بار در طول دوره مشاهده رخ می دهد. صاحب اشتراک می تواند مشخصات آن را تغییر دهد و البته اگر مثلاً یک تلفن همراه جدید خریداری کرده باشد، دستگاه را تغییر دهد. نوع مشترک و مشتری برای هر سیم کارت ارائه شده بود، اما سن و جنسیت در بسیاری از موارد گم شده بود، احتمالاً به دلیل گزینه های حریم خصوصی درخواست شده توسط مشترک.
سوابق نه نوع فعالیت (تماس صوتی، پیام، انتقال داده) و نه جهت (ورودی، خروجی) را شامل نمی شود و هیچ داده ای توسط اپراتور برای حل TAC ها به سازنده و مدل ارائه نشده است.
مجموعه دادههای CDR «آوریل، 2017» شامل فعالیت شبکه تلفن همراه کاربران Vodafone از بوداپست (و مناطق اطراف) در آوریل 2017 است. این شامل 955,035,169 سوابق فعالیت از 1,629,275 سیم کارت است. شکل 1 ، توزیع فعالیت بین دسته های فعالیت سیم کارت ها را نشان می دهد. تنها 17.67 درصد از کل سیم کارت هایی که بیش از 1000 سابقه فعالیت دارند، اکثریت (75.48 درصد) از فعالیت تلفن همراه را در طول دوره مشاهده تامین می کنند. شکل 2، توزیع سیم کارت ها را بر اساس تعداد روزهای فعال نشان می دهد. تنها حدود یک سوم (33.23%) سیم کارت ها حداقل در 21 روز مختلف فعالیت دارند. علیرغم تعداد نسبتاً زیاد سیم کارت ها، که در مجموعه داده ها وجود دارد، اکثر آنها به اندازه کافی فعال نیستند تا اطلاعات کافی در مورد عادت های حرکتی خود ارائه دهند. برای معیارهای دقیق انتخاب، به بخش 4.4 مراجعه کنید .
3.1. داده های قیمت املاک
اطلاعات قیمت املاک توسط وب سایت فروش املاک ingatlan.com ارائه شده است. داده ها شامل کمی بیش از 60 هزار مکان املاک، فضاهای طبقه و قیمت های فروش از تبلیغات است. قیمتها ممکن است ارزش واقعیای نباشند که خریدار پرداخت کرده است، اما حتی اگر چانهزنی نیز وجود داشته باشد، ترتیب بزرگی باید به طور منطقی دقیق باشد.
دادهها مربوط به سال 2018 است، نه مربوط به همان سال دادههای CDR، اما تفاوت قیمتها بین مناطق بوداپست در طول چند سال گذشته تغییر قابلتوجهی نداشته است، بنابراین باید برای توصیف میانگین قیمت املاک یک منطقه کافی باشد. برای این کار قیمت یک متر مربع از زیر بنا و قیمت فروش محاسبه می شود. به این ترتیب سطح قیمت دو ملک مختلف در دو نقطه بسیار متفاوت از شهر قابل مقایسه است.
4. روش شناسی
یک چارچوب محاسباتی برای پردازش داده های CDR، از جمله پیش پردازش با ماژول تمیز کردن و ماژول های اختصاص داده شده به مکان های خانه و محل کار یا محاسبه شاخص های تحرک (مانند شعاع چرخش و آنتروپی) ایجاد شده است. این فرآیند ساده شده را می توان در شکل 3 مشاهده کرد.
4.1. آماده سازی داده ها
از آنجایی که داده های دریافتی فرمت گسترده ای داشتند، قبل از وارد کردن به پایگاه داده نرمال سازی شدند. جدول CDR فقط شامل شناسه سیم کارت، مهر زمانی و شناسه سلول است. جدولی برای ذخیره ویژگی های مربوط به سیم کارت (مانند نوع اشتراک، نوع مشتری، سن، جنسیت) و دیگری برای ذخیره ویژگی های سلول (مرکز سلول و مختصات ایستگاه پایه) معرفی شده است.
نوع مشترک و نوع اشتراک برای همه سیم کارت ها ارائه شده است، در حالی که سن، جنسیت اغلب وجود ندارد. برای گروهی از سیم کارت ها، برخی از این مقادیر در طول مجموعه داده تغییر کرده است. این تغییرات می تواند به درستی واقع بینانه باشد زیرا نوع اشتراک تغییر می کند، مشترک (مالکیت) یا طرح اشتراک تغییر می کند و اغلب این تغییر چیزی شبیه به ناشناخته شدن سن شناخته شده یا بالعکس است. این روی 2000 دستگاه از حدود 1.6 میلیون دستگاه تأثیر می گذارد. در این موارد، ویژگیهای مشترک بدون نامعلوم تنظیم میشدند تا تصمیم بگیرند که کدام مقدار باید استفاده شود.
نقشه برداری سلولی
در بیشتر موارد فقط مختصات ایستگاه های پایه توسط اپراتور ارائه می شود، بنابراین، استفاده از ایستگاه های پایه برای نگاشت سوابق جزئیات تماس به مکان های جغرافیایی و استفاده از ایستگاه های پایه در پردازش CDR معمول است [ 3 ، 5 ، 31 ، 32 ، 33 ]. از تسلاسیون Voronoi برای تخمین مساحت تحت پوشش ایستگاه پایه استفاده کنید.
Vodafone مجارستان نه تنها مختصات ایستگاه پایه، بلکه مرکز سلولی (تخمینی) را برای سلول ها ارائه کرد. با این کار، موقعیت سیمکارتها با دانهبندی دقیقتری نسبت به سیمکارتهایی که فقط مکانهای ایستگاه پایه دارند، مشخص میشود. این به این دلیل است که یک ایستگاه پایه می تواند چندین سلول را سرویس دهد.
سلول های نزدیک در 100 متر با استفاده از الگوریتم DBSCAN بسته Scikit-learn [ 34 ] Python با استفاده از فعالیت سلول به عنوان وزن ادغام می شوند و Tessellation Voronoi برای مرکز سلول های ادغام شده، به طور مشابه در [ 35 ] اعمال می شود. داده های قیمت دارایی (به بخش 3.1 مراجعه کنید ) از طریق این چند ضلعی های voronoi به سلول ها نگاشت می شوند.
4.2. شاخص های تحرک
برخی از شاخصها وجود دارند که به طور گسترده در ادبیات برای توصیف تحرک انسان استفاده میشوند، مانند شعاع چرخش، آنتروپی یا فاصله بین مکانهای خانه و محل کار ( بخش 4.3 ). این شاخص ها برای هر مشترک تعیین می شود.
4.2.1. شعاع چرخش
شعاع چرخش [ 2 ] دایره ای را تعریف می کند که معمولاً می توان یک فرد را در آن یافت. در ابتدا در معادله ( 1 ) تعریف شد، که در آن L مجموعه مکان هایی است که توسط فرد بازدید می شود. rجمترمرکز جرم این مکان ها است، nمنتعداد بازدیدها یا زمان سپری شده در محل i-ام است.
4.2.2. K-شعاع چرخش
شعاع K چرخش فقط با استفاده از k پرتکرارترین مکان های فرد [ 6 ]، که با معادله ( 2 ) تعریف شده است، محاسبه می شود. پاپالاردو و همکاران از این رویکرد برای طبقه بندی افراد بر اساس آداب و رسوم حرکتی آنها استفاده کردند. دو کلاس به نامهای «بازگشتکنندگان» و «کاوشگران» با مقدار چرخش تعریف شدهاند. بازگشت کنندگان کسانی هستند که بیشتر وقت خود را بین k ترین مکان ها می گذرانند ( rg(2)>rg/2بر خلاف کاوشگرانی که منطقه فعالیت آنها را نمی توان با k ترین مکان ها توصیف کرد ( rg(2)<rg/2) [ 11 ].
4.2.3. آنتروپی
آنتروپی مکانهای بازدید شده، تنوع حرکات فرد را مشخص میکند، که به عنوان معادله ( 3 ) تعریف میشود، که در آن L مجموعه مکانهایی است که فرد بازدید میکند، l یک مکان واحد را نشان میدهد.پ(ل)احتمال فعال بودن یک فرد در مکانی l و N تعداد کل فعالیت های یک فرد است [ 16 ، 31 ].
تعمیم آنتروپی عبارت است، تنوع سفر [ 11 ]. به جای تنوع مکان ها، تنوع سفرهای بین مکان های متوالی را تعیین می کند. می توان آن را به انتقال های طول k محاسبه کرد، که در آنک=1آنتروپی مکان را پس می دهد. این امکان وجود دارد که انتقال ها را با جهت یا بدون جهت در نظر بگیریم، مشروط به اینکه تفاوت بین آنها وجود دارد L1→L2و L2→L1مهم است یا نه
4.3. ارزیابی محل کار و منزل
اکثر ساکنان شهرها زمان قابل توجهی از روز را در دو مکان سپری می کنند: خانه و محل کار. برای یافتن رابطه بین این مهم ترین مکان ها و SES، ابتدا باید موقعیت آنها از این مکان ها مشخص شود. چند رویکرد برای یافتن مکان های خانه از طریق تجزیه و تحلیل داده های تلفن همراه استفاده می شود [ 18 ، 36 ، 37 ].
محل کار به عنوان پرتکرارترین سلولی است که دستگاه در ساعات کاری، روزهای کاری در آن حضور دارد. ساعت کاری از 09:00 الی 16:00 در نظر گرفته شده است. مکان خانه به عنوان پرتکرارترین سلولی محاسبه می شود که دستگاه در طول عصر و شب در روزهای کاری (از ساعت 22:00 تا 06:00) و در تمام روز در روزهای تعطیل در آن حضور دارد. اگرچه مردم همیشه آخر هفتهها در خانه نمیمانند، اما فرض بر این است که بیشتر فعالیتها همچنان از محل زندگیشان ایجاد میشود.
بیشتر فعالیت های تلفن همراه در طول روز انجام می شود ( شکل 4 را ببینید ) که با فعالیت های کاری مرتبط است. این ممکن است باعث شود که تعیین مکان خانه برای برخی از دستگاه ها نادرست یا حتی غیرممکن باشد.
این روش فرض می کند که همه در طول روز کار می کنند و عصرها استراحت می کنند. اگرچه در سال 2017، 6.2٪ از افراد شاغل به طور منظم در شب در مجارستان کار می کردند [ 38 ]، نسخه فعلی الگوریتم سعی نمی کند با کارگران شبانه برخورد کند. برخی از آنها ممکن است به عنوان یک کارگر عادی شناسایی شوند، اما محل کار و خانه آنها مخلوط است.
4.4. انتخاب سیم کارت های فعال
همانطور که در بخش 3 نشان داده شد ، اکثر سیم کارت ها فعالیت کافی برای ارائه اطلاعات کافی در مورد گمرک جابجایی مشترکین ندارند. بنابراین، تنها آن سیمکارتها به اندازه کافی فعال در نظر گرفته میشوند، زیرا نشاندهنده فعالیت برای حداقل 20 روز، میانگین روزانه در روزهای هفته، حداقل 40 رکورد فعالیت و حداقل 20 در آخر هفته است. علاوه بر این، میانگین فعالیت سیم کارت نمی تواند بیش از 1000 باشد تا سیم کارتی را که احتمالاً در تلفن همراه کار نمی کند، اما مثلاً در مودم 3G، فیلتر کند.
توجه داشته باشید که فعالیت می تواند تماس صوتی، پیام متنی یا انتقال داده باشد، همچنین هر دو ورودی یا خروجی، بنابراین، آنها را نمی توان در مجموعه داده متمایز کرد.
5. تجزیه و تحلیل رفت و آمد
به منظور بررسی قابلیت اطمینان و دقت روش پیشنهادی برای برآورد محل کار و خانه، یک مطالعه مقایسه ای بر روی شاخص های تحرک و اطلاعات پردازش شده از سرشماری کوچک به دست آمده در مجارستان انجام شده است.
در مجارستان، سرشماری هر 10 سال یکبار و سرشماری خرد با جمع 10 درصد در نیمفصل انجام میشود. آخرین سرشماری در سال 2011 انجام شد، در حالی که آخرین سرشماری خرد در سال 2016 بود. بر اساس این بررسی ها، رفت و آمد به بوداپست در مطالعاتی مانند [ 39 ، 40 ] تجزیه و تحلیل می شود. این مطالعات به عنوان مرجع برای مقایسه نتایج ما برای رفت و آمد استفاده می شود.
شکل 5 ، مقایسه بین CDR و نسبت سفر مسافران بر اساس سرشماری ([ 40 ]، شکل 1) را بر اساس مناطق بوداپست و طبقه بندی مکان خانه نشان می دهد. افرادی که در بوداپست کار می کنند نشان داده می شوند، و محل خانه می تواند (i) همان منطقه ای باشد که یکی در آن کار می کند ( شکل 5 الف)، (2) ناحیه دیگری از بوداپست ( شکل 5 ب)، (iii) تجمع ( شکل 5) ج) و (IV)، سایر سکونتگاه های خارج از تجمع ( شکل 5 د).
توافق خوبی عمدتا در بوداپست در مورد نسبت مسافران پیدا شده است. مهم ترین تفاوت را می توان با دسته “تراکم بیرونی” مشاهده کرد ( شکل 5 د). با این حال، این انحراف از محتوای منبع داده ناشی می شود، زیرا داده های شبکه تلفن همراه، که در این مطالعه استفاده شده است، عمدتاً منطقه بوداپست را پوشش می دهد. همچنین شامل فعالیت های تلفنی از شهرستان اطراف است، اما با دور شدن از بوداپست، داده های موجود کاهش می یابد.
کسری از کارگرانی که خانه های خود را در همان منطقه دارند به داده های سرشماری در مناطق بیرونی (15-23) بسیار نزدیک است، اما به طور کلی در مناطق اصلی (1، 5-9) و مناطق داخلی (2-2) بیش از حد برآورد می شود. 4، 10-14). کارگران گروه نواحی دیگر ( شکل 5 ب) بهترین تطابق را با داده های سرشماری نشان می دهد (جایی که CDR باید بهترین کیفیت را داشته باشد)، در حالی که تجمع در بسیاری از مناطق تا حدودی بیش از حد برآورد شده است.
در [ 39 ]، تجزیه و تحلیل دقیق تری در مورد رفت و آمد از تراکم وجود دارد، که به شش بخش تقسیم می شود و رفت و آمد بر اساس مبدا (بخش خانه، گاهی اوقات بر اساس شهرها) و مقصد (گروه ناحیه بوداپست) بررسی می شود. شکل 6 الف، توزیع مسافران را بر اساس رده های سنی و بخش به عنوان محل خانه نشان می دهد. فقط مسافرانی که در بوداپست کار می کنند بررسی می شوند.
به سختی می توان از روی مقاله متوجه شد که حد بالای رده سنی بالای 60 سال چقدر است. افرادی که معمولاً به سر کار می روند، کمتر از 65 سال سن دارند (به عنوان سن فعلی بازنشستگی در مجارستان)، اگرچه افراد می توانند بالای 65 سال کار کنند. در شکل مبتنی بر CDR ( شکل 6 ب)، 60+ به معنای بالاتر است. 60 و کمتر از 100. با این حال تعداد مشترکین بالای 70 سال زیاد نیست، فقط 1.87 درصد از سیم کارت فعال ( بخش 4.4 ) متعلق به افراد بالای 70 سال است. علاوه بر این، لازم به ذکر است که اطلاعات سن متعلق به صاحب اشتراک است، نه لزوماً به کاربر واقعی تلفن.
با مقایسه دادههای بهدستآمده از سرشماری کوچک و اطلاعات سلولی، توافقهای قابل قبولی در مورد روند و معیارهای توزیع مسافران بر اساس ردههای سنی به دست آمده است. مهم ترین تفاوت بین سرشماری و داده های مبتنی بر CDR در دسته های ’60+’ و ’50-59′ است. اولی می تواند نتیجه تفسیر حد بالایی باشد. این همچنین میتواند بر سایر دستهها، بهویژه دسته 50–59 تأثیر بگذارد. دستههای ’20-29’، ’30-29′ و ’40-49′ نتایج بسیار مشابهی را با هر دو رویکرد نشان میدهند. بر اساس شباهت اقدامات تحرک ارائه شده توسط سرشماری و پردازش CDR، به نظر می رسد روش پیشنهادی برای تعیین شاخص های تحرک قابل استفاده باشد.
6. آماده سازی داده ها برای تجزیه و تحلیل آماری
افراد بر اساس میانگین قیمت دارایی محل خانه (سلول) به ده دسته طبقه بندی می شوند، در محدوده قیمتی 0.2 تا 1.2 میلیون HUF/m2 ، سپس میانگین ارزش شاخص ها در طبقات تعیین می شود. شکل 7 ، شعاع چرخش، آنتروپی و فاصله خانه-کار طبقات مالی را نشان می دهد، که در آن فقط فاصله خانه-کار ( شکل 7 ج) تمایل جزئی بین طبقات را نشان می دهد.
Radius of Gyration دایرهای را تعریف میکند که در آن یک فرد زندگی خود را میگذراند و آنتروپی تنوع مکانهای بازدید شده یک فرد را اندازهگیری میکند، اما هر دوی آنها به شدت تحتتاثیر کیفیت دادهها قرار دارند. دادههای مورد استفاده برای این مقاله فقط شامل آن مکانهای بازدید شده است، جایی که فعالیت صورتحساب (تماسهای تلفنی، پیامهای کوتاه یا انتقال داده) اتفاق افتاده است، همه چیز فراتر از آن، نامرئی است. حتی با وجود ارتباطات فعال، آداب و رسوم تحرک یک فرد را می توان توصیف کرد، اما به نظر می رسد این برای تشخیص با استفاده از معیارهای وضعیت مالی کافی نیست.
شکل 7 د، قیمتهای املاک معمولی مکانهای کاری را در مقابل قیمتهای مستغلات مکانهای خانه با استفاده از نمودار جعبهای بدون نقاط پرت نشان میدهد. برای هر دسته قیمت دارایی محل خانه، نمودار جعبه ( شکل 7 د) سیم کارت ها را به سه گروه تقسیم می کند: (1) آنهایی که بین ربع اول و سوم (Q1-Q3)، (ii) آنهایی که زیر چارک اول هستند. بین حداقل و Q1: min-Q1)، و (iii) کسانی که بالاتر از چارک سوم (بین Q3 و حداکثر، Q3-max). ایده این بود که سیم کارت در محدوده بین ربعی (IQR) جدا از سیم کارت های زیر و بالای IQR باشد.
سیمکارتها بر اساس دستههای قیمت محل کار خانه و محل کار (0.2 تا 1.2 میلیون HUF) و دوازده دسته Radius of Gyration و Entropy (با استفاده از محدوده فاصله 0.5 کیلومتری بین 0.5 تا 20 کیلومتر برای مقادیر Radius of Gyration و Entropy با استفاده از 0.05 گام بین 0.05 و 1.00). ساختار داده های مورد استفاده برای تجزیه و تحلیل مؤلفه اصلی به شرح زیر است. هر ردیف از 40 ستون تشکیل شده است که نشان دهنده 40 سطل شعاع چرخش بین 0.5 تا 20 کیلومتر و 20 ستون نشان دهنده 20 سطل آنتروپی، بین 0.05 و 1.00 است. سطلها حاوی تعداد سیمکارتهایی هستند که با معیارها نرمال شدهاند تا بتوان آنها را با هم مقایسه کرد. اگرچه روزهای کاری و تعطیلات در طول کل مطالعه به طور جداگانه در نظر گرفته می شوند، داده ها به صراحت توسط آنها برچسب گذاری نشده اند. همین جدول با استفاده از معیارهای آخر هفته/تعطیلات ساخته شده است و ردیفهای آن بعد از روزهای هفته اضافه میشوند. ستونهای قیمت دارایی مکان خانه و ستونهای توصیفگر قیمت دارایی محل کار به الگوریتم PCA ارائه نشدهاند.
7. نتایج و بحث
در این بخش، خلاصه ای از یافته های مربوط به رابطه شاخص های تحرک و وضعیت اقتصادی اجتماعی کاربران تلفن همراه ارائه شده است.
مجارستان یک کشور معمولی سرمایه محور است. بوداپست مرکز سیاسی، اقتصادی، لجستیکی و فرهنگی کشور است که تقریباً 18٪ از جمعیت در آن زندگی می کنند [ 41 ]. رودخانه دانوب شهر را به دو قسمت بودا (بو دا) و آفت (پش تی) تقسیم میکند، اولی منطقه شیکتری است و ارزش ملک بهطور قابلتوجهی بالاتر است ( شکل 8 a و شکل 9 a را ببینید).
هر سیم کارتی در تلفن همراه کار نمی کند و هر دستگاهی موقعیت خود را تغییر نمی دهد. برخی از دستگاههای موجود در مجموعه داده نشاندهنده یک مودم 3G یا نوعی دستگاه اینترنت اشیا هستند. اگرچه، یک دستگاه ثابت نیز می تواند در داده های CDR غیر ثابت به نظر برسد، اگر سلولی که متصل است را تغییر دهد، حرکت آنها حداقل است. بنابراین، دستگاههایی با شعاع چرخش کمتر از 1 کیلومتر یا فاصله کار تا خانه، از تجزیه و تحلیل بیشتر حذف میشوند.
شکل 8 الف، توزیع مکانی قیمت دارایی را نشان می دهد. توزیع فضایی به وضوح نشان می دهد که سمت بودای بوداپست بسیار گران تر است. سلول هایی با رنگ بسیار روشن در وسط شهر، جزیره مارگارت است که یک منطقه تفریحی با پارک های بزرگ، مراکز ورزشی و هتل ها بدون منطقه مسکونی است و در داده ها هیچ ملکی برای فروش وجود ندارد.
شکل 8 ب و شکل 10 ، میانگین شعاع چرخش افرادی را نشان می دهد که محل خانه آنها در منطقه داده شده تخمین زده می شود. اولی حومه بوداپست و شهرها و روستاهای اطراف را نشان می دهد، دومی در سطح سلولی بر بوداپست تمرکز دارد. گرایشهای گسترده اساساً یکسان هستند: هر چه فرد از مرکز دورتر باشد، بیشتر سفر میکند، اما نقشه سطح سلولی برخی از مراکز شهری محلی را نشان میدهد که تصویر را ظریفتر میکند. تأثیر مراکز شهری محلی بر تحرک، روندها می تواند موضوع جداگانه ای برای بررسی باشد.
یک مدل لایه اجتماعی [ 42 ] برای تمایز SES کاربران استفاده شده است. ما SES آنها را در طبقات قیمت مسکن گروه بندی کردیم. این کلاسها فقط ویژگیهای سطح گروه را نشان میدهند و نمیتوانند برای مشخص کردن SES فردی استفاده شوند.
دارندگان تلفن همراه بر اساس ارزش های اجتماعی-اقتصادی مرتبط با SES به ترتیب صعودی مرتب شده اند . این رویکرد کاربران تلفن همراه را در کلاسهای q SES گروهبندی میکند که مجموع ارزشهای اجتماعی-اقتصادی در هر طبقه مالک یکسان است (یعنی یکسان به (∑vاسEاس)/qاسEاس). مدل لایه اجتماعی کاربران تلفن را به طبقاتی با اندازههای رو به کاهش توزیع میکند (هرچه SES کمتر باشد، اعضای کلاس بالاتر هستند)، و بنابراین تفاوتهای SES در بین کلاسها را میتوان به طور مؤثرتری تشخیص داد.
روابط بین Radius of Gyration و SES کاربران تلفن در بوداپست تجزیه و تحلیل می شود. ما از قیمت مسکن مرتبط برای نشان دادن SES کاربران تلفن همراه استفاده کردیم. کاربران بر اساس قیمت مسکن به ترتیب صعودی رتبه بندی شده اند. شعاع چرخش ( شکل 11 الف) توزیع نرمال را نشان می دهد با این حال به طور قابل توجهی به سمت راست منحرف شده است (به نظر می رسد شبیه مشاهدات انجام شده در بوستون [ 11 ] باشد). اکثریت ساکنان شعاع چرخش نسبتاً کوچکی دارند. از سوی دیگر، برخی از کاربران تلفن باید مسافت قابل توجهی را طی کنند.
آنتروپی نیز توزیع نرمال را نشان می دهد. اکثریت جمعیت بوداپست از مکانهای زیادی بازدید میکنند (آنتروپی بین 0.2 و 0.6) و در کنار بخش قابل توجهی از مردمی که در همسایگی خانه باقی ماندهاند (آنتروپی کمتر از 0.2) تنها تعداد کمی از مکانهای زیادی در شهر بازدید میکنند.
توزیع فاصله بین محل کار و خانه ویژگی های نمایی را نشان می دهد شکل 11 ج). اکثریت جمعیت مورد بررسی مکان های کاری نزدیکتر از 5 کیلومتر را انتخاب کرده اند و تعداد نسبتا کمی از مردم باید بیش از 10 کیلومتر را برای کار طی کنند.
فعالیت مردم در روزهای کاری به طور قابل توجهی بیشتر از روزهای آخر هفته است. علاوه بر این، مقادیر بالاتری از شعاع چرخش، آنتروپی و تعداد مکانهای فعال در جمعهها ثبت شدهاند که نشان میدهد آخرین روز کاری هفته به نوعی نقش ممتاز دارد ( شکل 12 ). در تعطیلات آخر هفته فعالیت های بیشتر و سفرهای پر جنب و جوش بیشتری را می توان در روزهای شنبه مشاهده کرد و بسیاری از ساکنان یکشنبه ها در حال استراحت هستند.
شکل 7 الف، رابطه بین شعاع چرخش و قیمت های عادی مسکن را نشان می دهد. ما کاربران تلفن همراه را در 10 گروه (Q = 10) رتبه بندی کردیم. ما دریافتیم که کاربران تلفن همراه که در محدوده قیمت متوسط (0.5 تا 0.7 میلیون HUF) زندگی میکنند، به طور متوسط نسبت به مناطق ارزانتر (فقیرتر) شعاع چرخش کمتری دارند. ساکنان مناطق فقیرتر به طور متوسط حدود 5 کیلومتر سفر می کنند در حالی که شعاع چرخش در ساکنان طبقه متوسط و مناطق گران تر کمتر است. این یافته ها را می توان با این واقعیت توضیح داد که میانگین افراد ساکن در خانه های با قیمت متوسط ( شکل 7الف) شانس بیشتری برای داشتن فرصت های شغلی و تفریحی متفاوت دارند و بنابراین نیازی به پیمودن مسافت های طولانی تری ندارند. میانگین و محدوده بین ربعی کاربران شبکه تلفن همراه که در گران ترین منطقه زندگی می کنند (بیش از 1.0 میلیون HUF) بزرگتر از منطقه کم هزینه است. این همچنین از این نتیجه می شود که افراد کمتری در مناطق ثروتمندتر خانه دارند و بنابراین میانگین و پراکندگی شعاع چرخش بیشتر است.
شکل 7 ب، روابط بین SES و آنتروپی فعالیت را نشان می دهد که نشانگر تحرک برای توصیف منظم الگوهای سفر و فعالیت روزانه کاربران تلفن اختصاص داده شده است. نتایج نشاندهنده تنوع کم در SES برای آنتروپی فعالیت است. مقادیر میانگین هر کلاس قیمت گذاری خانه در محدوده 3.5 تا 4.5 باقی مانده است. یکی از دلایل بالقوه این است که برای اکثر افراد، فعالیت های روزانه آنها عمدتاً در مکان های معدودی (مثلاً محل کار و خانه) متمرکز است. با این حال، یک گرایش کوچک افزایشی متوسط ارزش خانه را می توان مشاهده کرد، که نشان می دهد ساکنانی که در بخش های گران تر زندگی می کنند، از مکان های بیشتری بازدید می کنند. منظم بودن فعالیتها در مکانهای ثروتمندتر تأثیر کمی بر تنوع فعالیت کاربران تلفن دارد. این یافته با نتایج تجزیه و تحلیل [11 ]. شو نشان داد که سطح ثروت مردم، حداقل در سنگاپور و بوستون، یک عامل محدود کننده نیست، که بر نحوه سفر آنها در شهر تأثیر می گذارد. به نظر میرسد که ساکنانی که در مناطق گرانتر بوداپست زندگی میکنند، احتمالاً یا مجبور هستند از مکانهای بیشتری دیدن کنند تا آنهایی که در مناطق ارزانتر خانه دارند.
ما رابطه بین فواصل کار-خانه و SES را بررسی کردیم. شکل 7c، مسافت پیموده شده بین مکان های خانه و شغل را به عنوان تابعی از قیمت های مکان خانه نشان می دهد. روند نزولی مقادیر میانگین فاصله مربوط به قیمت مسکن از پایین تر به قیمت بالاتر ملک نشان می دهد که SES نقش مهمی در میزان سفر ساکنان به محل کار خود دارد. ارزانترین خانهها دورترین خانهها از محل کار هستند (میانگین 8.4 کیلومتر و حداکثر 27.5 کیلومتر)، در حالی که کوتاهترین سفرهای کاری روزانه متعلق به خانههایی است که در رده 0.9 میلیون HUF قرار دارند (میانگین 5.2 کیلومتر و حداکثر آن است. 21.8 کیلومتر). به عبارت دیگر، مردمی که در مناطق فقیرتر زندگی می کنند مجبورند بیشتر به محل کار خود سفر کنند. زمان بیشتری برای رفت و آمد روزانه توسط افرادی که در مکان های ارزان تری زندگی می کنند صرف می شود که ممکن است بر فرصت های آنها برای بازدید از جاذبه های بیشتر در شهر تأثیر بگذارد.شکل 7 ب).
ما همچنین همبستگی قیمت ملک در خانه و محل کار را تجزیه و تحلیل کردیم. ما دریافتیم که وضعیت اقتصادی مکانهای خانه و محل کار برای هر کاربر تلفن همراه رابطه مستقیمی دارد ( شکل 7)د). مقادیر میانگین بالاتر قیمت مسکن، جایی که افراد ساعات کاری خود را سپری می کنند، به طبقات بالاتر قیمت مسکن تعلق دارند. قابل توجه است که میانگین ارزش ملک در مکان های کاری، بالاتر از طبقات Home برای ساکنانی است که قیمت مسکن آنها بین 0.2 تا 0.6 و 0.9-1.1 میلیون HUF است. محدوده کل (حداکثر-دقیقه) و محدوده Q1-Q3 قیمت ملک در محل کار با قیمت مسکن منازل نسبت معکوس دارد، در محدوده 0.2-0.6 و در محدوده 0.7-1.1 میلیون HUF نسبت مستقیم دارد. این مشاهدات نشان میدهد که تعداد کمی از محلهای کار در مناطق ارزانتر بوداپست هستند و بنابراین، اکثر ساکنان ساعات کاری را در مناطق گرانتر میگذرانند. از سوی دیگر، محل های کار محدودی در دسترس است، همچنین در ثروتمندترین مناطق و افرادی که در آنجا خانه دارند، در مناطق ارزان تر کار می کنند. کوچکترین پراکندگی ارزش ملک در محل کار، برای ساکنان ساکن در مناطق قیمتی 0.6 میلیون HUF شهر داده می شود. با این وجود، نتایج درشکل 7 د، نشان می دهد که محل کار و خانه رابطه قابل توجهی دارند.
7.1. خصوصیات SES توسط تجزیه و تحلیل مؤلفه اصلی
رابطه بین معیارهای تحرک (در طول روزهای هفته و آخر هفته) و وضعیت اقتصادی اجتماعی (SES) با استفاده از PCA بررسی شده است.
شکل 13 ، هیستوگرام پارتو را برای 60 جزء نشان می دهد. به نظر می رسد که دو مؤلفه اول (حدود 50 درصد از واریانس توضیح داده شده) برای نشان دادن واریانس متغیرها کافی است. شکل 14 ، دو جزء اول یک تحلیل PCA بدون نظارت اعمال شده را نشان می دهد. سبکهای نشانگر، رنگها و اندازهها هر کدام یک برچسب از دادهها را نشان میدهند. اول، رنگهای قهوهای نشاندهنده روزهای کاری، رنگهای مایل به سبز روزهای تعطیل هستند و به وضوح دو خوشه مجزا را تشکیل میدهند، اگرچه ردیفهای روزهای کاری و روزهای هفته متمایز نبودند. این بدان معناست که اولین اجزای اصلی به اندازه کافی گویا هستند تا بین عادت های تحرک روز کاری و تعطیلات تمایز قائل شوند.
اندازه نشانگر محدوده قیمت ملک موقعیت مکانی خانه را نشان می دهد. تمایل قابل توجهی در امتداد محور PC2 وجود دارد که نشانگرها افزایش می یابند. اگرچه خط روند بیشتر شبیه یک منحنی است که به سمت راست خم می شود، به نظر می رسد نتایج مشترکان ثروتمندتر را متمایز می کند. تحرک منطقه کم هزینه را می توان در قسمت پایین نمودار پیدا کرد و هر چه قیمت ملک بالاتر باشد، موقعیت های عمودی معیارهای تحرک بالاتر است. به نظر می رسد دومین جزء اصلی متغیر مناسبی برای نشان دادن تأثیر قیمت مسکن بر چرخش و آنتروپی باشد. لازم به ذکر است که کوچکترین نشانگرها نامناسب به نظر می رسند. آنها مناطق بسیار ارزانی را نشان می دهند که مناطق مسکونی نیستند، بلکه بیشتر شبیه مناطق صنعتی هستند و تنها تعداد کمی از مشترکین در آن دسته بندی ها طبقه بندی می شوند.
گروه های چارک ذکر شده با نشانگرها و رنگ های مختلف نشان داده شده اند. نمادهایی که معیارهای تحرک گروه min-Q1 را نشان می دهند در سمت چپ هستند و نشانگرهایی که معیارهای تحرک گروه Q3-max را نشان می دهند در سمت راست گروه Q1-Q3 در اکثر گروه های قیمت گذاری خانه قرار دارند. این به این معنی است که اولین مؤلفه اصلی به نظر میرسد یک پارامتر تعیینکننده باشد تا نه تنها الگوهای تحرک روز کاری و آخر هفته را متمایز کند، بلکه محدوده چارکی دستههای قیمت املاک محل خانه را نیز متمایز میکند.
محدوده PC1 بین 0.0 و 2.5 شامل نشانگرهای چارک اول در بیشتر موارد است، در حالی که مخلوطی از نمایندگان متعلق به گروه های Q1-Q3 و Q3-max در محدوده 2.5-10.0 قرار دارند. آداب و رسوم جابجایی روزهای هفته افراد متعلق به گروه min-Q1 به طور قابل توجهی با سایر گروه های ساکن متفاوت است. این نشان میدهد که حتی این ساکنان در محلهای با ارزش مشابه مانند گروههای Q1-Q3 زندگی میکنند، آنها زندگی خود را متفاوت مدیریت میکنند. قابل توجه است که انحراف در پایین ترین و بالاترین رده قیمت مسکن کوچکتر و در محدوده قیمت ملک در سطح متوسط بزرگتر است. به نظر می رسد افرادی که خانه هایی در سطح متوسط قیمت در شهر دارند نسبت به افراد ساکن در مناطق فقیرتر یا ثروتمندتر عادت های متنوع تری دارند.
ویژگی های تحرک، مربوط به ساکنان مرتبط با گروه های Q1-Q3 و Q3-max، کاملا مشابه است. در محدوده PC1 بین 2.5 و 5.0، چندین نشانگر از گروه های مختلف و دسته های مختلف قیمت مسکن با یکدیگر همپوشانی دارند. نشانگرهای روی نمودار (یعنی در محدوده PC2 بین 0.0 و 0.2-) احتمالاً نشان میدهند که ساکنانی که در مقولههای ارزانترین و متوسط سطح قیمت زندگی میکنند، اگر به Q1-Q3 و Q3-max تعلق داشته باشند، به طور مستقل الگوهای سفر بسیار مشابهی دارند. گروه ها. همچنین قابل توجه است که در روزهای هفته و تعطیلات آخر هفته، آداب و رسوم تردد ثروتمندترین ولسوالی ها کاملاً از سایرین جدا می شود.
7.2. محدودیت های این مطالعه
این مطالعه چند محدودیت داشت. ما ساکنان را با میانگین ارزش دارایی در محل سلول خانه آنها (یعنی چند ضلعی های Voronoi) مرتبط کردیم. در برخی از مناطق شهر، که تراکم دکل های تلفن همراه کم است، این رویکرد می تواند منجر به عدم دقت در SES ساکنان شود (قیمت مسکن در مناطق نسبتا بزرگتر متفاوت است). تنها از یک متغیر (قیمت مسکن) استفاده شده است، سایر عوامل اجتماعی- جمعیتی در نظر گرفته نشده است. اندازه خانواده و خانواده، سطح تحصیلات و غیره از ابعاد ضروری SES هستند. مطالعات آتی برنامه ریزی شده است تا پارامترهای بیشتری را برای توصیف ویژگی های اقتصادی ساکنان در بر گیرد.
7.3. کار آینده
یکی از پیشرفتهای احتمالی تحقیقات استفاده از منابع داده دقیقتر برای طبقهبندی مالی، به عنوان مثال، نوع و قیمت تلفنهای همراه است. ترکیبی از قیمت ملک در اطراف محل خانه و قیمت دستگاه تلفن همراه ممکن است نتیجه بهتری ارائه دهد.
با استفاده از یک مجموعه داده که حاوی اطلاعاتی در مورد هر دو شرکت کننده در تماس است، نه تنها شبکه اجتماعی می تواند ساخته شود، بلکه می توان آن شبکه را با وضعیت مالی مشترکین وزن کرد.
ممکن است بتوان با بررسی مکانهای بازدید شده، از ثروتمندترین طبقات، که در مناطقی با رستورانهای زیباتر، تئاترها و غیره خارج از ساعات کاری معمولی ظاهر میشوند، این کار را بهبود بخشید.
8. نتیجه گیری
در این مطالعه، آداب و رسوم سفر جمعیت زیادی در بوداپست (مجارستان) با استفاده از Call Detail Records بررسی شده است. همراه با شاخصهای تحرک، محاسبهشده از دادههای شبکه تلفن همراه، قیمت املاک و مستغلات برای نشان دادن وضعیت اجتماعی و اقتصادی افراد ساکن در یک منطقه خاص استفاده میشود. به منظور یافتن و ارزیابی همبستگی بین الگوهای تحرک انسانی و وضعیت اجتماعی-اقتصادی ساکنان، در بوداپست، یک چارچوب تحلیلی بر روی مجموعه دادههای همراه شبکههای تلفن همراه و قیمت املاک و مستغلات استفاده شده است.
شعاع چرخش، آنتروپی و فاصله اقلیدسی بین مکانهای خانه و محل کار از دادههای شبکه تلفن همراه استخراج شده و به عنوان شاخصهای تحرک برای توصیف الگوهای سفر ساکنان استفاده شده است. قیمت ملک خانه ها برای نشان دادن وضعیت اجتماعی-اقتصادی آنها اعمال شده است. ما روش ادغام دادهها را برای تعیین کمیت SES (وضعیت اجتماعی اقتصادی) کاربران تلفن همراه در سطح کل انجام دادیم.
با بررسی روابط بین SES و سه شاخص تحرک، دریافتیم که سطح ثروت در بوداپست تأثیر خاصی بر آداب سفر دارد. قیمت املاک و مستغلات سایتهای خانگی، تأثیر قابلتوجهی بر تعداد مکانهای بازدید شده (آنتروپی) و چرخش ندارد، که نشان میدهد تنوع سفر ساکنان، به شدت به وضعیت اجتماعی-اقتصادی آنها وابسته نیست.
از سوی دیگر، میانگین فاصله خانه و محل کار به طور قابل توجهی با ارزش اموال مرتبط است. مردمی که در مناطق ارزانتر زندگی میکنند باید مسیرهای طولانیتری را به سمت محل کار خود طی کنند. دلیل این رابطه را می توان با این واقعیت توضیح داد که مناطق ارزان تر در حاشیه شهر واقع شده اند، در حالی که بیشتر سایت های کاری در مناطق ثروتمندتر هستند. با تجزیه و تحلیل ارزش املاک و مستغلات در خانه و محل کار ساکنان، یک رابطه مثبت قوی پیدا کردیم. زندگی در یک محله گران قیمت در بوداپست، مستلزم کار در مناطق گران تر و بالعکس است.
تجزیه و تحلیل مؤلفه اصلی شباهت ها و تفاوت های رفتار حرکتی ساکنان ساکن در دسته های مختلف سطح قیمت را نشان داد. همبستگی آداب و رسوم تحرک و SES می تواند به طور موثر برای حمایت از فعالیت های حمل و نقل عمومی، توسعه املاک و مستغلات و خرده فروشی استفاده شود.
ما همچنین ارتباط رفتار حرکتی و SES را با انجام PCA (تحلیل اجزای اصلی) ارزیابی کردیم. نتایج نشان داد که دو مؤلفه اول میتوانند برای تمایز الگوهای تحرک روز کاری و آخر هفته و همچنین دستههای قیمت املاک محل خانه کافی باشند. از دادههای شبکه تلفن همراه نیز میتوان برای تجزیه و تحلیل رفتوآمد، مشابه دادههای سرشماری، استفاده کرد، حتی اگر وضوح مکانی آن دقیق نباشد. روند رفت و آمد بین بخشهای معین تجمع و گروههای منطقه بوداپست به اندازه کافی مطابقت دارد که میتوان گفت که Call Detail Records میتواند راهحلی ارزانتر، موقت و دقیقتر برای رفت و آمد و احتمالاً انواع دیگر مطالعات جامعهشناختی باشد.
در نتیجه، این تحقیق بر شناسایی پیوندهای پنهان یا نامشخص، بین تحرک انسان و وضعیت اجتماعی-اقتصادی متمرکز شد. بدین منظور، این کار موفق بوده است. رویکرد و حتی چارچوب توسعه یافته در اینجا، می تواند برای مکان های مختلف اعمال شود. از یافته ها می توان برای درک دقیق تر و کارآمدتر شرایط و شرایط زندگی روزمره برای افرادی که در محیط های شهری مدرن زندگی می کنند استفاده کرد.
بدون دیدگاه