چکیده

در این مقاله، ما رابطه بین داده های تلفن همراه و قیمت مسکن در بوداپست، مجارستان را بررسی می کنیم. ما شاخص‌های تحرک را از یک ماه داده‌های سوابق جزئیات تماس (CDR) تعیین می‌کنیم، در حالی که داده‌های قیمت ملک برای توصیف وضعیت اجتماعی-اقتصادی در پایتخت مجارستان استفاده می‌شود. ابتدا، روش پیشنهادی را با مقایسه تخمین مکان‌های خانه و محل کار و الگوهای رفت‌وآمد حاصل از مجموعه داده شبکه سلولی با گزارش‌های سرشماری کوچک ملی تأیید کردیم. ما روابط آماری بین شاخص‌های تلفن همراه، مانند شعاع چرخش، فاصله بین مکان‌های خانه و محل کار یا آنتروپی سلول‌های بازدید شده، و معیارهای وضعیت اقتصادی بر اساس قیمت مسکن را بررسی کردیم. یافته های ما نشان می دهد که تحرک به طور قابل توجهی با وضعیت اجتماعی و اقتصادی ارتباط دارد. ما تجزیه و تحلیل مؤلفه اصلی (PCA) را روی بردارهای ترکیبی شاخص‌های تحرک انجام دادیم تا وابستگی عادات تحرک را به وضعیت اجتماعی-اقتصادی مشخص کنیم. نتایج بررسی PCA همبستگی قابل توجهی را بین قیمت مسکن و آداب و رسوم جابجایی نشان داد.

کلید واژه ها:

داده های تلفن همراه ؛ تحرک انسان ؛ ویژگی های اجتماعی و اقتصادی

1. مقدمه

تلفن‌های همراه و حتی بیشتر، تلفن‌های هوشمند، اکنون بخش‌های اساسی زندگی ما هستند، آن‌ها عملاً، همیشه با ما هستند، هر کجا که می‌رویم، تقریباً انگار بخشی از بدن ما هستند. ارتباط مداوم بین یک دستگاه و شبکه های تلفن همراه، ردپایی را در سیستم اپراتور از عادت های حرکتی ما به جا می گذارد. از طریق این دستگاه‌ها، شبکه تلفن همراه می‌تواند حرکات ما را «احساس» کند، که اساس مفهوم «شهر هوشمند» [ 1 ] است. تعداد فزاینده‌ای از آثار علمی منتشر شده در دو دهه اخیر، پتانسیل توصیف حرکت انسان را با استفاده از Call Detail Records (CDR) نشان می‌دهد [ 2 ، 3 ، 4 ، 5 ، 6 .] – در میان سایر زمینه ها – در اپیدمیولوژی، جامعه شناسی و برنامه ریزی شهری.
تجزیه و تحلیل تحرک انسانی می تواند بر روی افراد یا گروه ها کار کند. گروه بندی با هر یک از ویژگی های افراد امکان پذیر است. به عنوان مثال، با استفاده از مکان‌های (تخمینی) خانه، الگوهای حرکتی افرادی که در همان منطقه زندگی می‌کنند را می‌توان با ساکنان یک منطقه دیگر مقایسه کرد. سپس با استفاده از منبع داده های خارجی مانند قیمت املاک مناطق شهر، می توان به گروه بندی بر اساس وضعیت مالی افراد دست یافت، با این فرض که قیمت دارایی منزل شخصی می تواند وضعیت مالی آنها را به درستی توصیف کند. در این مقاله، داده‌های قیمت املاک با داده‌های CDR ترکیب می‌شوند تا تأثیر وضعیت مالی بر گمرکات تحرک را ارزیابی کنند.
تجزیه و تحلیل الگوهای حرکت انسان بر اساس داده‌های CDR، که امکان بررسی جمعیت بسیار بزرگ را به صورت مقرون‌به‌صرفه ممکن می‌سازد، منجر به تعدادی اکتشاف در مورد پویایی انسان شد. این آثار معمولاً جمعیت را به عنوان یک گروه همگن در نظر می گیرند و طبقه بندی بر اساس برخی از شاخص های تحرک [ 6 ] است. به منظور گسترش بررسی به سایر ویژگی های جمعیت، گام بعدی افزودن منابع داده خارجی به داده های شبکه تلفن همراه بود. اغلب، این منبع خارجی برای طبقه بندی داده ها (به عنوان مثال، بر اساس جنسیت) و برای تجزیه و تحلیل طبقات، با استفاده از شاخص های تحرک معرفی شده قبلی استفاده می شود. از جمله: داده های شبکه اجتماعی [ 7 ]، داده های حمل و نقل [ 8 ]، سفرهای تاکسی [ 9 ]]، شاخص های اجتماعی-اقتصادی (درآمد سرانه، نرخ تحصیلات، نرخ بیکاری و شاخص محرومیت) [ 10 ]، قیمت فروش املاک مسکونی [ 11 ]. بله، این کار نیز با استفاده از قیمت فروش املاک، با روندها مطابقت دارد.
در این مقاله به بررسی روابط بین شاخص‌های تلفن همراه و معیارهای وضعیت اجتماعی-اقتصادی بر اساس قیمت مسکن می‌پردازیم. در انجام این کار، ما تجزیه و تحلیل آماری را بر روی شاخص های تحرک به دست آمده از مجموعه داده های CDR و اطلاعات قیمت املاک در بوداپست انجام می دهیم. با فرض اینکه قیمت مسکن در سطح معینی وضعیت اجتماعی-اقتصادی را مشخص می کند، در حال بررسی رابطه بین قیمت بازار املاک در محله ای که ساکنان در آن زندگی می کنند یا کار می کنند و شاخص های تحرک را بررسی می کنیم. فرضیه ما این است که شاخص‌های تلفن همراه انواع مختلفی از تغییرات مکانی را برای مجموعه‌های مختلف قیمت مسکن نشان می‌دهند و بنابراین الگوها و همبستگی‌های پنهان را می‌توان آشکار کرد.
این مقاله به شرح زیر سازماندهی شده است: بخش 2 خلاصه ای از ادبیات مربوطه را ارائه می دهد. بخش 3 داده های مورد استفاده در این مطالعه را تشریح می کند. بخش 4 ، روش مورد استفاده و شاخص ها و معیارهای تولید شده را شرح می دهد. شاخص های تحرک به دست آمده از مجموعه داده های ثبت شده توسط اپراتور تلفن همراه با مقایسه با گزارش های سرشماری کوچک ملی ( بخش 5 ) اعتبارسنجی شده است. سپس، نتایج تجزیه و تحلیل آماری در بخش 7 مورد بحث قرار گرفته است . خلاصه یافته ها در بخش 8 آورده شده است.

2. بررسی ادبیات

درک حرکات انسان و شناخت الگوهای رفتاری که در طول زندگی روزمره، در مناطق شهری رخ می‌دهد، مستلزم تحلیل سیستماتیک آن تحرک انسان است. ارزیابی سفر انسان بر اساس مشاهدات در سطوح فردی و گروهی است. در دهه‌های گذشته، چندین مجموعه داده جدید، بر اساس سوابق GPS خودرو و شبکه تلفن همراه یا اطلاعات رسانه‌های اجتماعی، در دسترس قرار گرفتند که توصیف دقیق‌تر و پیچیده‌تری از حرکات افراد ارائه می‌کردند. گونزالس و همکاران از مجموعه داده ای استفاده کرد که شامل 100000 پرونده تلفن همراه کاربر بود که به مدت نیم سال به دست آمد و نشان داد که ساکنان معمولاً از برخی مکان های پر رفت و آمد بازدید می کنند [ 2 ]]. سونگ و همکاران مجموعه داده ای را که نشان دهنده 50000 کاربر تلفن همراه ثبت شده به مدت سه ماه ارزیابی کرد. حرکات انسانی که از اطلاعات سلولی مجموعه داده به دست می‌آید بسیار قابل پیش‌بینی است [ 12 ]. شاخص‌های عددی (یعنی متریک‌های مبتنی بر آنتروپی، شعاع چرخش) برای تعیین کمیت توزیع زمانی مکانی افراد و حرکات آنها محاسبه شده‌اند. پریجا و همکاران [ 13] الگوریتم صفحه‌بندی مبتنی بر نمایه را بر روی CDRها به منظور کشف الگوهای تحرک شخصی انسان اعمال کرد. نتایج نشان می‌دهد که الگوریتم پیشنهادی سه برابر کارآمدتر از صفحه‌بندی معمولی و دو برابر مؤثرتر از سایر الگوریتم‌های صفحه‌بندی هوشمند دیگر است. این تحقیقات ویژگی‌های پنهان حرکات فردی را نشان داد و برای تلاش‌های علمی بیشتر رونق محسوسی ایجاد کرد.
به نظر می رسد معیارهای جمعیت شناختی و وضعیت اجتماعی-اقتصادی (SES) رابطه معناداری با رفتار سفر فردی دارند. مطالعات اولیه با هدف بررسی همبستگی ویژگی های سفر انسان و SES [ 14 ، 15 ] انجام شد. Cottineau و Vanhoof [ 16 ] مدلی را برای بررسی رابطه بین داده های تلفن همراه و اطلاعات اجتماعی-اقتصادی سنتی از سرشماری ملی در شهرهای فرانسه ایجاد کردند. شاخص های تلفن همراه از شش ماه سوابق جزئیات تماس تخمین زده می شود، در حالی که داده های سرشماری و اداری برای توصیف سازمان اجتماعی-اقتصادی شهرهای فرانسه استفاده می شود. یافته‌ها نشان می‌دهد که برخی از شاخص‌های تلفن همراه با سازمان‌های اقتصادی-اجتماعی مختلف شهرها ارتباط معناداری دارد. پخریال و همکاران [17 ] از یک چارچوب محاسباتی برای پیش بینی دقیق شاخص جهانی فقر چند بعدی (MPI) در سنگال بر اساس داده های محیطی و CDR استفاده کرد. این روش پیش بینی دقیق ابعاد مهم فقر را فراهم می کند: بهداشت، آموزش، و استاندارد زندگی (برآوردها با استفاده از محرومیت های محاسبه شده از سرشماری تایید شده اند).
در دهه گذشته، CDR ها به یک منبع اطلاعاتی استاندارد برای تجزیه و تحلیل ویژگی های اجتماعی تحرک انسان تبدیل شده اند. یک کار تحقیقاتی [ 18 ] که فعالیت های روزانه مردم را در شنژن، چین بررسی کرد. نتایج به‌اصطلاح تفاوت‌های «شمال-جنوب» در فعالیت‌های انسانی را شناسایی کرد که یافته‌ها با شکاف اجتماعی-اقتصادی در شهر مطابقت دارد.
برخی از تحقیقات نشان می دهد که داده های تلفن همراه را می توان برای پیش بینی SES فردی [ 19 ] یا ویژگی های اجتماعی-اقتصادی منطقه ای [ 20 ] استفاده کرد. خو و همکاران [ 11] از یک چارچوب تحلیلی در مقیاس بزرگ تلفن همراه و مجموعه داده های اجتماعی-اقتصادی شهری برای ارزیابی الگوهای تحرک و SES استفاده کرد. شش شاخص تحرک، قیمت مسکن و درآمد سرانه در سنگاپور و بوستون برای تجزیه و تحلیل طبقات اجتماعی-اقتصادی استفاده شده است. مشخص شد که کاربران تلفن که عموماً ثروتمندتر هستند، در سنگاپور مسافت های کوتاه تری را طی می کنند، اما در بوستون طولانی تر. این تحقیق یافته‌های جالبی را به ارمغان آورد، اما همچنین نشان داد که رابطه بین تحرک و وضعیت اجتماعی-اقتصادی ارزش بررسی در سایر شهرها و کشورها نیز دارد.
کاستیو و همکاران شاخص توسعه انسانی را برای داده‌های محلی موجود برای اکوادور برای توصیف وضعیت اجتماعی-اقتصادی محاسبه کرد و در مقایسه با رویکرد مبتنی بر تلفن همراه آنها استفاده کرد [ 21 ]. باربودا و همکاران تفاوت های قابل توجهی در میانگین مسافت سفر بین گروه های کم درآمد و پردرآمد در برزیل پیدا کرد [ 22 ]. این مطالعه با این روند مطابقت دارد و بر پایتخت اروپای مرکزی، بوداپست تمرکز دارد.
اپیدمیولوژی به عنوان یک کاربرد بالقوه از مطالعات تحرک انسانی، با برخی کاربردها مانند [ 23 ] استفاده می شود، اما همه گیر COVID-19 ارتباط بین تجزیه و تحلیل تحرک مبتنی بر تلفن همراه و اپیدمیولوژی را در اولویت قرار داد. اصطلاح “اپیدمیولوژی دیجیتال” را می توان در هنگام کار با داده هایی استفاده کرد که با هدف اولیه مطالعات اپیدمیولوژیک تولید نشده اند [ 24 ].
ویلبرگ و همکاران کاهش قابل توجهی از حضور جمعیت در بزرگترین شهرهای فنلاند پس از قرنطینه در مقایسه با یک هفته معمولی شناسایی کرد [ 25 ]. بوشمن و همکاران انطباق با فاصله گذاری اجتماعی در ایالات متحده را با استفاده از داده های تلفن همراه تجزیه و تحلیل کرد [ 26 ]. گائو و همکاران همبستگی منفی در فاصله گذاری در خانه و میزان افزایش COVID-19 یافت شد [ 27 ]. WD Lee و همکاران تأثیر SES بر تغییرات تحرک در طول قرنطینه را بررسی کرد و دریافت که تحرک مشترکان ثروتمندتر به طور قابل توجهی در انگلستان کاهش یافته است [ 28 ].
داده‌هایی که در این مطالعه استفاده شد، مربوط به همه‌گیری COVID-19 است و صرفاً بر زندگی عادی بوداپست تمرکز دارد و تأثیر وضعیت مالی را بر آداب و رسوم حمل‌ونقل ارزیابی می‌کند.

3. کاوش در داده ها

مجموعه داده های مورد استفاده در این مطالعه توسط Vodafone مجارستان ارائه شده است. داده های CDR از بوداپست، پایتخت مجارستان و شهرستان اطراف جمع آوری شد. Vodafone مجارستان یکی از سه اپراتور تلفن همراه ارائه دهنده خدمات در مجارستان است. سهم بازار سه اپراتور بزرگ در مجارستان در چند سال گذشته تغییر قابل توجهی نداشته است. Vodafone مجارستان در سه ماهه دوم سال 2017 در سراسر کشور 25.5% داشت [ 29 ].
ارتباط بین یک دستگاه تلفن همراه و شبکه تلفن همراه را می توان به دو دسته تقسیم کرد: (i) یک ارتباط اداری که ارتباط با سرویس را حفظ می کند، برای مثال، ثبت سوئیچینگ سلولی که می توان آن را ارتباط غیرفعال نامید. (ii) هنگامی که دستگاه بطور فعال از شبکه برای تماس های صوتی، پیام یا انتقال داده استفاده می کند، می توان آن را ارتباط فعال نامید. داده های موجود فقط شامل ارتباط فعال است که پراکنده تر است، بنابراین نمی توان از آن برای ردیابی حرکات مداوم استفاده کرد.
داده‌های خام CDR حاوی نوعی برچسب هش برای شناسایی سیم‌کارت (ماژول هویت مشترک)، یک مهر زمانی است که به 10 ثانیه کوتاه شده است، و یک شناسه سلول، بنابراین، یک مشترک را می‌توان به یک مکان جغرافیایی در یک مکان مشخص نگاشت کرد. زمان. این موارد با نوع مشتری (کسب و کار، مصرف کننده)، نوع اشتراک (پیش پرداخت، پس پرداخت)، سن و جنسیت مشترک و کد تخصیص نوع (TAC) دستگاه گسترش می یابد. TAC هشت رقم اول شماره IMEI (شناسه بین المللی تجهیزات موبایل) است که به سازنده و مدل دستگاهی که سیم کارت در آن فعال است اشاره دارد. این مقادیر نیز در هر رکورد وجود دارد، بنابراین به عنوان مثال می توان تغییرات دستگاه را نیز ردیابی کرد.
در مورد سلول ها، جدول جداگانه ای با شناسه سلول، موقعیت جغرافیایی مرکز سلول، مساحت سلول و فاصله بین مرکز و ایستگاه پایه ارائه شد. این مقادیر تخمینی بر اساس یک حالت لحظه ای هستند، به ویژه با سلول های UMTS به دلیل مکانیسم تنفسی آنها، که می تواند اندازه جغرافیایی منطقه خدمات را برای متعادل کردن بار تغییر دهد. سلول های به شدت بارگذاری شده کوچک می شوند و سلول های مجاور برای جبران رشد می کنند [ 30 ].
منطق این قالب “گسترده” ممکن است این باشد که داده های مشترک و دستگاه را می توان در دوره مشاهده تغییر داد. این اتفاق در حدود 3000 بار در طول دوره مشاهده رخ می دهد. صاحب اشتراک می تواند مشخصات آن را تغییر دهد و البته اگر مثلاً یک تلفن همراه جدید خریداری کرده باشد، دستگاه را تغییر دهد. نوع مشترک و مشتری برای هر سیم کارت ارائه شده بود، اما سن و جنسیت در بسیاری از موارد گم شده بود، احتمالاً به دلیل گزینه های حریم خصوصی درخواست شده توسط مشترک.
سوابق نه نوع فعالیت (تماس صوتی، پیام، انتقال داده) و نه جهت (ورودی، خروجی) را شامل نمی شود و هیچ داده ای توسط اپراتور برای حل TAC ها به سازنده و مدل ارائه نشده است.
مجموعه داده‌های CDR «آوریل، 2017» شامل فعالیت شبکه تلفن همراه کاربران Vodafone از بوداپست (و مناطق اطراف) در آوریل 2017 است. این شامل 955,035,169 سوابق فعالیت از 1,629,275 سیم کارت است. شکل 1 ، توزیع فعالیت بین دسته های فعالیت سیم کارت ها را نشان می دهد. تنها 17.67 درصد از کل سیم کارت هایی که بیش از 1000 سابقه فعالیت دارند، اکثریت (75.48 درصد) از فعالیت تلفن همراه را در طول دوره مشاهده تامین می کنند. شکل 2، توزیع سیم کارت ها را بر اساس تعداد روزهای فعال نشان می دهد. تنها حدود یک سوم (33.23%) سیم کارت ها حداقل در 21 روز مختلف فعالیت دارند. علیرغم تعداد نسبتاً زیاد سیم کارت ها، که در مجموعه داده ها وجود دارد، اکثر آنها به اندازه کافی فعال نیستند تا اطلاعات کافی در مورد عادت های حرکتی خود ارائه دهند. برای معیارهای دقیق انتخاب، به بخش 4.4 مراجعه کنید .

3.1. داده های قیمت املاک

اطلاعات قیمت املاک توسط وب سایت فروش املاک ingatlan.com ارائه شده است. داده ها شامل کمی بیش از 60 هزار مکان املاک، فضاهای طبقه و قیمت های فروش از تبلیغات است. قیمت‌ها ممکن است ارزش واقعی‌ای نباشند که خریدار پرداخت کرده است، اما حتی اگر چانه‌زنی نیز وجود داشته باشد، ترتیب بزرگی باید به طور منطقی دقیق باشد.
داده‌ها مربوط به سال 2018 است، نه مربوط به همان سال داده‌های CDR، اما تفاوت قیمت‌ها بین مناطق بوداپست در طول چند سال گذشته تغییر قابل‌توجهی نداشته است، بنابراین باید برای توصیف میانگین قیمت املاک یک منطقه کافی باشد. برای این کار قیمت یک متر مربع از زیر بنا و قیمت فروش محاسبه می شود. به این ترتیب سطح قیمت دو ملک مختلف در دو نقطه بسیار متفاوت از شهر قابل مقایسه است.

4. روش شناسی

یک چارچوب محاسباتی برای پردازش داده های CDR، از جمله پیش پردازش با ماژول تمیز کردن و ماژول های اختصاص داده شده به مکان های خانه و محل کار یا محاسبه شاخص های تحرک (مانند شعاع چرخش و آنتروپی) ایجاد شده است. این فرآیند ساده شده را می توان در شکل 3 مشاهده کرد.

4.1. آماده سازی داده ها

از آنجایی که داده های دریافتی فرمت گسترده ای داشتند، قبل از وارد کردن به پایگاه داده نرمال سازی شدند. جدول CDR فقط شامل شناسه سیم کارت، مهر زمانی و شناسه سلول است. جدولی برای ذخیره ویژگی های مربوط به سیم کارت (مانند نوع اشتراک، نوع مشتری، سن، جنسیت) و دیگری برای ذخیره ویژگی های سلول (مرکز سلول و مختصات ایستگاه پایه) معرفی شده است.
نوع مشترک و نوع اشتراک برای همه سیم کارت ها ارائه شده است، در حالی که سن، جنسیت اغلب وجود ندارد. برای گروهی از سیم کارت ها، برخی از این مقادیر در طول مجموعه داده تغییر کرده است. این تغییرات می تواند به درستی واقع بینانه باشد زیرا نوع اشتراک تغییر می کند، مشترک (مالکیت) یا طرح اشتراک تغییر می کند و اغلب این تغییر چیزی شبیه به ناشناخته شدن سن شناخته شده یا بالعکس است. این روی 2000 دستگاه از حدود 1.6 میلیون دستگاه تأثیر می گذارد. در این موارد، ویژگی‌های مشترک بدون نامعلوم تنظیم می‌شدند تا تصمیم بگیرند که کدام مقدار باید استفاده شود.

نقشه برداری سلولی

در بیشتر موارد فقط مختصات ایستگاه های پایه توسط اپراتور ارائه می شود، بنابراین، استفاده از ایستگاه های پایه برای نگاشت سوابق جزئیات تماس به مکان های جغرافیایی و استفاده از ایستگاه های پایه در پردازش CDR معمول است [ 3 ، 5 ، 31 ، 32 ، 33 ]. از تسلاسیون Voronoi برای تخمین مساحت تحت پوشش ایستگاه پایه استفاده کنید.
Vodafone مجارستان نه تنها مختصات ایستگاه پایه، بلکه مرکز سلولی (تخمینی) را برای سلول ها ارائه کرد. با این کار، موقعیت سیم‌کارت‌ها با دانه‌بندی دقیق‌تری نسبت به سیم‌کارت‌هایی که فقط مکان‌های ایستگاه پایه دارند، مشخص می‌شود. این به این دلیل است که یک ایستگاه پایه می تواند چندین سلول را سرویس دهد.
سلول های نزدیک در 100 متر با استفاده از الگوریتم DBSCAN بسته Scikit-learn [ 34 ] Python با استفاده از فعالیت سلول به عنوان وزن ادغام می شوند و Tessellation Voronoi برای مرکز سلول های ادغام شده، به طور مشابه در [ 35 ] اعمال می شود. داده های قیمت دارایی (به بخش 3.1 مراجعه کنید ) از طریق این چند ضلعی های voronoi به سلول ها نگاشت می شوند.

4.2. شاخص های تحرک

برخی از شاخص‌ها وجود دارند که به طور گسترده در ادبیات برای توصیف تحرک انسان استفاده می‌شوند، مانند شعاع چرخش، آنتروپی یا فاصله بین مکان‌های خانه و محل کار ( بخش 4.3 ). این شاخص ها برای هر مشترک تعیین می شود.

4.2.1. شعاع چرخش

شعاع چرخش [ 2 ] دایره ای را تعریف می کند که معمولاً می توان یک فرد را در آن یافت. در ابتدا در معادله ( 1 ) تعریف شد، که در آن L مجموعه مکان هایی است که توسط فرد بازدید می شود. rجمترمرکز جرم این مکان ها است، nمنتعداد بازدیدها یا زمان سپری شده در محل i-ام است.

rg=1ن∑من∈Lnمن(rمن-rجمتر)2
4.2.2. K-شعاع چرخش

شعاع K چرخش فقط با استفاده از k پرتکرارترین مکان های فرد [ 6 ]، که با معادله ( 2 ) تعریف شده است، محاسبه می شود. پاپالاردو و همکاران از این رویکرد برای طبقه بندی افراد بر اساس آداب و رسوم حرکتی آنها استفاده کردند. دو کلاس به نام‌های «بازگشت‌کنندگان» و «کاوش‌گران» با مقدار چرخش تعریف شده‌اند. بازگشت کنندگان کسانی هستند که بیشتر وقت خود را بین k ترین مکان ها می گذرانند ( rg(2)>rg/2بر خلاف کاوشگرانی که منطقه فعالیت آنها را نمی توان با k ترین مکان ها توصیف کرد ( rg(2)<rg/2) [ 11 ].

rg(ک)=1نک∑من=1کnمن(rمن-rجمتر(ک))2
4.2.3. آنتروپی

آنتروپی مکان‌های بازدید شده، تنوع حرکات فرد را مشخص می‌کند، که به عنوان معادله ( 3 ) تعریف می‌شود، که در آن L مجموعه مکان‌هایی است که فرد بازدید می‌کند، l یک مکان واحد را نشان می‌دهد.پ(ل)احتمال فعال بودن یک فرد در مکانی l و N تعداد کل فعالیت های یک فرد است [ 16 ، 31 ].

ه=-∑ل∈Lپ(ل)ورود به سیستمپورود به سیستمن
تعمیم آنتروپی عبارت است، تنوع سفر [ 11 ]. به جای تنوع مکان ها، تنوع سفرهای بین مکان های متوالی را تعیین می کند. می توان آن را به انتقال های طول k محاسبه کرد، که در آنک=1آنتروپی مکان را پس می دهد. این امکان وجود دارد که انتقال ها را با جهت یا بدون جهت در نظر بگیریم، مشروط به اینکه تفاوت بین آنها وجود دارد L1→L2و L2→L1مهم است یا نه

4.3. ارزیابی محل کار و منزل

اکثر ساکنان شهرها زمان قابل توجهی از روز را در دو مکان سپری می کنند: خانه و محل کار. برای یافتن رابطه بین این مهم ترین مکان ها و SES، ابتدا باید موقعیت آنها از این مکان ها مشخص شود. چند رویکرد برای یافتن مکان های خانه از طریق تجزیه و تحلیل داده های تلفن همراه استفاده می شود [ 18 ، 36 ، 37 ].
محل کار به عنوان پرتکرارترین سلولی است که دستگاه در ساعات کاری، روزهای کاری در آن حضور دارد. ساعت کاری از 09:00 الی 16:00 در نظر گرفته شده است. مکان خانه به عنوان پرتکرارترین سلولی محاسبه می شود که دستگاه در طول عصر و شب در روزهای کاری (از ساعت 22:00 تا 06:00) و در تمام روز در روزهای تعطیل در آن حضور دارد. اگرچه مردم همیشه آخر هفته‌ها در خانه نمی‌مانند، اما فرض بر این است که بیشتر فعالیت‌ها همچنان از محل زندگی‌شان ایجاد می‌شود.
بیشتر فعالیت های تلفن همراه در طول روز انجام می شود ( شکل 4 را ببینید ) که با فعالیت های کاری مرتبط است. این ممکن است باعث شود که تعیین مکان خانه برای برخی از دستگاه ها نادرست یا حتی غیرممکن باشد.
این روش فرض می کند که همه در طول روز کار می کنند و عصرها استراحت می کنند. اگرچه در سال 2017، 6.2٪ از افراد شاغل به طور منظم در شب در مجارستان کار می کردند [ 38 ]، نسخه فعلی الگوریتم سعی نمی کند با کارگران شبانه برخورد کند. برخی از آنها ممکن است به عنوان یک کارگر عادی شناسایی شوند، اما محل کار و خانه آنها مخلوط است.

4.4. انتخاب سیم کارت های فعال

همانطور که در بخش 3 نشان داده شد ، اکثر سیم کارت ها فعالیت کافی برای ارائه اطلاعات کافی در مورد گمرک جابجایی مشترکین ندارند. بنابراین، تنها آن سیم‌کارت‌ها به اندازه کافی فعال در نظر گرفته می‌شوند، زیرا نشان‌دهنده فعالیت برای حداقل 20 روز، میانگین روزانه در روزهای هفته، حداقل 40 رکورد فعالیت و حداقل 20 در آخر هفته است. علاوه بر این، میانگین فعالیت سیم کارت نمی تواند بیش از 1000 باشد تا سیم کارتی را که احتمالاً در تلفن همراه کار نمی کند، اما مثلاً در مودم 3G، فیلتر کند.
توجه داشته باشید که فعالیت می تواند تماس صوتی، پیام متنی یا انتقال داده باشد، همچنین هر دو ورودی یا خروجی، بنابراین، آنها را نمی توان در مجموعه داده متمایز کرد.

5. تجزیه و تحلیل رفت و آمد

به منظور بررسی قابلیت اطمینان و دقت روش پیشنهادی برای برآورد محل کار و خانه، یک مطالعه مقایسه ای بر روی شاخص های تحرک و اطلاعات پردازش شده از سرشماری کوچک به دست آمده در مجارستان انجام شده است.
در مجارستان، سرشماری هر 10 سال یکبار و سرشماری خرد با جمع 10 درصد در نیم‌فصل انجام می‌شود. آخرین سرشماری در سال 2011 انجام شد، در حالی که آخرین سرشماری خرد در سال 2016 بود. بر اساس این بررسی ها، رفت و آمد به بوداپست در مطالعاتی مانند [ 39 ، 40 ] تجزیه و تحلیل می شود. این مطالعات به عنوان مرجع برای مقایسه نتایج ما برای رفت و آمد استفاده می شود.
شکل 5 ، مقایسه بین CDR و نسبت سفر مسافران بر اساس سرشماری ([ 40 ]، شکل 1) را بر اساس مناطق بوداپست و طبقه بندی مکان خانه نشان می دهد. افرادی که در بوداپست کار می کنند نشان داده می شوند، و محل خانه می تواند (i) همان منطقه ای باشد که یکی در آن کار می کند ( شکل 5 الف)، (2) ناحیه دیگری از بوداپست ( شکل 5 ب)، (iii) تجمع ( شکل 5) ج) و (IV)، سایر سکونتگاه های خارج از تجمع ( شکل 5 د).
توافق خوبی عمدتا در بوداپست در مورد نسبت مسافران پیدا شده است. مهم ترین تفاوت را می توان با دسته “تراکم بیرونی” مشاهده کرد ( شکل 5 د). با این حال، این انحراف از محتوای منبع داده ناشی می شود، زیرا داده های شبکه تلفن همراه، که در این مطالعه استفاده شده است، عمدتاً منطقه بوداپست را پوشش می دهد. همچنین شامل فعالیت های تلفنی از شهرستان اطراف است، اما با دور شدن از بوداپست، داده های موجود کاهش می یابد.
کسری از کارگرانی که خانه های خود را در همان منطقه دارند به داده های سرشماری در مناطق بیرونی (15-23) بسیار نزدیک است، اما به طور کلی در مناطق اصلی (1، 5-9) و مناطق داخلی (2-2) بیش از حد برآورد می شود. 4، 10-14). کارگران گروه نواحی دیگر ( شکل 5 ب) بهترین تطابق را با داده های سرشماری نشان می دهد (جایی که CDR باید بهترین کیفیت را داشته باشد)، در حالی که تجمع در بسیاری از مناطق تا حدودی بیش از حد برآورد شده است.
در [ 39 ]، تجزیه و تحلیل دقیق تری در مورد رفت و آمد از تراکم وجود دارد، که به شش بخش تقسیم می شود و رفت و آمد بر اساس مبدا (بخش خانه، گاهی اوقات بر اساس شهرها) و مقصد (گروه ناحیه بوداپست) بررسی می شود. شکل 6 الف، توزیع مسافران را بر اساس رده های سنی و بخش به عنوان محل خانه نشان می دهد. فقط مسافرانی که در بوداپست کار می کنند بررسی می شوند.
به سختی می توان از روی مقاله متوجه شد که حد بالای رده سنی بالای 60 سال چقدر است. افرادی که معمولاً به سر کار می روند، کمتر از 65 سال سن دارند (به عنوان سن فعلی بازنشستگی در مجارستان)، اگرچه افراد می توانند بالای 65 سال کار کنند. در شکل مبتنی بر CDR ( شکل 6 ب)، 60+ به معنای بالاتر است. 60 و کمتر از 100. با این حال تعداد مشترکین بالای 70 سال زیاد نیست، فقط 1.87 درصد از سیم کارت فعال ( بخش 4.4 ) متعلق به افراد بالای 70 سال است. علاوه بر این، لازم به ذکر است که اطلاعات سن متعلق به صاحب اشتراک است، نه لزوماً به کاربر واقعی تلفن.
با مقایسه داده‌های به‌دست‌آمده از سرشماری کوچک و اطلاعات سلولی، توافق‌های قابل قبولی در مورد روند و معیارهای توزیع مسافران بر اساس رده‌های سنی به دست آمده است. مهم ترین تفاوت بین سرشماری و داده های مبتنی بر CDR در دسته های ’60+’ و ’50-59′ است. اولی می تواند نتیجه تفسیر حد بالایی باشد. این همچنین می‌تواند بر سایر دسته‌ها، به‌ویژه دسته 50–59 تأثیر بگذارد. دسته‌های ’20-29’، ’30-29′ و ’40-49′ نتایج بسیار مشابهی را با هر دو رویکرد نشان می‌دهند. بر اساس شباهت اقدامات تحرک ارائه شده توسط سرشماری و پردازش CDR، به نظر می رسد روش پیشنهادی برای تعیین شاخص های تحرک قابل استفاده باشد.

6. آماده سازی داده ها برای تجزیه و تحلیل آماری

افراد بر اساس میانگین قیمت دارایی محل خانه (سلول) به ده دسته طبقه بندی می شوند، در محدوده قیمتی 0.2 تا 1.2 میلیون HUF/m2 ، سپس میانگین ارزش شاخص ها در طبقات تعیین می شود. شکل 7 ، شعاع چرخش، آنتروپی و فاصله خانه-کار طبقات مالی را نشان می دهد، که در آن فقط فاصله خانه-کار ( شکل 7 ج) تمایل جزئی بین طبقات را نشان می دهد.
Radius of Gyration دایره‌ای را تعریف می‌کند که در آن یک فرد زندگی خود را می‌گذراند و آنتروپی تنوع مکان‌های بازدید شده یک فرد را اندازه‌گیری می‌کند، اما هر دوی آن‌ها به شدت تحت‌تاثیر کیفیت داده‌ها قرار دارند. داده‌های مورد استفاده برای این مقاله فقط شامل آن مکان‌های بازدید شده است، جایی که فعالیت صورت‌حساب (تماس‌های تلفنی، پیام‌های کوتاه یا انتقال داده) اتفاق افتاده است، همه چیز فراتر از آن، نامرئی است. حتی با وجود ارتباطات فعال، آداب و رسوم تحرک یک فرد را می توان توصیف کرد، اما به نظر می رسد این برای تشخیص با استفاده از معیارهای وضعیت مالی کافی نیست.
شکل 7 د، قیمت‌های املاک معمولی مکان‌های کاری را در مقابل قیمت‌های مستغلات مکان‌های خانه با استفاده از نمودار جعبه‌ای بدون نقاط پرت نشان می‌دهد. برای هر دسته قیمت دارایی محل خانه، نمودار جعبه ( شکل 7 د) سیم کارت ها را به سه گروه تقسیم می کند: (1) آنهایی که بین ربع اول و سوم (Q1-Q3)، (ii) آنهایی که زیر چارک اول هستند. بین حداقل و Q1: min-Q1)، و (iii) کسانی که بالاتر از چارک سوم (بین Q3 و حداکثر، Q3-max). ایده این بود که سیم کارت در محدوده بین ربعی (IQR) جدا از سیم کارت های زیر و بالای IQR باشد.
سیم‌کارت‌ها بر اساس دسته‌های قیمت محل کار خانه و محل کار (0.2 تا 1.2 میلیون HUF) و دوازده دسته Radius of Gyration و Entropy (با استفاده از محدوده فاصله 0.5 کیلومتری بین 0.5 تا 20 کیلومتر برای مقادیر Radius of Gyration و Entropy با استفاده از 0.05 گام بین 0.05 و 1.00). ساختار داده های مورد استفاده برای تجزیه و تحلیل مؤلفه اصلی به شرح زیر است. هر ردیف از 40 ستون تشکیل شده است که نشان دهنده 40 سطل شعاع چرخش بین 0.5 تا 20 کیلومتر و 20 ستون نشان دهنده 20 سطل آنتروپی، بین 0.05 و 1.00 است. سطل‌ها حاوی تعداد سیم‌کارت‌هایی هستند که با معیارها نرمال شده‌اند تا بتوان آنها را با هم مقایسه کرد. اگرچه روزهای کاری و تعطیلات در طول کل مطالعه به طور جداگانه در نظر گرفته می شوند، داده ها به صراحت توسط آنها برچسب گذاری نشده اند. همین جدول با استفاده از معیارهای آخر هفته/تعطیلات ساخته شده است و ردیف‌های آن بعد از روزهای هفته اضافه می‌شوند. ستون‌های قیمت دارایی مکان خانه و ستون‌های توصیفگر قیمت دارایی محل کار به الگوریتم PCA ارائه نشده‌اند.

7. نتایج و بحث

در این بخش، خلاصه ای از یافته های مربوط به رابطه شاخص های تحرک و وضعیت اقتصادی اجتماعی کاربران تلفن همراه ارائه شده است.
مجارستان یک کشور معمولی سرمایه محور است. بوداپست مرکز سیاسی، اقتصادی، لجستیکی و فرهنگی کشور است که تقریباً 18٪ از جمعیت در آن زندگی می کنند [ 41 ]. رودخانه دانوب شهر را به دو قسمت بودا (بو دا) و آفت (پش تی) تقسیم می‌کند، اولی منطقه شیک‌تری است و ارزش ملک به‌طور قابل‌توجهی بالاتر است ( شکل 8 a و شکل 9 a را ببینید).
هر سیم کارتی در تلفن همراه کار نمی کند و هر دستگاهی موقعیت خود را تغییر نمی دهد. برخی از دستگاه‌های موجود در مجموعه داده نشان‌دهنده یک مودم 3G یا نوعی دستگاه اینترنت اشیا هستند. اگرچه، یک دستگاه ثابت نیز می تواند در داده های CDR غیر ثابت به نظر برسد، اگر سلولی که متصل است را تغییر دهد، حرکت آنها حداقل است. بنابراین، دستگاه‌هایی با شعاع چرخش کمتر از 1 کیلومتر یا فاصله کار تا خانه، از تجزیه و تحلیل بیشتر حذف می‌شوند.
شکل 8 الف، توزیع مکانی قیمت دارایی را نشان می دهد. توزیع فضایی به وضوح نشان می دهد که سمت بودای بوداپست بسیار گران تر است. سلول هایی با رنگ بسیار روشن در وسط شهر، جزیره مارگارت است که یک منطقه تفریحی با پارک های بزرگ، مراکز ورزشی و هتل ها بدون منطقه مسکونی است و در داده ها هیچ ملکی برای فروش وجود ندارد.
شکل 8 ب و شکل 10 ، میانگین شعاع چرخش افرادی را نشان می دهد که محل خانه آنها در منطقه داده شده تخمین زده می شود. اولی حومه بوداپست و شهرها و روستاهای اطراف را نشان می دهد، دومی در سطح سلولی بر بوداپست تمرکز دارد. گرایش‌های گسترده اساساً یکسان هستند: هر چه فرد از مرکز دورتر باشد، بیشتر سفر می‌کند، اما نقشه سطح سلولی برخی از مراکز شهری محلی را نشان می‌دهد که تصویر را ظریف‌تر می‌کند. تأثیر مراکز شهری محلی بر تحرک، روندها می تواند موضوع جداگانه ای برای بررسی باشد.
یک مدل لایه اجتماعی [ 42 ] برای تمایز SES کاربران استفاده شده است. ما SES آنها را در طبقات قیمت مسکن گروه بندی کردیم. این کلاس‌ها فقط ویژگی‌های سطح گروه را نشان می‌دهند و نمی‌توانند برای مشخص کردن SES فردی استفاده شوند.
دارندگان تلفن همراه بر اساس ارزش های اجتماعی-اقتصادی مرتبط با SES به ترتیب صعودی مرتب شده اند . این رویکرد کاربران تلفن همراه را در کلاس‌های q SES گروه‌بندی می‌کند که مجموع ارزش‌های اجتماعی-اقتصادی در هر طبقه مالک یکسان است (یعنی یکسان به (∑vاسEاس)/qاسEاس). مدل لایه اجتماعی کاربران تلفن را به طبقاتی با اندازه‌های رو به کاهش توزیع می‌کند (هرچه SES کمتر باشد، اعضای کلاس بالاتر هستند)، و بنابراین تفاوت‌های SES در بین کلاس‌ها را می‌توان به طور مؤثرتری تشخیص داد.
روابط بین Radius of Gyration و SES کاربران تلفن در بوداپست تجزیه و تحلیل می شود. ما از قیمت مسکن مرتبط برای نشان دادن SES کاربران تلفن همراه استفاده کردیم. کاربران بر اساس قیمت مسکن به ترتیب صعودی رتبه بندی شده اند. شعاع چرخش ( شکل 11 الف) توزیع نرمال را نشان می دهد با این حال به طور قابل توجهی به سمت راست منحرف شده است (به نظر می رسد شبیه مشاهدات انجام شده در بوستون [ 11 ] باشد). اکثریت ساکنان شعاع چرخش نسبتاً کوچکی دارند. از سوی دیگر، برخی از کاربران تلفن باید مسافت قابل توجهی را طی کنند.
آنتروپی نیز توزیع نرمال را نشان می دهد. اکثریت جمعیت بوداپست از مکان‌های زیادی بازدید می‌کنند (آنتروپی بین 0.2 و 0.6) و در کنار بخش قابل توجهی از مردمی که در همسایگی خانه باقی مانده‌اند (آنتروپی کمتر از 0.2) تنها تعداد کمی از مکان‌های زیادی در شهر بازدید می‌کنند.
توزیع فاصله بین محل کار و خانه ویژگی های نمایی را نشان می دهد شکل 11 ج). اکثریت جمعیت مورد بررسی مکان های کاری نزدیکتر از 5 کیلومتر را انتخاب کرده اند و تعداد نسبتا کمی از مردم باید بیش از 10 کیلومتر را برای کار طی کنند.
فعالیت مردم در روزهای کاری به طور قابل توجهی بیشتر از روزهای آخر هفته است. علاوه بر این، مقادیر بالاتری از شعاع چرخش، آنتروپی و تعداد مکان‌های فعال در جمعه‌ها ثبت شده‌اند که نشان می‌دهد آخرین روز کاری هفته به نوعی نقش ممتاز دارد ( شکل 12 ). در تعطیلات آخر هفته فعالیت های بیشتر و سفرهای پر جنب و جوش بیشتری را می توان در روزهای شنبه مشاهده کرد و بسیاری از ساکنان یکشنبه ها در حال استراحت هستند.
شکل 7 الف، رابطه بین شعاع چرخش و قیمت های عادی مسکن را نشان می دهد. ما کاربران تلفن همراه را در 10 گروه (Q = 10) رتبه بندی کردیم. ما دریافتیم که کاربران تلفن همراه که در محدوده قیمت متوسط ​​(0.5 تا 0.7 میلیون HUF) زندگی می‌کنند، به طور متوسط ​​نسبت به مناطق ارزان‌تر (فقیرتر) شعاع چرخش کمتری دارند. ساکنان مناطق فقیرتر به طور متوسط ​​حدود 5 کیلومتر سفر می کنند در حالی که شعاع چرخش در ساکنان طبقه متوسط ​​و مناطق گران تر کمتر است. این یافته ها را می توان با این واقعیت توضیح داد که میانگین افراد ساکن در خانه های با قیمت متوسط ​​( شکل 7الف) شانس بیشتری برای داشتن فرصت های شغلی و تفریحی متفاوت دارند و بنابراین نیازی به پیمودن مسافت های طولانی تری ندارند. میانگین و محدوده بین ربعی کاربران شبکه تلفن همراه که در گران ترین منطقه زندگی می کنند (بیش از 1.0 میلیون HUF) بزرگتر از منطقه کم هزینه است. این همچنین از این نتیجه می شود که افراد کمتری در مناطق ثروتمندتر خانه دارند و بنابراین میانگین و پراکندگی شعاع چرخش بیشتر است.
شکل 7 ب، روابط بین SES و آنتروپی فعالیت را نشان می دهد که نشانگر تحرک برای توصیف منظم الگوهای سفر و فعالیت روزانه کاربران تلفن اختصاص داده شده است. نتایج نشان‌دهنده تنوع کم در SES برای آنتروپی فعالیت است. مقادیر میانگین هر کلاس قیمت گذاری خانه در محدوده 3.5 تا 4.5 باقی مانده است. یکی از دلایل بالقوه این است که برای اکثر افراد، فعالیت های روزانه آنها عمدتاً در مکان های معدودی (مثلاً محل کار و خانه) متمرکز است. با این حال، یک گرایش کوچک افزایشی متوسط ​​ارزش خانه را می توان مشاهده کرد، که نشان می دهد ساکنانی که در بخش های گران تر زندگی می کنند، از مکان های بیشتری بازدید می کنند. منظم بودن فعالیت‌ها در مکان‌های ثروتمندتر تأثیر کمی بر تنوع فعالیت کاربران تلفن دارد. این یافته با نتایج تجزیه و تحلیل [11 ]. شو نشان داد که سطح ثروت مردم، حداقل در سنگاپور و بوستون، یک عامل محدود کننده نیست، که بر نحوه سفر آنها در شهر تأثیر می گذارد. به نظر می‌رسد که ساکنانی که در مناطق گران‌تر بوداپست زندگی می‌کنند، احتمالاً یا مجبور هستند از مکان‌های بیشتری دیدن کنند تا آنهایی که در مناطق ارزان‌تر خانه دارند.
ما رابطه بین فواصل کار-خانه و SES را بررسی کردیم. شکل 7c، مسافت پیموده شده بین مکان های خانه و شغل را به عنوان تابعی از قیمت های مکان خانه نشان می دهد. روند نزولی مقادیر میانگین فاصله مربوط به قیمت مسکن از پایین تر به قیمت بالاتر ملک نشان می دهد که SES نقش مهمی در میزان سفر ساکنان به محل کار خود دارد. ارزان‌ترین خانه‌ها دورترین خانه‌ها از محل کار هستند (میانگین 8.4 کیلومتر و حداکثر 27.5 کیلومتر)، در حالی که کوتاه‌ترین سفرهای کاری روزانه متعلق به خانه‌هایی است که در رده 0.9 میلیون HUF قرار دارند (میانگین 5.2 کیلومتر و حداکثر آن است. 21.8 کیلومتر). به عبارت دیگر، مردمی که در مناطق فقیرتر زندگی می کنند مجبورند بیشتر به محل کار خود سفر کنند. زمان بیشتری برای رفت و آمد روزانه توسط افرادی که در مکان های ارزان تری زندگی می کنند صرف می شود که ممکن است بر فرصت های آنها برای بازدید از جاذبه های بیشتر در شهر تأثیر بگذارد.شکل 7 ب).
ما همچنین همبستگی قیمت ملک در خانه و محل کار را تجزیه و تحلیل کردیم. ما دریافتیم که وضعیت اقتصادی مکان‌های خانه و محل کار برای هر کاربر تلفن همراه رابطه مستقیمی دارد ( شکل 7)د). مقادیر میانگین بالاتر قیمت مسکن، جایی که افراد ساعات کاری خود را سپری می کنند، به طبقات بالاتر قیمت مسکن تعلق دارند. قابل توجه است که میانگین ارزش ملک در مکان های کاری، بالاتر از طبقات Home برای ساکنانی است که قیمت مسکن آنها بین 0.2 تا 0.6 و 0.9-1.1 میلیون HUF است. محدوده کل (حداکثر-دقیقه) و محدوده Q1-Q3 قیمت ملک در محل کار با قیمت مسکن منازل نسبت معکوس دارد، در محدوده 0.2-0.6 و در محدوده 0.7-1.1 میلیون HUF نسبت مستقیم دارد. این مشاهدات نشان می‌دهد که تعداد کمی از محل‌های کار در مناطق ارزان‌تر بوداپست هستند و بنابراین، اکثر ساکنان ساعات کاری را در مناطق گران‌تر می‌گذرانند. از سوی دیگر، محل های کار محدودی در دسترس است، همچنین در ثروتمندترین مناطق و افرادی که در آنجا خانه دارند، در مناطق ارزان تر کار می کنند. کوچکترین پراکندگی ارزش ملک در محل کار، برای ساکنان ساکن در مناطق قیمتی 0.6 میلیون HUF شهر داده می شود. با این وجود، نتایج درشکل 7 د، نشان می دهد که محل کار و خانه رابطه قابل توجهی دارند.

7.1. خصوصیات SES توسط تجزیه و تحلیل مؤلفه اصلی

رابطه بین معیارهای تحرک (در طول روزهای هفته و آخر هفته) و وضعیت اقتصادی اجتماعی (SES) با استفاده از PCA بررسی شده است.
شکل 13 ، هیستوگرام پارتو را برای 60 جزء نشان می دهد. به نظر می رسد که دو مؤلفه اول (حدود 50 درصد از واریانس توضیح داده شده) برای نشان دادن واریانس متغیرها کافی است. شکل 14 ، دو جزء اول یک تحلیل PCA بدون نظارت اعمال شده را نشان می دهد. سبک‌های نشانگر، رنگ‌ها و اندازه‌ها هر کدام یک برچسب از داده‌ها را نشان می‌دهند. اول، رنگ‌های قهوه‌ای نشان‌دهنده روزهای کاری، رنگ‌های مایل به سبز روزهای تعطیل هستند و به وضوح دو خوشه مجزا را تشکیل می‌دهند، اگرچه ردیف‌های روزهای کاری و روزهای هفته متمایز نبودند. این بدان معناست که اولین اجزای اصلی به اندازه کافی گویا هستند تا بین عادت های تحرک روز کاری و تعطیلات تمایز قائل شوند.
اندازه نشانگر محدوده قیمت ملک موقعیت مکانی خانه را نشان می دهد. تمایل قابل توجهی در امتداد محور PC2 وجود دارد که نشانگرها افزایش می یابند. اگرچه خط روند بیشتر شبیه یک منحنی است که به سمت راست خم می شود، به نظر می رسد نتایج مشترکان ثروتمندتر را متمایز می کند. تحرک منطقه کم هزینه را می توان در قسمت پایین نمودار پیدا کرد و هر چه قیمت ملک بالاتر باشد، موقعیت های عمودی معیارهای تحرک بالاتر است. به نظر می رسد دومین جزء اصلی متغیر مناسبی برای نشان دادن تأثیر قیمت مسکن بر چرخش و آنتروپی باشد. لازم به ذکر است که کوچکترین نشانگرها نامناسب به نظر می رسند. آنها مناطق بسیار ارزانی را نشان می دهند که مناطق مسکونی نیستند، بلکه بیشتر شبیه مناطق صنعتی هستند و تنها تعداد کمی از مشترکین در آن دسته بندی ها طبقه بندی می شوند.
گروه های چارک ذکر شده با نشانگرها و رنگ های مختلف نشان داده شده اند. نمادهایی که معیارهای تحرک گروه min-Q1 را نشان می دهند در سمت چپ هستند و نشانگرهایی که معیارهای تحرک گروه Q3-max را نشان می دهند در سمت راست گروه Q1-Q3 در اکثر گروه های قیمت گذاری خانه قرار دارند. این به این معنی است که اولین مؤلفه اصلی به نظر می‌رسد یک پارامتر تعیین‌کننده باشد تا نه تنها الگوهای تحرک روز کاری و آخر هفته را متمایز کند، بلکه محدوده چارکی دسته‌های قیمت املاک محل خانه را نیز متمایز می‌کند.
محدوده PC1 بین 0.0 و 2.5 شامل نشانگرهای چارک اول در بیشتر موارد است، در حالی که مخلوطی از نمایندگان متعلق به گروه های Q1-Q3 و Q3-max در محدوده 2.5-10.0 قرار دارند. آداب و رسوم جابجایی روزهای هفته افراد متعلق به گروه min-Q1 به طور قابل توجهی با سایر گروه های ساکن متفاوت است. این نشان می‌دهد که حتی این ساکنان در محله‌ای با ارزش مشابه مانند گروه‌های Q1-Q3 زندگی می‌کنند، آنها زندگی خود را متفاوت مدیریت می‌کنند. قابل توجه است که انحراف در پایین ترین و بالاترین رده قیمت مسکن کوچکتر و در محدوده قیمت ملک در سطح متوسط ​​بزرگتر است. به نظر می رسد افرادی که خانه هایی در سطح متوسط ​​قیمت در شهر دارند نسبت به افراد ساکن در مناطق فقیرتر یا ثروتمندتر عادت های متنوع تری دارند.
ویژگی های تحرک، مربوط به ساکنان مرتبط با گروه های Q1-Q3 و Q3-max، کاملا مشابه است. در محدوده PC1 بین 2.5 و 5.0، چندین نشانگر از گروه های مختلف و دسته های مختلف قیمت مسکن با یکدیگر همپوشانی دارند. نشانگرهای روی نمودار (یعنی در محدوده PC2 بین 0.0 و 0.2-) احتمالاً نشان می‌دهند که ساکنانی که در مقوله‌های ارزان‌ترین و متوسط ​​سطح قیمت زندگی می‌کنند، اگر به Q1-Q3 و Q3-max تعلق داشته باشند، به طور مستقل الگوهای سفر بسیار مشابهی دارند. گروه ها. همچنین قابل توجه است که در روزهای هفته و تعطیلات آخر هفته، آداب و رسوم تردد ثروتمندترین ولسوالی ها کاملاً از سایرین جدا می شود.

7.2. محدودیت های این مطالعه

این مطالعه چند محدودیت داشت. ما ساکنان را با میانگین ارزش دارایی در محل سلول خانه آنها (یعنی چند ضلعی های Voronoi) مرتبط کردیم. در برخی از مناطق شهر، که تراکم دکل های تلفن همراه کم است، این رویکرد می تواند منجر به عدم دقت در SES ساکنان شود (قیمت مسکن در مناطق نسبتا بزرگتر متفاوت است). تنها از یک متغیر (قیمت مسکن) استفاده شده است، سایر عوامل اجتماعی- جمعیتی در نظر گرفته نشده است. اندازه خانواده و خانواده، سطح تحصیلات و غیره از ابعاد ضروری SES هستند. مطالعات آتی برنامه ریزی شده است تا پارامترهای بیشتری را برای توصیف ویژگی های اقتصادی ساکنان در بر گیرد.

7.3. کار آینده

یکی از پیشرفت‌های احتمالی تحقیقات استفاده از منابع داده دقیق‌تر برای طبقه‌بندی مالی، به عنوان مثال، نوع و قیمت تلفن‌های همراه است. ترکیبی از قیمت ملک در اطراف محل خانه و قیمت دستگاه تلفن همراه ممکن است نتیجه بهتری ارائه دهد.
با استفاده از یک مجموعه داده که حاوی اطلاعاتی در مورد هر دو شرکت کننده در تماس است، نه تنها شبکه اجتماعی می تواند ساخته شود، بلکه می توان آن شبکه را با وضعیت مالی مشترکین وزن کرد.
ممکن است بتوان با بررسی مکان‌های بازدید شده، از ثروتمندترین طبقات، که در مناطقی با رستوران‌های زیباتر، تئاترها و غیره خارج از ساعات کاری معمولی ظاهر می‌شوند، این کار را بهبود بخشید.

8. نتیجه گیری

در این مطالعه، آداب و رسوم سفر جمعیت زیادی در بوداپست (مجارستان) با استفاده از Call Detail Records بررسی شده است. همراه با شاخص‌های تحرک، محاسبه‌شده از داده‌های شبکه تلفن همراه، قیمت املاک و مستغلات برای نشان دادن وضعیت اجتماعی و اقتصادی افراد ساکن در یک منطقه خاص استفاده می‌شود. به منظور یافتن و ارزیابی همبستگی بین الگوهای تحرک انسانی و وضعیت اجتماعی-اقتصادی ساکنان، در بوداپست، یک چارچوب تحلیلی بر روی مجموعه داده‌های همراه شبکه‌های تلفن همراه و قیمت املاک و مستغلات استفاده شده است.
شعاع چرخش، آنتروپی و فاصله اقلیدسی بین مکان‌های خانه و محل کار از داده‌های شبکه تلفن همراه استخراج شده و به عنوان شاخص‌های تحرک برای توصیف الگوهای سفر ساکنان استفاده شده است. قیمت ملک خانه ها برای نشان دادن وضعیت اجتماعی-اقتصادی آنها اعمال شده است. ما روش ادغام داده‌ها را برای تعیین کمیت SES (وضعیت اجتماعی اقتصادی) کاربران تلفن همراه در سطح کل انجام دادیم.
با بررسی روابط بین SES و سه شاخص تحرک، دریافتیم که سطح ثروت در بوداپست تأثیر خاصی بر آداب سفر دارد. قیمت املاک و مستغلات سایت‌های خانگی، تأثیر قابل‌توجهی بر تعداد مکان‌های بازدید شده (آنتروپی) و چرخش ندارد، که نشان می‌دهد تنوع سفر ساکنان، به شدت به وضعیت اجتماعی-اقتصادی آنها وابسته نیست.
از سوی دیگر، میانگین فاصله خانه و محل کار به طور قابل توجهی با ارزش اموال مرتبط است. مردمی که در مناطق ارزان‌تر زندگی می‌کنند باید مسیرهای طولانی‌تری را به سمت محل کار خود طی کنند. دلیل این رابطه را می توان با این واقعیت توضیح داد که مناطق ارزان تر در حاشیه شهر واقع شده اند، در حالی که بیشتر سایت های کاری در مناطق ثروتمندتر هستند. با تجزیه و تحلیل ارزش املاک و مستغلات در خانه و محل کار ساکنان، یک رابطه مثبت قوی پیدا کردیم. زندگی در یک محله گران قیمت در بوداپست، مستلزم کار در مناطق گران تر و بالعکس است.
تجزیه و تحلیل مؤلفه اصلی شباهت ها و تفاوت های رفتار حرکتی ساکنان ساکن در دسته های مختلف سطح قیمت را نشان داد. همبستگی آداب و رسوم تحرک و SES می تواند به طور موثر برای حمایت از فعالیت های حمل و نقل عمومی، توسعه املاک و مستغلات و خرده فروشی استفاده شود.
ما همچنین ارتباط رفتار حرکتی و SES را با انجام PCA (تحلیل اجزای اصلی) ارزیابی کردیم. نتایج نشان داد که دو مؤلفه اول می‌توانند برای تمایز الگوهای تحرک روز کاری و آخر هفته و همچنین دسته‌های قیمت املاک محل خانه کافی باشند. از داده‌های شبکه تلفن همراه نیز می‌توان برای تجزیه و تحلیل رفت‌وآمد، مشابه داده‌های سرشماری، استفاده کرد، حتی اگر وضوح مکانی آن دقیق نباشد. روند رفت و آمد بین بخش‌های معین تجمع و گروه‌های منطقه بوداپست به اندازه کافی مطابقت دارد که می‌توان گفت که Call Detail Records می‌تواند راه‌حلی ارزان‌تر، موقت و دقیق‌تر برای رفت و آمد و احتمالاً انواع دیگر مطالعات جامعه‌شناختی باشد.
در نتیجه، این تحقیق بر شناسایی پیوندهای پنهان یا نامشخص، بین تحرک انسان و وضعیت اجتماعی-اقتصادی متمرکز شد. بدین منظور، این کار موفق بوده است. رویکرد و حتی چارچوب توسعه یافته در اینجا، می تواند برای مکان های مختلف اعمال شود. از یافته ها می توان برای درک دقیق تر و کارآمدتر شرایط و شرایط زندگی روزمره برای افرادی که در محیط های شهری مدرن زندگی می کنند استفاده کرد.

مشارکت های نویسنده

مفهوم سازی، Gergő Pintér و Imre Felde. روش شناسی، Gergő Pintér; نرم افزار Gergő Pintér; اعتبار سنجی، Gergő Pintér و Imre Felde. تحلیل رسمی، Gergő Pintér; تحقیق، ایمره فلد; منابع، Imre Felde; مدیریت داده ها، Gergő Pintér; نوشتن – آماده سازی پیش نویس اصلی، Gergő Pintér و Imre Felde. نوشتن – بررسی و ویرایش، Gergő Pintér و Imre Felde. تجسم، Gergő Pintér; نظارت، ایمره فلده؛ مدیریت پروژه، Imre Felde. کسب سرمایه، ایمره فلد. همه نویسندگان نسخه منتشر شده نسخه خطی را خوانده و با آن موافقت کرده اند.

اختصارات

در این نسخه از اختصارات زیر استفاده شده است:
CDR ضبط جزئیات تماس
IMEI شناسه بین المللی تجهیزات موبایل
سیم کارت ماژول هویت مشترک
TAC کد تخصیص را تایپ کنید
WGS 84 سیستم ژئودتیک جهانی که با نام EPSG:4326 نیز شناخته می شود
SES وضعیت اقتصادی اجتماعی

منابع

  1. باتی، م. Axhausen، KW; جیانوتی، اف. پوزدنوخوف، ا. بذانی، ع. واچوویچ، ام. اوزونیس، جی. پرتغالی، ی. شهرهای هوشمند آینده. یورو فیزیک J. Spec. بالا. 2012 ، 214 ، 481-518. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  2. گونزالس، ام سی؛ هیدالگو، کالیفرنیا؛ Barabasi, AL درک الگوهای حرکتی فردی انسان. Nature 2008 , 453 , 779. [ Google Scholar ] [ CrossRef ]
  3. کاندیا، جی. گونزالس، ام سی؛ وانگ، پی. شونهارل، تی. مدی، جی. Barabási، AL کشف پویایی فردی و جمعی انسان از سوابق تلفن همراه. J. Phys. یک ریاضی نظریه. 2008 ، 41 ، 224015. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  4. کالابرس، اف. کولونا، ام. لوویسولو، پی. پاراتا، دی. Ratti, C. نظارت بر شهری در زمان واقعی با استفاده از تلفن های همراه: مطالعه موردی در رم. IEEE Trans. هوشمند ترانسپ سیستم 2011 ، 12 ، 141-151. [ Google Scholar ] [ CrossRef ]
  5. Csáji، BC; برویت، ا. Traag، VA; دلون، جی سی; هوئنس، ای. ون دورن، پی. اسموردا، ز. Blondel, VD بررسی تحرک کاربران تلفن همراه. فیزیک یک آمار مکانیک. برنامه آن است. 2013 ، 392 ، 1459-1473. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  6. پاپالاردو، ال. سیمینی، اف. رینزیویلو، اس. پدرشی، دی. جیانوتی، اف. Barabási، AL دوگانگی بازگشت کنندگان و کاشفان در تحرک انسان. نات. اشتراک. 2015 ، 6 ، 8166. [ Google Scholar ] [ CrossRef ] [ PubMed ] [ نسخه سبز ]
  7. سکاج، ع. مامه ای، م. Bicocchi، N. شناسایی مجدد مجموعه داده های CDR ناشناس با استفاده از داده های شبکه اجتماعی. در مجموعه مقالات کنفرانس بین المللی IEEE 2014 در کارگاه های آموزشی فراگیر محاسبات و ارتباطات (PERCOM WORKSHOPS)، بوداپست، مجارستان، 24 تا 28 مارس 2014. صص 237-242. [ Google Scholar ]
  8. هوانگ، ز. لینگ، ایکس. وانگ، پی. ژانگ، اف. مائو، ی. لین، تی. Wang، FY مدلسازی تحرک انسان در زمان واقعی بر اساس تلفیق داده های تلفن همراه و حمل و نقل. ترانسپ Res. قسمت C Emerg. تکنولوژی 2018 ، 96 ، 251-269. [ Google Scholar ] [ CrossRef ]
  9. فورنو، ا. ال فوزی، NE; فیوره، ام. Stanica، R. تلفیق کاوشگر GPS و داده های تلفن همراه برای تشخیص کاربری پیشرفته زمین. در مجموعه مقالات پنجمین کنفرانس بین المللی IEEE در سال 2017 در مورد مدل ها و فناوری ها برای سیستم های حمل و نقل هوشمند (MT-ITS)، ناپل، FL، ایالات متحده آمریکا، 26 تا 28 ژوئن 2017؛ صص 693-698. [ Google Scholar ]
  10. پاپالاردو، ال. پدرشی، دی. اسموردا، ز. Giannotti، F. استفاده از داده های بزرگ برای مطالعه ارتباط بین تحرک انسانی و توسعه اجتماعی-اقتصادی. در مجموعه مقالات کنفرانس بین المللی IEEE در سال 2015 درباره داده های بزرگ (داده های بزرگ)، سانتا کلارا، کالیفرنیا، ایالات متحده آمریکا، 29 اکتبر تا 1 نوامبر 2015؛ صص 871-878. [ Google Scholar ]
  11. خو، ی. بلی، ا. بوجیک، آی. راتی، سی. تحرک انسانی و وضعیت اجتماعی-اقتصادی: تجزیه و تحلیل سنگاپور و بوستون. محاسبه کنید. محیط زیست سیستم شهری 2018 ، 72 ، 51-67. [ Google Scholar ] [ CrossRef ]
  12. آهنگ، سی. کورن، تی. وانگ، پی. Barabási، AL مدل سازی خواص مقیاس پذیری تحرک انسان. نات. فیزیک 2010 ، 6 ، 818-823. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  13. پریجا، اس آر. ساهو، پی کی; سینگ، الگوی تحرک SS کاربر فردی در شبکه تلفن همراه پویا با استفاده از رکورد داده تماس. بین المللی جی. وایرل. اوباش محاسبه کنید. 2019 ، 17 ، 23-35. [ Google Scholar ] [ CrossRef ]
  14. هانسون، اس. هانسون، پی. الگوهای سفر-فعالیت ساکنان شهری: ابعاد و روابط با ویژگی های اجتماعی جمعیت شناختی. اقتصاد Geogr. 1981 ، 57 ، 332-347. [ Google Scholar ] [ CrossRef ]
  15. کوان، جنسیت MP، پیوند خانه و کار، و الگوهای فضا-زمان فعالیت‌های غیر استخدامی. اقتصاد Geogr. 1999 ، 75 ، 370-394. [ Google Scholar ] [ CrossRef ]
  16. کوتینو، سی. ونهوف، ام. شاخص های تلفن همراه و ارتباط آنها با سازمان اجتماعی-اقتصادی شهرها. ISPRS Int. J. Geo-Inf. 2019 ، 8 ، 19. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  17. پخریال، ن. Jacques, DC ترکیب منابع داده های متفاوت برای پیش بینی و نقشه برداری بهبود فقر. Proc. Natl. آکادمی علمی USA 2017 ، 114 ، E9783–E9792. [ Google Scholar ] [ CrossRef ] [ PubMed ][ نسخه سبز ]
  18. خو، ی. شاو، اس ال. ژائو، ز. یین، ال. نیش، ز. لی، کیو. درک کل الگوهای تحرک انسان با استفاده از داده های موقعیت مکانی تلفن همراه منفعل: یک رویکرد مبتنی بر خانه. حمل و نقل 2015 ، 42 ، 625-646. [ Google Scholar ] [ CrossRef ]
  19. بلومن استاک، جی. کادامورو، جی. در، R. پیش بینی فقر و ثروت از فراداده تلفن همراه. Science 2015 ، 350 ، 1073-1076. [ Google Scholar ] [ CrossRef ] [ PubMed ][ نسخه سبز ]
  20. شپانوویچ، اس. میشکوسکی، آی. هوی، پی. نورمینن، JK; Ylä-Jääski, A. داده های تماس تلفن همراه به عنوان یک شاخص پراکسی اجتماعی-اقتصادی منطقه ای. PLoS ONE 2015 ، 10 ، e0124160. [ Google Scholar ] [ CrossRef ] [ PubMed ][ نسخه سبز ]
  21. کاستیو، جی. لایدرا، اف. گواراندا، مگابایت؛ لارا، پی. Vaca, C. سکوت کانتون ها: برآورد وضعیت اجتماعی-اقتصادی روستاها از طریق داده های تلفن همراه. در مجموعه مقالات کنفرانس بین المللی 2018 در مورد دموکراسی الکترونیک و دولت الکترونیک (ICEDEG)، آمباتو، اکوادور، 4 تا 6 آوریل 2018؛ صص 172-178. [ Google Scholar ]
  22. باربوسا، اچ. هزاری، س. دیکنسون، بی. باسولاس، ا. فرانک، ا. کاوتز، اچ. سادیلک، ع. راماسکو، جی جی. Ghoshal, G. کشف جنبه های اجتماعی-اقتصادی تحرک انسانی. arXiv 2020 ، arXiv:2012.00838. [ Google Scholar ]
  23. بردار، س. گاوریچ، ک. Ćulibrk، D. Crnojević، V. پرده برداری از اپیدمیولوژی فضایی HIV با داده های تلفن همراه. علمی Rep. 2016 , 6 , 19342. [ Google Scholar ] [ CrossRef ] [ PubMed ] [ نسخه سبز ]
  24. Salathé, M. اپیدمیولوژی دیجیتال: چیست و به کجا می رود؟ زندگی علمی. Soc. سیاست 2018 ، 14 ، 1-5. [ Google Scholar ] [ CrossRef ]
  25. ویلبرگ، ای. جرو، او. وایسنن، تی. Toivonen, T. فرار از شهرها در طول بحران COVID-19: استفاده از داده های تلفن همراه برای ردیابی تحرک در فنلاند. ISPRS Int. J. Geo-Inf. 2021 ، 10 ، 103. [ Google Scholar ] [ CrossRef ]
  26. بوشمن، ک. پلکرینیس، ک. لابرینیدیس، الف. اثربخشی و انطباق با فاصله گذاری اجتماعی در طول COVID-19. arXiv 2020 ، arXiv:2006.12720. [ Google Scholar ]
  27. گائو، اس. رائو، جی. کانگ، ی. لیانگ، ی. کروزه، جی. دوپفر، دی. ستی، AK; ریس، JFM; Yandell، BS; پاتز، JA انجمن داده‌های مکان تلفن همراه نشان‌دهنده سفر و اقامت در خانه با نرخ عفونت COVID-19 در ایالات متحده است. JAMA Netw. باز کردن 2020 , 3 , e2020485. [ Google Scholar ] [ CrossRef ]
  28. دو لی، دبلیو. کیان، م. شوانن، تی. ارتباط بین وضعیت اجتماعی-اقتصادی و کاهش تحرک در مراحل اولیه اپیدمی COVID-19 انگلستان. Health Place 2021 , 69 , 102563. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  29. سازمان ملی رسانه و ارتباطات اطلاعات، مجارستان. A Nemzeti Média- és Hírközlési Hatóság Mobilpiaci Jelentése 2015. IV.–2019. II. نگیدف _ گزارش فنی؛ سازمان ملی رسانه و ارتباطات اطلاعاتی: بوداپست، مجارستان، 2019. [ Google Scholar ]
  30. العکایدی، م. علی، ح. تجزیه و تحلیل عملکرد بخش بندی آنتن در تنفس سلولی. در مجموعه مقالات چهارمین کنفرانس بین‌المللی فناوری‌های ارتباطات سیار 3G، لندن، انگلستان، 25 تا 27 ژوئن 2003. [ Google Scholar ]
  31. پاپالاردو، ال. ونهوف، م. گابریلی، ال. اسموردا، ز. پدرشی، دی. Giannotti، F. چارچوبی تحلیلی برای ارائه بهزیستی با استفاده از داده های تلفن همراه. بین المللی J. Data Sci. مقعدی 2016 ، 2 ، 75-92. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  32. ونهوف، م. اسکورز، دبلیو. ون رومپی، آ. پلوتز، تی. اسموردا، ز. مقایسه الگوهای منطقه ای حرکت فردی با استفاده از آنتروپی تحرک تصحیح شده. J. فناوری شهری. 2018 ، 25 ، 27–61. [ Google Scholar ] [ CrossRef ]
  33. نووویچ، او. بردار، س. مساروش، م. کرنویویچ، وی. پاپادوپولوس، AN کشف رابطه بین پویایی اتصالات انسانی و کاربری زمین. ISPRS Int. J. Geo-Inf. 2020 ، 9 ، 140. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  34. پدرگوسا، اف. واروکو، جی. گرامفورت، آ. میشل، وی. تیریون، بی. گریزل، او. بلوندل، م. پرتنهوفر، پی. ویس، آر. دوبورگ، وی. و همکاران Scikit-Learn: یادگیری ماشینی در پایتون. جی. ماخ. فرا گرفتن. Res. 2011 ، 12 ، 2825-2830. [ Google Scholar ]
  35. فیادینو، پ. پونس لوپز، وی. آنتونیو، جی. تورنت-مورنو، ام. D’Alconzo، A. Call Detail Records for Human Mobility Studies: بررسی وضعیت در “عصر همیشه متصل”. در مجموعه مقالات کارگاه تجزیه و تحلیل داده های بزرگ و یادگیری ماشین برای شبکه های ارتباطی داده، لس آنجلس، کالیفرنیا، ایالات متحده آمریکا، 7 اوت 2017؛ ص 43-48. [ Google Scholar ]
  36. آحاس، ر. سیلم، اس. جرو، او. سالویر، ای. Tiru, ​​M. استفاده از داده های موقعیت یابی تلفن همراه برای مدل سازی مکان های معنی دار برای کاربران تلفن های همراه. J. فناوری شهری. 2010 ، 17 ، 3-27. [ Google Scholar ] [ CrossRef ]
  37. بوجیک، آی. ماسارو، ای. بلی، ا. سوبولفسکی، اس. Ratti, C. انتخاب روش مناسب تعریف مکان خانه برای مجموعه داده داده شده. در مجموعه مقالات کنفرانس بین المللی انفورماتیک اجتماعی، پکن، چین، 9 تا 12 دسامبر 2015. صص 194-208. [ Google Scholar ]
  38. یورواستات افراد شاغل که در شب کار می کنند به عنوان درصدی از کل اشتغال، بر اساس جنسیت، سن و وضعیت حرفه ای. 2020. در دسترس آنلاین: https://appsso.eurostat.ec.europa.eu/nui/show.do?dataset=lfsa_ewpnig&lang=en (در 31 مارس 2020 قابل دسترسی است).
  39. لاکاتوش، م. Kapitány، G. تحرک روزانه نیروی کار (رفت و آمد) و سفر در بوداپست و در کلان شهر بر اساس داده های سرشماری جمعیت. قسمت دوم. Területi Statisztika 2016 ، 56 ، 209-239. [ Google Scholar ] [ CrossRef ]
  40. کولتای، ال. Varró، A. Ingázás a budapesti agglomerációban. Új munkaügyi szemle 2020 ، 1 ، 26-37. [ Google Scholar ]
  41. Központi Statisztikai Hivatal. بوداپست–Gazdaság és Társadalom ; Központi Statisztikai Hivatal: بوداپست، مجارستان، 2018; شابک 978-963-235-541-2. [ Google Scholar ]
  42. لئو، ی. فلوری، ای. آلوارز-هاملین، جی. ساراوت، سی. کرسایی، م. همبستگی‌های اجتماعی و اقتصادی و قشربندی در شبکه‌های ارتباطی اجتماعی. JR Soc. رابط 2016 ، 13 ، 20160598. [ Google Scholar ] [ CrossRef ] [ PubMed ] [ نسخه سبز ]
شکل 1. سیم کارت ها در مجموعه داده 2017-04 طبقه بندی شده بر اساس تعداد سوابق فعالیت. دسته بندی ها عبارتند از: فقط 1 رکورد، 1 تا 10 رکورد، 10 تا 100 رکورد، 100 تا 1000 رکورد و بیش از 1000 رکورد. سیم کارت های رده آخر (17.7 درصد سیم کارت ها) بیشترین (75.48 درصد) فعالیت را به خود اختصاص می دهند.
شکل 2. توزیع سیم کارت در مجموعه داده های 2017-04 بر اساس تعداد روزهای فعال.
شکل 3. پردازش ساده داده های تلفن همراه به همراه اطلاعات سلولی و داده های قیمت املاک که برای تعیین وضعیت مالی مشترکین استفاده می شود.
شکل 4. توزیع فعالیت تلفن همراه بر اساس روزهای هفته و ساعات بر اساس مجموعه داده 2017. دوشنبه ها و جمعه ها به اندازه روزهای کاری دیگر روشن نیستند، احتمالاً به دلیل دوشنبه عید پاک و جمعه خوب که در مجارستان تعطیل هستند.
شکل 5. مقایسه بین CDR و نسبت های رفت و آمد مبتنی بر سرشماری (داده های [ 40 ]، شکل 1).
شکل 6. مقایسه رفت و آمد به بوداپست از بخش های تجمع بر اساس رده های سنی.
شکل 7. شاخص ها بر اساس طبقه بندی مالی.
شکل 8. چند ضلعی های Voronoi سلول های تلفن همراه ادغام شده با قیمت های دارایی و شعاع چرخش رنگ شده اند. رودخانه دانوب با رنگ سفید نشان داده می شود و سلول های بدون داده کافی با خاکستری روشن رنگ می شوند.
شکل 9. توزیع‌های قیمت دارایی: ( الف ) توزیع نمونه‌های قیمت دارایی را نشان می‌دهد که توسط بودا و آفت شهر متمایز شده‌اند، و ( ب ) توزیع قیمت‌های مکان خانه افراد را نشان می‌دهد.
شکل 10. مناطق بوداپست و سکونتگاه های تجمع با میانگین شعاع چرخش (کیلومتر) برای روزهای کاری رنگ آمیزی شده اند. گرایش این است که هر چه فردی از مرکز شهر دورتر باشد، بیشتر سفر می کند. مرز سفید نشان دهنده مرز اداری بوداپست است و دانوب با آبی روشن نشان داده می شود.
شکل 11. هیستوگرام شعاع چرخش ( a )، آنتروپی ( b ) و فاصله مکان خانه-کار ( c ).
شکل 12. تفاوت بین روزهای کاری (آبی) و تعطیلات (نارنجی) واضح است. ستون های نارنجی نشان دهنده تعطیلات هستند، 14 آوریل 2017 جمعه خوب و 17 آوریل 2017 دوشنبه عید پاک بود که تعطیلات در مجارستان است.
شکل 13. هیستوگرام پارتو برای 60 جزء تجزیه و تحلیل مؤلفه اصلی.
شکل 14. نمودار پراکندگی PCA 2 جزئی. اندازه های نشانگر دسته HomePrice، رنگ/نوع دسته WorkPrice و همچنین نوع روز (روز هفته/آخر هفته) را نشان می دهد.

بدون دیدگاه

دیدگاهتان را بنویسید