1. معرفی
مطالعه استخراج اطلاعات ارزشمند و به دست آوردن بینش مفید از داده های مکانی-زمانی در سال های اخیر اهمیت زیادی یافته است. با توجه به محبوبیت شبکه های اجتماعی مبتنی بر مکان (LBSN) در عصر مدرن، در دسترس بودن حجم عظیمی از اطلاعات تولید شده توسط کاربران، به ویژه از نقطه نظر عملی بسیار ارزشمند شده است. اطلاعات استخراجشده از این دادهها را میتوان در بسیاری از زمینههای کاربردی، مانند تجزیه و تحلیل جریانهای حملونقل عمومی، توصیههای مکان، تخمین تراکم جمعیت، برنامهریزی مسیر، مدیریت بلایا و بسیاری موارد دیگر مورد استفاده قرار داد .]. خدمات آنلاین کاربران مختلف را تشویق میکنند تا فعالیتها و علایق خود را با دوستان اجتماعی خود به اشتراک بگذارند، و علاوه بر این، حجم عظیمی از دادهها را تولید میکنند و محققان را قادر میسازد تا فعالیتها، الگوها و ترجیحات کاربران را با دقت بیشتری درک کنند. این خدمات آنلاین اطلاعات کاربران را با در نظر گرفتن موقعیت مکانی آنها در زمان واقعی ارائه و ذخیره می کنند. دادههای جمعآوریشده از طریق چنین سرویسهای آنلاین به طور کلی با چند رسانه، متن، موقعیت جغرافیایی و ابرداده غنی میشوند که میتوانند بیشتر برای انجام مطالعات در مورد جنبههای مختلف رفتار انسانی مورد استفاده قرار گیرند.
در سالهای اخیر، مطالعات متعددی برای تحلیل و مدلسازی فعالیتهای انسانی بر اساس دادههای مکانی-زمانی انجام شده است [ 2 ]. پرکاربردترین دادههای مورد استفاده در مطالعات اخیر شامل ورود کاربران از LBSNهای مختلف است، علیرغم این واقعیت که آنها مشکلات نمونهگیری مانند سوگیری در جنسیت، سن و طبقات اجتماعی را ایجاد میکنند. اصطلاح “check-in” به این معنی است که کاربر موقعیت خود را در LBSN در حالی که مشغول فعالیت در یک مکان خاص است تأیید می کند یا کاربر هنگام ارسال پیام در چنین شبکه ای به طور خودکار مکان خود را با شخصی به اشتراک می گذارد [ 3 ] ، 4 ]. با رشد تصاعدی در استفاده از برنامه هایی که شامل خدمات مبتنی بر مکان هستند، مانند Facebook [ 5 ]، Twitter [ 6 ]و Foursquare [ 7 ] در سراسر جهان، و همچنین Weibo [ 8 ] در چین، مطالعات زیادی برای شناسایی روابط و استخراج الگوهای بین کاربران مانند مردان و زنان، گروههای با تحصیلات بالا یا کم سواد، طبقهبندی سنی، انجام شده است. و غیره این الگوها منعکس کننده ویژگی های عملکردی در داخل شهر و همچنین در بین شهرهای مختلف هستند [ 9 ، 10 ، 11 ]. Weibo نه تنها در بین کاربران، بلکه در بین محققان نیز مشهور است، زیرا دادههای بررسی ورود از Weibo میتواند برای انجام انواع مختلف مطالعات به منظور استخراج اطلاعات مفید بر اساس دادههای موقعیت جغرافیایی که ارائه میکند، مورد استفاده قرار گیرد. به عنوان مثال، برخی از مطالعات اخیر تصادفات جاده ای در شانگهای را تجزیه و تحلیل کرده اند [ 12]، رشد مرزهای شهری در پکن را بررسی کرد [ 13 ]، ویژگی های جاذبه مکان گردشگری را با استفاده از داده های Weibo از دوره 2012-2014 [ 14 ] تجزیه و تحلیل کرد، و جنسیت را به صورت مکانی-زمانی در پکن تحلیل کرد [ 15 ]. بیشتر این مطالعات بررسیهای کاربران خاص یا زمینههای کاربردی خاص، مانند گردشگری، مرزهای شهر، تصادفات جادهای، عجلههای جشنواره بهاری و جنسیت را پوشش دادهاند [ 16 ]]. با این حال، تا آنجا که ما میدانیم، هیچ مطالعه جامعی بر اساس دادههای Weibo شانگهای وجود ندارد که تجزیه و تحلیل زمانی و مکانی را با هم ترکیب کند و در عین حال ویژگیها و ماهیت بررسیهای مکانهای مختلف را در نظر بگیرد. بنابراین، ما سه نوع تجزیه و تحلیل مختلف را بر روی دادههای اعلام حضور از Weibo به مدت شش ماه (اول ژانویه 2017 تا 30 ژوئن 2017) در شانگهای انجام دادیم که تجزیه و تحلیلهای مکانی-زمانی را با طبقهبندی مکانهای مجزا و جنبههای مختلف ورود کاربران پوشش میداد. داده ها.
این مقاله سه سهم کلیدی دارد. ابتدا، ما یک تجزیه و تحلیل زمانی از الگوهای ساعتی تا هفتگی، و برای کل دوره مطالعه (180 روز)، از دادههای ثبت نام بهدستآمده از معروفترین LBSN چین، Weibo، ارائه میکنیم و بیش از 220000 مراجعه جمعآوری شده در شش مورد را در نظر میگیریم. ماه ها. دوم، ما از مجموعه دادهها برای طبقهبندی و مطالعه 10 نوع مختلف دستهبندی مکان استفاده میکنیم، که در آن هر مکان حداقل 100 بار در طول دوره مطالعه بازدید شده است. سوم، ما یک تجزیه و تحلیل فضایی برای مکان نقشه برداری هر مکان انجام دادیم، و پس از آن، تراکم را برای به دست آوردن نتایج برای درک بهتر از غلظت معمولی پذیرش در نزدیکی مرکز شهر با بینش اضافی در مورد مکان موسسات آموزشی و مسکونی تخمین زدیم. مناطق عمدتاً به تنوع داده ها در سرتاسر شهر شانگهای کمک می کردند.17 ] که در بین محققین محبوبیت دارد، برای کشف الگوهای مختلف در داده ها با توجه به زمان. ما هم نمودارهای گرافیکی و هم نتایج آماری را با بحث های مفصل برای درک روشنی از یافته های تحقیق ارائه می کنیم. طبقه بندی مکان ورود با استفاده از داده های جغرافیایی از مجموعه داده ها و اطلاعات مکان های فیزیکی در شهر شانگهای انجام شد. طبقه بندی بر اساس ماهیت، هدف و ویژگی های مکان های ورود انجام شد. به عنوان مثال، ورود با طول و عرض جغرافیایی یک دانشگاه به رده “آموزشی” تعلق دارد، در حالی که مکان پذیرش در رستوران های مختلف در رده “غذا” است. برای تجزیه و تحلیل فضایی، از ArcMap، تکنیک تخمین تراکم هسته (KDE) [ 18 ] و دادههای مکانی (فایلهای شکل) از OpenStreetMap [ 18] استفاده کردیم.19 ].
بقیه مقاله به شرح زیر سازماندهی شده است. بخش 2 کارهای مربوط به LBSN، تجزیه و تحلیل کلان داده از طریق تحقیق در مورد کاربردهای آن در زمینه های مختلف، و بررسی مقالات تحقیقاتی مبتنی بر داده مربوط به Weibo، چین و شانگهای را پوشش می دهد. بخش 3 شامل یک نمای کلی از مجموعه داده ها و منطقه مورد مطالعه، شرح مفصلی از روش های مورد استفاده برای جمع آوری و آماده سازی داده ها، و تجزیه و تحلیل زمانی و مکانی است. نتایج، همراه با تصاویری از یافته های ما، در بخش 4 ارائه شده است. بخش 5 مطالعه ما را با خلاصه ای از یافته ها، محدودیت های مجموعه داده ما و جهت گیری های تحقیقاتی آینده به پایان می رساند.
2. کارهای مرتبط
در چند دهه اخیر، علاقه محققین به کلان داده ها به طور تصاعدی افزایش یافته است و تحقیق در مورد کلان داده در مقایسه با سایر رشته های علوم کامپیوتر، توجه فوق العاده ای را به خود جلب کرده است. خود این اصطلاح و مقالاتی مانند «دادههای بزرگ درها را باز میکند، اما شاید خیلی زیاد» [ 20 ] و «دادههای بزرگ: سود بیشتر یا تجاوز به حریم خصوصی؟» [ 21 ] ادراک حجم را پیشنهاد می کند. با این حال، ویژگیهای بیشتری در رابطه با کلان دادهها مانند پیچیدگی، ساختار، رفتار، و ابزارها، تکنیکها و فناوریهای مورد استفاده برای پردازش و تحلیل آنها وجود دارد [ 22 ]. دمبل [ 23] سه بعد مختلف داده های بزرگ را مورد بحث قرار داد: حجم، سرعت و تنوع محتوا. Mayer-Schönberger و Cukier [ 24 ] سه چالش اصلی داده های بزرگ را برجسته کردند: جمعیت ها به جای نمونه ها، آشفته به جای داده های تمیز، و همبستگی به جای علیت. علاوه بر این، میلر و گودچایلد [ 25 ] کلان داده را به عنوان داده هایی تعریف کردند که با استفاده از ابزارهای سنتی قابل تجزیه و تحلیل نیستند. در سال 2013، Ovadia و Librarian [ 26 ] بر اهمیت داده های بزرگ برای دانشمندان علوم اجتماعی و کتابداران تأکید کردند و پیشنهاد کردند که بسیار مهم است که نادیده گرفته شود، زیرا اکثر تحقیقات علوم اجتماعی مبتنی بر حجم عظیمی از داده ها و مجموعه داده های عظیم است.
به عنوان تمرکز اصلی بسیاری از زمینههای مطالعاتی، از جمله جغرافیای زمانی و مکانی، ویژگیهای شهری، و تحرک انسانی، تجزیه و تحلیل دادههای بزرگ یک زمینه تحقیقاتی گسترده است که در ابتدا با استفاده از دادههای آماری از نظرسنجیها، مصاحبهها، خاطرات سفر، پرسشنامهها و سایر کتابهای دستی مورد مطالعه قرار گرفت. مجموعه ای از مجموعه داده ها [ 27 ، 28 ، 29 ]. جمع آوری داده های آماری ممکن است روش کارآمدی برای تعیین الگوها در زمینه های مذکور و مطالعات مرتبط نباشد. بنابراین، دادههای دستگاههای تلفن همراه، کارتهای هوشمند، رهیابهای سیستم موقعیتیابی جهانی (GPS)، و برنامههای مبتنی بر مکان و برنامههای آنلاین حاوی فعالیتهای کاربران با موقعیتهای جغرافیایی به طور گسترده مورد استفاده قرار میگیرند و در مطالعات اخیر برای چنین مطالعاتی کارآمدتر بودهاند. سال [ 24 ،30 ، 31 ، 32 ، 33 ، 34 ]. با پیشرفت فناوری های تلفن همراه و استفاده گسترده از دستگاه های تلفن همراه، ردیابی مکان کاربران از دستگاه ها و فعالیت های آنها آسان است. به عنوان مثال، گونزالس و همکاران. [ 35 ] مجموعه داده ای را معرفی کرد که حاوی داده های 100000 کاربر در مدت شش ماه بود. اگرچه دادهها فقط شامل مکان نزدیک دکلهای تلفن همراه از جایی بود که تماس تلفنی از آنجا شروع شد، اما همچنان در تخمین مکانهای تقریبی کاربران با فاصله زمانی مشخص بسیار مفید بود و متعاقباً در پیشبینی انسان مورد استفاده قرار گرفت. جنبش [ 36]. ویژگی های مختلف عملکردهای سیستم اطلاعات جغرافیایی (GIS) و نقش بالقوه آنها در مطالعات معدن شهری توسط ژو [ 37 ] از طریق بحث در مورد چگونگی استفاده از داده های GIS برای تجزیه و تحلیل، تجسم، گزارش و استخراج ویژگی های زمانی یا مکانی مورد بررسی قرار گرفت. زباله های قابل بازیافت و سیستم های جمع آوری و بازیافت آن. دنیای دیجیتالی مدرن به محققان امکان میدهد تا تحلیلهای کمی از الگوهای فعالیت کاربر و عوامل مرتبط، مانند منطقه زندگی، تماسهای اجتماعی، و مراجع شخصی انجام دهند [ 38 ، 39 ، 40 ]. فن و همکاران [ 41] تحقیقات فعالیت کاربر را در سه کلاس مختلف، یعنی پیشبینی مکان، استخراج مسیر و توصیههای مکان طبقهبندی کرد. نویسندگان همچنین بر نقش آن در درک ما از الگوهای فعالیت کاربر، و اینکه چگونه میتواند در بسیاری از زمینهها، مانند کنترل ترافیک، امداد رسانی به بلایا، بازاریابی تلفن همراه، برنامهریزی شهری و سلامت عمومی مفید باشد، تأکید کردند.
یکی از مهمترین منابع دادههای بزرگ، شبکههای اجتماعی آنلاین به دلیل استفاده گسترده و رو به رشد آنها در تقریباً هر بخش از جهان است [ 16 ]. LBSN ها به کاربران اجازه می دهند مکان ها، فعالیت ها و علایق فعلی خود را به اشتراک بگذارند و داده هایی تولید کنند که فرصت انجام انواع مطالعات در زمینه های مختلف را برای ما فراهم می کند. روش های تحلیلی و مطالعات انجام شده بر روی فعالیت های انسانی از داده های تلفن همراه در آثار مختلف مورد بحث قرار گرفته است [ 42 ، 43 ، 44 ]. استفاده از LBSNs توسط Lindqvist و همکاران مورد بررسی قرار گرفت. [ 45 ]، به دنبال آن تعدادی از مطالعات بر روی الگوهای فعالیت انسانی بر اساس داده های LBSN [ 16 ، 46 ،47 ، 48 ]. Zhang و Chow [ 49 ] با استفاده از دو مجموعه داده مختلف (Foursquare و Gowalla)، توصیههای جغرافیایی-اجتماعی شخصیسازی شده را بر اساس LBSN ارائه کردند و الگوهای مشابهی را در هر دو مجموعه داده مشاهده کردند. Preoţiuc-Pietro و Cohn [ 16 ] همچنین 10000 کاربر Foursquare را برای درک بهتر الگوهای فعالیت انسانی در دسته های مختلف مکان مورد بررسی قرار دادند. آنها بیشتر کاربران را بر اساس رفتارشان به خوشه های مختلفی تقسیم کردند و حرکات آنها را بر اساس فرکانس پیش بینی کردند. کلمبو و همکاران [ 50 ] از دادههای مشابه از دو شهر مختلف در بریتانیا برای بهبود سیستمهای توصیه استفاده کرد، با جمعآوری بازدیدهای مکرر در مکانهای مختلف. لی و همکاران [ 51] با استفاده از داده های Foursquare از 14 شهرستان مختلف و 2.4 میلیون مکان، مطالعه گسترده تری را برای کشف دلایل محبوبیت مکان انجام داد. به این نتیجه رسیدیم که سه دلیل اصلی بر محبوبیت یک مکان تأثیر میگذارد: (1) اطلاعات نمایه مکان، زیرا مکانهایی با اطلاعات نمایه کامل بدون شک محبوبیت بیشتری دارند. (2) سن مکان، زیرا مردم تمایل به بازدید از مکان های شناخته شده و معروف دارند. و (3) رده مکان، زیرا مکانهای زیر دسته «غذا» دارای بیشترین تعداد ورود هستند. الرومایان و همکاران [ 2] الگوهای مردم مربوط به دسته های مختلف محل برگزاری را در پایتخت عربستان سعودی، ریاض، با پشتیبانی از داده های Foursquare مورد مطالعه قرار داد. این مطالعه بیشتر بر روی مقوله “غذا” متمرکز بود زیرا مردم علاقه بیشتری به اشتراک گذاری تجربیات خود و گذاشتن نظرات در هنگام بازدید از مکان های غذایی دارند. داده های LBSN در تعدادی از زمینه های حیاتی استفاده شده است. گراهام و همکاران [ 52] اهمیت LBSN ها را در کمک به دولت های محلی با انجام یک نظرسنجی از بیش از 300 مقام دولتی محلی از ایالات متحده مورد مطالعه قرار داد. آنها در مورد سهم ابزارهای رسانه های اجتماعی در مدیریت بحران بحث کردند که در نتیجه روابط مثبتی با توانایی کاربران برای کنترل وضعیت بحران ایجاد شد. سایر مطالعات مشابه که استفاده و توانایی رسانه های اجتماعی در بحران ها را برجسته می کند شامل مقالاتی در مورد آتش سوزی های جنگلی در کالیفرنیا [ 53 ]، طوفان سندی، و زلزله در هائیتی [ 54 ] است. مطالعه ای توسط لین و همکاران. [ 55] در شهر نیویورک، سانفرانسیسکو و هنگ کنگ، از دادههای ورود بیش از 19000 کاربر Swarm (یک برنامه از Foursquare)، ترجیحات کاربر و ارتباط بین دستههای مکان مختلف در زمانهای مختلف روز را مورد بحث قرار دادند. لو و همکاران [ 12 ] از داده های LBSN و روش تراکم هسته برای مطالعه توزیع فضایی تصادفات جاده ای در شانگهای استفاده کرد.
تحقیقات زیادی برای کشف ویژگی های مختلف در داده های LBSN و از داده های LBSN در چند سال اخیر انجام شده است. اکثر محققان اطلاعات LBSN ها مانند Twitter و Foursquare را برای بررسی انواع الگوها، از جمله فعالیت و تحرک کاربر، برنامه ریزی شهری، و طبقه بندی مکان مورد مطالعه قرار دادند. Weibo یک LBSN معروف در چین است و ثابت شده است که منبع کارآمد داده برای این نوع تجزیه و تحلیل است. مطالعه موردی شانژن، چین، رویکردی را برای تجزیه و تحلیل دادههای ورود LBSN به منظور تجزیه و تحلیل ویژگیهای جاذبه مکانهای گردشگری با استفاده از دادههای Weibo از دوره 2012-2014 معرفی کرد [ 14 ]. لانگ و همکاران [ 13] از الگوهای تحرک و فعالیت انسان بر اساس داده های Weibo استفاده کرد و چارچوبی را برای تجزیه و تحلیل رشد مرزهای شهری برای شهر پکن پیشنهاد کرد. مطالعه دیگری توسط شی و همکاران. [ 56 ] از داده های Weibo برای استخراج جمعیت گردشگری در شانگهای استفاده کرد. این مطالعه در ابتدا دادههای ورود از Weibo را برای تعیین محبوبیت مکانهای گردشگری مورد تجزیه و تحلیل قرار داد و سپس از تحلیل الگوی فضایی برای یافتن ارتباط بین این مکانها استفاده کرد، و به دنبال آن تحلیل احساسی نظرات گردشگران از اطلاعات زمینهای Weibo انجام شد. رضوان و همکاران [ 57 ] از دادههای Weibo از اوایل سال 2016 برای مشاهده رفتار ورود و خروج و تفاوتهای جنسیتی استفاده کرد.
با این حال، طبق اطلاعات ما، هیچ مطالعه جامعی برای منطقه شانگهای وجود ندارد که هم ویژگیهای زمانی و هم مکانی چکاینها را استخراج کند و ویژگیهای ورود به Weibo را با کلاسهای مکان مختلف در شهر مرتبط کند. هدف ما مطالعه نوسانات و الگوهای ورود کاربران در مقیاسهای زمانی مختلف (به عنوان مثال، زمان روز، روز هفته، بیش از شش ماه) در ارتباط با نوع مکانها، اثبات اثربخشی آنها تحت بررسی است. از دستههای مکان، و در نهایت مکان مکانهای مختلف و تراکم ورود از Weibo را برای بازه زمانی ژانویه 2017 تا ژوئیه 2017 نشان میدهد.
3. مواد و روش ها
3.1. منبع اطلاعات
داده های مورد استفاده در مطالعه حاضر از یکی از محبوب ترین میکروبلاگ های چینی، Weibo است. فیس بوک و توییتر محبوب ترین LBSN در جهان هستند. در چین، Weibo، ترکیبی از فیس بوک و توییتر، یکی از غالب ترین LBSN ها است [ 56 ]]. این به یک پلتفرم بزرگ تبدیل شده است که به کاربران امکان می دهد فعالیت ها، نظرات، ترجیحات و مکان های خود را همراه با صدا، تصاویر و ویدیوها از طریق بررسی و نوشتن پست ها و در کنار برقراری ارتباط با دوستان خود به اشتراک بگذارند. از زمانی که Weibo در 14 آگوست 2009 راه اندازی شد، تعداد کاربران، ثبت نام ها و فعالیت ها به سرعت افزایش یافته است. Weibo انواع مختلفی از منابع جغرافیایی فضایی را فراهم می کند. سه مورد از منابع اصلی شامل مکانهای نمایه کاربر، مکانهای ذکر شده در پستها، و اشتراکگذاری مکانهای بیدرنگ از طریق اعلام حضور میشود. تا پایان سال 2018، تعداد کل کاربران به بیش از 500 میلیون نفر افزایش یافت و به 462 میلیون کاربر فعال ماهانه و 200 میلیون کاربر فعال روزانه رسید. Weibo یک نسخه بین المللی را در مارس 2017 راه اندازی کرد و ادعا می کند که در بیش از 190 کشور کاربر دارد [ 57 ، 58 ]]. این مطالعه الگوهای ورود را از طریق کلاسهای مختلف استخراج کرد و تراکم ورود را بر روی نقشه واقعی با استفاده از SPSS، ArcMap و OpenStreetMap از طریق دادههای مکانی-زمانی اجتماعی ایجاد شده از Weibo در شهر معروف شانگهای، چین برای مدت زمان تخمین زد. شش ماهه، از 1 ژانویه 2017 تا 30 ژوئن 2017.
3.2. منطقه مطالعه
این مطالعه بر روی دادههای Weibo گرفته شده برای شانگهای، چین انجام شد، که در لبه شرقی دلتای رودخانه یانگ تسه بین 30’40 اینچ تا 31’53 اینچ شمالی و 120’52 اینچ تا 122’12 اینچ شرقی واقع شده است. مساحت کل 8359 کیلومتر مربع، همانطور که در شکل 1 نشان داده شده است. در سال 2016، شانگهای به 16 منطقه و یک شهرستان تقسیم شد، یعنی بائوشان، چانگنینگ، فنگ شیان، هونگکو، هوانگپو، جیادینگ، جینگان، جینشان، مینهنگ، منطقه جدید پودونگ، پوتوئو، چینگپو، سونگجیانگ، یانگپونگ، زوهویچ و گنجانده نشد زیرا به ندرت توسط مردم بازدید می شود) [ 57 ].
شانگهای به عنوان شهر اقتصادی چین، چین را به اقتصاد جهانی متصل می کند. مجموع تولید ناخالص داخلی (GDP) شانگهای در سال 2016، 2.7 تریلیون یوان چین، با افزایش متوسط 7.4 درصدی طی پنج سال گذشته بود و تولید ناخالص داخلی سرانه به 15290 دلار آمریکا (103100 یوان) رسید. شانگهای با میانگین جمعیت 3854 نفر در هر کیلومتر مربع در مناطق شهری، اولین شهر چین و پنجمین شهر از نظر تراکم جمعیت در جهان است و سالانه حدود 0.66 میلیون نفر در این شهر جابه جا می شوند. جمعیت آن از 16.74 میلیون نفر به 23.02 میلیون نفر در دهه گذشته از سال 2000 تا 2010 افزایش یافته است که با افزایش 37.53٪ و بیش از 24 میلیون نفر در پایان سال 2015 افزایش یافته است [ 59 ].]. دلیل اصلی این رشد تعداد زیاد مهاجران است که 39 درصد از کل جمعیت شانگهای را در سال 2010 تشکیل می دادند. طرح جامع اخیر به شدت بر ارائه تسهیلات و مدیریت بیشتر برای بهبود ساکنان شانگهای تأکید دارد (طرح جامع شانگهای). (2016-2035)) [ 60 ].
3.3. روش شناسی
این بخش جمعآوری دادهها و آمادهسازی مجموعه دادههای مورد استفاده در تحقیق ما را شرح میدهد و مروری بر روشهای توصیفی و تحلیلی ما ارائه میدهد. روش شناسی ما شامل موارد زیر است: جمع آوری داده ها و آماده سازی، تجزیه و تحلیل توصیفی، و تجزیه و تحلیل فضایی.
3.3.1. جمع آوری و آماده سازی داده ها
الهامبخش اولیه استفاده از LBSNها اشتراک علایق و فعالیتها و در نتیجه ایجاد روابط اجتماعی جدید و نزدیک است که محققان را قادر میسازد الگوهایی را در فعالیتها و ترجیحات کاربران از دادههای بزرگ تولید شده توسط LBSN کشف کنند. منبع داده این تحقیق Weibo است که به عنوان یکی از محبوب ترین میکروبلاگ ها در چین در نظر گرفته می شود. ما از یک Weibo API (رابط برنامه کاربردی) مبتنی بر پایتون برای جمعآوری دادهها در مناطق خاصی از چین، بهویژه شهر شانگهای استفاده کردیم. ما داده های خود را در طول سال 2017 جمع آوری کردیم و در ابتدا تقریباً 3.5 میلیون بازدید از حدود 2 میلیون کاربر وجود داشت. داده های به دست آمده از Weibo در API استاندارد (Java Script Object Notation، JSON) بودند. فرمت JSON با استفاده از MongoDB برای تجزیه و تحلیل بیشتر به فرمت CSV (مقادیر جدا شده با کاما) تبدیل شد.
مجموعه داده اولیه شامل چندین ویژگی، مانند User_ID، جنسیت، تاریخ/زمان ورود، تاریخ/زمان ایجاد حساب، Location_ID و پیامهای متنی بود. مجموعه داده ابتدا برای ناهنجاریها، ویژگیهای از دست رفته و ویژگیهای نامربوط به مطالعه ما فیلتر شد. برای اینکه اهمیت بیشتری داشته باشیم و فقط مکانهای مهم را در نظر بگیریم، مکانهایی را با بیش از 100 مراجعه در دوره مطالعه شش ماهه در نظر گرفتیم. مجموعه داده نهایی شامل 166898 کاربر با 222525 چک در 722 مکان مختلف بود. نمونه ای از مجموعه داده نهایی در جدول 1 نشان داده شده است .
3.3.2. روش های زمانی
ما یک تجزیه و تحلیل آماری توصیفی را با استفاده از IBM SPSS 25 روی مجموعه داده انجام دادیم تا الگوهای مختلفی را در ورود کاربران بر اساس دفعات ورود در ساعات مختلف روز، روزهای مختلف هفته، و برای همه روزهای فردی در طول دوره مشخص کنیم. دوره تحصیلی شش ماهه دستهبندیهای مختلف مکان ورود بررسی شد تا مشخص شود که مردم از کجا بیشتر از LBSN استفاده میکنند. تمامی نتایج توصیفی شامل جنسیت می باشد تا الگوهای فراوانی را در مردان و زنان نشان دهد.
طبقهبندی مکان با مقایسه طول/طول جغرافیایی و نامهای مکان از مجموعه داده با مکانهای واقعی در سراسر شهر تکمیل شد. این مطالعه شامل مکانهای معروف و پربازدید میشود و بنابراین دستههای مکان را با حداکثر تعداد اعلام حضور نشان میدهد. به هر ورود، یک دسته بندی با توجه به ورود به محل اختصاص داده شد که برای کلاس محل برگزاری مناسب تر است. جریان کلی روش تحقیق ما در شکل 2 نشان داده شده است .
3.3.3. روش های فضایی
برای مشاهده دادههای جغرافیایی روی نقشه، ویژگیهای نقشه را از OpenStreetMap جمعآوری کردیم و از فایلهای Shape در ArcMap با یک پلتفرم برنامهنویسی داخلی پایتون برای نشان دادن مکانهای واقعی مکانها و تراکم ورودها در منطقه مورد مطالعه استفاده کردیم. شانگهای OpenStreetMap یک پلت فرم اطلاعات جغرافیایی است که محتوای بلادرنگ و تولید شده توسط کاربر مرتبط با نقشه جهانی، شامل ویژگیهای مختلف نقشهها مانند جادهها، کانالها، خیابانها و مناطق را ارائه میکند و به صورت رایگان در دسترس است. این به طور گسترده توسط محققان برای تجزیه و تحلیل و تجسم داده های جغرافیایی-مکانی استفاده می شود [ 61 ].
برای به دست آوردن چگالی دقیق تر و صاف تر، از KDE استفاده کردیم. KDE یک روش چند متغیره است که از یک نمونه تصادفی از داده ها برای تخمین چگالی استفاده می کند. ما می توانیم چگالی را همانطور که در رابطه (1) نشان داده شده است محاسبه کنیم:
جایی که لjیک مکان دو بعدی است که شامل ایکسو y، و Dمجموعه داده است. با استفاده از پهنای باند ساعتهم برای ابعاد فضایی و هم برای تابع هسته گاوسی ک( )یک روش کارآمد برای تخمین چگالی ارائه می دهد [ 62 ].
4. نتایج
با پیشرفتهای خدمات آنلاین، ارتباطات بیسیم، دستگاههای تلفن همراه و فناوریهای اشتراکگذاری مکان، LBSNها مانند Facebook، Foursquare، Twitter و Weibo به دلیل حجم عظیم دادههای تولید شده توسط این LBSNها توجه محققان را به خود جلب میکنند. داده ها را می توان برای استخراج اطلاعات بسیار مفید برای برنامه ریزی شهری، مدیریت بحران و بلایا و سایر زمینه های مطالعاتی شامل داده های بزرگ با وضوح مکانی-زمانی بالا مورد استفاده قرار داد. مطالعه حاضر دارای سه جنبه مختلف از تجزیه و تحلیل بود: زمانی، طبقه بندی مکان ورود، و تجزیه و تحلیل فضایی داده های Weibo برای شانگهای. این بخش شامل نتایج و بحث در مورد این سه جنبه است.
4.1. الگوهای زمانی
تجزیه و تحلیل ورود زمانی شامل سه بخش است: الگوهای روزانه، الگوهای هفتگی و الگوهای ورود به مدت 180 روز، از 1 ژانویه تا 30 ژوئن 2017 (دوره مطالعه تحقیق ما). همه این نتایج همچنین فراوانی کاربران زن و مرد را برجسته می کند.
4.1.1. الگوهای روزانه (ساعت)
برای بررسی الگوی دفعات ورود کاربران Weibo، ما توزیع ورودها را برای 24 ساعت از روز مشاهده کردیم، همانطور که در شکل 3 نشان داده شده است. می توان مشاهده کرد که فعالیت های روتین تأثیر عمیقی بر تعداد و زمان ورود دارد. به عنوان مثال، تعداد پذیرشها در اوایل صبح شروع به افزایش میکند، بعد از ساعت 10 صبح قابل توجه است و بعد از ساعت 12 بعد از ظهر به بالاترین میزان خود میرسد، در حالی که از نیمهشب شروع به کاهش میکند. اوج ورود از ساعت 10 شب تا 12 صبح بود که یک چارچوب زمانی معمول برای فعالیت های اجتماعی بسیاری از مردم بود.
در شکل 3 قابل مشاهده استکه در مقیاس زمانی از نیمه شب تا نیمه شب (00 تا 24 ساعت)، فرکانس ورود بیشتر به سمت راست است، و تعداد بیشتری از ورود را در بعد از ظهر، عصر و قبل از نیمه شب نشان می دهد. شکل، توزیع نرمال دادهها را نشان میدهد، نشانداده شده است که کشیدگی دارای مقدار تقریباً نرمال 3 است. به دلیل روال خواب ساکنان شانگهای، پس از نیمهشب و در اوایل صبح، چکاینها کمتر است. بهعنوان یکی از توسعهیافتهترین شهرهای چین، فراوانی ورود زن و مرد تقریباً یکسان است، اما تعداد مراجعهها به دلیل تعداد متفاوت کاربران مرد و زن در مجموعه داده ما متفاوت است. فرکانس تا بعدازظهر عادی است زیرا مردم بیشتر سر کار هستند و با اتمام کار و ملاقات با دوستان و خانواده یا بازدید از مکانها این تعداد زیاد میشود.
4.1.2. الگوهای هفتگی (ساعت کاری)
این بخش، ریتم هفتگی ورود به سیستم را تجزیه و تحلیل می کند. الگوهای هفتگی نشان می دهد که اعلام حضور کاربر در آخر هفته در مقایسه با روزهای هفته غالب است. نمای کامل تعداد کل ورودها برای هر روز از هفته را می توان در شکل 4 مشاهده کرد.
از شکل 4 می توان مشاهده کرد که بیشتر بررسی ها در روزهای شنبه و یکشنبه انجام شده است که نشان دهنده رفتار افرادی است که از LBSN در روزهای تعطیل استفاده می کنند. کاربران تمایل دارند فعالیت های اجتماعی خود را بعد از کار در روزهای جمعه، شنبه و یکشنبه افزایش دهند و این افزایش گاهی اوقات تا یک شب یکشنبه ادامه دارد. بنابراین، فعالیت های بیشتری از جمعه شب تا صبح دوشنبه انجام می شود. این رقم نشان می دهد که دفعات ورود در روزهای شنبه و یکشنبه بیشترین و پس از آن جمعه و دوشنبه است. سه شنبه، چهارشنبه و پنجشنبه حداقل تعداد فعالیت های اجتماعی را در طول هفته نشان می دهد.
4.1.3. الگوها بر اساس تاریخ (180 روز)
این بخش روند روزانه تعداد کل کاربران Weibo را برای 180 روز (اول ژانویه 2017 تا 30 ژوئن 2017) در شانگهای نشان می دهد. شکل 5 تغییرات دفعات ورود برای مردان و زنان را در طول دوره مطالعه نشان می دهد.
شکل 5 نشان می دهد که حداکثر تعداد ورود در دو هفته اول آوریل 2017 رخ داده است. برخی از دلایل اصلی این امر شامل هفته مد شانگهای، جایزه بزرگ فرمول 1 شانگهای، “دریاچه قو” شرکت باله شانگهای، و عید پاک، همه از دسته «سرگرمی» بود که بیشترین تأثیر را داشت و همچنین به دلیل تعداد مکانهای متعلق به این دسته در مجموعه داده بود. کمترین تعداد ورود در دو هفته آخر ژانویه 2017 و دو هفته اول فوریه 2017 به دلیل مهاجرت دوره ای گسترده مردم در حوالی سال نو چینی یا جشنواره بهار چینی رخ داده است [ 63]، که در آن تعداد زیادی از ساکنان شانگهای برای تعطیلات به شهر خود برمی گردند، که 39٪ (در سال 2010) از کل جمعیت شانگهای را تشکیل می دهد. نتایج همچنین نشان میدهد که افراد تمایل دارند فعالیتهای خود را با استفاده از LBSN در مواردی مانند بازدید از مکانها و ملاقات با دوستان در مقایسه با حضور فیزیکی در خانه یا محل کار، به اشتراک بگذارند.
4.2. دسته بندی مکان ورود
یکی از مزایای اصلی استفاده از دادههای LBSN، توانایی شناسایی مکان فعالیت ورود به همراه هدف آن است. هر ورود، طول و عرض جغرافیایی مکان اصلی را توسط LBSN (به عنوان مثال، Weibo) ارائه می دهد [ 64 ]. هنگامی که در داده های LBSN جستجو می شود، طول و عرض جغرافیایی مکان خاصی را بر روی نقشه مرجع جغرافیایی نشان می دهد. از این مکان می توان برای کسب اطلاعات در مورد مکان بازدید شده استفاده کرد. ما این مکان ها را بر اساس نوع آنها و فعالیت های انجام شده در آنها طبقه بندی می کنیم.
در این مطالعه، ما فقط از کلی ترین انواع سلسله مراتب استفاده می کنیم که شامل 10 نوع مکان مختلف است: “آموزشی”، “سرگرمی”، “غذا”، “موقعیت عمومی”، “هتل”، “حرفه ای”، “مسکونی”، «خرید و خدمات»، «ورزش»، و «سفر»، بر اساس مکانهای مکانی واقعی در شانگهای که اغلب در طول و عرض جغرافیایی ثبت نام میشوند. دسته بندی ها و نمونه هایی از مکان های ورود در جدول 2 در زیر آورده شده است.
با توجه به معیارهای فوق، توزیع مکان ها را می توان در دسته بندی ها قرار داد، همانطور که در جدول 3 نشان داده شده است. کلاس محل ورود «سرگرمی» شامل 136 مکان متمایز است و 88، 27، 55، 30، 51، 172، 90، 26، و 47 مکان در «آموزش»، «غذا»، «موقعیت عمومی» یافت میشوند، به ترتیب «هتل»، «حرفهای»، «مسکونی»، «خرید و خدمات»، «ورزش» و «سفر». ما الگوهای جالبتری را با اعمال توزیع دستهبندی یکسان برای کل مجموعه داده از طریق ویژگیهای مختلف دستههای تجویز شده بررسی کردیم. رایج ترین ویژگی های 10 دسته مکان در زیر آورده شده است.
ابتدا، تعداد مکانهای هر دسته را در مجموعه داده خود بررسی کردیم. میتوانیم ببینیم که دستههایی که بیشترین تعداد کاربر و اعلام حضور دارند، «سرگرمی» و «خرید و خدمات» هستند. «مسکونی» و «آموزشی» نیز در مقایسه با سایر دستهها، تعداد قابل توجهی کاربر و اعلام حضور دارند. این نشان دهنده رفتار منظم روزمره مردم است. همانطور که انتظار می رود، مردم در مکان های سرگرمی و خرید در مقایسه با افرادی که در دفاترشان کار می کنند، تمایل بیشتری به استفاده از LBSN دارند. بینش دیگر این است که دانشآموزان و مردم در اوقات فراغت خود در خانه بیشتر از خدمات LBSN استفاده میکنند. از این رو، نتایج مشابه انتظارات است، با روند اضافی دادههای ورود این است که تعداد اعلام حضورها در دسته «مسکونی» کمتر از «سرگرمی» و «خرید و خرید» است.
4.3. الگوهای فضایی
در این بخش، تجزیه و تحلیل فضایی را با تجسم مکان دستههای مکان ورود و تراکم کل ورود با استفاده از دادههای موقعیت جغرافیایی Weibo بر روی نقشه شانگهای بررسی میکنیم. برای این منظور، از نقشهای استفاده کردیم که شامل ویژگیهای OpenStreetMap بود، زیرا حاوی جدیدترین بهروزرسانیهای ویژگیهای نقشه است [ 65 ]. ما میتوانیم ویژگیهایی مانند مرزهای شهر، مناطق و مرزهای منطقه، خطوط مترو شانگهای و ساختار جاده را مشاهده کنیم. با کمک این ویژگی ها، ارزیابی و تشخیص مکان های مختلف روی نقشه آسان است. برای تجزیه و تحلیل فضایی، ما ابتدا مکان های همه مکان های معروف در شانگهای را ترسیم کردیم، همانطور که در شکل 6 نشان داده شده است.
از شکل بالا می توان مشاهده کرد که طبق برنامه ریزی یکی از شهرهای بزرگ چین و سهولت دسترسی، اکثر این مکان ها یا در مرکز شهر یا نزدیک مترو شانگهای قرار دارند. هفت ناحیه، یعنی Changning، Huangpu، Putuo، Hongkou، Xuhui، Jingan، و Yangpu، واقع در Puxi (غرب Huangpu) مجموعاً منطقه مرکز شهر یا مرکز شهر شانگهای نامیده می شوند [ 66 ]. مرکز شهر دارای تمرکز بالاتری از مکان های معروف است، همانطور که در هر شهر بزرگی انتظار می رود. با این حال، اماکن آموزشی و مسکونی نسبتاً در داخل شهر پراکنده هستند.
اگرچه ترسیم مکانها به ما یک ایده انتزاعی در مورد توزیع مکانهای ورود میدهد، برای تجزیه و تحلیل الگوهای فضایی در مجموعه دادههایمان به تحقیقات بیشتری نیاز داریم. بنابراین، ما از KDE برای یافتن تراکم ورود با استفاده از ArcMap استفاده کردیم. همانطور که در شکل 7 نشان داده شده است، ما چگالی را بر اساس بررسی های انجام شده توسط همه کاربران محاسبه کردیم، و نتایج دقیق تری را برای تجزیه و تحلیل بیشتر در اختیار ما قرار دادیم .
شکل 7 توزیع چگالی چک-این ها را در مناطق مختلف شانگهای نشان می دهد. قرمز نشان دهنده بالاترین چگالی و سفید نشان دهنده میانگین است که در نهایت با توجه به نوع داده به رنگ پایه نقشه حل می شود [ 67 ]. بررسیهایی که حداقل معیارهای موجود در مجموعه داده ما را برآورده نمیکردند در نظر گرفته نشدند. بنابراین، چنین داده هایی روی نقشه ظاهر نمی شوند. این رقم به وضوح نشان میدهد که بررسیها در مرکز شهر در مقایسه با مناطق دور از مرکز شهر (همانطور که انتظار میرود) متراکمتر هستند. مناطق Hongkou، Huangpu، و Jingan در مقایسه با سایر مناطق متراکم ترین مناطق هستند.
تحلیل مکانی-زمانی با مقایسه تراکم هفتگی برای دو هفته اول آوریل (دارای حداکثر تعداد ورود) با هفته آخر ژانویه و هفته اول فوریه (شامل حداقل تعداد ورود) انجام شد. همانطور که در شکل 8 نشان داده شده است.
شکل بالا نشان دهنده تراکم ورود در چهار هفته مختلف است. دو مورد از آنها ( شکل 8 a,b) دارای حداکثر تعداد ورود هستند (17344 در هفته اول و 14920 در هفته دوم آوریل) و دو مورد ( شکل 8 c,d) دارای حداقل تعداد ورود هستند. (4699 در هفته آخر ژانویه و 5952 در هفته اول فوریه) همانطور که در شکل 5 نشان داده شده است.. می توان مشاهده کرد که اگرچه تراکم در مناطق مختلف در سراسر شهر متفاوت است، منطقه مرکز شهر حتی با تعداد کمتری از ورود به خانه در طول هفته های ژانویه و فوریه متراکم تر باقی می ماند. با این حال، توزیع کلی ورود، منطقه بزرگ تری را در دوره های زمانی مختلف پوشش می دهد. توجه به این نکته مهم است که منطقه مرکز شهر مرکز تجاری شانگهای در نظر گرفته می شود. بنابراین، این مناطق تقریباً از هر نظر دارای امکانات بیشتری از جمله حمل و نقل، غذا، مراکز خرید، ادارات دولتی و شبانهها هستند. با این حال، از آنجایی که شانگهای یک شهر به طور قابل توجهی توسعه یافته و مدرن با تعداد زیادی پارک و مکانهای آموزشی و مسکونی متنوع است، دستههای ثبت نام را میتوان در مکانهای مختلف در سراسر شهر مشاهده کرد.
5. بحث
تجزیه و تحلیل نشان می دهد که داده های Weibo یک منبع کارآمد برای تجزیه و تحلیل توزیع فعالیت ها و ترجیحات کاربر از نظر جنبه های مکانی-زمانی است. یکی از مزایای استفاده از داده های LBSN برای تجزیه و تحلیل مکانی-زمانی این است که می توانیم اطلاعات در مقیاس بزرگ را برای کلانشهری مانند شانگهای با جزئیات بیشتری استخراج و تجسم کنیم. برخی از مناطق در مرکز شهر شانگهای شلوغ هستند، در حالی که سایر مناطق حومه شهر بازدیدکنندگان کمتری دارند. این مطالعه با ارائه شواهدی مبنی بر اینکه پویایی یک کلان شهر می تواند تحت تأثیر امکانات مختلف و سهم ماهیت مکان های مختلف قرار گیرد، به مشاهده ویژگی های رفتاری کاربران پرداخت. برای نشان دادن توزیع کاربران در شانگهای، الگوهای مکانی-زمانی را در اعلام حضورها بررسی کردیم. در این مطالعه، ما یک تجزیه و تحلیل تجربی از ورود به سیستم با استفاده از نمودارها، جداول و نقشه های چگالی بر اساس داده های LBSN. الگوهای مکانی-زمانی از دیدگاههای مختلف، از جمله ساعتها، روزها و دستههای مکان مورد مطالعه قرار گرفتند. از منظر زمانی، نتایج تعداد دفعات اعلام حضور از اواسط روز تا اواخر شب و افزایش آشکار فعالیتهای آخر هفته را در مقایسه با روزهای هفته تأیید کرد. از نقطه نظر فضایی، سطح شدت فضایی کاربران در مرکز شهر در منطقه مرکز شهر بالاتر بود، زیرا این مرکز فعالیت برای اکثر کلاسهای مکان است. نتایج تعداد دفعات ورود از وسط روز تا اواخر شب و افزایش آشکار فعالیتهای آخر هفته را در مقایسه با روزهای هفته تأیید کرد. از نقطه نظر فضایی، سطح شدت فضایی کاربران در مرکز شهر در منطقه مرکز شهر بالاتر بود، زیرا این مرکز فعالیت برای اکثر کلاسهای مکان است. نتایج تعداد دفعات ورود از وسط روز تا اواخر شب و افزایش آشکار فعالیتهای آخر هفته را در مقایسه با روزهای هفته تأیید کرد. از نقطه نظر فضایی، سطح شدت فضایی کاربران در مرکز شهر در منطقه مرکز شهر بالاتر بود، زیرا این مرکز فعالیت برای اکثر کلاسهای مکان است.
این تحقیق از داده های ثبت نام با برچسب جغرافیایی از یک LBSN به عنوان نمایشی برای تقریب جمعیت عمومی شانگهای استفاده کرد، زیرا کارآمدتر از پرسشنامه ها و نظرسنجی های وقت و کار فشرده است و بنابراین می تواند پوشش مکانی و زمانی استثنایی ارائه دهد. Weibo یک پایگاه داده جغرافیایی باز ارائه می دهد و تمام اطلاعات مربوط به حریم خصوصی کاربران را حذف نمی کند. با این حال، این رویکرد محدودیت های خاص خود را دارد. به عنوان مثال، ما راهی برای اندازهگیری نسبت نمونه دقیق کاربران LBSN و جمعیت شانگهای نداریم، بنابراین فقط میتوانیم ارتباط بین دادههای اعلام حضور و افراد واقعی را در ارزیابی و برنامهریزی یک کلان شهر تعیین کنیم. ارتباط بین چکاینهای Weibo و ساکنان واقعی ممکن است در مناطق مختلف متفاوت باشد.68 ].
پوشش مکانی-زمانی جامع این تحقیق نتایج و اطلاعات مفیدی را ارائه میکند که میتواند در تحلیل فعالیتهای کاربران در یک شهر شهری سودمند باشد و در نتیجه برای برنامهریزی و توسعه شهرهای بزرگ مفید باشد و زمینهای برای استفاده فراهم کند. دادههای Weibo برای تجزیه و تحلیل دستههای فردی، مانند سفر، غذا و مکانهای آموزشی. مطالعه تأثیر انواع مکانهای مختلف بر ترجیحات ساکنان در مناطق مختلف شهری، پتانسیل قابلتوجهی برای ترجیحات برنامهریزی و فعالیت در بین ساکنان شهری دارد.
6. نتیجه گیری
ما از دادههای ورود از Weibo برای تجزیه و تحلیل دادههای جغرافیایی-مکانی برای کشف الگوهای زمانی و مکانی مختلف در مشهورترین مکانهای شانگهای استفاده کردیم. این مطالعه برای بررسی سه جنبه مختلف تجزیه و تحلیل انجام شد: تجزیه و تحلیل زمانی برای نشان دادن الگوها بر اساس زمان، طبقهبندی مکان ورود برای ارائه بینشی به کاربران LBSN در هر دسته، و تجزیه و تحلیل فضایی، که منجر به یک واضح میشود. مشاهده مکان ها و بررسی ها از طریق نقشه برداری. یافتهها نشان داد که افراد تمایل دارند از LBSN بیشتر در عصر به جای صبح و روز کاری استفاده کنند. ما همچنین مشاهده کردیم که LBSN ها هنگام بازدید از مکان ها و خرید بیشتر استفاده می شوند. ورود از موسسات آموزشی قابل توجه است، و نشان می دهد که دانش آموزان کاربران مکرر LBSN هستند. اگرچه بسیاری از نتایج مشابه آنچه ما انتظار داشتیم است، ما حقایق جالبی در مورد استفاده از LBSN به دست آوردیم. برای مثال، علیرغم داشتن مکانهای بیشتر در دسته مسکونی در مجموعه دادههای ما، تعداد اعلام حضور برای دستههای سرگرمی و خرید بیشتر از اعلام حضورهای مسکونی است. الگوی جالب دیگری که ما کشف کردیم این بود که تراکم به مناطق حومه شهر گسترش می یابد، عمدتاً به دلیل موسسات آموزشی و مناطق مسکونی، واقعیت مهمی که هنوز مورد بحث قرار نگرفته است.
دادههای LBSN میتوانند نقش استراتژیکی در توسعه و بهبود جنبههای مختلف «هوشمندی» شهرهای بزرگ داشته باشند. امکان تحلیل فعالیتهای عوامل شهری، بازنمایی ارتباط بین فعالیتها و فضاها را کاملاً اصلاح کرده است. این می تواند با فراهم کردن ابزارهایی برای دستیابی به اهداف پایداری و ایجاد شهرهای بزرگ و قابل زندگی و کارآمدتر به برنامه ریزی شهری کمک کند. برای مثال، یافتن عواملی که به طور فزاینده ای بر شهرها (دسته های محل برگزاری) تأثیر می گذارند، اگر به خوبی برنامه ریزی نشود، می تواند هم بر اهداف پایداری و هم بر توسعه تأثیر بگذارد. مطالعه فعالیت های کاربر اساساً مستلزم در دسترس بودن کلان داده ها و اطلاعات است. از این رو، استفاده از LBSN برای جمعآوری دادهها از افرادی که در داخل یک شهر بزرگ زندگی میکنند و در حال حرکت هستند، میتواند برای برنامهریزی توزیع انواع مختلف مکانها در سراسر شهر مفید باشد. در این چارچوب، اطلاعات مربوط به فعالیت های مختلف کاربران و ساکنان شهر می تواند وقایع رخ داده در فضای فیزیکی را توصیف کند. مطالعه حاضر سعی دارد با استفاده از دادههای Weibo به بررسی بهتر فعالیتهای جمعیت شهری در شانگهای به این موضوع بپردازد. در واقع به بررسی بیشتر رفتار جمعیتی که در اینجا توضیح داده شده است، با تعریفی خاص تر برای تقویت رابطه بین خطوط پایه این مطالعه و تأثیر عملکردهای مختلف شهری، مانند رستوران ها، حمل و نقل و موسسات آموزشی، نیاز است. نتایج میتواند بینشهایی را در مورد ارتباط بین آنتروپی شهری و آهنرباهای شهری (انواع مکانهایی که افراد بیشتری را جذب میکنند) در شهر ارائه دهد، بنابراین مناطق و جنبههایی را که نیاز به توجه ویژه و توزیع برنامهریزی شده در مدیریت شهر دارند، شناسایی میکند. این نتایج بر اساس مجموعه داده ای است که شامل حداقل 100 ورود به Weibo برای یک مکان واحد است، به همین دلیل است که نتایج در مناطق خاصی در شهر متمرکز می شود. تجزیه و تحلیل را می توان با استفاده از داده های سطح میکرو بیشتر از LBSN های مختلف بهبود بخشید. به طور مشابه، دسته ها را می توان با پوشش دادن مکان های بیشتر و توزیع های تخصصی گسترش داد. بعد دیگر مطالعه آینده ممکن است استفاده از مجموعه داده های متنوع و گسترش کلاس های دسته برای به دست آوردن الگوهای خاص و دقیق تر باشد.
بدون دیدگاه