پیش‌بینی و نظارت جنایت در پورتو، پرتغال، با استفاده از یادگیری ماشین، تجزیه و تحلیل مکانی و متنی

جرایم یک نگرانی رایج اجتماعی است که بر کیفیت زندگی و رشد اقتصادی تأثیر می گذارد. علیرغم کاهش جهانی آمار جرم و جنایت، انواع خاصی از جرم و احساس ناامنی، اغلب افزایش یافته است و سازمان‌های ایمنی و امنیتی را پیشروی می‌کنند که نیاز به استفاده از رویکردهای جدید و سیستم‌های پیشرفته برای پیش‌بینی و پیشگیری بهتر از رویدادها دارند. استفاده از فن‌آوری‌های مکانی، همراه با داده‌کاوی و تکنیک‌های یادگیری ماشین، پیشرفت‌های قابل‌توجهی در جرم‌شناسی مکان می‌دهد. در این مطالعه، داده‌های پلیس رسمی پورتو، در پرتغال، بین سال‌های 2016 و 2018، با استفاده از روش‌های تحلیل فضایی، که امکان شناسایی الگوهای فضایی و نقاط داغ مربوطه را فراهم می‌کند، ارجاع جغرافیایی و درمان شد. سپس، فرآیندهای یادگیری ماشین برای کاوی الگوی فضا-زمان اعمال شد. با استفاده از تحلیل رگرسیون کمند، برای متغیرهای جرم و جنایت معنی دار بود، با جنگل تصادفی و درخت تصمیم که از انتخاب متغیر مهم حمایت می کرد. در نهایت، توییت‌های مربوط به ناامنی جمع‌آوری شد و مدل‌سازی موضوع و تحلیل احساسات انجام شد. این روش‌ها با هم به تفسیر الگوها، پیش‌بینی و در نهایت عملکرد پلیس و متخصصان برنامه‌ریزی کمک می‌کنند.

کلید واژه ها:

تحلیل فضایی ; یادگیری ماشینی ؛ جرم شناسی مکان ; تحلیل احساسات ؛ مدل سازی موضوع ; کشور پرتغال

1. مقدمه

جرم به هر عملی گفته می شود که غیرقانونی باشد. وجود جرم و مهمتر از آن احساس ناامنی که ممکن است مستقیماً از آن ناشی شود، کیفیت زندگی و پایداری جوامع را تحت تأثیر قرار می دهد. برنامه‌های سیاست و برنامه‌ریزی مرتبط مانند اهداف توسعه پایدار سازمان ملل، برنامه شهرهای امن‌تر زیستگاه سازمان ملل، شاخص رفاه OECD [ 1 ] یا گزارش‌های انسجام اتحادیه اروپا [ 2 ] به وضوح بر نیاز به ایجاد فضاهای شهری تأکید می‌کنند که ساکنان آن احساس امنیت و امنیت کنند. از این نظر، مدتهاست ثابت شده است که واکنش های سنتی مبارزه با جرم و جنایت به خودی خود کافی نیست [ 3]. از دهه 1970، به ویژه در دو دهه اخیر، پارادایم‌های پلیسی از واکنش به پیشگیری، و از تحلیل صرف عامل و عوامل اجتماعی زمینه‌ای برای در نظر گرفتن عوامل شهری مرتبط با فضا، زمان و ایجاد فرصت‌ها تغییر کرده است.

بنابراین، اصول جرم شناسی محیطی [ 4 ، 5 ، 6 ] بر سه ایده اصلی استوار است. اول اینکه رفتار مجرمانه به طور قابل توجهی تحت تأثیر ماهیت زمینه‌ای محیطی است که در آن رخ می‌دهد، به عنوان مثال، مسائل مکانی [ 5 ]، زیرا دارای ویژگی‌های فردی است که جرم را تشدید یا کاهش می‌دهد. ثانیاً، توزیع الگوهای جرم تصادفی نیست، زیرا نتیجه چنین شرایط سرزمینی است که در مکان و زمان متفاوت است. سوم، با تغییر ویژگی ها و همچنین با هدایت منابع (پلیس، طراحی شهری یا مداخلات اجتماعی یا فرهنگی) به این مکان های داغ، کاهش قابل توجهی در ناامنی حاصل می شود.

گسترش مدل‌سازی رایانه‌ای، سیستم‌های اطلاعات جغرافیایی و فن‌آوری‌های مکانی [ 7 ، 8 ، 9 ] به پیشرفت‌های قابل‌توجهی در زمینه مرجع جغرافیایی جرم، نقشه‌برداری و نقطه داغ اجازه داده است. چنین استفاده ای از داده های مکانی و تجزیه و تحلیل برای بهبود عملکرد و پیشگیری به عنوان پلیس نقطه داغ [ 10 ، 11 ]، پلیس مبتنی بر مکان [ 12 ] یا حتی GIS پزشکی قانونی [ 13 ]، بخشی از آنچه Couldren et al. [ 14] پارادایم جدید «پلیس هوشمند» نامیده اند، که همچنین خواستار ادغام و اشتراک دانش بیشتر بین سازمان های پلیس و مؤسسات تحقیقاتی مانند دانشگاه ها است. از یک سو، روش‌های پیشرفته‌تر به‌عنوان نحو فضایی [ 15 ]، و همچنین الگوریتم‌های داده کاوی و یادگیری ماشین برای درک الگوهای فضایی و حتی پیش‌بینی رخدادها، با استفاده از روش‌های خطی یا مدل‌های بیزی استفاده می‌شوند [ 16 ، 17 ، 18 ]. اینها شامل، اما نه محدود به، الگوریتم جنگل تصادفی (RF) [ 19 ]، درخت تصمیم [ 20 ، 21 ]، K-نزدیکترین همسایه (KNN) [ 22 ، 23 ]، ماشین بردار پشتیبانی (SVM) [24 ] یا شبکه های عصبی مصنوعی (ANN) [ 25 ]. از سوی دیگر، نویسندگانی مانند بنیستر و همکاران. [ 26 ] اخیراً به وابستگی فزاینده نتایج به دست آمده از داده های بزرگ و الگوریتم های مدل سازی هشدار داده اند، که در آن “علیت مرده است، همبستگی پادشاه است” [ 26 ] (ص. 323)، زیرا آنها “روش را بر معنا با اتخاذ یک غیر” برتری می دهند. رویکرد انتقادی به ویژگی‌های مکانی و زمانی داده‌ها» [ 26 ] (ص. 323). علاوه بر این، از ادبیات مشخص است که استفاده از این تکنیک ها در برخی کشورها رواج بیشتری دارد، در حالی که سایر کشورها هنوز در مراحل اولیه پلیس مکان محور هستند، با فرهنگ دانشگاهی و نهادی پایین نقشه برداری جرم و یا حتی ارجاع جغرافیایی جرم. [ 27].

در نتیجه، این پیشرفت‌ها باید به‌درستی در زمینه‌های محلی شکل گرفته و درک شوند. اول، تأثیری که فناوری‌های جدید و این ظرفیت بی‌سابقه برای مدیریت داده‌ها و تجزیه و تحلیل فضایی می‌تواند بر پلیس‌های مبتنی بر شواهد داشته باشد باید مورد توجه قرار گیرد. دوم، اینکه چگونه می‌توانند فراتر از محاسبات بروند و به مشارکت جامع‌تر در حمایت از تصمیم‌گیری، در راستای اشتراک و جابجایی مسئولیت‌ها که توسط مدل‌های جدید پلیس ارتقا می‌یابد [ 28 ]. سوم، همانطور که Andresen و Weisburd [ 12 ] پیشنهاد می‌کنند، چگونه چنین نظریه‌ها، روش‌ها و مدل‌هایی خارج از مکان‌هایی که بیشتر آنها توسعه و آزمایش شده‌اند، یعنی خارج از کلانشهرهای بزرگتر و همچنین در کشورهای پیرامونی، رفتار می‌کنند.

در این مقاله، این پرسش‌ها در یک مطالعه موردی در پورتو، پرتغال مورد بررسی قرار می‌گیرند. در لبه غربی اروپا و اخیراً با غلبه بر یک بحران عمیق مالی، پرتغال به عنوان یکی از امن ترین کشورهای جهان در نظر گرفته می شود که چهارمین جایگاه جهانی را در شاخص صلح جهانی [ 29 ] در اختیار دارد و یکی از پایین ترین نرخ قربانیان در اروپا را ارائه می دهد. 30 ]، و همچنین وضعیت تهدید متوسط [ 31 ]. در عین حال، ترس بالایی از جرم را نشان می دهد [ 32 ]، چیزی که ممکن است در این واقعیت منعکس شود که یکی از بالاترین نرخ افسران پلیس به ازای هر ساکن در اروپا را دارد [ 33 ]. علاوه بر این، هنوز فرهنگ نقشه برداری، ارجاع جغرافیایی و تحلیل فضایی کم جرم در کشور وجود دارد.27 ] و نمونه های بسیار کمی از مدل سازی جرم با استفاده از الگوریتم های مبتنی بر فضا وجود دارد [ 34 ، 35 ، 36 ].

این مقاله با استفاده از ثبت‌های رسمی داده‌های جرم از پلیس امنیت عمومی پورتو از دوره پیش از همه‌گیری بین ژانویه 2016 تا دسامبر 2018، با ترکیب تجزیه و تحلیل فضایی با یادگیری ماشینی برای ایجاد یک مدل پیش‌بینی تجربی، به ادبیات فعلی در مورد مدل‌سازی جرم جغرافیایی کمک می‌کند. . بیش از استفاده از خود تکنیک‌ها، تولید دانش مبتنی بر شواهد و فضا برای ایمنی شهری در زمانی که منابع محلی اغلب کمیاب نیاز به مدیریت صحیح و ادغام با برنامه‌ریزی و برنامه‌های سرزمینی دارند، حیاتی تلقی می‌شود. زندگی و پایداری

2. یادگیری ماشینی، تحلیل احساسات و مدل‌سازی موضوع در نقطه داغ و پیش‌بینی جرم

محبوبیت اخیر تحقیقات جرم‌شناسی مکان همراه با پیشرفت‌های فن‌آوری قرن بیست و یکم، امکان «ادبیات نوپایی از رویکردهای الگوریتمی به پیش‌بینی نقطه داغ جرم خاص زمان و مکان» را فراهم کرد [ 26 ] (ص. 323)، جایی که Big داده ها باید به عنوان «ابزار جدید عمیق ادراک اجتماعی» [ 37 ] (ص. 7) شناخته شوند. در چند سال اخیر این موضوع حتی شدیدتر شده است. رویکردهای یادگیری ماشین به طور گسترده ای در زمینه های مختلف مانند علوم شهری، حمل و نقل و پیش بینی جریان عابر پیاده، مراقبت های بهداشتی، زیست شناسی، باستان شناسی، امور مالی و حتی هنر استفاده شده است [ 38 ، 39 ]. آنها برای نظارت بر فعالیت های غیرقانونی استفاده شده اند [ 40 ، 41] و مدل سازی و پیش بینی جرم، با نویسندگان اغلب روش های مختلف [ 42 ، 43 ، 44 ، 45 ، 46 ].

به عنوان مثال، لین و همکاران. [ 42 ]، که در تایوان کار می کرد، یک روش مبتنی بر داده مبتنی بر نظریه پنجره های شکسته را برای پیش بینی کانون های جرم و جنایت در حال ظهور، بهبود عملکرد مدل با انباشت داده ها با مقیاس های زمانی مختلف، پیشنهاد کرد. از همه روش‌های آزمایش‌شده، الگوریتم‌های یادگیری عمیق، جنگل تصادفی و بیز ساده پیش‌بینی‌های بهتری ارائه کردند. برای ژانگ و همکاران. [ 43]، با این حال، نتایج بر اساس داده های جرم تاریخی و استفاده از نقاط مورد علاقه محیط ساخته شده و تراکم شبکه جاده های شهری به عنوان متغیرهای کمکی برای بهبود عملکرد، نشان می دهد که مدل حافظه کوتاه مدت یادگیری عمیق (LSTM) بهتر از سایرین عمل می کند. در مطالعه اخیر دیگری در مورد الگوهای فضا-زمان سرقت در منهتن، جایی که یک نمونه اولیه کاربردی برای جستجوی پارکینگ ایمن‌تر ایجاد شد، Matijosaitiene و همکاران. [ 44 ] کشف کردند که مدل های خطی بهتر عمل می کنند. پینتو و همکاران با مقایسه پنج ناحیه شهر نیویورک. [ 45 ] همچنین نشان داد که رگرسیون خطی چند متغیره دقت بهتری در پیش‌بینی نوع جرم ارائه شده به دست می‌دهد، اما درخت‌های تصمیم در پیش‌بینی ناحیه محل وقوع جرم بهترین بودند.

چنین یافته‌هایی باید به این معنا باشد که در نظر گرفتن شرایط مکان خاص، به جای محاسبات جهانی (یک روش برای همه رویکردها)، باید استفاده از این الگوریتم‌ها را هدایت کند. در واقع، نویسندگان از روش‌های یادگیری ماشینی برای استخراج دانش و پیش‌بینی روند داده‌های جرم با عوامل اجتماعی، شهری و اقتصادی مبتنی بر مکان استفاده کرده‌اند. میتال و همکاران [ 46 ]، برای مثال، از یادگیری ماشینی در زمینه هندی برای پیش‌بینی علیت بین نرخ جرم، مانند دزدی، سرقت و دزدی، با شاخص‌های اقتصادی استفاده کرد و در آن مورد مشاهده کرد که بیکاری بزرگترین متغیر توضیحی است.

همچنین ادغام این مدل‌ها با تجزیه و تحلیل فضایی با استفاده از سیستم‌های اطلاعات جغرافیایی (GIS)، به عنوان راهی برای شفاف‌سازی الگوهای فضا-زمان، کشف عوامل تعیین‌کننده فضایی و به طور کلی بهبود رویکرد نقطه داغ جغرافیایی و مکان‌محور جرم‌شناسی مدرن است. محل. به عنوان مثال، بوگومولوف و همکاران. [ 47 ] از داده‌های کلان رفتاری جمع‌آوری شده از تلفن‌های همراه در ترکیب با اطلاعات اولیه جمعیت‌شناختی برای پیش‌بینی اینکه آیا مناطقی در لندن مستعد تبدیل شدن به کانون جرم و جنایت هستند یا خیر، با دقت 70% استفاده کردند. آزمایشات ژو و همکاران [ 48] با استفاده از رویکرد ترکیبی از الگوریتم‌های غیرخطی، درخت‌های تصمیم‌گیری افزایش گرادیان (GBDT) و مدل‌های GIS، به نتایج مشابهی دست پیدا می‌کنند، و نرخ‌های کارایی و دقت بالا را آشکار می‌کنند تا تأثیر بیش از هزار عامل از جمعیت، مسکن، تحصیلات را ارزیابی کنند. ، اقتصاد، اجتماعی و شهرسازی. GBDT، در این مورد، بهتر از روش‌های دیگر مانند رگرسیون لجستیک (LR)، ماشین‌های بردار پشتیبان (SVM)، شبکه‌های عصبی مصنوعی (ANN) یا جنگل تصادفی (RF) عمل کرد.

چنین مدل‌های پیش‌بینی جرم خاص منطقه، مانند Boni و همکاران. [ 49 ] که آنها را نام بردند، باید عدم تجانس جغرافیایی الگوهای جرم و جنایت را تشخیص دهند، چیزی که با قانون تمرکز جرم ویزبورد [ 50 ] مطابقت دارد. در مورد Boni، یادگیری آماری سلسله مراتبی و چند وظیفه‌ای برای پیش‌بینی جرایم در سطح کد پستی، از طریق مدل‌های محلی‌سازی شده که در آن پراکندگی با اشتراک‌گذاری اطلاعات در مناطق کاهش می‌یابد، استفاده شد. برای مثال، ژانگ و همکاران، پیش‌بینی مکانی-زمانی از طریق رمزگذاری رویدادهای جرم خاص منطقه نیز اعمال شد. [ 51 ] و باپی و همکاران. [ 52]، نتایجی را مطابق با قانون Weisebud نشان می دهد. اولین مورد از روش‌های آماری مبتنی بر هیستوگرام، تجزیه و تحلیل متمایز (LDA) و K-نزدیک‌ترین همسایه‌ها (KNN)، مقایسه الگوها با ویژگی‌های همسایگی و فاصله زمانی تا تعطیلات مهم استفاده کرد و با تنظیم دقیق‌تر داده‌های زمانی، عملکرد بیشتری را مشاهده کرد. دومی از خوشه‌بندی فضایی مبتنی بر چگالی سلسله مراتبی برنامه‌ها با نویز (HDBSCAN) برای استخراج نقاط داغ از کانون‌های جرم برای دسته‌های مختلف جرم و سپس محاسبه فاصله فضایی بین مرکزهای خوشه‌ای (یعنی نقاط داغ کانون‌های جرم) به عنوان ویژگی برای طبقه‌بندی‌کننده‌ها استفاده کرد. . در این مورد LR و SVM دقت بیشتری نسبت به RF نشان دادند. مانند نتایج تجزیه و تحلیل فضایی، این نتایج مربوط به منطقه خاص و مبتنی بر فضا از یادگیری ماشینی را می توان تا حدی نمایش داد،53 ].

نکته دیگری که مورد بحث است، چگونگی گنجاندن داده‌های غیرساخت‌یافته مربوط به ادراکات، روال‌ها و احساسات کلی ساکنان شهر است. فراتر از نظرسنجی ها، تحقیقات به طور فزاینده ای به داده های تلفن همراه به عنوان پروکسی برای الگوهای فعالیت [ 47 ، 54 ] و همچنین به طور گسترده در رسانه های اجتماعی، ایجاد تجزیه و تحلیل احساسات، یعنی بر اساس احساسات ناشی از مطالعه پیام های فردی، توجه کرده است. بسیاری از اینها به دلیل استفاده قابل توجه در بسیاری از کشورها، در دسترس بودن رایگان داده ها و این واقعیت که توییت ها اغلب با مختصات مکانی و زمانی مرتبط هستند، از داده های توییتر به عنوان منبع استفاده کرده اند [ 55 ، 56 ، 57 ، 58 ، 59 .]. در ایالات متحده، گربر [ 55 ] نشان داد که چگونه استفاده از داده‌های توییتر، از طریق تجزیه و تحلیل زبانی و مدل‌سازی موضوع آماری، عملکرد مدل‌های پیش‌بینی را برای 19 نوع از 25 نوع جرم، در مقایسه با رویکرد درون یابی استاندارد بر اساس تراکم هسته، بهبود بخشید. برآورد کردن. در هند، Thanh و همکاران. [ 56 ] دریافتند که تجزیه و تحلیل احساسات مبتنی بر داده‌های توییتر به نتایجی منتهی شد که با داده‌های نرخ واقعی جرم مطابقت داشت، در حالی که وانگ و همکاران. [ 57 ] نشان می‌دهد که چگونه مدلی شامل تحلیل معنایی خودکار پست‌های توییتر همراه با کاهش ابعاد و پیش‌بینی از طریق مدل‌سازی خطی از مدل‌های پایه بهتر عمل می‌کند. با استفاده از داده‌های توییت‌های مجرمانه، Siriaraya و همکاران. [ 58] همچنین از تحلیل احساسات برای کشف ویژگی‌های منفی مناطق فضایی مرتبط با جرایم مختلف استفاده کرد و مجدداً بر ارتباط یک پایه جغرافیایی در چنین تحلیلی تأکید کرد.

برخلاف تحلیل احساسات، نمونه‌های زیادی یافت نشد که از مدل‌سازی موضوعی بر روی داده‌های مرتبط با جرم استفاده کرده باشند [ 60 ، 61 ]. این روش از تکنیک های آماری یادگیری ماشین برای شناسایی الگوها (به عنوان یک توصیف شفاهی) در یک مجموعه یا مقدار زیادی از متن بدون ساختار استفاده می کند. به عنوان مثال، Pandey و همکاران. [ 60 ] گزارش های جرم و جنایت از لس آنجلس را تجزیه و تحلیل کرد و انسجام موضوع را در برابر تمرکز فضایی در آزمون قانون تمرکز جرم ارزیابی کرد. یافته‌های آن‌ها نشان می‌دهد که تخصیص دیریکله نهفته (LDA) موضوعات مرتبط با جرم و جنایت را با انسجام و غلظت جرم بالاتر ایجاد می‌کند، در حالی که فاکتورسازی ماتریس غیرمنفی (NMF) انسجام را بهبود می‌بخشد، اما غلظت فضایی آنچنان بالا نبود.

همانطور که بنیستر و همکاران. [ 26 ] نشان می‌دهد، مطالعاتی مانند اینها همگی دارای محدودیت‌های داده‌ای مربوط به بازنمایی داده‌های رسانه‌های اجتماعی هستند، اما همچنین در ارتباط با دقت داده‌های جرم جغرافیایی و زمانی مورد استفاده قرار می‌گیرند [ 62 ]. تحقیقات بیشتری در مورد مدل‌هایی مورد نیاز است که می‌توانند با استفاده از GIS و داده‌های رسمی جرم جغرافیایی-زمانی، با پیشرفت در تکنیک‌های یادگیری ماشین و داده‌کاوی، از تحلیل‌های مکانی دقیق عبور کنند.

3. داده ها و روش ها

3.1. زمینه مطالعه موردی

مطالعه موردی این تحقیق شهر پورتو در پرتغال می باشد. دومین شهر کشور، پس از پایتخت لیسبون، پورتو خانه حدود 240000 نفر است [ 63 ]. تشخیص های اخیر، پورتو را به عنوان یکی از شهرهایی با بالاترین میزان جرم و جنایت در پرتغال معرفی کرده است که به ویژه جرایم علیه اموال (مانند سرقت خودرو، جیب بری، سرقت از ساختمان ها) را ثبت می کند. علیه مردم (به ویژه تمامیت جسمانی بلکه خشونت خانگی، تهدید یا اجبار)؛ جرایم علیه جامعه (مانند جعل یا رانندگی در حالت مستی) و جرایم متفرقه (مانند قاچاق مواد مخدر) [ 27 ] (ص 64). به عنوان یک مقصد گردشگری اصلی در اروپا، این کشور همچنین مستعد افزایش جرایم خیابانی غیرخشونت آمیز در ماه های تابستان است [ 31 ]]. تعداد کل جرایم ثبت شده در سال در طول دهه گذشته در پورتو تا حدودی کاهش یافته است (از حدود 16 به 14 هزار)، اما این شهر همچنین ساکنان خود را به حومه های پیرامونی از دست داده است که منجر به تعداد کم و بیش ثابت 65 رویداد جنایی شده است. در هر هزار نفر جمعیت [ 64 ].

3.2. منابع اطلاعات

داده‌های جرم مورد استفاده در این مطالعه، داده‌های محرمانه‌ای هستند که توسط پلیس ایمنی عمومی پورتو به طور هدفمند در اختیار تیم تحقیقاتی قرار گرفته‌اند، زیرا تنها داده‌های جرم عمومی در دسترس در پرتغال، کل داده‌های شهرداری است. این مجموعه داده محدود و بدون ارجاع جغرافیایی شامل یک صفحه گسترده است که توسط پلیس گردآوری شده است که شامل تاریخ، ساعت، نوع شناسی، محله و نام خیابان همه جرایم گزارش شده در داخل محدوده شهر بین ژانویه 2016 تا دسامبر 2018 می باشد. به حدود 42 هزار ورودی. تنها 4 درصد از داده ها اطلاعات کافی برای ارجاع جغرافیایی نداشتند. بقیه، پس از تمیز کردن گسترده پایگاه داده (عمدتاً نام خیابان ها، که یکپارچه نبودند)، توسط تیم تحقیقاتی در بخش های خیابان، با در نظر گرفتن تقسیمات محله، ارجاع جغرافیایی شد.

سایر مجموعه‌های داده شامل داده‌های سرشماری، به‌دست‌آمده از موسسه آمار ملی پرتغال [ 63]، گزارش از آخرین سرشماری جمعیت یا داده های جدیدتر، در صورت وجود. این شامل بیش از 150 شاخص در سطح بلوک شهری، مربوط به داده های ساختمان (مانند نوع ساختمان، سن و نوع کاربری) بود. داده های مسکن (مانند اندازه، نوع شناسی، شرایط و اشغال)؛ داده های جمعیت (مانند سن، جنس یا تحصیلات)؛ داده های خانواده (نوع، اندازه، تعداد فرزندان) و داده های شغلی. داده های شهری و کاربری زمین یا از منابع رسمی شهرداری پورتو یا نقشه خیابان باز در زمانی که نقشه اول در دسترس نبود، بازیابی شد. این شامل کاربری زمین و نقاط مورد علاقه است. اتصال، شبکه جاده و داده های سیگنال ترافیکی؛ و همچنین محل استقرار کلانتری ها و دوربین های مداربسته.

توییت‌ها برای مدل‌سازی موضوع و تحلیل احساسات با استفاده از Snscrape [ 65 ] استخراج شدند. شعاع 1 کیلومتری از تمام نقاط داده جرم برای استخراج توییت ها در نظر گرفته شد و مجموعه خاصی از اصطلاحات مربوط به جرم در انگلیسی و پرتغالی جستجو شد. بر اساس تجزیه و تحلیل ادبیات، مجموعه ای از اصطلاحات مرتبط با جرم تهیه شد. این فهرست شامل بیش از پنجاه اصطلاح مرتبط با جرم است.

3.3. روش شناسی

سه نوع روش روش شناختی برای شناسایی الگوی جرم در شهر، پیش‌بینی میزان جرم و سپس پیش‌بینی جرم به‌صورت رخ‌داده/عدم وقوع استفاده شد. اینها تجزیه و تحلیل جغرافیایی، مدل‌سازی یادگیری ماشین و پردازش زبان طبیعی (NLP) بودند.

برای درک الگوهای جرم و جنایت، ابزارهای تحلیل فضایی با استفاده از ArcGIS 10.7.1 روی مجموعه داده اعمال شد. پس از ادغام همه مجموعه داده ها و پیش پردازش و پاکسازی مجموعه داده ادغام شده نهایی، ورودی های جرم با در نظر گرفتن مختصات خیابان ارجاع داده شدند و سپس با تخمین تراکم هسته (KDE) ترسیم شدند، یک تکنیک درونیابی که اغلب در تجزیه و تحلیل جرم استفاده می شود، زیرا نتایج دقیق تری ارائه می دهد. و به راحتی توسط ذینفعان قابل درک است [ 66 ، 67 ]. اگرچه توافق نظر در مورد اینکه کدام پارامترها باید استفاده شود [ 68 ] وجود ندارد، نویسندگان حمایت کرده اند که این یک روش بسیار مفید برای توصیف تغییرات کوچک محلی است [ 69 ]]. به همین دلیل، و همچنین برای اندازه کوچکتر شهرهای پرتغال، اندازه سلول 50 متر آزمایش شد. این کوچکتر از مواردی است که اخیراً در ادبیات نقشه برداری جنایی استفاده شده است، به عنوان مثال 63 متر [ 67 ]، 90 متر [ 70 ] یا 100 متر [ 71 ]، اما مطابق با تحقیقات قبلی برای پرتغال [ 72 ] است. نتایج با افسران پلیس ایمنی عمومی پورتو تأیید شد. تجزیه و تحلیل نقاط داغ بیشتر در حال ظهور انجام شد [ 73 ]، به عنوان مثال، یک تکنیک داده کاوی که نشان می دهد کدام نقاط گرم و سرد در طول مکان و زمان حفظ یا تغییر کرده اند. با در نظر گرفتن اندازه سلول بزرگتر از یک شبکه توری ماهی استفاده شد.

با در نظر گرفتن این اطلاعات، از یک الگوریتم جنگل تصادفی برای پیش‌بینی مقادیر هر مکان یک مکعب فضا-زمان استفاده شد. این ابزار برای هر مکان در مکعب دو مدل می‌سازد و سپس مقادیر فاز زمانی آینده را پیش‌بینی می‌کند. برازش مدل با مقدار ریشه پیش بینی میانگین مربعات خطا (RMSE) تعیین می شود. زمانی که برای هر مکان مکعب فضا-زمان دو مدل رگرسیون جنگلی تصادفی ساخته می شود، از تکنیک “پنجره” استفاده می شود. مدل از مقادیر واقعی و سپس پیش بینی شده برای پیش بینی مقادیر برای مراحل زمانی آینده استفاده می کند. مدل با RMSE کوچکتر به عنوان بهترین مدل مناسب از بین دو مدل برای هر مکان مکعب فضا-زمان انتخاب می شود.

پس از درک الگوی نقطه‌ای جرایم ثبت‌شده، تحلیل‌های مختلف یادگیری ماشین بر اساس روش‌های نظارت شده برای تعیین تأثیر عوامل بافتی شهری، ریخت‌شناسی و اجتماعی-اقتصادی انجام شد. انتخاب متغیر، به منظور انتخاب مناسب ترین زیرمجموعه پیش بینی کننده ها برای مدل، در نتیجه اجتناب از نویز، پیچیدگی و مسائل چند خطی، با استفاده از رگرسیون LASSO (حداقل انقباض مطلق و عملگر انتخاب) [ 74 ] انجام شد.]. سپس، برای مدل‌سازی جرم، که در آن نرخ جرم به یک هدف دوتایی تبدیل شد – 0 در صورت عدم وقوع جرم و 1 در صورت وقوع حداقل یک جرم – از چهار روش طبقه‌بندی مختلف برای پیش‌بینی کلاس‌های جرم 0 “بدون جرم رخ نخواهد داد” یا 1 استفاده شد. “حداقل یک جنایت رخ خواهد داد”. رگرسیون لجستیک اول، که در آن از تابع سیگموئید برای ترسیم پیش‌بینی‌ها به احتمالات استفاده می‌شود، که در آن جریمه L-1 برای انجام انتخاب متغیر اضافه می‌شود (یعنی از بین تعداد زیادی متغیر اولیه، فقط مهم‌ترین متغیرهای جرم را انتخاب می‌کند). که ضرایب متغیرهای کمتر کمک کننده را به صفر کاهش می دهد. دوم، درختان تصمیم، یک روش یادگیری نظارت شده ناپارامتریک که در آن یک مدل با تقسیم سوابق داده‌ها ساخته می‌شود تا زمانی که همه یا بیشتر رکوردها به برچسب‌های کلاس مربوطه خود 0 «هیچ جرمی رخ نخواهد داد» یا 1 «حداقل یک جرم رخ خواهد داد» طبقه‌بندی می‌شود. درختان تصمیم با “هرس” برگ ها و شاخه های مسئول طبقه بندی اعمال می شوند.75 ] برای جلوگیری از برازش بیش از حد مدل مبتنی بر درخت. برازش بیش از حد زمانی اتفاق می‌افتد که مدل الگوهای بسیار خوبی را در داده‌های آموزشی یاد می‌گیرد و بنابراین، عملکرد مدل بالایی را در داده‌های آموزشی نشان می‌دهد. با این حال، قادر به تعمیم الگوهای آموخته شده بر روی یک داده جدید نیست. سوم، جنگل تصادفی، که در آن تعداد زیادی درخت تصمیم گیری منفرد، ساخته شده از نمونه های گرفته شده از مجموعه آموزشی، در نظر گرفته می شوند، که هر کدام یک کلاس را پیش بینی می کنند و سپس یک روش مجموعه ای، کلاسی را که بیشترین رای را دارد به عنوان پیش بینی مدل تعیین می کند. 76 ، 77]. برای ساخت و آموزش مدل جنگل تصادفی، علاوه بر انتخاب تصادفی نمونه‌های بوت استرپ، یک تقسیم تصادفی روی ویژگی‌ها نیز انجام می‌شود. چهارم، ماشین بردار پشتیبان (SVM)، که هدف آن اختصاص ابرصفحه هایی است که به طور خاص نقاط داده را طبقه بندی می کنند، به عنوان مثال، آنهایی که بیشترین تفاوت را بین نقاط داده در هر دو گروه دارند [ 78 ].

در نهایت، از دو روش پردازش زبان طبیعی، مدل‌سازی موضوع و تحلیل احساسات استفاده شد. اولی، از طریق تخصیص دیریکله پنهان (LDA) [ 79 ]، متن را در یک سند به یک موضوع خاص طبقه بندی می کند. برای هر سند d ، هر کلمه w را پردازش می کند و p (موضوع t | سند d ) را محاسبه می کند ، یعنی نسبت کلمات موجود در سند d که به مبحث t اختصاص داده شده اند . سپس p (کلمه w |موضوع t )، یعنی نسبت تکالیف به مبحث t بر تمام اسنادی که از کلمه w می آیند.. از سوی دیگر، تحلیل احساسات متن را برای شناسایی و استخراج اطلاعات ذهنی مرتبط با احساسات مثبت یا منفی استخراج می کند [ 80 ]. یک رویکرد این است که از یادگیری ماشین و عملکردهای مختلف برای ساختن طبقه‌بندی‌کننده‌ای استفاده کنیم که بتواند متن احساسی را تشخیص دهد. مورد دیگر، که شامل آموزش داده نمی‌شود، مبتنی بر واژگان است و از اصطلاحات مختلفی استفاده می‌کند که با امتیاز قطبیت مشروح شده‌اند. هر دو رویکرد را می توان در یک رویکرد ترکیبی سوم ادغام کرد. اگرچه در این تحقیق از دو روش LDA و تحلیل احساسات به طور جداگانه به عنوان افزودنی های ارزشمند به یکدیگر استفاده شده است.

4. الگوی جنایت پورتو بین سال های 2016 و 2018

4.1. الگوی آماری

بین سال‌های 2016 و 2018، سوابق رسمی پلیس حاوی کمی بیش از 42 هزار ورودی است که از این تعداد حدود 1600 مورد (3.8٪) به دلیل کمبود اطلاعات در ثبت احوال یا در مورد جرمی که قربانی در آن است، نمی‌تواند در سطح خیابان ارجاع داده شود. نمی تواند مکان دقیق را بداند (به عنوان مثال، سرقت کیف پول). مجموع جرایم ثبت شده اندکی افزایش یافته است، از حدود 13 هزار در سال 2016، به 14 هزار در سال 2017 و به حدود 14500 در سال 2018. مطابق با گرایش های ملی گزارش شده در جاهای دیگر [ 27 ]]، در پورتو رایج ترین انواع جرایم جرایم علیه میراث/اموال (64٪؛ از جمله به عنوان زیرمجموعه های اصلی سرقت خودرو و سرقت کیف پول) و جرایم علیه مردم (18٪؛ از جمله تخلف علیه تمامیت جسمانی، خشونت خانگی یا تهدید و اجبار). به دنبال آن جرایم علیه زندگی در جامعه (مانند رانندگی در حالت مستی یا قاچاق اسلحه) و جرایم متفرقه (مانند قاچاق مواد مخدر یا رانندگی بدون گواهینامه) وجود دارد. هر کدام حدود 8 درصد سایر انواع جرایم، علیه هویت فرهنگی، علیه حیوانات خانگی یا علیه دولت، کمتر از 2 درصد است.

در طول روز ( شکل 1 الف)، وقوع جرم به تدریج از ساعت 8 صبح به بعد افزایش می یابد، بین ساعت 6 بعد از ظهر تا 8 بعد از ظهر به اوج خود می رسد، سپس دوباره به تدریج کاهش می یابد، که نشان می دهد غروب ها بیش از هر زمان دیگری از روز در معرض جرم و جنایت هستند. در طول سال ( شکل 1 ب)، تعداد کلی جرایم ثبت شده در هر ماه نسبتا ثابت است (بین 3200 تا 3700)، با بالاترین اعداد بین ماه مه و سپتامبر، چیزی که مطابق با ارزیابی های قبلی کشور است [ 31 ].]. روزهایی که کمترین جنایات گزارش شده مربوط به جشن های کریسمس و سال نو (20، 25 و 31 دسامبر و 2 ژانویه) است، در حالی که بیشترین تعداد جرایم گزارش شده مربوط به تعطیلات دیگر است: 24 ژوئن، روز تعطیلات شهرداری پورتو در شب 23) یا 1 نوامبر، یک تعطیلات مذهبی جشن گرفته می شود.

4.2. الگوی مکانی و زمانی

شکل 2یک KDE را برای پورتو، بر اساس مقادیر بخش‌های خیابان نشان می‌دهد. قانون تمرکز جرم تایید شده است، زیرا بخش ها و مناطق خاصی از شهر بیش از سایرین مستعد وقوع جرم هستند. این امر به ویژه در منطقه مرکز شهر (بیشترین تمرکز) در داخل و اطراف خیابان اصلی عابر پیاده/خرید شهر، خیابان سانتا کاتارینا، و میدان اصلی که تالار شهر در آن واقع شده است (خیابان آلیادوس)، هر دو نزدیک به شب شهر اتفاق می افتد. ناحیه. در نقاط دیگر، تمرکز قابل توجهی نیز در لبه شمالی شهر، جایی که بزرگترین پردیس دانشگاه و بیمارستان اصلی شهر واقع شده است، و در خیابان های اصلی دیگر مانند خیابان Boavista (در غرب شهر)، خیابان Campo Alegre (غرب شهر) رخ می دهد. مرکز)، خیابان Constituição (شمال مرکز شهر)،

تجزیه و تحلیل نقطه داغ با در نظر گرفتن سطل فضا-زمان 3 ماهه انجام شد ( شکل 3). مرکز شهر به‌عنوان مهم‌ترین نقطه از نظر آماری شهر تأیید می‌شود، که برای نود درصد یا بیشتر از مراحل زمانی، از جمله مرحله زمانی نهایی (به ترتیب کانون تشدید و پایدار) یک کانون است. مناطق بواویستا و کامپو آلگره دارای مکان‌های کانونی متوالی (یک اجرای بدون وقفه از سطل‌های هات اسپات آماری قابل توجه در آخرین مراحل زمانی)، یا نقاط پراکنده (مکانی در نقطه‌ای دوباره و سپس خارج از کانون هستند). یک الگوی کانونی پایدار کوچک در شمال در اطراف محوطه بیمارستان/دانشگاه مشاهده می شود. نکته قابل توجه منطقه پراکنده و به ویژه کانون جدید (یعنی مکانی که از نظر آماری یک کانون مهم برای مرحله زمانی نهایی است و قبلاً هرگز از نظر آماری کانون مهم نبوده است) در غرب مرکز شهر در اطراف وسط خیابان بواویستا است.

4.3. پیش بینی

با استفاده از خوشه‌بندی، یک ابزار یادگیری ماشینی بدون نظارت، می‌توان الگوهای طبیعی خوشه‌ها را در داده‌ها شناسایی کرد. برای به دست آوردن خوشه های فضایی جرم با توجه به داده های سرشماری، دومی با داده های جرم و جنایت با استفاده از تکنیک پیوستن فضایی ادغام شد (به عنوان مثال، داده های جرم-سرشماری ادغام شده به عنوان ورودی در الگوریتم خوشه بندی استفاده می شود). سپس تجزیه و تحلیل خوشه‌بندی DBSCAN انجام شد، که در آن اپسیلون = 533 متر (شعاع بهینه برای تجزیه و تحلیل خوشه‌ای) با روش “زانو” تعریف شد در حالی که فاصله خوشه‌ای را در برابر طیف وسیعی از مقادیر اپسیلون ممکن ترسیم کرد.

سپس برای پیش‌بینی تعداد جرایم، از ابزار پیش‌بینی تصادفی جنگل در ArcGIS استفاده شد. با استفاده از توسعه Breiman [ 81 ] از الگوریتم جنگل تصادفی، مدل مقادیر هر مکان مکعب فضا-زمان را پیش‌بینی می‌کند، در این مورد در اندازه سلول 500 متر انجام می‌شود. پیش‌بینی جنایات برای دوازده ماه پس از مجموعه داده‌ها، از ژانویه 2019 تا دسامبر 2019 انجام شد . شکل 4 شمارش جرم پیش‌بینی‌شده را در مجموعه داده‌های آزمایشی دیده نشده نشان می‌دهد. شمارش جنایات پیش‌بینی‌شده از 0 تا 746 در هر مربع متفاوت است، با بیشترین تراکم جرم در مرکز شهر و سپس در امتداد محورهای اصلی همانطور که قبلاً شناسایی شده بود. یک مکان جدید نیز نشان داده شده است.

5. یادگیری ماشینی برای پیش بینی جرم

برای استفاده از روش‌های یادگیری ماشین برای پیش‌بینی جرم، همه مجموعه‌های داده به صورت مکانی به هم پیوستند: داده‌های جرم، داده‌های سرشماری درباره ساختمان‌ها، خانه‌ها، جمعیت، داده‌های خانواده و شغل، داده‌های کاربری شهری و زمین با نقاط مورد علاقه، اتصال، شبکه جاده‌ها و علائم راهنمایی و رانندگی، مکان ایستگاه های پلیس و دوربین های مدار بسته.

5.1. انتخاب ویژگی با رگرسیون کمند

رگرسیون کمند به داده‌های جرم پورتو برای انتخاب زیرمجموعه‌ای از پیش‌بینی‌کننده‌ها که از نظر جرم مهم‌ترین هستند، اعمال شد. داشتن پیش‌بینی‌کننده‌های کمتری که قدرت پیش‌بینی قوی‌تری دارند، خطای پیش‌بینی را کاهش می‌دهد و زمان و منابع محاسباتی را به حداقل می‌رساند و همچنین از برازش بیش از حد مدل پیش‌بینی جلوگیری می‌کند. رگرسیون کمند از جریمه L1 استفاده می کند که اجازه می دهد ضرایب رگرسیون برای پیش بینی های بی اهمیت و کم اهمیت به صفر کاهش یابد. نسبت تمرین و مجموعه تست استفاده شده برای رگرسیون کمند بر این اساس 67% و 33% بود. ضریب رگرسیون مثبت نشان می دهد که با افزایش مقدار متغیرهای پیش بینی کننده، مقدار متغیر پاسخ نیز تمایل به افزایش دارد. در حالی که یک ضریب رگرسیون منفی نشان می دهد که با افزایش متغیر پیش بینی کننده، متغیر پاسخ تمایل به کاهش دارد. متغیرهای «جمعیت با تحصیلات پایین» و «درصد جوانان» دارای ضرایب مثبت هستند و بنابراین با افزایش این متغیرها، میزان جرم و جنایت افزایش می‌یابد. در حالی که متغیرهای «جمعیت با تحصیلات عالی (مدرک دانشگاهی)»، «خانواده‌های مؤسسه‌ای»، «جمعیت فعلی (مرد)»، «مسکن‌های خانوادگی کلاسیک محل سکونت معمولی با 1 یا 2 اتاق»، «عمدتا ساختمان‌های مسکونی» و وجود دوربین های مداربسته دارای ضرایب منفی هستند و بنابراین با افزایش این متغیرها میزان جرم و جنایت کاهش می یابد.

5.2. طبقه بندی

طبقه‌بندی یک کار یادگیری ماشینی است که رکوردها را با پیش‌بینی و تخصیص برچسب‌ها به کلاس‌ها طبقه‌بندی می‌کند. روش‌های زیادی در طبقه‌بندی وجود دارد که در این مطالعه از الگوریتم‌های طبقه‌بندی مختلف استفاده شده است. برای اهداف طبقه بندی، هدف، یعنی نرخ جرم، به یک متغیر باینری تبدیل می شود، که در آن 0 به معنای “بدون جرم رخ نخواهد داد” و 1 به معنای “حداقل یک جرم رخ خواهد داد”.

ابتدا، رگرسیون لجستیک با مجازات L1 برای شناسایی متغیرهایی که با جرم به عنوان یک هدف باینری مرتبط هستند، اعمال شد. برای آموزش و آزمایش مدل رگرسیون لجستیک، رکوردهای موجود در مجموعه داده ها به 70 درصد قطار و 30 درصد مجموعه آزمون تقسیم شدند. استفاده از جستجوی شبکه‌ای با اعتبارسنجی متقاطع در طیفی از پارامترهای فوق به ما امکان داد بهترین آلفا = 0.151 را برای مجازات L1 تنظیم کنیم که مهم‌ترین متغیرها را برای حضور جرم گزارش شده انتخاب می‌کند. «ساختمان های با سازه دیوار در بنایی با صفحه»، «ساختمان های ساخته شده قبل از سال 1919»، «جمعیت فعلی (مرد)»، «ساختمان های ساخته شده بین سال های 1946 تا 1960»، «ساختمان های ساخته شده بین سال های 2006 تا 2011» و دوربین مدار بسته دارای ضرایب منفی و بنابراین، احتمال وقوع جرم را کاهش می دهد. در حالی که “خانه های خانوادگی کلاسیک مسکونی معمولی با 1 یا 2 اتاق”،

برای ساخت مدل طبقه‌بندی SVM، جستجوی شبکه‌ای با اعتبارسنجی متقاطع بر روی طیف وسیعی از پارامترهای فوق به ما این امکان را می‌دهد تا بهترین هسته = rbf، پارامتر منظم‌سازی C = 1 و پارامتر گاما = 0.1 را تنظیم کنیم.

مدل‌های پیش‌بینی جرم نیز با استفاده از درخت تصمیم و جنگل تصادفی با تنظیم فراپارامترها و با استفاده از جستجوی شبکه‌ای با اعتبارسنجی متقاطع و همچنین ماشین بردار پشتیبان ساخته شدند. درخت تصمیم و جنگل تصادفی متغیرهای مهم زیر را شناسایی کردند: «ساختمان ها (کلاسیک)»، «ساکنان دارای دوره اول آموزش پایه» و «جمعیت فعلی (مرد)». مقایسه مدل جدول 1توصیه می کند که جنگل تصادفی بهترین دقت عملکرد مدل = 0.832، فراخوانی = 0.99، دقت = 0.79 و امتیاز F1 = 0.89 را دارد. جنگل تصادفی همچنین مجموعه ای از متغیرهای مهم برای جرم را فراهم می کند. بنابراین، مدل رگرسیون لجستیک مجموعه مفصلی از متغیرهای مهم جرم و تأثیر (مثبت یا منفی) این متغیرها بر جرم را ارائه می‌کند، اگرچه بر اساس متریک دقیق عملکرد ضعیفی دارد.

5.3. پردازش زبان طبیعی (NLP)

برای تجزیه و تحلیل فعالیت اجتماعی و بعد نظر در رابطه با جرم و جنایت، توییت‌هایی از توییتر با استفاده از کتابخانه Snscrape، یک سرویس شبکه اجتماعی در پایتون جمع‌آوری شد. طول و عرض جغرافیایی نقاط داده جرم برای استخراج توییت ها در شعاع 1 کیلومتری اطراف مکان های جرم استفاده شده است. برای تلاش و ارتباط با الگوی جرم، در اولین تکرار آزمایشی، توییت‌های مرتبط با کلماتی مانند سرقت، سرقت، آتش‌سوزی، خرابکاری، خشونت و غیره در انگلیسی و پرتغالی جستجو شد. اینها تنها مقدار کمی از تعداد کل توییت‌های موجود در این منطقه را نشان می‌دهند، که ممکن است نشان دهد کاربران برای گزارش در مورد موضوعات مرتبط با جرم وارد سیستم نمی‌شوند. در این مورد، حدود 1300 توییت جمع آوری شد که بیشتر آنها در واقع به منابع رسانه ای مرتبط بودند.

در شکل 5 ، این توییت‌ها به صورت فضایی ترسیم شده‌اند، و می‌توان مشاهده کرد که بیشترین تعداد توییت‌ها در داخل و اطراف مرکز شهر و، به‌ویژه، در جنوب‌تر در منطقه تفریحی شبانه Ribeira، مطابق با تداوم و تشدید نقاط داغ جنایات گزارش‌شده قبلی است. شناسایی شده و همچنین مناطقی که بیشترین پیش بینی در آنها بود. همچنین قابل توجه است که غلظت در Campo Alegre (غرب مرکز شهر) و در محله اجتماعی Cerco (شرق مرکز شهر)، مکان‌های کانونی موقت نیستند، اما با تراکم جرم قابل توجهی روبرو هستند.

5.3.1. مدلسازی موضوعی (LDA)

مدل‌سازی موضوعی نوعی مدل‌سازی آماری است که «موضوعاتی» را که در مجموعه‌ای از اسناد وجود دارد، شناسایی می‌کند. تخصیص دیریکله نهفته (LDA) روش مدل‌سازی موضوعی است که در این تحقیق مورد استفاده قرار گرفته است. پس از پاکسازی داده‌ها (پایه‌بندی، ریشه‌سازی و بردارسازی) و تنظیم فراپارامترها با استفاده از جستجوی شبکه و اعتبارسنجی متقاطع، مدل LDA اجرا شد و مقدار احتمال Log 56491- و گیجی 134.68 محاسبه شد. موضوعات با وزن های مختلف توییت ها محاسبه شد ( شکل 6و از این موضوعات، نگرانی های ساکنان قابل درک است. هر چه وزن بیشتر باشد، کلمه در کلمه ابر بزرگتر است. همانطور که در بالا مشاهده شد، مردم عادی ممکن است مستقیماً در مورد جرم توییت نکنند. به نظر می رسد روزنامه ها بیشتر این کار را در پورتو انجام می دهند. بنابراین کلماتی مانند دزدی، دزدی، باطری، خشونت در تاپیک ها زیاد دیده نمی شود. برعکس، کلمات دیگری که بیشتر با احساس ناامنی مرتبط هستند، از جمله جنایت، پلیس، دستگیری پلیس، زندان، قتل، نفوذ، افراد یا جراحت، در موضوعات مربوطه خود اهمیت بالایی دارند (برخی از موضوعات غیرمثل “thcmbzzbo” یا “mgruq” در این شکل ظاهر می شود. این می تواند از املای نادرست یا “زبان شخصی” استفاده شده در توییت ها مشتق شود. اگر اصطلاحی معنی ندارد و مخفف یا اصطلاح عامیانه شناخته شده نیست، در طول پیش پردازش متن حذف شده است).

5.3.2. تحلیل احساسات

تحلیل احساسات، استخراج متنی است که اطلاعات ذهنی از احساسات/عقیده را که می تواند مثبت یا منفی باشد، شناسایی و استخراج می کند. برای این تحلیل از روش مبتنی بر واژگان AFINN استفاده شد. AFINN لیستی از کلمات است که برای ظرفیت با عدد صحیح بین منهای پنج (منفی) و به علاوه پنج (مثبت) رتبه بندی شده اند. شکل 7 ابر کلمه ای از احساسات مثبت و منفی موجود در تحلیل توییتر را نشان می دهد. توییت‌هایی که شامل کلماتی مانند عشق، خدا، برد، کتاب یا عالی هستند در مثبت‌ترین احساسات فرکانس بالایی دارند، در حالی که توییت‌هایی مانند زندان، محکوم، کشته‌شده و توهین‌آمیز بیشترین احساسات منفی را ایجاد می‌کنند.

شکل 8 نشان می دهد که توییت ها عمدتاً دارای احساسات منفی (مقادیر منفی) هستند، مطابق با آنچه در بالا مورد بحث قرار گرفت. منفی ترین بخش ها در واقع کمی خارج از نقاط اصلی جرم و جنایت ثبت شده در مرکز شهر، در جنوب شرقی (در محله های فونتینها و کامپو 24 د آگوستو) و در شمال غربی (در اطراف استادیوم اصلی فوتبال شهر) توییت می شوند. احساسات منفی نیز در وسط خیابان Boavista، به سمت غرب، کانون جدید دیده می شود. برعکس، مثبت ترین احساسات (2 که حداکثر در مقیاس [-5؛ 5] یافت می شود) در مناطق غیر جرم و جنایت، مانند منطقه لردلو، منطقه تجاری/صنعتی شمال غرب و اطراف پارک شهر شرقی، واقع شده است. در حاشیه شرقی شهر

6. بحث و نتیجه گیری

تکامل مستمر در 20 سال گذشته ظرفیت نقشه‌برداری و مدل‌سازی فناوری‌های مکانی، توانایی بی‌سابقه‌ای برای درک روابط بین جرم و مکان را فراهم کرده است. این امر به طور قطع بر ارتباط جرم شناسی زیست محیطی به عنوان یک رشته و کمک های فوری آن به تصمیم گیری در زمینه پیشگیری، مدیریت شهری و حمایت از سیاست های انسجام و کیفیت زندگی (به معنای عام) و همچنین از نظر پلیس تاکید کرده است. و برنامه ریزی در مقیاس خرد (به معنای خاص تر). متفق القول شده است که روش های داده محور [26; 46] به طور موثر به کاهش ناامنی (واقعی و درک شده) کمک می کند، و در این میان، ادراک جغرافیایی از الگوها بسیار مهم است [ 82 ].

از یک طرف، جرم و جنایت الگوهای متمرکز و به طور کلی پایدار را در طول زمان نشان می دهد، که برای پورتو مفاد قانون تمرکز جرم ویزبورد [ 50 ] را تایید می کند.] و اصول فضایی جرم شناسی محیطی. تمرکز اصلی در ناحیه مرکز شهر رخ می‌دهد، که به مناطق کانونی پایدار، متوالی اما در حال تشدید تقسیم می‌شود، در حالی که سایر غلظت‌های کوچک‌تر نیز مشخص شده‌اند، از جمله مکان کانون جدید. پیش‌بینی تعداد جرایم، با نشان دادن این محورها به‌عنوان محورهایی با پتانسیل بالاتر برای وقوع و همچنین کشف مکان‌های دیگری که ممکن است روند صعودی را نشان دهند، این روند را دنبال می‌کند. همراه با درک زمانی (اوج در اواخر بعد از ظهر، و افزایش ماه مه تا سپتامبر) این می تواند در تخصیص منابع و در ایجاد برنامه های پیشگیری بسیار مرتبط باشد.

بدیهی است که این تجزیه و تحلیل با استفاده از داده‌های پیش از همه‌گیری، تنها نوع موجود در زمان نگارش، انجام شده است، بنابراین پیش‌بینی جرم در مرحله بعد و مقایسه با مقادیر واقعی به منظور ارزیابی بیشتر کارایی این مدل انجام خواهد شد. با این حال، همانطور که توضیح داده شد، مدل با استفاده از 30 درصد از داده‌های دست نخورده برای مقایسه با واقعیت اصلی اعتبارسنجی شد، و به نظر می‌رسد که هم با روندهای مورد انتظار و هم با دیدگاه‌های ذینفعان پلیس از قلمرو که در طول این تحقیق مورد مشورت قرار گرفته‌اند، مطابقت دارد. . به‌علاوه، داده‌ها توسط گزارش خود جرم سوگیری دارند (همه جرایم گزارش نمی‌شوند)، و همه جرایم از همه نوع‌شناسی در پیش‌بینی و در کانون در نظر گرفته شدند. بنابراین تجزیه و تحلیل دقیق بر اساس دسته بندی جرم نیز برای برآوردن نیازهای مختلف برنامه ریزی و پیشگیری از اهمیت بالایی برخوردار است. همانطور که توسط نویسندگان دیگر بحث شده است [83 ]، تحلیل جغرافیایی الگوهای جرم مشروط به سطح جغرافیای مورد استفاده و نحوه ارائه اطلاعات مکانی جرم و جنایت، در این مورد تنها توسط بخش‌های خیابانی است که در برخی مکان‌ها نیز نشان داده شده است که عملکرد بدتری نسبت به طبیعی دارند. خیابان ها در تبیین وقایع جنایی [ 15]. در واقع، Space Syntax اغلب در پیش‌بینی جرم مورد استفاده قرار گرفته است و می‌تواند در تحقیقات آینده برای آزمایش بیشتر یا بهبود نتایج ارائه شده در اینجا مورد استفاده قرار گیرد. علاوه بر این، نمایش بصری الگوهای جرم، به عنوان مثال در تخمین تراکم هسته، به تنظیمات پارامتر، به عنوان اندازه سلول و باند فاصله بسیار حساس است. با این حال، تکرار اولیه انجام شده در این مقاله اهمیت مدل‌سازی آماری و فضایی را آشکار کرده است، زیرا مبتنی بر دانشی است که اغلب در اختیار مؤسسات نیست، اما در عین حال نتایجی را تولید می‌کند که به راحتی با آن ارتباط برقرار می‌کند، قابل درک است و قابل درک است. تایید شده توسط ذینفعان ثابت شده است که مشارکت های فرا رشته ای با دانشگاه ها و مراکز تحقیقاتی می تواند سنگ بنای پلیس اطلاعاتی و مکان محور باشد.

با این وجود، از سوی دیگر، اگرچه نقشه‌برداری جرم با پشتیبانی ترکیبی از تحلیل‌های جغرافیایی و آماری ضروری است [ 84 ، 85 ]، نویسندگان خواستار تجمیع هوشمندتر داده‌ها [ 86 ] هستند، به عنوان مثال، یک رویکرد یکپارچه و کل نگر که شامل موارد اضافی، گاهی اوقات منابع داده های غیرساختارمندی که منعکس کننده بافت اقتصادی، مورفولوژیکی، اجتماعی، ادراکی یا فرهنگی مناطق شهری برای بهینه سازی بهتر سیاست های پیشگیری، برنامه ریزی و انسجام هستند [ 87 ، 88 ، 89 ]]. در این تحقیق، روش‌های یادگیری ماشینی، مانند درخت تصمیم و جنگل تصادفی، همسو با رگرسیون کمند، این ابعاد را با هم ترسیم کردند و متغیرهایی را نشان دادند که از نظر مکانی و آماری، به نظر می‌رسد که قرابت بیشتری با افزایش نرخ جرم گزارش‌شده دارند. اینها شامل درصد جمعیت با سطح تحصیلات پایین و درصد جوانان است. برعکس، مکان‌هایی که دارای نرخ‌های بالاتر جمعیت با مدرک دانشگاهی، دوربین‌های مداربسته بیشتر و تعداد مردان بیشتری در جمعیت هستند، به نظر می‌رسد ارتباط کمتری با میزان جرم و جنایت دارند. تراکم ساختمانی و تمرکز خانه ها بسته به روش می تواند به عنوان یک کاتالیزور برای و علیه نرخ جرم ظاهر شود. با این حال، حتی اگر مدل پیش‌بینی تصادفی جنگل بهترین نتایج عملکرد را نشان داد (یادآوری = 0.99 و دقت = 0.79)،

به طور کلی، این نتایج با تحقیقات قبلی مطابقت دارد. تراکم بیشتر، محله‌های قابل پیاده‌روی، تحصیلات عالی و مرد بودن با ترس کمتری از جرم مرتبط است، در حالی که ویژگی‌های خانه یک رابطه صریح را نشان نمی‌دهند [ 90 ]. جمعیت خیابان به طور قوی و مثبت با جرم و جنایت، به ویژه زنان، مرتبط است، همانطور که آسیب های متمرکز در سطح جامعه [ 89 ] و حضور نوجوانان پرخطر [ 91 ] وجود دارد.]. این مطالعات همچنین توجه به متغیرهای اثربخشی جمعی را جلب می کند. این به طور مستقیم در این تحقیق مورد بررسی قرار نگرفت، اما مدل‌سازی موضوعی (LDA) داده‌های توییتر، اگرچه این داده‌ها از نظر کاربران، مضامین و اندازه اطلاعات نیز محدود هستند (و از این رو نمی‌توان آنها را به عنوان یک جایگزین کلی برای نظرسنجی‌ها در نظر گرفت. مصاحبه‌ها و کارگاه‌های آموزشی با ساکنان) توانست راهی سریع برای ایجاد اولین تکرار از احساس ساکنان در مورد شهر ارائه دهد. همانطور که انتظار می رفت، احساسات عمدتاً در بحث ناامنی منفی است، نزدیک به مناطق با نرخ بالاتر جرم گزارش شده (مرکز شهر و بواویستا) اما همچنین مناطقی که به شدت مورد انگ هستند و توجه رسانه ها را جلب می کنند (مانند محله اجتماعی Cerco) . کلماتی مانند “پلیس”، “قتل”، “جراحت” یا “کشته شده” احساسات منفی را در این مکان ها نشان می دهد.

چنین یافته‌هایی به وضوح اهمیت مدل‌های توضیحی و پیش‌بینی‌کننده را در حمایت از تصمیم نشان می‌دهند و ممکن است تعریف سیاست‌های مکان خاص را هدایت کنند، اما باید با احتیاط به آنها نزدیک شد. ظرفیت تجزیه و تحلیل الگوی بینشی است و قطعاً باید بخشی از تشخیص و نظارت منطقه باشد. با این حال، تحقیقات نباید به همین جا ختم شود، و وابستگی به داده های بزرگ نیز در صورت از بین رفتن معنی، “خطرات” بزرگی را پنهان می کند [ 26 ]]. اول به این دلیل که همبستگی به معنای علیت نیست، و دوم، زیرا همانطور که در بالا بحث شد، از آنجایی که مکان‌های مقیاس خرد سیستم‌های پیچیده شهری و اجتماعی هستند، متغیرهای مهم مرتبط با مسائل شخصی و ادراکی (مثلا آن‌هایی که به کارایی جمعی یا فضای قابل دفاع مربوط می‌شوند) ممکن است در محاسبات گم شود یا اصلاً محاسبه نشود. الگوریتم‌ها و روش‌های جهانی باید با مدل‌سازی و درک فضایی عمیق‌تر جایگزین شوند و نتایج مدل باید موضوع نقد باشد. پس از شناسایی نقاط داغ، مرحله دوم تجزیه و تحلیل باید عمیق‌تر به فضای شهری بپردازد و به دنبال محسوس و ناملموس باشد و درک کند که چگونه متغیرهای قابل اندازه‌گیری در مقیاس خرد همبستگی دارند، اما همچنین به بررسی موارد غیرقابل اندازه‌گیری فوری، به عنوان تیم‌های پلیس جامعه یا CPTED. در دهه های اخیر انجام داده اند.

منابع

سازمان همکاری اقتصادی و توسعه. زندگی چطوره؟ انتشارات OECD: پاریس، فرانسه، 2020. [ Google Scholar ]
منطقه من، اروپای من، آینده ما – گزارش هفتم در مورد انسجام اقتصادی، اجتماعی و سرزمینی . کمیسیون اروپا: لوکزامبورگ، 2017.
برانتینگهام، PL; Brantingham، PJ پیشگیری از جرم موقعیتی در عمل. می توان. J. Criminol. 1990 , 32 , 17. [ Google Scholar ] [ CrossRef ]
اندرسن، کارشناسی ارشد جرم شناسی محیطی: تکامل، نظریه و عمل . Routledge: نیویورک، نیویورک، ایالات متحده آمریکا، 2014. [ Google Scholar ]
ویزبرد، دی. اک، جی. براگا، آ. Telep، CW; Cave, B. Place Matters: Criminology for the Twenty and First Century ; انتشارات دانشگاه کمبریج: نیویورک، نیویورک، ایالات متحده آمریکا، 2016. [ Google Scholar ]
ورتلی، آر. تاونزلی، ام. جرم شناسی محیطی و تجزیه و تحلیل جرم ؛ Routledge: نیویورک، نیویورک، ایالات متحده آمریکا، 2016. [ Google Scholar ]
لایتنر، ام. مدل‌سازی جرم و نقشه‌برداری با استفاده از فناوری‌های جغرافیایی ؛ Springer Science & Business Media: برلین، آلمان، 2013. جلد 8. [ Google Scholar ]
چینی، اس. Ratcliffe, J. GIS and Crime Mapping ; جان وایلی و پسران: هوبوکن، نیوجرسی، ایالات متحده آمریکا، 2013. [ Google Scholar ]
کنان، م. سینگ، ام. سیستم اطلاعات جغرافیایی و نقشه برداری جرم ؛ CRC Press: Boca Raton، FL، ایالات متحده، 2020. [ Google Scholar ]
براگا، آ. پاپاکریستوس، ا. هورو، دی. اثرات پلیس نقاط داغ بر جرم و جنایت. کمبل سیست. Rev. 2012 , 8 , 1-96. [ Google Scholar ] [ CrossRef ]
ویزبرد، دی. پلیس نقاط داغ Telep، CW: آنچه می دانیم و آنچه باید بدانیم. J. Contemp. جنایت. عدالت 2014 ، 30 ، 200-220. [ Google Scholar ] [ CrossRef ]
اندرسن، MA; ویزبورد، دی. پلیس مکان محور: مسیرهای جدید، چالش های جدید. سیاسی بین المللی J. 2018 , 41 , 310-313. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
المز، GA; رودل، جی. Conley, J. Forensic GIS: نقش فناوری‌های زمین فضایی برای بررسی جرم و ارائه شواهد . Springer: Dordrecht، هلند، 2014; جلد 11. [ Google Scholar ]
Coldren، JR; هانتون، ا. مدرس، م. معرفی پلیس هوشمند: مبانی، اصول و عمل. پلیس Q. 2013 ، 16 ، 275-286. [ Google Scholar ] [ CrossRef ]
Attig, S. The Organic Pattern of Space: A Space Syntax Analysis of Natural Streets and Street Segments for Measuring Crime and Traffic Incidents (پایان نامه). 2019. در دسترس آنلاین: https://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-264938 (در 1 آوریل 2022 قابل دسترسی است).
جردن، MI; میچل، یادگیری ماشینی TM: روندها، دیدگاه ها و چشم اندازها. Science 2015 ، 349 ، 255-260. [ Google Scholar ] [ CrossRef ] [ PubMed ]
ژائو، ایکس. تانگ، جی. مدل‌سازی همبستگی‌های زمانی-مکانی برای پیش‌بینی جرم. در مجموعه مقالات ACM 2017 در کنفرانس مدیریت اطلاعات و دانش، سنگاپور، 6 تا 10 نوامبر 2017؛ صص 497-506. [ Google Scholar ]
باباکورا، ا. سلیمان، MN; یوسف، MA روش بهبود یافته الگوریتم های طبقه بندی برای پیش بینی جرم. در مجموعه مقالات سمپوزیوم بین المللی 2014 در بیومتریک و فناوری های امنیتی (ISBAST)، کوالالامپور، مالزی، 26 اوت 2014؛ IEEE: Piscataway، NJ، ایالات متحده؛ صص 250-255. [ Google Scholar ]
آلوس، ال جی؛ ریبیرو، HV; رودریگز، پیش‌بینی جرم FA از طریق معیارهای شهری و یادگیری آماری. فیزیک یک آمار مکانیک. برنامه آن است. 2018 ، 505 ، 435-443. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
ایوان، ن. آهیشاکیه، ای. Omulo، EO; Taremwa، D. پیش‌بینی جرم با استفاده از الگوریتم طبقه‌بندی درخت تصمیم (J48). بین المللی جی. کامپیوتر. Inf. تکنولوژی 2017 ، 6 ، 188-195. [ Google Scholar ]
نصریدینوف، آ. Ihm, SY; پارک، YH یک مدل طبقه‌بندی مبتنی بر درخت تصمیم برای پیش‌بینی جرم. در همگرایی فناوری اطلاعات ; Springer: Dordrecht، هلند، 2013; صص 531-538. [ Google Scholar ]
Tayal، DK; جین، ا. آرورا، اس. آگاروال، اس. گوپتا، تی. Tyagi، N. کشف جرم و شناسایی جنایتکاران در هند با استفاده از تکنیک های داده کاوی. AI Soc. 2015 ، 30 ، 117-127. [ Google Scholar ] [ CrossRef ]
سیورنجانی، س. سیواکوماری، س. Aasha, M. پیش‌بینی و پیش‌بینی جرم در تامیلنادو با استفاده از رویکردهای خوشه‌بندی. در مجموعه مقالات کنفرانس بین المللی 2016 در مورد روندهای فناوری نوظهور (ICETT)، کولام، هند، 21 تا 22 اکتبر 2016؛ IEEE: Piscataway، NJ، ایالات متحده؛ صص 1-6. [ Google Scholar ]
کیانمهر، ک. الحاج، ر. اثربخشی ماشین بردار پشتیبان برای پیش‌بینی نقاط داغ جرم. Appl. آرتیف. هوشمند 2008 ، 22 ، 433-458. [ Google Scholar ] [ CrossRef ]
Memon، QA; محبوب، س. بررسی و تحلیل جرم با استفاده از شبکه های عصبی. در مجموعه مقالات هفتمین کنفرانس بین المللی چند موضوعی، 2003. INMIC 2003، اسلام آباد، پاکستان، 8-9 دسامبر 2003; IEEE: Piscataway، NJ، ایالات متحده؛ صص 346-350. [ Google Scholar ]
بنیستر، جی. O’Sullivan، A. بیتس، ای. مکان و زمان در جرم شناسی مکان. نظریه. Criminol. 2019 ، 23 ، 315-332. [ Google Scholar ] [ CrossRef ]
سارایوا، م. آمانته، ا. مارکز، تی. فریرا، م. Maia، C. Perfis territoriais de kriminalidade در پرتغال (2009–2019). Finisterra 2021 ، 56 ، 49-73. [ Google Scholar ] [ CrossRef ]
Freilich، JD; نیومن، GR Situational Crime Prevention دایره المعارف تحقیقات آکسفورد جرم شناسی و عدالت کیفری ; انتشارات دانشگاه آکسفورد: آکسفورد، بریتانیا، 2017. [ Google Scholar ]
برنامه آموزش فردی شاخص جهانی صلح 2021: سنجش صلح در دنیای پیچیده. 2021. در دسترس آنلاین: https://www.visionofhumanity.org/wp-content/uploads/2021/06/GPI-2021-web-1.pdf (در 1 آوریل 2022 قابل دسترسی است).
گرانژیا، اچ. کروز، او. تکسیرا، آر. Alves، P. Vulnerabilidades urbanas: O caso da kriminalidade associada às ourivesarias na cidade do Porto. کشیش لاتیت. 2013 ، 7 ، 69-89. [ Google Scholar ]
گزارش امنیت کشور 2020. در دسترس آنلاین: https://www.osac.gov/Country/Portugal/Content/Detail/Report/3e50b674-78b2-4997-8950-188df6d2cadf (در 1 آوریل 2022 قابل دسترسی است).
Tulumello, S. Segurança urbana: Tendências globais, contradições Portugueseas e tempos de crise. Cid. Em Reconstrução. Leituras Círitcas 2018 ، 2008–2018 ، 73–80. [ Google Scholar ]
یورواستات آمار جرم و عدالت کیفری. 2016. در دسترس آنلاین: https://ec.europa.eu/eurostat/statistics-explained/index.php/MainPage (در 1 آوریل 2022 قابل دسترسی است).
فریرا، جی. جوائو، پی. مارتینز، جی.ای.اس برای تجزیه و تحلیل جرم-جغرافی برای مدل های پیش بینی. الکترون. J. Inf. سیستم ارزشیابی 2012 ، 15 ، 36-49. [ Google Scholar ]
João, P. Modelo Preditivo de Criminalidade: Georeferenciação ao Concelho de Lisboa. پایان نامه کارشناسی ارشد، Universidade Nova de Lisboa، لیسبون، پرتغال، 2009. [ Google Scholar ]
رودریگز، TMF; ایناسیو، AA; آراجو، دی. پاینهو، ام. هنریکس، آر. Cabral، PdCB; اولیویرا، تی. Neto، MdC SIM4SECURITY. در کنگره پنجم Português de Demografia ; مدل پیش بینی و تحلیل فضایی برای امنیت داخلی پرتغال 2030; Fundação Calouste Gulbenkian: لیسبون، پرتغال، 2016. [ Google Scholar ]
اینس، ام. رابرتز، سی. پریس، ا. راجرز، دی. ده «رای» واکنش اجتماعی: استفاده از رسانه‌های اجتماعی برای تحلیل تأثیرات «پس از رویداد» قتل لی ریگبی. ترور خشونت سیاسی 2018 ، 30 ، 454-474. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
هو، اس. گائو، اس. وو، ال. خو، ی. ژانگ، ز. کوی، اچ. گونگ، X. طبقه‌بندی تابع شهری در سطح بخش جاده با استفاده از داده‌های مسیر تاکسی: یک رویکرد شبکه عصبی کانولوشنال گراف. محاسبه کنید. محیط زیست سیستم شهری 2021 ، 87 ، 101619. [ Google Scholar ] [ CrossRef ]
وو، اچ. لین، ا. زینگ، ایکس. آهنگ، دی. Li، Y. شناسایی عوامل محرک اصلی تغییر کاربری زمین شهری از محصولات پوشش زمین جهانی و داده های POI با استفاده از روش جنگل تصادفی. بین المللی J. Appl. زمین Obs. Geoinf. 2021 ، 103 ، 102475. [ Google Scholar ] [ CrossRef ]
ابوحف، م. کو، س. Gueaieb، W. ابیلمونا، آر. هارب، ام. پاسخ به فعالیت های غیرقانونی در امتداد سواحل کانادا با استفاده از یادگیری تقویتی. در مجموعه مقالات IEEE Instrumentation & Measurement Magazine، کاتانیا، ایتالیا، 12 آوریل 2021؛ جلد 24، ص 118-126. [ Google Scholar ] [ CrossRef ]
پتروسیان، GA جلوگیری از ماهیگیری غیرقانونی، گزارش نشده و غیرقانونی (IUU): یک رویکرد موقعیتی. Biol. حفظ کنید. 2015 ، 189 ، 39-48. [ Google Scholar ] [ CrossRef ]
Lin، YL; چن، TY; Yu, LC استفاده از یادگیری ماشینی برای کمک به پیشگیری از جرم. در مجموعه مقالات ششمین کنگره بین المللی IIAI در انفورماتیک کاربردی پیشرفته 2017 (IIAI-AAI)، هاماماتسو، ژاپن، 9 تا 13 ژوئیه 2017؛ IEEE: Piscataway، NJ، ایالات متحده؛ ص 1029–1030. [ Google Scholar ]
ژانگ، ایکس. لیو، ال. شیائو، ال. جی، جی. مقایسه الگوریتم‌های یادگیری ماشین برای پیش‌بینی نقاط داغ جرم. دسترسی IEEE 2020 ، 8 ، 181302–181310. [ Google Scholar ] [ CrossRef ]
Matijosaitiene، I.; مک داوالد، ای. جونجا، وی. پیش‌بینی فضاهای پارکینگ ایمن: رویکرد یادگیری ماشینی به داده‌های شهری و جرم و جنایت. پایداری 2019 ، 11 ، 2848. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
پینتو، ام. وی، اچ. کوناته، ک. Touray، I. بررسی عوامل مؤثر بر داده های جرم و جنایت نیویورک با ابزارهای یادگیری ماشین. جی. کامپیوتر. علمی Coll. 2020 ، 36 ، 61-70. [ Google Scholar ]
میتال، م. گویال، ال.ام. Sethi، JK; Hemanth، DJ نظارت بر تأثیر بحران اقتصادی بر جرم و جنایت در هند با استفاده از یادگیری ماشین. محاسبه کنید. اقتصاد 2019 ، 53 ، 1467-1485. [ Google Scholar ] [ CrossRef ]
بوگومولوف، آ. لپری، بی. استایانو، جی. الیور، ن. پیانسی، اف. پنتلند، آ. روزی روزگاری یک جنایت: به سوی پیش‌بینی جرم از روی اطلاعات جمعیتی و تلفن همراه. در مجموعه مقالات شانزدهمین کنفرانس بین المللی تعامل چندوجهی، استانبول، ترکیه، 12 تا 16 نوامبر 2014; ص 427-434. [ Google Scholar ]
ژو، جی. لی، ز. ما، جی جی. جیانگ، اف. کاوش عوامل تأثیرگذار پنهان بر فعالیت های جرم و جنایت: رویکرد داده های بزرگ. دسترسی IEEE 2020 ، 8 ، 141033–141045. [ Google Scholar ] [ CrossRef ]
البونی، م. مدل‌های پیش‌بینی جرم ویژه منطقه MS Gerber. در مجموعه مقالات پانزدهمین کنفرانس بین‌المللی IEEE در مورد یادگیری ماشین و کاربردها (ICMLA)، آناهیم، کالیفرنیا، ایالات متحده آمریکا، 18 تا 20 دسامبر 2016؛ IEEE: Piscataway، NJ، ایالات متحده؛ صص 671-676. [ Google Scholar ]
ویزبورد، دی. قانون تمرکز جرم و جرم شناسی مکان. جرم شناسی 2015 ، 53 ، 133-157. [ Google Scholar ] [ CrossRef ]
ژانگ، Q. یوان، پی. ژو، Q. یانگ، زی. ویژگی‌های مکانی-زمانی ترکیبی مبتنی بر پیش‌بینی نقاط داغ جنایت. در مجموعه مقالات بیستمین کنفرانس بین المللی IEEE در سال 2016 در مورد کار مشترک با پشتیبانی رایانه در طراحی (CSCWD)، نانچانگ، چین، 4 تا 6 مه 2016؛ IEEE: Piscataway، NJ، ایالات متحده؛ صص 97-101. [ Google Scholar ]
باپی، FK; جونیور، ع. متوین، اس. پیش بینی جرم با استفاده از ویژگی های فضایی. در مجموعه مقالات کنفرانس کانادایی هوش مصنوعی، تورنتو، کانادا، 8 تا 11 مه 2018؛ اسپرینگر: چم، سوئیس؛ صص 367-373. [ Google Scholar ]
Chen, Y. Crime Mapping با استفاده از یادگیری ماشین و وب GIS. Ph.D. پایان نامه، دانشگاه ایالتی کالیفرنیا، نورتریج، کالیفرنیا، ایالات متحده آمریکا، 2019. [ Google Scholar ]
او، ال. پائز، آ. جیائو، جی. آن، پ. لو، سی. مائو، دبلیو. طولانی، D. جمعیت محیطی و سرقت-سرقت: تجزیه و تحلیل فضایی با استفاده از داده های تلفن همراه. ISPRS Int. J. Geo-Inf. 2020 ، 9 ، 342. [ Google Scholar ] [ CrossRef ]
گربر، ام. پیش‌بینی جرم با استفاده از توییتر و تخمین چگالی هسته. تصمیم می گیرد. سیستم پشتیبانی 2014 ، 61 ، 115-125. [ Google Scholar ] [ CrossRef ]
وو، تی. شارما، آر. کومار، آر. پسر، LH; فام، بی تی؛ تین بوی، دی. پریادرشینی، ط. سرکار، م. Le, T. تشخیص میزان جرم و جنایت با استفاده از رسانه‌های اجتماعی مکان‌های مختلف جرم و برچسب‌گذاری بخشی از گفتار توییتر با خوشه‌بندی قهوه‌ای. جی. اینتل. سیستم فازی 2020 ، 38 ، 4287-4299، (پیش چاپ). [ Google Scholar ] [ CrossRef ]
وانگ، ایکس. گربر، ام اس; Brown, DE پیش‌بینی خودکار جرم با استفاده از رویدادهای استخراج شده از پست‌های توییتر. در مجموعه مقالات کنفرانس بین‌المللی محاسبات اجتماعی، مدل‌سازی رفتاری-فرهنگی و پیش‌بینی، کالج پارک، MD، ایالات متحده آمریکا، 3 تا 5 آوریل 2012. اسپرینگر: برلین، هایدلبرگ؛ ص 231-238. [ Google Scholar ]
سیریارایا، پ. ژانگ، ی. وانگ، ی. کاوایی، ی. میتال، م. Jeszenszky، P. Jatowt، A. شاهد جنایت از طریق توییت: ابزار تحقیق جرم بر اساس رسانه های اجتماعی. در مجموعه مقالات بیست و هفتمین کنفرانس بین‌المللی ACM SIGSPATIAL در مورد پیشرفت‌ها در سیستم‌های اطلاعات جغرافیایی، شیکاگو، IL، ایالات متحده آمریکا، 5 تا 8 نوامبر 2019؛ صص 568-571. [ Google Scholar ]
ال هاناچ، اچ. Benkhalifa، M. WordNet مبتنی بر تحلیل احساسات جنبه ضمنی برای شناسایی جرم از توییتر. بین المللی J. Adv. محاسبه کنید. علمی Appl. 2018 ، 9 ، 150-159. [ Google Scholar ] [ CrossRef ]
پاندی، آر. Mohler, GO ارزیابی مدل‌های موضوع جرم: انسجام موضوع در مقابل تمرکز جرم فضایی. در مجموعه مقالات کنفرانس بین المللی IEEE 2018 در زمینه اطلاعات و انفورماتیک امنیتی (ISI)، میامی، فلوریدا، ایالات متحده آمریکا، 9 تا 11 نوامبر 2018؛ IEEE: Piscataway، NJ، ایالات متحده؛ صص 76-78. [ Google Scholar ]
کوانگ، دی. برانتینگهام، پی جی. برتوزی، مدل سازی موضوع جرم و جنایت AL. علوم جنایی 2017 ، 6 ، 12. [ Google Scholar ] [ CrossRef ]
تامپسون، ال. جانسون، اس. اشبی، م. پرکینز، سی. Edwards, P. UK داده های جرم منبع باز: دقت و امکانات برای تحقیق. کارتوگر. Geogr. Inf. علمی 2015 ، 42 ، 97-111. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
موسسه ملی استاتیکا شاخص های اصلی Instituto Nacional de Estatistica (INE)، لیسبون، پرتغال. 2012. در دسترس آنلاین: https://www.ine.pt/xportal/xmain?xpid=INE&xpgid=inemain (در 1 آوریل 2022 قابل دسترسی است).
سارایوا، م. Amante، A. Geografia do bem-estar: Insegurança: O caso dos crimes contra as pessoas no Grande Porto. در جغرافیای دو پورتو ؛ فرناندس، آر.، اد. جلد کتاب: پورتو، پرتغال، 2020; ص 202-211. ISBN 9789898898517. [ Google Scholar ]
GitHub—JustAnotherArchivist/Snscrape: یک وب سایت اجتماعی. در دسترس آنلاین: www.github.com/JustAnotherArchivist/snscrape (در 1 آوریل 2022 قابل دسترسی است).
چینی، اس. تامپسون، ال. Uhlig, S. ابزار نقشه برداری کانون برای پیش بینی الگوهای فضایی جرم. امن J. 2008 , 21 , 4-28. [ Google Scholar ] [ CrossRef ]
کالینیچ، م. کریسپ، تخمین چگالی کرنل JM (KDE) در مقابل تجزیه و تحلیل نقطه داغ – تشخیص نقاط داغ جنایی در شهر سانفرانسیسکو. در مجموعه مقالات بیست و یکمین کنفرانس علوم اطلاعات جغرافیایی، لوند، سوئد، 12 تا 15 ژوئن 2018. [ Google Scholar ]
اک، جی. چینی، اس. کامرون، جی. Wilson, R. Mapping Crime: Understanding Hotspots ; دفتر برنامه های دادگستری وزارت دادگستری ایالات متحده: واشنگتن، دی سی، ایالات متحده آمریکا، 2005.
یانسنبرگر، EM; Staufer-Steinnocher، P. تخمین چگالی هسته دوگانه به عنوان روشی برای توصیف تغییرات مکانی-زمانی در بازار خرده‌فروشی مواد غذایی اتریش فوقانی. در مجموعه مقالات هفتمین کنفرانس AGILE در علم اطلاعات جغرافیایی، هراکلیون، کرت، یونان، 29 آوریل – 1 مه 2004. [ Google Scholar ]
Chainey، SP بررسی تأثیر اندازه سلول و اندازه پهنای باند بر روی نقشه‌های کانون جرم تخمین چگالی هسته برای پیش‌بینی الگوهای فضایی جرم. گاو نر Geogr. Soc. لیژ 2013 ، 60 ، 7–19. [ Google Scholar ]
هو، ی. وانگ، اف. گین، سی. زو، اچ. یک چارچوب تخمین چگالی هسته مکانی-زمانی برای نقشه‌برداری و ارزیابی نقاط داغ جرم و جنایت. Appl. Geogr. 2018 ، 99 ، 89-97. [ Google Scholar ] [ CrossRef ]
Meneses، BM; ریس، ای. ریس، آر. Vale، MJ اثرات استفاده از زمین و پوشش زمین اطلاعات جغرافیایی تعمیم شطرنجی در تجزیه و تحلیل LUCC در پرتغال. ISPRS Int. J. Geo-Inf. 2018 ، 7 ، 390. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
Ord، JK; Getis، A. آمار خودهمبستگی فضایی محلی: مسائل توزیع و یک برنامه کاربردی. Geogr. مقعدی 1995 ، 27 ، 286-306. [ Google Scholar ] [ CrossRef ]
تبشیرانی، آر. انقباض و انتخاب رگرسیون از طریق کمند. JR Stat. Soc. سر. B (Methodol.) 1996 ، 58 ، 267-288. [ Google Scholar ] [ CrossRef ]
دو، دبلیو. Zhan, Z. طبقه‌بندی درخت تصمیم‌گیری ساختمان در داده‌های خصوصی. مهندسی برق و علوم کامپیوتر. 2002. در دسترس آنلاین: https://surface.syr.edu/eecs/8 (دسترسی در 1 آوریل 2022).
Ho, TK جنگل‌های تصمیم تصادفی. در مجموعه مقالات سومین کنفرانس بین المللی تجزیه و تحلیل و شناسایی اسناد، مونترال، QC، کانادا، 14-16 اوت 1995. IEEE: Piscataway، NJ، ایالات متحده؛ جلد 1، ص 278-282. [ Google Scholar ]
Ho, TK روش زیر سرعت تصادفی برای ساخت جنگل های تصمیم. IEEE Trans. الگوی مقعدی ماخ هوشمند 1998 ، 20 ، 832-844. [ Google Scholar ]
Wang, L. (ویرایش) ماشین‌های بردار پشتیبانی: نظریه و کاربردها . Springer Science & Business Media: برلین، آلمان، 2005; جلد 177. [ Google Scholar ]
Blei، DM; Ng، AY؛ جردن، MI تخصیص دیریکله نهفته. جی. ماخ. فرا گرفتن. Res. 2003 ، 3 ، 993-1022. [ Google Scholar ]
لیو، بی. تحلیل احساسات و ذهنیت. هندب نات. لنگ پردازش 2010 ، 2 ، 627-666. [ Google Scholar ]
بریمن، ال. پیش بینی کننده های بگینگ. ماخ فرا گرفتن. 1996 ، 24 ، 123-140. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
Lasierra، FG شناسایی و مقابله با سطوح مختلف امنیت ذهنی 1. در ابعاد ناامنی در مناطق شهری ; باراباس، AT، اد. موسسه ملی بوداپست: بوداپست، مجارستان، 2018. [ Google Scholar ]
سولیموسی، ر. باورز، ک. فوجیما، تی. ترسیم ترس از جنایت به عنوان یک تجربه روزمره وابسته به زمینه که در مکان و زمان متفاوت است. پا. Criminol. روانی 2015 ، 20 ، 193-211. [ Google Scholar ] [ CrossRef ]
LeBeau، JL; لایتنر، ام. مقدمه: پیشرفت در تحقیق در مورد جغرافیای جرم و جنایت. پروفسور Geogr. 2011 ، 63 ، 161-173. [ Google Scholar ] [ CrossRef ]
بانتینگ، RJ; چانگ، OY؛ کوئن، سی. هانکینز، آر. لنگستون، اس. وارنر، ا. یانگ، ایکس. لودربک، ER; روی، اس اس الگوهای فضایی سرقت و حمله شدید در شهرستان میامی-داد، 2007-2015. پروفسور Geogr. 2018 ، 70 ، 34-46. [ Google Scholar ] [ CrossRef ]
هانت، پی. کیلمر، بی. روبین، جی. توسعه گزارش جرم اروپا: بهبود ایمنی و عدالت با داده های جرم و عدالت کیفری موجود . رند اروپا: کمبریج، بریتانیا، 2011. [ Google Scholar ]
مشارکت در امنیت در فضاهای عمومی (PSPS). برنامه اقدام شهری دستور کار مشارکت امنیت در فضاهای عمومی. 2021. در دسترس آنلاین: https://ec.europa.eu/futurium/en/system/files/ged/final_action_plan_security_in_public_spaces.pdf (دسترسی در 1 آوریل 2022).
ویزبرد، دی. سفید، سی. وودیچ، الف. آیا کارآیی جمعی در سطح جغرافیایی خرد اهمیت دارد؟ برادر J. Criminol. 2020 ، 60 ، 873-891. [ Google Scholar ] [ CrossRef ] [ PubMed ]
ویزبرد، دی. سفید، سی. سیم ها.؛ ویلسون، DB افزایش کنترل‌های اجتماعی غیررسمی برای کاهش جرم و جنایت: شواهدی از مطالعه نقاط داغ جرم و جنایت. قبلی علمی 2021 ، 22 ، 509-522. [ Google Scholar ] [ CrossRef ]
فاستر، اس. گیلز کورتی، بی. Knuiman، M. طراحی محله و ترس از جرم: یک بررسی اجتماعی-اکولوژیکی از همبستگی های ترس ساکنان در توسعه های جدید مسکن حومه شهر. Health Place 2010 ، 16 ، 1156-1165. [ Google Scholar ] [ CrossRef ]
ویزبرد، دی. گراف، ای آر. یانگ، اس ام درک و کنترل نقاط داغ جرم: اهمیت کنترل های اجتماعی رسمی و غیررسمی. قبلی علمی 2014 ، 15 ، 31-43. [ Google Scholar ] [ CrossRef ]

شکل 1. وقوع جرم ثبت شده پورتو بین سال های 2016 و 2018: ( الف ) بر حسب ساعت. ( ب ) بر اساس ماه و روز

شکل 2. تخمین تراکم هسته پورتو از جرایم گزارش شده از سال 2016 تا 2018 بر اساس بخش خیابان

شکل 3. تجزیه و تحلیل کانون های نوظهور برای جنایات گزارش شده

شکل 4. پیش‌بینی جنایت در پورتو بر اساس داده‌های 2016 تا 2018

شکل 5. توزیع فضایی توییت های جمع آوری شده

شکل 6. پنج موضوع حاصل از مدل سازی LDA (منبع: نویسندگان، بر اساس داده های توییتر).

شکل 7. ابرهای کلمه ای از مثبت ترین و منفی ترین احساسات بر اساس تجزیه و تحلیل احساسات توییت ها

شکل 8. توزیع فضایی نمرات احساسات

مقالات داخلی و بین المللی

بدون دیدگاه

دیدگاهتان را بنویسید لغو پاسخ

برای نوشتن دیدگاه باید وارد بشوید.

مشاورین هوش پیروزی

کلید واژه ها:

1. مقدمه

2. یادگیری ماشینی، تحلیل احساسات و مدل‌سازی موضوع در نقطه داغ و پیش‌بینی جرم