1. مقدمه
مطالعه توزیع جرایم در مناطق شهری منبع اصلی اطلاعات برای مقامات محلی است که منجر به اقدامات مناسب و راهبردهای مناسب توسط پلیس و شهرداری می شود. تجزیه و تحلیل جرایم شهری به وضعیت توسعه و عملکرد مناطق شهر نیز مربوط می شود و احتمالاً به جداسازی مشکلات بزهکاری برای تسهیل درک علل آنها و ارائه راه حل کمک می کند. انتقال آن همچنین با ارائه اطلاعات معنادار در مورد محله های نامزد که می تواند نیازهای آنها را برآورده کند، خدماتی را به شهروندان ارائه می دهد. به ویژه، اخیراً یک علاقه پژوهشی برجسته به سمت مفهوم جرم شناسی مکان معطوف شده است [ 1]، تلاش برای ادغام دانش جرم شناسی محیطی با سیاست های جرم محور جامعه و عناصر اجتماعی مرتبط (به عنوان مثال، فقر، اختلافات نژادی). مطالعات تجربی و نظری بر بررسی دلایل مکان و زمان وقوع انواع جرایم [ 2 ، 3 ] و رابطه آنها با جنبه های متضاد اجتماعی-اقتصادی در میان جوامع متمرکز شده است [ 4 ].
فعالیت های مجرمانه بسته به تخلف ارتکابی و زمینه اجتماعی و جغرافیایی محل وقوع آن، به اشکال و برداشت های مختلف بروز می کنند. علاوه بر این، بررسی توزیع جرایم شهری اغلب تحت تأثیر منبع دادههای منطقه مورد مطالعه قرار میگیرد که به موجب آن سازمانهای ملی و محلی مختلف تعاریف و دستهبندیهای متفاوتی از نوع جرم ارائه میکنند. به طور کلی، رویکردهای سنتی بر آمار نسبت و کمیت انواع جرم و جنایت بر اساس یک طرح طبقه بندی از پیش تعریف شده تمرکز می کنند. بنابراین، نتایج تحلیلی معمولاً بر روی انواع جداگانه انجام می شود. نمونههای سرراست با تحلیلهای مکانی-زمانی تک نوع نشان داده میشوند، از جمله، به عنوان مثال، تمرکز بر سرقت در زمینه پدیدههای تقریباً تکراری [ 5 ،6 ]، یا مطالعات شهری در مورد توزیع سرقت های خیابانی [ 7 ، 8 ]. به طور خاص، تحقیق شده است که هنگامی که یک رویداد جنایی در یک مکان تعریف شده رخ می دهد، رویدادهای جنایی بیشتر احتمالاً در مناطق مجاور رخ می دهد و الگوهای جرم درون طبقه بندی را تعریف می کند. از این نظر، تمرکز بر موقعیتهای تقریباً تکراری معمولاً تنها بر مجموعه بسیار کوچکی از مقولههای متمایز، یعنی دزدی، سرقت، و نقض سلاح تمرکز میکند [ 9 ، 10 ، 11 ]. علاوه بر این، تعدادی از کارهای تحقیقاتی به طور موازی نتایج تجربی را در مورد انواع جنایات متعدد به طور جداگانه گزارش میکنند و تغییرات تعداد هر نوع متمایز را نظارت میکنند [ 12 ، 13 ]]. همین رفتار در فعالیت های پیش بینی جرم نیز منعکس می شود [ 14 ]. همچنین چند کار وجود دارد که چندین دسته را در کلاسهای منفرد بر اساس ویژگیهای محیطی مشابه [ 15 ] یا ویژگیهای تجمع نوع جرم از پیش تعریفشده (مانند جرایم خشونتآمیز و غیرخشونتآمیز) ترکیب میکنند [ 16 ].
در هر صورت، گرایش کلی بر دستهبندی نوع جرم اصلی که توسط هر کشور یا نهاد محلی ارائه میشود، متشکل از ساختارهای سلسله مراتبی از یک دیدگاه واحد، از دستههای سطح بالا تا زیرگروههای سطح پایینتر متمرکز است. این طبقهبندی سنتی مبتنی بر درخت، انواع جرم را زمانی مستقل از یکدیگر میداند که از یک دسته سطح بالاتر منشعب نمیشوند، بنابراین فاقد روابط معنایی بینردهای هستند. انواع جرایمی که ممکن است ذاتاً به هم مرتبط باشند، اما از دستههای سطح بالا منشعب میشوند، بسیار دور از یکدیگر رفتار میشوند. به عنوان مثال، نوع جرم “برهم زدن آرامش” را می توان با نوع جرم “نوشیدن مشروب در ملاء عام” در درک ارتباط ذاتی مرتبط دانست، زیرا این دو جرم می توانند از منظر پلیس به هم مرتبط شوند. با این حال، “برهم زدن آرامش” به رده “رفتار بی نظم” تعلق دارد، در حالی که “نوشیدن مشروبات الکلی در ملاء عام” به رده “نقض مشروبات الکلی” در طبقه بندی جرم شهر بوستون تعلق دارد. به عنوان مثالی دیگر، سه نوع جرم «تصادف وسیله نقلیه موتوری (M/V) – خسارت مالی، «عملکرد تحت تأثیر – الکل» و «نقض قانون خودرو (VAL) – کارکردن خودروی ثبت نام نشده/بیمهشده» با هم میتوانند منعکس کننده این موارد باشند. وضعیت مشابه، علیرغم تعلق به سه دسته مختلف، به ترتیب «پاسخ به تصادف وسایل نقلیه موتوری»، «عملکرد تحت تأثیر» و «تخلفات». مجدداً، انواع جرم «سرقت خودرو-موتور سیکلت/روروک مخصوص بچهها»، «اموال – سرقت شده و سپس کشف» و «سلاح/سلاح-کشف یا مصادره» میتوانند بخشی از یک داستان باشند، اما به دستههای مختلف «خودرو» تعلق دارند. سرقت، “اموال مسروقه کشف شده”، و “کشف سلاح گرم”. بنابراین، بررسی توزیع جرایم شهری بر اساس طبقهبندی نوع جرم با ساختار درختی، ناگزیر بخشی از از دست دادن اطلاعات را معرفی میکند، زیرا انواع جرایم زمانی که از یک دسته سطح بالاتر منشعب نمیشوند، به طور متقابل مستقل در نظر گرفته میشوند. تنها آمار گزارش شده از نوع جرم، از روابط معنایی ضمنی بین دستههای مختلف جرم غفلت میکند.
فقط تعداد کمی از مطالعات به مشکل تحلیل روابط بین مقولهای مکانی-زمانی، به ویژه استفاده از شاخصهای جهانی تراکم و تنوع وقوع جرم [ 17 ]، متن کاوی توصیفات سوابق جنایی [ 18 ]، و فضای آماری مربوط به نوع فردی پرداختند. -امضاهای زمانی [ 19 ]. مجموعه خاصی از تحقیقات بر هممکانی و پیوند جرم متمرکز است، از جمله مطالعه هممکانی فضایی بین یک نوع جرم و دستهبندیهای مختلف کاربری زمین [ 20 ، 21 ] یا امکانات شهری [ 22 ]، و تحلیل هممکانی فضایی. وجود انواع جرم در میان واحدهای جغرافیایی پراکنده [ 23]، در زمینه گسترده تمرکز جرم فضایی [ 24 ، 25 ، 26 ] درج شده است. با این حال، تا آنجا که ما میدانیم، تحقیقات بسیار کمی با طراحی رویکردهای مدلسازی جدید برای استخراج ویژگیهای مکانی-زمانی رخدادهای جنایی همزمان میپردازد.
کار ما به پر کردن شکاف اطلاعاتی بین گروهی با ارائه درک کامل تر از انواع جرم در مناطق شهری در هر دو جنبه کیفی و کمی کمک می کند. به طور خاص، ما یک نمایش نوع جرم مبتنی بر برداری را پیشنهاد میکنیم که از طریق یادگیری ماشینی بدون نظارت بر روی عوامل زمانی و جغرافیایی ساخته شده است. ایده کلی این است که انواع جرم را به عنوان «مرتبط» تعریف کنیم، اگر آنها اغلب در یک منطقه و در یک بازه زمانی اتفاق میافتند، بدون توجه به هر طبقهبندی سلسله مراتبی اولیه. پیاده سازی از طریق معرفی مفهوم تعبیه بردارها در حوزه جرم انجام می شود. تعبیهها در ابتدا در دنیای پردازش زبان طبیعی (NLP) برای مدلسازی روابط معنایی بین کلمات ارائه شدند [ 27 ، 28 ، 29، 30 ]. در سالهای اخیر، در میان رشتههای دیگر، آنها همچنین با حوزههای جغرافیایی و شهری سازگار شدند [ 31 ، 32 ، 33 ، 34 ]، که عمدتاً برای نشان دادن مکانها یا نقاط دیدنی بر اساس توزیع فضایی آنها در قلمرو استفاده میشوند [ 35 ، 36 ] یا بر روی فعالیت حرکتی افراد بین آنها [ 37 ، 38 ]. ایده کلی در پشت مدلهای جاسازی، تولید نمایشهای موجودیت در قالب بردارهای با ارزش واقعی است که به موجب آن فاصله هر جفت موجودیت در فضای برداری، ارتباط معنایی آنها را منعکس میکند.
ما بدین وسیله یک چارچوب جدید برای کاوش انواع جرم شهری و مناطق شهری مرتبط با جرم، که در آن روابط ضمنی بین انواع مختلف در نظر گرفته میشود، پیشنهاد میکنیم. به طور خاص، ما به ساخت یک فضای برداری ادامه می دهیم که در آن همه انواع جرم به صورت یکسان به عنوان نقاط نمایش داده می شوند و روابط معنایی بین آنها توسط موقعیت های نسبی آنها منعکس می شود. این به معیار جدیدی از مقایسه می پردازد که فراتر از ساختارهای از پیش تعریف شده است و روابط پنهان بین انواع جرم را با استفاده از فضای برداری که به شیوه ای کاملاً مبتنی بر داده تولید می شود، آشکار می کند. فاصله نسبی بین انواع جرم، روابط معنایی قویتر یا ضعیفتر را آشکار میکند.
بردارهای نوع جرم با استفاده از یک روش جاسازی که ما آن را CrimeVec نامیدیم، با استفاده از ابزارهای Word2vec بر روی توالی های زمانی-مکانی پیش پردازش شده وقوع جرم شهری به دست می آیند. خروجی آن منجر به طراحی یک نمایش قابل خواندن توسط ماشین می شود که به موجب آن انواع جرایم مرتبط، بازنمایی های مشابهی را از نظر ریاضی به اشتراک می گذارند. CrimeVec در ابتدا برای به دست آوردن بردارهای متراکم از انواع جرم آموزش داده شده است که به نوبه خود می تواند برای تولید بردارهای مناطق شهری استفاده شود.
این روش بر روی مجموعه داده های اخیر رویدادهای جنایی در شهر بوستون، ماساچوست ارزیابی شد. ما توالیهایی از جنایات را بر اساس مکان و زمان وقوع ثبتشده ایجاد کردیم و آنها را به یک مدل مبتنی بر Skip-gram Word2vec تغذیه کردیم، که بردار تعبیهشده را برای هر نوع جرم با توجه به انواع مکرر همزمان آن در امتداد دنبالهها تعریف کرد. ما در نهایت از تعبیههای نوع جرم برای ساخت توطئههای تجسم منطقه شهری و جاسازیهای منطقه شهری استفاده کردیم. بنابراین، مقایسههای ارتباط و بازنماییهای بصری بر اساس وقوع جرم واقعی انجام شد، بهویژه با برجسته کردن ویژگیهای مجاورتهای مبتنی بر داده در مقابل ساختارهای سلسله مراتبی از پیش تعریفشده.
2. روش شناسی
CrimeVec یک روش بدون نظارت برای به دست آوردن بردارهای ویژگی چند بعدی (جاسازی) انواع جرم است که به نوبه خود می تواند برای ایجاد تجسم منطقه شهری و بردارهای منطقه شهری استفاده شود. این الگوریتم از دو مرحله تشکیل شده است: ایجاد توالی های مکانی- زمانی از انواع جرم و استفاده از یک مدل مبتنی بر Word2vec برای یادگیری بازنمایی های تعبیه شده مربوطه. این بخش نحوه پیش پردازش داده های جرم و جنایت را به منظور تغذیه آنها به مدل تعبیه، و نحوه اعمال و آموزش مدل بر روی چنین توالی جرمی برای ساخت جاسازی انواع جرم و مناطق شهری شرح می دهد.
2.1. پیش پردازش داده ها
رویدادهای جنایی به عنوان نقاطی در فضا و زمان نشان داده می شوند که با مکان مکانی وقوع (مثلاً به صورت جفت مختصات طول و عرض جغرافیایی)، مهر زمانی و برچسب طبقه بندی که نشان دهنده نوع جرم ارتکابی است، مشخص می شوند: سیمن=لآتیمن، لonمن، تیمن، تیyپهمن. بسته به منبع داده، ویژگی های اضافی ممکن است در دسترس باشد. با این حال، برای یک کاربرد گسترده تر، ما فقط به اطلاعات ذکر شده تکیه می کنیم.
مرحله پیش پردازش شامل تبدیل رویدادهای جنایی منفرد به دنباله هایی از انواع جرم، به طور خاص ایجاد توالی بر اساس مکان و زمان وقوع است. سپس این دنباله ها به عنوان یک مجموعه آموزشی برای مدل Word2vec مورد استفاده قرار می گیرند.
فرآیند تعریف توالی از یک قاعده ساده پیروی می کند: یک دنباله باید از انواع جرم تشکیل شده باشد که به رویدادهای جرمی که به ترتیب زمانی ترتیب داده شده اند که در همان منطقه ارتکاب یافته اند، اشاره دارد. واحد مساحت پارامتری است که می توان با توجه به ویژگی های مجموعه داده و ویژگی های برنامه انتخاب کرد. اگر قلمرو مورد مطالعه برای تقسیم بندی انتخاب شود نمناطق، نتیجه پیش پردازش توسط نشان داده شده است نسکانس های متشکل از وقوع جرم به ترتیب زمانی به شکل جفت تیyپهمن، تیمن. دنباله ای که به منطقه اشاره دارد jدر واقع به عنوان نشان داده شده است اسj={تیyپهمن، تیمن | من=1،2،3،…}j. بنابراین اطلاعات زمانی به صراحت در توالی، همراه با نوع جرم ارتکابی کدگذاری می شود. مجموعه این دنبالهها ورودی واقعی مدل تعبیهسازی و در نتیجه پایه فرآیند یادگیری نمایشهای برداری نهایی است. با استفاده از موازی با NLP، توالی ها مجموعه آموزشی را تشکیل می دهند و مجموعه ای از انواع جرم ممکن واژگان را نشان می دهد. در بخش فرعی بعدی، الگوریتم Word2vec را معرفی میکنیم و توضیح میدهیم که چگونه آن را برای یادگیری بازنماییهای تعبیهشده نوع جرم تطبیق داده و آموزش دادهایم.
2.2. مدل جاسازی برای بازنمایی های وکتور نوع جرم
2.2.1. الگوریتم Word2vec
مفهوم جاسازی بردارها از حوزه NLP برای مدلسازی روابط معنایی کلمات، بر اساس رخدادهای متوالی آنها در متن خام سرچشمه میگیرد. ماهیت طبقهبندی کلمات و وابستگی متوالی مدلهای تعبیهشده منجر به تعمیم مستقیم مسئله میشود، که امکان انطباق مدلهای جاسازی را با بسیاری از کاربردهای مرتبط با تجزیه و تحلیل نمایشهای متوالی موجودیتهای طبقهبندی میدهد.
به طور کلی، تعبیهها را میتوان بهعنوان بردارهای متراکم معنا توصیف کرد، که بازنمایی واقعی آنها بر اساس توزیع همزمان عناصر در یک مجموعه آموزشی بزرگ است. شهود کلی این است که عناصری که در زمینه های مشابه رخ می دهند، بازنمایی های برداری مشابهی دارند.
Word2vec [ 28] یکی از پرکاربردترین تکنیک ها برای تولید بردارهای تعبیه شده است. به طور کلی به عنوان یک رویکرد بدون نظارت در نظر گرفته می شود (هدف آن محدود به تعیین بازنمایی های موجودیت است)، اما هنوز به صورت داخلی یک مشکل پیش بینی کمکی را در طول فرآیند یادگیری تعریف می کند. با توجه به «واژگان» موجودیتهای منحصربهفرد، و مجموعه آموزشی متشکل از مجموعهای از دنبالههای آن موجودیتها، این مدل برای اسکن هر دنباله با یک پنجره کشویی و تعریف داخلی، در هر مرحله، یک کار پیشبینی متشکل از پیشبینی موجودیت فعلی با کمک موجودیت های همسایه خود در امتداد دنباله (یا برعکس، بسته به اینکه کدام یک از دو نسخه Word2vec استفاده می شود: CBOW یا Skip-gram). ساختار مدل یک شبکه عصبی مصنوعی است که از یک لایه طرح ریزی خطی منفرد بین لایه های ورودی و خروجی ساخته شده است. وزنهایی که هر موجودیت در لایه ورودی را به نورونهای لایه پنهان متصل میکنند، بردارهای تعبیهشده مؤثر را تعریف میکنند، که بنابراین اندازه آنها برابر با تعداد انتخاب شده نورونهای پنهان در شبکه است. از نظر ریاضی، مجموعه بردارهای تعبیه شده را می توان به عنوان یک ماتریس وزنی از ابعاد تعداد_هویت × اندازه_بردار نشان داد. نتایج پیشبینی در طول فرآیند آموزش، بهروزرسانیهای ماتریس تعبیه را تعیین میکند. پیشبینی در واقع به خودی خود یک هدف نیست، بلکه تنها یک پروکسی برای یادگیری بازنماییهای برداری است. مجموعه بردارهای تعبیه شده را می توان به عنوان یک ماتریس وزنی از ابعاد تعداد × اندازه بردار نمایش داد. نتایج پیشبینی در طول فرآیند آموزش، بهروزرسانیهای ماتریس تعبیه را تعیین میکند. پیشبینی در واقع به خودی خود یک هدف نیست، بلکه تنها یک پروکسی برای یادگیری بازنماییهای برداری است. مجموعه بردارهای تعبیه شده را می توان به عنوان یک ماتریس وزنی از ابعاد تعداد × اندازه بردار نمایش داد. نتایج پیشبینی در طول فرآیند آموزش، بهروزرسانیهای ماتریس تعبیه را تعیین میکند. پیشبینی در واقع به خودی خود یک هدف نیست، بلکه تنها یک پروکسی برای یادگیری بازنماییهای برداری است.
در اجرای خود، ما رویکرد Skip-gram را اتخاذ کردیم، و فرآیند یادگیری را به عنوان به حداکثر رساندن احتمال پیشبینی، در هر نمونه آموزشی، نهادهای همسایه تنظیم کردیم. جE1،…، جEj(همچنین به عنوان زمینه شناخته می شود) یک نهاد متمرکز معین Eتیبا توجه به تعبیه فعلی آن θتی. تابع هزینه سی، با آموزش تصادفی مینی دسته ای بهینه شده است، بنابراین شکل احتمال ثبت منفی پیش بینی صحیح را در نظر می گیرد:
گرادیان، مشتق شده با توجه به پارامترهای جاسازی θ (یعنی ∂C/∂θ)، به روز رسانی مقادیر جاسازی را تعریف می کند. این فرآیند در کل بدنه آموزشی تکرار می شود تا زمانی که ضرر به اعداد ثابت همگرا شود. به این ترتیب، بردارهای تعبیه شده همه موجودیت ها آموخته می شوند و روابط معنایی بین آنها را می توان به راحتی از طریق اندازه گیری های مبتنی بر فاصله در فضای برداری کمی سازی کرد.
2.2.2. آموزش مدل و نسل بردار نوع جنایت
مجموع انواع جرم منحصر به فرد در مجموعه آموزشی مجموعه “واژگان” را تعریف می کند که عناصر آن به عنوان جاسازی در نظر گرفته شده است. بنابراین، یک بردار برای هر نوع جرم منحصر به فرد تولید می شود که می تواند به عنوان یک ردیف منحصر به فرد خاص از ماتریس تعبیه شده با اندازه num_crime_types × vector_size در نظر گرفته شود.
مجموعه آموزشی متشکل از داده های جنایی از پیش پردازش شده در قالب توالی های وابسته به فضا از رویدادهای جنایی مرتب شده به ترتیب زمانی است که به صورت جفت نمایش داده می شوند. تیyپهمن، تیمنگزارش نوع جرم ارتکابی و مهر زمانی آن.
در طول آموزش، ما هر دنباله را با یک پنجره کشویی اسکن می کنیم و در هر مرحله، نوع جرم کانونی فعلی و متغیر متن، ورودی و هدف آن را به ترتیب به مدل Skip-gram Word2vec شناسایی می کنیم. عبارت کلی «انواع جرم بر اساس رخدادهای متقابل در مکان و زمان نشان داده میشوند»، بنابراین در عمل به این صورت ترجمه میشود: «انواع جرم بر اساس هموقوعهای وابسته به زمانشان در امتداد توالیهای وابسته به فضا نمایش داده میشوند». زمینه هر نوع جرم متمرکز بر اساس مجاورت زمانی در همان دنباله تعریف میشود که نشاندهنده همان ناحیه فضایی است. مجاورت زمانی از طریق یک پنجره کشویی وابسته به زمان مدلسازی میشود که منجر به یک زمینه با طول متغیر میشود. بر خلاف Word2vec سنتی، تنظیم فراپارامتر مدل به عنوان یک تعداد ثابت انتخاب شده از عناصر زمینه (به عنوان مثال، سه عنصر قبلی و سه عنصر زیر در امتداد دنباله)، ما هایپرپارامتر را به عنوان یک بازه زمانی انتخاب شده تعریف می کنیم، بنابراین منجر به تعداد متغیری از عناصر زمینه در هر مرحله لغزشی می شود. برای هر عنصر تمرکز در دنباله، فقط انواع جرم که در یک بازه زمانی مشخص رخ میدهند در پنجره زمینه درج میشوند. انتخاب مقدار بازه زمانی، بسته به اهداف نمایندگی و توزیع زمانی انواع جرم، دلخواه است. این به ویژه تحت تأثیر فراپارامتر وضوح فضا قرار می گیرد، که در هنگام ساخت سکانس های جنایی وابسته به فضا، تقسیم بندی قلمرو را تعیین می کند. یک مثال تصویری از فرآیند پنجره کشویی در گزارش شده است بنابراین منجر به تعداد متغیری از عناصر زمینه در هر مرحله لغزشی می شود. برای هر عنصر تمرکز در دنباله، فقط انواع جرم که در یک بازه زمانی مشخص رخ میدهند در پنجره زمینه درج میشوند. انتخاب مقدار بازه زمانی، بسته به اهداف نمایندگی و توزیع زمانی انواع جرم، دلخواه است. این به ویژه تحت تأثیر فراپارامتر وضوح فضا قرار می گیرد، که در هنگام ساخت سکانس های جنایی وابسته به فضا، تقسیم بندی قلمرو را تعیین می کند. یک مثال تصویری از فرآیند پنجره کشویی در گزارش شده است بنابراین منجر به تعداد متغیری از عناصر زمینه در هر مرحله لغزشی می شود. برای هر عنصر تمرکز در دنباله، فقط انواع جرم که در یک بازه زمانی مشخص رخ میدهند در پنجره زمینه درج میشوند. انتخاب مقدار بازه زمانی، بسته به اهداف نمایندگی و توزیع زمانی انواع جرم، دلخواه است. این به ویژه تحت تأثیر فراپارامتر وضوح فضا قرار می گیرد، که در هنگام ساخت سکانس های جنایی وابسته به فضا، تقسیم بندی قلمرو را تعیین می کند. یک مثال تصویری از فرآیند پنجره کشویی در گزارش شده است بسته به اهداف نمایندگی و توزیع زمانی انواع جرم؛ این به ویژه تحت تأثیر فراپارامتر وضوح فضا قرار می گیرد، که در هنگام ساخت سکانس های جنایی وابسته به فضا، تقسیم بندی قلمرو را تعیین می کند. یک مثال تصویری از فرآیند پنجره کشویی در گزارش شده است بسته به اهداف نمایندگی و توزیع زمانی انواع جرم؛ این به ویژه تحت تأثیر فراپارامتر وضوح فضا قرار می گیرد، که در هنگام ساخت سکانس های جنایی وابسته به فضا، تقسیم بندی قلمرو را تعیین می کند. یک مثال تصویری از فرآیند پنجره کشویی در گزارش شده استشکل 1 ، با استفاده از یک پنجره زمینه سه ساعته در گذشته و سه ساعت در آینده.
برای هر نوع جرم متمرکز، مدل بردار تعبیه شده مربوطه خود را با توجه به انواعی که در زمینه آن قرار می گیرند به روز می کند. با انجام مکرر کار پیشبینی داخلی کمکی در مورد توزیع انواع جرم به لحاظ مکانی و زمانی، این مدل به نمایش نهایی انواع جرم در «واژگان» ختم میشود.
فرآیند کلی از داده های خام تا بردارهای جاسازی در شکل 2 خلاصه شده است .
2.3. فضای برداری منطقه شهری
تعبیههای نوع جرم میتواند بیشتر برای کاوش توزیع نوع جرم در مناطق شهری مورد استفاده قرار گیرد. ما دو جهت ممکن را بر اساس ترکیب بردارهای نوع جرم برای ارائه اطلاعات در مورد مناطق شهری شناسایی کردیم. جهت اول به نقشه های موضوعی برای اهداف تجسم و کاوش شهودی داده ها متکی است. جهت دوم شامل تولید موثر تعبیههای منطقه شهری است که امکان اقدامات شباهت کمی بین مناطق شهر را فراهم میکند.
برای ارائه یک کاوش بصری بصری از مناطق شهری مرتبط با جرم، ما از یک نسخه کاهشیافته از فضای برداری نوع جرم به عنوان الگویی برای نمودارهای تجسم در قالب یک نقشه موضوعی استفاده میکنیم. با الهام از [ 35 ]، ما بازنماییهای تعبیهشده نوع جرم را در یک فضای دو بعدی ترسیم میکنیم و پیکربندی جرم هر منطقه را بهعنوان یک نقشه موضوعی تنظیمشده بر روی تعداد جرم هر نوع نشان میدهیم. از آنجایی که اطلاعات در چنین فضای معنایی تجمیع میشوند (انواع جرم مرتبط در نزدیکی یکدیگر قرار دارند)، الگوهای زیربنایی در دادههای جرم راحتتر به صورت بصری آشکار میشوند. این می تواند به درک شهودی و مقایسه آسان توزیع نوع جرم در مناطق مختلف شهری کمک کند.
برای اندازهگیری کمی شباهتها بین مناطق شهری مرتبط با جرم، در عوض، بردارهای واقعی مناطق را از طریق ترکیب بردارهای نوع جرم ایجاد میکنیم. هنگامی که تعبیه انواع جرم منفرد ایجاد شد، از آنها برای به دست آوردن بردارهای متراکم از مناطق شهری، مناطق و به طور کلی بخش هایی از قلمرو استفاده می کنیم. به ویژه، با پیروی از رویکرد ساده اما مؤثر میانگینگیری درج کلمات در متن برای ایجاد بردارهای سند [ 39 ، 40 ]، ما یک منطقه شهری مرتبط با جرم را بهعنوان ترکیبی از معانی نوع جرم فردی تعریف میکنیم. تابع ترکیب ناحیه از یک بردار متوسط تشکیل شده است آربر بردارهای همه عناصر جرم و جنایت ج1،…،جکدر ترکیب:
این رویکرد از پایین به بالا مزیت کارآمد بودن را نشان میدهد، زیرا از مدلهای آموزشدیده مجدد استفاده میکند، و مؤثر است، زیرا انواع جرم مرتبط به طور جمعی بیان اجزای مربوطه را افزایش میدهند و بنابراین، به طور خودکار ویژگیهای بردار متمایز را تعریف میکنند.
شکل 3 تحلیل منطقه شهری مرتبط با جرم را خلاصه می کند.
3. آزمایش کنید
این بخش ابتدا مجموعه داده انتخاب شده برای آموزش مدل CrimeVec و تنظیمات آزمایشی را تشریح می کند، سپس نتایج را از نظر تعبیه های نوع جرم، نقشه های موضوعی منطقه شهری و بردارهای منطقه شهری گزارش می کند.
3.1. داده ها
برای ارزیابی مدل از مجموعه دادههای جرم و جنایت در دنیای واقعی استفاده شد. شهر بوستون (ماساچوست، ایالات متحده آمریکا) به عنوان مطالعه موردی انتخاب شد که وقوع جرم و هشدارهای آن قبلاً در کارهای تحقیقاتی مختلف در مورد تجزیه و تحلیل و پیشبینی جرم مورد استفاده قرار گرفته است [ 41 ، 42 ]. با این وجود، چارچوب پیشنهادی را می توان برای هر نوع قلمرو شهری و زیر قلمرو در سراسر جهان اعمال کرد.
شهر بوستون دارای منطقه شهری 232.14 است کیلومتر2و جمعیت 694583 نفر (تخمین 2018). این قلمرو از نظر اداری به 17 منطقه برنامه ریزی و 69 منطقه آماری محله از سازمان توسعه مجدد بوستون، 178 منطقه سرشماری، 558 گروه بلوک سرشماری، و 7288 بلوک سرشماری تقسیم شده است [ 43 ]. دادههای جرم و جنایت از پورتال داده باز شهر بوستون ( https://data.boston.gov/dataset/crime-incident-reports-august-2015-to-date-source-new-system ، دسترسی به 23) به دست آمد. فوریه 2021)، گزارش رسمی وقوع جرم در قلمرو بوستون. به طور خاص، مطالعه موردی ما از داده های جرم در سال 2019 استفاده می کند و در مجموع 93080 رویداد جنایی را ثبت می کند.
هر رویداد جرم ثبت شده شامل تاریخ و مهر زمان وقوع، موقعیت جغرافیایی آن (به عنوان نزدیکترین تقاطع خیابان یا مرکز بین تقاطع خیابان ها محو شده است)، و نوع فعالیت مجرمانه است. دسته بندی نوع جرم اصلی به صورت درختی است و دارای طبقه بندی در سطوح بالاتر و پایین تر است. پس از یک فرآیند پاکسازی داده ها شامل حذف رخدادهای جرم بدون برچسب و انواع جرایم بسیار نادر، در مجموع از 147 نوع جرم مختلف سطح پایین متعلق به 48 دسته برتر در آموزش مدل استفاده شد. یک نمای کلی از دسته بندی نوع جرم در جدول 1 گزارش شده است. با توجه به توزیع جغرافیایی وقوع جرم در طول زمان، ما یک تفکیک فضایی برای ساخت توالی های ورودی به مدل تعبیه شده در سطح گروه های بلوک سرشماری تعریف کردیم. به طور کلی، انتخاب پارامترهایی مانند تفکیک فضا و دسته بندی نوع جرم را می توان متفاوت تعریف کرد و باید با توجه به ویژگی های مجموعه داده تنظیم شود. با توجه به رزولوشن گروه بلوک سرشماری انتخاب شده، در مجموع 558 توالی جرم احتمالی ایجاد شد، که هر یک از آنها به یک منطقه واحد فضایی منحصر به فرد که نماینده یک گروه بلوکی خاص است، اشاره دارد.
3.2. تنظیمات آزمایشی
مدل CrimeVec با اندازه پنجره زمینه سه ساعت در گذشته و سه ساعت در آینده و اندازه برداری 25 بعد اجرا شد. فرآیند آموزش از بهینهسازی مینی دستهای با تکیه بر تلفات تخمین نویز متضاد و بهینهساز Adam بهره میبرد [ 44 ، 45 ].
برای تعیین کمیت ارتباط موجودیت، ما معیار تشابه کسینوس را برای بازنماییهای تعبیهشده اعمال کردیم، بنابراین قدرت رابطه انواع جرم و مناطق شهری را به کسینوس زاویه بین بردارها ترجمه کردیم: با افزایش زاویه، شباهت کاهش مییابد، در حالی که به عنوان زاویه رشد میکند. کاهش می یابد. شباهت کسینوس به عنوان حاصل ضرب نقطه ای بردارهای نرمال شده واحد محاسبه می شود:
به منظور نگاشت تعبیهها در یک فضای معنایی قابل نمایش بصری، از روش جاسازی تصادفی همسایه t توزیع شده (t-SNE) [ 46 ] استفاده کردیم، که دامنه آن کاهش ابعاد است در حالی که سعی میکنیم موجودیتهای مشابه نزدیک و موجودیتهای غیرمشابه را از هم جدا نگه دارند. . که به طور گسترده برای تجسم خوشههایی از نمونههای با ابعاد بالا استفاده میشود، ما آن را به عنوان وسیلهای برای گزارش بصری روابط موجودیت به روشی بصری، با نگاشت بردارهای 25 بعدی در یک فضای معنایی دو بعدی، اتخاذ کردیم.
3.3. ارزیابی
یافته های ارزیابی در دو سطح سازماندهی شده است: انواع جرم و مناطق شهری.
ارزیابی نوع جرم بر شباهت برداری بین انواع جرم منفرد متمرکز است و خروجی مستقیم مدل CrimeVec را بررسی می کند. ارتباط انواع جرم مورد تجزیه و تحلیل قرار میگیرد و روابط بین مقولهای فضایی-زمانی در رابطه با طبقهبندی نوع جرم اصلی را آشکار میکند. از سوی دیگر، ارزیابی منطقه شهری بر نتیجه رویکرد ترکیبی متمرکز است که بازنمایی انواع جرم را در بازنمایی مناطق شهری در قالب نقشههای موضوعی کیفی به دست آمده از طریق سفارشیسازی فضای برداری نوع جرم یا در قالب ترکیب میکند. بردارهای ترکیبی واقعی مناطق شهری که با میانگین گیری تعبیه انواع جرم منفرد به دست آمده است. بنابراین ما معنای شباهت مرتبط با جرم و جنایت در مناطق شهری و رابطه آن با نزدیکی جغرافیایی را بررسی می کنیم.
3.3.1. جاسازی های نوع جرم
خروجی CrimeVec با تولید بردارهای جاسازی شده از انواع جرم منفرد نشان داده می شود. مقایسه شباهتهای کسینوس بین آنها، شبکهای از روابط مکانی-زمانی را توصیف میکند، اطلاعاتی را در مورد هموقوعهای مکرر نوع جرم آشکار میکند و بنابراین، دیدگاه جدیدی را در تحلیل دستهبندیهای نوع جرم معرفی میکند. شباهت زیاد بین دو نوع جرم مختلف نشانه ارتباط مکانی-زمانی زیاد است، یعنی وقوع مکرر در یک منطقه در یک بازه زمانی یکسان. این امر منجر به گروه بندی انواع جرم به گونه ای می شود که فراتر از طبقه بندی اصلی است، معمولاً بر اساس شباهت ذاتی جرایم ارتکابی از منظر شیوه تخلف. همان دسته برتر لزوماً به معنای مشخصه مکانی-زمانی یکسان انواع فرعی نیست،
بر اساس معیارهای شباهت کسینوس بین بردارهای جاسازی، جدول 2 10 نوع مشابه اصلی از چهار نوع جرم مرجع را گزارش میکند که به عنوان مثال عمل میکنند: «برهم زدن آرامش»، «VAL-کارکرد خودروی ثبتنشده/بیمهشده»، «اسلحه-اسلحه گرم- حمل/تصرف» و «مواد مخدر-قاچاق طبقه B بالای 18 گرم». نتایج روابط معنایی جمعآوری شده را در بین انواع جرم برجسته میکند و در واقع ترکیبهای ارتباطی قابل قبول را آشکار میکند.
“برهم زدن آرامش” (معلق به رده برتر “رفتار نابهنجار” و نشان دهنده رفتاری است که حق صلح و آرامش مردم را به خطر می اندازد) شباهت زیادی با انواع جرایم مربوط به تخلف از مشروبات الکلی و نگهداری مواد مخدر دارد. علاوه بر این، نشان دهنده ارتباط با طیف گسترده ای از مقوله های مختلف، اعم از نقض گردآوری، آزار و اذیت، تا جنجال، که همه آنها ارتباط منطقی با اخلال در صلح به معنای کلی دارند.
از سوی دیگر، انواع جرایم که شباهتهای زیادی با «VAL—خودروی ثبتنشده/بیمهشده کار میکند» (متعلق به دسته برتر «تخلفات») عمدتاً مربوط به خودرو هستند، حتی اگر همیشه به یک طبقهبندی تعلق نداشته باشند. به عنوان مثال، “VAL – نقض قانون خودرو – سایر” و “VAL – عملکرد بدون مجوز” در گروه تخلفات قانون خودرو قرار دارند، در حالی که سایر موارد (مثلا آسیب رساندن به عابران پیاده، آسیب رساندن به اموال و غیره) به عنوان دسته بندی می شوند. “پاسخ به تصادف وسایل نقلیه موتوری”. تعداد کمی از انواع غیر مرتبط با خودرو نیز وجود دارد، یعنی تحت تأثیر الکل، نگهداری مواد مخدر و فراری از عدالت. حتی در این مورد، ارتباط معنایی تعبیههای جرم را میتوان با شهودی کلی از ارتباطات مکانی-زمانی قابل قبول توجیه کرد.
با توجه به «حمل/داشتن اسلحه – اسلحه گرم» (متعلق به دسته برتر «تخلفات سلاح گرم»)، جرایم مشابه آن شامل انواع قابل توجهی از دسته بندی ها می شود که شامل سایر تخلفات مرتبط با سلاح، اما همچنین نگهداری مواد مخدر، نقض قانون خودرو، و جرایم خشن مانند قتل و ضرب و جرح. این انواع از نظر معنایی مرتبط هستند و می توانند به راحتی بخشی از همان داستان متنی باشند (مثلاً دستگیر شدن در حال حمل اسلحه گرم وقتی که به دلیل تخلف خودرو متوقف می شود، یا در اختیار داشتن سلاح های بی اهمیت در هنگام حمله یا قتل).
در نهایت، «مواد مخدر-قاچاق کلاس B بالای 18 گرم» (متعلق به دسته برتر «نقض مواد مخدر»)، علاوه بر اینکه بسیار شبیه به برخی دیگر از تخلفات مواد مخدر است، به شدت به جرایم مرتبط با سلاح نیز مرتبط است، که نشان میدهد رابطه معنایی مکرر بین قاچاق مواد مخدر و نگهداری سلاح.
به طور کلی، نمونههای گزارششده به این نکته اشاره میکنند که انواع جرم متعلق به دستههای مختلف به هر حال ممکن است از منظر مکانی-زمانی به شدت مرتبط باشند و در نتیجه به عنوان بردارهای مشابه، واقع در همان ناحیه از فضای تعبیهشده نمایش داده شوند. فراتر از طبقهبندی اصلی بر اساس دیدگاه روش نقض، فضای برداری یک سیستم پیچیده از روابط بین مقولهای (مانند ارتباط قاچاق مواد مخدر و داشتن سلاح) و دیدگاههای مختلف موقعیتی جرم (مانند اختلال صلح به عنوان یک نتیجه نقض مشروب یا مواد مخدر یا در نتیجه شورش یا جنجال). بنابراین، با تجزیه و تحلیل معیارهای شباهت، میتوانیم الگوهای مکانی-زمانی پنهان را در قالب ارتباط جرم آشکار کنیم.
به منظور نمایش بصری یک نمای کلی از کل فضای تعبیه شده و روابط بین نهادهای آن، بردارهای نوع جرم را می توان از طریق t-SNE کاهش ابعاد داد و رسم کرد. شکل 4 کاهش دو بعدی فضای تعبیه را گزارش می کند. چند گروه از انواع جرایم همگن را می توان اشاره کرد (مثلاً انواع مربوط به نگهداری مواد مخدر، تصادفات وسایل نقلیه موتوری)، اما به طور کلی دسته بندی های جرم به طور گسترده ای با هم مخلوط شده اند. از آنجایی که نقشه ایستا امکان تجسم واضح همه نامهای جنایت را نمیدهد، استفاده از ابزار نقشهبرداری تعاملی (مثلاً https://projector.tensorflow.org )، قابل دسترسی در 23 فوریه 2021) برای بررسی بصری بهتر فضای معنایی نوع جرم از طریق جلوه های پویا مفید است. برای درک بهتر، سه بخش از فضای برداری در شکل گزارش شده بزرگ شده است، که ترکیبی از انواع جرم و جنایت با ماهیت متفاوت را نشان می دهد، که منعکس کننده فرض اصلی ما است. به طور خاص، انواع جرم که در پایین سمت چپ نشان داده شده است، عمدتاً شامل تصادفات وسایل نقلیه موتوری و تخلفات مربوط به سرقت خودرو است. انواع جرم در سمت چپ بالا عمدتاً شامل کلاهبرداری و سرقت می شود. انواع جرم در بالا سمت راست در عوض به طیف گسترده ای از دسته بندی ها از جمله نقض مواد مخدر و جرایم مربوط به سلاح اشاره دارد.
بنابراین، اتفاقات مکرر جنایی در فضا و زمان به تداعی معنایی و در نتیجه به شاخصی از ارتباط موقعیتی در یک زمینه بالقوه ادراک پلیس ترجمه می شود.
3.3.2. جاسازی های منطقه شهری مرتبط با جرم و جنایت
بازنمایی تعبیهشده انواع جرم امکان مقایسه مناطق شهری را از نظر روابط فعالیت جرم فراهم میکند، بنابراین نه صرفاً بر اساس شمارش جرم، بلکه با توجه به ارتباط جمعی جرایم. ما استراتژی مقایسه را به دنبال دو روش مختلف توسعه دادیم، یک رویکرد کیفی بصری و یک جهت کمی مبتنی بر برداری. مورد اول بر استفاده از فضای معنایی کاهش یافته از نوع جرم به عنوان طرح پایه برای تجسم نقشه های موضوعی مرتبط با جرم از هر منطقه شهری، نوعی اثر انگشت بصری برای مقایسه فوری شهودی، متکی است. مورد دوم، در عوض، بر تولید بازنماییهای برداری مؤثر از مناطق شهری تک تمرکز دارد، که امکان اندازهگیری شباهت کمی بین مناطق جغرافیایی مختلف را فراهم میکند.
توطئه های پیکربندی جنایت
با استفاده از فضای برداری کاهش یافته از نوع جرم به عنوان یک نقشه پایه، یک نمایش بصری از توزیع معنایی نوع جرم هر منطقه شهری تعریف شده است. این فرآیند شامل شمارش آماری وقوع جرم در انواع مختلف، و ارائه نقاط در فضای برداری بر اساس آن (مثلاً از طریق اندازهها و رنگهای متغیر) است. کل بازنمایی فضا بسته به میزان و نوع توزیع وقایع جنایی که در هر منطقه رخ داده است، منطقه به منطقه متفاوت است. علاوه بر این، از آنجایی که انواع جرایم مربوط به مکانی-زمانی در کنار یکدیگر در فضای برداری قرار دارند، اطلاعات اغلب در چنین فضایی خوشهبندی میشوند و الگوهای زیربنایی را برجسته میکنند و از آنجایی که نقشههای موضوعی بر روی همان نقشه پایه ساخته شدهاند، مقایسههای بصری را انجام میدهند. در سراسر مناطق بسیار راحت است.
شکل 5پیکربندی نوع جرم دو منطقه شهری را به عنوان مثال نشان می دهد، ماتاپان جنوبی و راکسبری پایین. آنچه در ابتدا ظاهر میشود سهولت در تشخیص الگوها، شناسایی سریع تفاوتها بین ویژگیهای جرم در مناطق منفرد، یک مزیت متمایز نسبت به جداول آماری ساده شمارش جرم است. در واقع، از آنجایی که روابط معنایی انواع جرم از هموقوعهای مکانی-زمانی آنها آموخته میشود، نقشههای موضوعی تمایل دارند مقادیر بالایی از شمارش جرم را در کنار یکدیگر گزارش کنند و به طور قابلتوجهی به آشکار کردن الگوها از طریق تجسم مناسب کمک میکنند. با مقایسه این دو منطقه، پیکربندیهای مختلفی را بین ماتاپان جنوبی و راکسبری پایین مشاهده میکنیم. برچسبهای طرح بلافاصله برخی از اطلاعات جنایی زیربنایی را نشان میدهند: ماتاپان جنوبی دارای دو دایره متداخل برجسته است که انواع جرم “شخص گمشده” و “مفقود شده-موقعیت” را شناسایی می کند و یک ویژگی جرم متمایز را در منطقه آشکار می کند. Lower Roxbury تعداد بیشتری از رخدادهای جنایی عجیب و غریب را شناسایی می کند، از جمله دو دایره متداخل که نشان دهنده انواع جرم “مشروبات الکلی-نوشیدن در ملاء عام” و “مواد مخدر-دارای کلاس B-کوکائین و غیره” هستند، و دو حلقه برجسته دیگر که جرم را گزارش می کنند. انواع «تجاوز به داخل کشور» و «دستور بازداشت»، شناسایی گرایش جرم متفاوت با ویژگیهای بیشتر از روند قبلی.
همچنین، میتوانیم روی یک بخش فضای برداری خاصی تمرکز کنیم، به عنوان مثال آنچه در سمت راست بالای شکل 4 گزارش شده است (عمدتاً تخلفات مواد مخدر و جرایم مربوط به سلاح را تعریف میکند)، و نقشه موضوعی مربوطه را برای هر یک از دو منطقه بسازیم. نتایج نشان داده شده در شکل 6 . به نظر می رسد که Roxbury پایین تمایل کلی به تعداد بیشتری از وقوع جرم در بخش معنایی انتخاب شده دارد. چنین طرح های بصری به طور قابل توجهی به درک سریع ویژگی های منطقه شهری مرتبط با جرم کمک می کند. استفاده از یک ابزار تعاملی کاوش نقشه های موضوعی را تسهیل می کند.
علاوه بر این، تجزیه و تحلیل اضافی می تواند فضای معنایی را به فضای جغرافیایی پیوند دهد تا اطلاعات جرم و جنایت در سطح شهر را به صورت فضایی تجزیه و تحلیل کند. به عنوان مثال، با انتخاب گروهی از انواع جرایم پیوسته در فضای برداری، میتوانیم تمام مناطق شهری را در فضای جغرافیایی، با توجه به تعداد کلی انواع انتخاب شده، تجسم کنیم. از آنجایی که انواع جرم همسایه در فضای معنایی به یکدیگر مرتبط هستند، انتخاب گروه یک بلوک معنایی حامل نوع خاصی از معنای جرم را شناسایی می کند که اطلاعات مکانی متناظر آن در مناطق شهری در سراسر شهر به تصویر کشیده می شود. مثال شکل 7 به انتخاب جرم در شکل 6 اشاره دارد، گزارش اطلاعات جغرافیایی متناظر در سراسر بوستون از نظر تعداد وقوع انواع جرم در بلوک معنایی. باز هم، ابزار بصری ارائه شده یک گزینه ارزشمند برای نمایش شهودی توزیع فضایی انواع جرم مرتبط با معنایی است که به راحتی تأثیر بلوکهای معنایی انتخاب شده را بر قلمرو شهری آشکار میکند.
تعبیه منطقه شهری
یک رویکرد مبتنی بر شباهت کمی در مناطق شهری مرتبط با جرم با ساختن جاسازیهای منطقه شهری به عنوان بردارهای ترکیبی تعبیههای نوع جرم مورد بررسی قرار میگیرد. بنابراین، روابط الگوی جرم در میان مناطق شهری ذاتاً به عنوان معیارهای تشابه بین بردارهای مناطق جغرافیایی نشان داده می شود که با میانگین گیری تعبیه های مربوط به وقوع جرم ثبت شده در داخل منطقه (یعنی میانگین وزنی انواع جرم) به دست می آید. به این ترتیب، ارتباط جرم بین مناطق در یک “فضای برداری شهری” مشترک رمزگذاری شد.
تعریف “مناطق شهری” می تواند به هر انتخابی از تقسیم قلمرو اشاره کند. این رویکرد را می توان برای هر تفکیک فضایی خودسرانه انتخاب شده اعمال کرد. برای ارائه یک درک کلی از نتایج و تسهیل در معرض قرار گرفتن آنها، ما اقدام به تقسیم قلمرو در سطح مناطق آماری همسایگی، برای مجموع 68 منطقه شهری کردیم (منطقه 69، متشکل از جزایر در بندر بوستون، حذف شد) . شکل 8سه مورد نمونه را نشان می دهد که پنج منطقه مشابه بالا و پایین یک منطقه مرجع انتخاب شده را گزارش می کند (توزیع شباهت کلی بین صفر و یک مقیاس بندی شده است)، همراه با موقعیت جغرافیایی آنها بر روی نقشه. در نگاه اول، به نظر می رسد ارتباط بین جرم و جنایت بین مناطق تا حدی تحت تأثیر فاصله جغرافیایی آنها باشد. به عنوان یک گرایش کلی، زمانی که مناطق همسایه دارای ویژگیهای اجتماعی-اقتصادی و/یا عملکردی مشابهی هستند، این امر به طور شهودی قابل توضیح است که ممکن است نوعی تأثیر را بر انواع جرایم ارتکابی تعیین کند. با این حال، پیوند بین ارتباط معنایی و فاصله جغرافیایی ساده نیست، نه از نظر فرض اینکه همه مناطق همسایه ویژگیهای یکسانی دارند. نه از نظر فرضی که آن ویژگی ها لزوماً بر جرم به همان طریق تأثیر می گذارد. در واقع، اگرچه یک روند در نمونه ها قابل مشاهده است، شباهت های بالا و پایین به طور مشخص از ویژگی های فاصله مکانی دقیق پیروی نمی کنند (به عنوان مثال، شباهت های بالای میدان فرانکلین در شمال فقط در ضلع شرقی و جنوبی آن ایجاد می شود). علاوه بر این، شایان ذکر است که چگونه توزیعهای شباهت متفاوت بر مناطق مختلف تأثیر میگذارد، بهویژه به مورد Prudential/St Botolph اشاره کرد که مقادیر تشابه بالا و پایین بسیار پایینتری را در مقایسه با دو مورد دیگر گزارش میکند، بنابراین، تمایل کلی ضعیفتر به اشتراکگذاری جرم را نشان میدهد. الگوها با سایر مناطق فرانکلین فیلد شمالی شباهت های بالایی فقط در ضلع شرقی و جنوبی آن ایجاد می شود). علاوه بر این، شایان ذکر است که چگونه توزیعهای شباهت متفاوت بر مناطق مختلف تأثیر میگذارد، بهویژه به مورد Prudential/St Botolph اشاره کرد که مقادیر تشابه بالا و پایین بسیار پایینتری را در مقایسه با دو مورد دیگر گزارش میکند، بنابراین، تمایل کلی ضعیفتر به اشتراکگذاری جرم را نشان میدهد. الگوها با سایر مناطق فرانکلین فیلد شمالی شباهت های بالایی فقط در ضلع شرقی و جنوبی آن ایجاد می شود). علاوه بر این، شایان ذکر است که چگونه توزیعهای شباهت متفاوت بر مناطق مختلف تأثیر میگذارد، بهویژه به مورد Prudential/St Botolph اشاره کرد که مقادیر تشابه بالا و پایین بسیار پایینتری را در مقایسه با دو مورد دیگر گزارش میکند، بنابراین، تمایل کلی ضعیفتر به اشتراکگذاری جرم را نشان میدهد. الگوها با سایر مناطق
هنگام تعریف مناطق شهری، حتی با تقسیم قلمرو به بخش هایی که مناطق بزرگتر را پوشش می دهند، می توان وضوح های مختلف فضایی را بررسی کرد. شکل 9 سه نمونه را در سطح 16 منطقه برنامه ریزی گزارش می کند (جزایر بندر دوباره حذف شدند). همانطور که قبلا ذکر شد، شباهت معنایی تأثیر فاصله مکانی را نشان می دهد، حتی اگر به طور دقیق نباشد (مثلاً مورد Fenway/Kenmore)، و توزیع متفاوت مقادیر شباهت بین مناطق هنوز قابل مشاهده است (به عنوان مثال، سومین منطقه شبیه به Back Bay/ بیکن هیل تقریباً همان امتیازی را دارد که کمترین منطقه مشابه Fenway/Kenmore را دارد.
علاوه بر تجزیه و تحلیل بین منطقه ای، مقایسه های درون منطقه ای نیز امکان پذیر است. وقایع جنایی را می توان در گروه های مختلف جمع آوری کرد که به نوبه خود می توان آنها را بین یکدیگر مقایسه کرد. یک گزینه ممکن است شامل مطالعه شباهت های جرم در ساعات مختلف روز باشد. جدول 3سه نمونه درون منطقه ای را در سطح یک دستگاه سرشماری نشان می دهد که مقایسه کسینوس بین صبح (6 صبح تا 12 بعد از ظهر)، بعد از ظهر (12 بعد از ظهر تا 6 بعد از ظهر)، عصر (6 بعد از ظهر تا 12 صبح) و شب را گزارش می کند. 12 صبح تا 6 صبح)، بیان یک ارتباط ذاتی قوی تر یا ضعیف تر با جرم در بخش های مختلف روز. این موارد خاص یک روند کلی را نشان می دهد که بیشترین شباهت بین بعد از ظهر و عصر را نشان می دهد در حالی که کمترین شباهت را بین صبح و شب ثبت می کند.
در نهایت، برای داشتن یک دید کلی از روابط جرم بین مناطق مختلف شهری، بردارها را می توان با استفاده از t-SNE کاهش ابعاد داد و رسم کرد. نتیجه در شکل 10 نشان داده شده است ، که جاسازی مناطق آماری محله را گزارش می دهد، که برچسب های آنها بر اساس مناطق برنامه ریزی که به آنها تعلق دارند رنگ های متفاوتی دارند. گرایش گروه بندی مناطق همسایه به وضوح قابل مشاهده است، اما تعدادی استثنا نیز وجود دارد.
4. بحث و نتیجه گیری
فعالیت جرم به شدت با ویژگی های مکانی و زمانی مشخص می شود که بررسی آنها در سیاست شهری و مدیریت شهری ضروری است. درک روابط زمانی- مکانی بین انواع جرم و مناطق شهری می تواند به بینش مفیدی در مورد الگوهای جرم و دیدگاه های عملی در مورد عملکرد و وضعیت توسعه مناطق شهر منجر شود. رویکرد سنتی آمارگیری نسبت به جرم بر روی انواع جداگانه حساب میشود، روابط معنایی ضمنی بین انواع مختلف را نادیده میگیرد و یک جنبه معنادار از پیکربندی جرم شهری را از دست میدهد. این مطالعه چارچوب جدیدی را برای کاوش روابط معنایی ضمنی انواع جرم و تأثیر آنها بر شخصیتپردازی مناطق شهری پیشنهاد میکند.
CrimeVec رویکردی برای ایجاد بردارهای متراکم از انواع جرم بر اساس توزیع مکانی-زمانی آنها است، که فراتر از طبقه بندی های اصلی جرم با تعریف یک بازنمایی تعبیه شده تنها با تکیه بر نحوه وقوع انواع جرم در مکان و زمان است.
این روش متشکل از سازماندهی رویدادهای جنایی مکانیابی شده با زمان در توالیهایی از انواع جرم است که متعاقباً به یک مدل Word2vec اقتباسشده با استفاده از یک پنجره زمینه وابسته به زمان تغذیه میشود. خروجی تعبیه انواع جرم را با یادگیری همزمانی مکرر آنها در مکان و زمان تعریف می کند. پس از آن، میتوان با سفارشیسازی فضای برداری کاهشیافته، طرحهای موضوعی کیفی مناطق تک شهری را ساخت و در نهایت با ترکیب بردارهای وقوع جرم در هر منطقه جغرافیایی، تعبیههای مؤثر مناطق شهری را ایجاد کرد.
به طور کلی، تعبیههای نوع جرم، سیستم پیچیدهای از روابط را آشکار میکنند که امکان اندازهگیری مستقیم ارتباط معنایی را فراهم میکند. حتی با وجود اینکه برخی از انواع جرایم که در یک دسته برتر قرار میگیرند، تمایل دارند در فضای برداری به یکدیگر نزدیک شوند (به عنوان مثال، جرایم مرتبط با مواد مخدر)، ما روابط بیشتری را نشان دادیم که در آن انواع جرم متعلق به دستههای برتر کاملاً متفاوت از نظر روش نقض، تعبیههای مشابه را به دلیل حضور مکرر آنها در همان مناطق در یک بازه زمانی مشخص تعیین میکند. این فرآیند مفهوم شباهت مکانی-زمانی را در یک نمایش ریاضی مجسم می کند. ایده کلی در واقع انتقال معیارهای شباهت بین تعداد زیادی از انواع مختلف جرم است، که به موجب آن انواع جنایات مرتبط در نهایت بازنمایی های برداری مشابهی را فرض می کنند.
علاوه بر این، ترکیبات نوع جرم امکان کاوش در فضای تعبیه شده در سطح مناطق شهری را فراهم می کند و به شناسایی مناطق جغرافیایی مرتبط با جرم در قلمرو کمک می کند. این را می توان ابتدا در قالب نقشه های موضوعی کیفی برای تجسم بصری و مقایسه راحت مناطق شهری انجام داد و الگوهای پیکربندی جرم را به راحتی قابل تشخیص می کند. در یک رویکرد کمیتر، ساختن جاسازیهای منطقه واقعی یک حالت مقایسه را تعریف میکند که شامل معنای ضمنی متفاوتی نسبت به شمارش ساده انواع جرم در داخل هر منطقه است، بنابراین طعمی از ارتباط جرم بین مناطق را به دست میآورد. در حالی که ما یک تمایل کلی برای مناطق همسایه به نمایش برداری مشابه مشاهده کردیم، چندین استثنا وجود دارد از جمله مناطقی با فواصل مکانی قابل مقایسه که شباهتهای کسینوس متفاوتی دارند که دلالت بر توصیف جرم متفاوت دارد. اندازههای مختلف مناطق شهری را میتوان خودسرانه کاوش کرد و مقایسههای درون منطقهای نیز امکانپذیر است (به عنوان مثال، ارتباط جرم در ساعات مختلف روز).
به طور خلاصه، سهم اصلی این مطالعه ارائه یک رویکرد موثر برای کاوش در ارتباط با نوع جرم و ویژگیهای جرم متمایز مناطق شهری، از طریق نمایشهای قابل خواندن ماشینی است که قادر به انتقال معیارهای مشابه هستند. مدل پیشنهادی با شناسایی این که کدام رویدادهای جرمی به طور ذاتی ویژگی وقوع در مناطق شهری مشخص محدود شده در بازه های زمانی مشابه را دارند، ارتباط مکانی-زمانی انواع جرم را آشکار می کند، و از فراپارامترهای تفکیک مکان-زمان قابل تنظیم برای درک جنبه های مکانی-زمانی پنهان شهر استفاده می کند. واقعیت ما روابط زیربنایی انواع جرم و جنایت را استخراج می کنیم و دیدگاه جدیدی از رویکرد به جرم شهری ارائه می دهیم. افشای بینش در رابطه معنایی جرم و ارائه اطلاعات موثر در زمینه توسعه شهری و سیاست های مرتبط با جرم. جاسازی ها در بازنمایی معنادار انواع جرم بر اساس رخدادهای مکانی-زمانی آن ها، استفاده از روشی که به راحتی در هر قلمرو وسیع خودسرانه و در حضور هر دسته بندی اولیه جرم قابل اعمال است، دارای مزایایی هستند. مقایسه انواع جرم از لحاظ معنایی مشابه را می توان به منظور شناسایی سریع ترین انواع مرتبط با یک نوع جرم خاص انجام داد و روابط زیربنایی الگوهای جرم را آشکار کرد. علاوه بر این، مقایسه مناطق شهری، چه به صورت بصری و چه در یک متریک مبتنی بر امتیاز، ارتباطات جالبی را در میان مناطق شهر آشکار میکند و ابزاری برای بررسی جایگزین فراهم میکند. جاسازی ها در بازنمایی معنادار انواع جرم بر اساس رخدادهای مکانی-زمانی آن ها، استفاده از روشی که به راحتی در هر قلمرو وسیع خودسرانه و در حضور هر دسته بندی اولیه جرم قابل اعمال است، دارای مزایایی هستند. مقایسه انواع جرم از لحاظ معنایی مشابه را می توان به منظور شناسایی سریع ترین انواع مرتبط با یک نوع جرم خاص انجام داد و روابط زیربنایی الگوهای جرم را آشکار کرد. علاوه بر این، مقایسه مناطق شهری، چه به صورت بصری و چه در یک متریک مبتنی بر امتیاز، ارتباطات جالبی را در میان مناطق شهر آشکار میکند و ابزاری برای بررسی جایگزین فراهم میکند. جاسازی ها در بازنمایی معنادار انواع جرم بر اساس رخدادهای مکانی-زمانی آن ها، استفاده از روشی که به راحتی در هر قلمرو وسیع خودسرانه و در حضور هر دسته بندی اولیه جرم قابل اعمال است، دارای مزایایی هستند. مقایسه انواع جرم از لحاظ معنایی مشابه را می توان به منظور شناسایی سریع ترین انواع مرتبط با یک نوع جرم خاص انجام داد و روابط زیربنایی الگوهای جرم را آشکار کرد. علاوه بر این، مقایسه مناطق شهری، چه به صورت بصری و چه در یک متریک مبتنی بر امتیاز، ارتباطات جالبی را در میان مناطق شهر آشکار میکند و ابزاری برای بررسی جایگزین فراهم میکند. استفاده از روش شناسی که به راحتی در هر قلمرو وسیع خودسرانه و در صورت وجود هر دسته بندی اولیه جرم قابل اعمال است. مقایسه انواع جرم از لحاظ معنایی مشابه را می توان به منظور شناسایی سریع ترین انواع مرتبط با یک نوع جرم خاص انجام داد و روابط زیربنایی الگوهای جرم را آشکار کرد. علاوه بر این، مقایسه مناطق شهری، چه به صورت بصری و چه در یک متریک مبتنی بر امتیاز، ارتباطات جالبی را در میان مناطق شهر آشکار میکند و ابزاری برای بررسی جایگزین فراهم میکند. استفاده از روش شناسی که به راحتی در هر قلمرو وسیع خودسرانه و در صورت وجود هر دسته بندی اولیه جرم قابل اعمال است. مقایسه انواع جرم از لحاظ معنایی مشابه را می توان به منظور شناسایی سریع ترین انواع مرتبط با یک نوع جرم خاص انجام داد و روابط زیربنایی الگوهای جرم را آشکار کرد. علاوه بر این، مقایسه مناطق شهری، چه به صورت بصری و چه در یک متریک مبتنی بر امتیاز، ارتباطات جالبی را در میان مناطق شهر آشکار میکند و ابزاری برای بررسی جایگزین فراهم میکند.
چندین پسوند بالقوه برای این مقاله وجود دارد. به طور خاص، نمایشهای تعبیهشده را میتوان در برنامههای مختلف آزمایش کرد، یا به مدلهای پیشبینی وارد شده یا بهعنوان مبنایی برای رویکردهای خوشهبندی و جستجوی شباهت مورد استفاده قرار گرفت. اینها شامل مقایسه و خوشهبندی انواع جرم و مناطق شهری مرتبط، پیش پردازش برای مدلهای یادگیری ماشینی، تجزیه و تحلیل توزیع مرتبط با جرم در قلمرو، و ارائه اطلاعات عمومی در مناطق شهر است که به طور بالقوه با منابع دادهای بیشتر در ترکیبهای پیچیدهتر ادغام شدهاند. نمایش های داده محور علاوه بر این، وضوحهای مختلف در زمان و مکان را میتوان کاوش کرد، حتی از مجموعه دادههایی که اندازههای مختلف قلمرو را پوشش میدهند (به عنوان مثال، در سطح یک ایالت یا کشور، یا در سطح یک بخش شهر یا یک محله). سرانجام،
برای نتیجه گیری، با تقلید از استفاده از جاسازی کلمات در NLP، که نشان دهنده یک عامل مرکزی در هر کار مرتبط با معنی است، جاسازی های جرم به عنوان بازنمایی های قابل توجهی معرفی می شوند که بر اساس توزیع های جرم مکانی-زمانی ساخته شده اند که می توانند به طور عملی در انواع جرایم استفاده شوند. مطالعات انجام شده و در طیف وسیعی از برنامه های کاربردی که با داده های فعالیت مجرمانه سروکار دارند گنجانده شده است.
بدون دیدگاه