چکیده

با توجه به حجم گسترده سنسورهای ردیابی موجود در سال‌های اخیر، جریان‌های با فرکانس بالا و حجم بالایی از داده‌ها هر روز تولید می‌شوند. حوزه دریایی تفاوتی ندارد زیرا همه شناورهای بزرگتر موظف به مجهز شدن به سیستم ردیابی شناور هستند که مکان آنها را به صورت دوره ای مخابره می کند. در نتیجه، روش‌های خودکاری که قادر به استخراج اطلاعات معنی‌دار از حجم زیاد و فرکانس بالا از داده‌های ردیابی کشتی هستند، نیاز به توسعه دارند. شناسایی خودکار الگوهای تحرک کشتی از چنین داده‌هایی در زمان واقعی بسیار مهم است زیرا می‌تواند فعالیت‌های غیرعادی یا غیرقانونی کشتی را در زمان مقرر آشکار کند. بنابراین، در این اثر، ما یک رویکرد جدید ارائه می‌دهیم که الگوهای مسیر حرکت کشتی‌های جریانی را به تصاویر تبدیل می‌کند و از الگوریتم‌های یادگیری عمیق برای طبقه‌بندی دقیق فعالیت‌های کشتی در زمان واقعی و مقابله با چالش‌های داده‌های بزرگ حجم و سرعت استفاده می‌کند. دو مجموعه داده دنیای واقعی جمع‌آوری‌شده از گیرنده‌های زمینی و ردیابی کشتی برای ارزیابی روش پیشنهادی از نظر طبقه‌بندی و عملکرد اجرای جریان استفاده شد. نتایج تجربی نشان داد که عملکرد طبقه‌بندی فعالیت کشتی می‌تواند به دقت بیش از حد برسد 96%ضمن دستیابی به تأخیرهای فرعی در عملکرد اجرای جریان.

کلید واژه ها:

طبقه بندی مسیر ; یادگیری عمیق ؛ شبکه های عصبی ؛ بینایی کامپیوتری ؛ پردازش توزیع شده پردازش جریانی ؛ نظارت بر کشتی در زمان واقعی ؛ فشرده سازی مسیر ; AIS

1. مقدمه

افزایش ناگهانی حجم و سرعت داده های تحرک توجه محققان را در روش های استخراج دانش مبتنی بر رویداد، توزیع شده و جریانی به خود جلب کرده است. شناسایی خودکار الگوها در داده های حجیم از اهمیت بالایی برخوردار است. در حال حاضر، کشتی‌های بیش از 300 تناژ ناخالص در سراسر جهان ملزم به حمل یک فرستنده سیستم شناسایی خودکار (AIS) در کشتی هستند، یک سیستم ردیابی شناور که به کشتی‌ها اجازه می‌دهد موقعیت خود را به صورت دوره‌ای گزارش کنند. اگرچه AIS در ابتدا برای اطمینان از ایمنی در دریا با کمک به کشتی‌ها در موقعیت‌های اجتناب از برخورد و کمک به افسران در کشتی توسعه داده شد، اما طولی نکشید که مقامات دریایی متوجه شدند که داده‌های تحرک کشتی‌ها می‌تواند اطلاعات مفیدی را ارائه دهد.
چندین مورد استفاده متمایز که نیاز به افزایش MSA را نشان می دهد شامل تشخیص رفتار غیرعادی کشتی به دلیل آسیب کشتی، عملیات جستجو و نجات (SAR) و تشخیص برخورد، و دزدی دریایی و فعالیت های ماهیگیری غیرقانونی است. در مورد دزدی دریایی، چندین حمله دزدی دریایی مسلحانه هر ساله اتفاق می افتد ( https://www.statista.com/topics/1290/pirate-attacks/ ، در تاریخ 7 آوریل 2021، https://www.bbc.com/news/business- قابل دسترسی است. 53426890 ، قابل دسترسی در 7 آوریل 2021، https://www.maritime-executive.com/piracy-news ، در تاریخ 7 آوریل 2021، که جان مسافران و اعضای خدمه را به طور یکسان به خطر می اندازد. به همین دلیل، چندین سرویس به گزارش فوری چنین رفتارهای غیرقانونی اختصاص داده شده است ( https://www.icc-ccs.org/، قابل دسترسی در 7 آوریل 2021، https://safety4sea.com/tag/piracy-attack/ ، مشاهده شده در 7 آوریل 2021). با توجه به فعالیت‌های ماهیگیری، شناسایی فوری فعالیت‌های ماهیگیری غیرقانونی، گزارش‌نشده و غیرقانونی (IUU) می‌تواند ابزاری برای نظارت دریایی امن‌تر برای مقامات فراهم کند. تخمین زده می‌شود که تقریباً 640000 تن ابزار ارواح در اقیانوس‌های جهان باقی می‌ماند که در نهایت منجر به گرفتار شدن و کشتن پرندگان و سایر حیوانات دریایی می‌شود ( https://www.worldanimalprotection.org/illegal-fishing-threatens-wildlife در 7 آوریل 2021). این منجر به ایجاد خدماتی مانند Global Fishing Watch ( https://globalfishingwatch.org/، قابل دسترسی در 7 آوریل 2021)، که پایداری و شفافیت اقیانوس را ترویج می کند. برای ترویج MSA، چندین تکنیک یادگیری تحت نظارت یا بدون نظارت توسعه داده شد که از ویژگی‌های سینماتیکی و مکانی-زمانی مسیر کشتی‌ها بهره می‌برد.
رویکردهایی که از چنین ویژگی هایی بهره می برند شامل خوشه بندی مسیر، طبقه بندی، تشخیص ناهنجاری و پیش بینی رویداد است. به طور خاص، طبقه‌بندی مسیر یک تکنیک پرکاربرد است که با آن مدل‌های عادی و رفتاری ایجاد می‌شوند که قادر به شناسایی الگوهای غیرعادی یا رویدادهای مورد علاقه هستند. از سوی دیگر، رویکردهای خوشه‌بندی مسیری اغلب برای تشکیل گروه‌هایی از موقعیت‌های AIS با رفتارهای مکانی-زمانی مشابه به کار می‌روند، و رفتارهایی را آشکار می‌کنند که پیش‌تعریف آن‌ها سخت‌تر است. اگرچه مطالعات فراوانی در ادبیات مربوط به طبقه بندی و خوشه بندی مسیر آفلاین وجود دارد [ 1 ، 2 ، 3 ، 4 ، 5[ 6 ، 7 ، 8 ، 9 ، 10 ] ، آثار کمتری بر پردازش بخار رویدادها در حوزه دریایی متمرکز شده است. روش‌های پردازش رویداد زمانی که روی داده‌های جریانی به کار می‌روند با چالش‌های قابل‌توجهی مواجه می‌شوند، جایی که الزامات چنین برنامه‌هایی نیازمند مصرف کم حافظه و کاهش تأخیر هستند.
در تمام آن مطالعات، زمینه تحلیل معمولاً جهان فیزیکی و جغرافیا است. طول و عرض جغرافیایی ویژگی های اساسی در یک فضای چند بعدی (سرعت، جهت و غیره) هستند. با این حال، متخصصان به شدت به تجسم مسیرها برای شناسایی دستی بخش هایی از مسیر که دارای اهمیت هستند، تکیه می کنند. این شهود را برای انتقال تجزیه و تحلیل به حوزه متفاوتی فراهم می کند و از تکنیک های بینایی کامپیوتری در طبقه بندی استفاده می کند. در بینایی کامپیوتری، متداول‌ترین تکنیک‌های مورد استفاده شامل شبکه‌های عصبی کانولوشنال (CNN) است [ 11 ، 12 ، 13]. هر لایه از یک CNN ویژگی متفاوتی از تصویر را مشخص می کند که شامل شکل و رنگ می شود اما محدود به آن نمی شود. به منظور افزایش عملکرد CNN، محققان از یادگیری عمیق [ 12 ، 13 ] استفاده کرده اند که پیچیدگی شبکه ها را از نظر تعداد لایه ها و گره های پنهان افزایش می دهد. یکی از رایج ترین اهداف چنین شبکه هایی طبقه بندی مجموعه ای از تصاویر به مجموعه ای از برچسب های از پیش تعریف شده است که مورد علاقه هستند.
به طور مشابه، مفهوم اصلی روش پیشنهادی ما طبقه‌بندی در زمان واقعی الگوهای تحرک کشتی‌ها به مجموعه‌ای از فعالیت‌های از پیش تعریف‌شده (احتمالاً غیرقانونی) برای اهداف ترویج MSA در دریا است. تازگی رویکرد ما در استفاده از تکنیک‌های بینایی کامپیوتری برای طبقه‌بندی مسیرها و تشخیص فعالیت‌ها در داده‌های تحرک نهفته است. به طور خاص، رویکرد پیشنهادی از تکنیک‌های طبقه‌بندی تصویر با نمایش بصری مسیرهای کشتی به عنوان تصاویر استفاده می‌کند. استفاده از طبقه بندی تصویر برای مسئله در دست و کمک های اصلی آن عبارتند از:
  • الگوهای تحرک در حوزه دریایی از نظر بصری متمایز هستند. این تمایز بصری اجازه می دهد تا عملکرد طبقه بندی مسیر را افزایش دهد.
  • طبقه‌بندی تصویر امکان طبقه‌بندی مسیر را فراهم می‌کند حتی زمانی که داده‌ها در فواصل ثابت (مثلاً ساعتی) مانند پروتکل AIS ( https://help.marinetraffic.com/hc/en-us/articles/217631867-How-often ) ارسال نمی‌شوند. -do-the-positions-of-the-vessels-get-updated-on-MarineTraffic- ، قابل دسترسی در 7 آوریل 2021). این برخلاف روش‌های سری زمانی [ 2 ] است که ذاتاً برای چنین وظایفی مناسب نیستند و به نقاط داده در نقاط زمانی ثابت نیاز دارند.
  • رویکردهای طبقه‌بندی مسیری که در ادبیات [ 4 ، 10 ، 14 ، 15 ] یافت می‌شوند، نیازمند یک مرحله پیش پردازش مانند درک و تجزیه و تحلیل داده‌ها و انتخاب ویژگی‌هایی هستند که فقط برای الگوهای تحرک طبقه‌بندی شوند. این بدان معنی است که ویژگی های انتخاب شده برای یک الگوی تحرک خاص را نمی توان برای الگوهای دیگر نیز اعمال کرد [ 14]. یک رویکرد طبقه بندی تصویر برای طبقه بندی مسیر به طور کامل از مرحله پیش پردازش فوق الذکر صرف نظر می کند. همین تکنیک برای طبقه‌بندی یک تصویر (مثلاً CNN) می‌تواند برای طبقه‌بندی همه الگوهای حرکتی استفاده شود، زیرا آنها به تصاویر تبدیل می‌شوند. بنابراین، یک رویکرد طبقه‌بندی تصویر برای طبقه‌بندی مسیر، یک رویکرد جهانی امیدوارکننده برای طبقه‌بندی الگوهای تحرک ایجاد می‌کند.
  • تقریباً 16000 پیام AIS در هر ثانیه از 200000 کشتی در سراسر جهان تولید می شود که در نتیجه 46 گیگابایت داده در روز تولید می شود. در حوزه دریایی، تنها در سال‌های اخیر محققان شروع به مقابله با مشکل پردازش جریان در زمان واقعی با استفاده از پیام‌های AIS کرده‌اند [ 6 ، 7 ، 8 ، 9 ، 10 ]. تا جایی که ما می دانیم، این اولین بار در ادبیات حوزه دریایی است که از تکنیک های بینایی کامپیوتری به صورت بلادرنگ برای طبقه بندی مسیرها استفاده می شود. الگوریتم های یادگیری عمیق مانند VGG16 [ 16 ]، InceptionV3 [ 17 ]، NASNetLarge [ 18 ] و DenseNet201 [ 19 ]] به صورت توزیع شده و جریانی استفاده می شوند که زمان پاسخگویی کم و تشخیص زودهنگام رویدادهای مشکوک در دریا را ممکن می سازد.
  • خوشه بندی مسیرها اغلب یک گام اولیه را در هنگام برخورد با طبقه بندی مسیر تشکیل می دهد. بسیاری از الگوریتم های خوشه بندی به خوبی تثبیت شده نیاز به پارامترهای ورودی دارند که تعیین آنها سخت است (Optics [ 20 ]، Traclus [ 21 ]، DBSCAN [ 22 ]) و در نهایت تأثیر قابل توجهی بر نتایج خوشه بندی دارند. همانطور که در بالا گفته شد، از آنجایی که روش ما به طور کامل از این مرحله عبور می کند، نیاز به پارامترهای دلخواه یا تجربی تعریف شده توسط کاربر را حذف کردیم و رویکرد خود را مقیاس پذیر و قوی ساختیم.
  • با توجه به این مقادیر بی‌نظیر داده‌های مسیر، که به نوبه خود می‌تواند رویکردهای تحلیل انسانی را تحت الشعاع قرار دهد، چندین تکنیک فشرده‌سازی به منظور به حداقل رساندن اندازه داده‌های مسیر و در عین حال به حداقل رساندن تأثیر بر روش‌های تحلیل مسیر اعمال شد. بنابراین، ما برخی از آزمایش‌های اولیه را به منظور نشان دادن اثر فشرده‌سازی مسیر بر دقت طبقه‌بندی الگوهای تحرک انجام دادیم.
بقیه مقاله به شرح زیر سازماندهی شده است. بخش 2 به عنوان بررسی ادبیات در زمینه های یادگیری عمیق، طبقه بندی تصویر، طبقه بندی مسیر و پردازش جریان عمل می کند. بخش 3 روش پیشنهادی پردازش جریان یادگیری عمیق الگوهای تحرک را به تفصیل شرح می دهد، در حالی که بخش 4 رویکرد پیشنهادی را از نظر طبقه بندی و عملکرد اجرا ارزیابی می کند. علاوه بر این، بخش 5 نتایج تجربی و مزایای رویکرد پیشنهادی برای مشکل مورد بحث را مورد بحث قرار می‌دهد. در نهایت، بخش 6 شایستگی های کار ما را خلاصه می کند و برخی از دیدگاه هایی را که نیاز به توجه بیشتری در آینده دارند برجسته می کند.

2. کارهای مرتبط

برای رسیدگی به مشکلات تشخیص ناهنجاری و طبقه بندی مسیر، چندین تکنیک داده کاوی در طول سال ها توسعه یافته است. این دو مشکل اغلب مشابه هستند زیرا هر دوی آنها معمولاً به یک مدل طبقه بندی از قبل آموزش دیده برای ارزیابی نمونه های جدید مسیرها نیاز دارند. مدل طبقه‌بندی بر روی مسیرهایی آموزش داده می‌شود که با نمونه‌هایی از رفتار عادی یا نمونه‌هایی با یک برچسب از پیش تعریف‌شده مطابقت دارند. رویکرد پیشنهادی روشی را ارائه می‌کند که می‌تواند با استفاده از رویکرد بینایی کامپیوتری، طبقه‌بندی مسیر را در زمان واقعی انجام دهد. بنابراین، روش ما قابل مقایسه با سایر مطالعاتی است که طبقه‌بندی مسیر یا طبقه‌بندی تصویر را به صورت جداگانه انجام می‌دهند، زیرا این اولین بار است که در ادبیات، مسیرها به عنوان مجموعه‌ای از تصاویر در نظر گرفته می‌شوند.

2.1. طبقه بندی مسیر

طبقه‌بندی مسیر یک زمینه تحقیقاتی است که در آن تجزیه و تحلیل بر روی رفتار اجسام متحرک به منظور ایجاد یک طبقه‌بندی کننده قادر به تشخیص الگوهای حرکتی مختلف انجام می‌شود. در ادبیات، تنها در سال های اخیر، محققان تمرکز خود را به سمت حوزه دریایی تغییر دادند. بنابراین، چالش‌های پژوهشی جدیدی پدیدار شده‌اند [ 23 ]، و اکنون محققان بیشتری در تلاش برای رسیدگی به این چالش‌ها هستند. سوزا و همکاران [ 14 ] از سه طبقه‌بندی‌کننده مختلف برای شناسایی سه فعالیت کشتی‌های ماهیگیری مختلف بر روی داده‌های AIS، یعنی تراول‌ها، لانگ لاینرها و کشتی‌های دریایی کیف پول استفاده کرد و به دقتی دست یافت. 83%، 84%، و 97%به ترتیب برای هر فعالیت جیانگ و همکاران [ 15 ] از رمزگذارهای خودکار برای شناسایی فعالیت های ماهیگیری بر اساس پیام های ارسال شده AIS استفاده کرد. رویکرد پیشنهادی مسیرهای کشتی را به دنباله ای از بخش های پنجره مجزا تقسیم می کند. متعاقباً، یک طبقه‌بندی‌کننده نظارت‌شده می‌تواند پیش‌بینی کند که آیا پنجره‌ای از داده‌های AIS ماهیگیری می‌کند یا از طبقه‌بندی باینری استفاده نمی‌کند. عملکرد رمزگذارهای خودکار با SVM و جنگل های تصادفی مقایسه شد که منجر به دقت 85٪ شد. نویسندگان در [ 24 ] از الگوریتم DBSCAN برای استخراج نقاط مورد علاقه (POI) در مسیر حرکت کشتی های ماهیگیری به منظور ایجاد ویژگی هایی استفاده کردند که برای آموزش یک مدل طبقه بندی استفاده می شد. نویسندگان در [ 25]، ترکیبی از مدل‌های مارکوف پنهان عمومی (GHMM) و مدل‌های مارکوف پنهان ساختاری (SHMM) با الگوریتم ژنتیک (GA) برای طبقه‌بندی مسیر. آنها رویکرد خود را بر روی دو مجموعه داده نظارتی، ماشین MIT [ 26 ] و T15 [ 27 ] آزمایش کردند که نتایج امیدوارکننده ای را به دست آوردند. کاپادایس و همکاران [ 2] مشکل طبقه‌بندی مسیر را به عنوان یک وظیفه طبقه‌بندی سری زمانی یا شکل‌بندی در نظر گرفت. مشکل اصلی طبقه‌بندی سری‌های زمانی این است که مقادیر یا ویژگی‌هایی مانند سرعت کشتی باید در فواصل زمانی ثابت گزارش شوند، که در مورد پروتکل AIS صدق نمی‌کند – کشتی‌هایی که با سرعت‌های بالاتر حرکت می‌کنند موقعیت خود را بیشتر گزارش می‌کنند. (همین اتفاق زمانی می افتد که تغییر نرخ یک چرخش نیز بیشتر باشد). بنابراین، مقادیر گمشده باید محاسبه شوند یا مقادیر موجود حذف شوند، که منجر به تحریف بالقوه داده‌های اولیه می‌شود و نتایج طبقه‌بندی اشتباهی را به همراه دارد.
روش دیگر برای طبقه‌بندی مسیر، استفاده از شبکه‌های عصبی است. جیانگ و همکاران [ 28 ] از شبکه‌های عصبی بازگشتی (RNN) برای طبقه‌بندی مسیر مبتنی بر نقطه به چهار حالت مختلف حمل‌ونقل استفاده کرد. روش پیشنهادی از جاسازی داده‌های GPS برای ترسیم فضای ویژگی کم‌بعدی و ناهمگن اصلی در نمایش‌های برداری توزیع شده استفاده می‌کند. فضای ویژگی با اطلاعات مبتنی بر بخش غنی شد و فعال‌سازی‌های حداکثر توسط RNNها برای افزایش عملکرد به کار گرفته شد. روش پیشنهادی به دقت 98 درصد دست یافت و از چندین طبقه‌بندی‌کننده معروف مانند درخت‌های تصمیم، ماشین‌های بردار پشتیبان، بیز ساده و میدان تصادفی شرطی بهتر عمل کرد. در [ 29]، یک مدل یادگیری چند مقیاسی عمیق برای مدل‌سازی داده‌های شبکه تحت دانه‌بندی‌های مکانی و زمانی مختلف استفاده شد، بنابراین تأثیر فضا و زمان بر نتایج طبقه‌بندی را به تصویر کشید. علاوه بر این، یک ماژول متراکم توجه با ترکیب مکانیزم توجه، که قادر به انتخاب ویژگی‌های اصلی بود، و DenseNet، که قادر به افزایش انتشار ویژگی‌های محلی و فضایی در سراسر شبکه بود، طراحی شد. نمایش ویژگی های حاصل به عنوان نتایج طبقه بندی نهایی به کار گرفته شد. فضای ویژگی‌های کم‌بعد و ترکیب‌های ویژگی محدود معرفی‌شده توسط داده‌های AIS ناهمگن، چالش‌هایی را در رابطه با توسعه مدل‌های یادگیری عمیق ایجاد می‌کنند. نویسندگان در [ 30] از شبکه‌های عصبی بازگشتی عمیق و به‌ویژه یک معماری جدید واحد بازگشتی دروازه‌ای (pGRU) مبتنی بر پارتیشن برای طبقه‌بندی مسیر مبتنی بر نقطه در شناسایی فعالیت‌های ماهیگیری ترال استفاده کرد. روش پیشنهادی با استفاده از یک تابع فعال‌سازی پارتیشن که قبل از تبدیل خطی اعمال می‌شود، ویژگی‌های کم‌بعد را در فضای دیگری نگاشت می‌کند و پارامترهای مختلف را برای پارتیشن‌های مجزا دریافت می‌کند تا آنها را به طور مشترک در یک ساختار عمیق سلسله مراتبی غیرخطی مدل‌سازی کند. بنابراین، روش پیشنهادی حساسیت کمتری به کیفیت پارتیشن‌ها دارد و نتایج پیش‌بینی بهتری به دست می‌آورد.
اگرچه روش‌شناسی‌های زیادی برای طبقه‌بندی مسیر توسعه داده شده‌اند، اما مطالعات کمتری بر پردازش جریانی بلادرنگ رویدادها در حوزه دریایی متمرکز شده‌اند [ 10 ، 31 ، 32 ]. لین و همکاران [ 31 ] ویژگی‌هایی را از پیام‌های AIS استخراج کرد، که سپس به یک شبکه عصبی عمیق برای پیش‌بینی زمان تخمینی رسیدن (ETA) کشتی‌ها داده شد. Chatzikokolakis و همکاران. [ 32 ] یک سرویس تشخیص ناهنجاری در زمان واقعی را توسعه داد که بر شناسایی طیف گسترده ای از رویدادهای مورد علاقه در حوزه دریایی یا از طریق استفاده از تکنیک های یادگیری ماشین یا با رویکردهای مبتنی بر قانون متمرکز بود. نویسندگان در [ 10] یک فرآیند استخراج ویژگی آنلاین برای طبقه‌بندی مسیرهای ماهیگیری در زمان واقعی با استفاده از جنگل‌های تصادفی ارائه کرد.
در مقایسه با روش‌های پیشرفته فوق‌الذکر، رویکرد ما نه تنها می‌تواند به عملکرد طبقه‌بندی بهتری در شناسایی الگوهای تحرک دست یابد، بلکه می‌تواند به عنوان یک طبقه‌بندی چند طبقه جهانی و روش‌شناسی جریان برای طبقه‌بندی مسیر عمل کند.

2.2. طبقه بندی تصویر

متداول ترین تکنیک مورد استفاده در مورد بینایی رایانه شامل شبکه های عصبی کانولوشنال [ 11 ] است که در آن هر لایه از شبکه جنبه متفاوتی از تصویر را شناسایی می کند. در تلاش برای بهبود عملکرد شبکه های عصبی، یادگیری عمیق [ 12 ، 13 ، 33 ] اتخاذ شده است که با افزودن لایه ها و گره های پنهان بیشتر، پیچیدگی شبکه های عصبی را افزایش می دهد. یادگیری عمیق را می توان هم برای طبقه بندی و هم برای یادگیری ویژگی در زمینه های مختلف استفاده کرد و به سرعت در حال تبدیل شدن به تکنیک پیشرفته است که منجر به افزایش عملکرد می شود [ 34 ]]. شبکه عصبی کانولوشنال (CNN) نوعی تکنیک یادگیری عمیق است که عملکرد قابل توجهی در زمینه بینایی کامپیوتر [ 35 ] و همچنین در کاربردهای مختلف پزشکی [ 36 ، 37 ، 38 ] به دست آورده است. طبق [ 39 ]، CNN ها می توانند چهار جنبه مختلف را مدیریت کنند: آموزش وزنه ها از ابتدا، تنظیم دقیق، استخراج ویژگی ها، و پیش آموزش بدون نظارت. شبکه‌های عصبی کانولوشنال عمیق از جمله معماری‌های قدرتمند یادگیری عمیق هستند و به طور گسترده در طیف گسترده‌ای از وظایف یادگیری ماشین استفاده شده‌اند. اولین CNN که یک “الگوی معماری” استاندارد ایجاد کرد LeNet-5 [ 40 ] بود] که از دو لایه کانولوشن و سه لایه کاملا متصل استفاده می کند. از آن زمان، همین ایده با افزودن کانولوشن‌ها و لایه‌های ادغام بیشتر در معماری‌های بیشتری اعمال شده است که با یک یا چند لایه کاملاً متصل مانند AlexNet [ 41 ] و VGG-16 [ 16 ] خاتمه می‌یابد. AlexNet اولین معماری CNN بود که واحدهای خطی اصلاح شده (ReLUs) را به عنوان یک تابع فعال سازی پیاده سازی کرد [ 42 ]. از سوی دیگر، VGG-16 از 13 لایه کانولوشن و سه لایه کاملاً متصل استفاده کرد که ReLUs را از AlexNet به عنوان یک تابع فعال نگه داشت. در سال‌های بعد، معماری‌ها با معرفی چندین تکنیک در داخل لایه‌های شبکه عمیق‌تر و پیچیده‌تر شدند. Inception-v1 [ 43] از 22 لایه و رویکرد “شبکه در داخل شبکه” با استفاده از ماژول های “Inception” استفاده می کند. ایده پشت این رویکرد توسط Arora و همکاران ایجاد شد. [ 44 ]، که معماری را پیشنهاد کرد که آمار همبستگی آخرین لایه را تجزیه و تحلیل می‌کند و آنها را در گروه‌هایی از واحدهای با همبستگی بالا دسته‌بندی می‌کند. این ماژول‌های Inception از برج‌های کانولوشن موازی با فیلترهای مختلف استفاده می‌کنند که هر فیلتر ویژگی‌های متفاوتی را جذب می‌کند و سپس این ویژگی‌ها را با هم خوشه‌بندی می‌کند. Inception-v3 [ 17 ] و Inception-v4 [ 45 ]، که جانشینان شبکه Inception اولیه را تشکیل می دهند، ماژول های Inception بیشتری اضافه کردند و تغییراتی را برای بهبود سرعت آموزش انجام دادند. در [ 45]، ماژول های Inception به بلوک های Inception باقی مانده تبدیل شدند و معماری عمیق تری به نام Inception-ResNet-v2 معرفی کردند. ResNet-50 [ 46 ] همراه با Inception-v3 اولین شبکه هایی بودند که از نرمال سازی دسته ای استفاده کردند و علاوه بر این شامل دو معماری حتی عمیق تر، ResNet101 و ResNet152 به ترتیب با 101 و 152 لایه بودند. Xception [ 47 ] ماژول های Inception را با پیچش های قابل جداسازی عمیق جایگزین کرد. این بدان معنی است که آن را اجرا کرده است 1×1پیچیدگی در هر کانال و سپس انجام یک 3×3پیچیدگی در هر خروجی در DenseNet [ 19 ]، هر لایه به عنوان ورودی نقشه های ویژگی تمام لایه های قبلی را به دست می آورد. بنابراین، هر لایه یک “دانش جمعی” از تمام لایه های قبلی دریافت می کند. در نهایت، NASNet [ 18 ] شامل دو معماری NASNetMobile و NASNetLarge است که در اندازه ورودی تصاویر آموزشی متفاوت هستند. اجزای اصلی NASNet دو نوع سلول کانولوشن هستند: سلول‌های معمولی که نقشه ویژگی با همان ابعاد را برمی‌گردانند و سلول‌های کاهشی که نقشه ویژگی را برمی‌گردانند که در آن ارتفاع و عرض با ضریب دو کاهش می‌یابد.
مطالعه اخیر چن و همکاران. [ 48] با هدف طبقه بندی حالت حمل و نقل سفرهای کشتی از داده های خط سیر خام. روش پیشنهادی شناسایی و کشف حالت‌های تحرک را با استفاده از خوشه‌بندی نقطه مبدا و مقصد، به منظور کشف الگوهای مسیر از داده‌های مسیر تاریخی، ادغام می‌کند. مسیرهای AIS به ساختار مسیری مبتنی بر تحرک تبدیل می شوند که شبیه یک تصویر با وضوح پایین است. جعبه مرزی کل مسیر کشتی به شبکه ای تبدیل می شود که حاوی چندین پیکسل است. اگر مسیر کشتی در داخل یک پیکسل قرار گیرد، پیکسل با استفاده از طیفی از رنگ‌های خاکستری رنگ می‌شود که هر رنگ مقدار سرعت متفاوتی را نشان می‌دهد. علاوه بر این، برای طبقه‌بندی حالت‌های تحرک، یک مدل CNN با بهره‌گیری از داده‌های مسیر تاریخی برچسب‌گذاری شده استفاده می‌شود که منجر به حداکثر امتیاز F1 84.7٪ می‌شود.49 ]. مسیرهای خام AIS به تصاویر مسیری تبدیل شدند که شامل سه الگوی حرکت کشتی مختلف، ایستا، کروز و مانور بود. سپس از روش یادگیری نظارت شده برای آموزش CNN استفاده شد و نتایج دقت حدود 75 درصد را نشان داد. در نهایت، ساختار مشابهی نیز در [ 50 ] برای طبقه‌بندی حالت حمل و نقل غیرنظامیان (مانند پیاده‌روی، دوچرخه، اتوبوس، تاکسی) مورد استفاده قرار گرفت و به حداکثر دقت دست یافت. 83.2%. این رویکردها رفتار مسیر را به طور کامل نشان نمی دهند، زیرا فضای نظارت به سلول های بزرگ تقسیم می شود، به ویژه در مواردی که اجسام متحرک حرکات ریز انجام می دهند که در نهایت یک الگوی حرکتی متفاوت را تشکیل می دهند. تفاوت اصلی رویکرد ما و تازگی آن در این واقعیت نهفته است که تصاویر با وضوح بالا را می توان با ترسیم موقعیت های مسیر، ثبت هر جنبه ای از رفتار مسیر در طول یک الگوی تحرک ایجاد کرد، که سپس می تواند توسط هر طبقه بندی کننده تصویر استفاده شود.

3. روش شناسی

در این بخش، رویکرد پیشنهادی خود را برای طبقه‌بندی فعالیت‌های کشتی در زمان واقعی ارائه می‌کنیم. به طور خاص، ما ابتدا در بخش 3.1 الگوهای تحرک یا فعالیت‌های کشتی را که برای ارزیابی تجربی استفاده شده‌اند نشان می‌دهیم. علیرغم این واقعیت که چهار الگوی تحرک برای اهداف نمایشی مورد استفاده قرار گرفت، رویکرد ما را می‌توان برای استفاده از الگوهای بیشتر و طبقه‌بندی کلاس‌های بیشتری مانند دزدی دریایی در صورت ارائه حقیقت پایه، گسترش داد. سپس، در بخش 3.2 ، تبدیل مسیرها یا الگوهای تحرک به تصاویر ارائه شده است، در حالی که در بخش 3.3، نحوه استفاده از این تصاویر برای طبقه بندی آنها از طریق تکنیک های یادگیری عمیق به تفصیل توضیح داده شده است. علاوه بر این، طبقه بندی تصاویر در زمان واقعی در بخش 3.4 ارائه شده است . در نهایت، در بخش 3.5 ، چندین الگوریتم فشرده سازی مسیر ارائه شده است که به عنوان وسیله ای برای کاهش اندازه داده های AIS عمل می کند و در عین حال حداقل تأثیر را بر دقت طبقه بندی دارد.

3.1. الگوهای دریایی

در این مطالعه تحقیقاتی، پنج الگوی مختلف حرکت کشتی مورد مطالعه قرار گرفت:
لنگر انداختن: لنگر انداختن یک عملیات حیاتی است، زیرا با جلوگیری از دور شدن از موقعیت مورد نظر، کلید جلوگیری از حوادث مربوط به آسیب/از دست دادن کشتی یا سایر شناورهای مجاور است. همانطور که در [ 51 ] ذکر شد، لنگر انداختن می تواند با بارگیری/تخلیه محموله، نگهداری، انتظار برای اسکله و سوخت گیری مرتبط باشد. هنگام لنگر انداختن، عواملی مانند شرایط دریا و باد (جهت و قدرت)، جریان های دریایی، مناطق ممنوعه، خطوط لوله زیر آب، آب های کم عمق و سایر کشتی ها در منطقه مجاور باید در نظر گرفته شوند. در طول این نوع فعالیت، شناورها در ساحل در یک منطقه لنگرگاه لنگر انداخته می شوند. کشتی تمایل به حرکت در اطراف لنگر دارد و الگوهای دایره ای یا نیمه دایره ای را در جهت های مختلف تشکیل می دهد، همانطور که در شکل 1 نشان داده شده است.a که در آن لنگر تقریباً در وسط دایره قرار دارد. حرکت دایره ای کشتی در اطراف لنگر می تواند ناشی از اثرات باد، جزر و مد یا جریان های دریا باشد و در نتیجه سرعت روی زمین بسته به نوع کشتی به حدود 0.5-3.0 گره به حداقل می رسد.
Moored: در طول این نوع فعالیت، شناورها در داخل یک بندر لنگر انداخته می شوند. پهلوگیری می تواند مربوط به بندکشی، اتصال، بستن یا هر سازه دائمی باشد که کشتی ممکن است به آن ایمن شود مانند اسکله ها، اسکله ها، اسکله ها، اسکله ها، شناورهای لنگر، و شناورهای پهلوگیری. حرکت کشتی در مقایسه با کشتی لنگردار محدودتر است زیرا کشتی نه تنها توسط لنگر، بلکه توسط شناورهای پهلوگیری نیز محدود می شود. همانطور که در شکل 1 ب نشان داده شده است، موقعیت کشتی به صورت پراکنده و “نزدیک” به پهلوگیری به نظر می رسد. حرکت جزئی ناشی از تاثیر باد و جریان دریا بوده و در نتیجه سرعت روی زمین از ۱ یا ۲ گره بیشتر نمی‌شود.
در حال انجام: در طول این نوع فعالیت، یک کشتی از نقطه عزیمت به نقطه مقصد در حال حرکت است. یک کشتی زمانی در حال حرکت در نظر گرفته می شود که به گل نشسته، لنگر انداخته یا به سرعت به اسکله، ساحل یا هر شی ثابت دیگری نرفته باشد. یک کشتی در حال حرکت لزوما توسط ابزار یا وسیله ای رانده یا هل داده نمی شود، اما ممکن است به دلیل باد یا جریان دریا در جریان باشد [ 52 ، 53 ]. شکل 1 ج مسیر یک کشتی در حال حرکت را نشان می دهد. الگوهای حرکتی یک کشتی در حال حرکت معمولاً خطوط مستقیم، منحنی یا زیگزاگ را تشکیل می‌دهند که زمانی رخ می‌دهد که کشتی از جزایر در وسط دریا اجتناب کند.
صید ترال: انواع مختلفی از فعالیت های ماهیگیری مانند صید ترال و لانگ لاین وجود دارد. کشتی های ترال معمولاً سرعت خود را تقریباً ثابت نگه می دارند 2.5گره ها به منظور تثبیت تور ماهیگیری که توسط قایق کشیده می شود. علاوه بر این، کشتی‌های ترال در یک خط مستقیم حرکت نمی‌کنند، اما معمولاً مسیر خود را در اطراف منطقه ماهیگیری مورد نظر تغییر می‌دهند ( شکل 1 د). فعالیت ماهیگیری می تواند از چند ساعت تا چند روز ادامه داشته باشد.
لنگلینینگ: از طرف دیگر، کشتی هایی که به فعالیت لانگلین مشغول هستند، خطوط ماهیگیری را با قلاب های طعمه دار وصل می کنند. هنگام تنظیم خطوط، کشتی ها با سرعت بخار خود حرکت می کنند و سرعت ثابتی را حفظ می کنند. وقتی همه خطوط تنظیم می شوند، آنها در آب رها می شوند و رگ ها به آرامی با آنها حرکت می کنند. در حین رانش، سرعت کشتی می تواند تقریباً باشد 2.5گره های ناشی از باد یا جریان آب. در نهایت، فعالیت لانگ لاین دارای مدت زمان مشابه فعالیت ترال است و می تواند چندین روز طول بکشد. اگرچه این دو فعالیت ماهیگیری دارای شباهت هایی مانند چرخش های مکرر و سرعت های مشابه هستند، الگوی تحرک آنها می تواند از نظر بصری متفاوت باشد ( شکل 1 e). می توان مشاهده کرد که خطوط فرعی خط مستقیم طولانی تشکیل می شود که مربوط به بخشی از مسیر است که در طی آن کشتی های لانگ لاین خطوط را با قلاب طعمه دار تنظیم می کنند.

3.2. بازنمایی تصویر

این بخش رویکرد نمایش تصویر مسیرها را توضیح می دهد. این مسیرها الگوهای حرکتی هستند که نشان دهنده فعالیت کشتی است که در بخش فرعی قبلی تعریف شده است. به منظور تجسم و طبقه‌بندی مؤثر الگوهای حرکتی کشتی‌ها، دو ویژگی کلیدی که الگوهای مسیر را در حوزه دریایی مشخص می‌کنند، به دست می‌آیند: (1) شکل مسیر، که نشان‌دهنده نحوه حرکت کشتی در فضا با در نظر گرفتن است. نرخ تغییر مسیر روی زمین (COG) یا سمت، و (ii) سرعت، که نشان می دهد کشتی با چه سرعتی در فضا حرکت می کند.

3.2.1. شکل مسیر

مسیرهای فعالیت کشتی یکسان الگوهای مشابهی را تشکیل می دهند. با این حال، از آنجایی که مسافتی که هر کشتی در فضا طی می کند متفاوت است (به عنوان مثال، یک کشتی ماهیگیری در اقیانوس اطلس مسافت بیشتری را در مقایسه با یک کشتی ماهیگیری در دریای ایرلند طی می کند)، جعبه مرزی یا منطقه نظارتی که کشتی در آن حرکت می کند باید عادی شود. بنابراین، برای ثبت و قرار دادن شکل مسیر به طور موثر در داخل یک جعبه مرزی نرمال شده، ابتدا باید فاصله کل هر دو محور x و y که کشتی در آن حرکت می کند، تعریف شود. به همین دلیل، ما فاصله افقی کل ( x— معادله ( 1 )) و فاصله عمودی کل ( y— معادله ( 2 ) را محاسبه کردیم.)) کشتی به ترتیب بر اساس حداقل و حداکثر طول و عرض جغرافیایی حرکت می کند. کل فاصله افقی به صورت زیر تعریف می شود:

دمنستیآnجهایکس=لongمنتیتودهمترآایکس-لongمنتیتودهمترمنn

به طور مشابه، کل مسافت عمودی که کشتی طی کرده است به صورت زیر تعریف می شود:

دمنستیآnجهy=لآتیمنتیتودهمترآایکس-لآتیمنتیتودهمترمنn

سپس مسافتی را که هر موقعیت AIS m طی کرده است از حداقل طول و عرض جغرافیایی به ترتیب از معادلات ( 3 ) و ( 4 ) به صورت زیر محاسبه می شود:

دمنستیآnجه(مترایکس)=لongمنتیتودهمتر-لongمنتیتودهمترمنn

و:

دمنستیآnجه(مترy)=لآتیمنتیتودهمتر-لآتیمنتیتودهمترمنn

از معادلات ( 1 )–( 4 )، می‌توانیم درصد کل مسافتی را که هر موقعیت AIS m تا کنون طی کرده است، از حداقل مختصات در هر دو محور x و y محاسبه کنیم :

norمترآلمنzهد(مترایکس)=دمنستیآnجه(مترایکس)÷دمنستیآnجهایکس

و:

norمترآلمنzهد(مترy)=دمنستیآnجه(مترy)÷دمنستیآnجهy

با توجه به اندازه تصویر از پیش تعریف شده ن×ن، موقعیت دقیق m در داخل یک تصویر را می توان به صورت زیر محاسبه کرد:

پمنایکسهلایکس=norمترآلمنzهد(مترایکس)×ن

و:

پمنایکسهلy=norمترآلمنzهد(مترy)×ن
بنابراین، هر موقعیت AIS در داخل یک جعبه مرزی نرمال شده یا یک فضای نظارتی با اندازه قرار می گیرد ن×ن، که در اصل یک نمایش تصویری است. شکل 2 نمونه ای از عادی سازی فضای نظارتی را نشان می دهد ن=10. هر دایره سبز مربوط به موقعیت AIS است که در آن طول و عرض جغرافیایی مربوطه با فلش های آبی نشان داده می شود. مجموع فاصله افقی است فاصلهایکس=28.75-2.875=25.875، در حالی که کل فاصله عمودی است فاصلهy=92.5-9.25=83.25. بر اساس معادلات ( 3 ) و ( 4 ) دمنستیآnجه(مترایکس)پیام AIS بالا سمت راست برابر است با 20.125، و دمنستیآnجه(مترy)برابر 0 است. با توجه به معادلات ( 5 ) و ( 6 )، norمترآلمنzهد(مترایکس)برابر است با 0.7، و norمترآلمنzهد(مترy)برابر 0 است. ضرب هر مقدار نرمال شده در ن=10منجر می شود به پمنایکسهلایکس=7و پمنایکسهلy=0. به منظور تناسب موقعیت‌های AIS مرزی در فضای نظارت نرمال‌شده، مقادیر پیکسل‌های کوچک‌تر از N به 1 و مقادیر پیکسل‌های بزرگ‌تر از N به N تبدیل می‌شوند . پمنایکسهلyبه 1 تبدیل می شود و موقعیت پیکسل نهایی در داخل 10×10تصویر است ایکس=7و y=1همانطور که در شکل 2 نشان داده شده است.
در نهایت، یک خط مستقیم بین هر زمان متوالی پمنایکسهل(پمنایکسهلایکس،پمنایکسهلy)یا موقعیت AIS m با استفاده از الگوریتم خط برزنهام [ 54 ] ترسیم می شود تا الگوی ایجاد شده توسط هر مسیر متمایزتر شود. الگوریتم خط برزنهام یک الگوریتم رسم خط است که نقاطی را ایجاد می کند که تقریب نزدیکی به یک خط مستقیم بین دو نقطه از یک شطرنجی N- بعدی تشکیل می دهند.
3.2.2. سرعت
محدوده سرعت در مورد رایج ترین انواع کشتی مانند مسافری، باری یا ماهیگیری بین 0 تا 22 گره متفاوت است. آر=[0،22]. به منظور نشان دادن مقادیر سرعت هر موقعیت AIS m ، محدوده R به افزایش های 2 گره تقسیم شد که هر افزایش مربوط به یک مقدار رنگ RGB متفاوت در تصویر نهایی است. افزایش 2 گره به این دلیل انتخاب شد که ما مقدار معقولی از مقادیر رنگ را می خواستیم (11 مقدار رنگ متمایز در برابر 22 مقدار رنگ با افزایش 1 گره) و در عین حال تعداد نسبتاً بالایی از افزایش ها را حفظ می کردیم. بنابراین، مقادیر رنگ برای مقادیر سرعت غیرمشابه موقعیت‌های AIS متفاوت بود. علاوه بر این، سرعت شناورهای ماهیگیری بین 2 تا 4 گره متفاوت است [ 10 ، 14 ]. که مربوط به افزایش 2 گره است. گاهی اوقات سرعت از R بیشتر می شوددامنه؛ بنابراین، مقادیر سرعت بیشتر از 22 گره، رنگ مشابه آخرین افزایش ( 20≤س<22). علاوه بر این، پیکسل‌هایی که دارای موقعیت AIS یا خط ترسیم شده توسط الگوریتم خط برسنهام نیستند، سفید رنگ می‌شوند و پیکسل‌هایی که حاوی خطوط بین موقعیت‌های AIS هستند از رنگ افزایش اول استفاده می‌کنند. در نتیجه، 12 مقدار رنگ در یک تصویر مسیر وجود دارد. نمونه ای از مسیر ترال در شکل 3 نشان داده شده است . در نهایت، شایان ذکر است که تبدیل یک مسیر به یک تصویر، سربار ناچیزی را اضافه می کند.

3.3. یادگیری عمیق برای طبقه بندی الگوی کشتی

این بخش رویکرد یادگیری عمیق را برای طبقه‌بندی الگوی تحرک کشتی از تصاویر مسیر، بر اساس شبکه‌های عصبی کانولوشنال (CNN) توصیف می‌کند.
CNN ها نیازی به استخراج ویژگی های دست ساز ندارند و ویژگی های عمیق مسیرها مانند شکل و رنگ (مثلاً سرعت) را می توان به طور خودکار توسط CNN آموخت. همانطور که در [ 48]، نورون ها در CNN سیگنال هایی را از نورون های دیگر در ناحیه محلی در لایه قبلی دریافت می کنند. بنابراین، CNN قادر است همبستگی های فضایی محلی بیشتری را به تصویر بکشد. علاوه بر این، مشخصه اشتراک وزن در اتصال لایه های مجاور می تواند تعداد متغیرها را به میزان قابل توجهی کاهش دهد. نقطه ضعف اصلی رویکردهای یادگیری عمیق در مورد طبقه بندی تصاویر این است که آنها به مقدار زیادی داده برای انجام استخراج و طبقه بندی دقیق ویژگی ها نیاز دارند. به منظور غلبه بر این محدودیت، یادگیری انتقالی اتخاذ شد. یادگیری انتقالی یک روش متداول و مؤثر است که هدف آن آموزش شبکه ای با نمونه های کمتر است، زیرا دانش استخراج شده توسط یک مدل از پیش آموزش دیده مجدداً مورد استفاده قرار می گیرد و برای کار مورد نظر مورد علاقه اعمال می شود. شهود پشت یادگیری انتقالی این است که ویژگی‌های عمومی که در یک مجموعه داده بزرگ کلی یاد می‌شوند را می‌توان در میان مجموعه‌های داده‌ای به ظاهر متفاوت به اشتراک گذاشت. ویژگی های آموخته شده را می توان برای حل یک کار متفاوت اما مرتبط استفاده کرد [55 ].
به طور کلی، دو راه برای انتقال استفاده از یادگیری در زمینه یادگیری عمیق [ 56 ] وجود دارد: (الف) استخراج ویژگی [ 57 ] و (ب) تنظیم دقیق [ 58 ، 59 ]]. در استخراج ویژگی، بازنمایی های آموخته شده از یک مدل از پیش آموزش دیده به عنوان یک استخراج کننده ویژگی دلخواه در نظر گرفته می شود و به منظور استخراج ویژگی های معنادار از نمونه های جدید استفاده می شود. از آنجایی که شبکه کانولوشنال پایه از قبل دارای ویژگی های عمومی مفید برای طبقه بندی است، نیازی به بازآموزی کل مدل نیست. در تنظیم دقیق، لایه های کاملا متصل مدل از پیش آموزش دیده با مجموعه جدیدی از لایه های کاملا متصل جایگزین می شوند. این لایه‌های جدید بر روی یک مجموعه داده مشخص آموزش داده می‌شوند و وزن لایه‌های بالایی مدل از پیش آموزش‌دیده به همراه لایه‌های جدید اضافه شده با استفاده از انتشار پس‌انداز «به‌خوبی» تنظیم می‌شوند. بنابراین، وزن ها از نقشه ویژگی های عمومی به ویژگی های مرتبط با مجموعه داده های ارائه شده تنظیم می شوند. با تنظیم دقیق، ویژگی‌های تخصصی با یک کار معین سازگار می‌شوند.60 ].
در این کار تحقیقاتی، تنظیم دقیق به عنوان روش استاندارد برای یادگیری انتقال استفاده شد. وزن ها بر روی مجموعه داده های ImageNet [ 61 ] برای همه CNN های عمیق آموزش داده شده بودند. شکل 4 فرآیند تنظیم دقیق در شبکه VGG16 را نشان می دهد. همین فرآیند برای همه مدل‌های یادگیری عمیق مورد بررسی قرار گرفت. مدل VGG16 شامل 13 کانولوشن ( سیOنV) و 3 کاملا متصل ( افسی) لایه های. مجموعه نهایی لایه هایی که شامل افسیلایه ها همراه با سofتیمترآایکستابع فعال سازی “سر” نامیده می شود. همانطور که در بالای شکل نشان داده شده است، شبکه با وزنه هایی که از قبل در ImageNet آموزش داده شده بودند، نمونه سازی شد. پس از آن، افسیلایه ها کوتاه شد و نهایی پOOLهمانطور که در وسط شکل نشان داده شده است، لایه به عنوان یک استخراج کننده ویژگی در نظر گرفته شد. در نهایت، لایه های کوتاه شده با یک لایه جدید جایگزین شدند افسیلایه سر، که به طور تصادفی مقداردهی اولیه شد و در بالای معماری اصلی (پایین شکل) قرار گرفت. سپس، مدل از طریق یک فرآیند پس انتشار آموزش داده شد. بدنه شبکه، به عنوان مثال، وزن از سیOنVلایه های شبکه از پیش آموزش دیده، به گونه ای منجمد شدند که تنها افسیلایه سر آموزش داده شد. این به این دلیل بود که سیOنVلایه ها قبلاً فیلترهای متمایز را یاد گرفته بودند و ویژگی های جهانی مانند منحنی ها و لبه ها را به دست آورده بودند. بنابراین، این وزنه ها باید دست نخورده باقی می ماندند. از سوی دیگر، افسیلایه سر به طور تصادفی از ابتدا مقداردهی اولیه شد و بر یادگیری ویژگی های خاص مجموعه داده متمرکز شد. بنابراین مقادیر تصادفی توانستند ویژگی های آموخته شده را از بین ببرند. ویژگی های لایه اولیه عمومی تر به نظر می رسید، در حالی که ویژگی های بعدی به تدریج برای یک کار خاص تر شدند [ 62 ].

داده‌های مسیر تاریخی به تصاویر تبدیل شدند و بر اساس حاشیه‌نویسی الگوهای تحرک بتن به چهار کلاس برچسب‌گذاری شدند. آnجساعتorهد، مترoorهد، توnدهrwآy، fمنسساعتمنng). این تصاویر به عنوان ورودی به مدل‌های مختلف یادگیری عمیق برای آموزش وارد شدند. برچسب ها در بردارهای یک داغ کدگذاری شدند، و سپس، هر مدل از طریق یک عملیات پس انتشار آموزش داده شد تا فرآیند بهینه سازی تابع هدف همگرا شود. همه CNN های مورد بررسی دارای برخی از فراپارامترهای مشترک بودند. تصاویر ورودی به اندازه ثابت مقیاس بندی شدند 224×224پیکسل ها آموزش برای 25 دوره برای همه مدل های از پیش آموزش دیده با نرخ یادگیری 1 × 10-3 و اندازه دسته ای 8 انجام شد. خروجی لایه های پیچشی توسط تابع فعال سازی غیر خطی به نام واحد خطی اصلاح شده فعال می شود. ReLU)، که تابع را محاسبه می کند:

آرهLU(ایکس)=ایکس،ایکس>00،ایکس≤0

ReLU به دلیل کاهش احتمال ناپدید شدن گرادیان ها و محاسبه کارآمد آن به عنوان تابع فعال سازی انتخاب شد. پس از هر لایه پیچشی، لایه ادغام برای انجام عملیات نمونه برداری پایین معرفی شد که ابعاد درون صفحه نقشه های ویژگی را کاهش داد. عملیات Downsamp بعد از لایه‌های کانولوشن، یک تغییر ناپذیری ترجمه را برای جابجایی‌ها و اعوجاج‌های کوچک ایجاد می‌کند و تعداد پارامترهای قابل یادگیری بعدی را کاهش می‌دهد. ادغام میانگین [ 63 ] به عنوان استراتژی ادغام استفاده شد، که یک نوع کاهش ابعاد شدید را انجام داد، که در آن یک تانسور با ابعاد ساعت×w×دنمونه برداری شد به a 1×1×دآرایه به سادگی با گرفتن میانگین همه عناصر در هر یک ساعت×wنقشه ویژگی، در حالی که عمق نقشه های ویژگی حفظ شد. تعداد پارامترهای قابل یادگیری کاهش یافت و از برازش بیش از حد جلوگیری شد. نقشه‌های ویژگی خروجی لایه نهایی صاف شده و به لایه‌های کاملاً متصل متصل شدند، که در آن هر ورودی با وزن قابل یادگیری به هر خروجی متصل می‌شد. لایه خروجی با استفاده از تابع softmax، توزیع احتمال را بر روی برچسب های طبقه بندی ایجاد کرد:

سofتیمترآایکس(ایکس)من=هایکسپ(ایکسمن)∑j=1منهایکسپ(ایکسj))

که در آن x بردار خروجی شبکه است. تابع softmax احتمالات هر کلاس را محاسبه می کند من=1،2،…،مندر تمام کلاس های هدف ممکن

خطا بین خروجی واقعی هر کلاس محاسبه شد تیمنو خروجی تخمین زده شده از f(س)منبا استفاده از “categorical_crossentropy” به عنوان تابع ضرر:

سیE=-∑منسیتیمنورود به سیستم(f(س)من)

جایی که f(س)به معادله ( 10 ) اشاره دارد. “categorical_crossentropy” توزیع پیش بینی ها را با توزیع واقعی مقایسه می کند. کلاس واقعی به عنوان یک بردار رمزگذاری شده یک داغ نشان داده می‌شود و هر چه خروجی‌های مدل به آن بردار نزدیک‌تر باشد، تلفات کمتر می‌شود.

CNN های بررسی شده با استفاده از روش بهینه سازی به نام Adam [ 64 ] گردآوری شدند که حداقل تابع هدف (خطا) را با استفاده از گرادیان خود پیدا می کند. علاوه بر این، یک لایه حذف [ 65 ] 0.5 اعمال شد، که به این معنی است که 50٪ از نورون ها به طور تصادفی در طول هر دوره آموزشی روی صفر قرار می گیرند، بنابراین از تطبیق بیش از حد در مجموعه داده های آموزشی جلوگیری می شود. Dropout یکی از محبوب‌ترین تکنیک‌های منظم‌سازی است که وزن‌های موجود در شبکه را مجبور می‌کند فقط مقادیر کوچکی را دریافت کنند. توزیع مقادیر وزن را منظم تر می کند. در نتیجه، این تکنیک می تواند بیش از حد برازش را در نمونه های آموزشی کوچک کاهش دهد [ 66 ]. یکی دیگر از راه های کارآمد برای جلوگیری از برازش بیش از حد مدل، افزایش داده ها است که میزان داده های آموزشی را افزایش می دهد.67 ]. بنابراین، تقویت داده ها در طول آموزش، با استفاده از چندین تکنیک چند پردازشی انجام شد. به طور خاص، تبدیل‌های بکار گرفته شده شامل چرخش تصادفی تصاویر (حداکثر زاویه چرخش 30 درجه بود)، چرخش‌های افقی، برش، بزرگ‌نمایی، برش و نویز تصادفی کوچک بود. افزایش داده ها تعمیم را بهبود بخشید و قابلیت یادگیری مدل را افزایش داد. جدول 1 پارامترهای به کار گرفته شده توسط CNN های عمیق مختلف را خلاصه می کند.

3.4. طبقه بندی کشتی های جریانی

تأخیر کم و توان عملیاتی بالا دو ویژگی کلیدی سیستم های جریان هستند که از تصمیم گیری سریع پشتیبانی می کنند. در چنین سیستم هایی، رویدادها باید در زمان واقعی پردازش شوند، به عنوان مثال، پس از مصرف یک رویداد، سیستم باید در اسرع وقت یک نتیجه را ارائه دهد. در یک سناریوی واقعی، تقریباً 200000 کشتی در سراسر جهان بیش از 16000 پیام AIS در هر ثانیه را ارسال می کنند که در مجموع 46 گیگابایت در روز است و هر گیرنده AIS با 5 تا 8 پیام AIS در ثانیه پر می شود. بنابراین، یک سیستم جریانی که تاخیر و توان عملیاتی را متعادل می‌کند، باید برای طبقه‌بندی فعالیت‌های کشتی در زمان واقعی ایجاد شود. برای این منظور، ما یک روش جریان یادگیری عمیق برای شناسایی الگوهای تحرک پیشنهاد کردیم که شامل دو مرحله بود.
آموزش مدل آفلاین: در این مرحله، مدل یادگیری عمیق همانطور که در بخش 3.3 توضیح داده شد ایجاد شد . برای آموزش مدل، مسیرهای معرف الگوهای تحرک مورد نیاز بود که به عنوان حقیقت اصلی استفاده شوند. بنابراین، مسیرهای قبلاً برچسب‌گذاری شده از داده‌های AIS تاریخی، که به‌عنوان «لنگر، لنگر انداخته»، «در حال انجام» و «ماهیگیری» مشروح شده بودند، استفاده شد. این مسیرها به تصاویر تبدیل شدند که به نوبه خود به عنوان نمونه های آموزشی مدل یادگیری عمیق مورد استفاده قرار گرفتند. برای پیاده سازی، کتابخانه Keras ( https://keras.io/ ، قابل دسترسی در 7 آوریل 2021) با یک TensorFlow ( https://www.tensorflow.org/ )، در 7 آوریل 2021 قابل دسترسی بود) از backend استفاده شد که شامل نه تنها API برای ایجاد شبکه های عصبی، بلکه از مدل های CNN از پیش آموزش دیده نیز بود. این مدل‌های از پیش آموزش‌دیده برای طبقه‌بندی تصاویر الگوهای تحرک در فاز بعدی به کار گرفته شدند و به‌خوبی تنظیم شدند.
طبقه بندی فعالیت کشتی در زمان واقعی: چندین چارچوب برای پردازش جریان توزیع شده وجود دارد مانند Apache Spark ( https://spark.apache.org/streaming/ ، در 7 آوریل 2021، Apache Flink ( https://flink.apache) .org/ ، قابل دسترسی در 7 آوریل 2021)، و جریان‌های کافکا ( https://kafka.apache.org/documentation/streams/ )، در 7 آوریل 2021 قابل دسترسی است) که تنها آپاچی اسپارک از زبان برنامه نویسی پایتون پشتیبانی می کند که برای اجرای شبکه های عصبی و ایجاد تصاویر مورد نیاز بود. Apache Spark ترجیح داده نمی شود زیرا میکروبچینگ را روی جریان رویدادها انجام می دهد و سیستمی مورد نیاز است که بتواند پردازش رویداد را در زمان واقعی انجام دهد. بنابراین، برای متعادل کردن پردازش رویداد با تاخیر کم و توان عملیاتی بالا، آپاچی کافکا ( https://kafka.apache.org/در 7 آوریل 2021 از چارچوب استفاده شد، یک پلت فرم انتشار-اشتراک و تبادل پیام توزیع شده شبیه به یک صف پیام که قادر به پردازش جریانی از رویدادها در زمان وقوع است. سه مفهوم اصلی در اکوسیستم آپاچی کافکا وجود دارد که عبارتند از موضوعات، تولیدکنندگان و مصرف کنندگان. موضوع کافکا یک نام دسته/فید است که پیام‌ها در آن ذخیره و منتشر می‌شوند. تولید کننده برنامه ای است که به طور مداوم پیام ها را در یک موضوع منتشر یا ذخیره می کند. مصرف کننده برنامه ای است که در یک موضوع مشترک شده و به طور مداوم پیام ها را می خواند یا مصرف می کند. یک موضوع کافکا را می توان به n پارتیشن تقسیم کرد که هر پارتیشن پیام های متفاوتی را ذخیره می کند. به طور خاص، پیام هایی با کلید یکسان در همان پارتیشن ذخیره می شوند. nمصرف کنندگان را می توان در موضوع پارتیشن بندی شده مشترک کرد و هر مصرف کننده از پارتیشن متفاوتی مصرف می کند، بنابراین توان عملیاتی بالا را ممکن می سازد. یک تولیدکننده می‌تواند پیام‌های مربوط به موضوع پارتیشن‌شده را ذخیره کند و آپاچی کافکا تعادل بار پیام‌ها را در بین پارتیشن‌ها به صورت داخلی مدیریت می‌کند. در مورد استفاده ما، شناسه کشتی را می توان به عنوان کلید پیام، گیرنده AIS به عنوان تولید کننده و ماژول های پیش بینی را به عنوان مصرف کننده در نظر گرفت. توزیع یکنواخت بار در گره‌های سیستم، احتمال تبدیل یک گره به یک هات اسپات را کاهش می‌دهد و این ویژگی همچنین به عنوان محافظی برای قابلیت اطمینان سیستم عمل می‌کند [ 68 ، 69 ].
ماژول های پیش بینی اجزای اصلی روش شناسی ما بودند. هر ماژول پیش‌بینی مسئول مصرف پیام‌های AIS از مجموعه‌ای از کشتی‌ها و طبقه‌بندی بخش‌هایی از مسیرهای آنها بر اساس مدل یادگیری عمیق ایجاد شده در مرحله قبل بود. برای طبقه‌بندی بخش‌هایی از مسیر کشتی‌ها، ماژول از یک پنجره کشویی زمانی W با طول تعریف‌شده توسط کاربر L و مرحله S استفاده کرد. هر پیام S AIS، ماژول تمام پیام‌های AIS کشتی مربوطه را که به پنجره فعلی W تعلق داشت، در نظر می‌گرفت.و آنها را به تصویر تبدیل کرد. در مرحله بعد، مدل یادگیری عمیق تصویر و خروجی هر یک از فعالیت های کشتی از پیش تعریف شده را به احتمال زیاد می خواند. فعالیت کشتی با بیشترین احتمال، پیش بینی نهایی ماژول بود. شکل 5 پنجره های کشویی ماژول های پیش بینی را نشان می دهد. یک پنجره به طول L و یک پله از اس=2رویدادها نشان داده شده است که از چپ به راست اسلاید می کند ( دبلیو1به دبلیو3). حد زمانی بالای پنجره زمانی است که پیام دریافتی مصرف شده است و حد زمانی پایین پنجره L ساعت/دقیقه/ثانیه قبل از t است .تی-L. پیام هایی که در پنجره W قرار می گیرند برای پیش بینی استفاده شدند.
در نهایت، شکل 6 کل معماری سیستم روش پیشنهادی ما را به تصویر می کشد. در ابتدا، پیام‌های AIS تاریخی که از گیرنده‌های AIS جمع‌آوری می‌شدند به تصاویر تبدیل شدند. سپس از این تصاویر برای آموزش یک مدل یادگیری عمیق آفلاین استفاده شد. برای طبقه بندی بلادرنگ، پیام های دریافتی از طریق گیرنده های AIS در یک موضوع کافکا ذخیره می شدند. این پیام‌ها سپس توسط ماژول‌های پیش‌بینی مصرف می‌شوند و به تصاویر تبدیل می‌شوند، که به مدل یادگیری عمیق آموزش‌دیده برای پیش‌بینی فعالیت کشتی داده می‌شوند. در طول طبقه‌بندی فعالیت کشتی بلادرنگ، بیش از یک ماژول پیش‌بینی می‌تواند برای افزایش توان عملیاتی سیستم استفاده شود.

3.5. فشرده سازی مسیر

میزان داده‌های مکانی-زمانی که دائماً توسط سیستم‌های امروزی مانند دستگاه‌های GPS، ایستگاه‌های دریافت AIS، خدمات مبتنی بر مکان و ماهواره‌ها تولید می‌شود، رشد خیره‌کننده‌ای داشته است. مدیریت و تجزیه و تحلیل این داده ها به طور فزاینده ای اهمیت پیدا می کند و برنامه هایی را قادر می سازد که ممکن است علم و جامعه را متحول کنند [ 70 ، 71 ]. سیستم های مدیریت پایگاه داده مکانی-زمانی اجزای اساسی در مواجهه با چالش های ناشی از کاربردهای مکانی-زمانی را تشکیل می دهند [ 72 ]]. در حالی که امتیازات بیشتری جمع آوری می شود، هرچه نمایش مسیر دقیق تر می شود، حجم عظیم داده های مسیر می تواند به سرعت سیستم های ذخیره سازی داده های موجود را تحت الشعاع قرار دهد و اطلاعات اضافی که اغلب در این داده ها وجود دارد می تواند تجزیه و تحلیل انسانی را تحت تأثیر قرار دهد.
یک رویکرد معمولی برای چالش‌های فوق، کاهش داده‌های مسیر با استفاده از تکنیک‌های فشرده‌سازی است. هدف فشرده سازی مسیر کاهش قابل توجهی در مقدار داده ها در حالی که از دست دادن اطلاعات (خطا) به حداقل می رسد و در عین حال کیفیت مسیر را حفظ می کند. بنابراین، مشخص می‌شود که بین نرخ تراکم و کیفیت مسیری که پس از فشرده‌سازی به دست می‌آید، یک مبادله وجود دارد. کیفیت به شدت با از دست دادن اطلاعات مرتبط است و با معیارهایی اندازه‌گیری می‌شود که خطای اعمال شده را در یک مسیر در صورت حذف یک نقطه مشخص محاسبه می‌کند.
مطالعات متعددی در رابطه با فشرده سازی در ادبیات وجود دارد که هدف آن متعادل کردن تعادل بین نرخ فشرده سازی به دست آمده و خطای قابل قبول است. مراتنیا و همکاران [ 73 ] یکی از اولین مطالعات تحقیقاتی بود که داده‌های تحرک سه‌بعدی را در نظر گرفت، بنابراین مسیر حرکت اجسام حرکتی، که در آن عامل زمانی در تکنیک‌های فشرده‌سازی در نظر گرفته شد. لیخسنرینگ و همکاران [ 74 ] ارزیابی هفت الگوریتم فشرده سازی با تلفات را با دیدگاه شناسایی مهم ترین جنبه ها در انتخاب الگوریتم فشرده سازی مناسب ارائه کرد، در حالی که Muckell و همکاران. [ 75] همچنین مقایسه عملکرد هفت الگوریتم فشرده سازی را هنگام استفاده از دو خطای مختلف، فاصله اقلیدسی همگام (SED) و تفاوت میانه سرعت ارائه کرد. پوتامیاس و همکاران [ 76 ] دو تکنیک فشرده سازی آنلاین به نام STTrace and Thresholds را پیشنهاد کرد. STTrace از ویژگی‌های مکانی-زمانی که حرکت را مشخص می‌کند و تغییرات سرعت و جهت را تشخیص می‌دهد، بهره‌برداری می‌کند، بنابراین SED را در هر مرحله به حداقل می‌رساند، در حالی که در آستانه‌ها، انتخاب الحاق یک نقطه به نمونه بر اساس آستانه سرعت است. در SQUISH [ 77 ]، مهمترین نقاط یک مسیر اولویت بندی می شوند و نقاط ورودی جدید نیاز به حذف نقطه دیگری دارند که قبلاً در یک بافر ذخیره شده است. نکته حذف شده این است که با حداقل خطای تخمینی SED. حساب مرده [78 ] نقطه جانشین را از طریق موقعیت و سرعت فعلی جسم تخمین می زند. در نهایت، یک تکنیک فشرده سازی جایگزین در [ 79 ] ارائه شد که مبتنی بر تبدیل دوگانه اجسام متحرک بود. هر خط سیر خام با تعداد گسسته ای از زیرمسیرهای خطی تقریب زده می شود که در معرض تبدیل دوگانه قرار می گیرند. تبدیل دوگانگی قطعات خط بر اساس Hough-X و Hough-Y است. در اصل، Hough-X یک تبدیل خطی در مختصات فضایی را تشکیل می دهد. همانطور که نتایج نشان داد، فضای Hough الگوهای تحرک بهتری را نسبت به داده‌های فضایی مسیر اصلی نشان می‌دهد، بنابراین منجر به خوشه‌های همگن‌تر می‌شود و کارایی ذخیره‌سازی را نیز فراهم می‌کند.
علاقه ما بر روی الگوریتم‌های فشرده‌سازی با تلفات آفلاین متمرکز است، که داده‌های کم‌اهمیت را در تلاش برای حفظ ویژگی‌های اصلی مسیر اصلی و در عین حال حفظ درجه قابل قبولی از خطا حذف می‌کنند. در این کار تحقیقاتی، پنج الگوریتم فشرده سازی از بالا به پایین آفلاین با اتلاف ارزیابی شدند. در الگوریتم های بالا به پایین، یک مسیر به صورت بازگشتی تقسیم می شود تا زمانی که یک شرط توقف برآورده شود [ 80 ]. الگوریتم ها به شرح زیر بود:
  • داگلاس-پوکر (DP)
  • نسبت زمانی (TR)
  • بر اساس سرعت (SP)
  • بر اساس سرفصل (HD)
  • بر اساس سرعت سرفصل (SP_HD)
داگلاس-پوکر [ 81 ] یک الگوریتم تعمیم خط است که به صورت بازگشتی نقاط را از مجموعه اصلی انتخاب می کند. روند الگوریتم در شکل 7 نشان داده شده است . در ابتدا، اولین ( پآ) و نکته آخر ( پب) به ترتیب به عنوان لنگر و نقطه شناور انتخاب می شوند و این دو نقطه یک پاره خط را تشکیل می دهند Lاسآ→بهمانطور که در شکل 7 الف نشان داده شده است. منحنی شروع مجموعه ای از نقاط و یک آستانه (بعد فاصله) است. ε>0. پس از آن، نقطه با حداکثر فاصله عمود بر (⊥) از Lاسآ→بانتخاب شده است ( پ1). اگر این نقطه نزدیکتر از εبه Lاسآ→ب، تمام نقاط بین پآو پبدور ریخته می شوند. در غیر این صورت، نقطه تازه اضافه شده در مجموعه حاصل گنجانده می شود و همانطور که در شکل 7 ب نشان داده شده است، به نقطه شناور جدید برای بخش اول و نقطه لنگر برای بخش دوم تبدیل می شود . این فرآیند با استفاده از بازگشت در هر بخش خط تکرار می شود ( شکل 7 ج). هنگامی که بازگشت کامل می شود، یک مسیر ساده شده جدید تنها از نقاطی ایجاد می شود که به عنوان حفظ شده علامت گذاری شده اند ( شکل 7 د).
علیرغم محبوبیت الگوریتم های تعمیم خط در زمینه های نقشه برداری و گرافیک کامپیوتری، اشکال اصلی در برخورد با داده های مسیر حرکت اجسام متحرک این است که جنبه زمانی را در نظر نمی گیرند. خطای مکانی نزدیکترین نقطه را در نمایش فشرده یک مسیر به هر نقطه از مسیر اصلی پیدا می کند. هر مسیر به عنوان یک خط در فضای دو بعدی در نظر گرفته می شود. با این حال، یک مسیر دارای یک بعد اضافی مهم است: زمان. مراتنیا و بای [ 80 ] الگوریتم نسبت زمانی را پیشنهاد کردند، که فواصل بین جفت موقعیت‌های همگام زمانی تخمینی را محاسبه می‌کند، یکی در مسیر اصلی و دیگری در مسیر تقریبی مربوطه، همانطور که در شکل 8 نشان داده شده است.

برای هر نقطه در مسیر اصلی مانند پمن، نقطه هماهنگ زمانی پمن”در مسیر تقریبی قرار دارد تیrپآ-پبو مختصات ( ایکسمن”، yمن”) از پمن”را می توان با استفاده از درون یابی خطی به صورت زیر محاسبه کرد:

ایکسمن”=ایکسآ+تیمن-تیآتیب-تیآ(ایکسب-ایکسآ)yمن”=yآ+تیمن-تیآتیب-تیآ(yب-yآ)
پس از تعیین نقاط همگام زمانی، فاصله اقلیدسی همگام شده به صورت محاسبه می شود. اسED(پمن،پمن”)=(ایکسمن-ایکسمن”)2+(yمن-yمن”)2. (ایکسمن،yمن)و (ایکسمن”،yمن”)مختصات یک جسم متحرک در زمان را نشان می دهد تیمنو زمان همگام شده تیمن”به ترتیب در ردهای فشرده نشده و فشرده. در نهایت، اگر فاصله بین پمن”و پمنبزرگتر از یک آستانه تعریف شده توسط کاربر است، نقطه خاص در مجموعه حاصل گنجانده می شود، در غیر این صورت دور انداخته می شود. با گنجاندن عامل زمانی، الگوریتم قادر است نتایج دقیق تری ارائه دهد.
الگوریتم مبتنی بر سرعت از سرعت های بخش های بعدی یک مسیر بهره برداری می کند. مثلاً اگر مقدار مطلق اختلاف سرعت بین دو بخش بعدی یک مسیر باشد |vمن+1-vمن|، بزرگتر از یک آستانه تعریف شده توسط کاربر است، نقطه وسط حفظ می شود، در غیر این صورت دور انداخته می شود. الگوریتم در شکل 9 نشان داده شده است .
الگوریتم مبتنی بر عنوان از زاویه تشکیل شده توسط بخش های بعدی یک مسیر بهره برداری می کند. در ابتدا فاصله بین نقاط پیوسته محاسبه می شود. سپس، برای هر مثلث تشکیل شده توسط سه نقطه پیوسته مانند پآپبپج، طول فاصله طرف مقابل زاویه مورد بررسی محاسبه می شود، به عنوان مثال، پآپجو از قانون کسینوس برای یافتن زاویه استفاده می شود، به عنوان مثال، آ1مانند ج2=آ2+ب2-2آبcosγ، جایی که γنشان دهنده زاویه بین اضلاع طول a ( پآپب) و ب ( پبپج) و مقابل ضلع طول c ( پآپج). اگر زاویه دو بخش بعدی بیشتر از یک آستانه تعریف شده توسط کاربر باشد، نقطه وسط حفظ می شود، در غیر این صورت دور انداخته می شود. الگوریتم در شکل 10 نشان داده شده است .
با ترکیب الگوریتم مبتنی بر سرعت با الگوریتم مبتنی بر سرفصل، می توان الگوریتم جدیدی به دست آورد که از مفهوم هر دو الگوریتم به طور همزمان بهره برداری می کند. الگوریتم، یعنی بر اساس سرعت سرفصل، یک نقطه را بر اساس دو آستانه حفظ یا حذف می کند. اگر سرعت یا سرفصل به ترتیب از حد آستانه و سرعت بیشتر باشد، نقطه حفظ می شود، در غیر این صورت دور انداخته می شود.
یکی از چالش ها، تعریف آستانه هایی است که باید توسط الگوریتم های فشرده سازی به کار گرفته شوند. تنظیم آستانه مناسب یک فرآیند وابسته به کاربرد است و می تواند به طور قابل توجهی بر نتایج فشرده سازی از نظر نسبت تراکم و کیفیت به دست آمده تأثیر بگذارد. به طور کلی، مراحلی که هر الگوریتم دنبال می‌کند عبارتند از: (i) نقاط را گروه‌بندی کنید و یک مسیر برای هر شی بر اساس یک شناسه ایجاد کنید. این عملا به این معنی است که تعداد مسیرها در یک مجموعه داده به اندازه تعداد اشیاء است. (ii) کل مسیر هر شناسه را فشرده کنید. (iii) نقاط باقی مانده پس از فشرده سازی را در یک فایل گروه بندی شده توسط شناسه ها بنویسید. همانطور که ما نقاط را برای هر شناسه (شیء) در مجموعه داده گروه بندی کردیم، مسیرها را استخراج کردیم (یک مسیر برای هر شی). به منظور تعیین آستانه ای که هر الگوریتم استفاده خواهد کرد، یک فرآیند پویا پیشنهاد شد: برای هر مسیر منفرد، یک آستانه متفاوت به طور خودکار بر اساس میانگین تعریف شد. به طور خاص، ما میانگین اپسیلون (DP )، میانگین SED ( TR )، سرعت متوسط ​​( SP )، عنوان متوسط ​​( HD )، و میانگین سرعت_هدینگ ( SP_HD ) برای هر مسیر قبل از هر یک از الگوریتم‌های مربوطه اعمال شد. سپس، از این مقدار میانگین (AVG) به عنوان یک نقطه مرجع برای تعریف یک قانون مشترک برای محاسبه آستانه استفاده کردیم. این عملا به این معنی است که در هر مسیر از هر مجموعه داده، آستانه متفاوتی در الگوریتم مربوطه اعمال می‌شود که به ویژگی‌ها و ویژگی‌های واقعی این مسیر بستگی دارد. بنابراین، ما نیاز به آستانه های دلخواه تعریف شده توسط کاربر را حذف کردیم.

4. ارزیابی تجربی

این بخش ارزیابی تجربی روش پیشنهادی را ارائه می‌کند. برای ارزیابی مناسب رویکرد ارائه شده در بخش 3 ، آزمایش هایی را ارائه می کنیم که:
  • دقت طبقه بندی به دست آمده و عملکرد طبقه بندی کلی روش یادگیری عمیق را نشان می دهد ( بخش 4.2 )،
  • تأخیر و توان عملیاتی به دست آمده و عملکرد کلی اجرا را نشان می دهد ( بخش 4.3 )،
  • تأثیر الگوریتم های فشرده سازی مسیر را بر عملکرد طبقه بندی کار در دست نشان دهید ( بخش 4.4 ).
مجموعه داده های دنیای واقعی مورد استفاده برای ارزیابی رویکرد طبقه بندی مسیر پیشنهادی در زیر ارائه شده است ( بخش 4.1 ).

4.1. توضیحات مجموعه داده

اولین مجموعه داده مورد استفاده شامل پیام‌های AIS جمع‌آوری‌شده از یک گیرنده AIS زمینی (T-AIS) است که خلیج سارونیک (یونان) از جمله بندر پیرئوس را پوشش می‌دهد و حاوی اطلاعات AIS با کیفیت بالا و بدون شکاف اطلاعاتی است. مجموعه داده ها اطلاعاتی را برای 1229 کشتی منحصر به فرد ارائه کرد و در مجموع شامل 11769237 رکورد AIS بود. کشتی‌ها تقریباً برای یک دوره یک و نیم ماهه از 18 فوریه 2020 تا 31 مارس 2020 پایان یافتند. نمونه کوچکی از مجموعه داده‌ها را می‌توانید در اینجا پیدا کنید [ 82 ].
AIS، علاوه بر اطلاعات موقعیتی، وضعیت ناوبری خود را نیز منتقل می کند ( https://help.marinetraffic.com/hc/en-us/articles/205426887-What-kind-of-information-is-AIS-transmitted-2020-04 -06 ، مشاهده شده در 7 آوریل 2021). وضعیت ناوبری به صورت دستی توسط خدمه کشتی درج می شود و یک شناسه مربوط به فعالیت کشتی را تشکیل می دهد (به عنوان مثال، پنج نشان می دهد که کشتی هنگام دریافت پیام لنگر انداخته است). پیام‌های AIS مورد استفاده برای مجموعه داده‌های حقیقت زمینی ما شامل فعالیت‌هایی بود که از کشتی‌هایی استخراج شده بود که وضعیت ناوبری خود را روی 0، 1، و 5 تنظیم می‌کردند – از این پس الگوی A:
  • 0: در حال انجام است
  • 1: لنگر انداخته
  • 5: پهلو گرفته
از آنجایی که وضعیت به صورت دستی گزارش می شود، اغلب می توان مشاهده کرد که خدمه کشتی ممکن است تغییر وضعیت را فراموش کنند و در نتیجه حاشیه نویسی نادرست ایجاد شود. برای مقابله با مشکل حاشیه نویسی های نادرست و ارائه نمایش های با کیفیت خوب از فعالیت های کشتی به طبقه بندی کننده ها، صد و پنجاه تصویر نماینده از هر کلاس (در مجموع 450) انتخاب شدند.
مجموعه داده دومی که مورد استفاده قرار گرفت توسط MarineTraffic ( https://www.marinetraffic.com ، دسترسی به 7 آوریل 2021) ارائه شد و حاوی پیام های AIS از 1 ژانویه 2018 تا 28 فوریه 2018 در دریاهای شمال اروپا بود. تعداد کل پیام های AIS این مجموعه داده به 61050 رسید. مشابه اولین مجموعه داده، پیام‌های AIS مورد استفاده برای مجموعه داده‌های حقیقت زمینی ما شامل فعالیت‌های ماهیگیری بود که از کشتی‌های ماهیگیری که وضعیت ناوبری خود را روی هفت تنظیم می‌کردند، که نشان‌دهنده «فعالیت ماهیگیری» است، و توسط کشتی‌هایی که مقصد خود را برای ترال تعیین می‌کردند استخراج می‌شد. یا در انتظار فعالیت مربوطه. سپس این مسیرهای ماهیگیری به دو دسته تقسیم شدند:
  • ماهیگیری (صیادی و لانگ لاین)
  • لنگر انداخته است
  • در حال انجام
کشتی‌ها معمولاً به بندری لنگر می‌زنند، سپس به منطقه ماهیگیری می‌روند، و در نهایت، درگیر یک فعالیت ماهیگیری (ترال یا لانگ لاین) می‌شوند – از این پس الگوی B. باز هم صد و پنجاه تصویر نماینده از هر کلاس (450 در اینچ) مجموع) استفاده شد.
در هر دو مجموعه داده، هر رکورد AIS شامل 10 ویژگی است که در جدول 2 توضیح داده شده است.

4.2. ارزشیابی یادگیری عمیق

به منظور ارزیابی عملکرد طبقه‌بندی، چندین معیار طبقه‌بندی رایج مورد استفاده قرار گرفتند: دقت (ACC)، دقت، یادآوری (حساسیت)، و امتیاز F1. آججتوrآجyنشان می دهد که چگونه یک الگوریتم طبقه بندی می تواند طبقات مسیرها را در مجموعه آزمایشی متمایز کند. همانطور که در معادله ( 13 ) نشان داده شده است، آسیسیرا می توان به عنوان نسبت برچسب های صحیح پیش بینی شده ( TP + TN ) به تعداد کل برچسب ها ( N ) تعریف کرد.

آججتوrآجy(آسیسی)=|سیorrهجتیلyLآبهلهدEایکسآمترپلهس|ن

پrهجمنسمنonهمانگونه که در رابطه ( 14 ) نشان داده شده است، نسبت برچسب های صحیح پیش بینی شده به تعداد کل برچسب های واقعی است ، در حالی که آرهجآللنسبت برچسب های صحیح پیش بینی شده به تعداد کل برچسب های پیش بینی شده است، همانطور که در رابطه ( 15 ) نشان داده شده است. یادآوری همچنین به عنوان حساسیت یا نرخ مثبت واقعی (TPR) شناخته می شود.

پrهجمنسمنon(پ)=تیپتیپ+افپ
آرهجآلل(اسهnسمنتیمنvمنتیy)=تیپتیپ+افن

امتیاز F 1 از میانگین هارمونیک دقت و یادآوری تشکیل شده است، که در آن دقت، دقت متوسط ​​در هر کلاس و یادآوری، میانگین یادآوری در هر کلاس است، همانطور که در معادله ( 16 ) نشان داده شده است.

اف1=2·پrهجمنسمنon·آرهجآللپrهجمنسمنon+آرهجآلل
TP ، TN ، FP ، و FN به نمونه های مثبت واقعی، منفی واقعی، مثبت کاذب و منفی کاذب برای هر کلاس (لنگر، پهلو گرفته، در حال اجرا و ماهیگیری) اشاره دارد.
عملکرد طبقه بندی چندین CNN از قبل آموزش دیده، یعنی VGG16، InceptionV3، NASNetLarge، و DenseNet201، بر روی اثربخشی تشخیص الگوی کشتی مورد ارزیابی قرار گرفت. برای هر CNN، ما یک اعتبارسنجی متقابل پنج برابری بر روی 800 نمونه (200 نمونه در هر کلاس) برای هر دو مجموعه داده انجام دادیم، و در هر برابر نگه داشتیم. 80%از داده ها برای آموزش و 20%از داده ها برای اعتبارسنجی، و نتایج میانگین کلان را گزارش کرد. مسیرها به مسیرهای پنجره زمانی با اندازه مساوی به طول 8 ساعت تقسیم شدند. این پنجره زمانی خاص به این دلیل انتخاب شد که الگوهای تحرک رگ‌ها برای شکل‌گیری نیاز به زمان دارد [ 10 ]. به عنوان مثال، در طول یک پنجره یک ساعته، الگوی لنگر همانطور که در بخش 3.1 توضیح داده شد ، به احتمال زیاد به طور کامل شکل نخواهد گرفت.
جدول 3 نتایج طبقه بندی هر مدل از اولین مجموعه داده را نشان می دهد (الگوی A).
بسته Keras و یک Backend TensorFlow همراه با زبان برنامه نویسی Python برای آموزش مدل های یادگیری عمیق استفاده شد. Keras یک کتابخانه شبکه عصبی با کاربرد ساده است که بر روی Theano یا TensorFlow ساخته شده است.
نتایج نشان داد که مدل VGG16 بهترین دقت طبقه بندی تقریباً 99٪ را به دست آورد و پس از آن InceptionV3 و NASNetLarge با دقت تقریباً مشابه 92٪ قرار گرفتند. DenseNet201 بدترین نتایج را با دقت 88 درصد ارائه کرد. حساسیت 100% برای لنگرگاه و لنگر و 97% برای کلاس در حال اجرا را می توان برای VGG16 مشاهده کرد. این عملاً به این معنی است که الگوهای تحرک کشتی لنگر یا لنگردار به طور دقیق در 100٪ موارد شناسایی می شوند، در حالی که الگوهای تایید شده در حال انجام فقط در 3٪ موارد به اشتباه طبقه بندی می شوند. علاوه بر این، VGG16 مقادیر دقت بالایی را برای همه کلاس ها نشان داد، به ویژه 100٪ برای لنگرها و در حال اجرا و 96٪ برای لنگرها. این نشان می دهد که هیچ کلاسی به اشتباه به عنوان پهلو گرفته یا در حال انجام از کلاس دیگری طبقه بندی نشده است. در حالی که فقط یک کلاس لنگر به اشتباه به عنوان در حال انجام طبقه بندی شد. این را می توان در ماتریس سردرگمی مدل VGG16 با بهترین عملکرد طبقه بندی از بین پنج برابر مشاهده کرد.شکل 11 الف). با توجه به امتیاز F1، کلاس لنگر 100٪ در تمام معیارهای عملکرد به دست آورد، به این معنی که FPs و FN ها در صفر به حداقل رسید.
InceptionV3 و NASNetLarge نتایج بسیار مشابهی ارائه کردند. دقت 100% در کلاس لنگرها مشاهده شد، به این معنی که هیچ کلاس لنگر یا در حال انجامی وجود نداشت که به اشتباه به عنوان لنگر طبقه بندی شده باشد. از سوی دیگر، دقت و امتیاز F1 در مورد کلاس لنگر، نتایج پایینی را نشان می‌دهد. در واقع، این مقادیر پایین توسط تعداد زیادی از FP ها توجیه می شدند. شکل 11 b,c نشان می‌دهد که کلاس لنگردار دارای هفت مورد طبقه‌بندی‌شده اشتباه است که در هر دو مدل در حال انجام است. علاوه بر این، مدل‌ها مقادیر حساسیت بالایی را برای کلاس لنگرگاه و لنگر نشان دادند، در حالی که کلاس در حال اجرا مقدار متوسط ​​80٪ را به تصویر می‌کشید. مجدداً، کلاس لنگر در تمام معیارهای عملکرد به 100٪ دست یافت.
اگرچه DenseNet201 بدترین نتایج را از نظر دقت ارائه کرد، کلاس لنگر انداخته مجدداً مقادیر بالایی برای همه معیارهای عملکرد به دست آورد. همانطور که نتایج نشان می دهد، دقت در مورد کلاس لنگر بسیار پایین در حدود 68٪ بود و از همان روند مدل های InceptionV3 و NASNetLarge برای کلاس خاص پیروی کرد. با این حال، این مدل به‌ترتیب در 100 و 97 درصد مواقع، به‌طور صحیح کلاس‌های لنگردار و لنگر گرفته شده را به درستی شناسایی کرد، در حالی که تنها 71 درصد موارد تأیید شده در حال انجام به‌طور دقیق به درستی شناسایی می‌شوند. کلاس لنگر 11 FP ارائه کرد، همانطور که در شکل 11 d نشان داده شده است، که به شدت با مقدار متوسطی از امتیاز F1 مرتبط بود.
به منظور تجسم اینکه مدل‌های بررسی‌شده تا چه اندازه کلاس‌ها را از نظر احتمال پیش‌بینی‌شده متمایز می‌کنند، برای هر CNN، منحنی‌های ROC مدل را با بهترین عملکرد طبقه‌بندی از بین پنج برابر در شکل 12 تجسم می‌کنیم . به طور خاص، شکل 12 a,b منحنی های ROC را برای مدل هایی با بالاترین و کمترین دقت، به ترتیب VGG16 و DenseNet201 نشان می دهد. همانطور که انتظار می رفت، منطقه تحت پوشش (AUC) توسط VGG16 بزرگتر بود زیرا این مدل قادر بود کلاس ها را با احتمال بسیار بالاتری در مقایسه با DenseNet201 متمایز کند.
الگوهای یکسانی را می توان بین مدل های مختلف برای معیارهای عملکرد خاص مشاهده کرد. با کاهش دقت کلی، دقت کلاس لنگر از روند نزولی پیروی کرد. همین رفتار در حساسیت کلاس در جریان بود. از سوی دیگر، کلاس moored مقادیر بالایی در تمام معیارهای عملکرد حتی با دقت متوسط ​​در مورد DenseNet201 به دست آورد. علاوه بر این، تمام مدل‌های CNN مقادیر بسیار دقیقی را برای کلاس‌های لنگر انداخته و در حال انجام بدون توجه به دقت ارائه کردند.
متعاقباً، برای هر CNN، از دست دادن و دقت مدل را با بهترین عملکرد طبقه‌بندی از بین پنج تا در طول آموزش آن‌ها در شکل 13 تجسم می‌کنیم . همانطور که در شکل 13 الف نشان داده شده است، VGG16 روند تمرینی نرمی را نشان داد ، که طی آن ضرر به تدریج کاهش یافت و دقت افزایش یافت. علاوه بر این، می‌توان مشاهده کرد که دقت آموزش و اعتبارسنجی تفاوت چندانی با یکدیگر نداشتند، پدیده‌ای که می‌توان آن را برای از دست دادن آموزش و اعتبارسنجی نیز مشاهده کرد که نشان می‌دهد مدل بیش از حد برازنده نبوده است. همان رفتاری که در شکل 13 نشان داده شده توسط مدل NASNetLarge ارائه شده استج. از سوی دیگر، در مورد InceptionV3 و DenseNet201، از دست دادن اعتبار آنها یا در حال افزایش یا نوسان بود، همانطور که در شکل 13 b,c نشان داده شده است، که به این معنی است که مدل ها به احتمال زیاد بیش از حد مناسب هستند. یک واقعیت جالب این است که مدل VGG16 که دارای کمترین تعداد لایه بود، عملکرد طبقه بندی بهتری را به دست آورد. این را می توان با این واقعیت توضیح داد که شبکه های عصبی با لایه های پنهان بیشتر به داده های آموزشی بیشتری نیاز دارند. بنابراین، تعداد بیشتری از نمونه‌های الگوی تحرک به عنوان ورودی در این شبکه‌ها مورد نیاز بود.
علاوه بر این، ما نتایج خود را با روش‌های دیگر برای طبقه‌بندی مسیر مقایسه کردیم، که در بررسی اخیر وانگ و همکاران نشان داده شد. [ 5]. طبقه‌بندی‌کننده‌های معروفی مانند جنگل‌های تصادفی (RF) و ماشین‌های بردار پشتیبان (SVM) با روش‌های پیشرفته برای طبقه‌بندی مسیر، بر روی ویژگی‌های استخراج‌شده از پیام‌های AIS یا نقاط داده مسیرها استفاده می‌شوند. بنابراین، سه ویژگی از مسیرها در طول هر نوع فعالیت (لنگر، پهلو گرفته، و در حال اجرا) استخراج شد: (1) سرعت متوسط ​​کشتی، (2) انحراف استاندارد سرعت آن، و (iii) فاصله هارسین. بین اولین و آخرین موقعیت کشتی این ویژگی‌ها به این دلیل انتخاب شدند که تفاوت‌های مشخصی را بین این فعالیت‌های خاص نشان دادند. یک کشتی لنگر معمولاً دارای سرعت صفر است، در حالی که یک کشتی لنگر انداخته به طور متوسط ​​به دلیل تأثیر باد و جریان های دریا با سرعت کمی بیشتر حرکت می کند. کشتی در حال حرکت سرعت بسیار بالاتری دارد و فاصله بین اولین و آخرین موقعیت در مقایسه با فاصله کشتی های لنگر انداخته یا پهلو گرفته بیشتر است. متعاقباً، این ویژگی‌های ذکر شده به دو طبقه‌بندی‌کننده، جنگل‌های تصادفی و ماشین‌های بردار پشتیبان تغذیه شدند. روش های مورد استفاده در مقایسه در زیر نشان داده شده است:
  • M1: روش یادگیری عمیق پیشنهادی این مقاله (طبقه بندی تصویر با استفاده از مدل VGG16، زیرا بهترین نتایج دقت طبقه بندی را ارائه می دهد).
  • M2: طبقه بندی جنگل های تصادفی با ویژگی های استخراج شده از پیام های AIS مسیرها.
  • M3: طبقه‌بندی‌کننده ماشین‌های بردار پشتیبان با ویژگی‌های استخراج‌شده از پیام‌های AIS مسیرها.
جدول 4 نتایج میانگین کلان اعتبارسنجی متقابل مقایسه بین رویکردهای مختلف را نشان می دهد. نتایج نشان می‌دهد که روش پیشنهادی ما (M1) از روش‌های دیگر (M2، M3) از نظر عملکرد طبقه‌بندی پیشی می‌گیرد. M1 امتیاز F1 را به دست آورد 99.32%و M2 و M3 امتیاز F1 را به دست آوردند 96.18%و 91.1%، به ترتیب.
برای ارزیابی بیشتر روش‌شناسی خود در مورد فعالیت‌های کشتی که برای مقامات دریایی بسیار اهمیت دارد، ما همان طبقه‌بندی‌کننده‌های یادگیری عمیق را که در الگوی A به کار گرفته شده بود، در مجموعه داده دوم (الگوی B) انجام دادیم، که شامل کشتی‌های ماهیگیری مشغول به ترال، لانگ لاین، پهلوگیری در بندر، یا سفر به سمت یک منطقه ماهیگیری (در حال انجام). یک کشتی ماهیگیری معمولاً در یک بندر پهلو می گیرد، سپس به سمت یک منطقه ماهیگیری حرکت می کند و در نهایت درگیر فعالیت ماهیگیری می شود. پس از پایان ماهیگیری، کشتی به بندر بازمی گردد و پهلو می گیرد. جدول 5 نتایج طبقه بندی هر مدل را برای الگوی B نشان می دهد.
همانطور که نتایج نشان می دهد، مدل VGG16 دوباره بهترین دقت طبقه بندی تقریباً 95٪ را به دست آورد و پس از آن InceptionV3 با دقت 87٪ قرار گرفت. NASNetLarge بدترین نتایج را با دقت 76 درصد نشان داد، در حالی که DenseNet201 نتایج کمی بهتر با دقت کلی 79 درصد ارائه کرد. فراخوانی (حساسیت) به ترتیب 100% و 96% برای کلاس پهلو گرفته و در حال اجرا برای VGG16 قابل مشاهده است. این عملاً به این معنی است که الگوهای تحرک کشتی پهلوگیری شده به طور دقیق در 100٪ موارد شناسایی می شوند، در حالی که الگوهای تایید شده در حال انجام تنها برای 4٪ موارد اشتباه طبقه بندی می شوند. در مقابل، ماهیگیری یک یادآوری متوسط ​​88 درصدی را ارائه کرد. علاوه بر این، VGG16 مقادیر دقت بالایی را برای ماهیگیری و لنگر انداختن و دقت متوسطی را برای در حال انجام ارائه کرد. این نشان می دهد که هیچ کلاسی وجود نداشت که به اشتباه به عنوان لنگر از کلاس دیگر طبقه بندی شده باشد، در حالی که فقط یک کلاس ماهیگیری به اشتباه به عنوان در حال انجام طبقه بندی شده است. دقت متوسط ​​در حال انجام با تعداد متوسطی از FP ها توجیه شد. در واقع، همانطور که در نشان داده شده است، چهار کلاس در حال اجرا به اشتباه به عنوان ماهیگیری طبقه بندی شدندشکل 14 a، که نشان دهنده ماتریس سردرگمی مدل VGG16 با بهترین عملکرد طبقه بندی از بین پنج برابر است. کلاس لنگرها امتیاز F1 100٪ را به دست آورد، در حالی که کلاس های باقی مانده درصد بالایی در حدود 92٪ برای ماهیگیری و 91٪ برای در حال انجام را نشان دادند.
در مدل InceptionV3، کلاس moored مقادیر بالایی برای تمام معیارهای عملکرد ارائه می‌دهد. علاوه بر این، دقت 100٪ در هر دو در حال اجرا و لنگر مشاهده شد. از سوی دیگر، دقت کلاس ماهیگیری مقدار کم 74% را نشان می دهد و با تعداد زیاد FP (در مجموع 12) توجیه می شود، همانطور که در شکل 14 ب نشان داده شده است. علاوه بر این، فراخوان کلاس در حال انجام کم بود، 58٪، و همچنین امتیاز F1، که به نوبه خود تعداد زیاد FN ها (در مجموع 11) را توجیه می کرد. طبقات دیگر مقادیر زیادی را در مورد فراخوان، 100٪ برای ماهیگیری و 97٪ برای پهلوگیری نشان دادند.
NASNetLarge و DenseNet201 شباهت های زیادی را ارائه کردند. کلاس ماهیگیری از دقت پایینی برخوردار بود، تقریباً 60٪ در هر دو مدل. شکل 14 c,d نشان می دهد که کلاس ماهیگیری به ترتیب دارای 22 و 20 مورد اشتباه طبقه بندی شده است. از سوی دیگر، مقادیر دقت بالایی برای کلاس های پهلو گرفته و در حال اجرا در هر دو مدل مشاهده شد. کلاس لنگرها مجدداً مقادیر بالایی را در تمام معیارهای عملکرد ارائه کرد. علاوه بر این، یادآوری در مورد کلاس در حال اجرا بسیار کم بود و در حدود 23 درصد در NASNetLarge و 31 درصد در DenseNet201 بود و از همان روند مدل InceptionV3 برای کلاس خاص پیروی کرد. در ترکیب با مقادیر پایین امتیاز F1، تنها تعداد کمی از کلاس‌های تایید شده به درستی شناسایی شدند.
شکل 15 منحنی های ROC را برای مدل هایی با بیشترین و کمترین دقت برای الگوی B، VGG16 در شکل 15 a و NASNetLarge در شکل 15 b نشان می دهد. برای این دو CNN، منحنی‌های ROC مدل را با بهترین عملکرد طبقه‌بندی از بین پنج برابر، تجسم کردیم.
متعاقباً، برای هر CNN، از دست دادن و دقت مدل را با بهترین عملکرد طبقه‌بندی از بین پنج لایه در طول آموزش آنها برای الگوی B، همانطور که در شکل 16 نشان داده شده است، مشاهده کردیم . همانطور که در شکل 16 الف نشان داده شده است، VGG16 روند تمرینی نرمی را برای الگوی B نشان داد، که در طی آن، از دست دادن به تدریج کاهش یافت و دقت افزایش یافت. تقریباً همان رفتار توسط مدل InceptionV3 ارائه شد، همانطور که در شکل 16 ب نشان داده شده است، به جز آخرین دوره هایی که ضرر افزایش یافته است. از سوی دیگر، در مورد NASNetLarge و DenseNet201، از دست دادن اعتبار آنها یا افزایش یا نوسان داشت، همانطور که در شکل 16 نشان داده شده است.به ترتیب c,d، به این معنی که مدل ها به احتمال زیاد بیش از حد مناسب هستند. در واقع، نرخ رشد از دست دادن اعتبار در مورد NASNetLarge بسیار بالا بود.
در نهایت، نتایج روش طبقه‌بندی خود را با رویکرد پیشنهادی در [ 10 ] برای کشتی‌های ماهیگیری (M4) مقایسه کردیم. نویسندگان در [ 10 ] از مجموعه ای از ویژگی های مناسب برای فعالیت های ماهیگیری استفاده کردند که سپس توسط جنگل های تصادفی برای طبقه بندی فعالیت های کشتی استفاده شد. علاوه بر این، ما همچنین از روش آزمایش قبلی (M2) استفاده کردیم، که از ویژگی‌هایی استفاده می‌کند که برای الگوی A مناسب بودند. مشابه مجموعه آزمایش‌های قبلی، ما فقط از مدل VGG16 استفاده کردیم زیرا بهترین دقت طبقه‌بندی کلی را ارائه می‌کرد. نتایج میانگین کلان در جدول 6 گزارش شده است. نتایج دوباره تأیید می‌کند که رویکرد پیشنهادی (M1) بسیار دقیق‌تر از مجموعه ویژگی‌هایی است که به طور خاص برای طبقه‌بندی فعالیت‌های ماهیگیری (M4) انتخاب شده‌اند. علاوه بر این، نتایج نشان می دهد که روش M2 عملکرد خوبی نداشته است (F1-score of 76.2%). این با این واقعیت توضیح داده می‌شود که ویژگی‌های مورد استفاده برای الگوی A قادر به تشخیص الگوی B نیستند. از طرف دیگر، روش پیشنهادی (M1) به دلیل این واقعیت که الگوها دارای ویژگی‌هایی بودند، توانست در هر دو مجموعه الگوها به خوبی عمل کند. تفاوت های بصری مشخص

4.3. ارزیابی جریان

در این بخش، نتایج تجربی عملکرد اجرای روش جریان پیشنهادی را ارائه می‌کنیم. برای این منظور، مجموعه‌های مختلفی از آزمایش‌ها به منظور ارزیابی برنامه‌های پخش جریانی انجام شد:
  • مقیاس پذیری،
  • توان عملیاتی،
  • تاخیر،
  • عملکرد اجرا با یک GPU
ارزیابی تجربی ارائه شده در زیر بر روی یک خوشه متشکل از چهار ماشین با چهار هسته (Intel(R) Xeon(R) CPU E5-2650 0 @ 2.00 GHz) و هر کدام 8 گیگابایت رم، مجموعاً 16 هسته و 32 گیگابایت رم انجام شد. ، اوبونتو 18.04 LTS را با پایتون 3.6 و آپاچی کافکا 2.4.0 اجرا می کند.
برای ارزیابی مقیاس پذیری رویکردمان، آزمایش هایی را با استفاده از ماشین های 1، 2، 3 و 4 به صورت تدریجی اجرا کردیم. هر دستگاه از یک ماژول پیش‌بینی استفاده کرد و اندازه پنجره و گام پنجره را به ترتیب برابر با 4 ساعت و 30 رویداد ثابت نگه داشت. همانطور که در بخش 3.4 ذکر شد ، روش جریان از یک پنجره کشویی بر روی جریان پیام های AIS برای انجام طبقه بندی استفاده کرد. اندازه پنجره 8 ساعت برای داشتن یک الگوی کامل در هر رگ کافی بود [ 10]. از آنجایی که بالاترین نرخ انتقال پروتکل AIS یک پیام در هر 2 ثانیه بود، یک مرحله پنجره از 30 رویداد یا پیام نشان می‌دهد که یک طبقه‌بندی توسط ماژول‌های پیش‌بینی در هر دقیقه آغاز می‌شود، دوره زمانی که در طی آن الگو تغییر نمی‌کند. به طور قابل ملاحظه. علاوه بر این، ما هر آزمایش را چهار بار برای ارزیابی چهار معماری مختلف CNN (VGG16، InceptionV3، DenseNet، NASNet) تکرار کردیم. شکل 17a توان عملیاتی هر معماری CNN را با تعداد متفاوتی از ماشین ها یا پارتیشن ها نشان می دهد. می‌توان مشاهده کرد که روش پیشنهادی جریان می‌تواند زمانی سودمند باشد که ماشین‌ها و ماژول‌های پیش‌بینی بیشتری بدون توجه به معماری CNN به کار گرفته شده استفاده شوند. علاوه بر این، واضح است که InceptionV3 سریع‌ترین معماری CNN بود که به حداکثر توان عملیاتی 140 رویداد در ثانیه دست یافت و از همه شرکت‌کنندگان برتری داشت. معماری بعدی CNN VGG16 با گذردهی 90 رویداد در ثانیه بود که مشابه سرعت 80 رویداد در ثانیه DenseNet است. کندترین معماری CNN NASNet بود که به حداکثر 60 رویداد در ثانیه دست یافت. عملکرد دو معماری آخر که بدترین نتایج را ارائه کردند، را می توان با این واقعیت توضیح داد که این معماری ها پیچیده تر از دو معماری قبلی هستند و از لایه های پنهان و لایه های ترکیبی بیشتری تشکیل شده اند. برای ارزیابی بیشتر توان عملیاتی روش پیشنهادی، InceptionV3 را انتخاب کردیم که سریع‌ترین معماری CNN بود و آزمایش‌هایی را با استفاده از چهار ماشین و تعداد متفاوتی از مراحل پنجره انجام دادیم.شکل 17 ب نتایج آزمایش فوق الذکر را با استفاده از مراحل پنجره ای که از 10 رویداد تا 40 رویداد را شامل می شود، به تصویر می کشد. مقدار مرحله پنجره نشان می‌دهد که طبقه‌بندی هر چند وقت یک‌بار راه‌اندازی می‌شود. بنابراین، هرچه تعداد مراحل کمتر باشد، میزان طبقه‌بندی‌هایی که راه‌اندازی می‌شوند بیشتر می‌شود و در نتیجه توان عملیاتی کمتری به همراه دارد. در واقع، این با آزمایش‌های شکل 17 ب تأیید شد، که در آن توان عملیاتی 155 رویداد در ثانیه هنگام استفاده از مرحله 40 و 57 رویداد در ثانیه در هنگام استفاده از مرحله 10 بود.
آزمایش اول، که نتایج شکل 17 a را به دست آورد، همچنین میانگین تأخیر پردازش هر معماری CNN را در شکل 18 ب ارائه کرد. تأخیر پردازش به عنوان مقدار زمان مورد نیاز CNN برای انجام طبقه بندی تصویر تعریف می شود. باز هم می توان مشاهده کرد که InceptionV3 سریع ترین معماری CNN با تأخیر پردازش 157 میلی ثانیه بود. شبکه بعدی VGG16 با تأخیر 283 میلی‌ثانیه و پس از آن DenseNet (360 میلی‌ثانیه) و NASNet (634 میلی‌ثانیه) قرار گرفتند. برای ارزیابی تأخیر تصویر، که به عنوان مدت زمان مورد نیاز برای ایجاد یک تصویر از پیام‌های AIS تعریف می‌شود، پیکربندی‌های مشابه آزمایش اول را حفظ کردیم (چهار ماشین و یک مرحله پنجره از 30 رویداد)، اما اندازه پنجره را تغییر دادیم. . شکل 18a متوسط ​​تأخیر تصویر را با اندازه پنجره 1، 2، 4 و 8 ساعت نشان می دهد. از آنجایی که یک پنجره زمانی بزرگتر حاوی پیام های AIS بیشتری است، انتظار می رود که ایجاد تصویر در تنظیمات پنجره بزرگتر بیشتر باشد. همانطور که در شکل 18 الف نشان داده شده و تأیید شده است، متوسط ​​تأخیر تصویر در یک پنجره یک ساعته 157 میلی ثانیه بود و در یک پنجره هشت ساعته، تأخیر می تواند تا 210 میلی ثانیه برسد.
برای ارزیابی بیشتر رویکردمان، نتایج تجربی را با و بدون استفاده از GPU نشان می‌دهیم. آزمایش‌های زیر که در زیر ارائه می‌شوند روی یک ماشین کالا با هشت هسته منطقی (CPU Intel(R) Core(TM) i7-7700HQ @ 2.8 گیگاهرتز)، 32 گیگابایت رم و یک پردازنده گرافیکی (NVIDIA 1050 با 4 گیگابایت VRAM) انجام شد. برای نشان دادن افزایش عملکرد توسط GPU، آزمایشی را با اندازه پنجره و مرحله 4 ساعت و 30 رویداد، به ترتیب دو بار برای هر معماری CNN، با و بدون استفاده از GPU اجرا کردیم. نتایج تجربی در شکل 19 ارائه شده است. به طور خاص، شکل 19a تأخیر تصویر و تأخیر هر معماری CNN را نشان می دهد. تأخیر تصویر در هر آزمایش تقریباً 60 میلی ثانیه بود (حداقل دو برابر سریعتر از همان آزمایش با CPU با فرکانس پایین تر در شکل 18 a). از سوی دیگر، افزایش عملکرد فوق العاده ای را می توان در تأخیر پردازش هر CNN مشاهده کرد. تأخیر پردازش VGG16، InceptionV3، DenseNet و NASNet به ترتیب 150 میلی‌ثانیه، 80 میلی‌ثانیه، 180 میلی‌ثانیه و 250 میلی‌ثانیه بدون استفاده از GPU بود، در حالی که وقتی از یک GPU استفاده می‌شد، تأخیر پردازش به 50 میلی‌ثانیه، 60 میلی‌ثانیه کاهش یافت. ms، 80 ms و 140 ms به ترتیب. همین الگو را می توان در توان عملیاتی رویکرد ما در شکل 19 نیز مشاهده کردb، جایی که توان عملیاتی هر معماری CNN افزایش یافت. یک مثال شاخص VGG16 است که در آن توان عملیاتی از 60 رویداد در ثانیه به 120 رویداد در ثانیه افزایش یافته است.
در نهایت، شایان ذکر است که تمام آزمایش‌های ارائه‌شده در این بخش، به توان عملیاتی بالاتر از نرخ انتقال پیام‌های AIS در هر گیرنده (پنج تا هشت پیام در ثانیه)، همانطور که در بخش 3.4 بیان شد، دست یافتند ، که ماژول پیش‌بینی را مناسب می‌کند. به کار گرفته شده بر اساس گیرنده زمینی.

4.4. ارزیابی فشرده سازی

به منظور ارزیابی الگوریتم های فشرده سازی مسیر، برخی از معیارهای اعتبار سنجی استفاده شد. راه حل های اصلی اعتبارسنجی شامل معیارهای عملکرد و دقت است. برای عملکرد، معیارهای زیر در نظر گرفته شد: (1) نسبت فشرده سازی و (2) زمان فشرده سازی. نسبت تراکم به نسبت نقاط باقی مانده پس از فشرده سازی ( a ) در مقایسه با نقاط اصلی ( n ) اشاره دارد که به صورت تعریف می شود. آn، در حالی که زمان فشرده سازی به کل زمان مورد نیاز برای اجرای فشرده سازی اشاره دارد. از سوی دیگر، معیارهای دقت برای اندازه گیری از دست دادن اطلاعات و در نتیجه دقت الگوریتم های فشرده سازی استفاده می شود.
در این مرحله، لازم به ذکر است که برای ارزیابی نتایج فشرده سازی، از زیر مجموعه ای از اولین مجموعه داده استفاده کردیم که در بخش 4.1 ذکر شده است . به طور خاص، این مجموعه داده‌های فرعی حاوی اطلاعاتی برای 472 کشتی منحصربه‌فرد بود که برای یک دوره سه روزه از 1 مارس 2020 تا پایان 3 مارس 2020 تحت نظارت قرار گرفتند. هدف ما انجام برخی آزمایش‌های اولیه به منظور نشان دادن تأثیر فشرده‌سازی مسیر بر روی آن بود. دقت طبقه بندی الگوهای تحرک
شکل 20 نسبت فشرده سازی بدست آمده توسط الگوریتم های مختلف را نشان می دهد. بیشترین تراکم توسط DP با نسبت 94% بدست آمد. فشرده سازی در TR کمی کمتر بود ، اما با این وجود بسیار بالا در حدود 92٪ باقی ماند. الگوریتم هایی که اطلاعات زمانی را برای تصمیم گیری در مورد حذف یا عدم کنار گذاشتن یک نقطه در نظر می گرفتند، تمایل داشتند نقاط بیشتری را در یک مسیر حفظ کنند. DP دارای بالاترین نرخ تراکم بود زیرا یک مسیر را به عنوان یک خط در فضای دو بعدی در نظر می گرفت و جنبه زمانی را در نظر نمی گرفت. نسبت تراکم در مورد SP کاهش یافت ، اما در سطح بالایی حدود 80٪ حفظ شد. HB و SP_HDکمترین میزان تراکم را به ترتیب 59% و 54% داشتند. SP_HD دو آستانه را به طور همزمان گنجانده بود و انتظار می رفت که کمترین نسبت فشرده سازی را ارائه دهد. به طور کلی، هر چه نسبت تراکم کمتر باشد، نقاط بیشتری در مجموعه حاصل گنجانده می شود.
علاوه بر نسبت تراکم، ارزیابی زمان اجرای هر الگوریتم مهم است زیرا شاخص مهمی برای اندازه‌گیری کارایی است. شکل 21 زمان اجرای همه الگوریتم ها را نشان می دهد. DP و TR کمترین اجرا را در بین همه الگوریتم ها ارائه کردند. با این حال، فشرده سازی بالاترین نرخ را برای این الگوریتم ها ارائه می دهد. در واقع، DP تنها در 180 ثانیه، تقریباً چهار برابر سریعتر از TR اجرا شد. SP زمان قابل توجهی بیشتر از DP و TR صرف کرد. به طور خاص، SP 27 و هفت برابر کندتر از DP و TR بود، به ترتیب. زمان اجرای HD و SP_HD بسیار بالا بود، بیش از دو ساعت برای هر دو الگوریتم. همانطور که انتظار می رفت، SP_HD بدترین عملکرد را به دلیل پیچیدگی نمایی داشت.
همانطور که در بخش 3.5 بیان شد ، الگوریتم های بررسی شده دارای تلفات هستند، به این معنی که آنها مقداری از دست دادن اطلاعات را ارائه می دهند زیرا داده های فشرده نمی توانند دقیقاً بازیابی یا بازسازی شوند [ 83 ]. بنابراین، اندازه گیری عملکرد فشرده سازی با ارزیابی کیفیت داده های فشرده مهم است. تکنیک‌های موجود، الگوریتم‌های فشرده‌سازی مسیر را با استفاده از معیارهای خطای مختلف مانند فاصله مکانی، فاصله اقلیدسی هماهنگ، نسبت فاصله زمانی، سرعت، سمت، شتاب، و ناحیه محصور ارزیابی می‌کنند. موکل و همکاران [ 77 ] میانگین SED و خطای میانگین سرعت را به کار گرفت، در حالی که در [ 75 ]، همان معیارها با اضافه کردن خطای عنوان اعمال شد. علاوه بر این، از سه معیار ارزیابی در [84 ]، میانگین SED، خطای مکانی و سرعت، در حالی که لیو و همکاران. [ 85 ] چندین الگوریتم فشرده سازی را از طریق میانگین PD، SED و ناحیه محصور ارزیابی کرد. علاوه بر این، در [ 80 ]، خطا با فرمولی ارائه شد که میانگین خطای فاصله بین مسیر اصلی و فشرده را اندازه‌گیری کرد.
از آنجایی که بین نسبت فشرده سازی به دست آمده و خطای قابل قبول یک مبادله وجود دارد، اثربخشی الگوریتم های فشرده سازی مسیر بر حسب کیفیت “اطلاعات” به دست آمده پس از فشرده سازی با استفاده از یادگیری عمیق ارزیابی شد. یادگیری عمیق بر روی داده های مسیر فشرده به منظور ارزیابی دقت آنها اعمال شد. تا جایی که ما می دانیم، این اولین کار تحقیقاتی است که تاثیر تکنیک های فشرده سازی مسیر را بر طبقه بندی الگوی تحرک کشتی از طریق شبکه های عصبی بررسی و ارزیابی کرده است.
هر کشتی منحصربه‌فرد درون مجموعه داده‌های فرعی مورد بررسی شامل تعداد متفاوتی از نقاط اولیه بود که از یک تا 25000 متغیر بود. به منظور ارزیابی نتایج فشرده سازی، چهل و هفت کشتی منحصر به فرد (10٪) از مجموع 472 از توزیع نرمال نقاط در هر ظرف انتخاب شدند. سپس، مسیرهای فرعی این کشتی‌های مختلف استخراج و به‌عنوان تصاویر مسیر، همانطور که در بخش 3.2 توضیح داده شد ، برای داده‌های اصلی (غیر فشرده) و فشرده‌سازی شده، مشاهده شد. در نهایت، ما طبقه‌بندی الگوی کشتی را در هر دو داده مسیر (فشرده و غیرفشرده)، با استفاده از مدل VGG16 انجام دادیم، زیرا بالاترین دقت را به دست آورد. جدول 7 درصد را نشان می دهد مترnالگوهای تحرک به درستی طبقه بندی شده استخراج شده از تصاویر زیر مسیرها برای هر الگوریتم فشرده سازی ( m ) در مقایسه با تعداد کل الگوهای تحرک بررسی شده ( n ). در واقع، هر چه این درصد بیشتر باشد، کیفیت داده های به دست آمده پس از فشرده سازی بهتر است.
نتایج نشان می دهد که دقت به شدت با نسبت تراکم مرتبط است. DP بالاترین فشرده سازی را ارائه کرد، اما بدترین دقت را نشان داد، حدود 65%. به طور مشابه، TR به فشرده سازی بسیار بالایی دست یافت، اما دقت پایین (69٪)، کمی بهتر از DP بود. SP نه بدترین و نه بهترین نتایج را داشت و دقت متوسط ​​74 درصد را ارائه کرد. با این وجود، فشرده سازی به دست آمده در مورد SP 12٪ کمتر از TR بود، در حالی که دقت بین این الگوریتم ها تنها 5٪ متفاوت بود. HDبالاترین دقت را به دست آورد زیرا به درستی طبقه بندی شده ترین الگوهای کشتی را از تصاویر زیر مسیر با نسبت 93٪ ارائه کرد. دقت برای SP_HD کمی کمتر بود ، اما با این وجود در حدود 86 درصد بالا باقی ماند. فشرده سازی به دست آمده در مورد HD و SP_HD به طور قابل توجهی در مقایسه با الگوریتم های دیگر کمتر بود، اما با دقت بسیار بالایی به خصوص در مورد HD همراه بود.

5. بحث

کار پیشنهادی یک رویکرد جدید برای طبقه‌بندی مسیرها در زمان واقعی ارائه می‌کند، وظیفه‌ای که در نظارت بر کشتی‌ها در حوزه دریایی از اهمیت بالایی برخوردار است. تازگی رویکرد ما در این واقعیت نهفته است که مسیرها به یک فرمت عادی سازی فضایی شبیه به یک تصویر تبدیل شدند، که سپس توسط یک شبکه عصبی کانولوشن طبقه بندی شدند، روشی که تا آنجا که دانش ما مطالعه محدودی در ادبیات داشته است. این ادغام زمینه‌های طبقه‌بندی مسیر و بینایی کامپیوتری می‌تواند نتایج قابل مقایسه یا حتی بهتر از پیشرفته‌ترین را ارائه دهد (به بخش 4.2 مراجعه کنید ).
تکنیک‌های طبقه‌بندی ممکن است شامل تعدادی مراحل پیش پردازش به منظور ایجاد یک طبقه‌بندی کننده باشد که نتایج بهینه را به همراه داشته باشد. در ابتدا، تجزیه و تحلیل کامل داده ها و تمیز کردن معمولا انجام می شود. سپس، یک تکنیک خوشه بندی ممکن است به کار گرفته شود، که اغلب به شکلی از پارامترهای تعریف شده توسط کاربر برای گروه بندی مسیرهای مشابه با هم نیاز دارد. پس از آن، انتخاب دقیق و تجزیه و تحلیل ویژگی های بهینه برای برچسب یا برچسب هایی که باید شناسایی شوند، دنبال شد. در نهایت، تجزیه و تحلیل و انتخاب چندین طبقه‌بندی کننده برای دستیابی به نتایج با دقت بالا انجام شد [ 5]. بنابراین، فرآیند کلی انتخاب ویژگی و طبقه بندی کار آسانی نیست. این مشکل در یافتن بهترین طبقه‌بندی را می‌توان در الگوهای ماهیگیری مشاهده کرد که کشتی‌ها رفتار مشابهی دارند. بنابراین، ویژگی‌ها و طبقه‌بندی‌کننده‌های متفاوتی باید برای هر الگو به کار گرفته شوند [ 14 ، 15 ]. اگرچه الگوهای حرکتی می توانند مشابه باشند (به عنوان مثال، الگوهای ماهیگیری از نظر سرعت و فرکانس چرخش رفتارهای مشابهی دارند [ 10 ، 14 ])، از نظر بصری متفاوت هستند ( شکل 1 را ببینید).د، ه). این تفاوت بصری متمایز الگوهای تحرک توسط تکنیک های بینایی کامپیوتری برای طبقه بندی آنها استفاده می شود. مزیت اصلی طبقه بندی تصویر برای الگوهای تحرک نسبت به سایر تکنیک ها (1) کاهش پیچیدگی مراحل فوق الذکر، (2) حذف پارامترهای تعریف شده توسط کاربر، و (3) تفاوت بصری متمایز الگوهای تحرک است. اگرچه نمی توان از فرآیند پاکسازی داده ها اجتناب کرد، انتخاب پارامتر، انتخاب ویژگی، تجزیه و تحلیل و جستجوی طبقه بندی کننده بهینه را می توان به طور کامل نادیده گرفت. برای طبقه‌بندی یک تصویر، فقط یک طبقه‌بندی کننده (مثلاً CNN) مورد نیاز است، چه این تصویر یک الگوی ماهیگیری را نشان دهد یا یک الگوی جستجو و نجات (SAR).
به دلیل شباهت الگوهای ماهیگیری (ترال، لانگ لاین، کیف پولکی)، سوزا و همکاران. [ 14 ] یک طرح طبقه‌بندی متفاوت برای هر الگو (سه طبقه‌بندی کننده با سه مجموعه از ویژگی‌های مختلف) پیشنهاد کرد، و به یک امتیاز F1 دست یافت. 97%. هر طبقه‌بندی کننده برای شناسایی مسیرهای بین ماهیگیری یا در حال انجام، که در آن ماهیگیری با فعالیت ماهیگیری نوع کشتی مربوطه مطابقت دارد، آموزش داده شد. این عملکرد طبقه‌بندی با عملکرد روش پیشنهادی (≈95٪) قابل مقایسه بود که از یک شبکه عصبی کانولوشن برای طبقه‌بندی چهار الگو در کل (الگوی A و B) استفاده می‌کرد. نویسندگان در [ 10 ] مجموعه‌ای از ویژگی‌هایی را ارائه کردند که می‌توان آن‌ها را در زمان واقعی استخراج کرد و همان فعالیت‌های ماهیگیری را که این کار انجام داد طبقه‌بندی کرد و به عملکرد طبقه‌بندی پایین‌تری دست یافت. 87%). نقطه ضعف اصلی این است که از این ویژگی ها نمی توان برای طبقه بندی الگوهای حرکتی دیگر استفاده کرد و آنها فقط برای الگوهای ماهیگیری در مطالعه مناسب هستند. کاپادایس و همکاران [ 2 ] یک تکنیک طبقه‌بندی شکل‌های سری زمانی را برای شناسایی الگوهای SAR پیشنهاد کرد. اشکال اصلی در چنین تکنیک هایی این است که آنها نیاز دارند که داده ها در فواصل زمانی ثابت در دسترس باشند (به عنوان مثال، ساعتی، هفتگی، ماهانه، سالانه)، مشخصه ای که در پیام های AIS وجود ندارد (به بخش 4.1 مراجعه کنید ). بنابراین، باید تکنیک‌هایی ابداع شود که بتواند شکاف‌ها را پر کند یا نقاط داده را حذف کند تا یک سری زمانی مناسب برای طبقه‌بندی ایجاد شود، مشکلی که با رویکرد پیشنهادی ما می‌توان از آن اجتناب کرد.
در مقایسه با چن و همکاران. [ 48 ] ​​که در آن نویسندگان مسیرهای AIS را به یک ساختار مسیر مبتنی بر تحرک (MB) تبدیل کردند که شبیه یک تصویر با وضوح پایین بود، رویکرد ما می‌تواند تصاویری با وضوح بالا ایجاد کند که می‌توانند رفتار یک مسیر را به طور کامل ثبت کنند. از آنجایی که فضای نظارت در [ 48 ] به سلول‌های بزرگ تقسیم شده بود، مواردی که کشتی‌ها حرکات میکرو را انجام می‌دهند که در نهایت الگوی تحرک متفاوتی مانند فعالیت‌های ماهیگیری را تشکیل می‌دهند، به اشتباه طبقه‌بندی می‌شوند. هدف نویسندگان [ 48 ] طبقه‌بندی حالت حمل و نقل (به عنوان مثال، حمل بار، تانکر، یدک‌کشی یا ماهیگیری) سفرهای کشتی هنگام سفر از بندر مبدا به بندر مقصد بود و به امتیاز F1 رسید. 84.7%. یک رویکرد مشابه در [ 50 ] برای طبقه‌بندی حالت حمل‌ونقل غیرنظامیان (به عنوان مثال، پیاده‌روی، دوچرخه، اتوبوس، تاکسی)، با دستیابی به حداکثر دقت به کار گرفته شد.83.2%.
علیرغم اینکه چندین روش طبقه بندی در ادبیات ارائه شده است، هر یک دارای محدودیت ها و معایب احتمالی خود هستند. به طور مشابه، اگرچه روش پیشنهادی با اکثر مسائل موجود در ادبیات قبلی مقابله می‌کند، می‌توان مشاهده کرد که یک مشکل شروع سرد وجود دارد. این بدان معناست که رویکرد پیشنهادی تنها زمانی می‌تواند فعالیت‌های کشتی را به‌طور دقیق طبقه‌بندی کند که پیام‌های AIS کافی برای یک دوره زمانی از پیش تعریف‌شده (مثلاً پنجره زمانی چهار ساعته) جمع‌آوری شده باشد و نه زمانی که کشتی برای اولین بار در منطقه نظارت ظاهر می‌شود. علاوه بر این، شبکه های عصبی عمیق از نظر محاسباتی گران هستند، نه تنها در طول فرآیند آموزش، بلکه در فرآیند طبقه بندی نیز. از نتایج تجربی، می توان مشاهده کرد که حداکثر توان خروجی برای داده های منشاء از یک گیرنده AIS منفرد تقریباً 155 رویداد در ثانیه بدون GPU بود. در مقیاس جهانی که فرکانس می تواند به 16000 رویداد در ثانیه برسد، یک خوشه بزرگ برای کنترل حجم و سرعت داده ها مورد نیاز است. بنابراین، راه حل برای رسیدگی به جریان های فرکانس بالا و حجم بالا داده های AIS، استقرار یک ماژول پیش بینی است (نگاه کنید بهبخش 3.4 ) در هر گیرنده AIS، بنابراین یک شبکه توزیع شده جهانی از ماژول های پیش بینی ایجاد می کند.

6. نتیجه گیری و کار آینده

در این کار، ما یک رویکرد طبقه‌بندی مسیر جدید و با دقت بالا را بر روی جریان‌های پیام‌های AIS ارائه کردیم. هدف روش شناسی ما ارائه یک روش کارآمد و جایگزین برای درمان مشکل طبقه بندی فعالیت کشتی جریان به عنوان یک کار طبقه بندی تصویر با استفاده از الگوریتم های پیشرفته یادگیری عمیق و ایجاد یک رویکرد جهانی برای طبقه بندی فعالیت های کشتی بود. . این رویکرد جهانی را می توان از طریق تفاوت بصری مشخصی که اکثر الگوهای تحرک، اگر نه همه، در حوزه دریایی دارند، به دست آورد. بنابراین می توان از یک طبقه بندی مشترک برای همه الگوها پس از تبدیل آنها به تصویر استفاده کرد.
برای نشان دادن کاربرد کار ما در شرایط دنیای واقعی، از دو مجموعه داده دنیای واقعی از پیام‌های AIS استفاده شد، یکی از یک گیرنده زمینی و ردیابی کشتی نصب شده در محل ما و دیگری استخراج شده از پایگاه داده MarineTraffic. از آنجایی که رویکردهای یادگیری عمیق به مقدار زیادی داده برای انجام یک طبقه بندی دقیق نیاز دارند، یادگیری انتقالی به کار گرفته شد. ارزیابی تجربی نشان داد که رویکرد پیشنهادی به دقت طبقه‌بندی پیشرفته دست یافته است. رویکرد پیشنهادی در مجموع بر روی پنج الگوی تحرک حوزه دریایی، یعنی لنگر انداخته، پهلو گرفته، در حال حرکت، ترالینگ و لانگ لاین ارزیابی شد. عملکرد طبقه‌بندی به‌دست‌آمده برای همه مدل‌های CNN در اولین مجموعه داده (الگوی A) از 89٪ فراتر رفت، با VGG16 که بهترین دقت 99٪ را ارائه داد. به منظور ارزیابی روش در یک مورد استفاده در دنیای واقعی مورد علاقه، ما عملکرد طبقه‌بندی آن را در چهار الگوی تحرک کشتی‌های ماهیگیری نشان دادیم: ترال، لانگ لاین، پهلوگیری و در حال حرکت. مدل VGG16 دوباره بهترین نتایج طبقه بندی را با دقت 95 درصد ارائه کرد.
آزمایش‌های مقیاس‌پذیری نشان داد که روش پیشنهادی می‌تواند با نرخ رویداد جریان‌های دنیای واقعی پیام‌های AIS سروکار داشته باشد و می‌تواند تا چندین ماشین مقیاس‌بندی شود، که امکان اجرای تقریباً زمان واقعی را فراهم می‌کند. InceptionV3 به حداکثر توان عملیاتی 140 رویداد در ثانیه دست یافت که از همه شرکت کنندگان خود بهتر عمل کرد و پس از آن VGG16 با توان عملیاتی 90 رویداد در ثانیه قرار گرفت. با توجه به تأخیر، InceptionV3 دوباره سریع‌ترین معماری CNN با تأخیر پردازش 157 میلی‌ثانیه و پس از آن تأخیر VGG16 283 میلی‌ثانیه بود. علاوه بر این، برتری GPU در مقابل CPU از طریق آزمایش‌هایی در مورد توان عملیاتی و تأخیر تأیید شد.
آزمایش‌های اولیه با الگوریتم‌های فشرده‌سازی نشان داد که جریان‌های پیام‌های AIS می‌توانند بیش از 50%تعداد پیام های اصلی با تأثیر نسبتاً کم بر عملکرد طبقه بندی. الگوریتم فشرده سازی مبتنی بر عنوان بهترین نسبت فشرده سازی را به دست آورد، در حالی که دقت در سطح نسبتاً بالایی باقی ماند. تنها 7 درصد موارد به اشتباه طبقه بندی شده بودند.
به عنوان کار آینده، ما قصد داریم تصاویر بیشتری را برای بهبود عملکرد شبکه‌های عصبی عمیق و شناسایی الگوهای تحرک کشتی بیشتر جمع‌آوری کنیم تا مدل‌های یادگیری عمیق خود را با برچسب‌های بیشتر غنی کنیم. در نهایت، الگوریتم‌های فشرده‌سازی آنلاین برای کاهش تأخیر سیستم توسعه و ارزیابی خواهند شد.

منابع

  1. لی، جی. هان، جی. لی، ایکس. Gonzalez, H. TraClass : طبقه‌بندی مسیر با استفاده از خوشه‌بندی مبتنی بر منطقه سلسله مراتبی و مبتنی بر مسیر. Proc. VLDB Enddow. 2008 ، 1 ، 1081-1094. [ Google Scholar ] [ CrossRef ]
  2. کاپادایس، ک. وارلامیس، آی. ساردیانوس، سی. Tserpes، K. چارچوبی برای تشخیص الگوهای جستجو و نجات با استفاده از طبقه‌بندی Shapelet. اینترنت آینده 2019 ، 11 ، 192. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  3. مازارلا، اف. وسپه، م. دامالاس، دی. Osio, G. کشف فعالیت های کشتی در دریا با استفاده از داده های AIS: نقشه برداری از ردپای ماهیگیری. در مجموعه مقالات هفدهمین کنفرانس بین المللی در همجوشی اطلاعات، FUSION 2014، سالامانکا، اسپانیا، 7-10 ژوئیه 2014. صص 1-7. [ Google Scholar ]
  4. داسیلوا، CL; پتری، LM; Bogorny, V. بررسی و مقایسه روش های طبقه بندی مسیر. در مجموعه مقالات هشتمین کنفرانس برزیل در سیستم های هوشمند (BRACIS) 2019، سالوادور، برزیل، 15 تا 18 اکتبر 2019؛ صص 788-793. [ Google Scholar ]
  5. وانگ، دی. میوا، تی. موریکاوا، تی. داده کاوی مسیر بزرگ: بررسی روش ها، کاربردها و خدمات. Sensors 2020 , 20 , 4571. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  6. باچار، م. الیملک، جی. گات، آی. سوبول، جی. ریوتی، ن. Gal، A. Venilia، یادگیری آنلاین و پیش‌بینی مقصد کشتی. در مجموعه مقالات دوازدهمین کنفرانس بین المللی ACM در مورد سیستم های توزیع شده و مبتنی بر رویداد، DEBS 2018، همیلتون، نیوزیلند، 25-29 ژوئن 2018؛ Hinze, A., Eyers, DM, Hirzel, M., Weidlich, M., Bhowmik, S., Eds.; ACM: نیویورک، نیویورک، ایالات متحده آمریکا، 2018؛ ص 209-212. [ Google Scholar ] [ CrossRef ]
  7. بودونوف، او. اشمیت، اف. مارتین، ای. بریتو، ا. Fetzer، C. مقصد بلادرنگ و پیش‌بینی ETA برای ترافیک دریایی. در مجموعه مقالات دوازدهمین کنفرانس بین المللی ACM در مورد سیستم های توزیع شده و مبتنی بر رویداد، DEBS 2018، همیلتون، نیوزیلند، 25-29 ژوئن 2018؛ Hinze, A., Eyers, DM, Hirzel, M., Weidlich, M., Bhowmik, S., Eds.; ACM: نیویورک، نیویورک، ایالات متحده آمریکا، 2018؛ ص 198-201. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  8. کونتوپولوس، آی. اسپیلیوپولوس، جی. زیسیس، دی. Chatzikokolakis، K. Artikis، A. مقابله با مسمومیت جریان بلادرنگ: معماری برای تشخیص جعل کشتی در جریان داده های AIS. در مجموعه مقالات شانزدهمین کنفرانس بین المللی IEEE 2018 در مورد محاسبات قابل اعتماد، خودمختار و ایمن، شانزدهمین کنفرانس بین المللی در مورد هوش فراگیر و محاسبات، چهارمین کنفرانس بین المللی در مورد هوش و محاسبات کلان داده ها و کنگره علوم و فناوری سایبری، DASC/PiCome/PiComy/DASC/PiCome20 ، آتن، یونان، 12–15 اوت 2018؛ انجمن کامپیوتر IEEE: واشنگتن، دی سی، ایالات متحده آمریکا، 2018؛ ص 981-986. [ Google Scholar ]
  9. کونتوپولوس، آی. Chatzikokolakis، K. زیسیس، دی. تسرپس، ک. Spiliopoulos، G. تشخیص ناهنجاری دریایی در زمان واقعی: تشخیص خاموش شدن عمدی AIS. بین المللی J. هوش کلان داده. 2020 ، 7 ، 85-96. [ Google Scholar ] [ CrossRef ]
  10. کونتوپولوس، آی. Chatzikokolakis، K. تسرپس، ک. Zissis، D. طبقه بندی فعالیت کشتی در جریان داده ها. در مجموعه مقالات DEBS ’20: چهاردهمین کنفرانس بین المللی ACM در مورد سیستم های توزیع شده و مبتنی بر رویداد، مونترال، QC، کانادا، 13 تا 17 ژوئیه 2020؛ Gascon-Samson, J., Zhang, K., Daudjee, K., Kemme, B., Eds. ACM: نیویورک، نیویورک، ایالات متحده آمریکا، 2020؛ صص 153-164. [ Google Scholar ] [ CrossRef ]
  11. روات، دبلیو. وانگ، زی. شبکه‌های عصبی کانولوشنال عمیق برای طبقه‌بندی تصویر: بررسی جامع. محاسبات عصبی 2017 ، 29 ، 2352-2449. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  12. ژونگ، اس. لیو، ی. لیو، ی. یادگیری عمیق دوخطی برای طبقه بندی تصاویر. در مجموعه مقالات نوزدهمین کنفرانس بین المللی ACM در چند رسانه ای، اسکاتسدیل، AZ، ​​ایالات متحده، 28 نوامبر تا 1 دسامبر 2011. صص 343-352. [ Google Scholar ] [ CrossRef ]
  13. وو، جی. یو، ی. هوانگ، سی. یو، ک. یادگیری چند نمونه عمیق برای طبقه بندی تصویر و حاشیه نویسی خودکار. در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو، بوستون، MA، ایالات متحده آمریکا، 7 تا 12 ژوئن 2015. صص 3460–3469. [ Google Scholar ] [ CrossRef ]
  14. سوزا، ای. بوئردر، ک. Worm, B. بهبود تشخیص الگوی ماهیگیری از AIS ماهواره ای با استفاده از داده کاوی و یادگیری ماشین. PLoS ONE 2016 , 11 , e0158248. [ Google Scholar ] [ CrossRef ]
  15. جیانگ، ایکس. نقره، DL; هو، بی. د سوزا، EN; متوین، اس. تشخیص فعالیت ماهیگیری از داده های AIS با استفاده از رمزگذارهای خودکار. In Advances in Artificial Intelligence — بیست و نهمین کنفرانس کانادایی در زمینه هوش مصنوعی، هوش مصنوعی کانادا 2016، ویکتوریا، BC، کانادا، 31 مه تا 3 ژوئن 2016 ؛ خوری، ر.، دراموند، سی.، ویرایش. Springer: برلین/هایدلبرگ، آلمان، 2016; جلد 9673، ص 33–39. [ Google Scholar ] [ CrossRef ]
  16. سیمونیان، ک. زیسرمن، الف. شبکه های پیچیده بسیار عمیق برای تشخیص تصویر در مقیاس بزرگ. در مجموعه مقالات سومین کنفرانس بین‌المللی بازنمایی‌های یادگیری، ICLR 2015، سن دیگو، کالیفرنیا، ایالات متحده آمریکا، 7 تا 9 مه 2015. [ Google Scholar ]
  17. سگدی، سی. ونهوک، وی. آیوف، اس. شلنز، جی. Wojna, Z. بازاندیشی در معماری آغازین برای بینایی کامپیوتر. در مجموعه مقالات کنفرانس IEEE 2016 در مورد بینایی کامپیوتری و تشخیص الگو، CVPR 2016، لاس وگاس، NV، ایالات متحده آمریکا، 27 تا 30 ژوئن 2016؛ ص 2818-2826. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  18. زوف، بی. واسودوان، وی. شلنز، جی. Le, QV Learning Architectures Transferable for Scalable Image Recognition. در مجموعه مقالات کنفرانس IEEE 2018 در مورد دید رایانه و تشخیص الگو، CVPR 2018، سالت لیک سیتی، UT، ایالات متحده آمریکا، 18 تا 22 ژوئن 2018؛ صص 8697-8710. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  19. هوانگ، جی. لیو، ز. ون در ماتن، ال. واینبرگر، شبکه‌های کانولوشن با اتصال متراکم KQ. در مجموعه مقالات کنفرانس IEEE 2017 در مورد دید رایانه و تشخیص الگو، CVPR 2017، هونولولو، HI، ایالات متحده آمریکا، 21 تا 26 ژوئیه 2017؛ ص 2261-2269. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  20. آنکرست، م. برونیگ، MM; کریگل، اچ پی؛ Sander, J. OPTICS: نقاط ترتیب برای شناسایی ساختار خوشه بندی. ACM Sigmod Rec. 1999 ، 28 ، 49-60. [ Google Scholar ] [ CrossRef ]
  21. لی، جی. هان، جی. Whang، K. خوشه‌بندی مسیر: یک چارچوب پارتیشن و گروهی. در مجموعه مقالات کنفرانس بین المللی ACM SIGMOD در مدیریت داده ها، پکن، چین، 12 تا 14 ژوئن 2007. صص 593-604. [ Google Scholar ] [ CrossRef ]
  22. کونتوپولوس، آی. وارلامیس، آی. Tserpes، K. چارچوب توزیع شده برای استخراج الگوهای ترافیک دریایی. بین المللی جی. جئوگر. Inf. علمی 2020 ، 1–26. [ Google Scholar ] [ CrossRef ]
  23. Vouros، GA; ولاچو، ع. Santipantakis، جنرال موتورز; دولکریدیس، سی. پلکیس، ن. جورجیو، HV; تئودوریدیس، ی. پاترومپاس، ک. Alevizos، E. آرتیکیس، ا. و همکاران تجزیه و تحلیل داده های بزرگ برای پیش بینی تحرک حیاتی زمان: پیشرفت اخیر و چالش های تحقیقاتی. در مجموعه مقالات بیست و یکمین کنفرانس بین المللی گسترش فناوری پایگاه داده، EDBT 2018، وین، اتریش، 26 تا 29 مارس 2018؛ صص 612-623. [ Google Scholar ] [ CrossRef ]
  24. چویسی، بی. Kiattisin، S. شناسایی رفتار شناورهای ماهیگیری برای مبارزه با ماهیگیری IUU: فعال کردن قابلیت ردیابی در دریا. سیم. پارس اشتراک. 2020 ، 115 ، 2971-2993. [ Google Scholar ] [ CrossRef ]
  25. ساینی، ر. روی، پی. Dogra, D. یک طبقه‌بندی مسیر مبتنی بر HMM با استفاده از الگوریتم ژنتیک. سیستم خبره Appl. 2017 ، 93 ، 169-181. [ Google Scholar ] [ CrossRef ]
  26. وانگ، ایکس. ما، KT; Ng، GW; گریمسون، تحلیل مسیر WEL و مدل‌سازی ناحیه معنایی با استفاده از مدل بیزی ناپارامتریک. در مجموعه مقالات کنفرانس IEEE Computer Society در سال 2008 در مورد دید رایانه و تشخیص الگو (CVPR 2008)، Anchorage، AK، ایالات متحده آمریکا، 24-26 ژوئن 2008. [ Google Scholar ] [ CrossRef ]
  27. هو، دبلیو. لی، ایکس. تیان، جی. Maybank، SJ; Zhang, Z. یک روش افزایشی مبتنی بر DPMM برای خوشه‌بندی مسیر، مدل‌سازی و بازیابی. IEEE Trans. الگوی مقعدی ماخ هوشمند 2013 ، 35 ، 1051-1065. [ Google Scholar ] [ PubMed ]
  28. جیانگ، ایکس. د سوزا، EN; پسرانقادر، ع. هو، بی. نقره، DL; Matwin, S. Trajectorynet: یک نمایش مسیر GPS تعبیه شده برای طبقه بندی مبتنی بر نقطه با استفاده از شبکه های عصبی مکرر. در مجموعه مقالات بیست و هفتمین کنفرانس بین المللی سالانه علوم کامپیوتر و مهندسی نرم افزار، مارکهام، ON، کانادا، 6 تا 8 نوامبر 2017؛ صص 192-200. [ Google Scholar ]
  29. ژانگ، آر. زی، پی. وانگ، سی. لیو، جی. Wan, S. طبقه بندی حالت و سرعت حمل و نقل از داده های مسیر از طریق یادگیری عمیق چند مقیاسی. محاسبه کنید. شبکه 2019 ، 162 ، 106861. [ Google Scholar ] [ CrossRef ]
  30. جیانگ، ایکس. لیو، ایکس. د سوزا، EN; هو، بی. نقره، DL; Matwin, S. بهبود طبقه‌بندی مسیر AIS مبتنی بر نقطه با واحدهای بازگشتی دروازه‌دار پارتیشن. در مجموعه مقالات کنفرانس مشترک بین المللی 2017 در مورد شبکه های عصبی (IJCNN)، انکوریج، AK، ایالات متحده آمریکا، 14-19 مه 2017؛ صفحات 4044-4051. [ Google Scholar ]
  31. لین، سی ایکس؛ هوانگ، TW; گوا، جی. Wong، MDF MtDetector: یک آشکارساز ترافیک دریایی با کارایی بالا در مقیاس جریان. در مجموعه مقالات دوازدهمین کنفرانس بین المللی ACM در مورد سیستم های توزیع شده و مبتنی بر رویداد، DEBS’18، همیلتون، نیوزیلند، 25 تا 29 ژوئن 2018؛ انجمن ماشین‌های محاسباتی: نیویورک، نیویورک، ایالات متحده آمریکا، 2018؛ ص 205-208. [ Google Scholar ] [ CrossRef ]
  32. Chatzikokolakis، K. زیسیس، دی. ووداس، م. اسپیلیوپولوس، جی. Kontopoulos، I. یک سرویس تشخیص ناهنجاری دریایی با رعد و برق توزیع شده. در مجموعه مقالات OCENS 2019، مارسی، فرانسه، 17 تا 20 ژوئن 2019؛ صص 1-8. [ Google Scholar ] [ CrossRef ]
  33. بویاروف، آ. Tyantov، E. تشخیص نقطه عطف در مقیاس بزرگ از طریق یادگیری عمیق متریک. در مجموعه مقالات بیست و هشتمین کنفرانس بین المللی ACM در مدیریت اطلاعات و دانش، تورین، ایتالیا، 22 تا 26 اکتبر 2019؛ صص 169-178. [ Google Scholar ]
  34. شن، دی. وو، جی. Suk, HI یادگیری عمیق در تجزیه و تحلیل تصویر پزشکی. آنو. کشیش بیومد. مهندس 2017 ، 19 ، 221-248. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  35. کریژفسکی، آ. سوتسکور، آی. هینتون، GE Imagenet طبقه بندی با شبکه های عصبی کانولوشن عمیق. در مجموعه مقالات پیشرفت‌ها در سیستم‌های پردازش اطلاعات عصبی، دریاچه تاهو، NV، ایالات متحده، 3-6 دسامبر 2012. ص 1097-1105. [ Google Scholar ]
  36. مکریس، ع. کونتوپولوس، آی. Tserpes، K. COVID-19 تشخیص از تصاویر اشعه ایکس قفسه سینه با استفاده از یادگیری عمیق و شبکه های عصبی کانولوشنال. در مجموعه مقالات یازدهمین کنفرانس یونانی هوش مصنوعی، آتن، یونان، 2 تا 4 سپتامبر 2020؛ صص 60-66. [ Google Scholar ]
  37. لیو، اس. لیو، اس. کای، دبلیو. پوژول، اس. کیکینیس، آر. Feng, D. تشخیص زودهنگام بیماری آلزایمر با یادگیری عمیق. در مجموعه مقالات یازدهمین سمپوزیوم بین المللی IEEE در تصویربرداری زیست پزشکی (ISBI) 2014، پکن، چین، 29 آوریل تا 2 می 2014. ص 1015–1018. [ Google Scholar ]
  38. وانگ، دی. خسلا، ع. گرگیا، ر. ارشاد، ح. Beck, AH یادگیری عمیق برای شناسایی سرطان سینه متاستاتیک. arXiv 2016 , arXiv:1606.05718. [ Google Scholar ]
  39. هو، TKK; گواک، جی. پراکاش، او. آهنگ، جی. پارک، CM با استفاده از مدل‌های آموزش عمیق از پیش آموزش دیده برای تشخیص خودکار سل ریوی با استفاده از رادیوگرافی قفسه سینه. در مجموعه مقالات کنفرانس آسیایی اطلاعات هوشمند و سیستم های پایگاه داده، یوگیاکارتا، اندونزی، 8 تا 11 آوریل 2019؛ صص 395-403. [ Google Scholar ]
  40. لکون، ی. بوتو، ال. بنژیو، ی. هافنر، پی. یادگیری مبتنی بر گرادیان برای شناسایی اسناد به کار می رود. Proc. IEEE 1998 ، 86 ، 2278-2324. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  41. کریژفسکی، آ. سوتسکور، آی. هینتون، GE ImageNet طبقه بندی با شبکه های عصبی پیچیده عمیق. اشتراک. ACM 2017 ، 60 ، 84–90. [ Google Scholar ] [ CrossRef ]
  42. نیر، وی. واحدهای خطی Hinton، GE Rectified ماشین‌های بولتزمن محدود را بهبود می‌بخشند. در مجموعه مقالات بیست و هفتمین کنفرانس بین المللی یادگیری ماشین (ICML-10)، حیفا، اسرائیل، 21 تا 24 ژوئن 2010. ص 807-814. [ Google Scholar ]
  43. سگدی، سی. لیو، دبلیو. جیا، ی. سرمانت، پ. رید، اس. آنگلوف، دی. ایرهان، د. ونهوک، وی. رابینوویچ، الف. با پیچیدگی ها عمیق تر می رویم. در مجموعه مقالات کنفرانس IEEE 2015 در مورد بینایی کامپیوتری و تشخیص الگو (CVPR)، بوستون، MA، ایالات متحده آمریکا، 7 تا 12 ژوئن 2015؛ صفحات 1-9. [ Google Scholar ]
  44. آرورا، اس. بهاسکارا، ا. جنرال الکتریک، آر. Ma, T. مرزهای قابل اثبات برای یادگیری برخی بازنمایی های عمیق. در مجموعه مقالات سی و یکمین کنفرانس بین المللی یادگیری ماشین، 21 تا 26 ژوئن 2014؛ Xing, EP, Jebara, T., Eds. PMLR: پکن، چین، 2014; جلد 32، ص 584–592. [ Google Scholar ]
  45. سگدی، سی. آیوف، اس. ونهوک، وی. عالمی، AA Inception-v4، Inception-ResNet و تاثیر اتصالات باقیمانده بر یادگیری. در مجموعه مقالات سی و یکمین کنفرانس AAAI در مورد هوش مصنوعی، AAAI’17، سانفرانسیسکو، کالیفرنیا، ایالات متحده آمریکا، 4 تا 9 فوریه 2017؛ مطبوعات AAAI: پالو آلتو، کالیفرنیا، ایالات متحده آمریکا، 2017؛ صص 4278-4284. [ Google Scholar ]
  46. او، ک. ژانگ، ایکس. رن، اس. Sun، J. یادگیری باقیمانده عمیق برای تشخیص تصویر. در مجموعه مقالات کنفرانس IEEE 2016 در مورد بینایی کامپیوتری و تشخیص الگو، CVPR 2016، لاس وگاس، NV، ایالات متحده آمریکا، 27 تا 30 ژوئن 2016؛ صص 770-778. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  47. Chollet، F. Xception: یادگیری عمیق با پیچیدگی های قابل جداسازی عمیق. در مجموعه مقالات کنفرانس IEEE 2017 در مورد دید رایانه و تشخیص الگو، CVPR 2017، هونولولو، HI، ایالات متحده آمریکا، 21 تا 26 ژوئیه 2017؛ صفحات 1800–1807. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  48. چن، آر. چن، ام. لی، دبلیو. وانگ، جی. Yao، X. Mobility آگاهی از مسیرهای مبتنی بر خوشه‌بندی و شبکه عصبی کانولوشنال را تنظیم می‌کند. ISPRS Int. J. Geo-Inf. 2019 ، 8 ، 208. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  49. چن، ایکس. کمالاسودان، ا. Zhang, X. کاربرد شبکه عصبی کانولوشن برای استخراج الگوهای حرکت رگ. در مجموعه مقالات پنجمین کنفرانس بین المللی اطلاعات و ایمنی حمل و نقل (ICTIS)، لیورپول، بریتانیا، 14 تا 17 ژوئیه 2019؛ ص 939-944. [ Google Scholar ]
  50. اندو، ی. تودا، اچ. نیشیدا، ک. Ikedo، J. طبقه بندی مسیرهای فضایی با استفاده از یادگیری بازنمایی. بین المللی J. Data Sci. مقعدی 2016 ، 2 ، 107-117. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  51. ژانگ، پی. ژائو، جی. تعهدات یک کشتی لنگردار برای جلوگیری از برخورد در دریا. جی. ناویگ. 2013 ، 66 ، 473-477. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  52. پیتسیکالیس، م. کونتوپولوس، آی. آرتیکیس، ا. Alevizos، E. دلونای، پی. پوسل، جی. درئو، آر. ری، سی. کاموسی، ای. جوسلمه، آ. و همکاران الگوهای رویداد ترکیبی برای نظارت دریایی. در مجموعه مقالات دهمین کنفرانس یونانی در زمینه هوش مصنوعی، SETN 2018، پاتراس، یونان، 9 تا 12 ژوئیه 2018؛ ص 29:1-29:4. [ Google Scholar ] [ CrossRef ]
  53. پیتسیکالیس، م. آرتیکیس، ا. درئو، آر. ری، سی. کاموسی، ای. Jousselme, A. شناسایی رویداد ترکیبی برای نظارت دریایی. در مجموعه مقالات سیزدهمین کنفرانس بین المللی ACM در مورد سیستم های توزیع شده و مبتنی بر رویداد، DEBS 2019، دارمشتات، آلمان، 24 تا 28 ژوئن 2019؛ صص 163-174. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  54. الگوریتم Gaol، FL Bresenham: پیاده سازی و تجزیه و تحلیل در شکل شطرنجی. جی. کامپیوتر. 2013 ، 8 ، 69-78. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  55. پان، SJ; یانگ، Q. نظرسنجی در مورد یادگیری انتقالی. IEEE Trans. بدانید. مهندسی داده 2009 ، 22 ، 1345-1359. [ Google Scholar ] [ CrossRef ]
  56. یاماشیتا، آر. نیشیو، م. انجام دهید، RKG; توگاشی، ک. شبکه های عصبی کانولوشن: مروری و کاربرد در رادیولوژی. Insights Imaging 2018 ، 9 ، 611–629. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  57. چن، ی. جیانگ، اچ. لی، سی. جیا، ایکس. غمیسی، ص. استخراج ویژگی های عمیق و طبقه بندی تصاویر فراطیفی بر اساس شبکه های عصبی کانولوشن. IEEE Trans. Geosci. Remote Sens. 2016 , 54 , 6232–6251. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  58. Bengio، Y. یادگیری عمیق بازنمایی ها برای یادگیری بدون نظارت و انتقالی. در مجموعه مقالات آموزش بدون نظارت و انتقال – کارگاه برگزار شده در ICML 2011، Bellevue، WA، ایالات متحده آمریکا، 2 ژوئیه 2011. جلد 27، ص 17-36. [ Google Scholar ]
  59. دوناهو، جی. جیا، ی. وینیالز، او. هافمن، جی. ژانگ، ن. تزنگ، ای. Darrell, T. DeCAF: A Deep Convolutional Activation Feature for Generic Visual Recognition. در مجموعه مقالات سی و یکمین کنفرانس بین المللی یادگیری ماشین، ICML 2014، پکن، چین، 21 تا 26 ژوئن 2014. جلد 32، ص 647–655. [ Google Scholar ]
  60. Mohanty، SP; هیوز، DP; Salathé، M. استفاده از یادگیری عمیق برای تشخیص بیماری گیاهی مبتنی بر تصویر. جلو. علوم گیاهی 2016 ، 7 ، 1419. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  61. دنگ، ج. دونگ، دبلیو. سوچر، آر. لی، ال جی; لی، ک. لی، F.-F. Imagenet: پایگاه داده تصویر سلسله مراتبی در مقیاس بزرگ. در مجموعه مقالات کنفرانس IEEE 2009 در مورد بینایی کامپیوتری و تشخیص الگو، میامی، FL، ایالات متحده آمریکا، 20-25 ژوئن 2009. ص 248-255. [ Google Scholar ]
  62. Zeiler، MD; Fergus, R. تجسم و درک شبکه های کانولوشن. در Computer Vision—ECCV 2014—سیزدهمین کنفرانس اروپایی، زوریخ، سوئیس، 6 تا 12 سپتامبر 2014 ؛ قسمت اول؛ Fleet, DJ, Pajdla, T., Schiele, B., Tuytelaars, T., Eds. Springer: برلین/هایدلبرگ، آلمان، 2014; جلد 8689، صص 818–833. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  63. لین، ام. چن، کیو. Yan, S. شبکه در شبکه. arXiv 2013 , arXiv:1312.4400. [ Google Scholar ]
  64. Kingma، DP; Ba, J. Adam: روشی برای بهینه سازی تصادفی. arXiv 2014 ، arXiv:1412.6980. [ Google Scholar ]
  65. هینتون، جنرال الکتریک؛ سریواستاوا، ن. کریژفسکی، آ. سوتسکور، آی. Salakhutdinov، RR بهبود شبکه های عصبی با جلوگیری از سازگاری مشترک آشکارسازهای ویژگی. arXiv 2012 ، arXiv:1207.0580. [ Google Scholar ]
  66. هاوکینز، DM مشکل بیش از حد برازش. جی. شیمی. Inf. محاسبه کنید. علمی 2004 ، 44 ، 1-12. [ Google Scholar ] [ CrossRef ]
  67. پرز، ال. Wang, J. اثربخشی افزایش داده ها در طبقه بندی تصویر با استفاده از یادگیری عمیق. arXiv 2017 , arXiv:1712.04621. [ Google Scholar ]
  68. مکریس، ع. تسرپس، ک. آناگنوستوپولوس، دی. یک پروتکل جدید قرار دادن شی برای به حداقل رساندن میانگین زمان پاسخ عملیات دریافت در فروشگاه‌های ارزش کلیدی توزیع شده. در مجموعه مقالات کنفرانس بین‌المللی IEEE 2017 درباره داده‌های بزرگ، BigData 2017، بوستون، MA، ایالات متحده آمریکا، 11–14 دسامبر 2017؛ صص 3196–3205. [ Google Scholar ] [ CrossRef ]
  69. مکریس، ع. تسرپس، ک. آناگنوستوپولوس، دی. Altmann, J. Load Balancing برای به حداقل رساندن میانگین زمان پاسخ عملیات دریافت در فروشگاه های توزیع شده کلید-مقدار. در مجموعه مقالات چهاردهمین کنفرانس بین المللی IEEE 2017 در مورد شبکه، سنجش و کنترل (ICNSC)، بوستون، MA، ایالات متحده، 11 تا 14 دسامبر 2017؛ صص 263-269. [ Google Scholar ]
  70. مکریس، ع. تسرپس، ک. اسپیلیوپولوس، جی. آناگنوستوپولوس، دی. ارزیابی عملکرد MongoDB و PostgreSQL برای داده های فضایی-زمانی. در مجموعه مقالات کارگاه های کنفرانس مشترک EDBT/ICDT 2019، EDBT/ICDT 2019، لیسبون، پرتغال، 26 مارس 2019؛ جلد 2322. [ Google Scholar ]
  71. مکریس، ع. تسرپس، ک. اسپیلیوپولوس، جی. زیسیس، دی. Anagnostopoulos، D. MongoDB در مقابل PostgreSQL: یک مطالعه مقایسه ای در مورد جنبه های عملکرد. GeoInformatica 2021 ، 25 ، 241-242. [ Google Scholar ] [ CrossRef ]
  72. مکریس، ع. تسرپس، ک. آناگنوستوپولوس، دی. نیکولایدو، م. de Macedo، مقایسه سیستم پایگاه داده JAF بر اساس عملکرد مکانی – زمانی. در مجموعه مقالات بیست و سومین سمپوزیوم مهندسی و برنامه های کاربردی پایگاه داده بین المللی، آتن، یونان، 10 تا 12 ژوئن 2019؛ صص 1-7. [ Google Scholar ]
  73. مراتنیا، ن. de By, RA دیدگاهی جدید در مورد تکنیک های فشرده سازی مسیر. در مجموعه مقالات کمیسیون ISPRS II و IV، WG II/5، II/6، IV/1 و IV/2 کارگاه مشترک مدل سازی و تحلیل داده های مکانی، زمانی و چند بعدی، شهر کبک، QC، کانادا، 2-3 اکتبر 2003. [ Google Scholar ]
  74. Leichsenring، YE; بالدو، اف. ارزیابی الگوریتم‌های فشرده‌سازی اعمال شده در مسیر حرکت جسم متحرک. بین المللی جی. جئوگر. Inf. علمی 2020 ، 34 ، 539-558. [ Google Scholar ] [ CrossRef ]
  75. ماکل، جی. هوانگ، جی. لاوسون، سی تی. Ravi، الگوریتم‌های SS برای فشرده‌سازی داده‌های مسیر GPS: یک ارزیابی تجربی. در مجموعه مقالات هجدهمین سمپوزیوم بین‌المللی ACM SIGSPATIAL در مورد پیشرفت‌ها در سیستم‌های اطلاعات جغرافیایی، ACM-GIS 2010، سن خوزه، کالیفرنیا، ایالات متحده آمریکا، 3 تا 5 نوامبر 2010. ص 402-405. [ Google Scholar ] [ CrossRef ]
  76. پوتامیاس، م. پاترومپاس، ک. سلیس، تی. نمونه‌برداری از جریان‌های مسیر با معیارهای مکانی-زمانی. در مجموعه مقالات هجدهمین کنفرانس بین المللی مدیریت پایگاه داده های علمی و آماری، وین، اتریش، 3 تا 5 ژوئیه 2006. صص 275-284. [ Google Scholar ]
  77. ماکل، جی. هوانگ، جی. پاتیل، وی. لاوسون، سی تی. پینگ، اف. Ravi، SS SQUISH: یک رویکرد آنلاین برای فشرده سازی مسیر GPS. در مجموعه مقالات دومین کنفرانس و نمایشگاه بین المللی محاسبات برای تحقیقات و کاربردهای جغرافیایی، واشنگتن، دی سی، ایالات متحده آمریکا، 23 تا 25 مه 2011. ص 13:1-13:8. [ Google Scholar ] [ CrossRef ]
  78. ترایچفسکی، جی. کائو، اچ. شوئرمن، پی. ولفسون، او. Vaccaro، D. کاهش داده های آنلاین و کیفیت تاریخچه در پایگاه داده های اشیاء متحرک. در مجموعه مقالات پنجمین کارگاه بین المللی ACM در زمینه مهندسی داده برای دسترسی بی سیم و موبایل، Mobide 2006، شیکاگو، IL، ایالات متحده آمریکا، 25 ژوئن 2006. صص 19-26. [ Google Scholar ] [ CrossRef ]
  79. دریتساس، ای. کاناووس، ا. تریگکا، م. سیوتاس، س. Tsakalidis، A. خوشه‌بندی مسیر کارآمد ذخیره‌سازی و k-nn برای حفظ حریم خصوصی قوی پایگاه‌های داده مکانی-زمانی. الگوریتم‌ها 2019 ، 12 ، 266. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  80. مراتنیا، ن. de By، تکنیک های فشرده سازی فضایی-زمانی RA برای اجسام نقطه متحرک. In Advances in Database Technology—EDBT 2004، نهمین کنفرانس بین المللی گسترش فناوری پایگاه داده، هراکلیون، کرت، یونان، 14-18 مارس 2004 . Bertino, E., Christodoulakis, S., Plexousakis, D., Christophides, V., Koubarakis, M., Böhm, K., Ferrari, E., Eds.; Springer: برلین/هایدلبرگ، آلمان، 2004; جلد 2992، ص 765–782. [ Google Scholar ] [ CrossRef ]
  81. داگلاس، دی اچ. Peucker، الگوریتم های TK برای کاهش تعداد نقاط مورد نیاز برای نشان دادن یک خط دیجیتالی یا کاریکاتور آن. Cartographica 1973 , 10 , 112-122. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  82. کونتوپولوس، آی. ووداس، م. اسپیلیوپولوس، جی. تسرپس، ک. Zissis، D. مجموعه داده ردیابی کشتی گیرنده AIS تک زمینی. 2020. در دسترس آنلاین: https://zenodo.org/record/3754481#.YG7dGD8RWbg (در 1 آوریل 2021 قابل دسترسی است).
  83. Sayood, K. Introduction to Data Compression , 3rd . سری مورگان کافمن در اطلاعات و سیستم‌های چندرسانه‌ای. الزویر: آمستردام، هلند، 2006. [ Google Scholar ]
  84. ماکل، جی. اولسن، PW; هوانگ، جی اچ. لاوسون، سی تی. راوی، اس. فشرده سازی داده های مسیر: ارزیابی جامع و رویکرد جدید. GeoInformatica 2014 ، 18 ، 435-460. [ Google Scholar ] [ CrossRef ]
  85. لیو، جی. ایوای، م. Sezaki، K. روشی برای ساده سازی مسیر آنلاین با متریک ناحیه محصور. در مجموعه مقالات ششمین کنفرانس بین المللی محاسبات تلفن همراه و شبکه های فراگیر، اوکیناوا، ژاپن، 23 تا 25 مه 2012. [ Google Scholar ]
شکل 1. الگوهای حرکتی رگ های مختلف.
شکل 2. مثالی از نرمال سازی فضا.
شکل 3. مثالی از مسیر ترال که به تصویر تبدیل شده است.
شکل 4. تنظیم دقیق در معماری شبکه VGG16.
شکل 5. نمونه ای از پنجره های کشویی با یک پله کشویی از اس=2مناسبت ها.
شکل 6. معماری سیستم.
شکل 7. الگوریتم داگلاس-پوکر. ( الف ) پاره خطی که توسط نقاط لنگر و شناور تشکیل شده است. ( ب ) نقطه ( پ1) با حداکثر فاصله عمود بر پاره خط انتخاب می شود. ( ج ) فرآیند با استفاده از بازگشت در هر بخش خط تکرار می شود. ( د ) مسیر ساده شده جدید.
شکل 8. الگوریتم نسبت زمان.
شکل 9. الگوریتم مبتنی بر سرعت.
شکل 10. الگوریتم مبتنی بر سرفصل.
شکل 11. ماتریس سردرگمی مدل‌های یادگیری عمیق برای الگوی A با بهترین عملکرد طبقه‌بندی از بین پنج لایه.
شکل 12. منحنی ROC مدل های یادگیری عمیق برای الگوی A.
شکل 13. دقت و از دست دادن (آموزش و آزمون) مدل های یادگیری عمیق برای الگوی A.
شکل 14. ماتریس سردرگمی مدل های یادگیری عمیق برای الگوی B با بهترین عملکرد طبقه بندی از بین پنج لایه.
شکل 15. منحنی ROC مدل های یادگیری عمیق برای الگوی B.
شکل 16. دقت و از دست دادن (آموزش و آزمون) مدل های یادگیری عمیق برای الگوی B.
شکل 17. آزمایش های توان عملیاتی. ( الف ) توان عملیاتی هر معماری CNN با تعداد پارتیشن های مختلف. ( ب ) توان عملیاتی InceptionV3 با مراحل مختلف پنجره.
شکل 18. آزمایشات تاخیر. ( الف ) تأخیر تصویر با اندازه های مختلف پنجره. ( ب ) تأخیر هر معماری CNN.
شکل 19. آزمایشات عملکرد اجرا با و بدون GPU.
شکل 20. نسبت تراکم به دست آمده توسط الگوریتم های مختلف.
شکل 21. زمان اجرای الگوریتم های فشرده سازی.

بدون دیدگاه

دیدگاهتان را بنویسید