با توسعه سریع اینترنت و رسانه های اجتماعی، استخراج رویدادهای اضطراری از گزارش های خبری آنلاین به یک نیاز فوری برای امنیت عمومی تبدیل شده است. با این حال، مطالعات کنونی در مورد متن کاوی اطلاعات اضطراری عمدتاً بر طبقه‌بندی متن و تشخیص رویداد متمرکز است و فقط به یک شناخت کلی و مفهومی در مورد یک رویداد اضطراری می‌پردازد که نمی‌تواند به طور موثر از هشدار خطر اضطراری پشتیبانی کند و غیره. روش‌های استخراج رویداد موجود در سایر زمینه‌های حرفه‌ای اغلب به یک وابستگی نحوی خاص، به خوبی طراحی شده یا پایگاه دانش خارجی بستگی دارند، که می تواند دقت بالایی را در زمینه های حرفه ای آنها ارائه دهد، اما توانایی تعمیم آنها خوب نیست، و اعمال مستقیم آنها در زمینه اضطراری دشوار است. برای رفع این مشکلات، یک مدل استخراج رویداد اضطراری چینی سرتاسر، به نام EmergEventMine، با استفاده از یک شبکه دشمن عمیق پیشنهاد شده است. با توجه به ویژگی‌های متون اضطراری چینی، از جمله پیکره‌های برچسب‌دار در مقیاس کوچک، ساختارهای نحوی نسبتاً واضح‌تر، و توزیع آرگومان متمرکز، این مقاله استخراج رویداد را با چهار کار فرعی به عنوان یک کار دو مرحله‌ای بر اساس اهداف وظایف فرعی ساده می‌کند و سپس توسعه می‌دهد. یک مدل مشترک ناهمگن سبک وزن مبتنی بر شبکه های عصبی عمیق برای تحقق استخراج رویدادهای اضطراری چینی انتها به انتها و چند شات. علاوه بر این، آموزش خصومت‌آمیز به مدل مشترک معرفی می‌شود تا برازش بیش از حد مدل در بدنه‌های برچسب‌دار در مقیاس کوچک کاهش یابد. آزمایشات روی پیکره اضطراری چینی به طور کامل کارایی مدل پیشنهادی را ثابت می کند. علاوه بر این،

کلید واژه ها:

متن کاوی ; استخراج رویداد ; آموزش عمیق دشمنی

1. مقدمه

در چند سال گذشته، اینترنت و فناوری های ارتباطی سیار به طور اساسی تغییر کرده اند. اطلاعات اضطراری عظیم [ 1]، به ویژه اخبار آنلاین، در بسترهای مختلف رسانه های اجتماعی تولید شده است. هم با رویدادهای اضطراری طبیعی، مانند آتش‌سوزی و زلزله، و هم با رویدادهای اضطراری ساخته دست بشر، مانند حوادث ترافیکی، بیماری‌های همه‌گیر، و حملات تروریستی که اغلب باعث ایجاد بحث‌های داغ در بین کاربران اینترنتی می‌شود، درگیر است. انتشار اطلاعات اضطراری بر روانشناسی و رفتار عمومی تأثیر می گذارد و سپس وقوع و تحول رویدادهای اضطراری را ترویج می کند. بنابراین، جمع آوری و تجزیه و تحلیل به موقع وقایع اضطراری یک نیاز مهم و فوری برای ایمنی عمومی است که در آن استخراج رویدادهای اضطراری اولین گام کلیدی است. با این حال، اینترنت و اینترنت موبایل مملو از انواع اخبار رویدادهای اضطراری بی نظم است که با اخبار دیگر در هم آمیخته است.2 ]. علاوه بر این، داده‌های اطلاعات اضطراری بدون ساختار از نظر محتوا غنی، از نظر شکل متنوع، چند منبعی و ناهمگن هستند [ 3 ]. از این رو، استخراج کارآمد، دقیق و کامل رویدادهای اضطراری نیز یک کار چالش برانگیز متن کاوی است.
در حال حاضر، مطالعات بر روی اطلاعات کاوی اضطراری عمدتاً بر طبقه بندی متن و تشخیص رویداد متمرکز است. اگرچه این مطالعات به نتایج رضایت‌بخشی دست یافته‌اند، محدودیت‌های وظایف استخراج منجر به این شد که آنها فقط می‌توانند شناخت کلی و مفهومی رویدادهای اضطراری، مانند برچسب دسته [ 4 ] یا نوع رویداد [ 5 ] را به دست آورند، که نمی‌توانند الزامات اضطراری را برآورده کنند. هشدار خطر بر اساس نتایج استخراج رویداد [ 6 ، 7]. جدا از طبقه‌بندی متن و تشخیص رویداد، استخراج رویداد می‌تواند محتوای دقیق‌تر و ساختارمندتری به دست آورد. یک کار استخراج رویداد معمولاً شامل چهار کار فرعی است: تشخیص ماشه، شناسایی نوع ماشه/رویداد، تشخیص آرگومان و طبقه بندی نقش آرگومان. بسیاری از مدل‌های استخراج رویدادهای پیشرفته در زمینه‌های حرفه‌ای دیگر، مانند زمینه‌های زیست پزشکی [ 8 ، 9 ] و زمینه‌های مالی [ 10 ، 11 ] وجود دارد. با این حال، آنها را نمی توان مستقیماً در زمینه اضطراری اعمال کرد. از یک طرف، این مدل‌ها اغلب به وابستگی نحوی خاص دامنه و به خوبی طراحی شده [ 12 ] یا پایگاه دانش خارجی [ 8 ] بستگی دارند.]. آنها در رشته های حرفه ای خود دقت بالایی دارند اما قابلیت تعمیم خوب نیست و انتقال آنها به رشته های دیگر دشوار است. از سوی دیگر، مدل‌های استخراج رویداد حرفه‌ای اخیر عمدتاً بر توسعه شبکه‌های پیچیده برای گرفتن ویژگی‌های عمیق به زبان تخصصی برای بهبود اثر استخراج رویداد متمرکز شده‌اند که در نتیجه تقاضا برای پیکره‌های برچسب‌دار در مقیاس بزرگ افزایش می‌یابد. با این حال، نهادهای اضطراری چینی موجود، مانند سازمان اضطراری چین (CEC، https://github.com/shijiebei2009/CEC-Corpus، قابل دسترسی در 15 ژوئیه 2021)، در مقیاس کوچک هستند. اغلب کمتر از 200 نمونه از هر نوع رویداد وجود دارد. بنابراین، تحقق استخراج رویداد اضطراری به طور مستقیم با استفاده از این مدل‌های استخراج رویداد حرفه‌ای غیرممکن است. در واقع، به دلیل خدمات رسانی به مردم، اطلاعات اضطراری چینی ساختار نحوی واضح تری در مقایسه با سایر عبارات تخصصی در مقالات یا گزارش های علمی دارد. شکل 1 مقایسه ای بین ذکر رویداد ژنتیکی و ذکر اضطراری ارائه می دهد. شکل 1a یک رویداد ژنتیک ذکر شده از وظیفه مشترک BioNLP (BioNLP-ST) 2013 Cancer Genetics را نشان می دهد. سبز و نارنجی نشان دهنده موجودیت ها و قرمز نشان دهنده محرک های رویداد است. یک اتصال آبی نشان دهنده نقش آرگومان است. ساختارهای رویداد توسط یک تریگر رویداد و یک یا چند آرگومان ساخته می شوند. اگرچه بسیار مختصر است، اما این ذکر رویداد ژنتیکی دارای ساختار رویداد لانه ای است که شامل یک رویداد مسطح و یک رویداد تو در تو است. رویداد مسطح، سلول‌های اریتروئیدی تبدیل‌شده ، تنها یک موجودیت به عنوان آرگومان خود دارد. رویداد تودرتو، سلول‌های اریتروید تبدیل‌شده erbA/myb IRES ، موجودیت erbA/myb IRES و رویداد تخت سلول‌های اریتروئیدی تبدیل‌شده را به‌عنوان آرگومان‌های خود دارد. شکل 1b یک رویداد لرزه ای در بدنه CEC است که شامل دسته های مختلفی از آرگومان ها است که به ترتیب با رنگ های نارنجی، آبی، سبز و خاکستری مشخص شده اند و یک ماشه با علامت قرمز مشخص شده است. خطوط اتصال آبی نقش آرگومان ها را نشان می دهد. کل ساختار رویداد ساده و واضح است. با هدف این ویژگی متون اضطراری، به جای استفاده مستقیم از مدل‌های استخراج رویداد حرفه‌ای موجود، باید یک مدل جدید و سبک وزن برای استخراج رویدادهای اضطراری توسعه داد.
برخی از روش‌های استخراج رویداد دامنه باز [ 13 ، 14 ] در زمینه‌های متعددی از مجموعه داده‌ها، اغلب شامل مجموعه‌های اضطراری، آزمایش شده‌اند، اما نتایج آنها اغلب عدم قطعیت را نشان می‌دهند و نسبتاً ضعیف هستند. مبادله بین نرخ دقت و فراخوان نیز چالش بزرگی برای استخراج رویدادهای دامنه باز است. بنابراین، این روش‌های استخراج رویداد دامنه باز برای استخراج رویدادهای اضطراری نیز نامناسب هستند، که دارای طبقه‌بندی و تعریف رویداد واضح است و نیاز بالایی به یکپارچگی، دقت و یادآوری نتایج استخراج دارد.
بر اساس مشاهدات فوق، این مقاله یک مدل استخراج رویداد اضطراری چینی سرتاسر به نام EmergEventMine را با استفاده از یک شبکه دشمن عمیق پیشنهاد می‌کند. مشارکت های اصلی را می توان به شرح زیر خلاصه کرد:
  • در ابتدا، این مقاله استخراج رویداد را با چهار کار فرعی به عنوان یک کار دو مرحله‌ای بر اساس اهداف وظایف فرعی ساده می‌کند و سپس یک مدل مشترک عمیق ناهمگن را برای تحقق استخراج رویداد اضطراری چینی انتها به انتها توسعه می‌دهد. شناسایی آرگومان از مدل کلاسیک BiLSTM-CRF (حافظه کوتاه‌مدت-فیلدهای تصادفی شرطی) کلاسیک استفاده می‌کند و طبقه‌بندی نقش آرگومان به عنوان یک کار انتخاب چند سر تحقق می‌یابد. در مقایسه با مدل‌های مشترک استخراج رویداد حرفه‌ای موجود، این مدل یک مدل سبک وزن است که به ابزارهای تحلیل نحوی خارجی وابسته نیست و دارای ساختار شبکه‌ای ساده‌تر برای تسریع همگرایی مدل در مجموعه داده‌های آموزشی کوچک است.
  • ثانیا، این مقاله آموزش خصمانه را بر اساس آموزش خصمانه رایگان (FreeAT) [ 15 ] در مدل مشترک استخراج رویداد ادغام می کند. با افزودن اغتشاشات کوچک و مداوم به ورودی مدل مشترک، برازش بیش از حد مدل ناشی از مجموعه داده های آموزشی کوچک و ساختار شبکه ساده می تواند برای بهبود استحکام و تعمیم مدل کاهش یابد.
  • ثالثاً، متفاوت از مطالعات متن‌کاوی موجود بر اساس مجموعه داده‌های عمومی CEC، برچسب‌های قالب XML از مجموعه داده‌های استاندارد CEC حذف شدند تا با سناریوی کاربردی واقعی مطابقت داشته باشند. آزمایش‌ها روی این مجموعه داده CEC بازیابی شده انجام شد. نتایج تجربی نشان می‌دهد که مدل پیشنهادی می‌تواند رویدادهای اضطراری را از متون اخبار آنلاین به طور مؤثرتر و جامع‌تر در مقایسه با مدل‌های استخراج رویداد موجود استخراج کند.

2. کارهای مرتبط

2.1. متن کاوی اطلاعات اضطراری

متن کاوی اطلاعات اضطراری برای مدت طولانی مورد توجه بوده است. تحقیقات اولیه اغلب موضوعاتی را از اطلاعات اضطراری در نظر می گرفتند و سپس روش های یادگیری ماشینی کم عمق را برای طبقه بندی متون اضطراری بر اساس موضوعات به دست آمده اتخاذ می کردند. وانگ و همکاران [ 16 ] یک مدل طبقه‌بندی بلادرنگ از متون اضطراری Weibo با ترکیب الگوریتم تخصیص دیریکله پنهان (LDA) و الگوریتم ماشین بردار پشتیبانی (SVM) ایجاد کرد. LDA برای شناسایی موضوعات از متون اصلی Weibo استفاده شد و موضوعات شناسایی شده سپس به عنوان ورودی SVM برای طبقه بندی Weibo استفاده شد. هان و همکاران [ 17] یک مدل طبقه بندی Weibo بر اساس الگوریتم LDA و الگوریتم جنگل تصادفی (RF) ساخت. LDA برای تقسیم متون Weibo مربوط به سیل به شش موضوع و RF برای طبقه بندی متون Weibo بر اساس نتایج یادگیری موضوع استفاده شد. با توسعه یادگیری عمیق، اثربخشی شبکه های عصبی عمیق در متن کاوی به طور گسترده ای شناخته شده است. بسیاری از روش های طبقه بندی متن اضطراری بر اساس یادگیری عمیق توسعه یافته اند. یو و همکاران [ 18 ] شبکه عصبی کانولوشنیک یکپارچه (CNN)، SVM، و رگرسیون لجستیک (LR) برای طبقه بندی متون توییت مربوط به طوفان های مختلف (ساندی، هاروی، ایرما). کومار و همکاران [ 19] از حافظه کوتاه مدت (LSTM) برای طبقه بندی متون توییت در بلایای مختلف، از جمله طوفان هاروی، زلزله مکزیک و سیل سریلانکا استفاده کرد. با استفاده از شبکه‌های عصبی عمیق مختلف، ویژگی‌های پنهان متون اضطراری به طور موثر استخراج شد تا طبقه‌بندی متن مؤثرتر محقق شود.
طبقه‌بندی متن اضطراری فقط می‌تواند برگه‌های دسته‌بندی درشت را از متون اضطراری به دست آورد و نمی‌تواند به طور موثر رویدادهای اضطراری طبیعی یا مصنوعی را تشخیص دهد. برای رفع این مشکل، تشخیص رویدادهای اضطراری به تدریج مورد توجه قرار گرفته است. ژانگ و همکاران [ 20 ] مدل تشخیص رویداد اضطراری چینی را بر اساس یادگیری عمیق (CEERM) پیشنهاد کرد، که ویژگی‌های معنایی عمیق کلمات را با آموزش یک مجموعه بردار ویژگی با استفاده از یک شبکه باور عمیق به دست آورد، سپس محرک‌ها را با استفاده از یک شبکه عصبی پس انتشار شناسایی کرد. لی و همکاران [ 21 ] شبکه های عصبی کانولوشنال عمیق (DCNN) و شبکه های LSTM را برای توسعه مدل DCNNS-LSTM برای تشخیص رویدادهای اضطراری در متون اویغور ترکیب کرد. نسیم و همکاران [ 22] یک روش تشخیص رویداد فاجعه را با استفاده از خوشه‌بندی سلسله مراتبی پیشنهاد کرد، که در آن رویدادهای اصلی توییت‌ها با خوشه‌بندی پیدا شدند و سپس رویدادهای فرعی مرتبط با خوشه‌بندی مجدد با توجه به اطلاعات روابط مکانی-زمانی و معنایی شناسایی شدند. یین و همکاران [ 5] یک مدل شبکه عصبی Conv-RDBiGRU (واحد دروازه‌ای دو جهته عمیق کانولوشن-باقیمانده) را پیشنهاد کرد که ویژگی‌های معنایی بافت عمیق را از طریق RDBiGRU استخراج کرد و سپس آنها را با استفاده از تابع softmax برای شناسایی رویدادهای اضطراری چینی فعال کرد. این روش‌های تشخیص رویداد اضطراری می‌توانند انواع مختلفی از رویدادهای اضطراری را از متون اضطراری شناسایی کنند. بنابراین، تشخیص رویداد اضطراری اغلب می‌تواند شناخت دقیق‌تری درباره اطلاعات اضطراری در مقایسه با طبقه‌بندی متن اضطراری ارائه دهد.
با این حال، هم طبقه‌بندی متن اضطراری و هم تشخیص رویداد اضطراری فقط می‌توانند یک شناخت کلی و مفهومی از رویدادهای اضطراری، یعنی برچسب دسته یا نوع رویداد به دست آورند. تجزیه و تحلیل و مدیریت اضطراری عمیق، مانند هشدار خطر اضطراری [ 6 ، 7 ]، نه تنها نیاز به شناسایی وقوع رویدادها، بلکه به دست آوردن عناصر کلیدی رویدادها، مانند موضوع، زمان و مکان دارد. بنابراین، توسعه یک مدل استخراج رویداد اضطراری ضروری است.

2.2. استخراج رویداد

استخراج رویداد یک جهت تحقیقاتی مهم در زمینه پردازش هوشمند اطلاعات است که هدف آن استخراج سریع انواع خاصی از رویدادها و عناصر از متون بدون ساختار است [ 23 ]. به طور گسترده ای در داده کاوی [ 24 ]، بازیابی اطلاعات [ 25 ]، سیستم های پاسخگویی به پرسش [ 26 ] و زمینه های دیگر استفاده شده است.
استخراج رویداد یک کار چالش برانگیز است و از چهار کار فرعی تشکیل شده است [ 27 ]. این وظایف فرعی را می توان به صورت خط لوله اجرا کرد، که در آن چندین طبقه بندی کننده مستقل به طور جداگانه ساخته می شوند و خروجی یک طبقه بندی کننده نیز می تواند به عنوان بخشی از ورودی طبقه بندی کننده متوالی آن باشد. مدل کلاسیک استخراج رویداد مبتنی بر خط لوله، DMCNN (شبکه عصبی کانولوشنال چند استخر پویا) است [ 28 ]، که در آن وظیفه استخراج رویداد به صورت دو مرحله فرموله شده است. یک DMCNN محرک ها را شناسایی می کند و سپس از DMCNN مشابه دیگری برای شناسایی آرگومان ها و نقش آنها استفاده می شود.
روش خط لوله برای استخراج رویداد دارای کاستی‌های مهمی است، از جمله انتشار خطا [ 29 ]، عدم تعامل زیرکار [ 30 ]، و غیره. بنابراین، روش مشترک، که در آن یک طبقه‌بندی کننده طبقه‌بندی چند وظیفه‌ای را انجام می‌دهد و مستقیماً نتایج وظایف فرعی متعدد را خروجی می‌دهد. ، به کانون تحقیقات اخیر استخراج رویداد تبدیل شده است. بسیاری از مدل های مشترک پیشرفته برای استخراج رویداد در زمینه های مختلف حرفه ای توسعه یافته اند.
نگوین و همکاران [ 31 ] یک مدل استخراج رویداد مشترک بر اساس RNNS پیشنهاد کرد که از یک ماتریس حافظه برای دریافت وابستگی بین ماشه و آرگومان‌ها برای بهبود نمایش‌های ذکر رویدادها استفاده می‌کرد. شا و همکاران [ 32 ] یک مدل استخراج رویداد مشترک را پیشنهاد کرد که پل‌های وابستگی بین کلمات و تعاملات بالقوه بین استدلال‌ها را برای افزایش بازنمایی ذکر رویدادها نشان می‌دهد. لی و همکاران [ 8 ] یک مدل شبکه‌های حافظه کوتاه‌مدت با ساختار درختی مبتنی بر دانش (KB-driven Tree-LSTM) را پیشنهاد کرد، که ساختارهای وابستگی زمینه‌ها و ویژگی‌های موجودیت را از هستی‌شناسی‌های خارجی برای تحقق استخراج رویداد Genia ترکیب می‌کرد. لیو و همکاران [ 12] یک مدل استخراج رویداد مالی چینی سلسله مراتبی (SSA-HEE) را بر اساس وابستگی ساختار موجودیت ماشه و آرگومان‌ها پیشنهاد کرد و هشت نوع وابستگی موجودیت را از پیش تعریف کرد. با گرفتن اطلاعات وابستگی نحوی، مدل به طور موثر توانایی شناسایی ارتباط بین ماشه و آرگومان های رویدادهای مالی را بهبود بخشید. با این حال، این مدل‌ها به یک حوزه خاص، وابستگی نحوی با طراحی خوب یا پایگاه دانش خارجی وابسته هستند که در نتیجه توانایی تعمیم پایین مدل را به همراه دارد. انتقال آنها به حوزه اورژانس نیز دشوار است.
مجموعه پیکره برچسب‌دار در مقیاس کوچک چالش مهم دیگری برای استخراج رویدادهای اضطراری چینی است. در حال حاضر، آن مدل‌های مشترک پیشرفته برای استخراج رویدادهای حرفه‌ای عمدتاً بر توسعه شبکه‌های پیچیده تمرکز می‌کنند تا ویژگی‌های عمیق را به زبان تخصصی برای بهبود استخراج رویداد به تصویر بکشند. برای مثال، مدل Tree-LSTM مبتنی بر KB [ 8 ] Tree-LSTM را برای یادگیری ویژگی‌های پنهان از تعبیه مفهومی KB طراحی کرد. مدل BERT-BLMCC [ 33 ] از چند CNN هسته‌های پیچشی در مقیاس مختلف برای استخراج ویژگی‌های محلی از زمینه‌ها استفاده کرد. ژائو و همکاران [ 34] از یک شبکه کانولوشن گراف مبتنی بر وابستگی (GCN) برای مدل‌سازی بافت محلی استفاده کرد و به‌طور مؤثر مفاهیم مرتبط معنایی را در جملات از طریق درخت وابستگی نحوی دریافت کرد. ساختار شبکه پیچیده به طور فزاینده ای تقاضای فزاینده ای را برای مجموعه های برچسب دار در مقیاس بزرگ به همراه دارد. با این حال، سازمان های اضطراری موجود چین، مانند سازمان اضطراری چین، در مقیاس کوچک هستند. اغلب کمتر از 200 نمونه از هر نوع رویداد وجود دارد. آزمایش‌ها در [ 20 ] نشان داد که فقط برای زیرکار تشخیص رویداد در CEC، عملکرد تشخیص زمانی بدتر می‌شود که تعداد لایه‌های ماشین محدود شده بولتزمن از 5 بیشتر شود. یین و همکاران [ 5 ] اشاره کرد که “CEC داده های کمی دارد، که ممکن است به آموزش مدل ناکافی منجر شود”.
به منظور استخراج مؤثر رویدادها از مجموعه‌های برچسب‌دار در مقیاس کوچک، مطالعات موجود عمدتاً رویکردهای تولید رویداد را برای تولید رویدادهای اضافی برای آموزش مدل اتخاذ کرده‌اند. با توجه به روش‌های مختلف برچسب‌گذاری داده‌ها، این رویکردها را می‌توان به سه نوع تقسیم کرد، از جمله برچسب‌گذاری دستی [ 5 ]، روش‌های مبتنی بر نظارت از راه دور [ 35 ، 36 ]، و روش‌های مبتنی بر راه‌اندازی [ 37 ، 38 ]. یین و همکاران [ 5] 43851 متن بدون ساختار را از we-media در اینترنت جستجو کرد و به صورت دستی آنها را برچسب گذاری کرد تا مجموعه آموزشی را گسترش دهد. از آنجایی که مجموعه برچسب‌گذاری دستی زمان‌بر است و ارزیابی عینی نتایج نیز دشوار است، روش‌های برچسب‌گذاری خودکار مبتنی بر نظارت از راه دور و مبتنی بر بوت استرپینگ تمرکز پژوهش هستند. چن و همکاران [ 36 ] یک روش نظارت از راه دور نرم (SDS) را برای برچسب‌گذاری خودکار نمونه‌های آموزشی استخراج رویداد پیشنهاد کرد. SDS آرگومان‌های کلیدی و محرک‌های مربوطه را به هر نوع رویداد از طریق دانش جهانی (Freebase) اختصاص می‌دهد و سپس از پایگاه دانش خارجی (FrameNet) برای فیلتر کردن محرک‌ها با نویز برای تحقق برچسب‌گذاری داده رویداد در مقیاس بزرگ استفاده می‌کند. یانگ و همکاران [ 13] یک روش تولید رویداد مبتنی بر بوت استرپینگ را برای به دست آوردن خودکار جملات رویداد جدید با استفاده از جایگزینی آرگومان و بازنویسی توکن الحاقی پیشنهاد کرد. فرگوسن و همکاران [ 35 ] یک روش تولید رویداد مبتنی بر بوت استرپینگ را برای شناسایی خودکار نمونه های رویداد جدید با استفاده از خوشه بندی پارافراسی پیشنهاد کرد. یانگ و همکاران [ 37 ] یک روش مبتنی بر راه‌اندازی را برای تولید خودکار نمونه‌های رویداد برچسب‌دار با ویرایش نمونه‌های اولیه و غربالگری نمونه‌های تولید شده با رتبه‌بندی کیفیت پیشنهاد کردند.
با این حال، روش‌های مبتنی بر نظارت از راه دور نیاز به منابع خارجی باکیفیت دارند که با مسیر فنی این مطالعه مغایرت دارد و به راحتی می‌تواند نویز ایجاد کند. فرآیند بوت استرپ با مشکلات تنظیم آستانه تشابه و نویز مواجه است. بنابراین، این رویکردهای تولید رویداد برای استخراج رویدادهای اضطراری چند شات مناسب نیستند. توسعه یک روش جدید استخراج رویداد اضطراری چند شات به دنبال رویکرد بهینه‌سازی مدل ضروری است.
علاوه بر روش‌های دامنه بسته بالا، برخی روش‌های دامنه باز برای استخراج رویداد وجود دارد. بدون طرح‌واره‌های رویداد از پیش تعریف‌شده، استخراج رویداد دامنه باز شناسایی رویدادها از متون و در بیشتر موارد، خوشه‌بندی رویدادهای مشابه از طریق کلیدواژه‌های رویداد استخراج شده است [ 27 ]. برخی از روش‌های استخراج رویداد دامنه باز بر روی مجموعه‌های اضطراری آزمایش شده‌اند. کونمن و همکاران [ 13 ] توییت‌ها را با ذکرهای همپوشانی بر اساس عبارات زمانی به‌دست‌آمده و اشاره‌های موجودیت دسته‌بندی کرد و نتیجه خوشه‌بندی را به عنوان شرح رویداد در نظر گرفت. لیو و همکاران [ 14] با استفاده از سه مدل پیچیده تولید بدون نظارت، که متغیرهای پنهان تولید شده توسط شبکه های عصبی را معرفی می کردند، رویدادها را از گزارش های خبری استخراج کرد. با این حال، رویدادهای استخراج شده از روش‌های دامنه باز اغلب عدم قطعیت و ناقصی را نشان می‌دهند. دقت و نرخ فراخوان آنها نیز نسبتا ضعیف است. علاوه بر این، از آنجا که روش‌های استخراج رویداد دامنه باز اغلب نیاز به تعیین آستانه برای رتبه‌بندی یا خوشه‌بندی دارند، مبادله بین نرخ دقت و فراخوان نیز یک چالش بزرگ است. بنابراین، این روش‌های استخراج رویداد دامنه باز برای استخراج رویدادهای اضطراری نیز نامناسب هستند، که دارای طبقه‌بندی و تعریف رویداد روشن است و نیاز بالایی به یکپارچگی، دقت و یادآوری نتایج استخراج دارد.

3. روش ها

3.1. تعریف رویداد اضطراری

با توجه به محتوای CEC، این مقاله رویداد اضطراری را به شرح زیر تعریف می کند:
رویداد اضطراری یک فعالیت بلای طبیعی یا انسانی است که در زمان و منطقه خاصی رخ می دهد، یک یا چند نقش در آن شرکت می کنند و یک سری ویژگی های عملی را نشان می دهد .

می توان آن را به صورت پنج تایی تعریف کرد:

EmerEvent = (موضوع، شی، زمان، مکان، ماشه)

که در آن موضوع و شی هر دو به شرکت کنندگان رویدادها اشاره می کنند، زمان به زمان یا دوره ای که یک رویداد رخ می دهد، مکان اشاره به مکانی دارد که رویداد رخ داده است، و Trigger به یک عمل کلیدی اشاره دارد که می تواند تغییرات و ویژگی های خاصی را در رویداد نشان دهد. فرآیند وقوع رویداد شکل 2 نمونه ای از یک رویداد اضطراری را نشان می دهد. استخراج رویداد اضطراری شامل یافتن رویداد، شناسایی نوع رویداد و استخراج جامع محتوای رویداد پنجگانه فوق از متون اضطراری بدون ساختار است.

3.2. داده ها و پیش پردازش

این مقاله CEC ایجاد شده توسط آزمایشگاه هوش معنایی دانشگاه شانگهای را اتخاذ می کند. داده‌های مجموعه از گزارش‌های خبری رویدادهای اضطراری در اینترنت و داده‌های رسانه‌ای خزیده شدند. این مجموعه شامل پنج نوع رویداد اضطراری است: زلزله، آتش سوزی، تصادف رانندگی، حمله تروریستی و مسمومیت غذایی. جدول 1 اطلاعات اولیه CEC را نشان می دهد.
از آنجایی که CEC در قالب زبان XML است، ویژگی‌های متن هنوز واضح هستند و استخراج و آموزش پس از پیش‌پردازش آسان‌تر است [ 5 ]. به منظور تطبیق بهتر صحنه استخراج واقعی رویداد، این مطالعه ابتدا پیکرها را به متون خبری اصلی بازگرداند، همانطور که در شکل 3 نشان داده شده است. پس از انجام پردازش قطعه‌بندی کلمه با استفاده از ابزار تقسیم‌بندی کلمه jieba، عناصر رویداد و نقش‌ها به‌طور خودکار طبق برچسب‌های XML CEC حاشیه‌نویسی شدند.
محرک ها و آرگومان ها با استفاده از حالت “مخفف رده B/I/O” حاشیه نویسی شدند. “B/I/O” حالت حاشیه نویسی BIO است [ 39 ]، که در آن “B” شروع موجودیت، “I” مخفف وسط یا انتهای موجودیت، و “O” مخفف دیگری است. اختصارات دسته با دسته های استدلال و دسته های ماشه درگیر هستند. همانطور که در جدول 2 نشان داده شده است ، “May 1” نشان دهنده آرگومان نوع زمان است، “May” به عنوان “B-Tim” و “1” به عنوان “I-Tim” مشخص می شود. “چک” متعلق به ماشه نوع عملیات است و به عنوان “B-عملیات” شناخته می شود.
حاشیه نویسی نقش ها و ویژگی های رویداد بر اساس محرک ها است. همانطور که در جدول 3 نشان داده شده است ، ستون اول موقعیت کلمه و ستون دوم کلمه مربوطه است. اگر کلمه یک ماشه باشد، ستون سوم به عنوان “ماشه” و ستون چهارم با عنوان “[ آrgتومترهnتیپoسمنتیمنon1، آrgتومترهnتیپoسمنتیمنon2 ،…، آrgتومترهnتیپoسمنتیمنonمن ،…] “، که در آن آrgتومترهnتیپoسمنتیمنonمنموقعیت پایانی آرگومان مربوطه در است نقشمن. اگر کلمه یک آرگومان باشد، ستون سوم آن با نوع نقش مربوطه برچسب زده می شود و ستون چهارم آن خالی است.

3.3. EmergEventMine

این مقاله یک مدل استخراج رویداد اضطراری چینی سرتاسر به نام EmergEventMine را پیشنهاد می‌کند. کل فرآیند استخراج رویداد به عنوان یک کار دو مرحله‌ای، از جمله شناسایی آرگومان و طبقه‌بندی نقش آرگومان، بر اساس اهداف وظایف فرعی ساده‌سازی می‌شود و سپس به‌طور همزمان توسط یک مدل مشترک عمیق ناهمگن انجام می‌شود. علاوه بر این، آموزش خصمانه مبتنی بر FreeAT در مدل مشترک ادغام شده است تا از تطبیق بیش از حد مدل ناشی از مجموعه داده های آموزشی کوچک کم کند. شکل 4 ساختار کلی مدل را نشان می دهد که از چهار ترکیب شامل لایه برداری متن، لایه شناسایی آرگومان، لایه طبقه بندی نقش آرگومان و مکانیسم آموزش خصمانه تشکیل شده است.

3.3.1. لایه برداری متن

لایه برداری متن، متون اضطراری ورودی را به عنوان بردار جمله رمزگذاری می کند. به منظور توسعه یک مدل کامل از پایان به انتها و اجتناب از وابستگی به ابزارهای تحلیل نحوی خارجی، این مقاله تنها از جاسازی کلمه بر اساس word2vec [ 40 ] برای ساخت بردارهای جمله استفاده می کند. برای یک جمله داده شده اس=w1، w2، …، wتی،…،wn، بردار جمله آن به صورت زیر است:

vاس=v1، v2، …، vتی،…،vn

جایی که vتینشان دهنده کلمه برداری است wتی.

3.3.2. لایه شناسایی آرگومان
لایه شناسایی آرگومان عناصر رویداد بالقوه (استدلال و ماشه) را بر اساس بردارهای جمله ورودی پیش بینی می کند. شناسایی آرگومان اساساً یک کار شناسایی موجودیت نام‌گذاری شده است، بنابراین ما این لایه را با استفاده از مدل BiLSTM-CRF، که کلاسیک‌ترین مدل شناسایی موجودیت نام‌گذاری شده در مسابقات متن کاوی چندگانه است، می‌سازیم [ 41 ].

همانطور که در بالا گفته شد، مدل‌های مشترک پیشرفته موجود برای استخراج رویدادهای حرفه‌ای عمدتاً بر توسعه شبکه‌های پیچیده برای ثبت ویژگی‌های عمیق در متون متمرکز شده‌اند که منجر به افزایش تقاضا برای مجموعه‌های برچسب‌دار در مقیاس بزرگ می‌شود. با این حال، متون اضطراری چینی به دلیل ساختار نحوی نسبتاً واضح و توزیع پارامترهای متمرکز، و همچنین پیکره‌های برچسب‌گذاری شده در مقیاس کوچک، به یک مدل سبک وزن نیاز دارند. بنابراین، این مقاله فقط BiLSTM را برای ثبت ویژگی‌های جهانی برچسب‌های کلمه اتخاذ می‌کند. فرآیند را می توان به صورت زیر تعریف کرد:

ساعتتی=[Lاستیم→vتی،Lاستیم←vتی]، تی∈1،n

جایی که vتیبردار ترکیبی کلمه است wتی، Lاستیم→vتیخروجی لایه پنهان رو به جلو است، Lاستیم←vتیخروجی لایه پنهان به عقب است و ساعتتییک نمایش کلمه ای از بردار ترکیبی است Lاستیم→vتیو Lاستیم←vتی.

بر اساس خروجی BiLSTM، CRF برای انجام وظیفه برچسب‌گذاری دنباله برای پیش‌بینی عناصر رویداد استفاده می‌شود. در لایه CRF، با در نظر گرفتن رابطه بین تگ های مجاور، می توان راه حل بهینه جهانی را به دست آورد. امتیاز هر کلمه را محاسبه می کنیم wتیبرای هر تگ عنصر رویداد:

استیساعتتی=VfUساعتتی ، تی∈1،n

جایی که f·یک تابع فعال سازی است، V∈ℝپ×ل، U∈ℝ2د×ل، پتعداد مجموعه تگ عنصر رویداد است، لعرض لایه LSTM است و داندازه پنهان لایه LSTM است. بنابراین، با توجه به ترتیب بردارهای امتیاز اس1، اس2، …، اسnو بردار پیش بینی برچسب ها y1، y2، …، yn، امتیاز CRF زنجیره خطی را می توان به صورت زیر محاسبه کرد:

اسy1،y2،…،yn=∑تی=0nستی،yتی+∑تی=1n-1تیyتی،yتی+1، تی∈1،n

جایی که yتیبرچسب از است wتی، ستی،yتیامتیاز پیش بینی شده است wتیبرچسب داده شده است yتی، و تیماتریس انتقال است. سپس، احتمال توالی تگ داده شده را بر روی تمام دنباله های برچسب ممکن در جمله ورودی محاسبه کنید. سبه شرح زیر است:

Pr=y1،y2،…،yn|س=هاسy1،y2،…،yn∑y1،˜y2˜،…،yn˜اسy1،˜y2˜،…،yn˜

در فرآیند آموزش، لایه BiLSTM-CRF تلفات ورودی متقاطع را به حداقل می رساند LنEآر:

LنEآر=∑تی=0n-ورود به سیستمپr(yتی|wتی;θ)

جایی که θمجموعه ای از پارامترها است.

3.3.3. لایه طبقه بندی نقش استدلال

لایه طبقه‌بندی نقش آرگومان، نقش‌های آرگومان‌ها، یعنی روابط بین ماشه و آرگومان‌ها را بر اساس عناصر رویداد پیش‌بینی‌شده تشخیص می‌دهد. ماشه در رویدادها معمولاً با چندین آرگومان مطابقت دارد که یک رابطه یک به چند است. بنابراین، این مقاله وظیفه طبقه بندی نقش آرگومان را به عنوان یک مسئله انتخاب چند سر مدل می کند [ 42 ]. برای یک برچسب نقش مشخص rک، امتیاز پیش بینی بین wتیو wjرا می توان به صورت زیر محاسبه کرد:

Yساعتتی،ساعتj،rک=ایکسfمساعتتی+دبلیوساعتj

جایی که f·یک تابع فعال سازی است، ساعتمنخروجی حالت پنهان LSTM مربوط به است wمن، ایکس∈ℝل، لاندازه پنهان LSTM است م∈ℝل∗2د، دبلیو∈ℝل∗2د، و داندازه پنهان لایه LSTM است. سپس، احتمال wjبه عنوان رئیس انتخاب شود wتیبا برچسب نقش rکبین آنها را می توان به صورت زیر محاسبه کرد:

پrساعتهآد=wj، تیآg=rک|wتی،θ=σYساعتتی،ساعتj،rک

جایی که σ·تابع سیگموئید است.

در فرآیند آموزش، این مقاله ضرر ورودی متقاطع را به حداقل می رساند Lrهل:

Lrهل=∑تی=0n∑j=0متر-پrساعتهآد=yتی،j،rهلآتیمنon=rک|wتی

جایی که yتیبردار حقیقت زمینی است، yتی⊆سو rک⊆ آرو متر( متر< n) تعداد سرهای مرتبط است wتی. در طول رمزگشایی، محتمل ترین سرها و نقش ها با استفاده از پیش بینی مبتنی بر آستانه انتخاب می شوند.

در نهایت، برای کار استخراج رویداد مشترک، مدل مشترک هدف نهایی را در فرآیند آموزش به حداقل می رساند:

Ljoمنnتیدبلیو،θ=LنEآر+Lrهل
3.3.4. مکانیسم آموزش خصمانه

ساختار شبکه ساده‌تر مدل مشترک، همگرایی مدل را در مجموعه داده‌های آموزشی کوچک تسریع می‌کند، اما همچنین می‌تواند به راحتی منجر به برازش بیش از حد شود. آموزش خصمانه برای به روز رسانی پارامترهای مدل در طول آموزش مدل، اغتشاش را به ورودی های مدل فعلی اضافه می کند. اگرچه توزیع خروجی مدل اساساً با توزیع اصلی سازگار است، تعمیم و استحکام مدل افزایش یافته است [ 38 ]. بنابراین، این مقاله آموزش خصمانه مبتنی بر FreeAT [ 15 ] را در مدل مشترک استخراج رویداد ادغام می کند. اغتشاش زیر در بدترین حالت به تعبیه اصلی اضافه می شود تا تابع ضرر را به حداکثر برساند:

rآدv متر+1=rآدv متر+ϵ🝛wL(w;θ^)”🝛wL(w;θ^)”

جایی که radvبدترین حالت آشفتگی است، مترتعداد تکرارهای درونی است، θ^یک کپی از پارامتر مدل فعلی است و ϵ=αDیک فراپارامتر اغتشاش است، که در آن αعامل و Dبعد تعبیه ها است ایکسمن.

در نهایت، با ترکیب ورودی های اصلی و ورودی های رویارویی تولید شده توسط آموزش خصمانه مدل، از دست دادن نهایی مدل مشترک به شرح زیر است:

L(w،θ^)=Ljoمنnتی(ایکس;θ^)+Ljoمنnتی(ایکس+rآدv;θ^)

جایی که θ^مقدار فعلی پارامتر مدل است.

3.4. ارزیابی

میزان دقت پ، نرخ فراخوان آر، و اف1مقدار [ 43 ] برای ارزیابی نتایج استخراج رویداد اضطراری اتخاذ شد. آنها را می توان به صورت زیر محاسبه کرد:

پrهجمنسمنon=تیپتیپ+افپ
آرهجآلل=تیپتیپ+افن
اف1=2×پrهجمنسمنon×آرهجآللپrهجمنسمنon+آرهجآلل

که در آن TP تعداد رویدادهایی را نشان می دهد که همه آرگومان ها و نقش های آنها به درستی شناسایی شده اند، |TP + FP| تعداد رویدادهای شناسایی شده را نشان می دهد، به عنوان مثال، جملاتی که در آن آرگومان رویداد شناسایی می شود، و |TP + FN| تعداد رویدادها در مجموعه داده را نشان می دهد.

4. آزمایش ها و نتایج

4.1. تنظیمات آزمایشی

مجموعه داده‌های CEC به مجموعه آموزشی، مجموعه ارزیابی و مجموعه تست بر اساس 8:1:1 تقسیم شد. سپس، میانگین را به دست آوردیم پ، آر، و اف1.
در این آزمایش، ابعاد بردارهای کلمه 50، تعداد تکرارها 100، بعد پنهان 64، و لایه LSTM 3 است. نرخ یادگیری به 1 × 10-3 تنظیم شده است ، تابع فعال سازی. tanh است و پارامتر اختلال خصمانه α 0.01 است.

4.2. نتیجه

4.2.1. روش های پایه

این مقاله مدل پیشنهادی EmergEventMine را با مدل‌های پیشرفته استخراج رویداد زیر مقایسه کرد:
  • DMCNN [ 28 ]: این یک مدل استخراج رویداد مبتنی بر خط لوله با وظایف دو مرحله ای، از جمله تشخیص ماشه و تشخیص آرگومان است.
  • JRNN [ 32 ]: این یک مدل استخراج رویداد مشترک مبتنی بر RNNS است که با گرفتن وابستگی بین محرک ها و پارامترها، بازنمایی جملات را غنی می کند.
  • dbRNN [ 33 ]: این یک مدل استخراج رویداد مشترک است که بازنمایی جملات را با گرفتن پل‌های وابستگی بین کلمات و تعاملات بالقوه بین آرگومان‌ها غنی می‌کند.
  • BERT-BLMCC [ 33 ]: این یک مدل استخراج رویداد مشترک با شبکه پیچیده است که در آن چند CNN و BiLSTM برای استخراج ویژگی‌های عمقی زبان‌های تخصصی یکپارچه شده‌اند. این مدل یک بردار ویژگی مشترک متشکل از خروجی مدل BERT، ویژگی POS و ویژگی نهاد، و خروجی لایه کدگذاری معنایی را اتخاذ می‌کند.
  • PLMEE [ 37 ]: به ​​طور خودکار نمونه های رویداد برچسب گذاری شده را با ویرایش نمونه های اولیه و غربالگری نمونه های تولید شده با رتبه بندی کیفیت تولید می کند تا مشکل داده های آموزشی ناکافی را حل کند.
4.2.2. تجزیه و تحلیل نتایج
نتایج تجربی در جدول 4 نشان داده شده است (کدهای منبع اصلی DMCNN و PLMEE از https://github.com/nlpcl-lab/event-extraction (20 نوامبر 2021) و https://github.com/boy56/ دانلود شده است. PLMEE (16 دسامبر 2021). در این مطالعه، آنها با استفاده از تنظیمات پارامتر پیش‌فرض دوباره اجرا می‌شوند. نتایج تجربی JRNN، dbRNN، و BERT-BLMCC از مرجع [ 33 ] ذکر شده‌اند. مدل EmergEventMine پیشنهادی بهترین عملکرد را به دست می‌آورد. دقت، یادآوری و اف1مقادیر به ترتیب 92.73%، 89.91% و 91.81% می باشد.
نتایج در جدول 4نشان می‌دهد که همه شاخص‌های ارزیابی DMCNN تقریباً پایین‌ترین هستند، که نشان می‌دهد مدل خط لوله واقعاً برای کار استخراج رویداد اضطراری مناسب نیست. در مقایسه با DMCNN، بهبود عملکرد JRNN و dbRNN بسیار محدود است. این امر قضاوت قبلی ما را تأیید می‌کند، یعنی اینکه اطلاعات وابستگی نحوی خاص دامنه، نمی‌تواند به طور مؤثری عملکرد مدل‌های استخراج رویداد را در اطلاعات اضطراری چینی با ساختار نحوی ساده و واضح بهبود بخشد. BERT-BLMCC بهترین نتیجه را در تمام روش های پایه به دست می آورد. این نشان می دهد که بردار ویژگی مشترک می تواند به طور موثری نمایش ویژگی جملات را برای آموزش شبکه های پیچیده غنی کند، که می تواند وابستگی مدل را به نمونه های در مقیاس بزرگ کاهش دهد. با این حال، کسب ویژگی ها، مانند ویژگی POS، اغلب به ابزارهای تحلیل نحوی خارجی بستگی دارد و دستیابی به استخراج رویداد پایان به انتها را دشوار می کند. علاوه بر این، BERT-BLMCC از هسته های کانولوشن با مقیاس های 1، 3 و 5 برای یادگیری اطلاعات معنایی استفاده می کند. این نوع شبکه پیچیده اغلب به معنای تقاضای زیاد برای منابع محاسباتی است که برای استخراج اضطراری چینی با ساختار نحوی ساده و واضح غیر ضروری به نظر می رسد. PLMEE دومین نتیجه برتر را در تمام روش های پایه به دست می آورد. این نشان می‌دهد که تولید رویدادهای اضافی برای آموزش مدل می‌تواند کمبود نمونه‌های برچسب‌دار را تا حدی جبران کند، اما ممکن است معایبی مانند نویز به همراه داشته باشد. بنابراین، همانطور که قبلا ذکر کردیم، آن رویکردهای تولید رویداد برای استخراج رویدادهای اضطراری چند شات مناسب نیستند. سرانجام، EmergEventMine پیشنهادی بهترین عملکرد را در تمام شاخص های ارزیابی به دست می آورد. علاوه بر این، EmergEventMine ساختار ساده‌تری دارد که به داده‌های برچسب‌گذاری‌شده کمتر و منابع محاسباتی کمتری نسبت به مدل مشترک با ساختار پیچیده، مانند BERT-BLMCC نیاز دارد.
EmergEventMine پیشنهادی ساختار سبک وزنی را برای سرعت بخشیدن به همگرایی مدل در نمونه های آموزشی در مقیاس کوچک اتخاذ می کند. با این حال، این ممکن است به برازش بیش از حد مدل در مجموعه آموزشی منجر شود. بنابراین، این مطالعه آموزش خصمانه مبتنی بر FreeAT [ 15 ] را در مدل مشترک استخراج رویداد معرفی می کند. EmergEventMine-NoAT یک مطالعه فرسایشی برای تأیید اثربخشی آموزش خصمانه است. همانطور که در جدول 4 نشان داده شده است ، میزان دقت EmergEventMine 2.22% بیشتر از EmergEventMine-NoAT است که EmergEventMine بدون ماژول آموزشی مخالف است. نرخ فراخوان آن تقریباً 1٪ بیشتر از EmergEventMine-NoAT است و اف1مقدار 2.08٪ بیشتر از EmergEventMine-NoAT است. این نشان می دهد که افزودن آموزش خصمانه می تواند به طور موثر توانایی تعمیم مدل را بهبود بخشد.

4.3. بحث

4.3.1. تجزیه و تحلیل عملکرد وظایف فرعی

استخراج مشترک رویداد با دو کار فرعی، “شناسایی استدلال” و “طبقه بندی نقش استدلال” درگیر است. در این بخش عملکرد آنها به طور جداگانه تجزیه و تحلیل خواهد شد.
شکل 5 عملکرد خوب EmergEventMine پیشنهادی را در شناسایی آرگومان نشان می دهد. اثر شناسایی ماشه و استدلال زمان بهترین است. با این حال، اثرات شناسایی مکان و آرگومان های شی ضعیف هستند. دلیل اصلی این امر این است که آرگومان های طولانی، مانند آرگومان شی “北京市119指挥中心” (فرماندهی 119 پکن) و آرگومان مکان “尼加拉瓜西南部太平洋沿岸Carident” در جنوب غربی، همسان سازی را انجام می دهند. .
شکل 6 نتایج طبقه بندی نقش آرگومان را نشان می دهد. مشاهده می شود که مدل ما به نتایج نسبتا خوبی دست یافته است. نتایج طبقه‌بندی نقش‌های Trigger-Object و Trigger-Location ضعیف هستند، که همچنین توسط آرگومان‌های طولانی شی و مکان ایجاد می‌شوند.
4.3.2. تحلیل اثربخشی استخراج رویدادهای اضطراری
همانطور که در بالا گفته شد، متن کاوی اضطراری موجود عمدتاً بر تشخیص رویداد و طبقه‌بندی متن تمرکز می‌کند و فقط می‌تواند برچسب‌های دسته‌بندی خشن را بدست آورد. شکل 7 نمونه ای از بدنه CEC را نشان می دهد که یک خبر با عنوان “زلزله 6.6 ریشتری در سواحل اقیانوس آرام نیکاراگوئه رخ داده است” است. جعبه های رنگی مختلف نشان دهنده انواع مختلف رویداد و خطوط رنگی مختلف نشان دهنده انواع آرگومان ها هستند. از این خبر، روش پیشنهادی [ 44 ] فقط می‌تواند برچسب طبقه‌بندی «زلزله، تلفات، تلفات یا نجات» را به دست آورد.
متفاوت از تشخیص رویداد و طبقه بندی متن، EmergEventMine می تواند هشت رویداد اضطراری را استخراج کند، همانطور که در نشان داده شده است شکل 8 نشان داده شده است.. دایره ها نشان دهنده محرک ها و جعبه ها نشان دهنده آرگومان ها هستند. می‌توانیم ببینیم که ماشه و چهار نوع آرگومان، از جمله “زمان”، “مکان”، “موضوع” و “شیء” را می‌توان با دقت تشخیص داد. روابط آنها همچنین می تواند استخراج شود تا ماشه و استدلال های مربوطه را در رویدادهای اضطراری مختلف ادغام کنند. بر اساس این رویدادهای اضطراری، می توانیم محتوای اصلی اخبار را درک کنیم. چنین نتیجه ای به طور قابل توجهی بهتر از برچسب دسته “زلزله، تلفات، تلفات یا نجات” است. مهم‌تر از آن، می‌تواند نمایش دقیق‌تر و ساختارمندتری از این خبر را برای پشتیبانی از آمار اطلاعات اضطراری و استخراج بیشتر ارائه دهد.

5. نتیجه گیری ها

هدف این مقاله توسعه یک روش عملی برای استخراج رویدادهای اضطراری از متون اضطراری چینی است. EmergEventMine برای اجرای یک استخراج رویداد اضطراری سرتاسر پیشنهاد شده است، که نیازی به قوانین سفارشی، مهندسی ویژگی و ابزارهای تحلیل نحوی خارجی ندارد و می تواند به طور خودکار عناصر رویدادهای مختلف را شناسایی و سازماندهی کند. با هدف رسیدگی به کمبود داده‌های برچسب در مقیاس بزرگ و اطلاعات اضطراری نسبتاً ساده، یک مدل مفصل عمیق سبک وزن را برای سرعت بخشیدن به همگرایی مدل در مجموعه داده‌های آموزشی کوچک اتخاذ می‌کند. آموزش خصمانه نیز در مدل مشترک ادغام شده است تا برازش بیش از حد مدل ناشی از مجموعه داده های آموزشی کوچک و ساختار شبکه ساده برای بهبود استحکام و تعمیم مدل را کاهش دهد. آزمایش‌ها بر روی مجموعه داده‌های CEC بازیابی شده برای تناسب با سناریوی کاربردی واقعی انجام شد. نتایج تجربی نشان می‌دهد که EmergEventMine می‌تواند نتایج استخراج رویداد بهتری را بر اساس داده‌های برچسب‌گذاری شده در مقیاس کوچک نسبت به مدل‌های استخراج رویداد موجود به دست آورد.
در کار آینده، ما بر استخراج روابط چند بعدی بین رویدادها برای ساختن نمودار دانش رویداد یک موقعیت اضطراری تمرکز خواهیم کرد. بر اساس این نمودار دانش رویداد، ما همچنین استخراج اطلاعات اضطراری مبتنی بر رویداد، مانند ردیابی رویداد و تجزیه و تحلیل علّی را مطالعه خواهیم کرد.

منابع

  1. شن، اچ. شی، ج. Zhang، Y. CrowdEIM: جمع سپاری وظایف مدیریت اطلاعات اضطراری برای کاربران رسانه های اجتماعی موبایل. بین المللی J. کاهش خطر بلایا. 2021 ، 54 ، 102024. [ Google Scholar ] [ CrossRef ]
  2. Yan, X. تحقیق در مورد شناسایی رویدادهای ناگهانی در وب بر اساس ترکیب قوانین و روش آماری. داده آنال. بدانید. کشف کنید. 2011 ، 26 ، 65-69. [ Google Scholar ]
  3. هان، ایکس. وانگ، جی. استخراج و مقایسه اطلاعات زلزله از منابع مختلف بر اساس متن وب. ISPRS Int. J. Geo-Inf. 2019 ، 8 ، 252. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  4. بای، اچ. یو، اچ. یو، جی. Huang, X. یک رویکرد یادگیری ماشینی جدید آگاهی از وضعیت اضطراری برای ارزیابی خطر بلایای سیل بر اساس Weibo چینی. محاسبات عصبی اعمال کنید. 2022 ، 34 ، 8431-8446. [ Google Scholar ] [ CrossRef ]
  5. یین، اچ. کائو، جی. کائو، ال. وانگ، جی. تشخیص رویداد اضطراری چینی با استفاده از مدل Conv-RDBiGRU. محاسبه کنید. هوشمند نوروسک. 2020 ، 2020 ، 7090918. [ Google Scholar ] [ CrossRef ]
  6. شیل، م. کالینز، جی. کاما، م. ناند، دی. فکتافون، دی. ساموئلا، جی. بیاکولا، وی. هاسکیو، سی. فلینت، جی. روپر، ک. و همکاران ارزیابی سیستم هشدار اولیه، هشدار و پاسخ پس از طوفان وینستون، فیجی، 2016. بول. ارگان بهداشت جهانی. 2019 ، 97 ، 178-189C. [ Google Scholar ] [ CrossRef ]
  7. شویاما، ک. کوی، کیو. هاناشیما، م. سانو، اچ. Usuda، Y. تشخیص سیل اضطراری با استفاده از منابع اطلاعاتی متعدد: تجزیه و تحلیل یکپارچه نظارت بر مخاطرات طبیعی و داده های رسانه های اجتماعی. علمی کل محیط. 2021 , 767 , 144371. [ Google Scholar ] [ CrossRef ]
  8. لی، دی. هوانگ، ال. هنگ، جی. Han, J. استخراج رویدادهای زیست پزشکی بر اساس Tree-LSTM دانش محور. در مجموعه مقالات کنفرانس 2019 بخش آمریکای شمالی انجمن زبان‌شناسی محاسباتی: فناوری‌های زبان انسانی، مینیاپولیس، MN، ایالات متحده آمریکا، 2 تا 7 ژوئن 2019؛ ص 1421-1430. [ Google Scholar ]
  9. Yu, F. LSLSD: وابستگی معنایی سطح کوتاه بلند مدت EMR چینی برای استخراج رویداد. Appl. علمی 2021 ، 11 ، 7237. [ Google Scholar ]
  10. ژنگ، اس. کائو، دبلیو. خو، دبلیو. Bian, J. Doc2EDAG: چارچوبی در سطح سند سرتاسر برای استخراج رویدادهای مالی چینی. در مجموعه مقالات کنفرانس 2019 روش های تجربی در پردازش زبان طبیعی و نهمین کنفرانس مشترک بین المللی در مورد پردازش زبان طبیعی (EMNLP-IJCNLP)، هنگ کنگ، چین، 3 تا 7 نوامبر 2019؛ صص 337-346. [ Google Scholar ]
  11. وانگ، پی. دنگ، ز. Cui, R. TDJEE: یک مدل مشترک در سطح سند برای استخراج رویدادهای مالی. Electronics 2021 , 10 , 824. [ Google Scholar ] [ CrossRef ]
  12. لیو، ز. خو، اچ. ژو، دی. چی، جی. سان، دبلیو. شن، اس. ژائو، جی. مدل رویداد سلسله مراتبی مبتنی بر توجه به خود وابسته به ساختار برای استخراج رویدادهای مالی چینی. در نمودار دانش و محاسبات معنایی: نمودار دانش ساخت زیرساخت جدید را تقویت می کند . Qin, B., Jin, Z., Wang, H., Pan, J., Liu, Y., An, B., Eds. CCKS 2021; ارتباطات در علوم کامپیوتر و اطلاعات؛ اسپرینگر: سنگاپور، 2021؛ جلد 1466. [ Google Scholar ]
  13. کونمن، اف. Van Den Bosch، A. استخراج دامنه باز رویدادهای آینده از توییتر. نات لنگ مهندس 2016 ، 22 ، 655-686. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  14. لیو، ایکس. هوانگ، اچ. Zhang، Y. استخراج رویداد دامنه باز با استفاده از مدل های متغیر نهفته عصبی. arXiv 2019 ، arXiv:1906.06947. [ Google Scholar ]
  15. شفاهی، ع. نجیبی، م. غیاثی، ع. خو، ز. دیکرسون، جی. استودر، سی. داوین، LS; تیلور، جی. آموزش Goldstein, T. Adversarial به صورت رایگان! arXiv 2019 ، arXiv:1904.12843. [ Google Scholar ]
  16. وانگ، ی. وانگ، تی. بله، X. ژو، جی. لی، جی. استفاده از رسانه های اجتماعی برای واکنش اضطراری و پایداری شهری: مطالعه موردی طوفان باران پکن در سال 2012. پایداری 2016 ، 8 ، 25. [ Google Scholar ] [ CrossRef ]
  17. هان، ایکس. وانگ، جی. استفاده از رسانه های اجتماعی برای استخراج و تجزیه و تحلیل احساسات عمومی در طول یک فاجعه: مطالعه موردی سیل 2018 شهر شوگوانگ در چین. ISPRS Int. J. Geo-Inf. 2019 ، 8 ، 185. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  18. یو، م. هوانگ، Q. کین، اچ. شیل، سی. یانگ، سی. یادگیری عمیق برای طبقه‌بندی متن رسانه‌های اجتماعی در زمان واقعی برای آگاهی از موقعیت با استفاده از طوفان‌های سندی، هاروی و ایرما به عنوان مطالعات موردی. بین المللی جی دیجیت. زمین 2019 ، 12 ، 1230-1247. [ Google Scholar ] [ CrossRef ]
  19. کومار، ا. سینگ، جی پی؛ Dwivedi، YK; Rana, NP یک شبکه عصبی چندوجهی عمیق برای طبقه بندی محتوای آموزنده توییتر در مواقع اضطراری. ان اپراتور Res. 2020 ، 1–32. [ Google Scholar ] [ CrossRef ]
  20. ژانگ، ی. لیو، ز. Zhou، W. تشخیص رویداد بر اساس یادگیری عمیق در متون چینی. PLoS ONE 2016 , 11 , e0160147. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  21. لی، اچ. یو، ال. تیان، اس. تورگن، آی. ژائو، جی. تشخیص اضطراری اویغور بر اساس مدل DCNNS-LSTM. جی. چین. Inf. علمی تکنولوژی 2018 ، 6 ، 52-61. [ Google Scholar ]
  22. آنام، م. شفیق، ب. شمایل، س. چون، SA; Adam, N. کشف رویدادها از رسانه های اجتماعی برای برنامه ریزی اضطراری. در مجموعه مقالات بیستمین کنفرانس بین المللی سالانه تحقیقات دولت دیجیتال، دبی، امارات متحده عربی، 18 تا 20 ژوئن 2019؛ صص 109-116. [ Google Scholar ]
  23. وانگ، ز. وانگ، ایکس. هان، ایکس. لین، ی. هو، ال. لیو، ز. لی، پی. لی، جی. ژو، جی. کلیو: پیش آموزش متضاد برای استخراج رویداد. در مجموعه مقالات پنجاه و نهمین نشست سالانه انجمن زبانشناسی محاسباتی و یازدهمین کنفرانس مشترک بین المللی پردازش زبان طبیعی، آنلاین. 1–6 اوت 2021؛ صص 6283-6297. [ Google Scholar ]
  24. فنگ، آر. یوان، جی. ژانگ، سی. مدل‌های درک مطلب کاوش و تنظیم دقیق برای استخراج رویداد چند شات. arXiv 2020 ، arXiv:abs/2010.11325. [ Google Scholar ]
  25. یو، دبلیو. یی، م. هوانگ، ایکس. یی، ایکس. یوان، Q. آن را مستقیماً بسازید: استخراج رویداد بر اساس Tree-LSTM و Bi-GRU. دسترسی IEEE 2020 ، 8 ، 14344–14354. [ Google Scholar ] [ CrossRef ]
  26. ژانگ، ی. خو، جی. وانگ، ی. لین، دی. Huang, T. چارچوبی مبتنی بر پاسخ به سؤال برای استخراج آرگومان رویداد یک مرحله ای. دسترسی IEEE 2020 ، 8 ، 65420–65431. [ Google Scholar ] [ CrossRef ]
  27. شیانگ، دبلیو. وانگ، بی. بررسی استخراج رویداد از متن. دسترسی IEEE 2019 ، 7 ، 173111–173137. [ Google Scholar ] [ CrossRef ]
  28. چن، ی. خو، ال. لیو، ک. زنگ، دی. ژائو، جی. استخراج رویداد از طریق شبکه‌های عصبی کانولوشنال چند ادغامی پویا. در مجموعه مقالات پنجاه و سومین نشست سالانه انجمن زبان‌شناسی محاسباتی و هفتمین کنفرانس مشترک بین‌المللی پردازش زبان طبیعی، پکن، چین، 26 تا 31 ژوئیه 2015. صص 167-176. [ Google Scholar ]
  29. لی، کیو. جی، اچ. Huang, L. استخراج رویداد مشترک از طریق پیش‌بینی ساختاریافته با ویژگی‌های جهانی. در مجموعه مقالات پنجاه و یکمین نشست سالانه انجمن زبانشناسی محاسباتی، صوفیه، بلغارستان، 4 تا 9 اوت 2013. صص 73-82. [ Google Scholar ]
  30. نگوین، TM; نگوین، TH One for All: مدل‌سازی مشترک عصبی موجودیت‌ها و رویدادها. arXiv 2018 , arXiv:1812.00195. [ Google Scholar ] [ CrossRef ]
  31. نگوین، تی. چو، ک. Grishman, R. استخراج رویداد مشترک از طریق شبکه های عصبی بازگشتی. در مجموعه مقالات کنفرانس 2016 بخش آمریکای شمالی انجمن زبان‌شناسی محاسباتی: فناوری‌های زبان انسانی، سن دیگو، کالیفرنیا، ایالات متحده آمریکا، 12 تا 17 ژوئن 2016. صص 300-309. [ Google Scholar ]
  32. شا، ال. کیان، ف. چانگ، بی. Sui، Z. استخراج مشترک محرک‌ها و آرگومان‌های رویداد توسط RNN پل وابستگی و تعامل آرگومان مبتنی بر تانسور. در مجموعه مقالات سی و دومین کنفرانس AAAI در مورد هوش مصنوعی (AAAI-18)، نیواورلئان، لس آنجلس، ایالات متحده آمریکا، 2 تا 7 فوریه 2018؛ صص 5916-5923. [ Google Scholar ]
  33. وانگ، اس. رائو، ی. فن، X. Qi، J. مدل استخراج رویداد مشترک بر اساس همجوشی چند ویژگی. Procedia Comput. علمی 2020 ، 174 ، 115-122. [ Google Scholar ]
  34. ژائو، دبلیو. ژانگ، جی. یانگ، جی. او، تی. Li، Z. یک چارچوب جدید استخراج رویداد زیست پزشکی مشترک از طریق مدل‌سازی دو سطحی اسناد. Inf. علمی 2021 ، 550 ، 27-40. [ Google Scholar ] [ CrossRef ]
  35. فرگوسن، جی. لاکارد، سی. جوش، DS; حاجی شیرزی، ح. استخراج رویداد نیمه نظارتی با خوشه های پارافراسی. در مجموعه مقالات کنفرانس 2018 بخش آمریکای شمالی انجمن زبان‌شناسی محاسباتی: فناوری‌های زبان انسانی، نیواورلئان، لس‌آنجلس، ایالات متحده آمریکا، 1 تا 6 ژوئن 2018؛ صص 359-364. [ Google Scholar ]
  36. چن، ی. لیو، اس. ژانگ، ایکس. لیو، ک. ژائو، جی. تولید داده با برچسب خودکار برای استخراج رویداد در مقیاس بزرگ. در مجموعه مقالات پنجاه و پنجمین نشست سالانه انجمن زبان‌شناسی محاسباتی (جلد 1: مقالات طولانی)، ونکوور، BC، کانادا، 30 ژوئیه تا 4 اوت 2017؛ صص 409-419. [ Google Scholar ]
  37. یانگ، اس. فنگ، دی. کیائو، ال. کان، ز. لی، دی. کاوش مدل های زبانی از پیش آموزش دیده برای استخراج و تولید رویداد. در مجموعه مقالات پنجاه و هفتمین کنفرانس انجمن زبانشناسی محاسباتی، فلورانس، ایتالیا، 28 ژوئیه تا 2 اوت 2019؛ صص 5284-5294. [ Google Scholar ]
  38. زنگ، ی. فنگ، ی. ما، ر. وانگ، ز. یان، آر. شی، سی. ژائو، دی. یادگیری استخراج رویداد را از طریق تولید خودکار داده های آموزشی افزایش دهید. در مجموعه مقالات سی و دومین کنفرانس AAAI در مورد هوش مصنوعی، نیواورلئان، لس آنجلس، ایالات متحده آمریکا، 2 تا 7 فوریه 2018. [ Google Scholar ]
  39. سانگ، ای اف. Veenstra، J. نشان دهنده تکه های متن. arXiv 1999 ، arXiv:cs/9907006. [ Google Scholar ]
  40. میکولوف، تی. چن، ک. کورادو، جی. Dean, J. برآورد کارآمد نمایش کلمات در فضای برداری. arXiv 2013 , arXiv:1301.3781. [ Google Scholar ]
  41. لی، ایکس. ون، کیو. لین، اچ. جیائو، ز. ژانگ، جی. بررسی اجمالی وظیفه 3 CCKS 2020: شناسایی موجودیت نامگذاری شده و استخراج رویداد در سوابق پزشکی الکترونیکی چین. هوش داده 2021 ، 3 ، 376-388. [ Google Scholar ] [ CrossRef ]
  42. جیانیس، بی. یوهانس، دی. توماس، دی. کریس، دی. شناسایی موجودیت مشترک و استخراج رابطه به عنوان یک مشکل انتخاب چند سر. سیستم خبره Appl. 2018 ، 114 ، 34-45. [ Google Scholar ]
  43. گوت، سی. Gaussier, E. یک تفسیر احتمالی از دقت، یادآوری و امتیاز F، با مفهومی برای ارزیابی. در مجموعه مقالات پیشرفت در بازیابی اطلاعات، مجموعه مقالات کنفرانس اروپایی در مورد بازیابی اطلاعات، سانتیاگو د کامپوستلا، اسپانیا، 21-23 مارس 2005. صص 345-359. [ Google Scholar ]
  44. زینگ، ز. سو، ایکس. لیو، جی. سو، دبلیو. Zhang، X. تجزیه و تحلیل تغییر مکانی و زمانی اطلاعات اضطراری زلزله بر اساس داده های میکروبلاگ: مطالعه موردی زمین لرزه جیوژایگو “8.8”. ISPRS Int. J. Geo-Inf. 2019 ، 8 ، 359. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
شکل 1. مقایسه مثالی بین ذکر رویداد ژنتیک و ذکر رویداد اضطراری چین.
شکل 2. پنج تاپل یک رویداد اضطراری.
شکل 3. نمونه ای از بدنه CEC در قالب زبان XML.
شکل 4. ساختار مدل EmergEventMine.
شکل 5. نتایج شناسایی آرگومان.
شکل 6. نتایج طبقه بندی نقش آرگومان.
شکل 7. نمونه ای از مجموعه CEC.
شکل 8. نمونه ای از نتایج استخراج رویداد EmergEventMine.

بدون دیدگاه

دیدگاهتان را بنویسید