خلاصه

بازسازی مدل محیط داخلی به عنوان یک کار مهم و چالش برانگیز از نظر ارائه یک مدل داخلی داخلی غنی از لحاظ معنایی و هندسی دقیق ظاهر شده است. اخیراً تحقیقات زیادی در رابطه با بازسازی محیط داخلی انجام شده است. بنابراین، این مقاله به بررسی تکنیک‌های پیشرفته برای بازسازی سه‌بعدی (3D) محیط‌های داخلی می‌پردازد. ابتدا، برخی از مجموعه داده‌های معیار موجود برای بازسازی سه‌بعدی محیط‌های داخلی توصیف و مورد بحث قرار می‌گیرند. سپس جمع‌آوری داده‌های فضاهای داخلی سه بعدی به اختصار خلاصه می‌شود. علاوه بر این، یک مرور کلی از بازسازی هندسی، معنایی و توپولوژیکی محیط داخلی ارائه شده است که در آن روش‌ها، مزایای موجود، و معایب این سه نوع بازسازی تحلیل و خلاصه می شود. در نهایت، جهت‌های تحقیقاتی آینده، از جمله چالش‌ها و گرایش‌های تکنیک، به منظور ارتقای علاقه پژوهشی آینده مورد بحث قرار می‌گیرند. می توان نتیجه گرفت که اکثر روش های بازسازی محیط داخلی موجود بر اساس فرضیه قوی منهتن است که ممکن است در یک محیط داخلی واقعی درست نباشد، بنابراین اثربخشی و استحکام روش های بازسازی محیط داخلی موجود را محدود می کند. علاوه بر این، بر اساس ساختارهای هرمی سلسله مراتبی و پارامترهای قابل یادگیری معماری های یادگیری عمیق، طرح‌های مشترک چند وظیفه‌ای برای به اشتراک گذاشتن پارامترها و بهینه‌سازی مشترک یکدیگر با استفاده از اطلاعات اضافی و مکمل از دیدگاه‌های مختلف، پتانسیل خود را برای بازسازی سه‌بعدی محیط‌های داخلی نشان می‌دهند. علاوه بر این، ادغام یکپارچه فضای داخلی و خارجی برای دستیابی به یک نمایش کامل از ساختمان‌های داخلی و خارجی نیز به شدت مورد تقاضا است.

کلید واژه ها:

محیط داخلی ؛ مدل سازی هندسی ; مدلسازی معنایی ; مدل سازی توپولوژیک ; بازسازی صحنه

1. معرفی

بر اساس تحقیقات آژانس حفاظت از محیط زیست، بیش از 75 درصد از جمعیت در سراسر جهان در شهرها و شهرها زندگی می کنند و تقریبا 90 درصد از وقت خود را در ساختمان ها می گذرانند [ 1 ]. انسان ها معمولاً بسیاری از فعالیت های داخلی مربوط به کار، خرید، اوقات فراغت، غذاخوری، ورزش و غیره را انجام می دهند. برای تسهیل این فعالیت های انسانی، یک عامل ضروری، در دسترس بودن نمایش اطلاعات فضایی داخلی برای برآوردن نیازهای کاربردهای مختلف است. علاوه بر این، با افزایش جمعیت شهری و رواج ساختمان‌های بزرگ (به عنوان مثال، فرودگاه‌ها، ایستگاه‌های قطار، مراکز خرید و بیمارستان‌ها) در جامعه کنونی، تقاضای فزاینده‌ای برای چیدمان‌های فضایی به‌روز در داخل ساختمان وجود دارد. محیط ها [ 2] و اطلاعات مربوط به اشیاء موجود در آنها [ 3 ].
در سال‌های اخیر، بازسازی سه‌بعدی (3D) محیط‌های داخلی به عنوان یک کار مهم و چالش برانگیز [ 4 ] از نظر ارائه یک مدل داخلی غنی از لحاظ معنایی و هندسی دقیق ظاهر شده است. در واقع، برای بسیاری از کاربردها، مانند راهنمایی ناوبری [ 5 ]، مدیریت اضطراری [ 6 ]، برنامه ریزی تعمیر و نگهداری و نوسازی ساختمان [ 7 ] و طیف وسیعی از خدمات مبتنی بر مکان داخلی (مثلاً راه ) نیز اساسی است. یافتن، تحویل محتوای متنی) [ 8]. به عنوان مثال، افراد بدون هیچ تجربه داخلی می‌توانند بخش‌های مبلمان آنلاین را که مدل‌های دیجیتال سه‌بعدی محصولات خود را ارائه می‌دهند، مرور کنند و با کمک کارشناسان یا سیستم‌های خبره دیجیتال تصمیم بگیرند که چه چیزی بخرند [ 9 ]. علاوه بر این، مدل‌های داخلی غنی از لحاظ معنایی و هندسی دقیق، اطلاعات حیاتی (مانند مکان‌های درب مورد استفاده برای خروجی‌ها، جهت باز شدن درها، مکان‌های فضاهای داخلی و روابط توپولوژیکی آنها، و ویژگی‌های معنایی فضاهای داخلی) را برای خدمات ناوبری داخلی فراهم می‌کنند [ 5 ].
تولید یک مدل فضای داخلی ابتدا به اجرای مناسب حسگرها نیاز دارد (به عنوان مثال، دوربین (تک چشمی [ 10 ]، استریو [ 11 ]، ویدئو [ 12 ]، یا پانوراما [ 13 ]، اسکن لیزری [ 14 ]، دوربین عمق [ 15 ]]، و غیره) برای جمع آوری داده های صحنه داخلی، که به مدل سازی دقیق کل صحنه داخلی کمک می کند و به کارایی مدل بازسازی شده در مراحل بعدی کمک می کند. به عنوان مثال، یک حسگر عمق ارزان قیمت، مانند مایکروسافت کینکت، می تواند برای دیجیتالی کردن و بازسازی سریع یک مدل سه بعدی داخلی با استفاده از جریان های عمق و تصاویر رنگی استفاده شود. علاوه بر این، سیستم‌های اسکن لیزری زمینی یا متحرک به طور قابل توجهی پیشرفته هستند زیرا می‌توانند به راحتی و به سرعت اطلاعات هندسی دقیق محیط‌های داخلی را ضبط کنند. به دنبال این، یک الگوریتم مناسب برای بازسازی یک مدل فضای داخلی از داده های دریافتی مورد نیاز است. مدل‌سازی یک محیط داخلی را می‌توان از مدل‌های مش [ 16 ] و مدل‌های هندسی طراحی به کمک رایانه (CAD) [ 17 ] نشان داد.] به مدل های پارامتری مبتنی بر شی [ 18 ، 19 ]. این مدل ها به طور کلی برای برآوردن نیازهای برنامه های مختلف بازسازی می شوند. به عنوان مثال، مدل‌سازی هندسی دیجیتال با هدف طراحی و شبیه‌سازی معماری ارائه شده است [ 20 ]. علاوه بر این مدل، اطلاعات مکانی یک ساختمان نیز توسط چندین استاندارد داده‌های مکانی، مانند کلاس‌های بنیاد صنعت (IFC) [ 21 ]، زبان نشانه‌گذاری جغرافیای شهر (CityGML) [ 22 ] و زبان نشانه‌گذاری جغرافیای داخلی تعریف و سازمان‌دهی می‌شود. IndoorGML)، برای پشتیبانی از خدمات مبتنی بر مکان و سایر برنامه های داخلی.
با این حال، بر خلاف همتایان خود در فضای باز، بازسازی سه بعدی محیط های داخلی همچنان چالش های خاصی را به دلیل ماهیت چیدمان پیچیده ساختار داخلی، تعاملات پیچیده بین اشیا، درهم و برهمی و انسدادها ایجاد می کند [ 23 ]. به عنوان مثال، عدم پوشش دید، دستیابی به داده‌های مربوط به دیوارها، کف‌ها و سایر سازه‌های مورد علاقه را در طول جمع‌آوری داده‌ها دشوار می‌کند و منجر به نتایج بازسازی رضایت‌بخش نمی‌شود [ 24 ].]. مثال معمولی دیگر مشکل در بازیابی ساختارهای داخلی و روابط توپولوژیکی (به عنوان مثال، اتصال، مهار، یا مجاورت) بین آنها است. علاوه بر این، مناطق با بافت ضعیف (مانند دیوارها یا کف‌های بدون ویژگی) معمولاً در محیط‌های داخلی وجود دارند که باعث خطاهای اندازه‌گیری سازگاری عکس می‌شوند [ 25 ]. بدیهی است که نویز حسگر و نقاط پرت فرآیندهای بازسازی را پیچیده تر می کند. علاوه بر این، تفاوت‌های عمده ظاهری، روشنایی و تغییرات دید در صحنه‌های مختلف، تولید خودکار و قوی یک مدل داخلی را به‌شدت چالش‌برانگیز می‌سازد.
برای مقابله با این چالش ها، روش های متعددی در سال های اخیر در رابطه با بازسازی سه بعدی محیط های داخلی توسعه یافته است. با این حال، این هنوز یک موضوع تحقیقاتی فعال در هر دو زمینه گرافیک کامپیوتری و بینایی کامپیوتر است. با جستجوی کلمات کلیدی در Web of Science، شکل 1خلاصه آمار انتشار مربوط به بازسازی سه بعدی محیط های داخلی را که دوره 2000 تا 2019 را پوشش می دهد. محلی‌سازی و نقشه‌برداری همزمان (SLAM)، «تخمین طرح‌بندی»، «بخش‌بندی معنایی» و «توپولوژی». از سال 2010 به بعد، افزایش قابل توجهی در تعداد این گونه مطالعات را می توان مشاهده کرد که نشان دهنده اهمیت روزافزون این موضوع تحقیقاتی است. بنابراین، این مقاله مروری سیستماتیک از تکنیک‌های بازسازی سه‌بعدی محیط‌های داخلی را ارائه می‌کند. به دلیل اهمیت در توسعه بازسازی محیط داخلی، در بخش 2ابتدا شرح مختصری از برخی از مجموعه داده‌های معیار موجود به منظور ارزیابی عملکرد الگوریتم‌های مختلف ارائه می‌کنیم. سپس، فرآیند جمع‌آوری داده‌های ویژگی‌های فضای داخلی سه‌بعدی در بخش 3 توضیح داده می‌شود ، قبل از اینکه تجزیه و تحلیل دقیق و خلاصه‌ای از مطالعات موجود مرتبط با بازسازی سه‌بعدی محیط‌های داخلی در بخش 4 ارائه شود.، که با توجه به اصول ذاتی و الزامات کاربردی می توان آنها را به دسته های مختلفی تقسیم کرد. این بخش به جای تحلیل کمی، بر معرفی نظریه های مربوطه و همچنین مزایا و معایب آنها تمرکز دارد. در نهایت، یک بحث از ملاحظات تحقیقات آینده با نتیجه گیری های خودمان در مورد وضعیت هنر بازسازی سه بعدی محیط های داخلی به ترتیب در بخش 5 و بخش 6 ارائه شده است.

2. مجموعه داده های محک

مجموعه داده‌های معیار نقش مهمی در تأیید عینی عملکرد و استحکام الگوریتم‌های توسعه‌یافته دارند. تا به امروز، تعداد فزاینده ای از مجموعه داده های اختصاص داده شده به برنامه های مختلف در دسترس قرار گرفته اند که برای اندازه گیری وضعیت فعلی هنر اهمیت زیادی دارند. در این بخش، مجموعه داده‌های معیار موجود بر اساس اهداف اولیه طبقه‌بندی می‌شوند و توضیحات مختصر مربوطه نیز ارائه می‌شود. لازم به ذکر است که بیشتر مجموعه داده‌های معیار موجود برای چند کار ساخته می‌شوند، نه تنها برای یک کار خاص. علاوه بر این، تا جایی که ما می‌دانیم، هیچ معیاری برای ارزیابی کیفی و کمی مدل‌سازی توپولوژیکی وجود ندارد، اگرچه روش‌های متعددی برای نشان دادن روابط توپولوژیکی توسعه داده شده‌اند.

2.1. مجموعه داده‌های معیار مدل‌سازی هندسی

2.1.1. امپریال کالج لندن و دانشگاه ملی ایرلند مینوث (ICL-NUIM)

مجموعه داده‌های امپریال کالج لندن و دانشگاه ملی ایرلند Maynooth (ICL-NUIM) [ 26 ] از توالی‌های دوربین RGB-D دستی («D» به کانال «عمق» یا «فاصله» اشاره دارد) برای ارزیابی فاصله‌سنجی بصری، 3 بعدی جمع‌آوری شده است. بازسازی، و الگوریتم‌های SLAM، که نه تنها اطلاعات ژست دوربین را برای هر فریم ارائه می‌دهند، بلکه کاربر را قادر می‌سازد تا دقت نقشه نهایی یا بازسازی سطح تولید شده را به طور کامل تعیین کند.
2.1.2. دانشگاه فنی مونیخ (TUM)
مجموعه داده دانشگاه فنی مونیخ (TUM) [ 27 ] حاوی تصاویر RGB و عمقی است که با استفاده از مایکروسافت کینکت گرفته شده است. 39 دنباله تصویر در یک محیط اداری و یک سالن صنعتی ضبط می‌شوند و مسیر حقیقت زمینی متناظر برای ارزیابی وظایفی مانند فاصله‌سنجی بصری و SLAM ارائه شده است. این مجموعه داده طیف وسیعی از صحنه‌ها و دوربین‌ها را برای ارزیابی موقعیت‌های خاص (مثلاً حرکت آهسته، مسیرهای طولانی‌تر با یا بدون تشخیص بسته شدن حلقه) پوشش می‌دهد.
2.1.3. چالش رباتیک اروپا (EuRoc)
مجموعه داده چالش رباتیک اروپا (EuRoC) [ 28 ] شامل 11 توالی استریو است که سه محیط مختلف را پوشش می دهد: دو اتاق داخلی و یک صحنه صنعتی. با توجه به سرعت پرواز، شرایط نوری و شرایط بافت پهپاد، مجموعه داده های مختلفی ارائه شده است. هر مجموعه داده یک قاب تصویر کامل و داده‌های واقعی واقعی و همچنین پارامترهای مهم برای ثبت اطلاعات داخلی دوربین و سایر حسگرها را ارائه می‌دهد.
2.1.4. نقشه برداری و موقعیت داخلی چند حسی (MiMAP)
معیار انجمن بین‌المللی فتوگرامتری و سنجش از دور (ISPRS) در نقشه‌برداری و موقعیت داخلی چندحسی (MiMAP) اولین مجموعه داده‌ای است که وظایف متعدد تشخیص نور و محدوده (LiDAR) مبتنی بر SLAM، مدل اطلاعات ساختمان (BIM) استخراج ویژگی را به هم مرتبط می‌کند. و موقعیت یابی داخلی مبتنی بر گوشی هوشمند همه با هم [ 29]. این معیار شامل سه مجموعه داده است: یک مجموعه داده SLAM مبتنی بر LiDAR داخلی، یک مجموعه داده استخراج ویژگی BIM و یک مجموعه داده موقعیت یابی داخلی. هر صحنه در مجموعه داده حاوی ابرهای نقطه‌ای از اسکنر لیزری چند پرتو، تصاویر دوربین‌های لنز چشم ماهی، و سوابق حسگرهای گوشی هوشمند متصل در محیط‌های داخلی با پیچیدگی‌های مختلف است. پروژه MiMAP یک چارچوب مشترک برای ارزیابی و مقایسه SLAM مبتنی بر LiDAR، استخراج خودکار ویژگی‌های BIM و موقعیت‌یابی چندحسی در فضای داخلی فراهم می‌کند.
2.1.5. معیار انجمن بین المللی فتوگرامتری و سنجش از دور (ISPRS) در مدل سازی فضای داخلی
معیار ISPRS در مجموعه داده‌های مدل‌سازی داخلی [ 30 ] از چندین ابر نقطه (از جمله دانشگاه فنی برانشوایگ 1 (TUB1)، TUB2، آتش‌نشانی، Uvigo، دانشگاه ملبورن (UoM) و موزه گرینگر) تشکیل شده است که از حسگرهای محیطی مختلف در ایندو گرفته شده‌اند. از پیچیدگی های مختلف برای امکان مقایسه عملکرد روش های مدل سازی داخلی.

2.2. مجموعه داده‌های معیار مدل‌سازی معنایی

2.2.1. SUN RGB-D

مجموعه داده RGB-D Scene Understanding (SUN) [ 31 ] شامل 10335 تصویر RGB-D از چهار حسگر مختلف با حاشیه نویسی متراکم است، و همچنین شامل 146617 چند ضلعی دو بعدی (2D) و 64595 جعبه محدود کننده 3 بعدی، با جهت گیری دقیق شی است. همچنین یک چیدمان اتاق سه بعدی و دسته بندی صحنه برای هر تصویر. برای این مجموعه داده، نیمی از تصاویر به آموزش اختصاص داده می شود، در حالی که نیمی دیگر به آزمایش، به منظور ارزیابی طبقه بندی صحنه، تقسیم بندی معنایی، تشخیص اشیاء سه بعدی، شی گرایی، تخمین چیدمان اتاق و درک کلی صحنه.
2.2.2. اسکن نت
ScanNet [ 32 ] یک مجموعه داده ویدیویی RGB-D بزرگ با 2.5 میلیون فریم داده در 1513 صحنه است. این 1513 اسکن، 707 فضای مجزا را نشان می‌دهد، از جمله فضاهای کوچک مانند کمد، حمام، و اتاق‌های ابزار، و فضاهای بزرگ مانند کلاس‌های درس، آپارتمان‌ها و کتابخانه‌ها که با ژست‌های دوربین سه‌بعدی، بازسازی‌های سطحی و تقسیم‌بندی معنایی حاشیه‌نویسی شده‌اند. این مجموعه داده به 1205 اسکن برای آموزش و 312 اسکن دیگر برای آزمایش تقسیم شده است.
2.2.3. عمق دانشگاه نیویورک (NYU).
مجموعه داده عمقی دانشگاه نیویورک (NYU) متشکل از توالی های ویدئویی از صحنه های مختلف داخلی است. NYU depth v1 [ 33 ] و v2 [ 34 ] به ترتیب در سال‌های 2011 و 2012 معرفی شدند که هر دو با استفاده از کینکت مایکروسافت گرفته شدند. برای NYU depth v1، 64 صحنه مختلف داخلی، 7 کلاس در سطح صحنه، و 2347 فریم برچسب متراکم وجود دارد که به 60٪ برای آموزش و 40٪ برای آزمایش تقسیم می شوند. NYU depth v2 شامل 1449 تصویر RGB-D است که 464 صحنه مختلف داخلی را در 26 کلاس سطح صحنه توصیف می کند، و حاشیه نویسی دقیق برای هر تصویر ارائه شده است. این مجموعه داده به 795 تصویر برای آموزش و 664 تصویر برای آزمایش تقسیم شده است.
2.2.4. مجموعه داده معنایی دو بعدی-سه بعدی (2D-3D) استانفورد
مجموعه داده 2D-3D-Semantic Stanford [ 35 ] یک مجموعه داده فضای داخلی در مقیاس بزرگ را ارائه می دهد، که داده های 2D، 2.5D و 3D را با حاشیه نویسی های معنایی و هندسی سطح نمونه می گیرد. مجموعه داده در شش منطقه داخلی در مقیاس بزرگ، شامل سه ساختمان مختلف با کاربری آموزشی و سه ساختمان اداری، که بیش از 6000 متر مربع را پوشش می دهد و شامل 70000 تصویر RGB، همراه با عمق های مربوطه، سطح عادی، حاشیه نویسی های معنایی، جمع آوری شده است. تصاویر جهانی XYZ و اطلاعات دوربین.
2.2.5. Matterport3D
Matterport3D [ 36 ] مجموعه داده RGB-D بزرگ و متنوعی را برای محیط های داخلی ارائه می دهد. این شامل 10800 نمای پانوراما از 194400 تصویر RGB-D است که صحنه های داخلی 90 ساختمان را توصیف می کند. برخلاف سایر مجموعه‌های داده، شامل هر دو پانورامای عمقی و رنگی 360 برای هر دیدگاه است که توسط بازسازی‌های سطحی، ژست‌های دوربین و تقسیم‌بندی‌های معنایی دوبعدی و سه‌بعدی حاشیه‌نویسی می‌شود. هم ترازی جهانی دقیق و نماهای پانورامای جامع و متنوع در کل ساختمان ها تطبیق نقاط کلیدی، پیش بینی همپوشانی دید، پیش بینی عادی از رنگ، تقسیم بندی معنایی و طبقه بندی منطقه را امکان پذیر می کند.

3. جمع آوری داده ها از فضاهای داخلی 3 بعدی

امروزه راه های زیادی برای جمع آوری یا به دست آوردن داده های سه بعدی فضاهای داخلی وجود دارد. در این قسمت سه روش زیر را خلاصه می کنیم: تخمین عمق تک نمای، تخمین عمق چند نمای و SLAM. باید توجه داشت که تعداد فزاینده‌ای از روش‌ها یا حسگرهای جمع‌آوری داده (مانند رادار [ 37 ]) برای کاربردهای مختلف داخلی در حال ظهور هستند.

3.1. تخمین عمق تک‌نما

هدف اصلی تخمین عمق تخمین مستقیم عمق پیکسل های تصویر برای انعکاس صحنه سه بعدی واقعی مشاهده شده در یک تصویر است. تخمین عمق تک نمای اجازه می دهد تا اطلاعات عمق را تنها با استفاده از یک تصویر تک چشمی بازیابی کنید [ 38 ]. کلمات کلیدی جستجو شامل ترکیبی از «تخمین عمق تصویر/نما»، «تخمین عمق تک چشمی» و «محوطه/محیط داخلی» بود. شکل 2 آمار انتشار مربوط به تخمین عمق تک چشمی را فهرست می کند. به خوبی شناخته شده است که بافت فضایی معمولاً برای رمزگذاری روابط بین موجودیت های همسایه برای تضمین سازگاری فضایی در سراسر تصاویر معرفی می شود. برای معرفی بافت فضایی، لیو و همکاران. [ 39] یک مدل گرافیکی گسسته-پیوسته ایجاد کرد که در آن عبارت داده بر اساس نقشه عمق کاندید بازیابی شده تعریف شد، در حالی که عبارت صاف با استفاده از روابط انسداد بین سوپرپیکسل‌های همسایه ساخته شد. بدون هیچ مقدمه اضافی، Zhuo [ 40 ] لایه‌های سوپرپیکسل، منطقه و طرح‌بندی را در یک چارچوب سلسله مراتبی سازماندهی کرد، جایی که اطلاعات محلی، سطح متوسط ​​و سطح بالا تحت مدل میدان تصادفی شرطی، با اولیه کدگذاری می‌شد. هدف از تخمین عمق از یک تصویر تک چشمی
برخلاف کار قبلی که از ویژگی‌های دست ساز با اطلاعات قبلی استفاده می‌کرد، تکنیک‌های یادگیری عمیق عملکرد برتر را در نمایش ویژگی برای تخمین عمق نشان می‌دهند. ادر و همکاران [ 41 ] یک شبکه عصبی کانولوشن را ایجاد کرد که در آن انحنای اصلی برای تخمین مشترک عمق متراکم، نرمال سطح و مرزها از یک تصویر همه‌جهت واحد ادغام شد. روی و همکاران [ 42 ] یک شبکه عصبی کانولوشنال و جنگل های رگرسیون را ترکیب کرد، که در آن نتایج رگرسیون فردی در یک تخمین عمق نهایی، بر اساس یک تصویر تک چشمی ادغام شدند. بدون در نظر گرفتن اطلاعات قبلی، لیو و همکاران. [ 43] به طور مشترک هم یک میدان تصادفی شرطی پیوسته و هم یک شبکه عصبی کانولوشنال عمیق را برای انجام تخمین عمق از یک تصویر منفرد اتخاذ کردند.

3.2. تخمین عمق چند نما

تخمین عمق چند نمای، تصاویر چند نما را از دوربین‌های کالیبره یا کالیبره نشده جمع‌آوری می‌کند تا یک نمایش سه‌بعدی متراکم از صحنه را بر اساس پارامترها و ژست‌های دوربین بازسازی کند، که همیشه یک موضوع داغ در جوامع فتوگرامتری و بینایی کامپیوتری بوده است. با جستجوی کلمات کلیدی در Web of Science، شکل 3 خلاصه ای از آمار انتشار مربوط به تخمین عمق چند نمای را در بازه زمانی 2000 تا 2019 نشان می دهد. “استریو چند نمای.”
شکل 4 نمونه ای از بازسازی چند نمای با دوربین های کالیبراسیون چندگانه را نشان می دهد. با توجه به تصاویر کالیبره‌شده و هندسه بازسازی‌شده، می‌توان یک نقشه بافت با وضوح فوق‌العاده بر اساس مدل‌های هندسه سه‌بعدی از تصاویر متعدد تخمین زد [ 44 ]. این روش مدل‌هایی با بافت بهتر با سطح جزئیات بالاتر نسبت به مدل‌های مبتنی بر یک تصویر تولید می‌کند.
با این حال، تراز تصویر به راحتی بر کیفیت نقشه بافت تأثیر می گذارد و حجم محاسبات به طور قابل توجهی با تعداد تصاویر ورودی افزایش می یابد. علاوه بر الگوریتم کلاسیک تنظیم بسته نرم افزاری، روش های استریو چند نمای سنتی بر محاسبه حجم جابجایی صفحه و بهینه سازی توابع خطای فتومتریک برای اندازه گیری شباهت بین وصله ها برای تخمین عمق تمرکز می کنند. کالینز و همکاران [ 45 ] یک روش ساده جاروب هواپیما را برای منظم کردن متوالی حجم هزینه پیشنهاد کرد. فوروکاوا و همکاران [ 46 ] یک الگوریتم استریو چند نمای را با معرفی قوام نورسنجی محلی و محدودیت‌های دید جهانی برای تولید یک نقشه عمق متراکم ارائه کرد. گالیانی و همکاران [ 47] به صورت تکراری، عمق سه بعدی و میدان معمولی در هر دید را برای به حداکثر رساندن معیار سازگاری عکس تعریف شده برای ایجاد تطابق چند نمای با کیفیت بالا، منتشر و اصلاح می‌کند. علاوه بر این، اطلاعات تکمیلی دیگری به منظور افزایش عملکرد به روند بازسازی اضافه شده است. به عنوان مثال، Langguth و همکاران. [ 48 ] ​​انرژی شکل گیری از سایه را به رویه بهینه سازی بازسازی معرفی کرد. بر اساس فرض منهتن، لانگگوث و همکاران. [ 48 ] ​​همچنین از میدان تصادفی مارکوف برای انجام بهینه‌سازی مبتنی بر فرضیه صفحه برای بهبود عملکرد بازسازی، به‌ویژه در مناطق با بافت ضعیف استفاده کرد. هانه و همکاران [ 49] تقسیم بندی معنایی و بازسازی متراکم به طور مشترک انجام می شود، که در آن اولی قادر به ارائه اطلاعات در مورد احتمال جهت سطح است و دومی می تواند احتمال کلاس معنایی را ارائه دهد. تکنیک ساختار از حرکت (SfM) [ 50 ]، به عنوان یک نوع تخمین عمق چند نمای، یک روش بازسازی موفق است که از اطلاعات RGB استفاده می کند. اکثر سیستم‌های SfM برای مجموعه‌های تصاویر نامرتب افزایشی هستند، با چند تصویر شروع می‌شوند، ویژگی‌های مکرر را بین دو تصویر تطبیق می‌دهند، تصاویر منطبق را اضافه می‌کنند، تطابق ویژگی‌ها را مثلث می‌کنند و بهینه‌سازی‌هایی را برای اصلاح وضعیت‌های دوربین انجام می‌دهند.
درست مانند سایر برنامه‌ها، تکنیک‌های یادگیری عمیق نیز عملکرد برتر خود را در تخمین عمق چند نمای نشان داده‌اند. در سال‌های اخیر، شبکه‌های عصبی کانولوشنال برای اندازه‌گیری شباهت بین وصله‌ها [ 51 ] معرفی شده‌اند. جی و همکاران [ 52 ] یک چارچوب یادگیری استریو چند نمای سرتاسری ایجاد کرد که به طور مستقیم هم سازگاری عکس و هم روابط ساختار هندسی سطوح را یاد می‌گیرد. هوانگ و همکاران [ 53 ] از یک شبکه عصبی کانولوشن عمیق برای جمع‌آوری اطلاعات از مجموعه‌ای از حجم‌های از پیش تولید شده برای بازسازی استریو چند نما استفاده کرد. یائو و همکاران [ 54] یک معماری استریو چند نمای سرتاسری برای تخمین عمق ایجاد کرد، که در آن مشکل بازسازی با تعیین حجم هزینه به تخمین عمق در هر دید جدا می شود. برای پرداختن به مصرف حافظه که اثر قبلی [ 53 ] از نظر بازسازی صحنه های با وضوح بالا از آن رنج می برد، یائو و همکاران. [ 55 ] همچنین یک چارچوب استریوی چند نمای مبتنی بر شبکه عصبی تکراری را با تنظیم حجم هزینه به روشی متوالی طراحی کرد.

3.3. مکان یابی و نقشه برداری همزمان (SLAM)

یک چارچوب کلی تر به عنوان نسخه بلادرنگ تکنیک SfM، روش SLAM [ 56 ] است، که در آن یک سیستم نقشه برداری حرکت را از یک مکان ناشناخته در یک محیط ناشناخته شروع می کند تا موقعیت های خود را با توجه به محیط اطراف در طول حرکت تخمین بزند. در حالی که از موقعیت های خود برای ساختن یک نقشه افزایشی استفاده می کند. SLAM فرآیند گرفتن و بازیابی ساختارهای هندسی کل صحنه با استفاده از فعال (به عنوان مثال، سنسور لیزری [ 57 ] و دوربین های عمق [ 58 ]) یا غیرفعال (به عنوان مثال، تک چشمی [ 59 ] و استریو دوچشمی [ 60 ]) است. تکنیک های حس کردن شکل 5پس از جستجوی کلمات کلیدی در وب آو ساینس، آمار انتشار مربوط به SLAM را که از سال 2000 تا 2019 را پوشش می دهد، خلاصه می کند. کلمات کلیدی جستجو شامل ترکیبی از “صحنه داخلی، محیط داخلی، بازسازی، محلی سازی و نقشه برداری همزمان (SLAM)” بود. علاوه بر این، با توجه به نوع حسگر، چندین مجموعه داده عمومی با داده های حقیقت زمینی (به عنوان مثال، ICL-NUIM، TUM، EuRoC) برای ارزیابی عملکرد روش های مختلف منتشر شده است. لئونارد و وایت [ 61 ] در ابتدا یک سیستم SLAM به نام فیلتر کالمن گسترده (EKF)-SLAM را توسعه دادند، که در آن روش احتمالی برای کاهش اثر سنسورهای نادرست استفاده شد و این سیستم به پیاده سازی استاندارد تبدیل شده است.
پس از یک دوره توسعه بیش از 30 سال، SLAM بصری به نتایج قابل توجهی دست یافته است، به ویژه با ظهور Oriented FAST و Rotated BRIEF (ORB)-SLAM2، که سیستم SLAM بصری سنتی را به اوج خود رسانده است. با این حال، هنگامی که سیستم‌های SLAM مبتنی بر تک ویژگی در صحنه‌های با بافت پایین استفاده می‌شوند، عملکرد موقعیت‌یابی و نقشه‌برداری آنها اغلب کاهش می‌یابد. SLAM بصری مدرن به تدریج به روشی چند ویژگی، چند حسگر و مبتنی بر یادگیری عمیق تبدیل شده است. بر خلاف راه حل ORB-SLAM، فاصله سنج تصویری تک چشمی نقطه ای خط نیمه مستقیم (PL-SVO) [ 62] بر اساس ویژگی‌های نقطه-خط توسعه داده شد، جایی که تخمین حالت افزایشی انجام می‌شود و حداقل خطای بازپرداخت غیرخطی ویژگی‌های نقطه-خط به طور مشترک برای دستیابی به تخمین حرکت دوربین استفاده می‌شود. علاوه بر این، یک سیستم دوچشمی Point-Line-SLAM کامل (PL-SLAM) نیز توسعه داده شد که بر روی PL-SVO [ 62 ] ساخته شد. بر اساس سیستم ORB-SLAM، Pumarola [ 63 ] ویژگی های خطی را برای طراحی نقطه تک چشمی و خط SLAM که یک مدل ردیابی می سازد، گنجانده است. گومز و همکاران [ 62 ] سنجیدن خطاهای ویژگی های مختلف را با توجه به ماتریس کوواریانس آنها به صورت تطبیقی ​​پیشنهاد کرد. علاوه بر خطای بازپرداخت سنتی نقاط پایانی برای ایجاد یک مدل تخمین گاوس-نیوتن با به حداقل رساندن مشاهده زاویه، وانگ و همکاران. [64 ] پیشنهاد تنظیم نسبت وزن نقاط و خطوط بر اساس تخمین باقیمانده های حالت دوربین. SLAM معنایی ویژگی‌های تصویر را به سطح شی ارتقا می‌دهد و درک محیط اطراف را فراهم می‌کند. در ترکیب با روش‌های یادگیری عمیق در حال ظهور، نتایج تقسیم‌بندی معنایی و تشخیص هدف می‌تواند اطلاعات سطح بالاتری را در اختیار SLAM قرار دهد. اخیراً، محققان از روش بیشینه سازی انتظارات (EM) استفاده کرده اند [ 65]، و همچنین روش های مختلف تشخیص شی پویا، برای حذف شی پویا. در نتیجه، ارتباط داده ها از طریق مدل احتمال انجام می شود، جایی که اشیاء شناسایی شده در تصویر به درستی به اشیاء سه بعدی که از قبل در داده های نقشه وجود دارند نگاشت می شوند، بنابراین نتایج قوی تری ایجاد می شود.

4. مروری بر روش تحقیق برای بازسازی سه بعدی محیط های داخلی

این بخش پیشرفت در زمینه مدل‌سازی محیط داخلی را پوشش می‌دهد که با توجه به هدف مدل‌سازی می‌توان آن را به سه بعد تقسیم کرد: مدل‌سازی هندسه، مدل‌سازی معنایی و مدل‌سازی توپولوژیکی. شکل 6تکنیک های موجود برای بازسازی سه بعدی محیط های داخلی را خلاصه می کند. هدف اصلی مدل‌سازی هندسه بازیابی کامل هندسه سه‌بعدی محیط داخلی، از جمله مدل‌سازی عناصر ساختاری چند ضلعی (مانند دیوارها، کف، سقف، درها، پنجره‌ها)، تخمین چیدمان اتاق، و مدل‌سازی بدون درز داخلی و خارجی است. این مدل های تولید شده را می توان بر اساس معیارها (به عنوان مثال، ICL-NUM، TUM، EuRoc، MiMAP، معیار ISPRS در مدل سازی داخلی) ارزیابی کرد. مدل‌سازی معنایی بر برچسب‌گذاری معنایی (مثلاً انواع شی) با استفاده از چارچوب یادگیری ماشینی یا یادگیری عمیق تمرکز دارد. مجموعه داده های رایج (به عنوان مثال، SUN RGB-D، ScanNet، عمق NYU، مجموعه داده معنایی 2D-3D-Stanford، Matterport3D) معمولاً به عنوان معیار برای تأیید نتایج تفسیر استفاده می شوند. مدل‌سازی توپولوژیک عمدتاً برای بازیابی روابط توپولوژیکی استفاده می‌شود (به عنوان مثال،

4.1. مدل سازی هندسه

4.1.1. مدل چند ضلعی ساختاری

تولید مدل های ساختمان سه بعدی کاربردهای گسترده ای در جامعه مهندسی معماری و ساخت و ساز دارد. با این حال، ایجاد دستی یک مدل سه بعدی چند ضلعی از مجموعه ای از پلان های طبقه، بی اهمیت است و به مهارت و زمان نیاز دارد. در حال حاضر، محققان در تلاش برای خودکارسازی بازسازی مدل های ساختمان های سه بعدی هستند. در این بخش، نشان داده شده است که یک مدل با ساختار چند ضلعی عمدتاً بر تعیین عناصر ساختاری (به عنوان مثال، دیوارها، سقف‌ها و کف) یا ویژگی‌های سطح دیوار (به عنوان مثال، پنجره‌ها و درها) تمرکز دارد. علاوه بر این، مجموعه داده های عمومی، مانند معیار ISPRS در مجموعه داده های بازسازی داخلی، به عنوان مجموعه داده های معیار استفاده می شود و یک چارچوب ارزیابی مشترک برای مقایسه عملکرد روش های مختلف استفاده می شود.
برای طراحی و اصلاح یک ساختمان پیچیده معماری سه بعدی، نقشه های معماری دو بعدی اغلب ابزار مؤثرتری برای این منظور فراهم می کند. با اطلاعات معماری و معنایی، نقشه های معماری دو بعدی به عنوان منابع داده موثر برای بازسازی مدل های ساختمان های سه بعدی استفاده شده است. با این وجود، بیشتر نقشه‌ها به شکل پلان‌های طبقه‌ای هستند که با استفاده از مجموعه‌ای از نمادهای استاندارد شده در رابطه با عناصر معماری، پیش‌بینی املایی هر سطح ساختمان را به تصویر می‌کشند. بر اساس این واقعیت، برداری و تشخیص نماد نقش مهمی در بازسازی ایفا می‌کنند و روش‌های متعددی که نقشه‌های معماری دوبعدی به عنوان ورودی برای تولید مدل‌های سه‌بعدی مرتبط ارائه می‌شوند، توسعه یافته‌اند. به عنوان مثال، So et al. [ 66] یک روش نیمه خودکار بازسازی مدل های ساختمان های سه بعدی مجازی را از نقشه های معماری دو بعدی توسعه داد تا کارایی فرآیند بازسازی دستی قبلی را بهبود بخشد. لو و همکاران [ 67 ] اطلاعات معماری را در نقشه های متعدد، معناشناسی و دانش قبلی برای بازسازی یک مدل ساختمان سه بعدی از نقشه های معماری دو بعدی ترکیب کرد. لی و همکاران [ 68 ] چارچوبی برای مشاهده تصاویر به منظور پیاده سازی تکنیک های مبتنی بر ادراک، و همچنین یک طرح زاویه محور برای طراحی تعاملی ارائه کرد. هورنا و همکاران [ 69 ] یک نمایش رسمی از محدودیت سازگاری برای بازسازی سه بعدی و مدل های توپولوژیکی مرتبط با آن را پیشنهاد کرد. لی و همکاران [ 70] یک بازسازی کارآمد از نقشه های معماری انجام داد، که در آن الگوریتم های تطبیق و طبقه بندی برای کاهش تعامل در طول بازسازی سه بعدی استفاده شد. اگرچه این روش‌ها مبتنی بر نقشه‌های معماری دوبعدی ارائه شده‌اند، اما اتوماسیون کامل برای تولید مدل‌های ساختمانی سه‌بعدی از نقشه‌های معماری دوبعدی به دلیل ابهامات یا ناهماهنگی‌های بازنمایی‌های معماری به دست نیامده است [ 71 ].
علاوه بر دیجیتالی‌سازی و اکستروژن از طرح‌های معماری دوبعدی به مدل‌های چند ضلعی سه‌بعدی، توسعه سیستم‌های اسکن لیزری (به عنوان مثال، زمینی یا موبایل) و تکنیک‌های فتوگرامتری با استفاده از تصاویر، راه‌حل‌های عملی را برای ارائه محیط‌های داخلی سه بعدی واقعی ارائه می‌دهد. روش‌های موجود مربوط به مدل‌های ساختار پارامتریک که مستقیماً از داده‌های سه بعدی خام مشتق شده‌اند، به طور کلی به روش‌های استخراج عناصر ساختاری و روش‌های تجزیه و بازسازی فضا تقسیم می‌شوند.
روش‌های استخراج عناصر ساختاری معمولاً هنگام مدل‌سازی محیط‌های داخلی پیچیده، از فرضیه قوی منهتن پیروی می‌کنند و صحنه داخلی را با استفاده از روش‌های تحلیل معمولی [ 72 ]، روش‌های مبتنی بر حداقل مربع [ 73 ]، روش‌های رشد منطقه به سقف، دیوارها و کف تقسیم می‌کنند . 73 ، روش‌های مبتنی بر اجماع نمونه تصادفی (RANSAC) [ 74 ]، و اجماع نمونه‌گیری بیزی مستقل از آستانه (BaySAC) [ 75 ]. شکل 7نمونه‌ای از روش استخراج عناصر سازه‌ای را نشان می‌دهد که می‌توان آن را یک الگوی مدل‌سازی چند ضلعی ساختاری، شامل مرحله تشخیص سازه ساختمان و مرحله پارامتری (یا بردار) مرتبط در نظر گرفت. تحت فرض قوی منهتن، معماری اصلی ساختمان‌ها شامل مجموعه‌ای از اولیه‌های مسطح است که بینش‌های کلیدی را در پشت اکثر روش‌های استخراج عناصر ساختاری ارائه می‌دهد. با این حال، فرض منهتن ممکن است در محیط واقعی درست نباشد، بنابراین استفاده از این روش را محدود می کند. یونگ و همکاران [ 76 ] تشخیص هواپیما را با استفاده از الگوریتم RANSAC انجام داد و مرزها را برای استخراج طرح ردیابی کرد. وانگ و همکاران [ 77] اجزای ساختمان را با استفاده از الگوریتم رشد منطقه برای ساخت یک مدل اطلاعاتی شناسایی و طبقه بندی کرد. نینگ و همکاران [ 72 ] ساختارهای دیوار را بر اساس یک نوع معمولی شناسایی کرد و یک مدل سه بعدی را با استفاده از ساختارهای دیوار استخراج شده ایجاد کرد. برای تولید یک مدل پارامتری واقعی تر، پرویتالی و همکاران. [ 74 ] ابتدائی‌های مسطح را با استفاده از تکنیک RANSAC اصلاح‌شده استخراج کرد، ابتدا ابتدائی‌های مسطح استخراج‌شده را با استفاده از یک الگوریتم برش نمودار اصلاح کرد و در نهایت هم درها و هم پنجره‌ها را با استفاده از روش ردیابی پرتو برای تولید مدل CityGML یا IFC شناسایی کرد. بدون استفاده از اطلاعات قبلی، شی و همکاران. [ 78] با استفاده از ترکیبی از اطلاعات مختلف، تقسیم بندی سه بعدی را انجام داد و سپس طرح اتاق را برای تولید یک مدل سه بعدی معنایی بازسازی کرد. هانگ و همکاران به جای استخراج ساختارهای اصلی سه بعدی ساختمان ها. [ 79 ] ساختارهای دیوار اصلی در حوزه دو بعدی را برای استخراج مرز کف دوبعدی مدل‌سازی کرد، که سپس می‌توان آن را با مدل‌سازی عمودی برای تولید یک مدل قاب سیمی سه‌بعدی از داده‌های ابر نقطه‌ای ترکیب کرد. برای تشخیص دقیق سازه های معماری اصلی، Michailidis و Pajarola [ 80] بر روی بازشوها (مثلاً پنجره‌ها و درها) استخراج صحنه‌های بهم ریخته و مسدود شده داخلی از ابرهای نقطه‌ای با استفاده از روش‌های برش نمودار بیزی متمرکز شده است. اخیراً، تحقیقاتی که بر موضوع طبقه‌بندی و برچسب‌گذاری اشیاء متمرکز شده‌اند، عملکرد برتری را برای تکنیک‌های یادگیری ماشینی و یادگیری عمیق نشان می‌دهند که پیش‌نیاز برای کاربردهای بعدی است. برخلاف روش های قبلی تشخیص مسطح برای استخراج سازه های اصلی ساختمان ها، وانگ و همکاران. [ 14 ] روش‌های طبقه‌بندی معنایی را برای ایجاد چارچوبی مبتنی بر خط معنایی برای مدل‌سازی ساختمان‌های داخلی، و استفاده از روش شبکه‌های متخاصم مولد شرطی برای بهینه‌سازی وضعیت انسداد ارائه کرد.
روش‌های تجزیه و بازسازی فضا از دانش قبلی سازه‌های معماری داخلی استفاده می‌کنند و موضوع بازسازی صحنه را به یک مشکل تجزیه و بازسازی فضای داخلی فرموله می‌کنند تا به نتیجه بازسازی قوی‌تری دست یابند. مشابه روش‌های استخراج عناصر ساختاری، بیشتر روش‌های تجزیه و بازسازی فضا نیز بر اساس فرضیه قوی منهتن انجام می‌شوند. با توجه به روش‌های تجزیه و بازسازی فضا، واحدهای اتاق از دیدگاه‌های مختلفی تعریف می‌شوند. شکل 8 نمونه هایی از روش های تجزیه و بازسازی فضا را نشان می دهد [ 20]، که در آن واحدهای ساختمان (یعنی اتاق ها) به صورت جداگانه پارتیشن بندی و مدل سازی می شوند. اگرچه این روش‌های تجزیه و بازسازی فضا، استحکام و عملکرد یا بازسازی را با تقسیم کردن فضاهای داخلی پیچیده به اتاق‌های ساده منفرد بهبود می‌بخشند، کیفیت مدل‌های سه بعدی نیز تحت تأثیر نتایج تقسیم‌بندی قرار می‌گیرد. اخیراً، موقعیت های اسکنر یا مسیر حرکت معمولاً اطلاعات مهمی را برای تقسیم بندی اتاق های جداگانه ارائه می دهند. مورا و همکاران با بهره‌برداری از دانش موقعیت اسکنر. [ 81 ] الگوریتم پارتیشن بندی فضا مبتنی بر دیوار کاندید را برای تقسیم خودکار اتاق های جداگانه انجام داد و هر اتاق را به عنوان یک مدل چند ضلعی سه بعدی مدل کرد. تانگ و همکاران [ 82] محیط داخلی را با استراتژی start-stop به چندین واحد تقسیم کرد و سپس ساختارهای اصلی معماری (به عنوان مثال، دیوارها، کف، سقف و پنجره ها) را از تصاویر RGB-D برای ایجاد مدل های داخلی سه بعدی غنی از لحاظ معنایی استخراج و مدلسازی کرد. استاندارد CityGML 3.0 اگرچه موقعیت های اسکنر یا مسیر حرکت عملکرد پارتیشن را افزایش می دهند، اما همیشه در دسترس نیستند. بدون استفاده از اطلاعات مهر زمانی، وانگ و همکاران. [ 83 ] یک چارچوب برچسب‌گذاری مبتنی بر برش نمودار برای بازسازی دیوارهای ساختاری از خطوط اولیه استخراج‌شده، و سپس بازسازی اتاق‌ها برای تولید مدل‌های پایه سه‌بعدی ارائه کرد. لی و همکاران برای تضمین یکپارچگی پارتیشن بندی فضا و نظم هندسی فضا. [ 84] یک روش مبتنی بر تقسیم بندی جامع برای بازسازی محیط داخلی چند طبقه ایجاد کرد، که در آن ساختمان های چند طبقه را می توان با استفاده از استراتژی اوج-نادیر-قله به چندین طبقه تقسیم کرد و هر طبقه را می توان به اتاق ها و راهروها تقسیم کرد. مشابه خط قبلی روش های مبتنی بر ابتدایی [ 83 ]، Pang و همکاران. [ 85 ] مرز فضایی و تفاوت بولی یکپارچه برای استخراج فضای داخلی برای تولید یک مدل داخلی با اطلاعات هندسی، معنایی و رابطه. به جای اینکه جهان منهتن را فرض کنیم، یانگ و همکاران. [ 20 ] با به حداقل رساندن تابع انرژی بر اساس فرمول میدان تصادفی مارکوف، محیط های داخلی پیچیده ای را با ساختارهای دیواری مستقیم و منحنی ساخت.
به طور خلاصه، راه‌حل‌های مبتنی بر طراحی معماری دوبعدی موجود، خط لوله مشترکی برای تبدیل خودکار محیط‌های دو بعدی به مدل‌های سه بعدی دارند. با این حال، بیشتر نقشه های معماری به شکل پلان های طبقه با سطوح مختلف جزئیات و استفاده از نمادهای گرافیکی متفاوت است که منجر به ابهام یا ناهماهنگی در بازنمایی های معماری می شود. روش‌های استخراج عناصر سازه‌ای معمولاً از روش‌های برازش مدل برای برازش اولیه‌های هندسی (مانند صفحات، استوانه‌ها، کره‌ها و مخروط‌ها) استفاده می‌کنند و سپس از آنها برای محاسبه تقاطع‌ها و گوشه‌ها استفاده می‌کنند [ 86 ]] که به راحتی تحت تاثیر صداها یا انسداد قرار می گیرد. در همین حال، روش‌های تجزیه و بازسازی فضا، بازسازی صحنه را به یک مشکل تجزیه فضای داخلی فرموله می‌کنند و می‌توانند در محیط‌های داخلی درهم و برهم استفاده شوند. با این حال، مسائل بیش از حد بخش‌بندی که الگوریتم‌های تقسیم‌بندی اتاق از آن رنج می‌برند، باید در مرحله پس از پردازش بهینه شوند. همچنین، هر دو روش استخراج عناصر سازه‌ای و روش‌های تجزیه و بازسازی فضا عمدتاً بر سازه‌های معماری ساختمان‌ها تمرکز دارند. علاوه بر ساختارهای معماری ساختمان ها، اشیاء داخلی نیز با استفاده از روش های بازیابی مدل مدل سازی می شوند [ 10 ، 18 ، 24 ، 87 ، 88 .] برای تولید مدل‌های کامل‌تر صحنه داخلی. علاوه بر این، ارزیابی کمی در هندسه بین مدل مشتق شده و داده های حقیقت زمین برای مقایسه کیفیت هندسی مفید است [ 89 ].
4.1.2. تخمین چیدمان اتاق
بازسازی چیدمان اتاق یک محیط داخلی بر اساس تعیین مرزهای دیوارها، کف ها و سقف ها [ 90 ] است که اطلاعات زمینه ای سطح بالایی را در مورد صحنه (حتی در محیط های به هم ریخته) ارائه می دهد [ 91 ]. با این حال، از آنجایی که وجود درهم و برهم منجر به انسداد می‌شود، اکثر روش‌های موجود عموماً مبتنی بر مفروضات هندسی ذاتی (مانند منهتن یا حتی طرح‌بندی جعبه‌شکل) هستند تا موقعیت‌های گوشه یا مرزهای کلیدی را که چیدمان اتاق را مشخص می‌کنند، مشخص کنند. با توجه به دیدگاه های مختلف تخمین چیدمان، روش های موجود را می توان به روش های مبتنی بر ناحیه [ 92 ] (همانطور که در شکل 9 الف نشان داده شده است)، روش های مبتنی بر لبه [ 93 ] طبقه بندی کرد.] (همانطور که در شکل 9 ب نشان داده شده است)، روش های مبتنی بر نقطه کلید (گوشه) [ 94 ] (همانطور که در شکل 9 ج نشان داده شده است)، و روش های ترکیبی [ 95 ] (همانطور که در شکل 9 د نشان داده شده است). بدیهی است که این روش ها مبتنی بر دانش قبلی از محیط داخلی واقعی هستند و چیدمان صحنه ها را از دیدگاه های مختلف (یعنی منطقه، لبه، گوشه) تفسیر می کنند. با این حال، اکثر این روش ها تحت یک فرض هندسه قوی قرار می گیرند (به عنوان مثال، هندسه منهتن). برای چیدمان های پیچیده (مانند چیدمان های L شکل، دیوارهای منحنی)، این روش ها ممکن است قابل اجرا نباشند. در همین حال، مجموعه داده های عمومی، به عنوان مثال، NYU، SUN RGB-D، Stanford 2D-3D-Semantic مجموعه داده، به عنوان معیار برای ارزیابی این روش ها استفاده می شود.
روش‌های مبتنی بر ناحیه معمولاً بر ویژگی‌های هندسی مناطق محلی، مانند زمینه هندسی و نقشه جهت، برای تعیین جهت مکانی با استفاده از روش مبتنی بر نقطه ناپدید [ 96 ] (همانطور که در شکل 10 نشان داده شده است ) متکی هستند. سپس، طرح چیدمان بهینه از میان مجموعه ای از نامزدهای چیدمان انتخاب می شود. روش مبتنی بر نقطه ناپدید شدن مبتنی بر نظریه هندسه پرسپکتیو است، و همچنین توسط فرض قوی منهتن محدود شده است. از آنجایی که روش‌های تولید فرضیه‌های چیدمان مبتنی بر نقطه ناپدید شدن در محیط‌های داخلی بسیار درهم شکسته می‌شوند، چائو و همکاران. [ 97] از رابطه بین افراد و جعبه اتاق و همچنین معرفی نشانه های هندسی و معنایی برای بهبود عملکرد تخمین نقطه ناپدید شدن بهره برد. پارک و همکاران [ 98 ] یک چارچوب میدانی تصادفی شرطی را ایجاد کرد، که در آن ویژگی‌های معنایی حاصل از معماری تقسیم‌بندی معنایی و نقشه‌های جهت ادغام می‌شوند تا طرح‌بندی داخلی را از تصاویر منفرد تخمین بزنند. با توجه به عملکرد برتر، تکنیک‌های یادگیری عمیق نیز برای ارائه ویژگی‌های سطح بالا برای تخمین چیدمان یا دستیابی به یک چارچوب تخمین چیدمان انتها به انتها استفاده می‌شوند. داسگوپتا و همکاران [ 2] یک تصویر RGB منفرد را به پنج دسته (یعنی دیوار چپ، دیوار جلو، دیوار راست، سقف و زمین) با استفاده از یک شبکه کاملاً کانولوشن طبقه‌بندی کرد و سپس یک چارچوب اصلاحی برای بازیابی طرح فضایی انجام شد. لین و همکاران [ 92 ] یک معماری شبکه کاملاً کانولوشنال سرتاسر را با تعریف جریمه لبه تطبیقی ​​و شرایط همواری برای دستیابی به تخمین چیدمان معنایی مسطح از یک تصویر واحد طراحی کرد.
روش‌های مبتنی بر لبه، تخمین چیدمان را به عنوان مشکل یافتن تمام مرزهای دیوار-کف، دیوار-دیوار و دیوار-سقف در نظر می‌گیرند. مالیا و همکاران [ 99 ] نقشه‌های احتمال لبه‌های اطلاعاتی را با استفاده از تصاویر منفرد از طریق یک شبکه کاملاً کانولوشن تعریف و پیدا کرد، و سپس از یک طبقه‌بندی ساختار یافته حداکثر حاشیه برای تولید تخمین طرح‌بندی استفاده کرد. جهرمی و همکاران [ 100 ] یک روش تأیید فرضیه ارائه کرد، که در آن مجموعه‌ای از فرضیه‌ها از طریق تقاطع قطعه خط تصادفی و پرتوهای مجازی نقاط ناپدید تولید شدند و سپس از روش تأیید مبتنی بر استدلال هندسی برای جستجوی فرضیه بهینه برای بازسازی استفاده کردند. طرح فضایی صحنه راهرو ژانگ و همکاران [ 93] یک شبکه deconvolutional را با یک استراتژی نمونه گیری تطبیقی ​​ترکیب کرد تا یک نقشه لبه با کیفیت بالا برای تخمین چیدمان اتاق ایجاد کند.
روش‌های مبتنی بر نقطه کلید (یا گوشه) بر پیش‌بینی موقعیت نقاط کلیدی دوبعدی که چیدمان اتاق را تعریف می‌کنند، تمرکز دارند. به عنوان مثال، هیرزر و همکاران. [ 101 ] یک استراتژی فرضیه و آزمون گوشه‌ای را انجام داد، که در آن فرضیه‌های تقسیم‌بندی مختلف بر اساس تعداد متفاوت دیوارهای قابل مشاهده برای بومی‌سازی گوشه‌ها و پیش‌بینی چیدمان فضایی بر اساس یک تصویر تک‌چشمی ایجاد شد. به جای اکثر فرضیه‌ها، تخمین‌های چیدمان اتاق را تأیید می‌کنند، لی و همکاران. [ 94 ] یک چارچوب تخمین چیدمان اتاق انتها به انتها برای استفاده در یک تصویر تک چشمی ایجاد کرد، جایی که نقاط کلیدی که چیدمان اتاق را مشخص می‌کنند، محلی و مرتب می‌شوند. فرناندز و همکاران [ 91] همچنین یک چارچوب تخمین چیدمان مبتنی بر گوشه را از 360 تصویر به صورت انتها به انتها توسعه داد.
روش های ترکیبی سعی می کنند عناصر چیدمان مختلف را ترکیب کرده و محدودیت های یکدیگر را تکمیل کنند. بر اساس فرض منهتن، چانگ و همکاران. [ 102 ] مسئله تخمین چیدمان فضایی داخلی را در یک فرآیند بهینه سازی انرژی از یک تصویر تک چشمی، که در آن تابع هزینه با استفاده از مرز و ثبات سطح تعریف می شود، فرموله کرد. زو و همکاران [ 95 ] روشی را پیشنهاد کرد که مستقیماً بر اساس یک تصویر پانوراما است تا طرح‌بندی مکعبی و کلی‌تر را از طریق ترکیبی از عناصر چیدمان متعدد (مثلاً گوشه‌ها و مرزها) پیش‌بینی کند. کروژیلوف و همکاران [ 103 ] نقشه‌های نقطه کلید و نقشه‌های لبه را برای پیش‌بینی چیدمان اتاق با استفاده از یک شبکه اصلاح دوگانه ترکیب کرد.
ادغام تخمین چیدمان اتاق با سایر وظایف (به عنوان مثال، تقسیم بندی معنایی یا تشخیص شی) به طور همزمان انجام می شود، جایی که تخمین چیدمان اتاق می تواند دانش چیدمان فضایی را برای استدلال در تقسیم بندی معنایی یا وظیفه تشخیص شی فراهم کند، در حالی که تقسیم بندی معنایی یا تشخیص شی نیز می تواند ارائه دهد. اطلاعات معنایی برای تخمین چیدمان اتاق شکل 11مثالی از ادغام چند وظیفه ای را ارائه می دهد که در آن نقشه لبه و نقشه تقسیم بندی به طور مشترک تخمین زده می شوند. این یک چارچوب کلی در مورد ادغام چند وظیفه ای بر اساس یک ساختار سلسله مراتبی را نشان می دهد که از یک رمزگذار واحد و سرهای متعدد برای پیش بینی امتیازات از پیش تعریف شده بر اساس الزامات مختلف تشکیل شده است. در این مورد، پیش‌بینی‌های متعدد را می‌توان برای برنامه‌های مختلف برای اهداف مختلف اعمال کرد، در حالی که پارامترهای قابل یادگیری برای بازده محاسباتی بالا به اشتراک گذاشته می‌شوند، به‌ویژه در تنظیماتی که جمع‌آوری داده‌های حقیقت زمینی برای همه وظایف پرهزینه است. هداو و همکاران [ 96] یک روش تخمین چیدمان فضایی داخلی را بر اساس تصاویر منفرد ایجاد کرد که در آن چیدمان فضایی و برچسب‌گذاری سطح به طور مشترک انجام و تکمیل می‌شوند. آنها یک الگوریتم یادگیری ساختار را برای پیش‌بینی مدل جعبه سه بعدی پارامتری فضای اتاق جهانی در حین انجام برچسب‌گذاری سطح پیکسل‌ها پیشنهاد کردند. گوپتا و همکاران با در نظر گرفتن تعامل سه بعدی بین اشیا و چیدمان فضایی. [ 104 ] استدلال حجمی را بین اشیاء داخلی و چیدمان آنها برای بهبود چارچوب پیش‌بینی ساختار یافته موجود برای بازسازی طرح‌بندی ارائه کرد. پرو و ​​همکاران [ 105 ] پیش‌بینی چیدمان را با تشخیص و محلی‌سازی شی در تصاویر منفرد با استفاده از استدلال سه بعدی و استنتاج بیزی برای درک بهتر صحنه‌های داخلی ترکیب کرد. شوینگ و همکاران [ 106] یک روش شاخه و کران برای انجام همزمان تخمین چیدمان اتاق و تشخیص اشیا در صحنه های بهم ریخته داخلی پیشنهاد کرد. ژانگ و همکاران [ 107 ] هر دو ویژگی عمق و ظاهر را از تصاویر RGB-D برای پیش‌بینی مشترک چیدمان اتاق و به هم ریختگی در محیط‌های داخلی یکپارچه کرد. برای پیش بینی مشترک ساختار اتاق سه بعدی و اشیاء داخلی، بائو و همکاران. [ 108 ] هر دو اطلاعات هندسی استخراج شده از ساختار از نقاط حرکت را با اطلاعات معنایی با استفاده از تصاویر چند نمای یکپارچه کرد. ژانگ و همکاران [ 109 ] یک معماری شبکه رمزگذار-رمزگشا طراحی کرد که در آن نقشه لبه و اطلاعات معنایی یکپارچه شده بود تا طرح اتاق را از روی یک تصویر تک چشمی بازسازی کند.
به طور خلاصه، تخمین چیدمان با شناسایی سازه های معماری (به عنوان مثال، سقف، کف، دیوار) به دست می آید. با این حال، این فرآیند به دلیل مقادیر قابل توجهی از درهم ریختگی، نورهای متفاوت، واریانس زیاد درون کلاسی و انسداد مبلمان بسیار چالش برانگیز است. این نوع روش‌ها تلاش می‌کنند تا نقطه کلیدی، نواحی یا لبه‌ها را برای مکان‌یابی ساختارهای معماری برای دستیابی به تخمین چیدمان شناسایی کنند. اخیراً، تکنیک‌های یادگیری عمیق به طور مؤثر اطلاعات معنایی را برای کمک به تصمیم‌گیری فراهم می‌کنند، و ساختار سلسله مراتبی آن نقش مهمی در بهینه‌سازی مشارکتی چند وظیفه‌ای برای تولید تخمین چیدمان قابل‌اطمینان‌تر ایفا می‌کند.
4.1.3. مدلسازی بدون درز داخل و خارج از منزل
با افزایش تقاضا برای برنامه های کاربردی خدمات مبتنی بر مکان داخلی، ادغام مدل های داخلی و خارجی در یک صحنه نیز موضوع جدیدی است. تا جایی که ما می دانیم، در ادبیات روی همسویی مدل های داخلی و خارجی تمرکز کافی وجود ندارد. کوهن و همکاران [ 110 ] اطلاعات پنجره را برای مطابقت با صحنه های داخلی و خارجی در نظر گرفت. به طور مشابه، کوچ و همکاران. [ 111 ] همچنین بخش‌های خطی پنجره‌ها را شناسایی کرد تا به‌طور خودکار مدل‌های داخلی و خارجی را تراز کند. پیش‌نماهای شکل هندسی پنجره‌ها اطلاعات مهمی را برای اتصال مدل‌های داخلی و خارجی فراهم می‌کند، که بینش کلیدی را برای مدل‌سازی بدون درز داخلی و خارجی ارائه می‌دهد. با این وجود، روش های موجود توسط این پیشین های شکل هندسی محدود شده اند.

4.2. مدلسازی معنایی

بر خلاف مدل‌سازی هندسی، که به محتوای آن اهمیتی نمی‌دهد، مدل‌سازی معنایی عمدتاً بر برچسب‌گذاری معنایی (مثلاً انواع شی) تمرکز می‌کند، که نقش مهمی در مدل‌های داخلی غنی از لحاظ معنایی و دقیق هندسی دارد. علاوه بر این، مجموعه داده‌های عمومی، مانند SUN RGB-D، ScanNet، NYU، مجموعه داده معنایی 2D-3D-Stanford، Matterport3D، و غیره، حاشیه‌نویسی معنایی متراکم پیکسلی یا نقطه‌ای را برای ارزیابی عملکرد نتایج تقسیم‌بندی معنایی به دست آمده ارائه می‌کنند. از روش های مختلف بیشتر تحقیقات قبلی عمدتاً بر ویژگی‌های دست ساز به عنوان ورودی طبقه‌بندی‌کننده پرکاربرد برای طبقه‌بندی خودکار و مدل‌های گرافیکی احتمالی، مانند میدان‌های تصادفی شرطی (CRF) تکیه داشتند [ 33 ، 112]. همچنین، فیلدهای تصادفی مارکوف (MRFs) به طور سنتی برای رمزگذاری اطلاعات متنی در بخش‌بندی معنایی استفاده می‌شوند. شکل 12 چارچوب طبقه بندی کلی را بر اساس ویژگی های دست ساز خلاصه می کند. سیلبرمن و فرگوس [ 33 ] یک مدل مبتنی بر CRF را ایجاد کردند، ترکیبی از موقعیت 3 بعدی، که از قبل از کانال‌های عمق گرفته شده بود، با ویژگی‌هایی که از کانال‌های عمق و رنگ برای تقسیم‌بندی صحنه‌های داخلی گرفته شده‌اند. رن و همکاران [ 113 ] چارچوب مبتنی بر هسته را برای تبدیل شباهت سطح پیکسل در هر سوپرپیکسل به یک توصیفگر وصله اتخاذ کرد، که سپس با اطلاعات متنی تحت چارچوب MRF ها برای برچسب زدن تصاویر RGB-D ادغام شد. سیلبرمن و همکاران [ 34] از نشانه‌های عمق برای قادر ساختن ساختار هندسی دقیق‌تر و دقیق‌تر برای تفسیر سطوح اصلی صحنه‌های داخلی، به عنوان مثال، کف، دیوار، سطوح حمایت‌کننده و نواحی شی، از تصاویر RGB-D و بازیابی روابط پشتیبانی فیزیکی استفاده کرد. گوپتا و همکاران [ 114 ] به طور موثری از اطلاعات عمق برای بهینه‌سازی تقسیم‌بندی تصویر استفاده کرد و ویژگی‌های سوپرپیکسل‌ها را برای طبقه‌بندی خودکار با استفاده از طبقه‌بندی‌کننده جنگل تصادفی و طبقه‌بندی‌کننده ماشین بردار پشتیبانی (SVM) تعریف کرد. خان و همکاران [ 112 ] ظاهر، مکان، مرزها، و چیدمان پیکسل‌ها را در چارچوب CRFها برای استدلال درباره مجموعه‌ای از کلاس‌های معنادار معنایی از تصاویر RGB-D ترکیب کرد. مولر و بهنکه [ 115] یک چارچوب مبتنی بر CRF را بدون اطلاعات قبلی در مورد چیدمان صحنه، که در آن رنگ، عمق و ویژگی‌های صحنه سه‌بعدی گنجانده شده بود، برای حاشیه‌نویسی معنایی تصاویر RGB-D ایجاد کرد. دنگ و همکاران [ 116 ] از ساختار هندسی سه بعدی مشتق شده از Kinect استفاده کامل کرد و محدودیت هم‌وقوع شی جهانی، محدودیت رابطه ارتفاع نسبی و محدودیت رابطه پشتیبانی محلی را با استفاده از یک چارچوب مبتنی بر CRF برای تقسیم‌بندی و حاشیه‌نویسی RGB-D یکپارچه کرد. تصاویر صحنه های داخلی متأسفانه، این روش‌های مرسوم معمولاً شامل تقسیم‌بندی از پایین به بالا، استخراج ویژگی و طبقه‌بندی می‌شوند و نتایج نهایی آنها به نتایج هر مرحله بستگی دارد [ 3 ].
با در دسترس بودن یک شبکه عصبی کانولوشنال (CNN) در بسیاری از کاربردها، معماری‌های مختلف مبتنی بر CNN برای استخراج ویژگی‌های معنایی سطح بالا برای تقسیم‌بندی معنایی در سال‌های اخیر توسعه یافته‌اند. بدون نیاز به ویژگی های مهندسی شده، فارابت و همکاران. [ 117 ] بافت، شکل و اطلاعات زمینه‌ای را از مناطق با اندازه‌های چندگانه در مرکز هر پیکسل برای استخراج بردارهای ویژگی متراکم با استفاده از معماری CNN برای برچسب‌گذاری صحنه، ضبط کرد. به دنبال ایده روش CNN منطقه ای (R-CNN) [ 118 ]، گوپتا و همکاران. [ 119] ارتفاع از سطح زمین، زاویه با گرانش برای هر پیکسل و نابرابری افقی را کدگذاری کرد. سپس، آنها مجموعه ای از مناطق مورد علاقه را از یک تصویر ورودی استخراج کردند، ویژگی های هر منطقه استخراج شده را با استفاده از معماری CNN محاسبه کردند، و هر منطقه استخراج شده را با استفاده از طبقه بندی کننده SVM برای تشخیص شی طبقه بندی کردند. در نهایت، آنها یک چارچوب طبقه‌بندی مبتنی بر پیکسل‌های فوق‌العاده [ 114 ] بر روی خروجی آشکارسازهای شی برای تقسیم‌بندی صحنه معنایی ایجاد کردند. اگرچه آنها می توانند یک نمایش ویژگی قدرتمند بر اساس معماری های CNN ایجاد کنند، این روش های مبتنی بر پیشنهاد منطقه ای مبتنی بر CNN مقدار زیادی از محاسبات مکرر را نشان می دهند و خود سیستم را وادار می کنند که خطاهای بالقوه در الگوریتم تقسیم بندی جلویی را مرتکب شود [ 120 ].
برای مقابله با محدودیت‌هایی که این روش‌های پیشنهادی منطقه مبتنی بر CNN از آن رنج می‌برند، روش‌های مبتنی بر شبکه کاملاً کانولوشن (FCN) [ 121 ] استخراج ویژگی کارآمد و آموزش انتها به انتها را نشان می‌دهند، و بنابراین برای تقسیم‌بندی معنایی محبوبیت فزاینده‌ای پیدا کرده‌اند. شکل 13 چارچوب طبقه بندی سرتاسری را بر اساس یادگیری عمیق ترسیم می کند، جایی که برخی از ماژول های معمولی [ 122 ، 123 ، 124 ] خلاصه می شوند. علاوه بر این، این نوع شبکه می تواند ورودی هایی با اندازه دلخواه بگیرد و خروجی هایی با اندازه متناظر تولید کند. حاضرباس و همکاران [ 125] یک معماری مبتنی بر رمزگذار-رمزگشا ایجاد کرد، که در آن نشانه‌های عمق تکمیلی در نقشه‌های ویژگی RGB استخراج‌شده در طول روش‌های رمزگذار برای تقسیم‌بندی معنایی داخلی ترکیب شدند. حسین و همکاران [ 3 ] ویژگی های معنایی تصاویر رنگی، ویژگی های هندسی و ویژگی پیشنهادی فاصله از دیوار را برای تقسیم بندی کلاس شی صحنه های داخلی ترکیب کرد. جیانگ و همکاران [ 126 ] یک شبکه عصبی کاملاً کانولوشنال مبتنی بر RGB-D را با یک میدان تصادفی شرطی کاملاً متصل حساس به عمق ترکیب کرد تا نتایج تقسیم‌بندی معنایی را اصلاح کند. چنگ و همکاران [ 127] اطلاعات بصری و هندسی محلی را برای بازیابی مرزهای اشیاء تیز گنجاند و از یک لایه همجوشی دروازه‌ای برای تنظیم ترکیب نشانه‌های RGB و عمق برای بهبود عملکرد تشخیص اشیا استفاده کرد. لین و همکاران [ 128 ] از نشانه‌های عمق برای تقسیم صحنه به لایه‌های متعدد با ویژگی‌های بصری مشابه استفاده کرد و سپس یک میدان دریافتی آگاه از زمینه را برای استفاده کامل از ویژگی‌های بصری مشترک صحنه‌های مشاهده‌شده پیشنهاد کرد. در نهایت، آنها یک مدل شبکه مبتنی بر چند شاخه را برای تقسیم‌بندی تصاویر RGB-D پیاده‌سازی کردند. لی و همکاران برای بهره برداری کافی از اطلاعات زمینه ای. [ 129] یک FCN دو جریانی را برای تعیین ویژگی‌های RGB و عمق انجام داد و به تدریج این ویژگی‌ها را از سطح بالا به سطح پایین برای تقسیم‌بندی معنایی صحنه‌های داخلی ترکیب کرد. جیانگ و همکاران [ 130 ] یک معماری رمزگذار-رمزگشا برای استخراج اطلاعات RGB و اطلاعات عمقی به طور جداگانه و ترکیب اطلاعات در چندین لایه برای تقسیم بندی معنایی داخلی ایجاد کرد. با ترکیب اطلاعات عمق، می توان اطلاعات هندسی مکانی را که نسبت به تغییرات و ظواهر روشنایی تغییر ناپذیرتر است، برای بهبود تقسیم بندی معنایی به دست آورد. گوو و چن [ 131] یک CNN عمیق برای تخمین نقشه عمق از یک تصویر RGB منفرد اتخاذ کرد و تصویر عمق تخمینی را با تصویر RGB اصلی برای بهبود عملکرد تقسیم‌بندی معنایی داخلی ادغام کرد.
به طور خلاصه، در مقایسه با روش‌های مبتنی بر ویژگی دست ساز، یک چارچوب پایان به پایان مبتنی بر معماری یادگیری عمیق، عملکرد برتری را نشان می‌دهد که در آن مقیاس‌های مختلف اطلاعات استخراج و تحت یک ساختار سلسله مراتبی ترکیب می‌شوند. در همین حال، توانایی محاسباتی قوی، به ویژه هنگام استفاده از واحد پردازش گرافیکی (GPU)، امکان استفاده از داده های در مقیاس بزرگ را برای یادگیری فراهم می کند. علاوه بر این، به دلیل توانایی برتر در تجمیع اطلاعات، عملیات کانولوشن نه تنها از داده های منظم/ساختار یافته (مثلاً تصویر یا تصویر RGB-D)، بلکه از داده های غیرساختار یافته (مثلاً ابرهای نقطه ای) استفاده می کند که راه حل های بیشتری را ارائه می دهد. برای تفسیر بهتر داده های صحنه داخلی و امکان اطلاعات بیشتر از دیدگاه های مختلف برای تصمیم گیری.

4.3. مدل سازی توپولوژیکی

بر خلاف فضاهای بیرونی، که در آن یک مکان خاص توسط سیستم های مرجع مختصات تعریف و نشان داده می شود، موقعیت در یک فضای داخلی معمولاً با استفاده از یک شناسه سلول یا یک کد نمادین مشخص می شود. علاوه بر این، فاصله بین هر دو موقعیت در یک فضای بیرونی را می توان با طول خطی بین آن تعیین و محاسبه کرد. با این حال، وضعیت در یک فضای داخلی متفاوت است و تحت تأثیر ساختارهای معماری (مانند دیوارها و درها) قرار می گیرد. در نتیجه، هر مدل اطلاعات مکانی مناسب برای فضای بیرونی به دلیل تفاوت‌هایشان (مانند تأثیرات ساختارهای معماری و فقدان سیگنال‌های سیستم ناوبری ماهواره‌ای جهانی (GNSS)) نمی‌تواند به سادگی در فضای داخلی اعمال شود. بنابراین، برای مدیریت و نگهداری اطلاعات پیچیده فضای داخلی به طور موثر،132 ]. یعنی، نمایش غنی از لحاظ معنایی یک محیط داخلی نه تنها به هندسه و معناشناسی نیاز دارد، بلکه به توپولوژی [ 74 ] نیز نیاز دارد که اطلاعات مفیدی در مورد اشیاء هندسی مانند مکان درها یا نقاط خروجی در یک ساختمان ارائه می‌کند تا قابلیت مسیریابی پویا را فراهم کند. و حرکت درب به در [ 133 ]. همانطور که در شکل 14 نشان داده شده است ، یک نمودار دوگانه برای نشان دادن روابط اتصال (خطوط جامد سیاه) و روابط مجاورت (خطوط چین دار قرمز) ساخته شده است [ 80 ]. بنابراین، بازیابی روابط فضایی نقش مهمی در برنامه‌های کاربردی داخلی دارد، از برنامه‌ریزی مسیر و ناوبری داخلی تا خدمات مبتنی بر بومی‌سازی.
توپولوژی روشی را پیشنهاد می‌کند که در آن اتاق‌ها، راهروها، پله‌ها و درها به هم مرتبط یا چیده شده‌اند، معمولاً اطلاعات زیر را ارائه می‌دهند: “کدام اتاق مجاور کدام اتاق است؟” و “کدام در کدام اتاق را به هم وصل می کند؟” [ 134 ] روش‌های موجود برای مدل‌سازی روابط توپولوژیکی داخلی به طور کلی می‌توانند به سه دسته طبقه‌بندی شوند: مدل‌های روش تقسیم‌بندی، مدل‌های شبکه‌ای و مدل‌های ترکیبی. بر اساس این مدل‌های توپولوژیکی داخلی، تحلیل فضایی پیچیده (به عنوان مثال، یافتن کوتاه‌ترین و طبیعی‌ترین مسیر برای موقعیت‌های خاص) می‌تواند پیاده‌سازی شود [ 135 ]]. روش تقسیم فضای داخلی را به مجموعه ای از سلول های غیر همپوشانی تقسیم می کند تا روابط توپولوژیکی آنها را تجزیه و تحلیل و استخراج کند، که معمولاً توسط ساختارهای گراف گره و لبه نشان داده می شود. ترون و همکاران [ 136 ] از شبکه های عصبی مصنوعی و ادغام بیزی برای استخراج اطلاعات سطح بالا از یک نقشه شبکه، که در آن نقاط بحرانی در نمودار Voronoi شناسایی شدند، برای تولید یک نقشه توپولوژیکی استفاده کردند. جو و همکاران [ 137 ] تشخیص درب مجازی مبتنی بر ویژگی گوشه را انجام داد و یک الگوریتم ژنتیک را برای تولید یک نقشه توپولوژیکی از نقشه شبکه اشغال استفاده کرد. پرتغال و روچا [ 138 ] همچنین یک نمودار توپولوژیکی ساده را از نقشه شبکه استخراج کردند تا به وظیفه ناوبری کمک کنند. یانگ و وربویز [ 139] یک نقشه ترکیبی را که هم هندسه و هم اطلاعات معنایی را در بر می گرفت، به ساختارهای داخلی مبتنی بر نمودار تبدیل کرد تا توپولوژی و اتصال را توصیف کند. تران و همکاران [ 134 ] ابرهای نقطه ای را به فضای قابل کشتیرانی و غیرقابل هدایت تقسیم کرد و سپس از قوانین دستور زبان برای بازسازی روابط توپولوژیکی استفاده کرد. به جای تقسیم بندی فضاهای داخلی، Sithole و همکاران. [ 140 ] یک نمودار کلی از فضاهای داخلی با ساده سازی مکرر نقشه های طبقه آنها ساخت. بر اساس ساختارهای نمودار، روش تقسیم بندی از نظر تحلیل مسیر و پرس و جو کارایی بالایی دارد، اما اطلاعات مکان مکانی را نادیده می گیرد. مدل‌های شبکه‌ای بر اساس روش مبتنی بر وکسل برای در نظر گرفتن اندازه مسیر برای ارائه چندین مسیر داخلی به کاربران ایجاد شده‌اند. دمین و همکاران [ 141] محیط داخلی را بر اساس یک شبکه مثلثی نامنظم نشان داد و تحلیل مسیریابی را پیاده سازی کرد. لی و همکاران [ 142 ] یک مدل مبتنی بر گراف شبکه ای برای نشان دادن یک فضای داخلی با در نظر گرفتن ویژگی های ساختاری و فضایی آن ایجاد کرد و پتانسیل مدل پیشنهادی را از طریق تحلیل فضای داخلی نشان داد. آرجونا و همکاران [ 143 ] نگاشت فضای داخلی شبکه اشغال ساده برای روبات های کم هزینه. خو و همکاران [ 144] اطلاعات هندسی و معنایی مورد نیاز را از مدل BIM استخراج کرد و با در نظر گرفتن موانع یک شبکه ناوبری شبکه دو بعدی ایجاد کرد. در مقایسه با روش تقسیم‌بندی، مدل‌های شبکه اطلاعات موقعیتی را حفظ می‌کنند اما حجم داده‌ها و پیچیدگی محاسباتی را افزایش می‌دهند و همچنین کارایی تحلیل فضایی را کاهش می‌دهند. برای ترکیب مزایای روش تقسیم بندی و مدل های شبکه ای منظم و کاهش محدودیت های آنها، توسعه یک مدل ترکیبی می تواند تعادل یک مدل واحد را بهبود بخشد. لی و لی [ 145 ] یک مدل نمایش توپولوژی داخلی مبتنی بر شبکه را پیشنهاد کردند، که قادر است یک نمایش صریح نه تنها مهار و همپوشانی، بلکه مجاورت مفهوم شبکه را نیز ارائه دهد. لین و همکاران [ 146] یک نمودار توپولوژی و یک مدل شبکه را برای بهبود عملکرد تحلیل فضایی و ارائه اطلاعات موقعیتی ترکیب کرد.
به منظور در دسترس قرار دادن قابلیت همکاری داده‌های فضایی داخلی، چندین استاندارد داده مکانی (به عنوان مثال، IFC، CityGML و IndoorGML) [ 147 ] در سال‌های اخیر برای تعریف، سازمان‌دهی و ذخیره محیط‌های فیزیکی داخلی با جزئیات توسعه یافته‌اند. در میان این استانداردهای داده، هر کدام نیازهای منحصر به فرد یک برنامه خاص را برآورده می کنند و مطالعات متعددی در مورد تولید توپولوژی ارائه شده است. خان و همکاران [ 148 ] یک تبدیل خودکار هندسی، معنایی و توپولوژیکی از یک مدل ساختمان سه بعدی معنایی موجود (به عنوان مثال، IFC یا CityGML LoD4) به IndoorGML انجام داد. میروهابی و عباسپور [ 149 ] فایل داده IndoorGML را از فایل OpenStreetMap استخراج کردند. با اشاره به IndoorGML، ژو و همکاران. [ 150] GML موقعیت مکانی چند بعدی داخلی را عمدتاً برای مکان یابی داخلی و ناوبری تعریف کرده است. تئو و یو [ 151 ] روابط توپولوژیکی را از BIM به یک مدل شبکه داخلی ذخیره شده در ساختارهای IndoorGML تبدیل کردند. سریواستاوا و همکاران [ 152 ] موجودیت های هندسی مرتبط و روابط توپولوژیکی آنها را از نقشه های CAD استخراج کرد و اطلاعات معنایی را برای گسترش IndoorGML موجود اضافه کرد. تسما و همکاران [ 153 ] هم اطلاعات معنایی و هم اطلاعات توپولوژیکی را از یک نقشه شبکه اشغال استخراج کرد و این اطلاعات استخراج شده را به یک نمودار رابطه گره معنایی ذخیره شده در قالب IndoorGML ترجمه کرد. با انگیزه یک مطالعه موردی موزه، Kontarinis و همکاران. [ 154] با ترکیب مدل‌های مسیر معنایی موجود در فضای باز و مدل نمادین فضای داخلی سلسله مراتبی غنی از لحاظ معنایی، یک مدل مسیر داخلی معنایی ایجاد کرد. Flikweert و همکاران [ 155 ] به طور خودکار یک نمودار ناوبری را از ابرهای نقطه متحرک مبتنی بر مسیر استخراج کرد، که در آن فضاهای متصل، فضاهای قابل پیاده روی، اتاق ها و راهروها شناسایی و سازماندهی شدند و آنها را در قالب IndoorGML ذخیره کرد. مورتاری و همکاران [ 156 ] یک مدل ناوبری با استفاده از اطلاعات هندسی از CityGML پیشنهاد کرد و عناصر معنایی (به عنوان مثال، دهانه ها) را در ایجاد مدل ناوبری داخلی برای برآوردن نیازهای انسان معرفی کرد. با شروع از ابرهای نقطه خام، نیکوهمت و همکاران. [ 157] برای انجام ناوبری و برنامه ریزی مسیر، یک روش بازسازی سه بعدی داخلی، که شامل موانع نیز بود، توسعه داد.
اگرچه استانداردهای داده موجود، اطلاعات فضایی دقیق را برای پشتیبانی از کاربردهای داخلی داخلی تعریف، سازماندهی، مدیریت و ذخیره می‌کنند، تلاش‌های بیشتری برای کشف و پیاده‌سازی جنبه‌های بالقوه آن‌ها و تکمیل نسخه‌های فعلی آن‌ها مورد نیاز است، که ممکن است به صراحت در این مقاله توضیح داده نشود. سند استاندارد [ 158 ]. به عنوان مثال، IndoorGML نسخه 1 برای برآوردن الزامات برنامه های ناوبری داخلی (به عنوان مثال، سرویس های مبتنی بر مکان داخلی و خدمات مسیریابی) توسعه یافته است، اما انتظار می رود سایر الزامات (مانند مدیریت تسهیلات) در نسخه های آینده آن انجام شود [ 145 ]]. علاوه بر این، ترکیباتی برای تکمیل یکدیگر برای برآوردن نیازهای خاص کاربردهای مختلف داخلی وجود دارد. کیم و همکاران به عنوان مکمل یکدیگر. [ 159 ] داده های IndoorGML را از CityGML LoD4 تولید کرد و ارجاعات خارجی را از IndoorGML به یک شی در CityGML LoD4 ارائه کرد. لیو و همکاران [ 160 ] IndoorGML را با IndoorLocationGML یکپارچه کرد، جایی که IndoorGML تقسیم بندی فضاهای داخلی را ارائه می دهد، در حالی که معناشناسی مکان در IndoorLocationGML می تواند معرفی شود. برای پرداختن به محدودیت‌های سطح استاندارد شده جزئیات (LoD)، تانگ و همکاران. [ 161 ] یک مشخصات LoD داخلی را با استفاده از IFC و IndoorGML گسترش داد تا به یک مشخصات LoD کامل برای مدل‌های ساختمان سه بعدی دست یابد. زنگ و کانگ [ 162] عناصر ناوبری را از داده های RGB-D استخراج کرد و آنها را تحت چارچوب IndoorGML کدگذاری کرد. آلاتاس و همکاران [ 163 ] حقوق دسترسی فضاهای داخلی را در نظر گرفت و یک مدل مفهومی ایجاد کرد که مدل دامنه مدیریت زمین (LADM) و IndoorGML را برای تعریف حقوق، محدودیت‌ها و مسئولیت‌های کاربران ترکیب می‌کند. علاوه بر این، برخی توصیه ها با هدف بهبود استاندارد آینده مورد بحث قرار گرفته است. دیاکیته و همکاران [ 164 ] اشاره کرد که چندین مفهوم (به عنوان مثال، فاصله سلولی فرعی) در نسخه فعلی IndoorGML باید بهبود یابد، و چندین معیار را برای انجام خودکار فرآیندهای تقسیم بندی داخلی پیشنهاد کرد.

5. روندها و چالش ها

در سال های اخیر، بازسازی سه بعدی محیط های داخلی به طور فزاینده ای برای توسعه بسیاری از برنامه های کاربردی داخلی، مانند هدایت ناوبری، مدیریت اضطراری، تعمیر و نگهداری ساختمان، و برنامه ریزی نوسازی، و همچنین طیف وسیعی از خدمات مبتنی بر مکان داخلی (مثلا ، راهیابی و تحویل محتوای متنی). بنابراین، این بررسی ادبیات خلاصه‌ای در رابطه با تکنیک‌های پیشرفته برای بازسازی سه بعدی محیط‌های داخلی ارائه می‌کند. با توسعه مداوم تحقیقات، چالش ها و روند تکنیک های فعلی در این بخش مورد بحث قرار می گیرد.

5.1. فرض غیر منهتن

محدودیت عمده در روش‌های موجود عموماً به فرض قوی منهتن مربوط می‌شود [ 92 ، 94 ، 96 ، 97 ، 102 ، 103 ، 104 ، 109 ]، که در آن ساختارهای اصلی ساختمان‌ها مستطیل شکل و متعامد فرض می‌شوند. با این حال، فضاهای داخلی با ساختارهای هندسی پیچیده (به عنوان مثال، دیوارهای استوانه‌ای، سقف‌های کروی، چیدمان L شکل، یا سایر سازه‌های غیرمسطح [ 20 ، 95 ، 165 ، 166 ، 167 )]) در محیط های داخلی فعلی رخ می دهد. بنابراین، بازیابی یک مدل کامل سه بعدی داخلی با اشکال هندسی دلخواه یک موضوع جالب برای مطالعه آینده است [ 95 ، 168 ].

5.2. بهینه سازی مشارکتی چند کاره

هدف یک کار واحد معمولاً نمی تواند اطلاعات کافی برای دستیابی قوی به نیازهای ایده آل تولید کند. بهینه سازی مشارکتی چند وظیفه ای اطلاعات اضافی و مکمل را از دیدگاه های مختلف برای کمک به تکمیل کار ارائه می دهد. به عنوان مثال، برای تخمین مشترک چیدمان اتاق و برای تشخیص اشیاء سه بعدی [ 106 ، 169 ]، تخمین چیدمان اتاق اطلاعاتی از محدودیت های فضایی برای تشخیص اشیا ارائه می دهد، در حالی که تشخیص شی نیز اطلاعات انسداد را برای تخمین چیدمان اتاق ارائه می دهد، بنابراین یکدیگر را تکمیل می کنند. مثال دیگر بهینه سازی مشترک چیدمان اتاق و وظیفه تقسیم بندی معنایی است [ 109]. علاوه بر این، بهینه‌سازی مشارکتی چند وظیفه‌ای همچنین می‌تواند به وزن‌های مشترک در معماری‌های شبکه طراحی‌شده برای کاهش هزینه‌های آموزشی و محاسباتی دست یابد [ 170 ، 171 ]. بنابراین، ادغام تکنیک‌های بهینه‌سازی مشارکتی چند وظیفه‌ای و یادگیری عمیق نیز تمرکز آینده برای مدل‌سازی و کاربردهای محیط داخلی خواهد بود.

5.3. درک صحنه داخلی با ترکیب هر دو سازگاری مکانی و زمانی

کارهای قبلی عمدتاً بر مدل‌سازی اطلاعات فضایی یا زمینه فضایی بر اساس یک تصویر RGB(-D) واحد متمرکز شده‌اند، که در آن سازگاری فضایی به طور گسترده به عنوان یک محدودیت ذاتی در مدل‌سازی و برنامه‌های کاربردی محیط داخلی مورد استفاده قرار گرفته است. با این حال، توجه کمی به سازگاری توالی تصاویر [ 172 ] شده است. بنابراین، سازگاری زمانی توالی‌ها در بسیاری از مدل‌سازی‌های داخلی و کاربردهای دنیای واقعی، مسئله‌ای است که باید حل شود [ 127 ، 173 ، 174 ، 175 ، 176 ، 177 ، 178 ، 179 .] از آنجایی که، برای صحنه‌های پویا پیچیده، اشیاء متحرک شکل‌ها و ظواهر مشابهی از نظر مکانی و زمانی از خود نشان می‌دهند [ 180 ]. از این رو، ترکیب هر دو سازگاری مکانی و زمانی نیز به منظور بهبود استحکام درک صحنه های داخلی (به عنوان مثال، تقسیم بندی معنایی و تشخیص شی) مهم خواهد بود.

5.4. بازسازی خودکار مدل های داخلی با سطوح مختلف جزئیات

تا به حال، مدل سازی سازه ای ساختمان ها تنها بر عناصر اصلی سازه ای (به عنوان مثال، دیوارها، کف، سقف و دهانه ها) متمرکز بوده است [ 14 ، 76 ، 79 ، 83 ، 181 ، 182 ]. برای تسهیل طیف وسیعی از خدمات مبتنی بر مکان، یک مدل داخلی سه بعدی دقیق تر با مبلمان داخلی (مخصوصاً موانع) باید برای کاربردهای ریزدانه تعریف و ایجاد شود [ 183 ]، که در آن ساختارهای فضایی آن توضیح داده شده و مبلمان داخلی نیز مدل سازی شده است. [ 10 ، 184]. اگرچه اشیاء داخلی در LoD4 دخیل هستند، بدیهی است که تعریف LoD فعلی ممکن است برای پاسخگویی به نیازهای تنوع رو به افزایش کاربردها، که ممکن است به ساختارهای داخلی با سطوح دقت متفاوت نیاز داشته باشد، کافی نباشد. در کار آینده، ویژگی‌های هندسی بیشتری باید به منظور تولید مدل‌های اطلاعات فضایی قوی‌تر با هندسه دقیق و معناشناسی غنی مورد بررسی قرار گیرد.

5.5. ادغام بدون درز فضای داخلی-خارجی

برای اینکه مردم بتوانند به طور یکپارچه بین ساختمان ها و مناطق اطراف حرکت کنند، یک نمایش کامل از ساختمان های داخلی و خارجی برای ارائه پشتیبانی در زمینه داخلی-خارج ضروری است [ 161 ، 185 ]. با این حال، این به دلیل تفاوت در ساختارهای فیزیکی، روابط فضایی بین موجودات، و غیره چالش برانگیز است [ 186 ]. به عنوان مثال، تناظرهای بصری کمی وجود دارد که بخشی از هر دو مدل داخلی و خارجی برای هم ترازی آنها باشد [ 111 ]. علاوه بر این، انجام یک بازسازی کامل برای گرفتن کل صحنه از بیرون به داخل به دلیل دریفت یا فقدان ویژگی های منطبق در بیشتر موارد، نادرست است [ 111 ]]. بنابراین، دوخت قوی مدل‌های داخلی و خارجی با هم بدون/چند همپوشانی بصری به یک موضوع فعال تبدیل شده است.

6. نتیجه گیری

این مقاله یک بررسی جامع را به منظور تحلیل و خلاصه سازی بازسازی سه بعدی محیط های داخلی انجام داد. به دلیل اهمیت توسعه تکنیک‌های بازسازی سه‌بعدی برای محیط‌های داخلی، ابتدا شرح مختصری از مجموعه داده‌های معیار موجود ارائه کردیم که می‌تواند برای ارزیابی عملکرد الگوریتم‌های مختلف و همچنین روش‌های جمع‌آوری داده‌ها در مورد فضاهای داخلی سه بعدی استفاده شود. . از آنجایی که بازسازی صحنه های داخلی از نظر دقت و دقت بسیار رضایت بخش نیست، تعداد فزاینده ای از مجموعه داده ها به عنوان معیار برای امکان مقایسه بین روش های مختلف بازسازی (از جمله هندسی، معنایی و توپولوژیکی) و ارتقای وضعیت بین المللی منتشر می شود. تحقیق هنر در همین حال، با توسعه فناوری حسگر،
بنابراین، این بررسی، تجزیه و تحلیل دقیق و خلاصه‌ای از مطالعات موجود در رابطه با بازسازی سه‌بعدی محیط‌های داخلی را ارائه می‌دهد که می‌توان آن‌ها را با توجه به اصول ذاتی و الزامات کاربردی به دسته‌های مختلفی تقسیم کرد. به‌جای ارائه یک تحلیل کمی در میان روش‌های مختلف، ما عمدتاً بر معرفی نظریه‌های مربوطه (به عنوان مثال، بازسازی هندسی، معنایی و توپولوژیکی محیط‌های داخلی) و مزایا و معایب آنها تمرکز کردیم. با توجه به بازسازی هندسی، اکثر روش های موجود بر اساس فرضیه قوی منهتن است و عمدتاً بر بازسازی سازه های اصلی معماری متمرکز است. بازسازی مبلمان داخلی و مدل سازی بدون درز فضاهای داخلی و خارجی هنوز در مراحل اولیه است. علاوه بر این، اگرچه ویژگی‌های به هم ریخته و مسدود محیط‌های داخلی هنوز چالش‌های بزرگی را برای مدل‌سازی معنایی ایجاد می‌کند، تکنیک‌های یادگیری عمیق و قابلیت عملیاتی داده قوی، به‌ویژه بر اساس استفاده از یک GPU، می‌تواند تعمیم مدل‌های قابل یادگیری را برای به دست آوردن نتایج تفسیر بهتر بهبود بخشد. علاوه بر این، ساختارهای هرمی سلسله مراتبی معماری‌های یادگیری عمیق، طرح‌های مشترک چند وظیفه‌ای را قادر می‌سازد تا به طور مشترک یکدیگر را با استفاده از اطلاعات اضافی و مکمل از دیدگاه‌های مختلف بهینه‌سازی کنند، که پتانسیل آنها را برای استفاده در بازسازی سه بعدی محیط‌های داخلی نشان می‌دهد. علاوه بر این، وقوع استانداردهای داده‌های مکانی (مانند IFC، CityGML و IndoorGML) برای تعریف، سازمان‌دهی و ذخیره‌سازی دقیق محیط‌های فیزیکی داخلی مفید است. و نیازهای منحصر به فرد یک برنامه خاص را برآورده می کند. اگرچه استانداردهای داده موجود، اطلاعات فضایی دقیق را برای پشتیبانی از کاربردهای داخلی داخلی تعریف، سازماندهی، مدیریت و ذخیره می‌کنند، تلاش‌های بیشتری برای کشف و پیاده‌سازی جنبه‌های بالقوه آن‌ها و تکمیل نسخه‌های فعلی آن‌ها مورد نیاز است، که ممکن است به صراحت در این مقاله توضیح داده نشود. سند استاندارد
در نهایت، چالش‌ها و روندهایی که تکنیک‌های فعلی با آن مواجه هستند، مانند بازسازی صحنه‌های داخلی بدون فرض قوی منهتن، بهینه‌سازی مشارکتی چند کاره برای تکمیل یکدیگر، درک صحنه با ترکیب همسانی مکانی و زمانی، بازسازی خودکار مدل‌های داخلی با مدل‌های مختلف. سطوح جزئیات، و ادغام یکپارچه فضای داخلی و خارجی، خلاصه و مورد بحث قرار گرفت.

منابع

  1. آژانس حفاظت از محیط زیست ایالات متحده ساختمان ها و تأثیر آنها بر محیط زیست: خلاصه آماری ; کارگروه ساختمان سبز آژانس حفاظت از محیط زیست ایالات متحده: واشنگتن، دی سی، ایالات متحده آمریکا، 2009.
  2. داسگوپتا، اس. نیش، ک. چن، ک. Savarese, S. Delay: تخمین چیدمان فضایی قوی برای صحنه های بهم ریخته داخلی. در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو، لاس وگاس، NV، ایالات متحده، 26 ژوئن تا 1 ژوئیه 2016. صص 616-624. [ Google Scholar ]
  3. حسین، ف. شولز، اچ. دلن، بی. توراس، سی. Benke, S. ترکیب ویژگی های معنایی و هندسی برای تقسیم بندی کلاس شی صحنه های داخلی. ربات IEEE. خودکار Lett. 2016 ، 2 ، 49-55. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  4. سکویرا، وی. Gonçalves، JG; Ribeiro، MI بازسازی 3 بعدی محیط های داخلی. در مجموعه مقالات سومین کنفرانس بین المللی IEEE در مورد پردازش تصویر، لوزان، سوئیس، 19 سپتامبر 1996; ص 405-408. [ Google Scholar ]
  5. ایسیکداغ، یو. زلاتانوا، اس. Underwood، J. یک مدل BIM-oriented برای پشتیبانی از الزامات ناوبری داخلی. محاسبه کنید. محیط زیست سیستم شهری 2013 ، 41 ، 112-123. [ Google Scholar ] [ CrossRef ]
  6. احمد، ع.ا. الشابطی، م. الزبیری، الف. الگوریتم راهنمایی اضطراری داخلی بر اساس شبکه‌های حسگر بی‌سیم. در مجموعه مقالات کنفرانس بین المللی 2015 رایانش ابری (ICCC)، ریاض، عربستان سعودی، 26-29 آوریل 2015؛ صص 1-5. [ Google Scholar ]
  7. چن، سی. Tang, L. طراحی گردش کار مدیریت یکپارچه مبتنی بر BIM برای برنامه ریزی و برنامه ریزی هزینه تعمیر و نگهداری پارچه ساختمان. خودکار ساخت و ساز 2019 ، 107 ، 102944. [ Google Scholar ] [ CrossRef ]
  8. تیان، ایکس. شن، آر. لیو، دی. ون، ی. وانگ، ایکس. تجزیه و تحلیل عملکرد مکان یابی داخلی بر اساس اثر انگشت RSS. IEEE Trans. اوباش محاسبه کنید. 2016 ، 16 ، 2847-2861. [ Google Scholar ] [ CrossRef ]
  9. چن، ک. لای، ی.-ک. هو، اس.-م. مدل سازی صحنه داخلی سه بعدی از داده های RGB-D: یک نظرسنجی محاسبه کنید. Vis. رسانه 2015 ، 1 ، 267-278. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  10. ژانگ، ی. لیو، ز. میائو، ز. وو، دبلیو. لیو، ک. Sun, Z. مدل‌سازی صحنه داخلی مبتنی بر داده‌های تک تصویر. محاسبه کنید. نمودار. 2015 ، 53 ، 210-223. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  11. انگل، جی. استوکلر، جی. Cremers, D. SLAM مستقیم در مقیاس بزرگ با دوربین های استریو. در مجموعه مقالات کنفرانس بین المللی IEEE/RSJ 2015 در مورد ربات ها و سیستم های هوشمند (IROS)، هامبورگ، آلمان، 28 سپتامبر تا 2 اکتبر 2015؛ صفحات 1935-1942. [ Google Scholar ]
  12. لیوا، جی. مارتینز، پی. پرز، ای. اوردیالز، سی. Sandoval, F. بازسازی 3 بعدی محیط استاتیک داخلی با ادغام داده های سونار و ویدئو. در مجموعه مقالات سمپوزیوم بین المللی در مورد سیستم های رباتیک هوشمند، تولوز، فرانسه، 18 تا 20 ژوئیه 2001. [ Google Scholar ]
  13. یانگ، اچ. ژانگ، اچ. مدلسازی ساختار اتاق از پانورامای داخلی. در مجموعه مقالات سیزدهمین کنفرانس بین المللی ACM SIGGRAPH درباره پیوستار واقعیت مجازی و کاربردهای آن در صنعت، شنژن، چین، 30 نوامبر تا 2 دسامبر 2014. ص 47-55. [ Google Scholar ]
  14. وانگ، سی. هو، اس. ون، سی. گونگ، ز. لی، کیو. سان، ایکس. Li, J. مدلسازی ساختمان داخلی مبتنی بر چارچوب خط معنایی با استفاده از ابر نقطه اسکن لیزری کوله‌ای. ISPRS J. Photogramm. Remote Sens. 2018 , 143 , 150–166. [ Google Scholar ] [ CrossRef ]
  15. بوکاریس، پ. مازلت، دی. Trémeau, A. بازسازی سه بعدی صحنه های داخلی با استفاده از یک تصویر RGB-D. در مجموعه مقالات دوازدهمین کنفرانس بین المللی نظریه و کاربردهای بینایی رایانه (VISAPP 2017)، پورتو، پرتغال، 27 فوریه تا 1 مارس 2017. [ Google Scholar ]
  16. والنتین، جی پی. سنگوپتا، اس. وارل، جی. شاهرکنی، ع. مدل‌سازی معنایی Torr، PH Mesh برای صحنه‌های داخلی و خارجی. در مجموعه مقالات کنفرانس IEEE در مورد دید کامپیوتری و تشخیص الگو، پورتلند، OR، ایالات متحده آمریکا، 23 تا 28 ژوئن 2013. ص 2067–2074. [ Google Scholar ]
  17. یونگ، جی. هونگ، اس. یون، اس. کیم، جی. Heo, J. مدل‌سازی قاب سیمی سه بعدی خودکار سازه‌های داخلی از ابرهای نقطه‌ای با استفاده از تنظیم حداقل مربعات محدود برای BIM ساخته شده. جی. کامپیوتر. مدنی مهندس 2015 ، 30 ، 04015074. [ Google Scholar ] [ CrossRef ]
  18. شائو، تی. خو، دبلیو. ژو، ک. وانگ، جی. لی، دی. Guo, B. یک رویکرد تعاملی برای مدل‌سازی معنایی صحنه‌های داخلی با دوربین rgbd. ACM Trans. نمودار. TOG 2012 , 31 , 136. [ Google Scholar ] [ CrossRef ]
  19. اوچمن، اس. ووک، آر. وسل، آر. Klein, R. بازسازی خودکار مدل های ساختمانی پارامتریک از ابرهای نقطه داخلی. محاسبه کنید. نمودار. 2016 ، 54 ، 94-103. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  20. یانگ، اف. ژو، جی. سو، اف. زو، ایکس. تانگ، ال. لیانگ، ی. زو، اچ. Li, L. بازسازی خودکار فضای داخلی از ابرهای نقطه ای در محیط های چند اتاق با دیوارهای منحنی. Sensors 2019 , 19 , 3798. [ Google Scholar ] [ CrossRef ] [ PubMed ][ نسخه سبز ]
  21. فروز، تی. گروبلر، اف. ریتسنتالر، جی. یو، ک. آکینجی، بی. اکباس، ر. کو، بی. بارون، ا. کلاس‌های بنیاد صنعتی کونز، JC برای مدیریت پروژه – اجرای آزمایشی. ITcon 1999 ، 4 ، 17-36. [ Google Scholar ]
  22. گروگر، جی. کلبه، تی. ناگل، سی. هافله، K.-H. استاندارد رمزگذاری زبان جغرافیایی شهر OGC (CityGML) . کنسرسیوم فضایی باز، 2012. در دسترس آنلاین: https://www.opengis.net/spec/citygml/2.0 (در 17 مه 2020 قابل دسترسی است).
  23. ناصر، م. خان، س. Porikli، F. درک صحنه داخلی در 2.5/3d برای عوامل مستقل: یک بررسی. دسترسی IEEE 2018 ، 7 ، 1859-1887. [ Google Scholar ] [ CrossRef ]
  24. لی، ی. دای، ا. گیباس، ال. Nießner, M. بازیابی شی به کمک پایگاه داده برای بازسازی سه بعدی بلادرنگ. نمودار کامپیوتری انجمن 2015 ، 34 ، 435-446. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  25. شوینگ، AG; هازان، ت. پولفیس، ام. Urtasun، R. پیش بینی ساختار یافته کارآمد برای درک صحنه های داخلی سه بعدی. در مجموعه مقالات کنفرانس IEEE 2012 در مورد دید کامپیوتری و تشخیص الگو، پراویدنس، RI، ایالات متحده آمریکا، 16-21 ژوئن 2012. صص 2815–2822. [ Google Scholar ]
  26. هاندا، ا. ویلان، تی. مک دونالد، جی. دیویسون، AJ معیاری برای کیلومتر شماری بصری RGB-D، بازسازی سه بعدی و SLAM. در مجموعه مقالات کنفرانس بین المللی IEEE 2014 در مورد رباتیک و اتوماسیون (ICRA)، هنگ کنگ، چین، 31 مه تا 7 ژوئن 2014. صص 1524-1531. [ Google Scholar ]
  27. استورم، جی. انگلهارد، ن. اندرس، اف. بورگارد، دبلیو. Cremers, D. معیاری برای ارزیابی سیستم های RGB-D SLAM. در مجموعه مقالات کنفرانس بین المللی IEEE/RSJ 2012 در مورد ربات ها و سیستم های هوشمند، ویلامورا، پرتغال، 7 تا 12 اکتبر 2012. صص 573-580. [ Google Scholar ]
  28. بوری، م. نیکولیک، جی. گوهل، پ. اشنایدر، تی. رهدر، جی. عمری، س. آچتلیک، مگاوات؛ Siegwart, R. مجموعه داده های وسایل نقلیه هوایی میکرو EuRoC. بین المللی ربات جی. Res. 2016 ، 35 ، 1157-1163. [ Google Scholar ] [ CrossRef ]
  29. وانگ، سی. دای، ی. الشیمی، ن. ون، سی. رتسچر، جی. کانگ، ز. Lingua، A. پیشرفت در معیار Isprs در نقشه برداری و موقعیت یابی چندحسی داخلی. بین المللی قوس. فتوگرام حسگر از راه دور اسپات. Inf. علمی 2019 ، XLII-2/W13 ، 1709–1713. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  30. خوشلحم، ک. ویلارینو، LD; پیتر، م. کانگ، ز. آچاریا، دی. معیار Isprs در مدلسازی فضای داخلی. بین المللی قوس. فتوگرام سناتور از راه دور اسپات. Inf. علمی 2017 ، 42 ، 367-372. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  31. آهنگ ها.؛ لیختنبرگ، SP; Xiao, J. Sun rgb-d: مجموعه معیار درک صحنه rgb-d. در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو، بوستون، MA، ایالات متحده آمریکا، 7 تا 12 ژوئن 2015. صص 567-576. [ Google Scholar ]
  32. دای، ا. چانگ، تبر. ساوا، م. هالبر، ام. فانک هاسر، تی. Nießner, M. Scannet: بازسازی های سه بعدی با حاشیه نویسی غنی از صحنه های داخلی. در مجموعه مقالات کنفرانس IEEE در مورد دید کامپیوتری و تشخیص الگو، بارسلون، اسپانیا، 6 تا 13 نوامبر 2011. صص 5828–5839. [ Google Scholar ]
  33. سیلبرمن، ن. Fergus, R. تقسیم‌بندی صحنه داخلی با استفاده از حسگر نور ساختاریافته. در مجموعه مقالات کنفرانس بین المللی IEEE 2011 در کارگاه های بینایی کامپیوتری (کارگاه های آموزشی ICCV)، بارسلون، اسپانیا، 6 تا 13 نوامبر 2011. ص 601-608. [ Google Scholar ]
  34. سیلبرمن، ن. هویم، دی. کهلی، پ. Fergus, R. تقسیم بندی داخلی و استنتاج پشتیبانی از تصاویر rgbd. در کنفرانس اروپایی بینایی کامپیوتر ; Springer: برلین/هایدلبرگ، آلمان، 2012. [ Google Scholar ]
  35. ارمنی، من. ساکس، اس. ضمیر، ع. Savarese، S. داده های معنایی 2 بعدی-3 بعدی مشترک برای درک صحنه های داخلی. arXiv 2017 , arXiv:1702.01105. [ Google Scholar ]
  36. چانگ، آ. دای، ا. فانک هاسر، تی. هالبر، ام. نیسنر، ام. ساوا، م. آهنگ ها.؛ زنگ، ا. Zhang، Y. Matterport3d: یادگیری از داده‌های rgb-d در محیط‌های داخلی. arXiv 2017 , arXiv:1709.06158. [ Google Scholar ]
  37. مارک، جی دبلیو. محمد، ع. vd Houwen، E. van Heijster, R. رادار داخلی SLAM یک برنامه راداری برای دید و محیط های فاقد GPS. در مجموعه مقالات کنفرانس رادار اروپا 2013، نورنبرگ، آلمان، 9 تا 11 اکتبر 2013. ص 471-474. [ Google Scholar ]
  38. ون دایک، تی. de Croon, GC چگونه شبکه های عصبی عمق را در تصاویر منفرد می بینند؟ در مجموعه مقالات کنفرانس بین المللی IEEE در مورد بینایی رایانه، سئول، کره، 27 تا 28 اکتبر 2019؛ صص 2183-2191. [ Google Scholar ]
  39. لیو، ام. سالزمن، ام. او، X. تخمین عمق گسسته-پیوسته از یک تصویر واحد. در مجموعه مقالات کنفرانس IEEE در مورد دید کامپیوتری و تشخیص الگو، کلمبوس، OH، ایالات متحده آمریکا، 23 تا 28 ژوئن 2014. صص 716-723. [ Google Scholar ]
  40. ژو، دبلیو. سالزمن، ام. او، X. لیو، ام. تجزیه و تحلیل ساختار صحنه داخلی برای تخمین عمق تصویر تک. در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو، بوستون، MA، ایالات متحده آمریکا، 7 تا 12 ژوئن 2015. صص 614-622. [ Google Scholar ]
  41. ادر، م. مولون، پ. Guan, L. Pano Popups: Reconstruction 3D indoor with a Plane-Aware Network. در مجموعه مقالات کنفرانس بین المللی 2019 در 3D Vision (3DV)، کبک، QC، کانادا، 16-19 سپتامبر 2019؛ صص 76-84. [ Google Scholar ]
  42. روی، ا. تخمین عمق تک چشمی Todorovic، S. با استفاده از جنگل رگرسیون عصبی. در مجموعه مقالات کنفرانس IEEE در مورد دید کامپیوتری و تشخیص الگو، لاس وگاس، NV، ایالات متحده، 27-30 ژوئن 2016. صص 5506-5514. [ Google Scholar ]
  43. لیو، اف. شن، سی. لین، جی. میدان های عصبی کانولوشنال عمیق برای تخمین عمق از یک تصویر واحد. در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو، بوستون، MA، ایالات متحده آمریکا، 7 تا 12 ژوئن 2015. صص 5162–5170. [ Google Scholar ]
  44. گلدلوکه، بی. اوبری، ام. کولف، ک. Cremers, D. چارچوبی با وضوح فوق العاده برای بازسازی چند نمای با دقت بالا. بین المللی جی. کامپیوتر. Vis. 2014 ، 106 ، 172-191. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  45. کالینز، RT یک رویکرد فضایی برای تطبیق واقعی چند تصویر. در مجموعه مقالات کنفرانس CVPR IEEE Computer Society on Computer Vision and Pattern Recognition، سانفرانسیسکو، CA، ایالات متحده آمریکا، 18-20 ژوئن 1996. صص 358-363. [ Google Scholar ]
  46. فوروکاوا، ی. پونس، جی. استریوپسی چند نمای دقیق، متراکم و قوی. IEEE Trans. الگوی مقعدی ماخ هوشمند 2009 ، 32 ، 1362-1376. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  47. گالیانی، اس. لاسینجر، ک. شیندلر، ک. استریوپسی چند نمای موازی انبوه توسط انتشار نرمال سطحی. در مجموعه مقالات کنفرانس بین المللی IEEE در بینایی کامپیوتر، لاس کوندس، شیلی، 11 تا 18 دسامبر 2015. صص 873-881. [ Google Scholar ]
  48. لانگگوث، اف. سونکاوالی، ک. حداپ، س. Goesele، M. استریو چند نمای سایه آگاه. در کنفرانس اروپایی بینایی کامپیوتر ; Springer: برلین/هایدلبرگ، آلمان، 2016. [ Google Scholar ]
  49. هانه، سی. زک، سی. کوهن، ا. Pollefeys، M. بازسازی سه بعدی معنایی متراکم. IEEE Trans. الگوی مقعدی ماخ هوشمند 2016 ، 39 ، 1730-1743. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  50. اولمن، اس. تفسیر ساختار از حرکت. Proc. R. Soc. لندن. سر. B Biol. علمی 1979 ، 203 ، 405-426. [ Google Scholar ]
  51. هارتمن، دبلیو. گالیانی، اس. هاولنا، م. ون گول، ال. شیندلر، کی. شباهت چند پچ را یاد گرفت. در مجموعه مقالات کنفرانس بین المللی IEEE در بینایی کامپیوتر، ونیز، ایتالیا، 22 تا 29 اکتبر 2017؛ صفحات 1586-1594. [ Google Scholar ]
  52. جی، م. گال، جی. ژنگ، اچ. لیو، ی. Fang, L. Surfacenet: یک شبکه عصبی سه بعدی سرتاسر برای استریوپسی چند نمای. در مجموعه مقالات کنفرانس بین المللی IEEE در بینایی کامپیوتر، ونیز، ایتالیا، 22 تا 29 اکتبر 2017؛ صص 2307–2315. [ Google Scholar ]
  53. هوانگ، P.-H. ماتزن، ک. کوپف، جی. آهوجا، ن. هوانگ، J.-B. Deepmvs: یادگیری استریوپسی چند نما. در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو، سالت لیک سیتی، UT، ایالات متحده آمریکا، 18 تا 22 ژوئن 2018؛ ص 2821-2830. [ Google Scholar ]
  54. یائو، ی. لو، ز. لی، اس. نیش، تی. Quan، L. Mvsnet: استنتاج عمق برای استریو چند نمای بدون ساختار. در مجموعه مقالات کنفرانس اروپایی بینایی کامپیوتر (ECCV)، مونیخ، آلمان، 8 تا 14 سپتامبر 2018؛ صص 767-783. [ Google Scholar ]
  55. یائو، ی. لو، ز. لی، اس. شن، تی. نیش، تی. Quan, L. Mvsnet مکرر برای استنتاج عمق استریو چند نمای با وضوح بالا. در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو، لانگ بیچ، کالیفرنیا، ایالات متحده آمریکا، 16 تا 20 ژوئن 2019؛ صص 5525–5534. [ Google Scholar ]
  56. بیلی، تی. Durrant-Whyte, H. محلی سازی و نقشه برداری همزمان (SLAM): قسمت دوم. ربات IEEE. خودکار Mag. 2006 ، 13 ، 108-117. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  57. آوینا، ا. دیوی، م. مدل‌سازی سه بعدی هرناندز AM با حسگر لیزری متحرک برای محیط‌های داخلی. IFAC Proc. جلد 2014 ، 47 ، 7604-7609. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  58. سالاس-مورنو، RF; نیوکمب، RA؛ استراسدات، اچ. کلی، پی اچ. Davison, AJ Slam++: محلی سازی و نقشه برداری همزمان در سطح اشیا. در مجموعه مقالات کنفرانس IEEE در مورد دید کامپیوتری و تشخیص الگو، پورتلند، OR، ایالات متحده آمریکا، 23 تا 28 ژوئن 2013. صص 1352–1359. [ Google Scholar ]
  59. دیویسون، ای جی؛ رید، شناسه; مولتون، ND; Stasse, O. MonoSLAM: SLAM تک دوربینی بی‌درنگ. IEEE Trans. الگوی مقعدی ماخ هوشمند 2007 ، 29 ، 1052-1067. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  60. شولز، وی.اچ. Bombardelli، FG; Todt، E. یک SoC با FPGA Landmark Acquisition System برای دوچشمی Visual SLAM. در مجموعه مقالات دوازدهمین سمپوزیوم رباتیک آمریکای لاتین 2015 و سومین سمپوزیوم رباتیک برزیل در سال 2015 (LARS-SBR)، اوبرلندیا، برزیل، 28 اکتبر 28 تا 1 نوامبر 2015؛ صص 336-341. [ Google Scholar ]
  61. لئونارد، جی جی; بومی سازی ربات دورنت-وایت، HF Mobile با ردیابی چراغ های هندسی. IEEE Trans. ربات. خودکار 1991 ، 7 ، 376-382. [ Google Scholar ] [ CrossRef ]
  62. گومز اوجدا، آر. بریالز، جی. Gonzalez-Jimenez, J. PL-SVO: Odometry بصری تک چشمی نیمه مستقیم با ترکیب نقاط و پاره خط. در مجموعه مقالات کنفرانس بین المللی IEEE/RSJ 2016 در مورد ربات ها و سیستم های هوشمند (IROS)، Daejeon، کره، 9 تا 14 اکتبر 2016؛ صص 4211-4216. [ Google Scholar ]
  63. پومارولا، ا. واخیتوف، آ. آگودو، ا. سانفلیو، ا. Moreno-Noguer، F. PL-SLAM: SLAM تصویری تک چشمی در زمان واقعی با نقاط و خطوط. در مجموعه مقالات کنفرانس بین المللی IEEE 2017 در مورد رباتیک و اتوماسیون (ICRA)، سنگاپور، 29 مه تا 3 ژوئن 2017؛ ص 4503-4508. [ Google Scholar ]
  64. وانگ، آر. دی، ک. وان، دبلیو. وانگ، ی. روش SLAM تصویری مبتنی بر ویژگی نقطه‌ای بهبود یافته برای صحنه‌های داخلی. Sensors 2018 , 18 , 3559. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  65. بومن، اس ال. آتاناسوف، ن. دانیلیدیس، ک. پاپاس، GJ ارتباط داده های احتمالی برای اسلم معنایی. در مجموعه مقالات کنفرانس بین المللی IEEE 2017 در مورد رباتیک و اتوماسیون (ICRA)، سنگاپور، 29 مه تا 3 ژوئن 2017؛ صفحات 1722-1729. [ Google Scholar ]
  66. بنابراین، سی. باچیو، جی. Sun, H. بازسازی ساختمان های مجازی سه بعدی از پلان های معماری دوبعدی. در مجموعه مقالات سمپوزیوم ACM در نرم افزار و فناوری واقعیت مجازی، تایپه، تایوان، 2 تا 5 نوامبر 1998. ص 17-23. [ Google Scholar ]
  67. لو، تی. تای، سی.-ال. بائو، ال. سو، اف. Cai, S. بازسازی سه بعدی ساختمان های دقیق از نقشه های معماری. محاسبه کنید. به دس کمک کرد. Appl. 2005 ، 2 ، 527-536. [ Google Scholar ] [ CrossRef ]
  68. لی، اس. فنگ، دی. گریم، سی. Gooch, B. یک رابط کاربری مبتنی بر طرح برای بازسازی نقشه های معماری. محاسبه کنید. نمودار. انجمن 2008 ، 27 ، 81-90. [ Google Scholar ] [ CrossRef ]
  69. هورنا، اس. منوو، دی. دامیاند، جی. برتراند، ی. محدودیت های سازگاری و بازسازی ساختمان سه بعدی. محاسبه کنید. به دس کمک کرد. 2009 ، 41 ، 13-27. [ Google Scholar ] [ CrossRef ]
  70. لی، تی. شو، بی. کیو، ایکس. Wang, Z. بازسازی کارآمد از نقشه های معماری. بین المللی جی. کامپیوتر. Appl. تکنولوژی 2010 ، 38 ، 177-184. [ Google Scholar ] [ CrossRef ]
  71. یین، ایکس. ونکا، پی. رازدان، ع. تولید مدل های ساختمان سه بعدی از نقشه های معماری: یک بررسی. محاسبات IEEE. نمودار. Appl. 2008 ، 29 ، 20-30. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  72. نینگ، ایکس. ما، جی. Lv، Z. خو، Q. Wang, Y. بازسازی ساختار صحنه داخلی از اسکنر لیزری زمینی. در کنفرانس بین المللی آموزش و بازی های الکترونیکی ؛ Springer: برلین/هایدلبرگ، آلمان، 2018. [ Google Scholar ]
  73. ادلسبرونر، اچ. اشکال آلفا-یک بررسی. Tesselations Sci. 2010 ، 27 ، 1-25. [ Google Scholar ]
  74. پرویتالی، م. دیاز-ویلارینو، ال. Scaioni، M. بازسازی ساختمان داخلی از ابرهای نقطه مسدود با استفاده از برش نمودار و ردیابی پرتو. Appl. علمی 2018 ، 8 ، 1529. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  75. کانگ، ز. ژونگ، آر. وو، آ. شی، ز. Luo, Z. یک روش برازش ویژگی مسطح کارآمد با استفاده از ساده‌سازی ابر نقطه و BaySAC مستقل از آستانه. IEEE Geosci. سنسور از راه دور Lett. 2016 ، 13 ، 1842-1846. [ Google Scholar ] [ CrossRef ]
  76. یونگ، جی. هونگ، اس. جونگ، اس. کیم، اس. چو، اچ. هونگ، اس. Heo, J. مدلسازی مولد برای توسعه BIM ساخته شده سازه های داخلی موجود. خودکار ساخت و ساز 2014 ، 42 ، 68-77. [ Google Scholar ] [ CrossRef ]
  77. وانگ، سی. چو، YK; Kim, C. استخراج خودکار اجزای BIM از ابرهای نقطه ای ساختمان های موجود برای کاربردهای پایداری. خودکار ساخت و ساز 2015 ، 56 ، 1-13. [ Google Scholar ] [ CrossRef ]
  78. شی، دبلیو. احمد، دبلیو. لی، ن. فن، دبلیو. شیانگ، اچ. وانگ، ام. مدل‌سازی هندسی معنایی ابر نقطه‌ای داخلی بدون ساختار. ISPRS Int. J. Geo-Inf. 2019 ، 8 ، 9. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  79. هونگ، اس. یونگ، جی. کیم، اس. چو، اچ. لی، جی. Heo, J. رویکرد نیمه خودکار به نقشه برداری داخلی برای مدل سازی اطلاعات ساختمان سه بعدی. محاسبه کنید. محیط زیست سیستم شهری 2015 ، 51 ، 34-46. [ Google Scholar ] [ CrossRef ]
  80. Michailidis، G.-T. Pajarola, R. Bayesian Graph-Cut بهینه سازی برای بازسازی سطوح دیوار در محیط های داخلی. Vis. محاسبه کنید. 2017 ، 33 ، 1347–1355. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  81. مورا، سی. ماتاوش، او. ویلانووا، ای جی; گوبتی، ای. Pajarola, R. تشخیص و بازسازی خودکار اتاق در محیط های داخلی درهم و برهم با چیدمان اتاق های پیچیده. محاسبه کنید. نمودار. 2014 ، 44 ، 20-32. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  82. تانگ، اس. ژانگ، ی. لی، ی. یوان، ز. وانگ، ی. ژانگ، ایکس. لی، ایکس. ژانگ، ی. گوا، آر. Wang, W. بازسازی سریع و خودکار نقشه‌های داخلی سه بعدی غنی از لحاظ معنایی از دنباله‌های RGB-D با کیفیت پایین. Sensors 2019 , 19 , 533. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  83. وانگ، آر. زی، ال. Chen, D. مدلسازی فضاهای داخلی با استفاده از تجزیه و بازسازی عناصر ساختاری. فتوگرام مهندس Remote Sens. 2017 , 83 , 827–841. [ Google Scholar ] [ CrossRef ]
  84. لی، ال. سو، اف. یانگ، اف. زو، اچ. لی، دی. زو، ایکس. لی، اف. لیو، ی. Ying, S. بازسازی فضای داخلی داخلی سه بعدی (3 بعدی) با داستان های متعدد از طریق تقسیم بندی جامع. Remote Sens. 2018 , 10 , 1281. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  85. پانگ، ی. ژانگ، سی. ژو، ال. لین، بی. Lv, G. استخراج اطلاعات فضای داخلی در محیط های پیچیده ساختمان. ISPRS Int. J. Geo-Inf. 2018 ، 7 ، 321. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  86. چن، جی. Chen, B. مدل‌سازی معماری از داده‌های محدوده اسکن شده پراکنده. بین المللی جی. کامپیوتر. Vis. 2008 ، 78 ، 223-236. [ Google Scholar ] [ CrossRef ]
  87. چن، ک. لای، ی. وو، Y.-X. مارتین، آر.آر. هو، اس.-م. مدل‌سازی معنایی خودکار صحنه‌های داخلی از داده‌های RGB-D با کیفیت پایین با استفاده از اطلاعات متنی. ACM Trans. نمودار. 2014 ، 33 ، 208. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  88. لیو، ز. ژانگ، ی. وو، دبلیو. لیو، ک. Sun, Z. مدل‌سازی صحنه‌های داخلی مبتنی بر مدل از یک تصویر واحد. در مجموعه مقالات چهل و یکمین کنفرانس رابط گرافیکی، هالیفاکس، NS، کانادا، 3 تا 5 ژوئن 2015. [ Google Scholar ]
  89. تران، اچ. خوشلحم، ک. کیلی، الف. مقایسه هندسی و ارزیابی کیفیت مدل‌های سه بعدی محیط‌های داخلی. ISPRS J. Photogramm. Remote Sens. 2019 ، 149 ، 29–39. [ Google Scholar ] [ CrossRef ]
  90. چن، جی. شائو، جی. ژانگ، دی. Wu, X. یک روش سریع سرتاسری با انتقال سبک برای تخمین چیدمان اتاق. در مجموعه مقالات کنفرانس بین المللی IEEE 2019 در چند رسانه ای و نمایشگاه (ICME)، شانگهای، چین، 8 تا 12 ژوئیه 2019؛ ص 964-969. [ Google Scholar ]
  91. فرناندز-لابرادور، سی. Facil, JM; پرز-یوس، آ. دمونسو، سی. سیورا، جی. Guerrero، JJ Corners for Layout: End-to-End Layout Recovery از 360 عکس. arXiv 2019 ، arXiv:1903.08094. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  92. لین، اچ جی; هوانگ، جنوب غربی؛ لای، SH; چیانگ، CK تخمین چیدمان صحنه داخلی از یک تصویر واحد. در مجموعه مقالات بیست و چهارمین کنفرانس بین‌المللی شناسایی الگو (ICPR)، پکن، چین، 20 تا 24 اوت 2018. [ Google Scholar ]
  93. ژانگ، دبلیو. ژانگ، دبلیو. لیو، ک. Gu, J. آموزش پیش‌بینی نقشه‌های لبه با کیفیت بالا برای تخمین چیدمان اتاق. IEEE Trans. چندتایی. 2016 ، 19 ، 935-943. [ Google Scholar ] [ CrossRef ]
  94. لی، سی.-ای. بدرینارایانان، وی. مالیزیویچ، تی. Rabinovich، A. Roomnet: تخمین چیدمان اتاق انتها به انتها. در مجموعه مقالات کنفرانس بین المللی IEEE در بینایی کامپیوتر، ونیز، ایتالیا، 22 تا 29 اکتبر 2017؛ صص 4865-4874. [ Google Scholar ]
  95. زو، سی. کولبرن، ا. شان، Q. Doiem, D. Layoutnet: بازسازی طرح اتاق سه بعدی از یک تصویر rgb. در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو، لانگ بیچ، کالیفرنیا، ایالات متحده آمریکا، 18 تا 23 ژوئن 2018. [ Google Scholar ]
  96. هداو، وی. هویم، دی. فورسیث، دی. بازیابی چیدمان فضایی اتاق های بهم ریخته. در مجموعه مقالات دوازدهمین کنفرانس بین المللی IEEE در سال 2009 در بینایی کامپیوتر، کیوتو، ژاپن، 29 سپتامبر تا 2 اکتبر 2009. [ Google Scholar ]
  97. چائو، Y.-W. چوی، دبلیو. پانتوفارو، سی. Savarese، S. تخمین چیدمان صحنه های داخلی بسیار درهم و برهم با استفاده از نشانه های هندسی و معنایی. در کنفرانس بین المللی تحلیل و پردازش تصویر ; Springer: برلین/هایدلبرگ، آلمان، 2013. [ Google Scholar ]
  98. پارک، اس.-جی. هونگ، ک.-اس. بازیابی یک چیدمان سه بعدی داخلی با تقسیم بندی معنایی بالا به پایین از یک تصویر واحد. تشخیص الگو Lett. 2015 ، 68 ، 70-75. [ Google Scholar ] [ CrossRef ]
  99. مالیا، ع. Lazebnik، S. یادگیری نقشه های لبه آموزنده برای پیش بینی طرح صحنه های داخلی. در مجموعه مقالات کنفرانس بین المللی IEEE در بینایی کامپیوتر، لاس کوندس، شیلی، 11 تا 18 دسامبر 2015. ص 936-944. [ Google Scholar ]
  100. جهرمی، ع.ب. Sohn, G. Edge مبتنی بر مدلسازی سه بعدی راهروی داخلی با استفاده از یک تصویر واحد. ISPRS Ann. فتوگرام حسگر از راه دور اسپات. Inf. علمی 2015 ، 2 . [ Google Scholar ]
  101. هیرزر، م. راث، PM؛ Lepetit، V. Smart Hypothesis Generation برای تخمین چیدمان اتاق کارآمد و مقاوم. arXiv 2019 ، arXiv:1910.12257. [ Google Scholar ]
  102. چانگ، اچ.-سی. هوانگ، S.-H. لای، اس.-اچ. استفاده از سازگاری خط برای تخمین طرح‌بندی صحنه منهتن داخلی سه بعدی از یک تصویر واحد. در مجموعه مقالات کنفرانس بین المللی IEEE 2015 در مورد پردازش تصویر (ICIP)، کبک، QC، کانادا، 27-30 سپتامبر 2015. صص 4723-4727. [ Google Scholar ]
  103. کروژیلوف، آی. رومانوف، م. کونوشین، الف. شبکه اصلاح دوگانه برای تخمین چیدمان اتاق. در کنفرانس آسیایی شناخت الگو . Springer: Cham، سوئیس، 2019. [ Google Scholar ]
  104. گوپتا، ا. هیبرت، ام. کاناد، تی. Blei, DM برآورد چیدمان فضایی اتاق ها با استفاده از استدلال حجمی در مورد اشیا و سطوح. در پیشرفت در سیستم های پردازش اطلاعات عصبی ; Curran Associates, Inc., 2010; ص 1288-1296. در دسترس آنلاین: https://papers.nips.cc/paper/4120-estimating-spatial-layout-of-rooms-using-volumetric-reasoning-about-objects-and-surfaces.pdf (در 17 مه 2020 قابل دسترسی است).
  105. دل پرو، ال. بودیش، جی. فرید، دی. کرمگرد، بی. هارتلی، ای. مدلسازی هندسی بیزی از صحنه های داخلی بارنارد، کی. در مجموعه مقالات کنفرانس IEEE 2012 در مورد دید کامپیوتری و تشخیص الگو، پراویدنس، RI، ایالات متحده آمریکا، 16-21 ژوئن 2012. صص 2719-2726. [ Google Scholar ]
  106. شوینگ، AG; فیدلر، اس. پولفیس، ام. Urtasun, R. Box in the box: Joint 3D layout و استدلال شی از تصاویر منفرد. در مجموعه مقالات کنفرانس بین المللی IEEE در بینایی کامپیوتر، سیدنی، استرالیا، 1-8 دسامبر 2013. صص 353-360. [ Google Scholar ]
  107. ژانگ، جی. کان، سی. شوینگ، AG; Urtasun, R. برآورد طرح سه بعدی صحنه های داخلی و درهم ریختگی آن از سنسورهای عمق. در مجموعه مقالات کنفرانس بین المللی IEEE در بینایی کامپیوتر، سیدنی، استرالیا، 1-8 دسامبر 2013. ص 1273-1280. [ Google Scholar ]
  108. بائو، سی. فورلان، ا. فی فی، ال. Savarese, S. درک طرح‌بندی سه‌بعدی یک اتاق به هم ریخته از چندین تصویر. در مجموعه مقالات کنفرانس زمستانی IEEE در مورد کاربردهای بینایی کامپیوتری، Steamboat Springs، CO، ایالات متحده آمریکا، 24-26 مارس 2014. صص 690-697. [ Google Scholar ]
  109. ژانگ، دبلیو. ژانگ، دبلیو. Gu, J. استراتژی یادگیری معنایی لبه برای تخمین چیدمان در محیط داخلی. IEEE Trans. سایبرن. 2020 ، 50 ، 2730–2739. [ Google Scholar ] [ CrossRef ] [ PubMed ][ نسخه سبز ]
  110. کوهن، ا. شونبرگر، جی ال. Speciale، P. ساتلر، تی. فرام، ج.-م. Pollefeys، M. تراز بازسازی سه بعدی داخلی-خارجی. در کنفرانس اروپایی بینایی کامپیوتر ; Springer: برلین/هایدلبرگ، آلمان، 2016; صص 285-300. [ Google Scholar ]
  111. کخ، تی. کورنر، ام. Fraundorfer, F. تراز خودکار مدل های ساختمان های داخلی و خارجی با استفاده از بخش های خط سه بعدی. در مجموعه مقالات کنفرانس IEEE در کارگاه های آموزشی بینایی رایانه و تشخیص الگو، لاس وگاس، NV، ایالات متحده، 26 ژوئن تا 1 ژوئیه 2016. [ Google Scholar ]
  112. خان، ش. بن نامون، م. سهل، ف. Togneri، R. برچسب‌گذاری معنایی مبتنی بر هندسه صحنه‌های داخلی. در کنفرانس اروپایی بینایی کامپیوتر ; Springer: برلین/هایدلبرگ، آلمان، 2014. [ Google Scholar ]
  113. رن، ایکس. بو، ال. Fox, D. Rgb-(d) برچسب زدن صحنه: ویژگی ها و الگوریتم ها. در مجموعه مقالات کنفرانس IEEE 2012 در مورد دید کامپیوتری و تشخیص الگو، پراویدنس، RI، ایالات متحده آمریکا، 16-21 ژوئن 2012. صص 2759-2766. [ Google Scholar ]
  114. گوپتا، اس. اربلائز، پ. Malik, J. سازماندهی ادراکی و تشخیص صحنه های داخلی از تصاویر RGB-D. در مجموعه مقالات کنفرانس IEEE در مورد دید کامپیوتری و تشخیص الگو، پورتلند، OR، ایالات متحده آمریکا، 23 تا 28 ژوئن 2013. صص 564-571. [ Google Scholar ]
  115. مولر، AC; Behnke، S. یادگیری زمینه های تصادفی شرطی حساس به عمق برای تقسیم بندی معنایی تصاویر RGB-D. در مجموعه مقالات کنفرانس بین المللی IEEE 2014 در مورد رباتیک و اتوماسیون (ICRA)، هنگ کنگ، چین، 31 مه تا 7 ژوئن 2014. صص 6232–6237. [ Google Scholar ]
  116. دنگ، ز. تودوروویچ، اس. Jan Latecki، L. بخش‌بندی معنایی تصاویر rgbd با محدودیت‌های mutex. در مجموعه مقالات کنفرانس بین المللی IEEE در بینایی کامپیوتر، لاس کوندس، شیلی، 11 تا 18 دسامبر 2015. صفحات 1733-1741. [ Google Scholar ]
  117. فارابت، سی. کوپری، سی. نجمان، ل. LeCun, Y. یادگیری ویژگی های سلسله مراتبی برای برچسب زدن صحنه. IEEE Trans. الگوی مقعدی ماخ هوشمند 2012 ، 35 ، 1915-1929. [ Google Scholar ] [ CrossRef ] [ PubMed ][ نسخه سبز ]
  118. گیرشیک، آر. دوناهو، جی. دارل، تی. Malik, J. Rich دارای سلسله مراتب برای تشخیص دقیق شی و تقسیم بندی معنایی هستند. در مجموعه مقالات کنفرانس IEEE در مورد دید کامپیوتری و تشخیص الگو، کلمبوس، OH، ایالات متحده آمریکا، 23 تا 28 ژوئن 2014. صص 580-587. [ Google Scholar ]
  119. گوپتا، اس. گیرشیک، آر. آربلاز، پ. Malik, J. یادگیری ویژگی های غنی از تصاویر RGB-D برای تشخیص و تقسیم بندی اشیا. در کنفرانس اروپایی بینایی کامپیوتر ; Springer: برلین/هایدلبرگ، آلمان، 2014. [ Google Scholar ]
  120. چن، L.-C.; پاپاندرو، جی. کوکینوس، آی. مورفی، ک. Yuille، تقسیم‌بندی تصویر معنایی AL با شبکه‌های پیچیده عمیق و crfهای کاملاً متصل. arXiv 2014 ، arXiv:1412.7062. [ Google Scholar ]
  121. لانگ، جی. شلهامر، ای. دارل، تی. شبکه های کاملاً پیچیده برای تقسیم بندی معنایی. در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو، بوستون، MA، ایالات متحده آمریکا، 7 تا 12 ژوئن 2015. صص 3431–3440. [ Google Scholar ]
  122. بدرینارایانان، وی. کندال، ا. Cipolla، R. Segnet: یک معماری رمزگذار-رمزگشای پیچیده پیچیده برای تقسیم‌بندی تصویر. IEEE Trans. الگوی مقعدی ماخ هوشمند 2017 ، 39 ، 2481-2495. [ Google Scholar ] [ CrossRef ]
  123. لی، ی. بو، ر. سان، م. وو، دبلیو. دی، ایکس. Chen, B. Pointcnn: Convolution on x-transformed points. در مجموعه مقالات پیشرفت‌ها در سیستم‌های پردازش اطلاعات عصبی، مونترال، QC، کانادا، 3 تا 8 دسامبر 2018؛ صص 820-830. [ Google Scholar ]
  124. Qi، CR; سو، اچ. مو، ک. Guibas، LJ Pointnet: یادگیری عمیق در مجموعه های نقطه برای طبقه بندی و تقسیم بندی سه بعدی. در مجموعه مقالات کنفرانس IEEE در مورد دید رایانه و تشخیص الگو، هونولولو، HI، ایالات متحده آمریکا، 21 تا 26 ژوئیه 2017؛ صص 652-660. [ Google Scholar ]
  125. حاضرباس، ج. ما، ال. دوموکوس، سی. Cremers، D. Fusenet: گنجاندن عمق در تقسیم بندی معنایی از طریق معماری cnn مبتنی بر فیوژن. در کنفرانس آسیایی بینایی کامپیوتر ; Springer: برلین/هایدلبرگ، آلمان، 2016. [ Google Scholar ]
  126. جیانگ، جی. ژانگ، ز. هوانگ، ی. Zheng, L. گنجاندن عمق در هر دو cnn و crf برای تقسیم بندی معنایی داخلی. در مجموعه مقالات هشتمین کنفرانس بین المللی IEEE 2017 در زمینه مهندسی نرم افزار و علوم خدمات (ICSESS)، پکن، چین، 24 تا 26 نوامبر 2017؛ صص 525-530. [ Google Scholar ]
  127. چنگ، ی. کای، آر. لی، ز. ژائو، ایکس. Huang، K. شبکه‌های دکانولوشن حساس به محل با همجوشی دروازه‌ای برای تقسیم‌بندی معنایی داخلی rgb-d. در مجموعه مقالات کنفرانس IEEE در مورد دید رایانه و تشخیص الگو، هونولولو، HI، ایالات متحده آمریکا، 21 تا 26 ژوئیه 2017؛ ص 3029–3037. [ Google Scholar ]
  128. لین، دی. چن، جی. کوهن-اور، دی. هنگ، P.-A.; Huang، H. شبکه ویژگی آبشاری برای تقسیم معنایی تصاویر RGB-D. در مجموعه مقالات کنفرانس بین المللی IEEE در بینایی کامپیوتر، هونولولو، HI، ایالات متحده آمریکا، 21 تا 26 ژوئیه 2017؛ ص 1311–1319. [ Google Scholar ]
  129. لی، ی. ژانگ، جی. چنگ، ی. هوانگ، ک. Tan, T. ترکیب ویژگی های چند سطحی RGB-D با هدایت معنایی برای تقسیم بندی معنایی داخلی. در مجموعه مقالات کنفرانس بین المللی IEEE 2017 در مورد پردازش تصویر (ICIP)، پکن، چین، 17 تا 20 سپتامبر 2017؛ ص 1262–1266. [ Google Scholar ]
  130. جیانگ، جی. ژنگ، ال. لو، اف. Zhang، Z. Rednet: شبکه رمزگذار-رمزگشای باقیمانده برای بخش بندی معنایی rgb-d داخلی. arXiv 2018 , arXiv:1806.01054. [ Google Scholar ]
  131. گوا، ی. چن، تی. تقسیم بندی معنایی تصاویر RGBD بر اساس رگرسیون عمق عمیق. تشخیص الگو Lett. 2018 ، 109 ، 55-64. [ Google Scholar ] [ CrossRef ]
  132. کیم، ی. کانگ، اچ. لی، جی. توسعه مدل داده های فضایی داخلی با استفاده از CityGML ADE. بین المللی قوس. فتوگرام حسگر از راه دور اسپات. Inf. علمی 2013 ، 40 ، 41-45. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  133. جمالی، ع. رحمان، ع.ا. بوگوسلاوسکی، پ. کومار، پی. Gold, CM مدلسازی سه بعدی خودکار شبکه ناوبری داخلی توپولوژیکی. جئوژورنال 2017 ، 82 ، 157–170. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  134. تران، اچ. خوشلحم، ک. کیلی، ا. دیاز-ویلارینو، L. استخراج روابط توپولوژیکی بین فضاهای داخلی از ابرهای نقطه ای. ISPRS Ann. فتوگرام حسگر از راه دور اسپات. Inf. علمی 2017 ، 4 ، 401. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  135. Sarda، N. توسعه ساختار ناوبری برای ساختمان ها از مدل های معتبر 3D CityGML آنها. در مجموعه مقالات سومین کنفرانس بین المللی 2016 در مورد محاسبات برای توسعه پایدار جهانی (INDIACom)، دهلی نو، هند، 16-18 مارس 2016؛ صص 3341–3346. [ Google Scholar ]
  136. ترون، اس. Bücken, A. یکپارچه سازی نقشه های مبتنی بر شبکه و توپولوژیکی برای ناوبری روبات های سیار. در مجموعه مقالات کنفرانس ملی هوش مصنوعی، پورتلند، OR، ایالات متحده آمریکا، 4 تا 6 اوت 1996. [ Google Scholar ]
  137. جو، ک. لی، تی.-ک. بایک، اس. اوه، S.-Y. ایجاد نقشه توپولوژیکی از نقشه شبکه اشغال با استفاده از تشخیص درب مجازی. در مجموعه مقالات کنگره IEEE در محاسبات تکاملی، بارسلون، اسپانیا، 18 تا 23 ژوئیه 2010. [ Google Scholar ]
  138. پرتغال، دی. Rocha، RP استخراج اطلاعات توپولوژیکی از نقشه های شبکه برای ناوبری ربات. در مجموعه مقالات چهارمین کنفرانس بین المللی عوامل و هوش مصنوعی (ICAART-2012)، آلگاروه، پرتغال، 6-8 فوریه 2012. صص 137-143. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  139. یانگ، ال. Worboys, M. Generation of Navigation graphs for space indoor. بین المللی جی. جغرافی. Inf. علمی 2015 ، 29 ، 1737-1756. [ Google Scholar ] [ CrossRef ]
  140. Sithole، G. نمودارهای مسیریابی فضای داخلی: دید، رمزگذاری، رمزگذاری و تضعیف. بین المللی قوس. فتوگرام حسگر از راه دور اسپات. Inf. علمی 2018 ، XLII-4 ، 579–585. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  141. دمین، دی. بورو، ام. مسیریابی مبتنی بر مثلث بندی کارآمد. در مجموعه مقالات بیست و یکمین کنفرانس ملی هوش مصنوعی (AAAI 06)، بوستون، MA، ایالات متحده آمریکا، 16 تا 20 ژوئیه 2006. [ Google Scholar ]
  142. لی، ایکس. کلارامونت، سی. Ray, C. یک مدل مبتنی بر گراف شبکه ای برای تجزیه و تحلیل فضاهای داخلی دو بعدی. محاسبه کنید. محیط زیست سیستم شهری 2010 ، 34 ، 532-540. [ Google Scholar ] [ CrossRef ]
  143. گونزالس-آرجونا، دی. سانچز، آ. لوپز-کولینو، اف. دی کاسترو، آ. Garrido, J. نگاشت فضای داخلی شبکه اشغال ساده شده برای روبات های کم هزینه بهینه شده است. ISPRS Int. J. Geo-Inf. 2013 ، 2 ، 959-977. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  144. خو، ام. وی، اس. زلاتانوا، اس. Zhang, R. برنامه ریزی مسیر داخلی مبتنی بر BIM با در نظر گرفتن موانع. ISPRS Ann. فتوگرام حسگر از راه دور اسپات. Inf. علمی 2017 ، 417-423. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  145. لی، دی. Lee, DL یک مدل مکان معنایی مبتنی بر شبکه برای ناوبری داخلی. در مجموعه مقالات نهمین کنفرانس بین المللی مدیریت داده های تلفن همراه (mdm 2008)، پکن، چین، 27-30 آوریل 2008; ص 17-24. [ Google Scholar ]
  146. لین، ز. خو، ز. هو، دی. هو، کیو. Li، W. مدل داده های مکانی ترکیبی برای فضای داخلی: توپولوژی و شبکه ترکیبی. ISPRS Int. J. Geo-Inf. 2017 ، 6 ، 343. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  147. لی، جی. لی، ک. زلاتانوا، اس. کلبه، تی. ناگل، سی. بکر، T. OGC IndoorGML – با اصلاحیه. 2016. در دسترس آنلاین: https://www.opengis.net/doc/IS/indoorgml/1.0 (در 17 مه 2020 قابل دسترسی است).
  148. خان، ا. دوناوبائر، آ. Kolbe، TH یک فرآیند تبدیل چند مرحله‌ای برای تولید خودکار نمودارهای مسیریابی داخلی از مدل‌های ساختمانی سه بعدی معنایی. در مجموعه مقالات نهمین کنفرانس اطلاعات جغرافیایی سه بعدی، دبی، امارات متحده عربی، 11 تا 13 نوامبر 2014. [ Google Scholar ]
  149. میروهابی، س. عباسپور، RA استخراج خودکار مدل هسته IndoorGML از OpenStreetMap. بین المللی قوس. فتوگرام حسگر از راه دور اسپات. Inf. علمی 2015 ، 40 ، 459. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  150. زو، س. لی، ی. Xiong، Q. زلاتانوا، اس. دینگ، ی. ژانگ، ی. Zhou, Y. Gml مکان چند بعدی داخلی و کاربرد آن برای خدمات مکان یابی داخلی همه جا حاضر. ISPRS Int. J. Geo-Inf. 2016 ، 5 ، 220. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  151. تئو، T.-A. یو، اس.-سی. استخراج اطلاعات ساختمان های داخلی از Bim به Ogc Indoorgml. بین المللی قوس. فتوگرام حسگر از راه دور اسپات. Inf. علمی 2017 ، 42 ، 167-170. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  152. سریواستاوا، اس. ماهوشواریب، ن. Rajanc، K. به سوی تولید داده‌های Indoorgml غنی از نظر معنایی از طرح‌های معماری. بین المللی قوس. فتوگرام حسگر از راه دور اسپات. Inf. علمی 2018 ، 42 ، 4. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  153. Tessema، LS; جگر، آر. Stilla، U. استخراج مدل IndoorGML از نقشه شبکه اشغال ساخته شده با استفاده از LiDAR 2D. در مجموعه مقالات انجمن آلمانی فتوگرامتری، سنجش از دور و اطلاعات جغرافیایی، سی و نهمین کنفرانس، وین، اتریش، فوریه 2020؛ در دسترس آنلاین: https://www.researchgate.net/publication/338690496_Extraction_of_IndoorGML_Model_from_an_Occupancy_Grid_Map_Constructed_Using_2D_LiDAR (در 17 مه 2020 قابل دسترسی است).
  154. کنتارینیس، ا. زیتونی، ک. مارینیکا، سی. وودیسلاو، دی. کوتزینوس، دی. به سوی یک مدل مسیر درونی معنایی. در مجموعه مقالات دومین کارگاه بین المللی “تجزیه و تحلیل داده های تحرک بزرگ” (BMDA) با EDBT، لیسبون، پرتغال، 26 مارس 2019. [ Google Scholar ]
  155. Flikweert، P. پیترز، آر. دیاز-ویلارینو، ال. ووت، آر. Staats، B. استخراج خودکار یک نمودار ناوبری در نظر گرفته شده برای Indoorgml از یک ابر نقطه داخلی. ISPRS Ann. فتوگرام سنسور از راه دور Spat.Inf. علمی 2019 ، 4 ، 271-278. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  156. مرتاری، ف. کلمنتینی، ای. زلاتانوا، اس. لیو، ال. یک مدل ناوبری داخلی و استخراج شبکه آن. Appl. Geomat. 2019 ، 11 ، 413-427. [ Google Scholar ] [ CrossRef ]
  157. نیکوهمت، س. دیاکیته، آ. زلاتانوا، اس. Vosselman، G. مدل‌سازی سه بعدی داخلی و زیربخش فضای انعطاف‌پذیر از Point Clouds. ISPRS Ann. فتوگرام حسگر از راه دور اسپات. Inf. علمی 2019 ، 4 ، 285-292. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  158. کانگ، H.-K. لی، ک.-جی. یک مدل استاندارد داده فضایی داخلی – OGC IndoorGML و رویکردهای پیاده سازی. ISPRS Int. J. Geo-Inf. 2017 ، 6 ، 116. [ Google Scholar ] [ CrossRef ]
  159. کیم، جی.اس. یو، اس.-جی. لی، ک.-جی. ادغام IndoorGML و CityGML برای فضای داخلی. در سمپوزیوم بین المللی وب و سیستم های اطلاعات جغرافیایی بی سیم ; Springer: برلین/هایدلبرگ، آلمان، 2014. [ Google Scholar ]
  160. لیو، ال. زلاتانوا، اس. زو، س. Li, K. به سوی ادغام IndoorGML و IndoorlocationGML برای برنامه های داخلی. ISPRS Ann. فتوگرام حسگر از راه دور اسپات. Inf. علمی 2017 ، 4 ، 343. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  161. تانگ، ال. لی، ال. یینگ، اس. Lei, Y. مشخصات کامل سطح جزئیات برای مدل‌های ساختمان‌های سه بعدی با ترکیب صحنه‌های داخلی و خارجی. ISPRS Int. J. Geo-Inf. 2018 ، 7 ، 419. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  162. زنگ، ال. Kang, Z. شناسایی خودکار عناصر ناوبری داخلی از ابرهای نقطه کینکت. بین المللی قوس. فتوگرام حسگر از راه دور اسپات. Inf. علمی 2017 ، 42 ، 431-437. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  163. آلاتاس، ا. زلاتانوا، اس. ون اوستروم، پی. Chatzinikolaou، E. لمن، سی. لی، ک.-جی. پشتیبانی از ناوبری داخلی با استفاده از حقوق دسترسی به فضاها بر اساس استفاده ترکیبی از مدل های IndoorGML و LADM. ISPRS Int. J. Geo-Inf. 2017 ، 6 ، 384. [ Google Scholar ] [ CrossRef ] [ نسخه سبز ]
  164. Diakité، AA; زلاتانوف، اس. لی، ک.-جی. درباره زیربخش فضاهای داخلی در Indoorgml. ISPRS Ann. فتوگرام حسگر از راه دور اسپات. Inf. علمی 2017 ، 4 ، 41-48. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  165. مورا، سی. ویلانووا، ای جی; ماتاوش، او. گوبتی، ای. Pajarola, R. بازسازی محیط های داخلی مجتمع با جهت گیری های خودسرانه دیوار. یوروگراف. پوسترها 2014 ، 19 ، 38-40. [ Google Scholar ]
  166. ناکاگاوا، م. کاتائوکا، ک. یاماموتو، تی. شیوزکی، م. Ohhashi، T. استخراج چند ضلعی مبتنی بر رندر پانورامیک از داده‌های Lidar موبایل داخلی. ISPRS Ann. فتوگرام حسگر از راه دور اسپات. Inf. علمی 2014 ، 2 ، 181-186. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  167. مورا، سی. ماتاوش، او. پاجارولا، آر. محاسبه کنید. نمودار. انجمن 2016 ، 35 ، 179-188. [ Google Scholar ] [ CrossRef ]
  168. Hsiao، C.-W.; سان، سی. سان، م. چن، اچ.-تی. Flat2Layout: نمای مسطح برای تخمین چیدمان انواع اتاق های عمومی. arXiv 2019 ، arXiv:1905.12571. [ Google Scholar ]
  169. یانگ، ی. جین، اس. لیو، آر. بینگ کانگ، اس. Yu, J. مدل‌سازی خودکار صحنه‌های داخلی سه‌بعدی از یک پانوراما. در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو، سالت لیک سیتی، UT، ایالات متحده آمریکا، 18 تا 22 ژوئن 2018؛ صص 3926–3934. [ Google Scholar ]
  170. نکراسوف، وی. دارماسیری، ت. اسپک، ا. دراموند، تی. شن، سی. رید، I. تقسیم بندی معنایی مشترک و تخمین عمق با استفاده از حاشیه نویسی نامتقارن. در مجموعه مقالات کنفرانس بین المللی رباتیک و اتوماسیون 2019 (ICRA)، مونترال، QC، کانادا، 20 تا 24 مه 2019؛ صفحات 7101–7107. [ Google Scholar ]
  171. Sarlin، P.-E. کادنا، سی. سیگوارت، آر. Dymczyk، M. از درشت به ریز: محلی سازی سلسله مراتبی قوی در مقیاس بزرگ. در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو، لانگ بیچ، کالیفرنیا، ایالات متحده آمریکا، 16 تا 20 ژوئن 2019؛ صص 12716–12725. [ Google Scholar ]
  172. ژائو، ز. چن، X. به سوی نگاشت معنایی سازگار مکانی-زمانی. در جام جهانی فوتبال ربات ; Springer: برلین/هایدلبرگ، آلمان، 2014. [ Google Scholar ]
  173. ژائو، ز. Chen, X. ساختن نقشه‌های معنایی سازگار زمانی برای صحنه‌های داخلی. در مجموعه مقالات کنفرانس بین المللی IEEE/RSJ 2015 در مورد ربات ها و سیستم های هوشمند (IROS)، هامبورگ، آلمان، 28 سپتامبر تا 2 اکتبر 2015؛ صص 88-95. [ Google Scholar ]
  174. گوپتا، اس. آربلاز، پ. گیرشیک، آر. Malik, J. درک صحنه های داخلی با تصاویر rgb-d: تقسیم بندی از پایین به بالا، تشخیص اشیا و تقسیم بندی معنایی. بین المللی جی. کامپیوتر. Vis. 2015 ، 112 ، 133-149. [ Google Scholar ] [ CrossRef ]
  175. لی، پی. تودوروویچ، اس. میدان عمیق زمانی مکرر برای برچسب‌گذاری معنایی ویدیو. در کنفرانس اروپایی بینایی کامپیوتر ; Springer: برلین/هایدلبرگ، آلمان، 2016. [ Google Scholar ]
  176. مصطفی، ع. کیم، اچ. Guillemaut, J.-Y.; هیلتون، A. بازسازی 4 بعدی منسجم زمانی صحنه های پویا پیچیده. در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو، لاس وگاس، NV، ایالات متحده، 26 ژوئن تا 1 ژوئیه 2016. صص 4660–4669. [ Google Scholar ]
  177. سلام.؛ Chiu، W.-C.; کیپر، ام. Fritz، M. Std2p: تقسیم‌بندی معنایی Rgbd با استفاده از ادغام مبتنی بر داده‌های مکانی-زمانی. در مجموعه مقالات کنفرانس IEEE در مورد دید رایانه و تشخیص الگو، هونولولو، HI، ایالات متحده آمریکا، 21 تا 26 ژوئیه 2017؛ صص 4837–4846. [ Google Scholar ]
  178. بهلی، جی. گارباده، م. میلیوتو، ا. کوئنزل، جی. بهنکه، اس. استاکنیس، سی. گال، J. SemanticKITTI: مجموعه داده ای برای درک صحنه معنایی توالی های لیدار. در مجموعه مقالات کنفرانس بین المللی IEEE در مورد بینایی رایانه، سئول، کره، 27 تا 28 اکتبر 2019؛ ص 9297–9307. [ Google Scholar ]
  179. چوی، سی. گواک، جی. Savarese, S. 4d convnets فضایی-زمانی: شبکه های عصبی کانولوشنال Minkowski. در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو، لانگ بیچ، کالیفرنیا، ایالات متحده آمریکا، 16 تا 20 ژوئن 2019؛ ص 3075–3084. [ Google Scholar ]
  180. مصطفی، ع. هیلتون، الف. هم‌بخش‌بندی منسجم معنایی و بازسازی صحنه‌های پویا. در مجموعه مقالات کنفرانس IEEE در مورد دید رایانه و تشخیص الگو، هونولولو، HI، ایالات متحده آمریکا، 21 تا 26 ژوئیه 2017؛ ص 422-431. [ Google Scholar ]
  181. پرویتالی، م. بارازتی، ال. برومانا، آر. Scaioni, M. Towards Towards Towards Towards Automatic Indoor Reconstruction of Indoor Indoor of the Estructury اتاق های ساختمان از ابرهای نقطه ای. ISPRS Ann. فتوگرام حسگر از راه دور اسپات. Inf. علمی 2014 ، 2 ، 281-288. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  182. تران، اچ. خوشلحم، ک. کیلی، ا. Díaz-Vilariño، L. Shape Grammar Approach به مدلسازی سه بعدی محیط های داخلی با استفاده از ابرهای نقطه ای. جی. کامپیوتر. مدنی مهندس 2019 , 33 , 04018055. [ Google Scholar ] [ CrossRef ]
  183. Diakité، AA; زلاتانوا، S. تقسیم بندی فضایی محیط های داخلی پیچیده برای ناوبری سه بعدی داخلی. بین المللی جی. جغرافی. Inf. علمی 2018 ، 32 ، 213-235. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  184. ژانگ، ی. خو، دبلیو. تانگ، ی. Zhou، K. تجزیه و تحلیل ساختار آنلاین برای بازسازی صحنه داخلی در زمان واقعی. ACM Trans. نمودار. TOG 2015 ، 34 ، 1-13. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  185. تئو، T.-A. چو، ک.-اچ. مدل شبکه داخلی مبتنی بر BIM برای برنامه ریزی مسیر ترکیبی داخلی و خارجی. Adv. مهندس آگاه کردن. 2016 ، 30 ، 268-282. [ Google Scholar ] [ CrossRef ]
  186. Vanclooster، A.; ون دی وگه، ن. De Maeyer, P. ادغام فضاهای داخلی و خارجی برای هدایت ناوبری عابر پیاده: بررسی. ترانس. GIS 2016 ، 20 ، 491-525. [ Google Scholar ] [ CrossRef ]
شکل 1. انتشار آمار مربوط به بازسازی سه بعدی (3 بعدی) محیط های داخلی.
شکل 2. انتشار آمار مربوط به تخمین عمق تک چشمی.
شکل 3. آمار انتشار مربوط به تخمین عمق چند نمای.
شکل 4. نمونه ای از بازسازی چند نمای.
شکل 5. آمار انتشار مربوط به مکان یابی و نقشه برداری همزمان (SLAM).
شکل 6. نمای کلی تکنیک برای بازسازی سه بعدی محیط های داخلی.
شکل 7. نمونه ای از روش استخراج عناصر ساختاری. ( الف ) ابرهای نقطه خام؛ ( ب ) تقسیم صفحه; ( ج ) استخراج مرز. ( د ) مدل نهایی وایرفریم. در ( b )، صفحات مختلف به طور تصادفی در رنگ های مختلف ارائه می شوند. در ( c )، نقاط مرزی استخراج شده به رنگ سیاه نشان داده می شوند.
شکل 8. نمونه هایی از روش های تجزیه و بازسازی فضا. ( الف ) تجزیه فضایی؛ ( ب ) نتیجه بازسازی.
شکل 9. نمونه های معمولی از روش های مختلف. ( الف ) روش‌های مبتنی بر ناحیه؛ ( ب ) روش های مبتنی بر لبه. ( ج ) روش‌های مبتنی بر نقطه کلید (گوشه). ( د ) روش های ترکیبی.
شکل 10. تصویری از روش مبتنی بر نقطه ناپدید شدن. ( الف ) قطعات خط شناسایی شده؛ ( ب ) نقاط ناپدید محاسبه شده. ( ج ) فرضیه های چیدمان اتاق. در ( a )، مجموعه ای از پاره خط ها شناسایی شده و برای یافتن نقاط ناپدید استفاده می شود. پاره‌های خط در ( a ) با استفاده از رنگ‌های مرتبط با نقاط ناپدید شدن آنها رنگ می‌شوند. سپس، چندین فرضیه چیدمان اتاق ایجاد می شود که می تواند توسط یک تابع اندازه گیری تعریف شده برای انتخاب بهینه رتبه بندی شود.
شکل 11. نمونه ای از ادغام چند وظیفه ای.
شکل 12. چارچوب طبقه بندی کلی بر اساس ویژگی های دست ساز.
شکل 13. یک چارچوب طبقه بندی پایان به انتها بر اساس یادگیری عمیق. CNN، شبکه عصبی کانولوشنال.
شکل 14. نمودار دوگانه نشان دهنده روابط اتصال (خطوط سیاه و سفید) و روابط مجاورت (خطوط چین دار قرمز).

بدون دیدگاه

دیدگاهتان را بنویسید