عنوان :
تخمين عمق از تك تصوير
مقطع تحصيلي :
كارشناسي ارشد
گرايش تحصيلي :
مخابرات سيستم
محل تحصيل :
اصفهان: دانشگاه صنعتي اصفهان، دانشكده برق و كامپيوتر
صفحه شمار :
نه، 124ص.: مصور
استاد راهنما :
شادرخ سماوي، نادر كريمي
توصيفگر ها :
تبديل تصاوير دو بعدي به سه بعدي , علائم ادراك عمق تك چشمي , روش هاي داده محور , مدل يادگيري چندسطحي
تاريخ ورود اطلاعات :
1395/02/05
دانشكده :
مهندسي برق و كامپيوتر
چكيده فارسي :
چكيده تخمين عمق صحنه از روي يك تصوير يك مسالهي پايه در حوزهي بينايي كامپيوتر است كه داراي محدودهي وسيعي از كاربردها شامل بينايي رباتها ادراك و بازساازي ساهبعادي صاحنه و از هماه مهامتار تباديل تصااوير و ويادئوهاي دوبعدي به سهبعدي ميباشد از آنجا كه بيشمار صحنهي حقيقي قادر به توليد يك تصوير دوبعادي مايباشاند بادون داشتن اطالعات پيشين راجع به صحنه تخمين عمق آن از روي تنها يك تصوير مسالهاي بهشدت چالشبرانگيز بهشمار ميآيد انسان اما به لطف داناش و اطالعااتي كاه در طاول سااليان در زميناهي رابطاهي صاحنههااي گونااگون و عماق متناظرشان كسب كردهاست با بهرهگيري از عالئم ادراك عمق تكچشمي بهراحتي قادر به تشخيص و درك ساختار سهبعدي صحنه در حضور تنها يك تصوير دوبعدي ميباشد اين واقعيت محققين را بر آن داشته تا با كشف اين عالئام و بهكارگيري موثر آنها چيزي شبيه آنچه در سيستم بينايي انسان براي ادراك عمق رخ ميدهد را شبيهساازي نمايناد دستهي بزرگي از روشهاي ارائهشده براي حل اين مساله تحت عنوان روشهاي دادهمحور درصدد يافتن اين عالئم و مدلسازي روابط ميان تصوير و عمق متناظرش با تكيه بار اطالعاات جاانبي هامچاون پايگااهدادههااي شاامل تصااوير و نقشههاي عمق نظيرشان ميباشند واضح است كه براي حل مساله اي با ايان درجاه از ابهاام داشاتن تنهاا ياك ديادگاه سراسري و يا محلي براي تخمين دقيق نقشهي عمق يك تصوير كفايت نميكند پيرو همين موضاوع در پاياانناماهي پيشرو با معرفي نشانههاي ادراك عمق تاكچشامي و باهكاارگيري ويژگايهااي محلاي ماوثر باراي توصايف آنهاا كوشش شده تا ضمن درنظرگرفتن ساختار كلي تصاوير در يك چهارچوب مبتني بر وصلههاي تشكيلدهندهي تصوير از اطالعات محلي مرتبط با عمق تصاوير نيز بهره بردهشود اين بهرهگيري ياك باار در قالاب روشاي مبتناي بار بازياابي وصلههاي مشابه به وصلهي ورودي و بار ديگر در قالب دو روش مبتني بار مادل ياادگيري تاك ساطحي و چندساطحي صورت گرفتهاست مقايسههاي بهدستآمده از نتايج روشهاي پيشنهادي و روشهاي موجود بر روي يك پايگاهدادهي استاندارد در اين حوزه حاكي از عملكرد دقيقتر سيستم پيشنهادي ما نسبت به ديگر روشها بر اساس معيارهاي كمي و كيفي ميباشد كلمات كليدي 1 تخمين عمق 2 تبديل تصاوير دوبعدي به سهبعدي 3 عالئم ادراك عمق تكچشمي 4 روشهاي دادهمحور 5 مدل يادگيري چندسطحي
چكيده انگليسي :
Single Image Depth Estimation Hoda Mohaghegh h mohaghegh@ec iut ac ir Date of Submission 2015 12 19 Department of Electrical and Computer Engineering Isfahan University of Technology Isfahan 84156 83111 Iran Degree M Sc Language FarsiSupervisor S Samavi Prof samavi96@cc iut ac ir N Karimi Dr nader karimi@cc iut ac irAbstract Estimating depth is a crucial component in computer vision tasks enabling many further applications suchas robot vision 3D modeling and above all 2D to 3D image video conversion Since there are an infinitenumber of possible world scenes that can produce a unique image without any prior information about scene single image depth estimation is a highly challenging task Humans however thanks to the data andknowledge they accumulated over years can perceive depth from a monocular image with no difficulty Thissuggests that using monocular depth cues in simulating human visual system for depth perception should makesingle image depth estimation an achievable goal This observation has been the motivation for several recentapproaches called data driven approaches which exploit the relationships between depth and these cues from apool of images for which the depth is known It is obvious that for solving such an ambiguous problem with alarge source of uncertainty it is not enough to have only local or global perspective for the precise single imagedepth estimation To this end in this thesis considering a number of robust and effective depth related features we introduce a patch based framework which jointly benefit from local and global structures of a scene Weformulate monocular depth estimation as a similar image patches retrieval method and a single level and multi level learning models as well Our experimental results demonstrate that our depth estimation models are moreaccurate than existing methods on a standard dataset Keywords Depth estimation 2D to 3D image video conversion Monocular depth perception cues Data driven approaches Multi level learning model
استاد راهنما :
شادرخ سماوي، نادر كريمي