شماره مدرك :
16945
شماره راهنما :
15023
پديد آورنده :
غفوري، نيلوفر
عنوان :

ارائه راهكاري مبتني بر حافظه نهان جهت كاهش تاخير استنتاج در روش هوش مشاركتي

مقطع تحصيلي :
كارشناسي ارشد
گرايش تحصيلي :
هوش مصنوعي و رباتيكز
محل تحصيل :
اصفهان : دانشگاه صنعتي اصفهان
سال دفاع :
1400
صفحه شمار :
دوازده، 73ص.: مصور، جدول،‌ نمودار
استاد راهنما :
عبدالرضا ميرزايي
استاد مشاور :
مهران صفاياني
توصيفگر ها :
شبكه عصبي عميق , كلاس بندي تصاوير , هوش مشاركتي , شبكه الكس نت , حافظه نهان
استاد داور :
محمدعلي خسروي فرد، مريم ذكري
تاريخ ورود اطلاعات :
1400/10/04
كتابنامه :
كتابنامه
رشته تحصيلي :
مهندسي كامپيوتر
دانشكده :
مهندسي برق و كامپيوتر
تاريخ ويرايش اطلاعات :
1400/10/08
كد ايرانداك :
2795577
چكيده فارسي :
امروزه با توجه به افزايش تقاضا براي پردازش داده‌ها و كاربردهاي فراوان آن‌ها، روش‌هاي يادگيري ماشين و به خصوص شاخه‌ي يادگيري عميق بسيار مورد توجه قرار گرفته‌است. علاوه بر افزايش دقت راهكارهاي موجود، كاهش زمان رسيدن به پاسخ بر روي دستگاه‌هاي انتهايي يكي از مسائلي است كه بسيار مورد توجه قرار مي‌گيرد. از جمله روش‌هاي سنتي استفاده از شبكه‌هاي عميق، پياده سازي كامل آن بر روي دستگاه انتهايي است. با اين كار امنيت داده‌ها حفظ مي‌شود اما مسئله اصلي توان پايين دستگاه براي انجام محاسبات پيچيده است كه تاخير زيادي را متحمل مي‌شود. از اين رو مي‌توان از روش جايگزين تحت عنوان مبتني بر سرويس دهنده استفاده كرد. در اين روش به دليل اتكا بر توان بالاي سرويس‌دهنده‌ها مي‌توان سرعت استنتاج را بهبود داد. مسئله اصلي كه در اين روش وجود دارد، انتقال داده‌ها از سمت دستگاه به سمت سرويس‌دهنده است كه سرعت اين انتقال وابسته به پهناي باند موجود، ممكن است بسيار پايين باشد. در سال‌هاي اخير در جهت پاسخگويي به اين چالش‌ها، راهكاري تحت عنوان هوش مشاركتي معرفي شده است. در اين روش، براي استنتاج هم از توان دستگاه و هم از توان سرويس‌دهنده استفاده مي‌شود. در اكثر شبكه‌هاي متمايز كننده، هر چه در شبكه پيش مي‌رويم، حجم خروجي لايه‌ها كاهش پيدا مي‌كند و اين خاصيت باعث مي‌شود كه انتقال در لايه‌هاي مياني شبكه، تاخير كمتري نسبت به انتقال داده اوليه ايجاد كند. در روش هوش مشاركتي، با توجه به پهناي باند موجود و خروجي هر لايه، نقطه‌اي جهت شكستن شبكه انتخاب مي‌شود. سپس قسمت ابتدايي شبكه بر روي دستگاه اجرا شده و خروجي حاصل از آن به منظور ادامه عمليات استنتاج براي سرويس‌دهنده ارسال مي‌شود. نتايج به دست آمده نشان مي‌دهد كه اين روش كمك خوبي به كاهش زمان استنتاج مي‌كند. پژوهشگران در سال‌هاي اخير سعي داشته‌اند كه با استفاده از راهكارهاي مختلف، تاخير به دست آمده توسط روش هوش مشاركتي را بهبود دهند. در اين پايان نامه از حافظه نهان در كنار هوش مشاركتي استفاده شده است. حافظه نهان اين امكان را مي‌دهد كه براي برخي از داده‌ها،تنها قسمت ابتدايي شبكه بر روي دستگاه انجام شود و پاسخ نهايي در همين مرحله براي كاربر ارسال شود. بنابراين در مصرف زمان ارسال داده‌ها به سمت سرويس دهنده و استنتاج بر روي آن صرفه‌جويي شده و زمان استنتاج براي كل داده‌ها به صورت متوسط كاهش پيدا مي‌كند. جهت ارزيابي اين روش از شبكه alexnet و تعداد دوازده كلاس از پايگاه داده imagenet استفاده شده است و تحت پهناي باندهاي مختلف مورد آزمايش قرار گرفته است. آزمون‌هايي كه بر روي روش پيشنهادي صورت گرفته نشان مي‌دهد كه بسته به پهناي باند موجود، تا حدود 53 درصد بهبود در تاخير استنتاج نسبت به استفاده از روش هوش مشاركتي ساده به دست مي‌آيد. يكي ديگر از مزيت‌هاي روش ارائه شده در اين است كه طيف وسيعي از مسائل را حل مي‌كند و چندين روش از راهكارهاي پيشين ارائه شده، حالت خاصي از روش پيشنهادي هستند. در الگوريتم پيشنهادي روش‌هاي مبتني بر دستگاه، مبتني بر سرويس‌دهنده، هوش مشاركتي، مبتني بر دستگاه با استفاده از حافظه نهان و هوش مشاركتي با استفاده از حافظه نهان، بر اساس محدوديت‌هايي كه كاربر اعمال مي‌كند و همين طور پهناي باندي كه در اختيار است، مي‌توانند انتخاب شوند به گونه‌اي كه تاخير، در حد نيازمندي كاربر باشد و دقت به دست آمده، وابسته به شرايط بيشينه باشد.
چكيده انگليسي :
Nowadays, due to the increasing demand for data processing and its many applications, machine learning methods, especially the branch of deep learning, have received much attention. In addition to increasing the accuracy of existing solutions, reducing the response time on edge devices is one of the issues that is highly regarded. One of the traditional methods of using deep networks is to completely implement them on the end devices. This maintains data security, but the main problem is the low power of the device to perform complex calculations. This suffer a long delay. Therefore, an alternative method called server-based can be used. In this method, due to the high power of servers, the inference speed can be improved. The main problem with this method is the transfer of data from the device to the server. The speed of this process depends on the available bandwidth, which can be very low. The main problem with this method is the transfer of data from the device to the server. The speed of this process depends on the available bandwidth, which can be very low. In recent years, a solution called collaborative intelligence has been introduced to address these challenges. In this method, both the power of the device and the server are used for inference. In most Discriminative networks, as we move through the network, the output volume of the layers decreases, and this property causes the transmission in the middle layers of the network to be less delayed than the original data transmission. In the collaborative intelligence method, according to the available bandwidth and output of each layer, a point for network division is selected. Then the initial part of the network is executed on the device and the resulting output is sent to the server in order to continue the inference operation. The results show that this method helps to reduce the inference time. Researchers in recent years have tried to improve the latency obtained by the collaborative intelligence method by using various strategies. In this thesis, the use of cache along with collaborative intelligence is introduced. Cache allows for some data, only the initial part of the network is done on the device and the final answer is sent to the user at this stage. Therefore, the time spent sending data to the server and inferring on it, is saved and the inference time for all data is reduced on average. To eva‎luate this method, alexnet network and twelve classes of imagenet database have been used and tested under different bandwidths. Tests performed on the proposed method show that, depending on the available bandwidth, up to 53% improvement in inference latency is obtained compared to using the simple collaborative intelligence method. Another advantage of the proposed method is that it solves a wide range of problems, and several of the previously proposed methods are a special case of our method
استاد راهنما :
عبدالرضا ميرزايي
استاد مشاور :
مهران صفاياني
استاد داور :
محمدعلي خسروي فرد، مريم ذكري
لينک به اين مدرک :

بازگشت