توصيفگر ها :
شبكه عصبي عميق , كلاس بندي تصاوير , هوش مشاركتي , شبكه الكس نت , حافظه نهان
چكيده فارسي :
امروزه با توجه به افزايش تقاضا براي پردازش دادهها و كاربردهاي فراوان آنها، روشهاي يادگيري ماشين و به خصوص شاخهي يادگيري عميق بسيار مورد توجه قرار گرفتهاست. علاوه بر افزايش دقت راهكارهاي موجود، كاهش زمان رسيدن به پاسخ بر روي دستگاههاي انتهايي يكي از مسائلي است كه بسيار مورد توجه قرار ميگيرد. از جمله روشهاي سنتي استفاده از شبكههاي عميق، پياده سازي كامل آن بر روي دستگاه انتهايي است. با اين كار امنيت دادهها حفظ ميشود اما مسئله اصلي توان پايين دستگاه براي انجام محاسبات پيچيده است كه تاخير زيادي را متحمل ميشود. از اين رو ميتوان از روش جايگزين تحت عنوان مبتني بر سرويس دهنده استفاده كرد. در اين روش به دليل اتكا بر توان بالاي سرويسدهندهها ميتوان سرعت استنتاج را بهبود داد. مسئله اصلي كه در اين روش وجود دارد، انتقال دادهها از سمت دستگاه به سمت سرويسدهنده است كه سرعت اين انتقال وابسته به پهناي باند موجود، ممكن است بسيار پايين باشد. در سالهاي اخير در جهت پاسخگويي به اين چالشها، راهكاري تحت عنوان هوش مشاركتي معرفي شده است. در اين روش، براي استنتاج هم از توان دستگاه و هم از توان سرويسدهنده استفاده ميشود. در اكثر شبكههاي متمايز كننده، هر چه در شبكه پيش ميرويم، حجم خروجي لايهها كاهش پيدا ميكند و اين خاصيت باعث ميشود كه انتقال در لايههاي مياني شبكه، تاخير كمتري نسبت به انتقال داده اوليه ايجاد كند. در روش هوش مشاركتي، با توجه به پهناي باند موجود و خروجي هر لايه، نقطهاي جهت شكستن شبكه انتخاب ميشود. سپس قسمت ابتدايي شبكه بر روي دستگاه اجرا شده و خروجي حاصل از آن به منظور ادامه عمليات استنتاج براي سرويسدهنده ارسال ميشود. نتايج به دست آمده نشان ميدهد كه اين روش كمك خوبي به كاهش زمان استنتاج ميكند. پژوهشگران در سالهاي اخير سعي داشتهاند كه با استفاده از راهكارهاي مختلف، تاخير به دست آمده توسط روش هوش مشاركتي را بهبود دهند. در اين پايان نامه از حافظه نهان در كنار هوش مشاركتي استفاده شده است. حافظه نهان اين امكان را ميدهد كه براي برخي از دادهها،تنها قسمت ابتدايي شبكه بر روي دستگاه انجام شود و پاسخ نهايي در همين مرحله براي كاربر ارسال شود. بنابراين در مصرف زمان ارسال دادهها به سمت سرويس دهنده و استنتاج بر روي آن صرفهجويي شده و زمان استنتاج براي كل دادهها به صورت متوسط كاهش پيدا ميكند. جهت ارزيابي اين روش از شبكه alexnet و تعداد دوازده كلاس از پايگاه داده imagenet استفاده شده است و تحت پهناي باندهاي مختلف مورد آزمايش قرار گرفته است. آزمونهايي كه بر روي روش پيشنهادي صورت گرفته نشان ميدهد كه بسته به پهناي باند موجود، تا حدود 53 درصد بهبود در تاخير استنتاج نسبت به استفاده از روش هوش مشاركتي ساده به دست ميآيد. يكي ديگر از مزيتهاي روش ارائه شده در اين است كه طيف وسيعي از مسائل را حل ميكند و چندين روش از راهكارهاي پيشين ارائه شده، حالت خاصي از روش پيشنهادي هستند. در الگوريتم پيشنهادي روشهاي مبتني بر دستگاه، مبتني بر سرويسدهنده، هوش مشاركتي، مبتني بر دستگاه با استفاده از حافظه نهان و هوش مشاركتي با استفاده از حافظه نهان، بر اساس محدوديتهايي كه كاربر اعمال ميكند و همين طور پهناي باندي كه در اختيار است، ميتوانند انتخاب شوند به گونهاي كه تاخير، در حد نيازمندي كاربر باشد و دقت به دست آمده، وابسته به شرايط بيشينه باشد.
چكيده انگليسي :
Nowadays, due to the increasing demand for data processing and its many applications, machine learning methods, especially the branch of deep learning, have received much attention. In addition to increasing the accuracy of existing solutions, reducing the response time on edge devices is one of the issues that is highly regarded. One of the traditional methods of using deep networks is to completely implement them on the end devices. This maintains data security, but the main problem is the low power of the device to perform complex calculations. This suffer a long delay. Therefore, an alternative method called server-based can be used. In this method, due to the high power of servers, the inference speed can be improved. The main problem with this method is the transfer of data from the device to the server. The speed of this process depends on the available bandwidth, which can be very low. The main problem with this method is the transfer of data from the device to the server. The speed of this process depends on the available bandwidth, which can be very low. In recent years, a solution called collaborative intelligence has been introduced to address these challenges. In this method, both the power of the device and the server are used for inference. In most Discriminative networks, as we move through the network, the output volume of the layers decreases, and this property causes the transmission in the middle layers of the network to be less delayed than the original data transmission. In the collaborative intelligence method, according to the available bandwidth and output of each layer, a point for network division is selected. Then the initial part of the network is executed on the device and the resulting output is sent to the server in order to continue the inference operation. The results show that this method helps to reduce the inference time. Researchers in recent years have tried to improve the latency obtained by the collaborative intelligence method by using various strategies. In this thesis, the use of cache along with collaborative intelligence is introduced. Cache allows for some data, only the initial part of the network is done on the device and the final answer is sent to the user at this stage. Therefore, the time spent sending data to the server and inferring on it, is saved and the inference time for all data is reduced on average. To evaluate this method, alexnet network and twelve classes of imagenet database have been used and tested under different bandwidths. Tests performed on the proposed method show that, depending on the available bandwidth, up to 53% improvement in inference latency is obtained compared to using the simple collaborative intelligence method. Another advantage of the proposed method is that it solves a wide range of problems, and several of the previously proposed methods are a special case of our method