توصيفگر ها :
كيفيت توليد پلت , ابعاد پلت , داده كاوي , فرمولاسيون پلت , الگو هاي پر تكرار , راهنماي توليد
چكيده فارسي :
امروزه در بسياري از واحدهاي صنعتي، حجم وسيعي از دادهها و مطالعات در مورد پارامترهاي مختلف فرآيند توليد پلت، جمع آوري و ثبت ميشود اما استفاده از اين دادهها در اغلب مواردكارسادهاي نيست و نميتوان به صورت يكپارچه از اين حجم دادهها در جهت بهبود فرآيند توليد پلت، استفاده نمود. داده كاوي، بستري مناسب است كه ابزارهايي را براي تحليل پايگاههاي داده بزرگ و كشف روندها و الگوهاي موجود در اين منابع معرفي ميكند. پژوهش حاضر به شناسايي مؤلفههاي مؤثر بر بهبود كيفيت توليد، ابعاد پلت و راههاي تسهيل فرآيند توليد پلت ميپردازد. اين پژوهش در دو فاز انجام شده است. در فاز اول، پس از شناسايي عوامل تأثيرگذار بر كيفيت توليد پلت، يك چارچوب مفهومي ازمؤلفهها و زيرمؤلفههاي مؤثر بر بهبود كيفيت فيزيكي و شيميايي پلت، توسعه داده شده است و در فاز دوم براساس مولفه هاي شناسايي شده جمع آوري داده صورت گرفته است و طي سه رويكرد (سناريو) داده كاوي دانش موجود در داده هاي جمع آوري شده استخراج شده است. رويكرد اول مؤلفه هاي اثرگذار در تحقق ابعاد مطلوب پلت، در رويكرد دوم الگوهاي پرتكرار در بهبود فرمولاسيون پلت را شناسايي ميكند و در رويكرد سوم راهنماهاي اجرايي و كاربردي پارامترهاي فرآيند توليد را توسعه ميدهد؛ كه در نتيجه7 ويژگي فرآيندي مهم شامل طبقهبندي، سرعت و دماي دستگاه اكستروژن، لاكتوز 80، سديم بي كربنات، استارچ 1500 و سديم ساخارين كه ميانگين ميزان دقت مدل نهايي در رويكرد اول براي شناسايي اين 7 ويژگي 68.5 درصد است، به دست آمد و همچنين 10 قانون براي بهبود اصلاحيه فرمولاسيون نيز استخراج شد. استخراج مؤلفههاي و زير مؤلفهها از كارخانههاي دارويي و اسناد كتابخانه اي معتبر جهاني در زمينه فرمولاسيون پلت دارويي جمع آوري شده است و در اين پژوهش 156 فرمولاسيون مطلوب جمع آوري و مورد استفاده قرار گرفته است. دراين پژوهش از الگوهاي نظارتي منفرد شامل درخت تصميم، جنگل تصادفي، لاجستيك رگرسيون، كي- نزديك ترين همسايه، شبكه عصبي سه لايه (عميق)، الگوي نظارتي تركيبي VOTE و الگوهاي غير نظارتي شامل مدل هاي تشخيص الگوهاي پرتكرار ( FP-Growth) و مدلهاي استخراج قانون، استفاده شده است.
چكيده انگليسي :
Today, in many industrial units, a large volume of data and studies on various parameters of the pellet production process are collected and recorded, but the use of this data is not easy in most cases and it is not possible to integrate this volume of data to improve the pellet production process. , used Data mining is a platform that introduces tools for analyzing large databases and discovering trends and patterns in these sources. The current research identifies the effective components for improving production quality, pellet dimensions and ways to facilitate the pellet production process. This research was done in two phases. In the first phase, after identifying the factors affecting the quality of pellet production, a conceptual framework of components and sub-components effective in improving the physical and chemical quality of pellets has been developed, and in the second phase, data collection has been done based on the identified components and during Three approaches (scenarios) of data mining of the knowledge available in the collected data have been extracted. The first approach identifies the effective components in realizing the desired dimensions of the pellet, in the second approach, it identifies frequent patterns in the improvement of pellet formulation, and in the third approach, it develops operational and practical guidelines for the parameters of the production process; As a result, 7 important process characteristics including classification, speed and temperature of the extrusion machine, lactose 80, sodium bicarbonate, starch 1500 and sodium saccharin were obtained, and the average accuracy of the final model in the first approach to identify these 7 characteristics is 68.5%. 10 rules for improving the formulation amendment were also extracted. Extraction of components and sub-components from pharmaceutical factories and international reliable library documents in the field of pharmaceutical pellet formulation have been collected and in this research 156 optimal formulations have been collected and used. In this research, single monitoring models include decision tree, random forest, logistic regression, K-nearest neighbor, three-layer (deep) neural network, combined VOTE monitoring model and non-supervisory models including frequent pattern recognition models (FP-Growth) and Law extraction models have been used.