طبقه‌بندی نظرهای مشتریان با رویکرد متن‌کاوی و یادگیری عمیق (نمونه موردی: نظرهای کاربران وبسایت دیجی‌کالا)

نوع مقاله : مقاله علمی پژوهشی

نویسنده

دانشجوی کارشناسی ارشد، بخش مهندسی کامپیوتر، دانشکده فنی و مهندسی، دانشگاه شهید باهنر کرمان، کرمان، ایران.

چکیده

هدف: امروزه افراد هنگام خرید محصول یا تهیه خدمات، معیار‌های متفاوتی را برای تصمیم‌گیری در نظر می‌گیرند. یکی از این معیار‌ها، اطلاع از نظر خریداران قبلی محصولات و خدمات است؛ اما حجم زیاد نظرها نیز، چالشی است که پیش‌ روی این افراد قرار دارد. پژوهش حاضر با هدف ایجاد مدلی جهت تحلیل احساسات کاربران و طبقه‌بندی نظر آن‌ها برای حل این چالش اجرا شده است.
روش: پژوهش حاضر روی نظرهای خریداران تلفن همراه از وبسایت دیجی‌کالا، طی سال‌های ۱۳۹۴ تا ۱۳۹۵ انجام شده است. به‌منظور تحلیل احساسات و طبقه‌بندی نظرها، الگوریتم‌های مبتنی بر یادگیری عمیق و شبکه‌های پیچشی (کانوولوشن) که نوعی از شبکه‌های عمیق هستند، پیشنهاد شده است. در این پژوهش پس از پیش‌پردازش داده‌ها و یکسان‌سازی آن‌ها با استفاده از مدل از پیش تعلیم‌دیده فست تکست، کلمه‌ها به بردار‌هایی از اعداد صحیح تبدیل و به‌عنوان ورودی به شبکه عمیق پیشنهادی تحویل داده شدند.
یافته‌ها: جهت تعلیم مدل منتخب این پژوهش، ۹۰ مرتبه الگوریتم آموزشی روی آن اجرا شد. برای صحت عملکرد مدل منتخب از معیار‌های ماتریس گیجی، دقت، بازخوانی، معیار F و میزان دقت استفاده شد.
نتیجه‌گیری: در پژوهش حاضر با رویکرد شبکه‌های عمیق و با استفاده از شبکه‌های پیچشی و حافظه طولانی کوتاه‌مدت دوطرفه، پس از ۹۰ دوره آموزش، توانستیم با دقت ۹۳ درصد عقاید خریداران تلفن همراه در وبسایت دیجی‌کالا را طبقه‌بندی کنیم.

کلیدواژه‌ها


عنوان مقاله [English]

Customer Reviews Classification with Text Mining and Deep Learning Approach (Case Study: Digikala Customers Reviews)

نویسنده [English]

  • Parham Parnian
Msc. Student, Department of Computer Engineering, Faculty of Computer Engineering, Shahid Bahonar University of Kerman, Kerman, Iran.
چکیده [English]

Objective
Today, people face different decision-making criteria when purchasing products and services. One of these criteria is using the reviews of the previous purchasers of products and services. A large volume of reviews is seen as a challenge for these people. The present study aimed to create a model to analyze users’ sentiments and to classify their reviews to solve the mentioned challenge.
Methodology
The present study investigated the buyers’ reviews of mobile phones purchased on the Digikala Website from 2015 to 2016. To analyze the sentiments, and to classify the reviews, deep learning-based algorithms, and convolutional networks, subtypes of deep networks, were suggested. Prior to preprocessing and homogenizing the data, the study used a pre-trained Fastext model to convert the words into integer vectors and deliver them as inputs to the proposed deep network.
Findings
To train the selected model, the training algorithm was carried out on it 90 times. To validate the performance of the selected model, confusion matrix, accuracy, recall, F1-score, and precision rate criteria were used.
Conclusion
The present study used the deep networks approach, convolutional networks, and bidirectional long short-term memory to classify the buyers’ reviews of the mobile phone from the website above at 93% accuracy, and after 90 training periods.

کلیدواژه‌ها [English]

  • Deep learning
  • Convolutional neural networks
  • Reviews classification
  • Text mining
بخشی زاده، کبری؛ حاجی جعفر، علی و نصیری، حامد (1397). ترسیم نقشۀ ذهنی مشتریان فروشگاه اینترنتی دیجی‌کالا با استفاده از تکنیک استخراج استعاره‌ای زالتمن (زیمت). مدیریت بازرگانی، 10(1)، 49 - 72.
پورسعید، محمدمهدی؛ شجاعی، فرزانه و نیک‌نفس، علی اکبر (1400). عوامل مؤثر بر برندسازی مکان با رویکرد داده‌کاوی (نمونه‌کاوی: شبکه اجتماعی اینستاگرام). مدیریت بازرگانی، 13(2)، 473-501.
پیکری، ناصر؛ یعقوبی، سید علی اصغر و طاهری، حامد (1394). تحلیل احساسات در شبکه اجتماعی توییتر با تکنیک متن کاوی. کنفرانس بین‌المللی وب‌پژوهی.
توکلی گارماسه، عاطفه و رافع، وحید (1395). ارائه روشی برای آنالیز احساسات در متن نظرات. نخستین کنفرانس ملی تحقیقات بین رشته‌ای در مهندسی کامپیوتر، برق، مکانیک و مکاترونیک.
حقیقی، محمد؛ آقازاده، هاشم؛ خداداد حسینی، سید حمید و غریبی، معین (1398). تبیین ابعاد هوشمندی رقابتی با بهره‌گیری از قابلیت‌های شبکه‌های اجتماعی در صنعت ماءالشعیر ایران. مدیریت بازرگانی، 11(4)، 742-761.
سزاوار، امیر؛ فرسی، حسن و محمدزاده، سجاد (1397). بازیابی تصویر مبتنی بر محتوا با استفاده از شبکه‌های عصبی کانولوشن عمیق. مجله مهندسی برق دانشگاه تبریز، 48(4)، 1595-1603.
صنیعی، محمد و محمودی، سینا (1394). داده‌کاوی کاربردی. تهران: نیازدانش.
عباسی، فاطمه؛ خدیور، آمنه و یزدی‌نژاد، محسن (1399). تحلیل ادراکات کاربران دربارۀ خرید تلفن همراه در سایت دیجی‌کالا. نشریه علمی مطالعات کسب‌وکار هوشمند، 8(32)، 181 - 210.
عباسی، فاطمه؛ سهرابی، بابک؛ مانیان، امیر و خدیور، آمنه (1397). ارائه مدلی جهت دسته‌بندی احساسات خریداران کتاب با استفاده از رویکرد ترکیبی. مطالعات مدیریت کسب‌وکار هوشمند، 6(21)، 65-92.
عدالت، محمد حسن؛ عزمی، رضا و باقری نژاد، جعفر (1399). بهبود دقت پیش‌بینی فرایندها در مدیریت فرایندهای کسب‌وکار با به‌کارگیری معماری LSTM. چشم‌انداز مدیریت صنعتی، 10(3)، 71-97.
موسوی، سید محسن؛ امیری عقدایی، سید فتح اله (1399). شناسایی عناصر سازنده «ارزش پیشنهادی به مشتری» و تأثیر آنها بر رضایت مشتری با استفاده از تحلیل احساسات بر مبنای متن‌کاوی. مدیریت بازرگانی، 12(4)، 1092-1116.
نجف‌زاده، محسن؛ راحتی قوچانی، سعید و قائمی، رضا (1397). یک چارچوب نیمه‌نظارتی مبتنی بر لغت‌نامه وفقی خودساخت جهت تحلیل نظرات فارسی. پردازش علائم داده‌ها، 15(2)، 89 - 102.
نیک‌نام، فرزاد و نیک‌نفس، علی‌اکبر (1395). بهبود روش‌های متن‌کاوی در کاربرد پیش‌بینی بازار با استفاده از الگوریتم‌های انتخاب نمونه اولیه. مدیریت فناوری اطلاعات، 8(2)، 415 - 434.
یکسان‌سازی یا نرمال سازی متون فارسی با استفاده از کتابخانه JHazm. (1400). دریافت شده در 8 16، 1400، از https://bigdata-ir.com/?p=2387
 
References
Abbasi, F., Khadivar, A. & Yazdinezhad, M. (2020). Sentiment analysis of the Digikala Iphone buyers reviews. IT Management Studies, 8(32), 181-210. (in Persian)
Abbasi, F., Sohrabi, B., Khadivar, A. & Yazdinezhad, M. (2019). Presenting a model to classify book buyers using hybrid method. IT Management Studies, 8(32), 181 - 210. (in Persian)
Almutairi, Y., & Abdullah, M. (2020). IRHM: Inclusive Review Helpfulness Model for Review Helpfulness Prediction in E-commerce Platform. Journal of Information Technology Management, 12(2), 184-197.
Bakhshizadeh Borj, K., Haji Jafar, A., & Nasiri, H. (2018). Eliciting Mental Map of the Customers of Digikala E-Stores Using Zaltman Metaphor Elicitation Technique (ZMET). Journal of Business Management10(1), 49-72. (in Persian)
Deng, L. & Yu, D. (2014). Deep Learning: Methods and Applications. Foundations and Trends® in Signal Processing, 7(3–4), 197–387. doi:10.1561/2000000039
Edalat, M. H., Azmi, R. & Bagherinezhad, J. (2020). An Enhanced LSTM Method to Improve the Accuracy of the Business Process Prediction. Industrial Management Perspective, 10(3), 71-97. (in Persian)
Fang, X. & Zhan, J. (2015). Sentiment analysis using product review data. Journal of Big Data, 2(5), 1 - 14.
Filho, P. & Pardo, T. (2013). An Improved Hybrid System for Sentiment Analysis in Twitter Messages. Second Joint Conference on Lexical and Computational Semantics (*SEM), 568-572.
Haghighi, M., Aghazadeh, H., Khodadad Hosseini, S., Gharibi, M. (2019). Explaining the Dimension of Competitive Intelligence through Utilizing Social Media Capabilities in Iran Non-Alcoholic Beverage Industry. Journal of Business Management, 11(4), 742-761. (in Persian)
Hochreiter, S. & Schmidhuber, J. (1997). Long Short-term Memory. Neural Computation, 9(8), 1735–1780.
Liu, B. (2012). Sentiment Analysis and Opinion Mining. Synthesis Lectures on Human Language Technologies.
Liu, B. (2015). Sentiment analysis: Mining opinions, sentiments, and emotions. Cambridge University Press.
Mojumder, P., Hasan, M., Hossain, Md. F., & Hasan, K. M. A. (2020). A Study of fastText Word Embedding Effects in Document Classification in Bangla Language. In T. Bhuiyan, Md. M. Rahman, & Md. A. Ali (Eds.), Cyber Security and Computer Science (pp. 441–453). Springer International Publishing.
Mousavi, S., Amiri Aghdaie, S. (2021). Identifying the Constructive Elements of “Value Proposition” and their Impact on Customers’ Satisfaction using Sentiment Analysis based on Text Mining. Journal of Business Management, 12(4), 1092-1116. doi: 10.22059/jibm.2020.302987.3847. (in Persian)
Murugavalli, S., Bagirathan, U., Saiprassanth, R., & Arvindkumar, S. (2017). Feedback analysis using Sentiment Analysis for E- commerce. International Journal of Latest Engineering Research and Applications (IJLERA), 2(3), 84-90.
Najafzadeh, M., Rahati Ghouchani, S. & Ghaemi, R. (2018). A Semi-supervised Framework Based on Self-constructed Adaptive Lexicon for Persian Sentiment Analysis. Signal and Data Processing, 15(2), 89 - 102. (in Persian)
Niknam, F., & Niknafs, A. (2016). Improving Text Mining Methods in Market Prediction via Prototype Selection Algorithms. Journal of Information Technology Management (JITM), 8(2), 415 - 434. (in Persian)
Pandey, A. C., Rajpoot, D. S. & Saraswat, M. (2017). Twitter sentiment analysis using hybrid cuckoo search method. Information Processing & Management, 53(4), 764 - 799.
Peykari, N., Yaghoubi, S. A. & Taheri, H. (2015). Sentiment analysis in twitter using data mining method. International Conference on Web Research. (in Persian)
Poursaeed, M., Shojaee, F., Niknafs, A. (2021). The Factors Affecting Place Branding based on Data Mining Approach (Case Study: Instagram Social Media). Journal of Business Management, 13(2), 473-501. doi: 10.22059/jibm.2021.309977.3944. (in Persian)
Qayyum, A., Anwar, S. M., Awais, M. & Majid, M. (2017). Medical Image Retrieval using Deep Convolutional Neural Network. Neurocomputing, 266, 8-20.
Raghavan, V., Gwang, J. (1989). A Critical Investigation of Recall and Precision as Measures of Retrieval System Performance. ACM Transactions on Information Systems, 7(3), 205-229.
Saniee Abade, M., Mahmoudi, S. & Taherparvar, M. (2015). Applied data mining. (in Persian)
Sezavar, A., Farsi, H. & Mohammadzadeh, S. (2019). Content-Based Image Retrieval using Deep Convolutional Neural Networks. Tabriz Journal of Electrical Engineering (TJEE), 48(4), 1595-1603. (in Persian)
Tavakoli garmase, A. & Rafe, V. (2016). Presenting a method to analyze sentiments in reveiws texts. First National Conference on Industrial Engineering & Systems. (in Persian)
Wang, Z. (2017). The Evaluation of Ensemble Sentiment Classification Approach on Airline Services Using Twitter. Masters dissertation, Technological University Dublin, 2017. doi:10.21427/D7190M.
Yu, L., Wang, J., Lai, K., Xhang, X,. (2017) Refining Word Embeddings for Sentiment Analysis. Proceedings of the 2017 Conference on Empirical Methods in Natural Language Processing.
Zhang, Y., Ren, W., Zhu, T. & Faith, E. (2019). MoSa: A Modeling and Sentiment Analysis System for Mobile Application Big Data. Symmetry, 11(1), 115.