مقایسه مدل‌های یادگیری ماشین در شناسایی مؤلفه‌های کلیدی ارزآوری صادرات در منطقه ویژه اقتصادی انرژی پارس

نوع مقاله : مقاله علمی پژوهشی

نویسندگان

دانشگاه خاتم

10.22059/jibm.2025.401083.5043

چکیده

هدف: در اقتصاد ملی ایران، مناطق ویژه اقتصادی به عنوان موتورهای محرک تجارت خارجی و تأمین ارز نقش حیاتی ایفا می‌کنند. در این میان، منطقه ویژه اقتصادی انرژی پارس با تمرکز بر صادرات محصولات با ارزشی نظیر محصولات پتروشیمی، میعانات گازی و فرآورده‌های نفتی، از جایگاهی بی‌بدیل برخوردار است. با این حال، تمامی صادرات این منطقه به یک میزان در ارزآوری مؤثر نیستند و شناسایی عواملی که منجر به خلق ارزش ارزی بالا می‌شوند، می‌تواند به تخصیص بهینه منابع، تنظیم سیاست‌های تشویقی و در نهایت، بیشینه‌سازی درآمدهای ارزی کشور بینجامد. این پژوهش با درک این ضرورت، با هدف شناسایی علمی و داده‌محور عوامل کلیدی مؤثر بر صادرات با ارزآوری بالا در این منطقه استراتژیک طراحی و اجرا شده است.

روش: جامعه آماری پژوهش، کلیه داده‌های تراکنش‌های صادراتی منطقه ویژه اقتصادی انرژی پارس در بازه زمانی شش ساله از ۱۳۹۷ تا ۱۴۰۳ را در بر می‌گیرد که بالغ بر ۳۵,۰۰۰ رکورد واقعی است. از این داده‌های گسترده برای آموزش و آزمایش مدل‌های پیش‌بینی کننده استفاده شده است. پس از مرحله پیش‌پردازش داده‌ها، سه الگوریتم قدرتمند و پرکاربرد یادگیری ماشین شامل درخت تصمیم، جنگل تصادفی و ماشین بردار پشتیبان (SVM) برای تحلیل داده‌ها به کار گرفته شد مدل‌های ایجادشده با معیار دقت (Accuracy) ارزیابی و مقایسه شدند تا کارآمدترین روش در پیش‌بینی ارزآوری بالا مورد مطالعه مشخص گردد.

یافته ها: نتایج حاصل از اجرای مدل‌ها بر روی داده‌های واقعی صادراتی، گویای برتری واضح مدل‌های مبتنی بر درخت بود. مدل درخت تصمی با دقت ۸۵.۳۶ درصد و مدل جنگل تصادفی با دقت ۸۵.۰۸ درصد بهترین عملکرد را در شناسایی صادرات با ارزآوری بالا از خود نشان دادند. این در حالی بود که مدل ماشین بردار پشتیبان (SVM) با دقت ۷۳.۷۷ درصد عملکرد ضعیف‌تری داشت. دلیل این امر می‌تواند به ماهیت داده‌ها و توزیع پیچیده مرزهای طبقه‌بندی بازگردد که مدل‌های خطی مانند SVM در جداسازی آن با چالش مواجه می‌شوند. علاوه بر این، تحلیل اهمیت ویژگی‌ها (Feature Importance) در مدل‌های درخت تصمیم و جنگل تصادفی، که از دقیق‌ترین مدل‌ها بودند، سه عامل کلیدی را به عنوان تأثیرگذارترین متغیرها در پیش‌بینی ارزآوری بالا معرفی کرد: نام کالا (نوع محصول) این متغیر به عنوان مهمترین عامل شناسایی شد و کشور مقصد بازار صادراتی دومین عامل بسیار مهم است. عواملی مانند فاصله جغرافیایی، شرایط تجاری و توافق‌های دوجانبه، ثبات اقتصادی کشور مقصد و توانایی پرداخت، به طور مستقیم بر ارزش معامله تأثیر می‌گذارند. صادرات به بازارهای خاص می‌تواند سودآوری بسیار بیشتری را به همراه داشته باشد. کارآمدی بسته‌بندی این یافته بر خلاف تصور رایج که بسته‌بندی را تنها یک عامل حاشیه‌ای می‌داند، نشان می‌دهد که استاندارد و بهینه بودن بسته‌بندی (از نظر حفظ کیفیت، کاهش ضایعات، مطابقت با استانداردهای بین‌المللی و کاهش هزینه‌های لجستیک) تأثیر مستقیم و معناداری بر ارزش نهایی صادرات دارد.

نتیجه گیری: این پژوهش به طور تجربی اثبات کرد که الگوریتم‌های یادگیری ماشین، به ویژه مدل‌های درختی، توانایی بالایی در شناسایی الگوهای پنهان در داده‌های عظیم صادراتی و پیش‌بینی عوامل مؤثر بر ارزآوری بالا دارند. نتایج این مطالعه می‌تواند مبنایی برای طراحی سیاست‌های صادراتی داده‌محور و تمرکز بر محصولات و بازارهای هدف با بیشترین بازدهی ارزی قرار گیرد

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Comparative Analysis of Machine Learning Models to Identify Key Features of Data for High Export Revenue in Pars Special Economic Energy Zone

نویسندگان [English]

  • Robab Kalantari
  • sholeh bagheri pormehr
Khatam university
چکیده [English]

Objective: In the national economy of Iran, special economic zones play a vital role as engines driving foreign trade and foreign exchange. Among them, the Pars Energy Special Economic Zone, focusing on the export of high-value products such as petrochemical products, gas condensates, and petroleum products, has an unparalleled position. However, not all exports from this region are equally effective in foreign exchange earnings, and identifying the factors that lead to the creation of high foreign exchange value can lead to the optimal allocation of resources, the regulation of incentive policies, and ultimately, the maximization of the country's foreign exchange earnings. Understanding this necessity, this study was designed and implemented with the aim of identifying the key factors affecting high-value exports in this strategic region in a scientific and data-driven manner.

Method: The statistical population of the study includes all export transaction data of the Pars Energy Special Economic Zone in the six-year period from 2018 to 2024, which amounts to 35,000 real records. This extensive data was used to train and test predictive models. After the data preprocessing stage, three powerful and widely used machine learning algorithms including decision tree, random forest and support vector machine (SVM) were used to analyze the data. The created models were evaluated and compared with the accuracy criterion to determine the most efficient method in predicting high foreign exchange earnings under study.

Findings: The results of running the models on real export data indicated the clear superiority of tree-based models. The decision tree model with an accuracy of 85.36% and the random forest model with an accuracy of 85.08% showed the best performance in identifying high foreign exchange earnings. This was while the support vector machine (SVM) model with an accuracy of 73.77% had a weaker performance. The reason for this can be attributed to the nature of the data and the complex distribution of classification boundaries, which linear models such as SVM face challenges in separating. In addition, the Feature Importance analysis in the decision tree and random forest models, which were among the most accurate models, identified three key factors as the most influential variables in predicting high exchange rate: the name of the product (product type) was identified as the most important factor, and the destination country of the export market was the second most important factor. Factors such as geographical distance, trade conditions and bilateral agreements, economic stability of the destination country, and ability to pay directly affect the transaction value. Exporting to specific markets can bring much greater profitability. Packaging Efficiency This finding, contrary to the popular belief that packaging is only a marginal factor, shows that the standard and optimality of packaging (in terms of maintaining quality, reducing waste, complying with international standards, and reducing logistics costs) has a direct and significant impact on the final value of exports.

Conclusion: This research empirically demonstrated that machine learning algorithms, especially tree models, have a high ability to identify hidden patterns in large export data and predict factors affecting high foreign exchange earnings. The results of this study can be a basis for designing data-driven export policies and focusing on products and target markets with the highest foreign exchange returns.

کلیدواژه‌ها [English]

  • Machine Learning
  • Export Revenue
  • Decision Tree
  • Random Forest
  • Support Vector Machine