مدیریت یکپارچه پژوهش و بازشناسی ارزش داده‌ها

سخن سردبیر

چکیده

اتخاذ یک رویکرد یکپارچه، داده محور و مقیاس‌پذیر به چرخه فعالیت‌های پژوهشی در جامعه علمی ما یک ضرورت است. وجود داده‌های اثربخش، مدیریت فراداده‌ها، انباره‌های قوی، تحلیل‌گری‌ها و گزارشگری یافته‌ها به نهادها،گروه‌ها و افراد همگی در توفیق این چرخه موثرند. با توجه به گستردگی مباحث مدیریت یکپارچه پژوهش پرداختن به همه ابعاد آن امکان پذیر نمی‌باشد، اما آنچه رواست در این سخن به آن بپردازیم و برای پژوهشگران ما و به‌ویژه علاقه‌مندان به نشر کارهای پژوهشی در مجله مفید است، بازشناسی ارزش داده‌ها و شیوه‌های تجزیه و تحلیل آن‌ها در فرایند پژوهش است.
موفقیت فرایند پژوهش به‌طور طبیعی به کیفیت داده‌های در دسترس، دامنه و دربرگیرندگی آن و ابزارهای بکار‌رفته برای تحلیل آن بستگی دارد. رویکردهای نوین پژوهش عمدتاً بر نحوه روایت داده‌ها و افزایش کیفیت تجزیه و تحلیل آن مبتنی است. از این‌روست که پژوهشگران ما سخت نیازمند بکارگیری رویکردها و روش‌هایی در پژوهش هستند که مبتنی بر روایت‌های دقیق‌تری از گردآوری و تجزیه و تحلیل داده‌ها باشند.
در اینجا یکی از روایت‌های معطوف به تجزیه و تحلیل داده‌‌ها را می‌آورم که در این روایت به قول دیوید کاکس (David cox)  و براد افرون (Brad Efron)، بیشتر کارآمار (تحلیل داده‌ها) "درباره تاثیرات علی مداخلات" است  تا "پیش بینی‌ها". این تمایز گر‌چه چندان قطعی نیست اما نباید از این واقعیت دور شد که هدف نهایی همان تاثیرات علی است.
برای نمونه، لئو بریمان تصویری از دو گرایش درگیر تحلیل داده‌ها شامل مدل‌سازی داده‌ها (data modelling) و یادگیری ماشین الگوریتمی (algorithmic machine learning) ترسیم می‌کند. هر یک از این گرایش‌‌ها بیانگر شیوه‌هایی از روایت داده‌ها هستند. به قول گویدو ایمبنس (Guido Imbens) برنده نوبل اقتصاد در سال 2021،" اگرچه هریک از این روش‌ها به وقت خود و در جای خود صحیح هستند"، اما تشخیص شیوه مناسب توسط پژوهشگر حائز اهمیت است. باید گفت که استفاده از شیوه نخست یعنی مدل‌سازی داده‌ها پیامدهای زیر را بدنبال داشته است:

ارائه نظریه های نامرتبط و نتایج علمی مساله دار
بازداشتن تحلیل‌گران از مدل­های مطلوب الگوریتمی
ممانعت از پرداختن تحلیل‌گران به مسائل جدید مبتلا

براساس یادگیری ماشین الگوریتمی در حال حاضر مدل‌سازی­های مختلفی از الگوریتم­ها صورت گرفته است. توسعه­دهندگان الگوریتم اکنون به فراتر از مسائل اولیه پیش­بینی گام نهاده­اند و فعالانه روش­هایی را جستجو می­کنند تا اهداف و محدودیت­های علی را در الگوریتم­ها بگنجانند. از روش­های ایجاد شده برپایه الگوریتم­ها می­توان به شیوه­های گرافیکی (graphical, Pearl 2000)، دیدگاه نتایج بالقوه Imbens and Rubin, 2015)) و مکاشفات علی (peters et al. 2,017) اشاره کرد. در ادامه روش­های متنوع یادگیری ماشینی و امکان ترکیب آنها با روش­های تحلیلی موجود و موارد بکارگیری آنها در حل مسایل واقعی کسب­وکارها بطور خلاصه می­آید.
 
 








روش‌های یادگیری ماشینی








سایر روش‌های تحلیل








موارد کاربرد




                                                                                                                                            




-         خوشه بندی (Clustering)
-         فروکاهی بعدمندی (Dimensionality reduction)
-         طبقه بندی (Classification)
-          شبکه های عصبی معمول
(Conventional neural networks)
-         شبکه های یادگیری عمیق
(Deep learning networks)
-         شبکه عصبی همگشتی
(Convolutional neural network)
-         شبکه عصبی بازگشتی
(Recurrent neural network)
-         شبکه باورهای عمیق
(Deep belief networks)


-         رگرسیون
(Regression)
-         الگوریتم های جستجو
(Search algorithms)
-         مرتب سازی
(Sorting)
-         ترکیب سازی
(Merging)
-         همفشردگی
(Compression)
-         الگوریتم های گراف
(Graph algorithms)
-         بهینه سازی خطی و غیر خطی
(Linear and non-linear optimization)
-         پردازش سیگنال
(Signal processing)
-         رمزنگاری
(Encryption)


-         تخصیص منابع
(Resource allocation)
-         تحلیل های پیش نگر
(Predictive analytics)
-         نگهداری پیش نگر
(Predictive maintenance)
-         شخص سازی ویژه
(Hyper-personalization)
-         شناسایی روندهای جدید/ناسازگاریها
(Discover new trends /anomalies)
-         پیش بینی
(Forecasting)
-         بهینه سازی محصول و قیمت
(Price and product optimization)
-         تبدیل داده های ساختار نیافته
(Convert unstructured data)
-         رده بندی ارجحیتی
(Triaging)




 
 
قصدم از پرداختن به روش­های تحلیل یادگیری ماشینی و امکان ترکیب آن با سایر روش­های تحلیلی بیان یک روایت تازه از روش­های برخورد با داده­ها بعنوان دارایی ارزشمند در جهان امروز است.  اکنون از محققانی که می­خواهند به پژوهش و نشر یافته­های علمی در این مجله بپردازند این انتظار می رود که با اتکاء به رویکردهای نوین در پردازش و تحلیل داده­ها مسیرهای تازه­ای را پیشروی خود در مکاشفات علمی بگشایند.
به قول نظامی
 
تا کی از این راه نو روزگار                                                                                                پرده­ای از راه قدیمی بیار
 
 
 

عنوان مقاله [English]

Integrated research management and data value recognition

Breiman, leo (2001). statistical modelling: the two cultures, statistical science,16 (3) , 199-231.
Glymour, clark; zhang, kun & spirtes, peter  (2019). Review of Causal Discovery Methods Based on Graphical Models, frontiers in genetics, doi.org/10.3389/fgene.2019.00524
Imbens, guido & Athey, susan (2021). Breiman's Two Cultures: A Perspective from Econometrics, observational studies, 7(1).
McKinsey & company (2016). The Age of Analytics: Competing in A Data-Driven World