کاربست الگوریتم‌های یادگیری ماشین برای تخمین تابش خورشیدی (مورد مطالعه: اقلیم خشک و نیمه‌خشک)

نوع مقاله : مقاله پژوهشی‌

نویسندگان

1 دانشیار گروه علوم و مهندسی آب، دانشکده کشاورزی و منابع طبیعی، دانشگاه اردکان، اردکان، ایران

2 پژوهشکده آب، انرژی و محیط زیست، دانشگاه اردکان، اردکان، ایران استادیار گروه مهندسی برق، دانشکده فنی و مهندسی، دانشگاه اردکان، اردکان، ایران

چکیده

تابش خورشیدی، یکی از متغیرهای مهم در مدل­های بیلان انرژی و شبیه­سازی رشد گیاهان است. در پژوهش حاضر، عملکرد نه الگوریتم یادگیری ماشین نظارت شده شامل الگوریتم­های رگرسیون خطی (LR)، رگرسیون خطی با اصلاح تابع زیان (LASSO)، رگرسیون خالص الاستیک (EN)، k نزدیک‌ترین همسایه (KNN)، درخت تصمیم­گیری (DT)، ماشین بردار پشتیبان (SVR)، جنگل تصادفی (RF)، درختان اضافی (ET) و الگوریتم تقویت ماشین (GBM) برای برآورد تابش خورشیدی در ایستگاه همدید یزد در حد فاصل سال­های 2005 تا 2021 با روش اعتبار سنجی متقابل (kfold) مورد بررسی قرار گرفت. پارامترهای میانگین دما، دمای کمینه، دمای بیشینه، ساعات آفتابی، رطوبت نسبی و تابش خورشیدی به­صورت روزانه از سازمان هواشناسی کشور دریافت و متغیرهای تابش فرازمینی، فاصله نسبی زمین تا خورشید، زاویه میل خورشیدی و حداکثر ساعات آفتابی با روابط موجود محاسبه و برای ورودی مدل­های پیش­بینی انتخاب شدند. معیارهای ارزیابی برای تخمین تابش خورشیدی MSE (متوسط مربعات خطا)، MAPE (متوسط قدرمطلق خطا) و ضریب تعیین (R2) در نظر گرفته شدند. نتایج نشان داد که مدل رگرسیون ماشین بردار پشتیبان (SVR) کمترین خطا را برای تخمین تابش روزانه خورشید دارد؛ به­طوری­که مدل ماشین بردار پشتیبان با میانگین مربعات خطای 85/2 مگا ژول بر مترمربع بر روز، قدر مطلق خطای 803/0 و ضریب تبیین 919/0 در مرحله آزمون و به­ترتیب 54/1 مگا ژول بر مترمربع بر روز، 92/4 و 870/0 در مرحله آموزش مدل­ها نسبت به سایر مدل­ها عملکرد بهتری در تخمین تابش خورشیدی داشته است که نشان­دهنده توانائی این مدل برای کاربردهای خورشیدی و گرمایی توسط مهندسان و سایر محققین است.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Application of machine learning algorithms to estimate solar radiation (case study: arid and semi-arid climate)

نویسندگان [English]

  • Somayeh Soltani-Gerdefaramarzi 1
  • Hajar Momeni 2
1 Associated Professor, Department of Water Engineering and Sciences, Faculty of Agriculture and Natural Resources, Ardakan University, Ardakan, Iran
2 Water, Energy and Environment Research Institute, Ardakan University, P.O. Box 184, Ardakan, Iran Assistant Professor, Department of Electrical Engineering, Faculty of Engineering, Ardakan University, Ardakan, Iran
چکیده [English]

Solar radiation is very important as one of the important variables in energy balance models and plant growth simulation. Although the measurement of this variable has a relatively long history in Iran, due to the high costs of measuring devices, there is no pyranometer in many existing stations in the country, and there are problems such as its recalibration, water, and dust accumulation that exists on the sensor. Even in meteorological stations that measure radiation, there are days when radiation data is not recorded or unrealistic values outside the expected range are observed due to equipment violations or other problems.
This research investigated the performance of nine machine learning algorithms including linear regression (LR), Least Absolute Shrinkage and Selection Operator (Lasso), Elastic Net (EN), K-Nearest Neighbors (kNN), Decision Tree (DT), Support Vector Regression (SVR), Random Forest (RF), Extra Trees (ET) and Gradient Boosting Machine (GBM) to estimate solar radiation in Yazd synoptic station between 2005 and 2021 with cross-validation method (kfold). The parameters of average temperature, minimum temperature, maximum temperature, sunny hours, relative humidity, and solar radiation are obtained from the National Meteorological Organization on a daily basis and extraterrestrial radiation variables, relative distance from the earth to the sun, solar inclination angle, and maximum sunny hours are calculated with existing relationships and were selected as input for the prediction models. The evaluation criteria for solar radiation estimation were MSE (Mean Square Error), MAPE (Mean Absolute Error), and determination Coefficient (R2).
The results showed the coefficient of determination (R2) varies between 0.716 and 0.870 depending on the algorithm used in the training phase. In other words, in terms of the determination coefficient, all the used algorithms showed good results for predicting solar radiation. According to the results of all three criteria, it can be seen that the Support Vector Regression (SVR) algorithm has performed better than other algorithms. After the support vector regression (SVR) algorithm, the linear regression (LR) algorithm was ranked next with the MAPE of 5.04, the MSE of 1.13, and the R2 of 0.867. Also, the elastic pure regression algorithm (EN) with the highest mean absolute value of error (MAPE), the highest mean squared error (MSE), and the lowest coefficient of explanation (R2) ranked last among the nine used algorithms. After the data training phase, using the K-fold cross-validation method, the remaining 20% of the data were tested. As the results show, the MSE changes for nine machine learning algorithms are high and vary from about 3 to 9 Mj/m2/day. Its highest value was observed in the DT algorithm and its lowest value was observed in the support vector algorithm. The average value of the absolute value of the error was also in the range of 0.8 to 2.2 Mj/m2/day, and also the values of the R2 were different in the range of 0.7 to 0.9. In general, and according to the results of all three evaluation criteria, the support vector machine algorithm showed the best results in the data test stage as well as in the training stage.

کلیدواژه‌ها [English]

  • Geometric characteristics
  • data mining
  • solar inclination angle
  • radiation
  • algorithm
  • Yazd
  1. جهان تیغ، ن.، پیری، ج. 1402. تخمین میزان تابش خورشیدی در اقلیم‌های مختلف ایران با استفاده از روش‌های هیبریدی یادگیری ماشین. نشریه علوم کاربردی و محاسباتی در مکانیک. 34(4): در حال چاپ.

    سلطانی گردفرامرزی، س.، ر.، تقی زاده، م. قاسمی. 1394. برآورد ضریب پخشیدگی طولی رودخانه با استفاده از انواع روش‌های داده کاوی. تحقیقات آب‌وخاک ایران. 46(3): 385-394.

    سلطانی گردفرامرزی، س.، ر.، تقی زاده. 1395. کاربرد روش‌های داده کاوی در تخمین عمق آبشستگی گروه پایه‌ها. هیدرولیک، 11(1): 67-75.

    سلطانی گردفرامرزی، س.، 1402. پیش‌بینی شدت تابش خورشیدی در ایستگاه یزد با به‌کارگیری مدل رگرسیونی مبتنی بر مولفه­های اصلی (PCR). هواشناسی کشاورزی. در حال چاپ.

    سیدیان، س. م.، فراستی، م.، روحانی، ح.، حشمت پور، ع. 1396. تخمین تابش خورشیدی با استفاده از پارامترهای هواشناسی. تحقیقات منابع آب ایران، 13(1): 88-100.

    شیخ الاسلامی، ن.، قهرمان، ب.، مساعدی، ا.، داوری، ک.، مهاجرپور، م. 1393. پیش‌بینی تبخیر و تعرق گیاه مرجع  (ETO) با استفاده از روش آنالیز مؤلفه‌های اصلی (PCA) و توسعه مدل رگرسیونی خطی چندگانه (MLR-PCA) (مطالعه موردی: ایستگاه مشهد). نشریه آب‌وخاک، 28(2): 420-429.

    محمدی، ب.، امامقلی زاده، ص. 1395. استفاده از تحلیل مؤلفه اصلی برای تعیین ورودی­های مؤثر بر تخمین بارش به کمک شبکه عصبی مصنوعی و ماشین بردار پشتیبان، سامانه­های سطوح آبگیر باران، 4(13): 67-75.

    Abdelhafidi, N., Bachari, N.E.I. and Abdelhafidi, Z., 2021. Estimation of solar radiation using stepwise multiple linear regression with principal component analysis in Algeria. Meteorology and Atmospheric Physics, 133(2), pp.205-216.

    Ağbulut, Ü., Gürel, A.E. and Biçen, Y., 2021. Prediction of daily global solar radiation using different machine learning algorithms: Evaluation and comparison. Renewable and Sustainable Energy Reviews, 135, p.110114.

    Amiri, V., Kamrani, S., Ahmad, A., Bhattacharya, P. and Mansoori, J., 2021. Groundwater quality evaluation using Shannon information theory and human health risk assessment in Yazd province, central plateau of Iran. Environmental Science and Pollution Research, 28(1), pp.1108-1130.

    Belmahdi, B., Louzazni, M. and El Bouardi, A., 2020. One month-ahead forecasting of mean daily global solar radiation using time series models. Optik, 219, p.165207.

    Boroughani, M., Soltani, S., Ghezelseflu, N. and Pazhouhan, I., 2022. A comparative assessment between artificial neural network, neuro-fuzzy, and support vector machine models in splash erosion modelling under simulation circumstances. Folia Oecologica, 49(1), pp.23-34.

    Chen, J.L., Li, G.S. and Wu, S.J., 2013a. Assessing the potential of support vector machine for estimating daily solar radiation using sunshine duration. Energy conversion and management, 75, pp.311-318.

    Chen, H.L., Huang, C.C., Yu, X.G., Xu, X., Sun, X., Wang, G. and Wang, S.J., 2013b. An efficient diagnosis system for detection of Parkinson’s disease using fuzzy k-nearest neighbor approach. Expert systems with applications, 40(1), pp.263-271.

    Duffie, J.A., Beckman, W.A., 1991. Solar Engineering of Thermal Processes. Wiley, New York.

    Geurts, P., Ernst, D. and Wehenkel, L., 2006. Extremely randomized trees. Machine learning, 63, pp.3-42.

    Han, J., Kim, S.Y., Lee, J. and Lee, W.H., 2022. Brain Age Prediction: A Comparison between Machine Learning Models Using Brain Morphometric Data. Sensors, 22(20), p.8077.

    Hunt, L.A., Kuchar, L., Swanton, C.J., 1998. Estimation of solar radiation for use in crop modeling. Agric. Meteorol. 91, 293–300.

    Hu, L.Y., Huang, M.W., Ke, S.W. and Tsai, C.F., 2016. The distance function effect on k-nearest neighbor classification for medical datasets. SpringerPlus, 5(1), pp.1-9.

    Kim, S., Mun, B.M. and Bae, S.J., 2018. Data depth based support vector machines for predicting corporate bankruptcy. Applied Intelligence, 48, pp.791-804.

    Kukreja, S.L., Löfberg, J. and Brenner, M.J., 2006. A least absolute shrinkage and selection operator (LASSO) for nonlinear system identification. IFAC proceedings volumes, 39(1), pp.814-819.

    Meenal, R. and Selvakumar, A.I., 2018. Assessment of SVM, empirical and ANN based solar radiation prediction models with most influencing input parameters. Renewable Energy, 121, pp.324-343.

    Mehdizadeh, S., Behmanesh, J. and Khalili, K.,

     

    1. Comparison of artificial intelligence methods and empirical equations to estimate daily solar radiation. Journal of Atmospheric and Solar-Terrestrial Physics, 146, pp.215-227.

    Mohammadi, K., Shamshirband, S., Tong, C.W., Alam, K.A., Petkovic, D., 2015. Potential of adaptive neuro-fuzzy system for prediction of daily global solar radiation by day of the year. Energy Convers. Manag. 93, 406–413.

    Moreno, A., Gilabert, M.A. and Martínez, B., 2011. Mapping daily global solar irradiation over Spain: A comparative study of selected approaches. Solar Energy, 85(9), pp.2072-2084.

    Nwokolo, S.C., Obiwulu, A.U., Ogbulezie, J.C. and Amadi, S.O., 2022. Hybridization of statistical machine learning and numerical models for improving beam, diffuse and global solar radiation prediction. Cleaner Engineering and Technology, 9, p.100529.

    Okundamiya MS, Emagbetere JO, Ogujor EA (2016) Evaluation of various global solar radiation models for Nigeria. Int J Green Energy 13(5):505–512.

    Olalekan, S., Abdullahi, M. I. and Olabisi, A. (2018). Modeling of Solar Radiation Using Artificial Neural Network for Renewable Energy Application. Journal of Applied Physics, 10(2), 6-12.

    Onel, M., Kieslich, C.A., Guzman, Y.A., Floudas, C.A. and Pistikopoulos, E.N., 2018. Big data approach to batch process monitoring: Simultaneous fault detection and diagnosis using nonlinear support vector machine-based feature selection. Computers & chemical engineering, 115, pp.46-63.

    Quej, V.H., Almorox, J., Arnaldo, J.A. and Saito, L., 2017. ANFIS, SVM and ANN soft-computing techniques to estimate daily global solar radiation in a warm sub-humid environment. Journal of Atmospheric and Solar-Terrestrial Physics, 155, pp.62-70.

    Radosevic, N., Duckham, M., Liu, G.J. and Sun, Q., 2020. Solar radiation modeling with KNIME and Solar Analyst: Increasing environmental model reproducibility using scientific workflows. Environmental Modelling & Software, 132, p.104780.

    Rahimikhoob A. 2010. Estimating global solar radiation using artificial neural network and air temperature data in a semi-arid environment. Renew. Energy. 35, 2131-2135.

    Sabziparvar A.A., and Shetaee H. 2007. Estimation of global solar radiation in arid and semi-arid climates of East and West Iran, Energy 32: 649–655.

    Seidian, S. M., Ferasati, M., Rouhani, H., Heshmatpour, A. 2016. Estimation of solar radiation using meteorological parameters. Iran Water Resources Research, 13(1): 88-100. (In Persian)

    Sheikhul-Islami, N., Qahraman, B., Mosaedi, A., Davari, K., Mohajerpour, M. 2013. Forecasting reference plant evapotranspiration (ETO) using principal component analysis (PCA) method and development of multiple linear regression model (MLR-PCA) (case study: Mashhad station). Journal of Water and Soil, 28(2): 420-429. (In Persian)

    Shi, T. and Horvath, S., 2006. Unsupervised learning with random forest predictors. Journal of Computational and Graphical Statistics, 15(1), pp.118-138.

    Taki, M., Rohani, A. and Yildizhan, H., 2021. Application of machine learning for solar radiation modeling. Theoretical and Applied Climatology, 143(3-4), pp.1599-1613.

    Yadav, A. K. and Chandel, S. S. (2015). Solar energy potential assessment of western Himalayan Indian state of Himachal Pradesh using J48 algorithm of WEKA in ANN based prediction model. Renewable Energy, 75, 675-693.

    Zang, H., Cheng, L., Ding, T., Cheung, K.W., Wang, M., Wei, Z. and Sun, G., 2020. Application of functional deep belief network for estimating daily global solar radiation: A case study in China. Energy, 191, p.116502.

    Zeng J, Qiao W (2013) Short-term solar power prediction using a support vector machine. Renewable Energy 52:118-127.

    Ziafati, A. and Maleki, A., 2020. Fuzzy ensemble system for SSVEP stimulation frequency detection using the MLR and MsetCCA. Journal of Neuroscience Methods, 338, p.108686.