LW
Lifeng Wu
Author with expertise in Global Forest Drought Response and Climate Change
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
15
(27% Open Access)
Cited by:
1,714
h-index:
42
/
i10-index:
93
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Comparison of Support Vector Machine and Extreme Gradient Boosting for predicting daily global solar radiation using temperature and precipitation in humid subtropical climates: A case study in China

Junliang Fan et al.Mar 5, 2018
The knowledge of global solar radiation (H) is a prerequisite for the use of renewable solar energy, but H measurements are always not available due to high costs and technical complexities. The present study proposes two machine learning algorithms, i.e. Support Vector Machine (SVM) and a novel simple tree-based ensemble method named Extreme Gradient Boosting (XGBoost), for accurate prediction of daily H using limited meteorological data. Daily H, maximum and minimum air temperatures (Tmax and Tmin), transformed precipitation (Pt, 1 for rainfall > 0 and 0 for rainfall = 0) and extra-terrestrial solar radiation (H0) during 1966–2000 and 2001–2015 from three radiation stations in humid subtropical China were used to train and test the models, respectively. Two combinations of input parameters, i.e. (i) only Tmax, Tmin and Ra, and (ii) complete data were considered for simulations. The proposed machine learning models were also compared with four well-known empirical models to evaluate their performances. The results suggest that the SVM and XGBoost models outperformed the selected empirical models. The performance of the machine learning models was improved by 5.9–12.2% for training phase and by 8.0–11.5% for testing phase in terms of RMSE when information of precipitation was further included. Compared with the SVM model, the XGBoost model generally showed better performance for training phase, and slightly weaker but comparable performance for testing phase in terms of accuracy. However, the XGBoost model was more stable with average increase of 6.3% in RMSE, compared to 10.5% for the SVM algorithm. Also, the XGBoost model (3.02 s and 0.05 s for training and testing phase, respectively) showed much higher computation speed than the SVM model (27.48 s and 4.13 s for training and testing phase, respectively). By jointly considering the prediction accuracy, model stability and computational efficiency, the XGBoost model is highly recommended to estimate daily H using commonly available temperature and precipitation data with excellent performance in humid subtropical climates.
0

Evaluation of SVM, ELM and four tree-based ensemble models for predicting daily reference evapotranspiration using limited meteorological data in different climates of China

Junliang Fan et al.Sep 1, 2018
Accurate estimation of reference evapotranspiration (ET0) is of great importance for the regional water resources planning and irrigation scheduling design. The FAO-56 Penman-Monteith model is recommended as the reference model to predict ET0, but its application is commonly restricted by lack of complete meteorological data at many worldwide locations. This study evaluated the potential of machine learning models, particularly four relatively simple tree-based assemble algorithms (i.e. random forest (RF), M5 model tree (M5Tree), gradient boosting decision tree (GBDT) and extreme gradient boosting (XGBoost)), for estimating daily ET0 with limited meteorological data using a K-fold cross-validation method. For assessment of the tree-based models in terms of prediction accuracy, stability and computational costs, these models were further compared with their corresponding support vector machine (SVM) and extreme learning machine (ELM) models. Four input combinations of daily maximum and maximum temperature (Tmax and Tmin), relative humidity (Hr), wind speed (U2), global and extra-terrestrial solar radiation (Rs and Ra) with Tmax, Tmin and Ra as the base dataset were considered using meteorological data during 1961–2010 from eight representative weather stations in different climates of China. The results showed that, when lack of complete meteorological data, the machine learning models using Tmax, Tmin, Hr, U2 and Ra obtained satisfactory ET0 estimates in the temperate continental, mountain plateau and temperate monsoon zones of China (RMSE < 0.5 mm d−1). However, models with three input parameters of Tmax, Tmin and Rs were superior for daily ET0 prediction in the tropical and subtropical zones. The ELM and SVM models offered the best combination of prediction accuracy and stability. The simple tree-based XGBoost and GBDT models showed comparable accuracy and stability to the SVM and ELM models, but exhibited much less computational costs. Considering the complexity level, prediction accuracy, stability and computational costs of the studied models, the XGBoost and GBDT models have been recommended for daily ET0 estimation in different climatic zones of China and maybe elsewhere with similar climates around the world.
0
Paper
Citation411
0
Save
0

Evaluation of CatBoost method for prediction of reference evapotranspiration in humid regions

Guomin Huang et al.Apr 29, 2019
Accurate estimation of reference evapotranspiration (ET0) is critical for water resource management and irrigation scheduling. This study evaluated the potential of a new machine learning algorithm using gradient boosting on decision trees with categorical features support (i.e., CatBoost) for accurately estimating daily ET0 with limited meteorological data in humid regions of China. Two other commonly used machine learning algorithms, Random Forests (RF) and Support Vector Machine (SVM), were also assessed for comparison. Eight input combinations of daily meteorological data [including both complete and incomplete combinations of solar radiation (Rs), maximum and minimum temperatures (Tmax and Tmin), relative humidity (Hr) and wind speed (U)] from five weather stations during 2001–2015 in South China were applied for model training and testing. The results showed that all the three algorithms could achieve satisfactory accuracy for ET0 estimation in subtropical China using Rs, Tmax and Tmin, or U, Hr, Tmax and Tmin as inputs, under the circumstances of lacking complete meteorological parameters. The increases in testing RMSE and MAPE over training RMSE and MAPE showed positive correlations with the number of input parameters to the machine learning models. For the local models, among the three algorithms, SVM offered the best prediction accuracy and stability with incomplete combinations of meteorological parameters as inputs, while CatBoost performed best with the complete combination of parameters. Patterns of the generalized models were almost the same as the local models, but the former ones showed less than 10% decreases in RMSE or MAPE in comparison with the latter ones. In addition, the computing time and memory usage for data processing of CatBoost were much less than those of RF and SVM. Overall, as a tree-based algorithm, CatBoost made significant improvements in accuracy, stability and computational cost when compared to RF. Therefore, the CatBoost algorithm has a very high potential for ET0 estimation in humid regions of China, and even possibly in other parts of the world with similar humid climates.
0
Paper
Citation367
0
Save
0

Extreme Temperature Index in China from a Statistical Perspective: Change Characteristics and Trend Analysis from 1961 to 2021

X Wang et al.Nov 20, 2024
Against the backdrop of intensified global climate change, the frequency and intensity of extreme weather events in mainland China continue to rise due to its unique topography and complex climate types. In-depth research on the trends and impacts of climate extremes can help develop effective adaptation and mitigation strategies to protect the environment and enhance social resilience. In this research, temperature data from 2029 meteorological stations for the period 1961–2021 were used to study 15 extreme temperature indices and 3 extreme composite temperature indices. Linear propensity estimation and the Mann–Kendall test were applied to analyze the spatial and temporal variations in extreme temperatures in China, and Pearson’s correlation analysis was used to reveal the relationship between these indices and atmospheric circulation. The results show that in the past 60 years, the extreme temperature index in China has shown a trend of decreasing low-temperature events and increasing high-temperature events; in particular, the increase in warm nights is significantly higher than that of warm days. In terms of spatial distribution, daily maximum temperature less than the 10th percentile (TX10P) and daily minimum temperature greater than the 90th percentile (TN90P) increased significantly in the warm temperate sub-humid (WTSH) region, north subtropical humid (NSH) region, and marginal tropical humid (MTH) region, whereas frost days (FD0) and diurnal temperature range (DTR) decreased significantly. In the extreme composite temperature index, extreme temperature range (ETR) showed a downward trend, while compound heatwave (CHW) and compound heatwave and relative humidity (CHW-RH20) increased, with the latter mainly concentrated in the WTSH and NSH regions. Correlation analysis with climate oscillation shows that Arctic Oscillation (AO), Atlantic Multiannual Oscillation (AMO), and El Niño–Southern Oscillation (ENSO) are positively correlated with extremely high temperatures, whereas North Atlantic Oscillation (NAO) and Pacific Decadal Oscillation (PDO) are negatively correlated.
0

Improvement of Citrus Yield Prediction Using UAV Multispectral Images and the CPSO Algorithm

Wenhao Xu et al.Jan 12, 2025
Achieving timely and non-destructive assessments of crop yields is a key challenge in the agricultural field, as it is important for optimizing field management measures and improving crop productivity. To accurately and quickly predict citrus yield, this study obtained multispectral images of citrus fruit maturity through an unmanned aerial vehicle (UAV) and extracted multispectral vegetation indices (VIs) and texture features (T) from the images as feature variables. Extreme gradient boosting (XGB), random forest (RF), support vector machine (SVM), gaussian process regression (GPR), and multiple stepwise regression (MSR) models were used to construct citrus fruit number and quality prediction models. The results show that, for fruit number prediction, the XGB model performed best under the combined input of VIs and T, with an R2 = 0.792 and an RMSE = 462 fruits. However, for fruit quality prediction, the RF model performed best when only the VIs were used, with an R2 = 0.787 and an RMSE = 20.0 kg. Although the model accuracy was acceptable, the number of input feature variables used was large. To further improve the model prediction performance, we explored a method that utilizes a hybrid coding particle swarm optimization algorithm (CPSO) coupled with XGB and SVM models. The coupled models had a significant improvement in predicting the number and quality of citrus fruits, especially the model of CPSO coupled with XGB (CPSO-XGB). The CPSO-XGB model had fewer input features and higher accuracy, with an R2 > 0.85. Finally, the Shapley additive explanations (SHAP) method was used to reveal the importance of the normalized difference chlorophyll index (NDCI) and the red band mean feature (MEA_R) when constructing the prediction model. The results of this study provide an application reference and a theoretical basis for the research on UAV remote sensing in relation to citrus yield.
Load More