RT
Ruhollah Taghizadeh–Mehrjardi
Author with expertise in Digital Soil Mapping Techniques
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
9
(56% Open Access)
Cited by:
921
h-index:
39
/
i10-index:
78
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Predicting and Mapping of Soil Organic Carbon Using Machine Learning Algorithms in Northern Iran

Mostafa Emadi et al.Jul 12, 2020
Estimation of the soil organic carbon (SOC) content is of utmost importance in understanding the chemical, physical, and biological functions of the soil. This study proposes machine learning algorithms of support vector machines (SVM), artificial neural networks (ANN), regression tree, random forest (RF), extreme gradient boosting (XGBoost), and conventional deep neural network (DNN) for advancing prediction models of SOC. Models are trained with 1879 composite surface soil samples, and 105 auxiliary data as predictors. The genetic algorithm is used as a feature selection approach to identify effective variables. The results indicate that precipitation is the most important predictor driving 14.9% of SOC spatial variability followed by the normalized difference vegetation index (12.5%), day temperature index of moderate resolution imaging spectroradiometer (10.6%), multiresolution valley bottom flatness (8.7%) and land use (8.2%), respectively. Based on 10-fold cross-validation, the DNN model reported as a superior algorithm with the lowest prediction error and uncertainty. In terms of accuracy, DNN yielded a mean absolute error of 0.59%, a root mean squared error of 0.75%, a coefficient of determination of 0.65, and Lin’s concordance correlation coefficient of 0.83. The SOC content was the highest in udic soil moisture regime class with mean values of 3.71%, followed by the aquic (2.45%) and xeric (2.10%) classes, respectively. Soils in dense forestlands had the highest SOC contents, whereas soils of younger geological age and alluvial fans had lower SOC. The proposed DNN (hidden layers = 7, and size = 50) is a promising algorithm for handling large numbers of auxiliary data at a province-scale, and due to its flexible structure and the ability to extract more information from the auxiliary data surrounding the sampled observations, it had high accuracy for the prediction of the SOC base-line map and minimal uncertainty.
0
Paper
Citation189
0
Save
0

Exploring the Potential of PRISMA Satellite Hyperspectral Image for Estimating Soil Organic Carbon in Marvdasht Region, Southern Iran

Mehdi Amoli et al.Jun 13, 2024
Soil organic carbon (SOC) is a crucial factor for soil fertility, directly impacting agricultural yields and ensuring food security. In recent years, remote sensing (RS) technology has been highly recommended as an efficient tool for producing SOC maps. The PRISMA hyperspectral satellite was used in this research to predict the SOC map in Fars province, located in southern Iran. The main purpose of this research is to investigate the capabilities of the PRISMA satellite in estimating SOC and examine hyperspectral processing techniques for improving SOC estimation accuracy. To this end, denoising methods and a feature generation strategy have been used. For denoising, three distinct algorithms were employed over the PRISMA image, including Savitzky–Golay + first-order derivative (SG + FOD), VisuShrink, and total variation (TV), and their impact on SOC estimation was compared in four different methods: Method One (reflectance bands without denoising, shown as M#1), Method Two (denoised with SG + FOD, shown as M#2), Method Three (denoised with VisuShrink, shown as M#3), and Method Four (denoised with TV, shown as M#4). Based on the results, the best denoising algorithm was TV (Method Four or M#4), which increased the estimation accuracy by about 27% (from 40% to 67%). After TV, the VisuShrink and SG + FOD algorithms improved the accuracy by about 23% and 18%, respectively. In addition to denoising, a new feature generation strategy was proposed to enhance accuracy further. This strategy comprised two main steps: first, estimating the number of endmembers using the Harsanyi–Farrand–Chang (HFC) algorithm, and second, employing Principal Component Analysis (PCA) and Independent Component Analysis (ICA) transformations to generate high-level features based on the estimated number of endmembers from the HFC algorithm. The feature generation strategy was unfolded in three scenarios to compare the ability of PCA and ICA transformation features: Scenario One (without adding any extra features, shown as S#1), Scenario Two (incorporating PCA features, shown as S#2), and Scenario Three (incorporating ICA features, shown as S#3). Each of these three scenarios was repeated for each denoising method (M#1–4). After feature generation, high-level features were added to the outputs of Methods One, Three, and Four. Subsequently, three machine learning algorithms (LightGBM, GBRT, RF) were employed for SOC modeling. The results showcased the highest accuracy when features obtained from PCA transformation were added to the results from the TV algorithm (Method Four—Scenario Two or M#4–S#2), yielding an R2 of 81.74%. Overall, denoising and feature generation methods significantly enhanced SOC estimation accuracy, escalating it from approximately 40% (M#1–S#1) to 82% (M#4–S#2). This underscores the remarkable potential of hyperspectral sensors in SOC studies.
0
Paper
Citation1
0
Save
0

Random Forest-Based Soil Moisture Estimation Using Sentinel-2, Landsat-8/9, and UAV-Based Hyperspectral Data

Hadi Shokati et al.May 29, 2024
Accurate spatiotemporal monitoring and modeling of soil moisture (SM) is of paramount importance for various applications ranging from food production to climate change adaptation. This study deals with modeling SM with the random forest (RF) algorithm using datasets comprising multispectral data from Sentinel-2, Landsat-8/9, and hyperspectral data from the CoSpectroCam sensor (CSC, licensed to AgriWatch BV, Enschede, The Netherlands) mounted on an unmanned aerial vehicle (UAV) in Iran. The model included nine bands from Landsat-8/9, 11 bands from Sentinel-2, and 1252 bands from the CSC (covering the wavelength range between 420 and 850 nm). The relative feature importance and band sensitivity to SM variations were analyzed. In addition, four indices, including the perpendicular index (PI), ratio index (RI), difference index (DI), and normalized difference index (NDI) were calculated from the different bands of the datasets, and their sensitivity to SM was evaluated. The results showed that the PI exhibited the highest sensitivity to SM changes in all datasets among the four indices considered. Comparisons of the performance of the datasets in SM estimation emphasized the superior performance of the UAV hyperspectral data (R2 = 0.87), while the Sentinel-2 and Landsat-8/9 data showed lower accuracy (R2 = 0.49 and 0.66, respectively). The robust performance of the CSC data is likely due to its superior spatial and spectral resolution as well as the application of preprocessing techniques such as noise reduction and smoothing filters. The lower accuracy of the multispectral data from Sentinel-2 and Landsat-8/9 can also be attributed to their relatively coarse spatial resolution compared to the CSC, which leads to pixel non-uniformities and impurities. Therefore, employing the CSC on a UAV proves to be a valuable technology, providing an effective link between satellite observations and ground measurements.
0

Soil textural class modeling using digital soil mapping approaches: Effect of resampling strategies on imbalanced dataset predictions

Fereshteh Mirzaei et al.Sep 1, 2024
In a digital soil mapping (DSM) context, machine learning (ML) algorithms are widely used to model soil textural classes (STCs). However, in the real world most soil class datasets exhibit imbalanced distributions. This poses a challenge as ML algorithms are designed to handle balanced classes, leading to a bias towards the majority classes while often overlooking the minority classes. Furthermore, within the DSM framework, two strategies can be employed to model STCs: direct and indirect approaches. In the direct approach, STCs are directly inputted into the model for prediction. In contrast, the indirect approach involves introducing soil texture fractions (i.e., clay, silt, sand) as initial inputs, then STCs are obtained from the outputs. Limited research has been conducted on the impact of data balancing on STC predictions, and there is a lack of comparative analysis between direct and indirect approaches in this context. Therefore, this study aimed to evaluate the efficacy of a resampling technique (SMOTE: synthetic minority oversampling technique) in handling an imbalanced soil texture dataset collected from the Kuhdasht region in western Iran. Additionally, the study sought to compare the performance of direct and indirect modeling approaches. Environmental covariates derived from Landsat 8 and Sentinel 2 images along with a digital elevation model (DEM) were used as input variables to a random forest (RF) model to model STCs and soil texture fractions. The results revealed that terrain attributes and Euclidean distances played a more significant role in modeling both balanced and imbalanced datasets compared to remotely sensed data. Kappa indices for balanced and imbalanced datasets, as well as for the indirect approach were found to be 89%, 68% and 38% respectively. In the same way, the overall accuracies were 91%, 79% and 68%, respectively. Among the imbalanced classes, clay loam and loam which accounted for the majority of observations showed the highest recall values, followed by sandy clay loam, sandy loam and silty clay loam. When employing the indirect approach, the RF model failed to capture the minority classes in terms of validation statistics. Additionally, modeling with the imbalanced dataset resulted in the exclusion of three minority STCs from the final map. Overall, this study showed the importance of balancing STCs prior to modeling to achieve more accurate estimates of STCs, as well as the superiority of employing the direct approach (using balanced data sets) over the indirect approach.
0

Assessment of Land Suitability Potential Using Ensemble Approaches of Advanced Multi-Criteria Decision Models and Machine Learning for Wheat Cultivation

Kamal Nabiollahi et al.Jul 12, 2024
Land suitability assessment, as an important process in modern agriculture, involves the evaluation of numerous aspects such as soil properties, climate, relief, hydrology and socio-economic aspects. The aim of this study was to evaluate the suitability of soils for wheat cultivation in the Gavshan region, Iran, as the country is facing the task of becoming self-sufficient in wheat. Various methods were used to evaluate the land, such as multi-criteria decision-making (MCDM), which is proving to be important for land use planning. MCDM and machine learning (ML) are useful for decision-making processes because they use complicated spatial data and methods that are widely available. Using a geomorphological map, seventy soil profiles were selected and described, and ten soil properties and wheat yields were determined. Three MCDM approaches, including the technique of preference ordering by similarity to the ideal solution (TOPSIS), gray relational analysis (GRA), and simple additive weighting (SAW), were used and evaluated. The criteria weights were extracted using Shannon’s entropy method. Random forest (RF) model and auxiliary variables (remote sensing data, terrain data, and geomorphological maps) were used to represent the land suitability values. Spatial autocorrelation analysis as a statistical method was applied to analyze the spatial variability of the spatial data. Slope, CEC (cation exchange capacity), and OC (organic carbon) were the most important factors for wheat cultivation. The spatial autocorrelation between the key criteria (slope, CEC, and OC) and wheat yield confirmed these results. These results also showed a significant correlation between the land suitability values of TOPSIS, GRA, and SAW and wheat yield (0.74, 0.72, and 0.57, respectively). The spatial distribution of land suitability values showed that the areas classified as good according to TOPSIS and GRA were larger than those classified as moderate and weak according to the SAW approach. These results were also confirmed by the autocorrelation of the MCDM techniques with wheat yield. In addition, the RF model showed its effectiveness in processing complex spatial data and improved the accuracy of land suitability assessment. In this study, by integrating advanced MCDM techniques and ML, an applicable land evaluation approach for wheat cultivation was proposed, which can improve the accuracy of land suitability and be useful for considering sustainability principles in land management.