JO
Joseph Ogutu
Author with expertise in Wildlife Ecology and Conservation Biology
Achievements
This user has not unlocked any achievements yet.
Key Stats
Upvotes received:
0
Publications:
4
(25% Open Access)
Cited by:
3
h-index:
44
/
i10-index:
74
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
5

Genomic prediction using machine learning: A comparison of the performance of regularized regression, ensemble, instance-based and deep learning methods on synthetic and empirical data

Vanda Lourenço et al.Jun 12, 2022
Abstract The accurate prediction of genomic breeding values is central to genomic selection in both plant and animal breeding studies. Genomic prediction involves the use of thousands of molecular markers spanning the entire genome and therefore requires methods able to efficiently handle high dimensional data. Not surprisingly, machine learning methods are becoming widely advocated for and used in genomic prediction studies. These methods encompass different groups of supervised and unsupervised learning methods. Although several studies have compared the predictive performances of individual methods, studies comparing the predictive performance of different groups of methods are rare. However, such studies are crucial for identifying (i) groups of methods with superior genomic predictive performance and assessing (ii) the merits and demerits of such groups of methods relative to each other and to the established classical methods. Here, we comparatively evaluate the genomic predictive performance and computational cost of several groups of supervised machine learning methods, specifically, regularized regression methods, deep, ensemble and instance-based learning algorithms, using one simulated animal breeding dataset and three empirical maize breeding datasets obtained from a commercial breeding program. Our results show that the relative predictive performance and computational expense of the groups of machine learning methods depend upon both the data and target traits and that for classical regularized methods, increasing model complexity can incur huge computational costs but does not necessarily always improve predictive accuracy. Thus, despite their greater complexity and computational burden, neither the adaptive nor the group regularized methods clearly improved upon the results of their simple regularized counterparts. This rules out selection of one procedure among machine learning methods for routine use in genomic prediction. The results also show that, because of their competitive predictive performance, computational efficiency, simplicity and therefore relatively few tuning parameters, the classical linear mixed model and regularized regression methods are likely to remain strong contenders for genomic prediction. The dependence of predictive performance and computational burden on target datasets and traits call for increasing investments in enhancing the computational efficiency of machine learning algorithms and computing resources. Author summary Machine learning methods are well suited for efficiently handling high dimensional data. Particularly, supervised machine learning methods have been successfully used in genomic prediction or genome-enabled selection. However, their comparative predictive accuracy is still poorly understood, yet this is a critical issue in plant and animal breeding studies given that increasing methodological complexity can substantially increase computational complexity or cost. Here, we show that predictive performance is both data and target trait dependent thus ruling out selection of one method for routine use in genomic prediction. We also show that for this reason, relatively low computational complexity and competitive predictive performance, the classical linear mixed model approach and regularized regression methods remain strong contenders for genomic prediction.
5
Citation3
0
Save
0

Wildebeest migration in East Africa: Status, threats and conservation measures

Fortunata Msoffe et al.Feb 11, 2019
Migration of ungulates is under pressure worldwide from range contraction, habitat loss and degradation, anthropogenic barriers and poaching. Here, we synthesize and compare the extent of historical migrations of the white-bearded wildebeest (Connochaetes taurinus) to their contemporary status, in five premier East African ecosystems, namely the Serengeti-Mara, Masai Mara, Athi-Kaputiei, Amboseli and Tarangire-Manyara. The current status, threats to migration, migratory ranges and routes for wildebeest were characterized using colonial-era maps, literature reviews, GIS and aerial survey databases, GPS collared animals and interviews with long-term researchers. Interference with wildebeest migratory routes and dispersal ranges has stopped or severely threatens continuation of the historical migration patterns in all but the Serengeti-Mara ecosystem where the threat level is relatively lower. Wildebeest migration has collapsed in Athi-Kaputiei ecosystem and is facing enormous pressures from land subdivision, settlements and fences in Amboseli and Mara ecosystems and from cultivation in Tarangire-Manyara ecosystem. Land use change, primarily expansion in agriculture, roads, settlements and fencing, increasingly restrict migratory wildebeest from accessing traditional grazing resources in unprotected lands. Privatization of land tenure in group ranches in Kenya and settlement policy (villagization) in Tanzania have accelerated land subdivision, fencing and growth in permanent settlements, leading to loss of key wildebeest habitats including their migratory routes and wet season calving and feeding grounds. These processes, coupled with increasing human population pressures and climatic variability, are exerting tremendous pressures on wildebeest migrations. Urgent conservation interventions are necessary to conserve and protect the critical wildebeest habitats and migration routes in East Africa.
0

Long-Term historical and Projected Herbivore Population Dynamics in Ngorongoro Crater, Tanzania

Joseph Ogutu et al.Feb 6, 2019
The Ngorongoro Crater is an intact caldera with an area of approximately 310 km2. Long term records on herbivore populations, vegetation and rainfall made it possible to analyze historic and project future herbivore population dynamics. In 1974 there was a perturbation in that resident Maasai and their livestock were removed from the Crater. Vegetation structure changed in 1967 from predominately short grassland to mid and tall grasses dominating in 1995. Even with a change in grassland structure, total herbivore biomass remained relatively stable from 1963 to 2012, implying that the crater has a stable multi-herbivore community. However, in 1974, Maasai pastoralists were removed from the Ngorongoro Crater and there were significant changes in population trends for some herbivore species. Buffalo, elephant and ostrich numbers increased significantly during 1974-2012. The zebra population was stable from 1963 to 2012 whereas numbers of other eight species declined substantially between 1974 and 2012 relative to their peak numbers during 1974-1976. Numbers of Grant’s and Thomson’s gazelles, eland, kongoni, waterbuck (wet season only) declined significantly in the Crater in both seasons after 1974. Wildebeest numbers decreased in the Crater between 1974 and 2012 but this decrease was not statistically significant. In addition, some herbivore species were consistently more abundant inside the Crater during the wet than the dry season. This pattern was most evident for the large herbivore species requiring bulk forage, comprising buffalo, eland, and elephant. Analyses of rainfall indicated that there was a persistent annual cycle of 4.83 years. Herbivore population size was correlated with rainfall in both the wet and dry seasons. The relationships established between the time series of historic animal counts in the wet and dry seasons and lagged wet and dry season rainfall series were used to forecast the likely future trajectories of the wet and dry season population size for each species under three alternative climate change scenarios.
0

Robust estimation of heritability and predictive accuracy in plant breeding: evaluation using simulation and empirical data

Vanda Lourenço et al.Jun 14, 2019
Background: Genomic prediction (GP) is used in animal and plant breeding to help identify the best genotypes for selection. One of the most important measures of the effectiveness and reliability of GP in plant breeding is predictive accuracy. An accurate estimate of this measure is thus central to GP. Moreover, regression models are the models of choice for analyzing field trial data in plant breeding. However, models that use the classical likelihood typically perform poorly, often resulting in biased parameter estimates, when their underlying assumptions are violated. This typically happens when data are contaminated with outliers. These biases often translate into inaccurate estimates of heritability and predictive accuracy, compromising the performance of GP. Since phenotypic data are susceptible to contamination, improving the methods for estimating heritability and predictive accuracy can enhance the performance of GP. Robust statistical methods provide an intuitively appealing and a theoretically well justified framework for overcoming some of the drawbacks of classical regression, most notably the departure from the normality assumption. We compare the performance of robust and classical approaches to two recently published methods for estimating heritability and predictive accuracy of GP using simulation of several plausible scenarios of random and block data contamination with outliers and commercial maize and rye breeding datasets. Results: The robust approach generally performed as good as or better than the classical approach in phenotypic data analysis and in estimating the predictive accuracy of heritability and genomic prediction under both the random and block contamination scenarios. Notably, it consistently outperformed the classical approach under the random contamination scenario. Analyses of the empirical maize and rye datasets further reinforce the stability and reliability of the robust approach in the presence of outliers or missing data. Conclusions: The proposed robust approach enhances the predictive accuracy of heritability and genomic prediction while alleviating the need for performing outlier detection for a broad range of simulation scenarios and empirical breeding datasets. Accordingly, plant breeders should seriously consider regularly using the robust alongside the classical approach and increasing the number of replicates to three or more, to further enhance the accuracy of the robust approach.