MP
Miguel Pérez‐Enciso
Author with expertise in Genomic Selection in Plant and Animal Breeding
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
10
(80% Open Access)
Cited by:
826
h-index:
48
/
i10-index:
114
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Pig Domestication and Human-Mediated Dispersal in Western Eurasia Revealed through Ancient DNA and Geometric Morphometrics

Claudio Ottoni et al.Nov 22, 2012
Zooarcheological evidence suggests that pigs were domesticated in Southwest Asia ∼8,500 BC. They then spread across the Middle and Near East and westward into Europe alongside early agriculturalists. European pigs were either domesticated independently or more likely appeared so as a result of admixture between introduced pigs and European wild boar. As a result, European wild boar mtDNA lineages replaced Near Eastern/Anatolian mtDNA signatures in Europe and subsequently replaced indigenous domestic pig lineages in Anatolia. The specific details of these processes, however, remain unknown. To address questions related to early pig domestication, dispersal, and turnover in the Near East, we analyzed ancient mitochondrial DNA and dental geometric morphometric variation in 393 ancient pig specimens representing 48 archeological sites (from the Pre-Pottery Neolithic to the Medieval period) from Armenia, Cyprus, Georgia, Iran, Syria, and Turkey. Our results reveal the first genetic signatures of early domestic pigs in the Near Eastern Neolithic core zone. We also demonstrate that these early pigs differed genetically from those in western Anatolia that were introduced to Europe during the Neolithic expansion. In addition, we present a significantly more refined chronology for the introduction of European domestic pigs into Asia Minor that took place during the Bronze Age, at least 900 years earlier than previously detected. By the 5th century AD, European signatures completely replaced the endemic lineages possibly coinciding with the widespread demographic and societal changes that occurred during the Anatolian Bronze and Iron Ages.
0
Citation234
0
Save
2

Automatic fruit morphology phenome and genetic analysis: An application in the octoploid strawberry

Laura Zingaretti et al.Nov 10, 2020
ABSTRACT Automatizing phenotype measurement is needed to increase plant breeding efficiency. Morphological traits are relevant in many fruit breeding programs, as appearance influences consumer preference. Often, these traits are manually or semi-automatically obtained. Yet, fruit morphology evaluation can be boosted by resorting to fully automatized procedures and digital images provide a cost-effective opportunity for this purpose. Here, we present an automatized pipeline for comprehensive phenomic and genetic analysis of morphology traits extracted from internal and external strawberry images. The pipeline segments, classifies and labels the images, extracts conformation features, including linear (area, perimeter, height, width, circularity, shape descriptor, ratio between height and width) and multivariate (Fourier Elliptical components and Generalized Procrustes) statistics. Internal color patterns are obtained using an autoencoder to smooth out the image. In addition, we develop a variational autoencoder to automatically detect the most likely number of underlying shapes. Bayesian modeling is employed to estimate both additive and dominant effects for all traits. As expected, conformational traits are clearly heritable. Interestingly, dominance variance is higher than the additive component for most of the traits. Overall, we show that fruit shape and color can be quickly and automatically evaluated and is moderately heritable. Although we study the strawberry species, the algorithm can be applied to other fruits, as shown in the GitHub repository https://github.com/lauzingaretti/DeepAFS .
2
Citation2
0
Save
0

Pervasive selection pressure in wild and domestic pigs

Jordi Leno-Colorado et al.Sep 9, 2020
ABSTRACT Animal domestication typically affected numerous polygenic quantitative traits, such as behaviour, development and reproduction. However, uncovering the genetic basis of quantitative trait variation is challenging, since it is probably caused by small allele-frequency changes. To date, only a few causative mutations related to domestication processes have been reported, strengthening the hypothesis that small effect variants have a prominent role. So far, the studies on domestication have been limited to the detection of the global effect of domestication on deleterious mutations and on strong beneficial variants, ignoring the importance of variants with small selective effects. In addition, very often, the study of the effects of selection are conducted on genome sequences that contain a non-negligible fraction of missing data, especially in non-model organisms. Hence, appropriate methods to account for these positions are needed. To overcome these difficulties, here we propose to estimate the proportion of beneficial variants using the asymptotic MacDonald-Kreitman (MK) method based on estimates of variability that summarizes the site frequency spectrum (SFS) while accounting for missing data and use them to perform an Approximate Bayesian Computation (ABC) analysis to infer the Distribution of Fitness Effects (DFE) of each population. We applied this approach to 46 genome sequences of pigs from three different populations, one wild and two domestics, with very different demographic histories and selective pressures. The obtained results showed that domestic and wild pig populations do not differ in nonsynonymous fixed mutations. Therefore, differences in α estimation among breeds are determined by their polymorphisms. The comparison of α for total and exclusive mutations suggests that the different domestic populations have suffered recent divergent changes in their functional versus neutral polymorphisms ratio, while the wild population is compatible with α =0. Besides, the DFE inferred with ABC indicates that both wild and domestic pigs display a large number of deleterious mutations at low frequency and a high number of neutral and/or nearly-neutral mutations that may have a significant effect on the evolution of domestic and wild populations. In addition, models not considering beneficial mutations have higher posterior probabilities, suggesting that beneficial mutations are difficult to detect or are scarce. Indeed, for all three populations, the median proportion of the strong favourable mutations are very low (≤ 0.1%) in those models that includes positive selection, with the average values of weak beneficial mutations around 0.6% for wild boar and 0.8-1.0% for the domestic pigs. Lastly, the analysis based on exclusive mutations showed that recent demographic changes may have severely affected the fitness of populations, especially that of the local Iberian breed.
0
Citation1
0
Save
1

Computer generation of fruit shapes from DNA sequence

Miguel Pérez‐Enciso et al.Sep 22, 2022
Abstract The generation of realistic plant and animal images from marker information could be a main contribution of artificial intelligence to genetics and breeding. Since morphological traits are highly variable and highly heritable, this must be possible. However, a suitable algorithm has not been proposed yet. This paper is a proof of concept demonstrating the feasibility of this proposal using ‘decoders’, a class of deep learning architecture. We apply it to Cucurbitaceae, perhaps the family harboring the largest variability in fruit shape in the plant kingdom, and to tomato, a species with high morphological diversity also. We generate Cucurbitaceae shapes assuming a hypothetical, but plausible, evolutive path along observed fruit shapes of C. melo . In tomato, we used 353 images from 129 crosses between 25 maternal and 7 paternal lines for which genotype data were available. In both instances, a simple decoder was able to recover expected shapes with large accuracy. For the tomato pedigree, we also show that the algorithm can be trained to generate offspring images from their parents’ shapes, bypassing genotype information. Data and code are available at https://github.com/miguelperezenciso/dna2image .
22

Opportunities and limits of combining microbiome and genome data for complex trait prediction

Miguel Pérez‐Enciso et al.Oct 5, 2020
Abstract The analysis and prediction of complex traits using microbiome data combined with host genomic information is a topic of utmost interest. However, numerous questions remain to be answered: How useful can the microbiome be for complex trait prediction? Are microbiability estimates reliable? Can the underlying biological links between the host’s genome, microbiome, and the phenome be recovered? Here, we address these issues by (i) developing a novel simulation strategy that uses real microbiome and genotype data as input, and (ii) proposing a variance-component approach which, in the spirit of mediation analyses, quantifies the proportion of phenotypic variance explained by genome and microbiome, and dissects it into direct and indirect effects. The proposed simulation approach can mimic a genetic link between the microbiome and SNP data via a permutation procedure that retains the distributional properties of the data. Results suggest that microbiome data could significantly improve phenotype prediction accuracy, irrespective of whether some abundances are under direct genetic control by the host or not. Overall, random-effects linear methods appear robust for variance components estimation, despite the highly leptokurtic distribution of microbiota abundances. Nevertheless, we observed that accuracy depends in part on the number of microorganisms’ taxa influencing the trait of interest. While we conclude that overall genome-microbiome-links can be characterized via variance components, we are less optimistic about the possibility of identifying the causative effects, i.e., individual SNPs affecting abundances; power at this level would require much larger sample sizes than the ones typically available for genome-microbiome-phenome data. Author summary The microbiome consists of the microorganisms that live in a particular environment, including those in our organism. There is consistent evidence that these communities play an important role in numerous traits of relevance, including disease susceptibility or feed efficiency. Moreover, it has been shown that the microbiome can be relatively stable throughout an individual’s life and that is affected by the host genome. These reasons have prompted numerous studies to determine whether and how the microbiome can be used for prediction of complex phenotypes, either using microbiome alone or in combination with host’s genome data. However, numerous questions remain to be answered such as the reliability of parameter estimates, or which is the underlying relationship between microbiome, genome, and phenotype. The few available empirical studies do not provide a clear answer to these problems. Here we address these issues by developing a novel simulation strategy and we show that, although the microbiome can significantly help in prediction, it will be difficult to retrieve the actual biological basis of interactions between the microbiome and the trait.
0

Evaluation of Deep Learning for predicting rice traits using structural and single-nucleotide genomic variants

Ioanna‐Theoni Vourlaki et al.Jan 22, 2024
Abstract Structural variants (SVs) such as deletions, inversions, duplications, and Transposable Element (TE) Insertion Polymorphisms (TIPs) are prevalent in plant genomes and have played an important role in evolution and domestication, as they constitute a significant source of genomic and phenotypic variability. Nevertheless, most methods in quantitative genetics focusing on crop improvement, such as genomic prediction, consider Single Nucleotide Polymorphisms (SNPs) as the only type of genetic marker. Here, we used rice to investigate whether combining the structural and nucleotide genome-wide variation can improve prediction ability of traits when compared to using only SNPs. Moreover, we also examine the potential advantage of Deep Learning (DL) networks over Bayesian Linear models, which have been widely applied in genomic prediction. Specifically, the performance of BayesC and a Bayesian Reproducible Kernel Hilbert space regressions were compared to two different DL architectures, the Multilayer Perceptron, and the Convolution Neural Network. We further explore their prediction ability by using various marker input strategies and found that exploiting structural and nucleotide variation improves prediction ability on complex traits in rice. Also, DL models outperformed Bayesian models in 75% of the studied cases. Finally, DL systematically improved prediction ability of binary traits against the Bayesian models.
0

SeqBreed: a python tool to evaluate genomic prediction in complex scenarios

Miguel Pérez‐Enciso et al.Aug 28, 2019
Background: Genomic Prediction (GP) is the procedure whereby molecular information is used to predict complex phenotypes. Although GP can significantly enhance predictive accuracy, it can be expensive and difficult to implement. To help in designing optimum experiments, including genome wide association studies and genomic selection experiments, we have developed SeqBreed, a generic and flexible python3 forward simulator. Results: SeqBreed accommodates sex and mitochondrion chromosomes as well as autopolyploidy. It can simulate any number of complex phenotypes determined by any number of causal loci. SeqBreed implements several GP methods, including single step GBLUP. We demonstrate its functionality with Drosophila Genome Reference Panel (DGRP) sequence data and with tetraploid potato genotypes. Conclusions: SeqBreed is a flexible and easy to use tool appropriate for optimizing GP or genome wide association studies. It incorporates some of the most popular GP methods and includes several visualization tools. Code is open and can be freely modified. Software, documentation and examples are available at https://github.com/miguelperezenciso/SeqBreed.