VC
Valérie Combes
Author with expertise in Genetic Architecture of Quantitative Traits
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
6
(50% Open Access)
Cited by:
11
h-index:
25
/
i10-index:
32
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

Genome-wide SNP genotyping of DNA pools identifies untapped landraces and genomic regions that could enrich the maize breeding pool

Marcella Arca et al.Oct 2, 2020
ABSTRACT Maize landraces preserved in genebanks have a large genetic diversity that is still poorly characterized and underexploited in modern breeding programs. Here, we genotyped DNA pools from 156 American and European landraces with a 50K SNP Illumina array to study the effect of both human selection and environmental adaptation on the genome-wide diversity of maize landraces. Genomic diversity of landraces varied strongly in different parts of the genome and with geographic origin. We detected selective footprints between landraces of different geographic origin in genes involved in the starch pathway ( Su1, Waxy1 ), flowering time ( Zcn8, Vgt3, ZmCCT9 ) and tolerance to abiotic and biotic stress ( ZmASR, NAC and dkg genes). Landrace diversity was compared to that of (i) 327 inbred lines representing American and European diversity (“CK lines) and (ii) 103 new lines derived directly from landraces (“DH-SSD lines”). We observed limited diversity loss or selective sweep between landraces and CK lines, except in peri-centromeric regions. However, analysis of modified Roger’s distance between landraces and the CK lines showed that most landraces were not closely related to CK lines. Assignment of CK lines to landraces using supervised analysis showed that only a few landraces, such as Reid’s Yellow Dent, Lancaster Surecrop and Lacaune, strongly contributed to modern European and American breeding pools. Haplotype diversity of CK lines was more enriched by DH-SSD lines that derived from the landraces with no related lines and the lowest contribution to CK lines. Our approach opens an avenue for the identification of promising landraces for pre-breeding. SIGNIFICANCE STATEMENTS Maize landraces are a valuable source of genetic diversity for addressing the challenges of climate change and the requirements of low input agriculture as they have been long selected to be well adapted to local agro-climatic conditions and human uses. However, they are underutilized in modern breeding programs because they are poorly characterized, genetically heterogeneous and exhibit poor agronomic performance compared to elite hybrid material. In this study, we developed a high-throughput approach to identify landraces that could potentially enlarge the genetic diversity of modern breeding pools. We genotyped DNA pools from landraces using 50K array technology, which is widely used by breeders to characterize the genetic diversity of inbred lines. To identify landraces that could enrich the modern maize germplasm, we estimated their contribution to inbred lines using supervised analysis and a new measurement of genetic distance.
1
Citation6
0
Save
2

Deciphering the genetic diversity of landraces with high-throughput SNP genotyping of DNA bulks: methodology and application to the maize 50k array

Marcella Arca et al.May 19, 2020
ABSTRACT Genebanks harbor original landraces carrying many original favorable alleles for mitigating biotic and abiotic stresses. Their genetic diversity remains however poorly characterized due to their large within genetic diversity. We developed a high-throughput, cheap and labor saving DNA bulk approach based on SNP Illumina Infinium HD array to genotype landraces. Samples were gathered for each landrace by mixing equal weights from young leaves, from which DNA was extracted. We then estimated allelic frequencies in each DNA bulk based on fluorescent intensity ratio (FIR) between two alleles at each SNP using a two step-approach. We first tested either whether the DNA bulk was monomorphic or polymorphic according to the two FIR distributions of individuals homozygous for allele A or B, respectively. If the DNA bulk was polymorphic, we estimated its allelic frequency by using a predictive equation calibrated on FIR from DNA bulks with known allelic frequencies. Our approach: (i) gives accurate allelic frequency estimations that are highly reproducible across laboratories, (ii) protects against false detection of allele fixation within landraces. We estimated allelic frequencies of 23,412 SNPs in 156 landraces representing American and European maize diversity. Modified Roger’s genetic Distance between 156 landraces estimated from 23,412 SNPs and 17 SSRs using the same DNA bulks were highly correlated, suggesting that the ascertainment bias is low. Our approach is affordable, easy to implement and does not require specific bioinformatics support and laboratory equipment, and therefore should be highly relevant for large-scale characterization of genebanks for a wide range of species.
2
Citation4
0
Save
4

Ecological and evolutionary drivers of phenotypic and genetic variation in the European crabapple (Malus sylvestris (L.) Mill.), a wild relative of the cultivated apple

X. Chen et al.Apr 10, 2022
Abstract Characterizing the phenotypic and genetic variation among populations of crop wild relatives help understanding the ecological and evolutionary processes involved in population divergence, and better harness their diversity to mitigate the impact of climate change on crops. We assessed genetic and phenotypic diversity of the European crabapple, Malus sylvestris , a main contributor to the cultivated apple genome ( Malus domestica ), and investigated for ecological divergence. We assessed variation in growth rate and traits related to carbon uptake between seedlings measured in a common garden, and related it to the genetic ancestry of the seedlings, assessed using 13 microsatellite loci and Bayesian clustering method. The occurrence of patterns of isolation-by-distance, -by-climate and -by-adaptation that might have caused genetic and phenotypic differentiation among M. sylvestris populations was also tested. Seedlings belonged to seven M. sylvestris populations in Europe, with 11.6% of seedlings introgressed by M. domestica . Significant trait variation among M. sylvestris populations was observed, which for some was of moderate to high heritability. Lack of association between trait and genetic divergence suggests that this significant phenotypic variation is not adaptive, but strong association between genetic variation and the climate during the last glacial maximum suggests local adaptation of M. sylvestris to past climates. This study provides an insight into the ecological and evolutionary drivers of phenotypic and genetic differentiation among populations of a wild apple species and relative of cultivated apples, which is a starting point for future breeding programs. Societal impact Statement Apple is a major fruit crop worldwide and a model species for understanding the evolutionary processes underlying perennial crop domestication. Several wild species have contributed to the genetic make-up of the cultivated apple, yet phenotypic and genetic diversity data across their natural distribution is lacking. This study revealed phenotypic variation between populations of the European crabapple, and showed that both geography, and surprisingly, past but not current climate, shaped its genetic structure. We provide a starting point for harnessing wild apple diversity for apple breeding programs to mitigate the impact of climate change on this perennial crop.
4
Citation1
0
Save
0

Genotyping-by-sequencing and SNP-arrays are complementary for detecting quantitative trait loci by tagging different haplotypes in association studies

Sandra Negro et al.Nov 23, 2018
Background Single Nucleotide Polymorphism (SNP) array and re-sequencing technologies have different properties ( e.g. calling rate, minor allele frequency profile) and drawbacks ( e.g. ascertainment bias). This lead us to study their complementarity and the consequences of using them separately or combined in diversity analyses and Genome-Wide Association Studies (GWAS). We performed GWAS on three traits (grain yield, plant height and male flowering time) measured in 22 environments on a panel of 247 F1 hybrids obtained by crossing 247 diverse dent maize inbred lines with a same flint line. The 247 lines were genotyped using three genotyping technologies (Genotyping-By-Sequencing, Illumina Infinium 50K and Affymetrix Axiom 600K arrays).Results The effects of ascertainment bias of the 50K and 600K arrays were negligible for deciphering global genetic trends of diversity and for estimating relatedness in this panel. We developed an original approach based on linkage disequilibrium (LD) extent in order to determine whether SNPs significantly associated with a trait and that are physically linked should be considered as a single Quantitative Trait Locus (QTL) or several independent QTLs. Using this approach, we showed that the combination of the three technologies, which have different SNP distributions and densities, allowed us to detect more QTLs (gain in power) and potentially refine the localization of the causal polymorphisms (gain in resolution).Conclusions Conceptually different technologies are complementary for detecting QTLs by tagging different haplotypes in association studies. Considering LD, marker density and the combination of different technologies (SNP-arrays and re-sequencing), the genotypic data available were most likely enough to well represent polymorphisms in the centromeric regions, whereas using more markers would be beneficial for telomeric regions.* DTA : Day to Anthesis GY : Grain Yield adjusted at 15% moisture plantHT : Plant Height GBS : Genotyping By Sequencing LD : Linkage disequilibrium GWAS : Genome-Wide Association Studies MAF : Minimum Allelic Frequency SNP : Single Nucleotide Polymorphism HRR : High Recombinogenic Regions LRR : Low Recombinogenic Regions QTL : Quantitative Trait Locus
0

High throughput genotyping of structural variations in a complex plant genome using an original Affymetrix® Axiom® array

Clément Mabire et al.Dec 28, 2018
Background Insertions/deletions (InDels) and more specifically presence/absence variations (PAVs) are pervasive in several species and have strong functional and phenotypic effect by removing or drastically modifying genes. Genotyping of such variants on large panels remains poorly addressed, while necessary for approaches such as association mapping or genomic selection.Results We have developed, as a proof of concept, a new high-throughput and affordable approach to genotype InDels. We first identified 141,000 InDels by aligning reads from the B73 line against the genome of three temperate maize inbred lines (F2, PH207, and C103) and reciprocally. Next, we designed an Affymetrix® Axiom® array to target these InDels, with a combination of probes selected at breakpoint sites (13%) or within the InDel sequence, either at polymorphic (25%) or non-polymorphic sites (63%) sites. The final array design is composed of 662,772 probes and targets 105,927 InDels, including PAVs ranging from 35bp to 129kbp. After Affymetrix® quality control, we successfully genotyped 86,648 polymorphic InDels (82% of all InDels interrogated by the array) on 445 maize DNA samples with 422,369 probes. Genotyping InDels using this approach produced a highly reliable dataset, with low genotyping error (~3%), high call rate (~98%), and high reproducibility (>95%). This reliability can be further increased by combining genotyping of several probes calling the same InDels (<0.1% error rate and >99.9% of call rate for 5 probes). This “proof of concept” tool was used to estimate the kinship matrix between 362 maize lines with 57,824 polymorphic InDels. This InDels kinship matrix was highly correlated with kinship estimated using SNPs from Illumina 50K SNP arrays.Conclusions We efficiently genotyped thousands of small to large InDels on a sizeable number of individuals using a new Affymetrix® Axiom® array. This powerful approach opens the way to studying the contribution of InDels to trait variation and heterosis in maize. The approach is easily extendable to other species and should contribute to decipher the biological impact of InDels at a larger scale.* List of abbreviations : GBA : Genotyping by array GBS : Genotyping by sequencing SNP : Single nucleotide polymorphism InDel : Insertion / Deletion BP : Breakpoint MONO : Monomorphic OTV : Off Target Variant QC : Quality control PHR : Poly High Resolyion VCF : Variant Call Format PAR : Presence / Absence Region PAV : Presence / Absence Variant SV : Structural variant CNV : Copy Number Variant TE : Transposable Element CGH : Comparative Genomic Hybridization NGS : Next Generation Sequencing FW : Forward REV : Reverse NAM : Nested Association Mapping DNA : Deoxyribonucleic Acid PCR : Polymerase Chain Reaction PcoA : Principal Coordinate Analysis Mbp : Millions of Base Pairs bp : base pair FreqDiff01 : Frequency of lines not fully consistent between probes within InDel
0

Disentangling group specific QTL allele effects from genetic background epistasis using admixed individuals in GWAS: an application to maize flowering

Simon Rio et al.Jun 12, 2019
When handling a structured population in association mapping, group-specific allele effects may be observed at quantitative trait loci (QTLs) for several reasons: (i) a different linkage disequilibrium (LD) between SNPs and QTLs across groups, (ii) group-specific genetic mutations in QTL regions, and/or (iii) epistatic interactions between QTLs and other loci that have differentiated allele frequencies between groups. We present here a new genome-wide association (GWAS) approach to identify QTLs exhibiting such group-specific allele effects. We developed genetic materials including admixed progeny from different genetic groups with known genome-wide ancestries (local admixture). A dedicated statistical methodology was developed to analyze pure and admixed individuals jointly, allowing one to disentangle the factors causing the heterogeneity of allele effects across groups. This approach was applied to maize by developing an inbred “Flint-Dent” panel including admixed individuals that was evaluated for flowering time. Several associations were detected revealing a wide range of configurations of allele effects, both at known flowering QTLs ( Vgt1 , Vgt2 and Vgt3 ) and new loci. We found several QTLs whose effect depended on the group ancestry of alleles while others interacted with the genetic background. The existence of directional epistasis was highlighted by comparing admixed with pure individuals and was consistent with epistatic interactions identified at the level of QTLs. Our GWAS approach provides useful information on the stability of QTL effects across genetic groups and can be applied to a wide range of species.Author summary Identification of genomic regions involved in genetic architecture of traits has become commonplace in quantitative genetics studies. Genetic structure is a common feature in human, animal and plant species and most current methods target genomic regions whose effects on traits are conserved between genetic groups. However, a heterogeneity of allele effects may be observed due to different factors: a group-specific correlation between the alleles of the tagged marker and those of the causal variant, a group-specific mutation at the causal variant or an epistatic interaction between the causal variant and the genetic background. We propose a new method adapted to structured populations including admixed individuals, which aims to identify these genomic regions and to unravel the previous factors. method was applied to a maize inbred diversity panel including lines from the dent and the flint genetic groups, as well as admixed lines, evaluated for flowering time. Several genomic regions were detected with various configurations of allele effects, with evidence of epistatic interactions between some of the loci and the genetic background.