TH
Tina Hu
Author with expertise in Population Genetic Structure and Dynamics
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
10
(70% Open Access)
Cited by:
6,590
h-index:
17
/
i10-index:
17
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Genome-wide association study of 107 phenotypes in Arabidopsis thaliana inbred lines

Susanna Atwell et al.Mar 23, 2010
Large-scale genome-wide association (GWA) studies have become an important tool in human genomics, mostly focused on disease but also on adaptive variations such as skin colour. The technique is now shown to be similarly useful in plants. Atwell et al. report a GWA study of over a hundred phenotypes in naturally occurring inbred lines of Arabidopsis thaliana. The results range from significant associations, usually for single genes, to more difficult-to-interpret findings that indicate confounding by complex genetics and population structure. The accompanying paper by Todesco et al. demonstrates the ability of this technique to detect major-effect gene loci. Using forward genetics and GWA analyses, they show that variation at a single locus (ACD6) in Arabidopsis underlies phenotypic variation in vegetative growth as well as resistance to infection. The strong enhancement of resistance mediated by one of the alleles at this locus explains its persistence in natural populations throughout the world, despite it drastically reducing new leaf production. Here, large-scale genome-wide association studies were carried out with the naturally occurring inbred lines of Arabidopsis thaliana, which can be genotyped once and phenotyped repeatedly. The results range from significant associations, usually corresponding to single genes, to findings that are more difficult to interpret, because confounding by complex genetics and population structure makes it hard to distinguish true associations from false. Although pioneered by human geneticists as a potential solution to the challenging problem of finding the genetic basis of common human diseases1,2, genome-wide association (GWA) studies have, owing to advances in genotyping and sequencing technology, become an obvious general approach for studying the genetics of natural variation and traits of agricultural importance. They are particularly useful when inbred lines are available, because once these lines have been genotyped they can be phenotyped multiple times, making it possible (as well as extremely cost effective) to study many different traits in many different environments, while replicating the phenotypic measurements to reduce environmental noise. Here we demonstrate the power of this approach by carrying out a GWA study of 107 phenotypes in Arabidopsis thaliana, a widely distributed, predominantly self-fertilizing model plant known to harbour considerable genetic variation for many adaptively important traits3. Our results are dramatically different from those of human GWA studies, in that we identify many common alleles of major effect, but they are also, in many cases, harder to interpret because confounding by complex genetics and population structure make it difficult to distinguish true associations from false. However, a-priori candidates are significantly over-represented among these associations as well, making many of them excellent candidates for follow-up experiments. Our study demonstrates the feasibility of GWA studies in A. thaliana and suggests that the approach will be appropriate for many other organisms.
0
Citation1,689
0
Save
0

The Arabidopsis lyrata genome sequence and the basis of rapid genome size change

Tina Hu et al.Apr 10, 2011
Detlef Weigel and colleagues report the genome sequence of Arabidopsis lyrata. In comparison with the much smaller genome of A. thaliana, from which A. lyrata diverged about 10 million years ago, they find that the reduction in genome size is attributed to a large number of deletions across the genome. We report the 207-Mb genome sequence of the North American Arabidopsis lyrata strain MN47 based on 8.3× dideoxy sequence coverage. We predict 32,670 genes in this outcrossing species compared to the 27,025 genes in the selfing species Arabidopsis thaliana. The much smaller 125-Mb genome of A. thaliana, which diverged from A. lyrata 10 million years ago, likely constitutes the derived state for the family. We found evidence for DNA loss from large-scale rearrangements, but most of the difference in genome size can be attributed to hundreds of thousands of small deletions, mostly in noncoding DNA and transposons. Analysis of deletions and insertions still segregating in A. thaliana indicates that the process of DNA loss is ongoing, suggesting pervasive selection for a smaller genome. The high-quality reference genome sequence for A. lyrata will be an important resource for functional, evolutionary and ecological studies in the genus Arabidopsis.
0
Citation858
0
Save
0

Multiplexed shotgun genotyping for rapid and efficient genetic mapping

Peter Andolfatto et al.Jan 13, 2011
We present a new approach to genotyping based on multiplexed shotgun sequencing that can identify recombination breakpoints in a large number of individuals simultaneously at a resolution sufficient for most mapping purposes, such as quantitative trait locus (QTL) mapping and mapping of induced mutations. We first describe a simple library construction protocol that uses just 10 ng of genomic DNA per individual and makes the approach accessible to any laboratory with standard molecular biology equipment. Sequencing this library results in a large number of sequence reads widely distributed across the genomes of multiplexed bar-coded individuals. We develop a Hidden Markov Model to estimate ancestry at all genomic locations in all individuals using these data. We demonstrate the utility of the approach by mapping a dominant marker allele in D. simulans to within 105 kb of its true position using 96 F1-backcross individuals genotyped in a single lane on an Illumina Genome Analyzer. We further demonstrate the utility of our method by genetically mapping more than 400 previously unassembled D. simulans contigs to linkage groups and by evaluating the quality of targeted introgression lines. At this level of multiplexing and divergence between strains, our method allows estimation of recombination breakpoints to a median of 38-kb intervals. Our analysis suggests that higher levels of multiplexing and/or use of strains with lower levels of divergence are practicable.
0
Citation420
0
Save
0

The Capsella rubella genome and the genomic consequences of rapid mating system evolution

Tanja Slotte et al.Jun 9, 2013
Stephen Wright, Detlef Weigel and colleagues report the whole-genome sequence of Capsella rubella, a highly selfing crucifer found throughout much of southern and western Europe. They compare mixed-stage flower bud transcriptomes from C. rubella and C. grandiflora, finding a shift in expression of genes associated with flowering phenotypes and providing insights into the transition to selfing. The shift from outcrossing to selfing is common in flowering plants1,2, but the genomic consequences and the speed at which they emerge remain poorly understood. An excellent model for understanding the evolution of self fertilization is provided by Capsella rubella, which became self compatible <200,000 years ago. We report a C. rubella reference genome sequence and compare RNA expression and polymorphism patterns between C. rubella and its outcrossing progenitor Capsella grandiflora. We found a clear shift in the expression of genes associated with flowering phenotypes, similar to that seen in Arabidopsis, in which self fertilization evolved about 1 million years ago. Comparisons of the two Capsella species showed evidence of rapid genome-wide relaxation of purifying selection in C. rubella without a concomitant change in transposable element abundance. Overall we document that the transition to selfing may be typified by parallel shifts in gene expression, along with a measurable reduction of purifying selection.
0
Citation408
0
Save
0

Natural allelic variation underlying a major fitness trade-off in Arabidopsis thaliana

Marco Todesco et al.Jun 1, 2010
Large-scale genome-wide association (GWA) studies have become an important tool in human genomics, mostly focused on disease but also on adaptive variations such as skin colour. The technique is now shown to be similarly useful in plants. Atwell et al. report a GWA study of over a hundred phenotypes in naturally occurring inbred lines of Arabidopsis thaliana. The results range from significant associations, usually for single genes, to more difficult-to-interpret findings that indicate confounding by complex genetics and population structure. The accompanying paper by Todesco et al. demonstrates the ability of this technique to detect major-effect gene loci. Using forward genetics and GWA analyses, they show that variation at a single locus (ACD6) in Arabidopsis underlies phenotypic variation in vegetative growth as well as resistance to infection. The strong enhancement of resistance mediated by one of the alleles at this locus explains its persistence in natural populations throughout the world, despite it drastically reducing new leaf production. Here, a combination of forward genetics and genome-wide association analyses has been used to show that variation at a single genetic locus in Arabidopsis thaliana underlies phenotypic variation in vegetative growth as well as resistance to infection. The strong enhancement of resistance mediated by one of the alleles at this locus explains the allele's persistence in natural populations throughout the world, even though it drastically reduces the production of new leaves. Plants can defend themselves against a wide array of enemies, from microbes to large animals, yet there is great variability in the effectiveness of such defences, both within and between species. Some of this variation can be explained by conflicting pressures from pathogens with different modes of attack1. A second explanation comes from an evolutionary ‘tug of war’, in which pathogens adapt to evade detection, until the plant has evolved new recognition capabilities for pathogen invasion2,3,4,5. If selection is, however, sufficiently strong, susceptible hosts should remain rare. That this is not the case is best explained by costs incurred from constitutive defences in a pest-free environment6,7,8,9,10,11. Using a combination of forward genetics and genome-wide association analyses, we demonstrate that allelic diversity at a single locus, ACCELERATED CELL DEATH 6 (ACD6)12,13, underpins marked pleiotropic differences in both vegetative growth and resistance to microbial infection and herbivory among natural Arabidopsis thaliana strains. A hyperactive ACD6 allele, compared to the reference allele, strongly enhances resistance to a broad range of pathogens from different phyla, but at the same time slows the production of new leaves and greatly reduces the biomass of mature leaves. This allele segregates at intermediate frequency both throughout the worldwide range of A. thaliana and within local populations, consistent with this allele providing substantial fitness benefits despite its marked impact on growth.
0
Citation374
0
Save
0

A Genomic Map of the Effects of Linked Selection in Drosophila

Eyal Elyashiv et al.Aug 18, 2016
Natural selection at one site shapes patterns of genetic variation at linked sites. Quantifying the effects of 'linked selection' on levels of genetic diversity is key to making reliable inference about demography, building a null model in scans for targets of adaptation, and learning about the dynamics of natural selection. Here, we introduce the first method that jointly infers parameters of distinct modes of linked selection, notably background selection and selective sweeps, from genome-wide diversity data, functional annotations and genetic maps. The central idea is to calculate the probability that a neutral site is polymorphic given local annotations, substitution patterns, and recombination rates. Information is then combined across sites and samples using composite likelihood in order to estimate genome-wide parameters of distinct modes of selection. In addition to parameter estimation, this approach yields a map of the expected neutral diversity levels along the genome. To illustrate the utility of our approach, we apply it to genome-wide resequencing data from 125 lines in Drosophila melanogaster and reliably predict diversity levels at the 1Mb scale. Our results corroborate estimates of a high fraction of beneficial substitutions in proteins and untranslated regions (UTR). They allow us to distinguish between the contribution of sweeps and other modes of selection around amino acid substitutions and to uncover evidence for pervasive sweeps in untranslated regions (UTRs). Our inference further suggests a substantial effect of linked selection from non-classic sweeps. More generally, we demonstrate that linked selection has had a larger effect in reducing diversity levels and increasing their variance in D. melanogaster than previously appreciated.
0
Citation184
0
Save