JG
Julia Goodrich
Author with expertise in Standards and Guidelines for Genetic Variant Interpretation
Broad Institute, Massachusetts General Hospital, Broad Center
+ 7 more
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
10
(50% Open Access)
Cited by:
6
h-index:
34
/
i10-index:
42
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Genome Sequencing for Diagnosing Rare Diseases

Monica Wojcik et al.Aug 23, 2024
+87
H
S
M
Genetic variants that cause rare disorders may remain elusive even after expansive testing, such as exome sequencing. The diagnostic yield of genome sequencing, particularly after a negative evaluation, remains poorly defined.
296

A harmonized public resource of deeply sequenced diverse human genomes

Zan Koenig et al.Oct 24, 2023
+16
L
M
Z
Abstract Underrepresented populations are often excluded from genomic studies due in part to a lack of resources supporting their analyses. The 1000 Genomes Project (1kGP) and Human Genome Diversity Project (HGDP), which have recently been sequenced to high coverage, are valuable genomic resources because of the global diversity they capture and their open data sharing policies. Here, we harmonized a high quality set of 4,096 whole genomes from HGDP and 1kGP with data from gnomAD and identified over 159 million high-quality SNVs, indels, and SVs. We performed a detailed ancestry analysis of this cohort, characterizing population structure and patterns of admixture across populations, analyzing site frequency spectra, and measuring variant counts at global and subcontinental levels. We also demonstrate substantial added value from this dataset compared to the prior versions of the component resources, typically combined via liftover and variant intersection; for example, we catalog millions of new genetic variants, mostly rare, compared to previous releases. In addition to unrestricted individual-level public release, we provide detailed tutorials for conducting many of the most common quality control steps and analyses with these data in a scalable cloud-computing environment and publicly release this new phased joint callset for use as a haplotype resource in phasing and imputation pipelines. This jointly called reference panel will serve as a key resource to support research of diverse ancestry populations.
87

Inferring compound heterozygosity from large-scale exome sequencing data

Michael Guo et al.Oct 24, 2023
+16
S
L
M
Recessive diseases arise when both the maternal and the paternal copies of a gene are impacted by a damaging genetic variant in the affected individual. When a patient carries two different potentially causal variants in a gene for a given disorder, accurate diagnosis requires determining that these two variants occur on different copies of the chromosome (i.e., are in trans) rather than on the same copy (i.e. in cis). However, current approaches for determining phase, beyond parental testing, are limited in clinical settings. We developed a strategy for inferring phase for rare variant pairs within genes, leveraging genotypes observed in exome sequencing data from the Genome Aggregation Database (gnomAD v2, n=125,748). When applied to trio data where phase can be determined by transmission, our approach estimates phase with 95.7% accuracy and remains accurate even for very rare variants (allele frequency < 1×10-4). We also correctly phase 95.9% of variant pairs in a set of 293 patients with Mendelian conditions carrying presumed causal compound heterozygous variants. We provide a public resource of phasing estimates from gnomAD, including phasing estimates for coding variants across the genome and counts per gene of rare variants in trans, that can aid interpretation of rare co-occurring variants in the context of recessive disease.
0

The landscape of regional missense mutational intolerance quantified from 125,748 exomes

Katherine Chao et al.May 28, 2024
+29
R
L
K
Missense variants can have a range of functional impacts depending on factors such as the specific amino acid substitution and location within the gene. To interpret their deleteriousness, studies have sought to identify regions within genes that are specifically intolerant of missense variation 1-12 . Here, we leverage the patterns of rare missense variation in 125,748 individuals in the Genome Aggregation Database (gnomAD) 13 against a null mutational model to identify transcripts that display regional differences in missense constraint. Missense-depleted regions are enriched for ClinVar 14 pathogenic variants, de novo missense variants from individuals with neurodevelopmental disorders (NDDs) 15,16 , and complex trait heritability. Following ClinGen calibration recommendations for the ACMG/AMP guidelines, we establish that regions with less than 20% of their expected missense variation achieve moderate support for pathogenicity. We create a missense deleteriousness metric (MPC) that incorporates regional constraint and outperforms other deleteriousness scores at stratifying case and control de novo missense variation, with a strong enrichment in NDDs. These results provide additional tools to aid in missense variant interpretation.
1

CHARR efficiently estimates contamination from DNA sequencing data

Wei Lü et al.Oct 24, 2023
+7
T
L
W
DNA sample contamination is a major issue in clinical and research applications of whole genome and exome sequencing. Even modest levels of contamination can substantially affect the overall quality of variant calls and lead to widespread genotyping errors. Currently, popular tools for estimating the contamination level use short-read data (BAM/CRAM files), which are expensive to store and manipulate and often not retained or shared widely. We propose a new metric to estimate DNA sample contamination from variant-level whole genome and exome sequence data, CHARR, Contamination from Homozygous Alternate Reference Reads, which leverages the infiltration of reference reads within homozygous alternate variant calls. CHARR uses a small proportion of variant-level genotype information and thus can be computed from single-sample gVCFs or callsets in VCF or BCF formats, as well as efficiently stored variant calls in Hail VDS format. Our results demonstrate that CHARR accurately recapitulates results from existing tools with substantially reduced costs, improving the accuracy and efficiency of downstream analyses of ultra-large whole genome and exome sequencing datasets.
290

A genome-wide mutational constraint map quantified from variation in 76,156 human genomes

Siwei Chen et al.Oct 11, 2023
+42
J
L
S
Abstract The depletion of disruptive variation caused by purifying natural selection (constraint) has been widely used to investigate protein-coding genes underlying human disorders, but attempts to assess constraint for non-protein-coding regions have proven more difficult. Here we aggregate, process, and release a dataset of 76,156 human genomes from the Genome Aggregation Database (gnomAD), the largest public open-access human genome reference dataset, and use this dataset to build a mutational constraint map for the whole genome. We present a refined mutational model that incorporates local sequence context and regional genomic features to detect depletions of variation across the genome. As expected, proteincoding sequences overall are under stronger constraint than non-coding regions. Within the non-coding genome, constrained regions are enriched for known regulatory elements and variants implicated in complex human diseases and traits, facilitating the triangulation of biological annotation, disease association, and natural selection to non-coding DNA analysis. More constrained regulatory elements tend to regulate more constrained protein-coding genes, while non-coding constraint captures additional functional information underrecognized by gene constraint metrics. We demonstrate that this genome-wide constraint map provides an effective approach for characterizing the non-coding genome and improving the identification and interpretation of functional human genetic variation.
0

Human salivary amylase gene copy number impacts oral and gut microbiomes

Angela Poole et al.May 6, 2020
+11
N
J
A
Host genetic variation influences the composition of the human microbiome. While studies have focused on associations between the microbiome and single nucleotide polymorphisms in genes, their copy number (CN) can also vary. Here, in a study of human subjects including a 2-week standard diet, we relate oral and gut microbiome to CN at the AMY1 locus, which encodes the gene for salivary amylase, active in starch degradation. We show that although diet standardization drove gut microbiome convergence, AMY1-CN influenced oral and gut microbiome composition and function. The gut microbiomes of low-AMY1-CN subjects had an enhanced capacity for breakdown of complex carbohydrates. Those of high-AMY1 subjects were enriched in microbiota linked to resistant starch fermentation, had higher fecal SCFAs, and drove higher adiposity when transferred to germfree mice. Gut microbiota results were validated in a larger separate population. This study establishes AMY1-CN as a genetic factor patterning microbiome composition and function.
0

The virome in adult monozygotic twins with concordant or discordant gut microbiomes

J. Moreno-Gallego et al.May 7, 2020
+7
S
S
J
The virome is one of the most variable components of the human gut microbiome. Within twin-pairs, viromes have been shown to be similar for infants but not for adults, indicating that as twins age and their environments and microbiomes diverge, so do their viromes. The degree to which the microbiome drives the virome vast diversity is unclear. Here, we examined the relationship between microbiome diversity and virome diversity in 21 adult monozygotic twin pairs selected for high or low microbiome concordance. Viromes derived from virus-like particles were unique to each subject, dominated by Caudovirales and Microviridae, and exhibited a small core that included crAssphage. Microbiome-discordant twins had more dissimilar viromes compared to microbiome-concordant twins, and the richer the microbiomes, the richer the viromes. These patterns were driven by the bacteriophages, not eukaryotic viruses. These observations support a strong role of the microbiome in patterning the virome.
0

Interactions between the gut microbiome and mucosal immunoglobulins A, M and G in the developing infant gut

Anders Janzon et al.May 7, 2020
+2
O
J
A
Objective: Interactions between the gut microbiome and immunoglobulin (Ig) A in infancy are important for future health. IgM and IgG are also present, however, their interactions with the microbiome in the developing infant are less understood. Design: We employed stool samples sampled 15 times in infancy from 32 healthy subjects at 4 locations in 3 countries (from the TEDDY study). We characterized patterns of microbiome development in relation to levels of IgA, IgG and IgM. For 8 infants from a single location, we FACS-sorted microbial cells from stool by Ig status. We used 16S rRNA gene profiling on full and sorted microbiomes to assess patterns of antibody coating in relation to age and other factors. Results: All antibodies decreased in concentration with age, but were augmented by breastmilk feeding regardless of infant age. Levels of IgA correlated with the relative abundances of OTUs belonging to the Bifidobacteria and Enterobacteriaceae, which dominated the early microbiome, and IgG levels correlated with Haemophilus. The diversity of Ig-coated microbiota was influenced by breastfeeding and age, but birth mode. IgA and IgM coated the same microbiota, while IgG targeted a different subset. Blautia generally evaded antibody coating, while members of the Bifidobacteria and Enterobacteriaceae were high in IgA/M. Conclusion: IgA/M have similar dynamics with respect to microbiome development with age, and their interactions with the microbiome are influenced by breastfeeding status. IgG generally does not coat the commensal microbiota.
0

High-resolution QTL mapping with Diversity Outbred mice identifies genetic variants that impact gut microbiome composition

Florencia Schlamp et al.May 7, 2020
+8
J
D
F
The composition of the gut microbiome is impacted by a complex array of factors, from nutrient composition and availability, to physical factors like temperature, pH and flow rate, as well as interactions among the members of the microbial community. Many of these factors are affected by the host, raising the question of how host genetic variation impacts microbiome composition. Human studies confirm a role for host genetics, but opinions vary on just how important is host genetic variation in determining gut microbiome composition. The mouse model, by allowing far better control of genetics, nutrition, and other environmental factors, has provided an excellent opportunity to extend this work, and the Diversity Outbred (DO) mice in particular present a chance for mapping host genetic variants that influence specific attributes of microbiome composition. Here we apply 16s sequencing to fecal samples of 247 DO mice and perform QTL mapping on microbial abundances. In addition to finding a number of novel associations, the concordance with heritabilities and associations with both human and mouse studies was striking, including the phylum Tenericutes, family Ruminococcaceae, as well as Staphylococcus and Turicibacter.