MA
Mariza Andrade
Author with expertise in Genomic Studies and Association Analyses
Mayo Clinic in Florida, Mayo Clinic, Winneshiek Medical Center
+ 11 more
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
12
(58% Open Access)
Cited by:
31
h-index:
97
/
i10-index:
311
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Inherited Causes of Clonal Hematopoiesis of Indeterminate Potential in TOPMed Whole Genomes

Alexander Bick et al.May 6, 2020
+120
S
J
A
ABSTRACT Age is the dominant risk factor for most chronic human diseases; yet the mechanisms by which aging confers this risk are largely unknown. 1 Recently, the age-related acquisition of somatic mutations in regenerating hematopoietic stem cell populations was associated with both hematologic cancer incidence 2–4 and coronary heart disease prevalence. 5 Somatic mutations with leukemogenic potential may confer selective cellular advantages leading to clonal expansion, a phenomenon termed ‘Clonal Hematopoiesis of Indeterminate Potential’ (CHIP). 6 Simultaneous germline and somatic whole genome sequence analysis now provides the opportunity to identify root causes of CHIP. Here, we analyze high-coverage whole genome sequences from 97,691 participants of diverse ancestries in the NHLBI TOPMed program and identify 4,229 individuals with CHIP. We identify associations with blood cell, lipid, and inflammatory traits specific to different CHIP genes. Association of a genome-wide set of germline genetic variants identified three genetic loci associated with CHIP status, including one locus at TET2 that was African ancestry specific. In silico -informed in vitro evaluation of the TET2 germline locus identified a causal variant that disrupts a TET2 distal enhancer. Aggregates of rare germline loss-of-function variants in CHEK2 , a DNA damage repair gene, predisposed to CHIP acquisition. Overall, we observe that germline genetic variation altering hematopoietic stem cell function and the fidelity of DNA-damage repair increase the likelihood of somatic mutations leading to CHIP.
0
Citation22
0
Save
1

Clonal hematopoiesis is driven by aberrant activation of TCL1A

Joshua Weinstock et al.Oct 24, 2023
+103
B
J
J
Abstract A diverse set of driver genes, such as regulators of DNA methylation, RNA splicing, and chromatin remodeling, have been associated with pre-malignant clonal expansion of hematopoietic stem cells (HSCs). The factors mediating expansion of these mutant clones remain largely unknown, partially due to a paucity of large cohorts with longitudinal blood sampling. To circumvent this limitation, we developed and validated a method to infer clonal expansion rate from single timepoint data called PACER (passenger-approximated clonal expansion rate). Applying PACER to 5,071 persons with clonal hematopoiesis accurately recapitulated the known fitness effects due to different driver mutations. A genome-wide association study of PACER revealed that a common inherited polymorphism in the TCL1A promoter was associated with slower clonal expansion. Those carrying two copies of this protective allele had up to 80% reduced odds of having driver mutations in TET2, ASXL1, SF3B1, SRSF2 , and JAK2 , but not DNMT3A. TCL1A was not expressed in normal or DNMT3A -mutated HSCs, but the introduction of mutations in TET2 or ASXL1 by CRISPR editing led to aberrant expression of TCL1A and expansion of HSCs in vitro. These effects were abrogated in HSCs from donors carrying the protective TCL1A allele. Our results indicate that the fitness advantage of multiple common driver genes in clonal hematopoiesis is mediated through TCL1A activation. PACER is an approach that can be widely applied to uncover genetic and environmental determinants of pre-malignant clonal expansion in blood and other tissues.
1
Paper
Citation8
0
Save
0

Validation of human telomere length multi-ancestry meta-analysis association signals identifies POP5 and KBTBD6 as human telomere length regulation genes

Rebecca Keener et al.Sep 11, 2024
+95
L
B
R
Abstract Genome-wide association studies (GWAS) have become well-powered to detect loci associated with telomere length. However, no prior work has validated genes nominated by GWAS to examine their role in telomere length regulation. We conducted a multi-ancestry meta-analysis of 211,369 individuals and identified five novel association signals. Enrichment analyses of chromatin state and cell-type heritability suggested that blood/immune cells are the most relevant cell type to examine telomere length association signals. We validated specific GWAS associations by overexpressing KBTBD6 or POP5 and demonstrated that both lengthened telomeres. CRISPR/Cas9 deletion of the predicted causal regions in K562 blood cells reduced expression of these genes, demonstrating that these loci are related to transcriptional regulation of KBTBD6 and POP5 . Our results demonstrate the utility of telomere length GWAS in the identification of telomere length regulation mechanisms and validate KBTBD6 and POP5 as genes affecting telomere length regulation.
0
Citation1
0
Save
0

Phenome-wide association analysis of LDL-cholesterol lowering genetic variants in PCSK9

Amand Schmidt et al.May 7, 2020
+163
D
M
A
Background: We characterised the phenotypic consequence of genetic variation at the PCSK9 locus and compared findings with recent trials of pharmacological inhibitors of PCSK9. Methods: Published and individual participant level data (300,000+ participants) were combined to construct a weighted PCSK9 gene-centric score (GS). Fourteen randomized placebo controlled PCSK9 inhibitor trials were included, providing data on 79,578 participants. Results were scaled to a one mmol/L lower LDL-C concentration. Results: The PCSK9 GS (comprising 4 SNPs) associations with plasma lipid and apolipoprotein levels were consistent in direction with treatment effects. The GS odds ratio (OR) for myocardial infarction (MI) was 0.53 (95%CI 0.42; 0.68), compared to a PCSK9 inhibitor effect of 0.90 (95%CI 0.86; 0.93). For ischemic stroke ORs were 0.84 (95%CI 0.57; 1.22) for the GS, compared to 0.85 (95%CI 0.78; 0.93) in the drug trials. ORs with type 2 diabetes mellitus (T2DM) were 1.29 (95% CI 1.11; 1.50) for the GS, as compared to 1.00 (95%CI 0.96; 1.04) for incident T2DM in PCSK9 inhibitor trials. No genetic associations were observed for cancer, heart failure, atrial fibrillation, chronic obstructive pulmonary disease, or Alzheimer's disease - outcomes for which large-scale trial data were unavailable. Conclusions: Genetic variation at the PCSK9 locus recapitulates the effects of therapeutic inhibition of PCSK9 on major blood lipid fractions and MI. Apparent discordance between genetic associations and trial outcome for T2DM might be explained lack by a of statistical precision, or differences in the nature and duration of genetic versus pharmacological perturbation of PCSK9.
0
0
Save
0

Recovery of trait heritability from whole genome sequence data

Pierrick Wainschtein et al.May 6, 2020
+47
Z
D
P
Heritability, the proportion of phenotypic variance explained by genetic factors, can be estimated from pedigree data, but such estimates are uninformative with respect to the underlying genetic architecture. Analyses of data from genome-wide association studies (GWAS) on unrelated individuals have shown that for human traits and disease, approximately one-third to two-thirds of heritability is captured by common SNPs. It is not known whether the remaining heritability is due to the imperfect tagging of causal variants by common SNPs, in particular if the causal variants are rare, or other reasons such as over-estimation of heritability from pedigree data. Here we show that pedigree heritability for height and body mass index (BMI) appears to be fully recovered from whole-genome sequence (WGS) data on 21,620 unrelated individuals of European ancestry. We assigned 47.1 million genetic variants to groups based upon their minor allele frequencies (MAF) and linkage disequilibrium (LD) with variants nearby, and estimated and partitioned variation accordingly. The estimated heritability was 0.79 (SE 0.09) for height and 0.40 (SE 0.09) for BMI, consistent with pedigree estimates. Low-MAF variants in low LD with neighbouring variants were enriched for heritability, to a greater extent for protein altering variants, consistent with negative selection thereon. Cumulatively variants in the MAF range of 0.0001 to 0.1 explained 0.54 (SE 0.05) and 0.51 (SE 0.11) of heritability for height and BMI, respectively. Our results imply that the still missing heritability of complex traits and disease is accounted for by rare variants, in particular those in regions of low LD.
0

Atlas-CNV: a validated approach to call Single-Exon CNVs in the eMERGESeq gene panel

Theodore Chiang et al.May 7, 2020
+27
T
X
T
Purpose: To provide a validated method to confidently identify exon-containing copy number variants (CNVs), with a low false discovery rate (FDR), in targeted sequencing data from a clinical laboratory with particular focus on single-exon CNVs. Methods: DNA sequence coverage data are normalized within each sample and subsequently exonic CNVs are identified in a midpool batch, when the target log2 ratio of the sample to the midpool median exceeds defined thresholds. The quality of exonic CNV calls is assessed by C-scores (Z-like scores) using thresholds derived from gold standard samples and simulation studies. We integrate an ExonQC threshold to lower FDR and compare performance with alternate software (VisCap). Results: Thirteen CNVs were used as a truth set to validate Atlas-CNV and compared with VisCap. We demonstrated FDR reduction in validation, simulation and 10,926 eMERGESeq samples without sensitivity loss. Sixty-four multi-exon and 29 single-exon CNVs with high C-scores were assessed by MLPA. Conclusions: Atlas-CNV is validated as a method to identify exonic CNVs in targeted sequencing data generated in the clinical laboratory. The ExonQC and C-score assignment can reduce FDR (identification of targets with high variance) and improve calling accuracy of single-exon CNVs respectively. We proposed guidelines and criteria to identify high confidence single-exon CNVs. Key Words: Atlas-CNV; copy number variation; CNV; single exon deletion duplication; targeted gene panel clinical sequencing;
0

Multi-ancestry Genome- and Phenome-wide Association Studies of Diverticular Disease in Electronic Health Records with Natural Language Processing enriched phenotype algorithm

Yoonjung Joo et al.Jun 11, 2024
+22
W
J
Y
Abstract Background and aims Diverticular disease is among the most prevalent conditions encountered by gastroenterologists, affecting ∼50% of Americans before the age of 60. Our aim was to identify genetic risk variants and clinical phenotypes associated with diverticular disease, utilizing the electronic health record (EHR) with Natural Language Processing (NLP). Methods We developed a NLP-enriched phenotype algorithm that incorporated colonoscopy or abdominal imaging reports to accurately identify patients with diverticulosis and diverticulitis from multicenter EHRs. We performed genome-wide association studies (GWAS) of diverticular disease in European, African and multi-ancestry participants, followed by phenome-wide association studies (PheWAS) of the risk variants to identify their potential comorbid/pleiotropic effects in the clinical phenome. For more in-depth investigation of associated clinical phenotypes, we also performed PheWAS with the previously reported 52 GWAS susceptibility variants for diverticular disease. Results Ancestry-stratified GWAS analyses confirmed the well-established associations between ARHGAP15 loci with diverticular disease in European cohorts, and found similar positive effect sizes in African cohorts but with non-significant p-values. With overall intensified GWAS signals in diverticulitis patients compared to diverticulosis patients, we found substantial genetic correlations between diverticulosis and diverticulitis, up to 0.997 in European ancestry. PheWAS analyses identified associations between the diverticular disease GWAS variants and circulatory system, genitourinary, and neoplastic EHR phenotypes. Conclusion Our multiancestry GWAS-PheWAS study demonstrated an effective use of multidimensional EHR information in disease case/control classification with NLP for more comprehensive and scalable phenotyping, and implementation of an integrative analytical pipeline to facilitate etiological investigation of a disease from a clinical perspective.
0

A system for phenotype harmonization in the NHLBI Trans-Omics for Precision Medicine (TOPMed) Program

Adrienne Stilp et al.Jun 11, 2024
+69
J
L
A
Genotype-phenotype association studies often combine phenotype data from multiple studies to increase power. Harmonization of the data usually requires substantial effort due to heterogeneity in phenotype definitions, study design, data collection procedures, and data set organization. Here we describe a centralized system for phenotype harmonization that includes input from phenotype domain and study experts, quality control, documentation, reproducible results, and data sharing mechanisms. This system was developed for the National Heart, Lung and Blood Institute’s Trans-Omics for Precision Medicine (TOPMed) program, which is generating genomic and other omics data for >80 studies with extensive phenotype data. To date, 63 phenotypes have been harmonized across thousands of participants from up to 17 TOPMed studies per phenotype. We discuss the challenges faced in this undertaking and how they were addressed. The harmonized phenotype data and associated documentation have been submitted to National Institutes of Health data repositories for controlled-access by the scientific community. We also provide materials to facilitate future harmonization efforts by the community, which include (1) the code used to generate the 63 harmonized phenotypes, enabling others to reproduce, modify or extend these harmonizations to additional studies; and (2) results of labeling thousands of phenotype variables with controlled vocabulary terms.
0

Robust, flexible, and scalable tests for Hardy-Weinberg Equilibrium across diverse ancestries

Alan Kwong et al.Oct 24, 2023
+43
J
T
A
ABSTRACT Traditional Hardy-Weinberg equilibrium (HWE) tests (the χ 2 test and the exact test) have long been used as a metric for evaluating genotype quality, as technical artifacts leading to incorrect genotype calls often can be identified as deviations from HWE. However, in datasets comprised of individuals from diverse ancestries, HWE can be violated even without genotyping error, complicating the use of HWE testing to assess genotype data quality. In this manuscript, we present the Robust Unified Test for HWE (RUTH) to test for HWE while accounting for population structure and genotype uncertainty, and evaluate the impact of population heterogeneity and genotype uncertainty on the standard HWE tests and alternative methods using simulated and real sequence datasets. Our results demonstrate that ignoring population structure or genotype uncertainty in HWE tests can inflate false positive rates by many orders of magnitude. Our evaluations demonstrate different tradeoffs between false positives and statistical power across the methods, with RUTH consistently amongst the best across all evaluations. RUTH is implemented as a practical and scalable software tool to rapidly perform HWE tests across millions of markers and hundreds of thousands of individuals while supporting standard VCF/BCF formats. RUTH is publicly available at https://www.github.com/statgen/ruth .
1

Validation of human telomere length trans-ancestry meta-analysis association signals identifiesPOP5andKBTBD6as novel human telomere length regulation genes

Rebecca Keener et al.Oct 24, 2023
+93
C
S
R
Abstract Telomere length genome-wide association studies (GWAS) have become well-powered to detect novel genes in telomere length regulation. However, no prior work has validated these putative novel genes to confirm the contribution of GWAS loci to telomere length regulation. We conducted a trans-ancestry meta-analysis of 211,369 individuals. Through enrichment analyses of chromatin state and cell-type heritability we identified blood and immune cells as the most relevant cell type to examine telomere length association signals. We validated specific GWAS associations by overexpressing KBTBD6 , a component of an E3 ubiquitin ligase complex, and POP5 , a component of the Ribonuclease P/MRP complex, and demonstrating that both lengthened telomeres as predicted by our statistical analyses. CRISPR/Cas9 deletion of the predicted causal regions of these association peaks in K562 immortalized blood cells reduced expression of these genes, demonstrating that these loci are related to transcriptional regulation of KBTBD6 and POP5 , respectively. Together our results demonstrate the utility of telomere length GWAS in the identification of novel telomere length regulation mechanisms and highlight the importance of the proteasome-ubiquitin pathway in telomere length regulation.
Load More