DR
D. Rao
Author with expertise in Genomic Studies and Association Analyses
Washington University in St. Louis, Pennington Biomedical Research Center, Boston University
+ 9 more
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
11
(64% Open Access)
Cited by:
102
h-index:
78
/
i10-index:
297
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Genome-wide meta-analysis of macronutrient intake of 91,114 European ancestry participants from the cohorts for heart and aging research in genomic epidemiology consortium

Jordi Merino et al.Aug 1, 2024
+101
S
H
J
Macronutrient intake, the proportion of calories consumed from carbohydrate, fat, and protein, is an important risk factor for metabolic diseases with significant familial aggregation. Previous studies have identified two genetic loci for macronutrient intake, but incomplete coverage of genetic variation and modest sample sizes have hindered the discovery of additional loci. Here, we expanded the genetic landscape of macronutrient intake, identifying 12 suggestively significant loci (P < 1 × 10−6) associated with intake of any macronutrient in 91,114 European ancestry participants. Four loci replicated and reached genome-wide significance in a combined meta-analysis including 123,659 European descent participants, unraveling two novel loci; a common variant in RARB locus for carbohydrate intake and a rare variant in DRAM1 locus for protein intake, and corroborating earlier FGF21 and FTO findings. In additional analysis of 144,770 participants from the UK Biobank, all identified associations from the two-stage analysis were confirmed except for DRAM1. Identified loci might have implications in brain and adipose tissue biology and have clinical impact in obesity-related phenotypes. Our findings provide new insight into biological functions related to macronutrient intake.
0

Inherited Causes of Clonal Hematopoiesis of Indeterminate Potential in TOPMed Whole Genomes

Alexander Bick et al.May 6, 2020
+120
S
J
A
ABSTRACT Age is the dominant risk factor for most chronic human diseases; yet the mechanisms by which aging confers this risk are largely unknown. 1 Recently, the age-related acquisition of somatic mutations in regenerating hematopoietic stem cell populations was associated with both hematologic cancer incidence 2–4 and coronary heart disease prevalence. 5 Somatic mutations with leukemogenic potential may confer selective cellular advantages leading to clonal expansion, a phenomenon termed ‘Clonal Hematopoiesis of Indeterminate Potential’ (CHIP). 6 Simultaneous germline and somatic whole genome sequence analysis now provides the opportunity to identify root causes of CHIP. Here, we analyze high-coverage whole genome sequences from 97,691 participants of diverse ancestries in the NHLBI TOPMed program and identify 4,229 individuals with CHIP. We identify associations with blood cell, lipid, and inflammatory traits specific to different CHIP genes. Association of a genome-wide set of germline genetic variants identified three genetic loci associated with CHIP status, including one locus at TET2 that was African ancestry specific. In silico -informed in vitro evaluation of the TET2 germline locus identified a causal variant that disrupts a TET2 distal enhancer. Aggregates of rare germline loss-of-function variants in CHEK2 , a DNA damage repair gene, predisposed to CHIP acquisition. Overall, we observe that germline genetic variation altering hematopoietic stem cell function and the fidelity of DNA-damage repair increase the likelihood of somatic mutations leading to CHIP.
0
Citation22
0
Save
3

A Saturated Map of Common Genetic Variants Associated with Human Height from 5.4 Million Individuals of Diverse Ancestries

Loïc Yengo et al.Jan 12, 2022
+554
E
S
L
ABSTRACT Common SNPs are predicted to collectively explain 40-50% of phenotypic variation in human height, but identifying the specific variants and associated regions requires huge sample sizes. Here we show, using GWAS data from 5.4 million individuals of diverse ancestries, that 12,111 independent SNPs that are significantly associated with height account for nearly all of the common SNP-based heritability. These SNPs are clustered within 7,209 non-overlapping genomic segments with a median size of ~90 kb, covering ~21% of the genome. The density of independent associations varies across the genome and the regions of elevated density are enriched for biologically relevant genes. In out-of-sample estimation and prediction, the 12,111 SNPs account for 40% of phenotypic variance in European ancestry populations but only ~10%-20% in other ancestries. Effect sizes, associated regions, and gene prioritization are similar across ancestries, indicating that reduced prediction accuracy is likely explained by linkage disequilibrium and allele frequency differences within associated regions. Finally, we show that the relevant biological pathways are detectable with smaller sample sizes than needed to implicate causal genes and variants. Overall, this study, the largest GWAS to date, provides an unprecedented saturated map of specific genomic regions containing the vast majority of common height-associated variants.
0

Smoking-by-genotype interaction in type 2 diabetes risk and fasting glucose

Peitao Wu et al.Aug 1, 2024
+56
L
D
P
Smoking is a potentially causal behavioral risk factor for type 2 diabetes (T2D), but not all smokers develop T2D. It is unknown whether genetic factors partially explain this variation. We performed genome-environment-wide interaction studies to identify loci exhibiting potential interaction with baseline smoking status (ever vs. never) on incident T2D and fasting glucose (FG). Analyses were performed in participants of European (EA) and African ancestry (AA) separately. Discovery analyses were conducted using genotype data from the 50,000-single-nucleotide polymorphism (SNP) ITMAT-Broad-CARe (IBC) array in 5 cohorts from from the Candidate Gene Association Resource Consortium (n = 23,189). Replication was performed in up to 16 studies from the Cohorts for Heart Aging Research in Genomic Epidemiology Consortium (n = 74,584). In meta-analysis of discovery and replication estimates, 5 SNPs met at least one criterion for potential interaction with smoking on incident T2D at p<1x10-7 (adjusted for multiple hypothesis-testing with the IBC array). Two SNPs had significant joint effects in the overall model and significant main effects only in one smoking stratum: rs140637 (FBN1) in AA individuals had a significant main effect only among smokers, and rs1444261 (closest gene C2orf63) in EA individuals had a significant main effect only among nonsmokers. Three additional SNPs were identified as having potential interaction by exhibiting a significant main effects only in smokers: rs1801232 (CUBN) in AA individuals, rs12243326 (TCF7L2) in EA individuals, and rs4132670 (TCF7L2) in EA individuals. No SNP met significance for potential interaction with smoking on baseline FG. The identification of these loci provides evidence for genetic interactions with smoking exposure that may explain some of the heterogeneity in the association between smoking and T2D.
0
Paper
Citation13
0
Save
0

Efficient gene-environment interaction tests for large biobank-scale sequencing studies

Xinyu Wang et al.Jun 5, 2024
+6
C
E
X
ABSTRACT Complex human diseases are affected by genetic and environmental risk factors and their interactions. Gene-environment interaction (GEI) tests for aggregate genetic variant sets have been developed in recent years. However, existing statistical methods become rate limiting for large biobank-scale sequencing studies with correlated samples. We propose efficient Mixed-model Association tests for GEne-Environment interactions (MAGEE), for testing GEI between an aggregate variant set and environmental exposures on quantitative and binary traits in large-scale sequencing studies with related individuals. Joint tests for the aggregate genetic main effects and GEI effects are also developed. A null generalized linear mixed model adjusting for covariates but without any genetic effects is fit only once in a whole genome GEI analysis, thereby vastly reducing the overall computational burden. Score tests for variant sets are performed as a combination of genetic burden and variance component tests by accounting for the genetic main effects using matrix projections. The computational complexity is dramatically reduced in a whole genome GEI analysis, which makes MAGEE scalable to hundreds of thousands of individuals. We applied MAGEE to the exome sequencing data of 41,144 related individuals from the UK Biobank, and the analysis of 18,970 protein coding genes finished within 10.4 CPU hours.
0
Paper
Citation1
0
Save
57

A multi-layer functional genomic analysis to understand noncoding genetic variation in lipids

Shweta Ramdas et al.Oct 24, 2023
+532
S
J
S
Abstract A major challenge of genome-wide association studies (GWAS) is to translate phenotypic associations into biological insights. Here, we integrate a large GWAS on blood lipids involving 1.6 million individuals from five ancestries with a wide array of functional genomic datasets to discover regulatory mechanisms underlying lipid associations. We first prioritize lipid-associated genes with expression quantitative trait locus (eQTL) colocalizations, and then add chromatin interaction data to narrow the search for functional genes. Polygenic enrichment analysis across 697 annotations from a host of tissues and cell types confirms the central role of the liver in lipid levels, and highlights the selective enrichment of adipose-specific chromatin marks in high-density lipoprotein cholesterol and triglycerides. Overlapping transcription factor (TF) binding sites with lipid-associated loci identifies TFs relevant in lipid biology. In addition, we present an integrative framework to prioritize causal variants at GWAS loci, producing a comprehensive list of candidate causal genes and variants with multiple layers of functional evidence. Two prioritized genes, CREBRF and RRBP1 , show convergent evidence across functional datasets supporting their roles in lipid biology.
0

Genome-Wide Interaction Analysis With DASH Diet Score Identified Novel Loci for Systolic Blood Pressure

Mélanie Guirette et al.Aug 1, 2024
+43
N
J
M
BACKGROUND: The Dietary Approaches to Stop Hypertension (DASH) diet score lowers blood pressure (BP). We examined interactions between genotype and the DASH diet score in relation to systolic BP. METHODS: We analyzed up to 9 420 585 single nucleotide polymorphisms in up to 127 282 individuals of 6 population groups (91% of European population) from the Cohorts for Heart and Aging Research in Genomic Epidemiology consortium (n=35 660) and UK Biobank (n=91 622) and performed European population-specific and cross-population meta-analyses. RESULTS: We identified 3 loci in European-specific analyses and an additional 4 loci in cross-population analyses at P interaction <5e−8. We observed a consistent interaction between rs117878928 at 15q25.1 (minor allele frequency, 0.03) and the DASH diet score ( P interaction =4e−8; P for heterogeneity, 0.35) in European population, where the interaction effect size was 0.42±0.09 mm Hg ( P interaction =9.4e−7) and 0.20±0.06 mm Hg ( P interaction =0.001) in Cohorts for Heart and Aging Research in Genomic Epidemiology and the UK Biobank, respectively. The 1 Mb region surrounding rs117878928 was enriched with cis-expression quantitative trait loci (eQTL) variants ( P =4e−273) and cis-DNA methylation quantitative trait loci variants ( P =1e−300). Although the closest gene for rs117878928 is MTHFS , the highest narrow sense heritability accounted by single nucleotide polymorphisms potentially interacting with the DASH diet score in this locus was for gene ST20 at 15q25.1. CONCLUSIONS: We demonstrated gene-DASH diet score interaction effects on systolic BP in several loci. Studies with larger diverse populations are needed to validate our findings.
0
Paper
Citation1
0
Save
6

Multi-ancestry genome-wide gene-sleep interactions identify novel loci for blood pressure

Heming Wang et al.Oct 24, 2023
+122
B
R
H
Abstract Long and short sleep duration are associated with elevated blood pressure (BP), possibly through effects on molecular pathways that influence neuroendocrine and vascular systems. To gain new insights into the genetic basis of sleep-related BP variation, we performed genome-wide gene by short or long sleep duration interaction analyses on four BP traits (systolic BP, diastolic BP, mean arterial pressure, and pulse pressure) across five ancestry groups using 1 degree of freedom (1df) interaction and 2df joint tests. Primary multi-ancestry analyses in 62,969 individuals in stage 1 identified 3 novel loci that were replicated in an additional 59,296 individuals in stage 2, including rs7955964 ( FIGNL2/ANKRD33 ) showing significant 1df interactions with long sleep duration and rs73493041 ( SNORA26/C9orf170 ) and rs10406644 ( KCTD15/LSM14A ) showing significant 1df interactions with short sleep duration (P int < 5×10 −8 ). Secondary ancestry-specific two-stage analyses and combined stage 1 and 2 analyses additionally identified 23 novel loci that need external replication, including 3 and 5 loci showing significant 1df interactions with long and short sleep duration, respectively (P int < 5×10 −8 ). Multiple genes mapped to our 26 novel loci have known functions in sleep-wake regulation, nervous and cardiometabolic systems. We also identified new gene by long sleep interactions near five known BP loci (≤1Mb) including NME7, FAM208A, MKLN1, CEP164 , and RGL3/ELAVL3 (P int < 5×10 −8 ). This study indicates that sleep and primary mechanisms regulating BP may interact to elevate BP level, suggesting novel insights into sleep-related BP regulation.
0

Multi-ancestry analysis of gene-sleep interactions in 126,926 individuals identifies multiple novel blood lipid loci that contribute to our understanding of sleep-associated adverse blood lipid profile

Raymond Noordam et al.May 7, 2020
+146
H
M
R
Both short and long sleep are associated with an adverse lipid profile, likely through different biological pathways. To provide new insights in the biology of sleep-associated adverse lipid profile, we conducted multi-ancestry genome-wide sleep-SNP interaction analyses on three lipid traits (HDL-c, LDL-c and triglycerides). In the total study sample (discovery + replication) of 126,926 individuals from 5 different ancestry groups, when considering either long or short total sleep time interactions in joint analyses, we identified 49 novel lipid loci, and 10 additional novel lipid loci in a restricted sample of European-ancestry cohorts. In addition, we identified new gene-sleep interactions for known lipid loci such as LPL and PCSK9. The novel gene-sleep interactions had a modest explained variance in lipid levels: most notable, gene-short-sleep interactions explained 4.25% of the variance in triglyceride concentration. Collectively, these findings contribute to our understanding of the biological mechanisms involved in sleep-associated adverse lipid profiles.
0

Sequencing of 53,831 diverse genomes from the NHLBI TOPMed Program

Daniel Taliun et al.May 6, 2020
+174
M
D
D
The Trans-Omics for Precision Medicine (TOPMed) program seeks to elucidate the genetic architecture and disease biology of heart, lung, blood, and sleep disorders, with the ultimate goal of improving diagnosis, treatment, and prevention. The initial phases of the program focus on whole genome sequencing of individuals with rich phenotypic data and diverse backgrounds. Here, we describe TOPMed goals and design as well as resources and early insights from the sequence data. The resources include a variant browser, a genotype imputation panel, and sharing of genomic and phenotypic data via dbGaP. In 53,581 TOPMed samples, >400 million single-nucleotide and insertion/deletion variants were detected by alignment with the reference genome. Additional novel variants are detectable through assembly of unmapped reads and customized analysis in highly variable loci. Among the >400 million variants detected, 97% have frequency <1% and 46% are singletons. These rare variants provide insights into mutational processes and recent human evolutionary history. The nearly complete catalog of genetic variation in TOPMed studies provides unique opportunities for exploring the contributions of rare and non-coding sequence variants to phenotypic variation. Furthermore, combining TOPMed haplotypes with modern imputation methods improves the power and extends the reach of nearly all genome-wide association studies to include variants down to ~0.01% in frequency.
Load More