SM
Sahar Mozaffari
Author with expertise in Genomic Studies and Association Analyses
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
10
(60% Open Access)
Cited by:
4,930
h-index:
21
/
i10-index:
33
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

A gene-based association method for mapping traits using reference transcriptome data

Eric Gamazon et al.Aug 10, 2015
+8
N
D
E
Hae Kyung Im and colleagues report a method for predicting gene expression perturbations from genotype data after training on reference transcriptome data sets. Association of predicted gene expression with disease traits identifies known and new candidate disease genes. Genome-wide association studies (GWAS) have identified thousands of variants robustly associated with complex traits. However, the biological mechanisms underlying these associations are, in general, not well understood. We propose a gene-based association method called PrediXcan that directly tests the molecular mechanisms through which genetic variation affects phenotype. The approach estimates the component of gene expression determined by an individual's genetic profile and correlates 'imputed' gene expression with the phenotype under investigation to identify genes involved in the etiology of the phenotype. Genetically regulated gene expression is estimated using whole-genome tissue-dependent prediction models trained with reference transcriptome data sets. PrediXcan enjoys the benefits of gene-based approaches such as reduced multiple-testing burden and a principled approach to the design of follow-up experiments. Our results demonstrate that PrediXcan can detect known and new genes associated with disease traits and provide insights into the mechanism of these associations.
0
Citation1,615
0
Save
0

FinnGen provides genetic insights from a well-phenotyped isolated population

Mitja Kurki et al.Jan 18, 2023
+97
P
J
M
Abstract Population isolates such as those in Finland benefit genetic research because deleterious alleles are often concentrated on a small number of low-frequency variants (0.1% ≤ minor allele frequency < 5%). These variants survived the founding bottleneck rather than being distributed over a large number of ultrarare variants. Although this effect is well established in Mendelian genetics, its value in common disease genetics is less explored 1,2 . FinnGen aims to study the genome and national health register data of 500,000 Finnish individuals. Given the relatively high median age of participants (63 years) and the substantial fraction of hospital-based recruitment, FinnGen is enriched for disease end points. Here we analyse data from 224,737 participants from FinnGen and study 15 diseases that have previously been investigated in large genome-wide association studies (GWASs). We also include meta-analyses of biobank data from Estonia and the United Kingdom. We identified 30 new associations, primarily low-frequency variants, enriched in the Finnish population. A GWAS of 1,932 diseases also identified 2,733 genome-wide significant associations (893 phenome-wide significant (PWS), P < 2.6 × 10 –11 ) at 2,496 (771 PWS) independent loci with 807 (247 PWS) end points. Among these, fine-mapping implicated 148 (73 PWS) coding variants associated with 83 (42 PWS) end points. Moreover, 91 (47 PWS) had an allele frequency of <5% in non-Finnish European individuals, of which 62 (32 PWS) were enriched by more than twofold in Finland. These findings demonstrate the power of bottlenecked populations to find entry points into the biology of common diseases through low-frequency, high impact variants.
0
Citation1,372
0
Save
0

Genome evolution in the allotetraploid frog Xenopus laevis

Adam Session et al.Oct 1, 2016
+71
T
Y
A
To explore the origins and consequences of tetraploidy in the African clawed frog, we sequenced the Xenopus laevis genome and compared it to the related diploid X. tropicalis genome. We characterize the allotetraploid origin of X. laevis by partitioning its genome into two homoeologous subgenomes, marked by distinct families of ‘fossil’ transposable elements. On the basis of the activity of these elements and the age of hundreds of unitary pseudogenes, we estimate that the two diploid progenitor species diverged around 34 million years ago (Ma) and combined to form an allotetraploid around 17–18 Ma. More than 56% of all genes were retained in two homoeologous copies. Protein function, gene expression, and the amount of conserved flanking sequence all correlate with retention rates. The subgenomes have evolved asymmetrically, with one chromosome set more often preserving the ancestral state and the other experiencing more gene loss, deletion, rearrangement, and reduced gene expression. The two homoeologous subgenomes in the allotetraploid frog Xenopus laevis evolved asymmetrically; one often retained the ancestral state, whereas the other experienced gene loss, deletion, rearrangement and reduced gene expression. Xenopus laevis, also known as the African clawed frog or platanna, is an important model organism that is used in the study of vertebrate cell and developmental biology. It is a palaeotetraploid—the product of genome duplications that occurred many millions of years ago. This makes X. laevis ideal for the study of polyploidy, but has greatly complicated genome sequencing. Here an international research collaboration reports the X. laevis genome sequence and compares it to that of the related X. tropicalis. Their analyses confirm that X. laevis is an allotetraploid and distinguishes two subgenomes that evolved asymmetrically—one often retained the ancestral state and the other was subject to gene loss, deletion, rearrangement and reduced expression. The two diploid progenitor species diverged about 34 million years ago, combining to form an allotetraploid about 18 million years ago.
0
Citation898
0
Save
0

A genome-wide association study with 1,126,563 individuals identifies new risk loci for Alzheimer’s disease

Douglas Wightman et al.Sep 1, 2021
+97
J
I
D
Late-onset Alzheimer’s disease is a prevalent age-related polygenic disease that accounts for 50–70% of dementia cases. Currently, only a fraction of the genetic variants underlying Alzheimer’s disease have been identified. Here we show that increased sample sizes allowed identification of seven previously unidentified genetic loci contributing to Alzheimer’s disease. This study highlights microglia, immune cells and protein catabolism as relevant to late-onset Alzheimer’s disease, while identifying and prioritizing previously unidentified genes of potential interest. We anticipate that these results can be included in larger meta-analyses of Alzheimer’s disease to identify further genetic variants that contribute to Alzheimer’s pathology. A genome-wide association study performed in 1,126,563 individuals identifies seven new loci associated with Alzheimer’s disease and implicates microglia and immune cells in late-onset disease.
0
Citation586
0
Save
0

Genetic determinants of daytime napping and effects on cardiometabolic health

Hassan Dashti et al.Feb 10, 2021
+61
L
I
H
Abstract Daytime napping is a common, heritable behavior, but its genetic basis and causal relationship with cardiometabolic health remain unclear. Here, we perform a genome-wide association study of self-reported daytime napping in the UK Biobank ( n = 452,633) and identify 123 loci of which 61 replicate in the 23andMe research cohort ( n = 541,333). Findings include missense variants in established drug targets for sleep disorders ( HCRTR1 , HCRTR2 ), genes with roles in arousal ( TRPC6 , PNOC ), and genes suggesting an obesity-hypersomnolence pathway ( PNOC, PATJ ). Association signals are concordant with accelerometer-measured daytime inactivity duration and 33 loci colocalize with loci for other sleep phenotypes. Cluster analysis identifies three distinct clusters of nap-promoting mechanisms with heterogeneous associations with cardiometabolic outcomes. Mendelian randomization shows potential causal links between more frequent daytime napping and higher blood pressure and waist circumference.
0
Citation456
0
Save
0

Heritability Estimation and Differential Analysis with Generalized Linear Mixed Models in Genomic Sequencing Studies

Shuang Sun et al.Jun 29, 2018
+3
J
M
S
ABSTRACT Motivation Genomic sequencing studies, including RNA sequencing and bisulfite sequencing studies, are becoming increasingly common and increasingly large. Large genomic sequencing studies open doors for accurate molecular trait heritability estimation and powerful differential analysis. Heritability estimation and differential analysis in sequencing studies requires the development of statistical methods that can properly account for the count nature of the sequencing data and that are computationally efficient for large data sets. Results Here, we develop such a method, PQLseq (Penalized Quasi-Likelihood for sequencing count data), to enable effective and efficient heritability estimation and differential analysis using the generalized linear mixed model framework. With extensive simulations and comparisons to previous methods, we show that PQLseq is the only method currently available that can produce unbiased heritability estimates for sequencing count data. In addition, we show that PQLseq is well suited for differential analysis in large sequencing studies, providing calibrated type I error control and more power compared to the standard linear mixed model methods. Finally, we apply PQLseq to perform gene expression heritability estimation and differential expression analysis in a large RNA sequencing study in the Hutterites. Availability and implementation PQLseq is implemented as an R package with source code freely available at www.xzlab.org/software.html and https://cran.r-project.org/web/packages/PQLseq/index.html . Contact XZ ( xzhousph@umich.edu ) Supplementary information Supplementary data are available online.
0
Citation3
0
Save
0

Parent of origin gene expression in a founder population identifies two new imprinted genes at known imprinted regions

Sahar Mozaffari et al.Jun 11, 2018
+2
K
M
S
Genomic imprinting is the phenomena that leads to silencing of one copy of a gene inherited from a specific parent. Mutations in imprinted regions have been involved in diseases showing parent of origin effects. Identifying genes with evidence of parent of origin expression patterns in family studies allows the detection of more subtle imprinting. Here, we use allele specific expression in lymphoblastoid cell lines from 306 Hutterites related in a single pedigree to provide formal evidence for parent of origin effects. We take advantage of phased genotype data to assign parent of origin to RNA-seq reads in individuals with gene expression data. Our approach identified known imprinted genes, two putative novel imprinted genes, and 14 genes with asymmetrical parent of origin gene expression. We used gene expression in peripheral blood leukocytes (PBL) to validate our findings, and then confirmed imprinting control regions (ICRs) using DNA methylation levels in the PBLs.
0

Parent of Origin Effects on Quantitative Phenotypes in a Founder Population

Sahar Mozaffari et al.Jun 14, 2017
+3
S
J
S
The impact of the parental origin of associated alleles in GWAS has been largely ignored. Yet sequence variants could affect traits differently depending on whether they are inherited from the mother or the father. To explore this possibility, we studied 21 quantitative phenotypes in a large Hutterite pedigree. We first identified variants with significant single parent (maternal-only or paternal-only) effects, and then used a novel statistical model to identify variants with opposite parental effects. Overall, we identified parent of origin effects (POEs) on 11 phenotypes, most of which are risk factors for cardiovascular disease. Many of the loci with POEs have features of imprinted regions and many of the variants with POE are associated with the expression of nearby genes. Overall, our results indicate that POEs, which are often opposite in direction, are relatively common in humans, have potentially important clinical effects, and will be missed in traditional GWAS.
0

Rare non-coding variants are associated with plasma lipid traits in a founder population

Catherine Igartua et al.May 24, 2017
C
D
S
C
Founder populations are ideally suited for studies on the clinical effects of alleles that are rare in general populations but occur at higher frequencies in these isolated populations. Whole genome sequencing in 98 South Dakota Hutterites, a founder population of European descent, and subsequent imputation to the Hutterite pedigree revealed 660,238 single nucleotide polymorphisms (SNPs; 98.9% non-coding) that are rare (<1%) or absent in European populations, but occur at frequencies greater than 1% in the Hutterites. We examined the effects of these rare in European variants on plasma levels of LDL cholesterol (LDL-C), HDL cholesterol (HDL-C), total cholesterol and triglycerides (TG) in 828 Hutterites and applied a Bayesian hierarchical framework to prioritize potentially causal variants based on functional annotations. We identified two novel non-coding rare variants associated with LDL-C (rs17242388 in LDLR) and HDL-C (rs189679427 between GOT2 and APOOP5), and replicated previous associations of a splice variant in APOC3 (rs138326449) with TG and HDL-C. All three variants are at well-replicated loci in genome wide association study (GWAS) but are independent from and have larger effect sizes than the known common variation in these regions. We also identified variants at two novel loci (rs191020975 in EPHA6 and chr1:224811120 in CNIH3) at suggestive levels of significance with LDL-C. Candidate expression quantitative loci (eQTL) analyses in lymphoblastoid cell lines (LCLs) in the Hutterites suggest that these rare non-coding variants are likely to mediate their effects on lipid traits by regulating gene expression. Overall, we provide insights into the mechanisms regulating lipid traits and potentially new therapeutic targets.
0

PrediXcan: Trait Mapping Using Human Transcriptome Regulation

Eric Gamazon et al.Jun 17, 2015
+8
K
H
E
Genome-wide association studies (GWAS) have identified thousands of variants robustly associated with complex traits. However, the biological mechanisms underlying these associations are, in general, not well understood. We propose a gene-based association method called PrediXcan that directly tests the molecular mechanisms through which genetic variation affects phenotype. The approach estimates the component of gene expression determined by an individual's genetic profile and correlates the “imputed” gene expression with the phenotype under investigation to identify genes involved in the etiology of the phenotype. The genetically regulated gene expression is estimated using whole-genome tissue-dependent prediction models trained with reference transcriptome datasets. PrediXcan enjoys the benefits of gene- based approaches such as reduced multiple testing burden, more comprehensive annotation of gene function compared to that derived from single variants, and a principled approach to the design of follow-up experiments while also integrating knowledge of regulatory function. Since no actual expression data are used in the analysis of GWAS data - only in silico expression - reverse causality problems are largely avoided. PrediXcan harnesses reference transcriptome data for disease mapping studies. Our results demonstrate that PrediXcan can detect known and novel genes associated with disease traits and provide insights into the mechanism of these associations.