NM
Nicholas Mancuso
Author with expertise in Genomic Studies and Association Analyses
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
15
(53% Open Access)
Cited by:
14
h-index:
11
/
i10-index:
13
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
10

Ancestry-specific maps of GRCh38 linkage disequilibrium blocks for human genome research

James MacDonald et al.Mar 7, 2022
+2
T
T
J
Abstract A map of approximately independent linkage disequilibrium (LD) blocks has many uses in statistical genetics. Current publicly available LD block maps are based on sparse recombination maps and are only available for GRCh37 (hg19) and prior genome assemblies. We generated LD blocks in GRCh38 coordinates for African (AFR), East Asian (EAS), European (EUR) and South Asian (SAS) ancestry populations. These new maps consist of 1,143 (EAS) - 1,604 (AFR) independent LD blocks across the 22 autosomal chromosomes and can be accessed at https://github.com/jmacdon/LDblocks_GRCh38 .
10
Citation8
0
Save
40

The motif composition of variable-number tandem repeats impacts gene expression

Tsung-Yu Lu et al.Mar 19, 2022
+2
G
P
T
Abstract Understanding the impact of DNA variation on human traits is a fundamental question in human genetics. Variable number tandem repeats (VNTRs) make up roughly 3% of the human genome but are often excluded from association analysis due to poor read mappability or divergent repeat content. While methods exist to estimate VNTR length from short-read data, it is known that VNTRs vary in both length and repeat (motif) composition. Here, we use a repeat-pangenome graph (RPGG) constructed on 35 haplotype-resolved assemblies to detect variation in both VNTR length and repeat composition. We align population scale data from the Genotype-Tissue Expression (GTEx) Consortium to examine how variations in sequence composition may be linked to expression, including cases independent of overall VNTR length. We find that 9,422 out of 39,125 VNTRs are associated with nearby gene expression through motif variations, of which only 23.4% associations are accessible from length. Fine-mapping identifies 174 genes to be likely driven by variation in certain VNTR motifs and not overall length. We highlight two genes, CACNA1C and RNF213 that have expression associated with motif variation, demonstrating the utility of RPGG analysis as a new approach for trait association in multiallelic and highly variable loci.
40
Citation2
0
Save
68

Tree-based QTL mapping with expected local genetic relatedness matrices

Vivian Link et al.Apr 8, 2023
+4
C
J
V
Abstract Understanding the genetic basis of complex phenotypes is a central pursuit of genetics. Genome-wide Association Studies (GWAS) are a powerful way to find genetic loci associated with phenotypes. GWAS are widely and successfully used, but they face challenges related to the fact that variants are tested for association with a phenotype independently, whereas in reality variants at different sites are correlated because of their shared evolutionary history. One way to model this shared history is through the ancestral recombination graph (ARG), which encodes a series of local coalescent trees. Recent computational and methodological breakthroughs have made it feasible to estimate approximate ARGs from large-scale samples. Here, we explore the potential of an ARG-based approach to quantitative-trait locus (QTL) mapping, echoing existing variance-components approaches. We propose a framework that relies on the conditional expectation of a local genetic relatedness matrix given the ARG (local eGRM). Simulations show that our method is especially beneficial for finding QTLs in the presence of allelic heterogeneity. By framing QTL mapping in terms of the estimated ARG, we can also facilitate the detection of QTLs in understudied populations. We use local eGRM to identify a large-effect BMI locus, the CREBRF gene, in a sample of Native Hawaiians in which it was not previously detectable by GWAS because of a lack of population-specific imputation resources. Our investigations can provide intuition about the benefits of using estimated ARGs in population- and statistical-genetic methods in general.
68
Citation2
0
Save
79

Multi-ancestry fine-mapping improves precision to identify causal genes in transcriptome-wide association studies

Zeyun Lu et al.Feb 11, 2022
+4
B
Y
Z
Abstract Transcriptome-wide association studies (TWAS) are a powerful approach to identify genes whose expression associates with complex disease risk. However, non-causal genes can exhibit association signals due to confounding by linkage disequilibrium patterns (LD) and eQTL pleiotropy at genomic risk regions which necessitates fine-mapping of TWAS signals. Here, we present MA-FOCUS, a multi-ancestry framework for the improved identification of genes underlying traits of interest. We demonstrate that by leveraging differences in ancestry-specific patterns of LD and eQTL signals, MA-FOCUS consistently outperforms single-ancestry fine-mapping approaches with equivalent total sample size across multiple metrics. We perform 15 blood trait TWAS using genome-wide summary statistics (average N EA =511k, N AA =13k) and lymphoblastoid cell line eQTL data from cohorts of primarily European and African continental ancestries. We recapitulate evidence demonstrating shared genetic architectures for eQTL and blood traits between the two ancestry groups and observe that gene-level effects correlate 20% more strongly across ancestries compared with SNP-level effects. We perform fine-mapping using MA-FOCUS and find evidence that genes at TWAS risk regions are more likely to be shared across ancestries rather than ancestry-specific. Using multiple lines of evidence to validate our findings, we find gene sets produced by MA-FOCUS are more enriched in hematopoietic categories compared to alternative approaches ( P = 1.73 × 10 −16 ). Our work demonstrates that including, and appropriately accounting for, genetic diversity can drive deeper insights into the genetic architecture of complex traits.
79
Citation1
0
Save
41

A genealogical estimate of genetic relationships

Caoqi Fan et al.Aug 18, 2021
C
N
C
Abstract The application of genetic relationships among individuals, characterized by a genetic relationship matrix (GRM), has far-reaching effects in human genetics. However, the current standard to calculate the GRM generally does not take advantage of linkage information and does not reflect the underlying genealogical history of the study sample. Here, we propose a coalescent-informed framework to infer the expected relatedness between pairs of individuals given an ancestral recombination graph (ARG) of the sample. Through extensive simulations we show that the eGRM is an unbiased estimate of latent pairwise genome-wide relatedness and is robust when computed using genealogies inferred from incomplete genetic data. As a result, the eGRM better captures the structure of a population than the canonical GRM, even when using the same genetic information. More importantly, our framework allows a principled approach to estimate the eGRM at different time depths of the ARG, thereby revealing the time-varying nature of population structure in a sample. When applied to genotyping data from a population sample from Northern and Eastern Finland, we find that clustering analysis using the eGRM reveals population structure driven by subpopulations that would not be apparent using the canonical GRM, and that temporally the population model is consistent with recent divergence and expansion. Taken together, our proposed eGRM provides a robust tree-centric estimate of relatedness with wide application to genetic studies.
41
Citation1
0
Save
1

A Rigorous Benchmarking of alignment-based HLA callers for RNA-seq data

Dottie Yu et al.May 24, 2023
+16
A
S
D
Abstract Accurate identification of human leukocyte antigen (HLA) alleles is essential for various clinical and research applications, such as transplant matching and drug sensitivities. Recent advances in RNA-seq technology have made it possible to impute HLA types from high throughput sequencing data, spurring the development of a large number of computational HLA typing tools. However, the relative performance of these tools is unknown, limiting the ability for clinical and biomedical research to make informed choices regarding which tools to use. Here, we rigorously compare the performance of 9 HLA callers on 652 RNA-seq samples across 6 datasets with molecularly defined gold standard. We find that OptiType has the highest accuracy at both low and high resolution with an accuracy above 99%, followed by arcasHLA and seq2HLA with accuracies above 96%. Despite OptiType’s high accuracy, it is only capable of Class I predictions, thereby limiting its application to clinical procedures like transplantation requiring Class II predictions. Furthermore, our findings reveal significant variation in accuracy across each HLA locus, with HLA-A exhibiting the highest accuracy and HLA-DRB1 exhibiting the lowest accuracy. We also find that class II genes are generally more challenging to impute than class I genes, with most typing algorithms capable of making Class I predictions to >97% accuracy whereas the best Class II tool predicts with 94.2% accuracy. Moreover, we identify notable differences in the computational resources necessary to run each tool. We find that the most computationally expensive tools are OptiType and HLA-HD which require 10 5 and 10 2 times greater RAM and CPU, respectively, than the least computationally expensive tools, seq2HLA and RNA2HLA. Furthermore, all tools have decreased accuracy for African samples with respect to European samples at four digit resolution. We conclude that RNA-Seq HLA callers are capable of returning high-quality results, but the tools that offer a good balance between accuracy, consistency, and computational expensiveness are yet to be developed.
0

Genetic control of gene expression and splicing in the developing human brain

Rebecca Walker et al.Nov 16, 2018
+7
L
N
R
Most genetic risk for human diseases lies within non-coding regions of the genome, which is predicted to regulate gene expression, often in a tissue and stage specific manner. This has motivated building of extensive eQTL resources to understand how human allelic variation affects gene expression and splicing throughout the body, focusing primarily on adult tissue. Given the importance of regulatory pathways during brain development, we characterize the genetic control of the developing human cerebral cortical transcriptome, including expression and splicing, in 201 mid-gestational human brains, to understand how common allelic variation affects gene regulation during development. We leverage expression and splice quantitative trait loci to identify genes and isoforms relevant to neuropsychiatric disorders and brain volume. These findings demonstrate genetic mechanisms by which early developmental events have a striking and widespread influence on adult anatomical and behavioral phenotypes, as well as the evolution of the human cerebral cortex.
0

Accurate estimation of SNP-heritability from biobank-scale data irrespective of genetic architecture

Kangcheng Hou et al.Jan 23, 2019
+5
K
Y
K
The proportion of phenotypic variance attributable to the additive effects of a given set of genotyped SNPs (i.e. SNP-heritability) is a fundamental quantity in the study of complex traits. Recent works have shown that existing methods to estimate genome-wide SNP-heritability often yield biases when their assumptions are violated. While various approaches have been proposed to account for frequency- and LD-dependent genetic architectures, it remains unclear which estimates of SNP-heritability reported in the literature are reliable. Here we show that genome-wide SNP-heritability can be accurately estimated from biobank-scale data irrespective of the underlying genetic architecture of the trait, without specifying a heritability model or partitioning SNPs by minor allele frequency and/or LD. We use theoretical justifications coupled with extensive simulations starting from real genotypes from the UK Biobank ( N = 337K) to show that, unlike existing methods, our closed-form estimator for SNP-heritability is highly accurate across a wide range of architectures. We provide estimates of SNP-heritability for 22 complex traits and diseases in the UK Biobank and show that, consistent with our results in simulations, existing biobank-scale methods yield estimates up to 30% different from our theoretically-justified approach.
0

Integrative analysis of Dupuytren's disease identifies novel risk locus and reveals a shared genetic etiology with BMI

Megan Major et al.Dec 18, 2018
+5
K
M
M
Dupuytren's disease is the common inherited tissue-specific fibrotic disorder. It's characterized by progressive and irreversible fibroblastic proliferation affecting the palmar fascia of the hand, with an onset typically in the sixth decade of life. Although genome-wide association studies (GWAS) have identified 24 genomic regions associated with Dupuytren's risk, the biological mechanisms driving signal at these regions remain elusive. We identify potential biological mechanisms for Dupuytren's disease by integrating the most recent, largest GWAS (n=8,557) with eQTLs (47 tissue panels from five consortia, total n=3,975) to perform a transcriptome-wide association study (TWAS). We identify 43 tissue-specific gene associations with Dupuytren's risk, one of which resides at least 0.5 Mb away from the 24 risk regions previously identified. We also estimate the genome-wide genetic correlation between Dupuytren's disease and 45 complex traits and find significant genetic correlations between Dupuytren's disease and body mass index (rho=-0.20), type II diabetes (rho=-0.18), triglycerides (rho=-0.14), and high-density lipoprotein levels (rho=0.13), which suggests a shared genetic etiology. We further refine the genome-wide genetic correlation signal to identify 8 regions significantly negatively correlated with BMI and 3 regions significantly correlated (1 positively and 2 negatively correlated) with HDL; none of these regions contained the novel gene association identified by TWAS. Our results are consistent with previous epidemiological findings which show that lower BMI increases risk for Dupuytren's disease. These 12 novel risk regions provide new insight into the biological mechanisms of Dupuytren's disease and serve as a starting point for functional validation.
1

Fetally-encoded GDF15 and maternal GDF15 sensitivity are major determinants of nausea and vomiting in human pregnancy

Marlena Fejzo et al.Jun 4, 2023
+45
I
N
M
Human pregnancy is frequently accompanied by nausea and vomiting that may become severe and life-threatening, as in hyperemesis gravidarum (HG), the cause of which is unknown. Growth Differentiation Factor-15 (GDF15), a hormone known to act on the hindbrain to cause emesis, is highly expressed in the placenta and its levels in maternal blood rise rapidly in pregnancy. Variants in the maternal GDF15 gene are associated with HG. Here we report that fetal production of GDF15, and maternal sensitivity to it, both contribute substantially to the risk of HG. We found that the great majority of GDF15 in maternal circulation is derived from the feto-placental unit and that higher GDF15 levels in maternal blood are associated with vomiting and are further elevated in patients with HG. Conversely, we found that lower levels of GDF15 in the non-pregnant state predispose women to HG. A rare C211G variant in GDF15 which strongly predisposes mothers to HG, particularly when the fetus is wild-type, was found to markedly impair cellular secretion of GDF15 and associate with low circulating levels of GDF15 in the non-pregnant state. Consistent with this, two common GDF15 haplotypes which predispose to HG were associated with lower circulating levels outside pregnancy. The administration of a long-acting form of GDF15 to wild-type mice markedly reduced subsequent responses to an acute dose, establishing that desensitisation is a feature of this system. GDF15 levels are known to be highly and chronically elevated in patients with beta thalassemia. In women with this disorder, reports of symptoms of nausea or vomiting in pregnancy were strikingly diminished. Our findings support a causal role for fetal derived GDF15 in the nausea and vomiting of human pregnancy, with maternal sensitivity, at least partly determined by pre-pregnancy exposure to GDF15, being a major influence on its severity. They also suggest mechanism-based approaches to the treatment and prevention of HG.
Load More