NS
Nicole Soranzo
Author with expertise in Genomic Studies and Association Analyses
University of Cambridge, National Institute for Health Research, Genomics (United Kingdom)
+ 7 more
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
29
(31% Open Access)
Cited by:
49
h-index:
117
/
i10-index:
238
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

A map of transcriptional heterogeneity and regulatory variation in human microglia

Adam Young et al.May 6, 2020
+33
F
N
A
Abstract Microglia, the tissue resident macrophages of the CNS, are implicated in a broad range of neurological pathologies, from acute brain injury to dementia. Here, we profiled gene expression variation in primary human microglia isolated from 141 patients undergoing neurosurgery. Using single cell and bulk RNA sequencing, we defined distinct cellular populations of acutely in vivo -activated microglia, and characterised a dramatic switch in microglial population composition in patients suffering from acute brain injury. We mapped expression quantitative trait loci (eQTLs) in human microglia and show that many disease-associated eQTLs in microglia replicate well in a human induced pluripotent stem cell (hIPSC) derived macrophage model system. Using ATAC-seq from 95 individuals in this hIPSC model we fine-map candidate causal variants at risk loci for Alzheimer’s disease, the most prevalent neurodegenerative condition in acute brain injury patients. Our study provides the first population-scale transcriptional map of a critically important cell for neurodegenerative disorders.
0
Citation22
0
Save
0

Genetic associations at regulatory phenotypes improve fine-mapping of causal variants for twelve immune-mediated diseases

Kousik Kundu et al.May 7, 2020
+10
M
A
K
Abstract The identification of causal genetic variants for common diseases improves understanding of disease biology. Here we use data from the BLUEPRINT project to identify regulatory quantitative trait loci (QTL) for three primary human immune cell types and use these to fine-map putative causal variants for twelve immune-mediated diseases. We identify 340 unique, non major histocompatibility complex (MHC) disease loci that colocalise with high (>98%) posterior probability with regulatory QTLs, and apply Bayesian frameworks to fine-map associations at each locus. We show that fine-mapping applied to regulatory QTLs yields smaller credible set sizes and higher posterior probabilities for candidate causal variants compared to disease summary statistics. We also describe a systematic under-representation of insertion/deletion (INDEL) polymorphisms in credible sets derived from publicly available disease meta-analysis when compared to QTLs based on genome-sequencing data. Overall, our findings suggest that fine-mapping applied to disease-colocalising regulatory QTLs can enhance the discovery of putative causal disease variants and provide insights into the underlying causal genes and molecular mechanisms.
0

Genetic Analyses of Blood Cell Structure for Biological and Pharmacological Inference

Parsa Akbari et al.May 7, 2020
+30
T
D
P
SUMMARY Thousands of genetic associations with phenotypes of blood cells are known, but few are with phenotypes relevant to cell function. We performed GWAS of 63 flow-cytometry phenotypes, including measures of cell granularity, nucleic acid content, and reactivity, in 39,656 participants in the INTERVAL study, identifying 2,172 variant-trait associations. These include associations mediated by functional cellular structures such as secretory granules, implicated in vascular, thrombotic, inflammatory and neoplastic diseases. By integrating our results with epigenetic data and with signals from molecular abundance/disease GWAS, we infer the hematopoietic origins of population phenotypic variation and identify the transcription factor FOG2 as a regulator of platelet α -granularity. We show how flow cytometry genetics can suggest cell types mediating complex disease risk and suggest efficacious drug targets, presenting Daclizumab/Vedolizumab in autoimmune disease as positive controls. Finally, we add to existing evidence supporting IL7/IL7-R as drug targets for multiple sclerosis.
3

An atlas of genetic scores to predict multi-omic traits

Yu Xu et al.Apr 18, 2022
+33
Y
S
Y
Abstract Genetically predicted levels of multi-omic traits can uncover the molecular underpinnings of common phenotypes in a highly efficient manner. Here, we utilised a large cohort (INTERVAL; N=50,000 participants) with extensive multi-omic data for plasma proteomics (SomaScan, N=3,175; Olink, N=4,822), plasma metabolomics (Metabolon HD4, N=8,153), serum metabolomics (Nightingale, N=37,359), and whole blood Illumina RNA sequencing (N=4,136). We used machine learning to train genetic scores for 17,227 molecular traits, including 10,521 which reached Bonferroni-adjusted significance. We evaluated genetic score performances in external validation across European, Asian and African American ancestries, and assessed their longitudinal stability within diverse individuals. We demonstrated the utility of these multi-omic genetic scores by quantifying the genetic control of biological pathways and by generating a synthetic multi-omic dataset of UK Biobank to identify disease associations using a phenome-wide scan. Finally, we developed a portal ( OmicsPred.org ) to facilitate public access to all genetic scores and validation results as well as to serve as a platform for future extensions and enhancements of multi-omic genetic scores.
3
Paper
Citation5
0
Save
13

Genome-wide association study identifies 48 common genetic variants associated with handedness

Gabriel Partida et al.Mar 15, 2020
+109
N
J
G
Abstract Handedness, a consistent asymmetry in skill or use of the hands, has been studied extensively because of its relationship with language and the over-representation of left-handers in some neurodevelopmental disorders. Using data from the UK Biobank, 23andMe and 32 studies from the International Handedness Consortium, we conducted the world’s largest genome-wide association study of handedness (1,534,836 right-handed, 194,198 (11.0%) left-handed and 37,637 (2.1%) ambidextrous individuals). We found 41 genetic loci associated with left-handedness and seven associated with ambidexterity at genome-wide levels of significance (P < 5×10 −8 ). Tissue enrichment analysis implicated the central nervous system and brain tissues including the hippocampus and cerebrum in the etiology of left-handedness. Pathways including regulation of microtubules, neurogenesis, axonogenesis and hippocampus morphology were also highlighted. We found suggestive positive genetic correlations between being left-handed and some neuropsychiatric traits including schizophrenia and bipolar disorder. SNP heritability analyses indicated that additive genetic effects of genotyped variants explained 5.9% (95% CI = 5.8% – 6.0%) of the underlying liability of being left-handed, while the narrow sense heritability was estimated at 12% (95% CI = 7.2% – 17.7%). Further, we show that genetic correlation between left-handedness and ambidexterity is low (r g = 0.26; 95% CI = 0.08 – 0.43) implying that these traits are largely influenced by different genetic mechanisms. In conclusion, our findings suggest that handedness, like many other complex traits is highly polygenic, and that the genetic variants that predispose to left-handedness may underlie part of the association with some psychiatric disorders that has been observed in multiple observational studies.
0

eQTLs identify regulatory networks and drivers of variation in the individual response to sepsis

Sarah Mappleback et al.Sep 11, 2024
+122
E
D
S
Sepsis is a clinical syndrome of life-threatening organ dysfunction caused by a dysregulated response to infection, for which disease heterogeneity is a major obstacle to developing targeted treatments. We have previously identified gene-expression-based patient subgroups (sepsis response signatures [SRS]) informative for outcome and underlying pathophysiology. Here, we aimed to investigate the role of genetic variation in determining the host transcriptomic response and to delineate regulatory networks underlying SRS. Using genotyping and RNA-sequencing data on 638 adult sepsis patients, we report 16,049 independent expression (eQTLs) and 32 co-expression module (modQTLs) quantitative trait loci in this disease context. We identified significant interactions between SRS and genotype for 1,578 SNP-gene pairs and combined transcription factor (TF) binding site information (SNP2TFBS) and predicted regulon activity (DoRothEA) to identify candidate upstream regulators. Overall, these approaches identified putative mechanistic links between host genetic variation, cell subtypes, and the individual transcriptomic response to infection.
0

Integrative analysis of the plasma proteome and polygenic risk of cardiometabolic diseases

Scott Ritchie et al.May 7, 2020
+22
M
S
S
Polygenic risk scores (PRSs) capture the genetic architecture of common diseases by aggregating genome-wide genetic variation into a single score that reflects an individual’s disease risk. These present new opportunities to identify molecular pathways involved in disease pathogenesis. We performed association analysis between PRSs and 3,442 plasma proteins in 3,175 healthy individuals, identifying 48 proteins whose levels associated with PRSs for coronary artery disease, chronic kidney disease, or type 2 diabetes. Integrative analyses of human and mouse data to characterise these associations revealed a role for polygenic effects on several well-known causal disease proteins and identified promising novel targets for future follow-up. We found implicated PRS-associated genes were responsive to dietary intervention in mice and showed strong evidence of druggability in humans, consistent with PRS-associated proteins having therapeutic potential. Overall, our study provides a framework for polygenic association studies, demonstrating the power of PRSs to unravel novel disease biology.
0

Personalized and graph genomes reveal missing signal in epigenomic data

Cristian Groza et al.May 7, 2020
+2
N
T
C
Background Epigenomic studies that use next generation sequencing experiments typically rely on the alignment of reads to a reference sequence. However, because of genetic diversity and the diploid nature of the human genome, we hypothesized that using a generic reference could lead to incorrectly mapped reads and bias downstream results.Results We show that accounting for genetic variation using a modified reference genome (MPG) or a denovo assembled genome (DPG) can alter histone H3K4me1 and H3K27ac ChIP-seq peak calls by either creating new personal peaks or by the loss of reference peaks. MPGs are found to alter approximately 1% of peak calls while DPGs alter up to 5% of peaks. We also show statistically significant differences in the amount of reads observed in regions associated with the new, altered and unchanged peaks. We report that short insertions and deletions (indels), followed by single nucleotide variants (SNVs), have the highest probability of modifying peak calls. A counter-balancing factor is peak width, with wider calls being less likely to be altered. Next, because high-quality DPGs remain hard to obtain, we show that using a graph personalized genome (GPG), represents a reasonable compromise between MPGs and DPGs and alters about 2.5% of peak calls. Finally, we demonstrate that altered peaks have a genomic distribution typical of other peaks. For instance, for H3K4me1, 518 personal-only peaks were replicated using at least two of three approaches, 394 of which were inside or within 10Kb of a gene.Conclusions Analysing epigenomic datasets with personalized and graph genomes allows the recovery of new peaks enriched for indels and SNVs. These altered peaks are more likely to differ between individuals and, as such, could be relevant in the study of various human phenotypes.
0

Network-based metabolite ratios for an improved functional characterization of genome-wide association study results

Jan Krumsiek et al.May 7, 2020
+5
K
F
J
Genome-wide association studies (GWAS) with metabolite ratios as quantitative traits have successfully deepened our understanding of the complex relationship between genetic variants and metabolic phenotypes. Usually all ratio combinations are selected for association tests. However, with more metabolites being detectable, the quadratic increase of the ratio number becomes challenging from a statistical, computational and interpretational point-of-view. Therefore methods which select biologically meaningful ratios are required. We here present a network-based approach by selecting only closely connected metabolites in a given metabolic network. The feasibility of this approach was tested on in silico data derived from simulated reaction networks. Especially for small effect sizes, network-based metabolite ratios (NBRs) improved the metabolite-based prediction accuracy of genetically-influenced reactions compared to the 'all ratios' approach. Evaluating the NBR approach on published GWAS association results, we compared reported 'all ratio'-SNP hits with results obtained by selecting only NBRs as candidates for association tests. Input networks for NBR selection were derived from public pathway databases or reconstructed from metabolomics data. NBR-candidates covered more than 80% of all significant ratio-SNP associations and we could replicate 7 out of 10 new associations predicted by the NBR approach. In this study we evaluated a network-based approach to select biologically meaningful metabolite ratios as quantitative traits in GWAS. Taking metabolic network information into account facilitated the analysis and the biochemical interpretation of metabolite-gene association results. For upcoming studies, for instance with case-control design, large-scale metabolomics data and small sample numbers, the analysis of all possible metabolite ratios is not feasible due to the correction for multiple testing. Here our NBR approach increases the statistical power and lowers computational demands, allowing for a better understanding of the complex interplay between individual phenotypes, genetics and metabolic profiles.
0

Learning polygenic scores for human blood cell traits

Yu Xu et al.May 7, 2020
+10
S
D
Y
Polygenic scores (PGSs) for blood cell traits can be constructed using summary statistics from genome-wide association studies. As the selection of variants and the modelling of their interactions in PGSs may be limited by univariate analysis, therefore, such a conventional method may yield sub-optional performance. This study evaluated the relative effectiveness of four machine learning and deep learning methods, as well as a univariate method, in the construction of PGSs for 26 blood cell traits, using data from UK Biobank (n=~400,000) and INTERVAL (n=~40,000). Our results showed that learning methods can improve PGSs construction for nearly every blood cell trait considered, with this superiority explained by the ability of machine learning methods to capture interactions among variants. This study also demonstrated that populations can be well stratified by the PGSs of these blood cell traits, even for traits that exhibit large differences between ages and sexes, suggesting potential for disease prevention. As our study found genetic correlations between the PGSs for blood cell traits and PGSs for several common human diseases (recapitulating well-known associations between the blood cell traits themselves and certain diseases), it suggests that blood cell traits may be indicators or/and mediators for a variety of common disorders via shared genetic variants and functional pathways.
Load More