MP
Milton Pividori
Author with expertise in Genomic Studies and Association Analyses
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
12
(67% Open Access)
Cited by:
589
h-index:
13
/
i10-index:
15
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

Integrating predicted transcriptome from multiple tissues improves association detection

Alvaro Barbeira et al.Jan 22, 2019
Integration of genome-wide association studies (GWAS) and expression quantitative trait loci (eQTL) studies is needed to improve our understanding of the biological mechanisms underlying GWAS hits, and our ability to identify therapeutic targets. Gene-level association methods such as PrediXcan can prioritize candidate targets. However, limited eQTL sample sizes and absence of relevant developmental and disease context restrict our ability to detect associations. Here we propose an efficient statistical method (MultiXcan) that leverages the substantial sharing of eQTLs across tissues and contexts to improve our ability to identify potential target genes. MultiXcan integrates evidence across multiple panels using multivariate regression, which naturally takes into account the correlation structure. We apply our method to simulated and real traits from the UK Biobank and show that, in realistic settings, we can detect a larger set of significantly associated genes than using each panel separately. To improve applicability, we developed a summary result-based extension called S-MultiXcan, which we show yields highly concordant results with the individual level version when LD is well matched. Our multivariate model-based approach allowed us to use the individual level results as a gold standard to calibrate and develop a robust implementation of the summary-based extension. Results from our analysis as well as software and necessary resources to apply our method are publicly available.
1
Citation295
0
Save
0

Shared and distinct genetic risk factors for childhood-onset and adult-onset asthma: genome-wide and transcriptome-wide studies

Milton Pividori et al.Apr 27, 2019
Background Childhood-onset and adult-onset asthma differ with respect to severity and comorbidities. Whether they also differ with respect to genetic risk factors has not been previously investigated in large samples. The goals of this study were to identify shared and distinct genetic risk loci for childhood-onset and adult-onset asthma, and to identify the genes that might mediate the effects of associated variation. Methods We did genome-wide and transcriptome-wide studies, using data from the UK Biobank, in individuals with asthma, including adults with childhood-onset asthma (onset before 12 years of age), adults with adult-onset asthma (onset between 26 and 65 years of age), and adults without asthma (controls; aged older than 38 years). We did genome-wide association studies (GWAS) for childhood-onset asthma and adult-onset asthma each compared with shared controls, and for age of asthma onset in all asthma cases, with a genome-wide significance threshold of p<5 × 10−8. Enrichment studies determined the tissues in which genes at GWAS loci were most highly expressed, and PrediXcan, a transcriptome-wide gene-based test, was used to identify candidate risk genes. Findings Of 376 358 British white individuals from the UK Biobank, we included 37 846 with self-reports of doctor-diagnosed asthma: 9433 adults with childhood-onset asthma; 21 564 adults with adult-onset asthma; and an additional 6849 young adults with asthma with onset between 12 and 25 years of age. For the first and second GWAS analyses, 318 237 individuals older than 38 years without asthma were used as controls. We detected 61 independent asthma loci: 23 were childhood-onset specific, one was adult-onset specific, and 37 were shared. 19 loci were associated with age of asthma onset. The most significant asthma-associated locus was at 17q12 (odds ratio 1·406, 95% CI 1·365–1·448; p=1·45 × 10−111) in the childhood-onset GWAS. Genes at the childhood onset-specific loci were most highly expressed in skin, blood, and small intestine; genes at the adult onset-specific loci were most highly expressed in lung, blood, small intestine, and spleen. PrediXcan identified 113 unique candidate genes at 22 of the 61 GWAS loci. Single-nucleotide polymorphism-based heritability estimates were more than three times larger for childhood-onset asthma (0·327) than for adult-onset disease (0·098). The onset of disease in childhood was associated with additional genes with relatively large effect sizes, with the largest odds ratio observed at the FLG locus at 1q21.3 (1·970, 95% CI 1·823–2·129). Interpretation Genetic risk factors for adult-onset asthma are largely a subset of the genetic risk for childhood-onset asthma but with overall smaller effects, suggesting a greater role for non-genetic risk factors in adult-onset asthma. Combined with gene expression and tissue enrichment patterns, we suggest that the establishment of disease in children is driven more by dysregulated allergy and epithelial barrier function genes, whereas the cause of adult-onset asthma is more lung-centred and environmentally determined, but with immune-mediated mechanisms driving disease progression in both children and adults. Funding US National Institutes of Health.
0
Citation267
0
Save
0

Integrating Predicted Transcriptome From Multiple Tissues Improves Association Detection

Alvaro Barbeira et al.Mar 31, 2018
Abstract Integration of genome-wide association studies (GWAS) and expression quantitative trait loci (eQTL) studies is needed to improve our understanding of the biological mechanisms underlying GWAS hits, and our ability to identify therapeutic targets. Gene-level association test methods such as PrediXcan can prioritize candidate targets. However, limited eQTL sample sizes and absence of relevant developmental and disease context restricts our ability to detect associations. Here we propose an efficient statistical method that leverages the substantial sharing of eQTLs across tissues and contexts to improve our ability to identify potential target genes: MulTiXcan. MulTiXcan integrates evidence across multiple panels while taking into account their correlation. We apply our method to a broad set of complex traits available from the UK Biobank and show that we can detect a larger set of significantly associated genes than using each panel separately. To improve applicability, we developed an extension to work on summary statistics: S-MulTiXcan, which we show yields highly concordant results with the individual level version. Results from our analysis as well as software and necessary resources to apply our method are publicly available.
0
Citation8
0
Save
43

Polygenic transcriptome risk scores improve portability of polygenic risk scores across ancestries

Yanyu Liang et al.Nov 13, 2020
Abstract Polygenic risk scores (PRS) are on course to translate the results of genome-wide association studies (GWAS) into clinical practice. To date, most GWAS have been based on individuals of European-ancestry, meaning that the utility of PRS for non-European populations is limited because SNP effects and LD patterns may not be conserved across populations. We hypothesized that cross population prediction at the level of genes rather than SNPs would be more effective, since the effect of genes on traits is likely to be more highly conserved. Therefore, we developed a framework to convert effect sizes at SNPs into effect sizes for genetically predicted transcript abundance, which we used for prediction in non-European populations. We compared this approach, which we call polygenic transcriptome risk scores (PTRS), to PRS, using data from 17 quantitative traits that were measured in multiple ancestries (European, African, East Asian, and South Asian) by UK Biobank. On average, PTRS using whole blood predicted transcriptome had lower absolute prediction accuracy than PRS, as we expected since not all regulatory processes were captured by a single tissue. However, as hypothesized, we found that in the African target set, the portability (prediction accuracy relative to the European reference set) was significantly higher for PTRS than PRS (p=0.03) with additional gain when transcriptomic prediction models ancestry matched the target population (p=0.021). Taken together, our results suggest that using PTRS can improve prediction in underrepresented populations and that increasing the diversity of transcriptomic data may be an effective way to improve portability of GWAS results between populations and help reduce health disparities.
43
Citation7
0
Save
41

An efficient not-only-linear correlation coefficient based on machine learning

Milton Pividori et al.Jun 17, 2022
Abstract Correlation coefficients are widely used to identify patterns in data that may be of particular interest. In transcriptomics, genes with correlated expression often share functions or are part of disease-relevant biological processes. Here we introduce the Clustermatch Correlation Coefficient (CCC), an efficient, easy-to-use and not-only-linear coefficient based on machine learning models. CCC reveals biologically meaningful linear and nonlinear patterns missed by standard, linear-only correlation coefficients. CCC captures general patterns in data by comparing clustering solutions while being much faster than state-of-the-art coefficients such as the Maximal Information Coefficient. When applied to human gene expression data, CCC identifies robust linear relationships while detecting nonlinear patterns associated, for example, with sex differences that are not captured by linear-only coefficients. Gene pairs highly ranked by CCC were enriched for interactions in integrated networks built from protein-protein interaction, transcription factor regulation, and chemical and genetic perturbations, suggesting that CCC could detect functional relationships that linear-only methods missed. CCC is a highly-efficient, next-generation not-only-linear correlation coefficient that can readily be applied to genome-scale data and other domains across different data types.
41
Citation4
0
Save
0

A publishing infrastructure for Artificial Intelligence (AI)-assisted academic authoring

Milton Pividori et al.Jun 14, 2024
Abstract Objective Investigate the use of advanced natural language processing models to streamline the time-consuming process of writing and revising scholarly manuscripts. Materials and Methods For this purpose, we integrate large language models into the Manubot publishing ecosystem to suggest revisions for scholarly texts. Our AI-based revision workflow employs a prompt generator that incorporates manuscript metadata into templates, generating section-specific instructions for the language model. The model then generates revised versions of each paragraph for human authors to review. We evaluated this methodology through 5 case studies of existing manuscripts, including the revision of this manuscript. Results Our results indicate that these models, despite some limitations, can grasp complex academic concepts and enhance text quality. All changes to the manuscript are tracked using a version control system, ensuring transparency in distinguishing between human- and machine-generated text. Conclusions Given the significant time researchers invest in crafting prose, incorporating large language models into the scholarly writing process can significantly improve the type of knowledge work performed by academics. Our approach also enables scholars to concentrate on critical aspects of their work, such as the novelty of their ideas, while automating tedious tasks like adhering to specific writing styles. Although the use of AI-assisted tools in scientific authoring is controversial, our approach, which focuses on revising human-written text and provides change-tracking transparency, can mitigate concerns regarding AI’s role in scientific writing.
0
Citation3
0
Save
53

Projecting genetic associations through gene expression patterns highlights disease etiology and drug mechanisms

Milton Pividori et al.Jul 6, 2021
Abstract Genes act in concert with each other in specific contexts to perform their functions. Determining how these genes influence complex traits requires a mechanistic understanding of expression regulation across different conditions. It has been shown that this insight is critical for developing new therapies. In this regard, the role of individual genes in disease-relevant mechanisms can be hypothesized with transcriptome-wide association studies (TWAS), which have represented a significant step forward in testing the mediating role of gene expression in GWAS associations. However, modern models of the architecture of complex traits predict that gene-gene interactions play a crucial role in disease origin and progression. Here we introduce PhenoPLIER, a computational approach that maps gene-trait associations and pharmacological perturbation data into a common latent representation for a joint analysis. This representation is based on modules of genes with similar expression patterns across the same conditions. We observed that diseases were significantly associated with gene modules expressed in relevant cell types, and our approach was accurate in predicting known drug-disease pairs and inferring mechanisms of action. Furthermore, using a CRISPR screen to analyze lipid regulation, we found that functionally important players lacked TWAS associations but were prioritized in trait-associated modules by PhenoPLIER. By incorporating groups of co-expressed genes, PhenoPLIER can contextualize genetic associations and reveal potential targets missed by single-gene strategies.
53
Citation3
0
Save
1

Probabilistic Colocalization of Genetic Variants from Complex and Molecular Traits: Promise and Limitations

Abhay Hukku et al.Jul 1, 2020
Abstract Colocalization analysis has emerged as a powerful tool to uncover the overlapping of causal variants responsible for both molecular and complex disease phenotypes. The findings from colocalization analysis yield insights into the molecular pathways of complex diseases. In this paper, we conduct an in-depth investigation of the promise and limitations of the available colocalization analysis approaches. Focusing on variant-level colocalization approaches, we first establish the connections between various existing methods. We proceed to discuss the impacts of various controllable analytical factors and uncontrollable practical factors on outcomes of colocalization analysis through realistic simulations and real data examples. We identify a single analytical factor, the specification of prior enrichment levels, which can lead to severe inflation of false-positive colocalization findings. Meanwhile, the combination of many other analytical and practical factors all lead to diminished power. Consequently, we recommend the following strategies for the best practice of colocalization analysis: i) estimating prior enrichment level from the observed data; and ii) separating fine-mapping and colocalization analysis. Our analysis of 4,091 complex traits and the multi-tissue eQTL data from the GTEx (version 8) suggests that colocalizations of molecular QTLs and GWAS traits are widespread in many complex traits. However, only a small proportion can be confidently identified from currently available data due to a lack of power. Our findings should serve as an important benchmark for the current and future integrative genetic association analysis applications.
1
Citation2
0
Save
0

Shared and Distinct Genetic Risk Factors for Childhood Onset and Adult Onset Asthma: Genome- and Transcriptome-wide Studies

Milton Pividori et al.Sep 26, 2018
Background Childhood and adult onset asthma differ with respect to severity and co-morbidities. Whether they also differ with respect to genetic risk factors has not been previously investigated in large samples. The goals of this study were to identify shared and distinct genetic risk loci for childhood and adult onset asthma, and the genes that may mediate the effects of associated variation.Methods We used data from UK Biobank to conduct genome-wide association studies (GWASs) in 37,846 subjects with asthma, including 9,433 childhood onset cases (onset before age 12) and 21,564 adult onset cases (onset between ages 26 and 65), and 318,237 subjects without asthma (controls; older than age 38). We conducted GWASs for childhood onset asthma and adult onset asthma each compared to shared controls, and for age of asthma onset in all 37,846 asthma cases. Enrichment studies determined the tissues in which genes at GWAS loci were most highly expressed, and PrediXcan, a transcriptome-wide gene-based test, was used to identify candidate risk genes.Findings We detected 61 independent asthma loci: 23 were childhood onset specific, one was adult onset specific, and 37 were shared. Nineteen loci were associated with age of asthma onset. Genes at the childhood onset loci were most highly expressed in skin, blood and small intestine; genes at the adult onset loci were most highly expressed in lung, blood, small intestine and spleen. PrediXcan identified 113 unique candidate genes at 22 of the 61 GWAS loci.Interpretation Genetic risk factors for adult onset asthma are largely a subset of the genetic risk for childhood onset asthma but with overall smaller effects, suggesting a greater role for non-genetic risk factors in adult onset asthma. In contrast, the onset of disease in childhood is associated with additional genes with relatively large effect sizes, and SNP-based heritability estimates that are over 3-times larger than for adult onset disease. Combined with gene expression and tissue enrichment patterns, we suggest that the establishment of disease in children is driven more by dysregulated allergy and epithelial barrier function genes whereas the etiology of adult onset asthma is more lung-centered and environmentally determined, but with immune mediated mechanisms driving disease progression in both children and adults.Funding This work was supported by the National Institutes of Health grants R01 MH107666 and P30 DK20595 to HKI, R01 HL129735, R01 HL122712, P01 HL070831, and UG3 OD023282 to CO; NS was supported by T32 HL007605.Evidence before this study Genome-wide association studies in large samples that include both childhood onset and adult onset asthma have identified many loci associated with asthma risk. However, little was known about the shared or distinct effects of those or other loci on age of asthma onset, or about the genes that may mediate the effects of loci associated with childhoon and/or adult onset asthma.Added value of this study Leveraging the resources of UK Biobank, we identified loci with both age of onset specific effects and shared effects. We further showed a significantly greater contribution of genetic variation to childhood onset asthma, implying a greater role for environmental risk factors in adult onset asthma, and different biological pathways and tissue enrichments for genes at loci associated with childhood vs adult onset asthma.Implications of all the available evidence Our results suggest that childhood onset specific loci and those associated with age of onset play a role in disease initiation, whereas the other associated loci reflect shared mechanisms of disease progression. The childhood onset specific loci highlight skin as a primiary target tissue for early onset disease and support the idea that asthma in childhood is due to impaired barrier function in the skin and other epithelial surfaces.
Load More