VR
Vincent Reuter
Author with expertise in Genomic Landscape of Cancer and Mutational Signatures
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
8
(100% Open Access)
Cited by:
4,927
h-index:
27
/
i10-index:
36
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Forecasting life expectancy, years of life lost, and all-cause and cause-specific mortality for 250 causes of death: reference and alternative scenarios for 2016–40 for 195 countries and territories

Kyle Foreman et al.Oct 16, 2018
+35
A
N
K
Understanding potential trajectories in health and drivers of health is crucial to guiding long-term investments and policy implementation. Past work on forecasting has provided an incomplete landscape of future health scenarios, highlighting a need for a more robust modelling platform from which policy options and potential health trajectories can be assessed. This study provides a novel approach to modelling life expectancy, all-cause mortality and cause of death forecasts -and alternative future scenarios-for 250 causes of death from 2016 to 2040 in 195 countries and territories.We modelled 250 causes and cause groups organised by the Global Burden of Diseases, Injuries, and Risk Factors Study (GBD) hierarchical cause structure, using GBD 2016 estimates from 1990-2016, to generate predictions for 2017-40. Our modelling framework used data from the GBD 2016 study to systematically account for the relationships between risk factors and health outcomes for 79 independent drivers of health. We developed a three-component model of cause-specific mortality: a component due to changes in risk factors and select interventions; the underlying mortality rate for each cause that is a function of income per capita, educational attainment, and total fertility rate under 25 years and time; and an autoregressive integrated moving average model for unexplained changes correlated with time. We assessed the performance by fitting models with data from 1990-2006 and using these to forecast for 2007-16. Our final model used for generating forecasts and alternative scenarios was fitted to data from 1990-2016. We used this model for 195 countries and territories to generate a reference scenario or forecast through 2040 for each measure by location. Additionally, we generated better health and worse health scenarios based on the 85th and 15th percentiles, respectively, of annualised rates of change across location-years for all the GBD risk factors, income per person, educational attainment, select intervention coverage, and total fertility rate under 25 years in the past. We used the model to generate all-cause age-sex specific mortality, life expectancy, and years of life lost (YLLs) for 250 causes. Scenarios for fertility were also generated and used in a cohort component model to generate population scenarios. For each reference forecast, better health, and worse health scenarios, we generated estimates of mortality and YLLs attributable to each risk factor in the future.Globally, most independent drivers of health were forecast to improve by 2040, but 36 were forecast to worsen. As shown by the better health scenarios, greater progress might be possible, yet for some drivers such as high body-mass index (BMI), their toll will rise in the absence of intervention. We forecasted global life expectancy to increase by 4·4 years (95% UI 2·2 to 6·4) for men and 4·4 years (2·1 to 6·4) for women by 2040, but based on better and worse health scenarios, trajectories could range from a gain of 7·8 years (5·9 to 9·8) to a non-significant loss of 0·4 years (-2·8 to 2·2) for men, and an increase of 7·2 years (5·3 to 9·1) to essentially no change (0·1 years [-2·7 to 2·5]) for women. In 2040, Japan, Singapore, Spain, and Switzerland had a forecasted life expectancy exceeding 85 years for both sexes, and 59 countries including China were projected to surpass a life expectancy of 80 years by 2040. At the same time, Central African Republic, Lesotho, Somalia, and Zimbabwe had projected life expectancies below 65 years in 2040, indicating global disparities in survival are likely to persist if current trends hold. Forecasted YLLs showed a rising toll from several non-communicable diseases (NCDs), partly driven by population growth and ageing. Differences between the reference forecast and alternative scenarios were most striking for HIV/AIDS, for which a potential increase of 120·2% (95% UI 67·2-190·3) in YLLs (nearly 118 million) was projected globally from 2016-40 under the worse health scenario. Compared with 2016, NCDs were forecast to account for a greater proportion of YLLs in all GBD regions by 2040 (67·3% of YLLs [95% UI 61·9-72·3] globally); nonetheless, in many lower-income countries, communicable, maternal, neonatal, and nutritional (CMNN) diseases still accounted for a large share of YLLs in 2040 (eg, 53·5% of YLLs [95% UI 48·3-58·5] in Sub-Saharan Africa). There were large gaps for many health risks between the reference forecast and better health scenario for attributable YLLs. In most countries, metabolic risks amenable to health care (eg, high blood pressure and high plasma fasting glucose) and risks best targeted by population-level or intersectoral interventions (eg, tobacco, high BMI, and ambient particulate matter pollution) had some of the largest differences between reference and better health scenarios. The main exception was sub-Saharan Africa, where many risks associated with poverty and lower levels of development (eg, unsafe water and sanitation, household air pollution, and child malnutrition) were projected to still account for substantive disparities between reference and better health scenarios in 2040.With the present study, we provide a robust, flexible forecasting platform from which reference forecasts and alternative health scenarios can be explored in relation to a wide range of independent drivers of health. Our reference forecast points to overall improvements through 2040 in most countries, yet the range found across better and worse health scenarios renders a precarious vision of the future-a world with accelerating progress from technical innovation but with the potential for worsening health outcomes in the absence of deliberate policy action. For some causes of YLLs, large differences between the reference forecast and alternative scenarios reflect the opportunity to accelerate gains if countries move their trajectories toward better health scenarios-or alarming challenges if countries fall behind their reference forecasts. Generally, decision makers should plan for the likely continued shift toward NCDs and target resources toward the modifiable risks that drive substantial premature mortality. If such modifiable risks are prioritised today, there is opportunity to reduce avoidable mortality in the future. However, CMNN causes and related risks will remain the predominant health priority among lower-income countries. Based on our 2040 worse health scenario, there is a real risk of HIV mortality rebounding if countries lose momentum against the HIV epidemic, jeopardising decades of progress against the disease. Continued technical innovation and increased health spending, including development assistance for health targeted to the world's poorest people, are likely to remain vital components to charting a future where all populations can live full, healthy lives.Bill & Melinda Gates Foundation.
0

The chromatin accessibility landscape of primary human cancers

M. Corces et al.Oct 26, 2018
+58
S
J
M
We present the genome-wide chromatin accessibility profiles of 410 tumor samples spanning 23 cancer types from The Cancer Genome Atlas (TCGA). We identify 562,709 transposase-accessible DNA elements that substantially extend the compendium of known cis-regulatory elements. Integration of ATAC-seq (the assay for transposase-accessible chromatin using sequencing) with TCGA multi-omic data identifies a large number of putative distal enhancers that distinguish molecular subtypes of cancers, uncovers specific driving transcription factors via protein-DNA footprints, and nominates long-range gene-regulatory interactions in cancer. These data reveal genetic risk loci of cancer predisposition as active DNA regulatory elements in cancer, identify gene-regulatory interactions underlying cancer immune evasion, and pinpoint noncoding mutations that drive enhancer activation and may affect patient survival. These results suggest a systematic approach to understanding the noncoding genome in cancer to advance diagnosis and therapy.
0
Citation954
0
Save
6

Genomic and Functional Approaches to Understanding Cancer Aneuploidy

Alison Taylor et al.Apr 1, 2018
+736
G
J
A
Aneuploidy, whole chromosome or chromosome arm imbalance, is a near-universal characteristic of human cancers. In 10,522 cancer genomes from The Cancer Genome Atlas, aneuploidy was correlated with TP53 mutation, somatic mutation rate, and expression of proliferation genes. Aneuploidy was anti-correlated with expression of immune signaling genes, due to decreased leukocyte infiltrates in high-aneuploidy samples. Chromosome arm-level alterations show cancer-specific patterns, including loss of chromosome arm 3p in squamous cancers. We applied genome engineering to delete 3p in lung cells, causing decreased proliferation rescued in part by chromosome 3 duplication. This study defines genomic and phenotypic correlates of cancer aneuploidy and provides an experimental approach to study chromosome arm aneuploidy.
6
Citation873
0
Save
4

Pathogenic Germline Variants in 10,389 Adult Cancers

Kuan‐lin Huang et al.Apr 1, 2018
+755
J
M
K
We conducted the largest investigation of predisposition variants in cancer to date, discovering 853 pathogenic or likely pathogenic variants in 8% of 10,389 cases from 33 cancer types. Twenty-one genes showed single or cross-cancer associations, including novel associations of SDHA in melanoma and PALB2 in stomach adenocarcinoma. The 659 predisposition variants and 18 additional large deletions in tumor suppressors, including ATM, BRCA1, and NF1, showed low gene expression and frequent (43%) loss of heterozygosity or biallelic two-hit events. We also discovered 33 such variants in oncogenes, including missenses in MET, RET, and PTPN11 associated with high gene expression. We nominated 47 additional predisposition variants from prioritized VUSs supported by multiple evidences involving case-control frequency, loss of heterozygosity, expression effect, and co-localization with mutations and modified residues. Our integrative approach links rare predisposition variants to functional consequences, informing future guidelines of variant classification and germline genetic testing in cancer.
4
Citation687
0
Save
4

A Comprehensive Pan-Cancer Molecular Study of Gynecologic and Breast Cancers

Zhenlin Ju et al.Apr 1, 2018
+740
S
H
Z
We analyzed molecular data on 2,579 tumors from The Cancer Genome Atlas (TCGA) of four gynecological types plus breast. Our aims were to identify shared and unique molecular features, clinically significant subtypes, and potential therapeutic targets. We found 61 somatic copy-number alterations (SCNAs) and 46 significantly mutated genes (SMGs). Eleven SCNAs and 11 SMGs had not been identified in previous TCGA studies of the individual tumor types. We found functionally significant estrogen receptor-regulated long non-coding RNAs (lncRNAs) and gene/lncRNA interaction networks. Pathway analysis identified subtypes with high leukocyte infiltration, raising potential implications for immunotherapy. Using 16 key molecular features, we identified five prognostic subtypes and developed a decision tree that classified patients into the subtypes based on just six features that are assessable in clinical laboratories.
4
Citation535
0
Save
26

Linking big biomedical datasets to modular analysis with Portable Encapsulated Projects

Nathan Sheffield et al.Oct 8, 2020
A
V
M
N
Organizing and annotating biological sample data is critical in data-intensive bioinformatics. Unfortunately, metadata formats from a data provider are often incompatible with requirements of a processing tool. There is no broadly accepted standard to organize metadata across biological projects and bioinformatics tools, restricting the portability and reusability of both annotated datasets and analysis software. To address this, we present Portable Encapsulated Projects (PEP), a formal specification for biological sample metadata structure. The PEP specification accommodates typical features of data-intensive bioinformatics projects with many samples, whether from individual experiments, organisms, or single cells. In addition to standardization, the PEP specification provides descriptors and modifiers for different organizational layers of a project, which improve portability among computing environments and facilitate use of different processing tools. PEP includes a schema validator framework, allowing formal definition of required metadata attributes for any type of biomedical data analysis. We have implemented packages for reading PEPs in both Python and R to provide a language-agnostic interface for organizing project metadata. PEP therefore presents an important step toward unifying data annotation and processing tools in data-intensive biological research projects.
0

Refgenie: a reference genome resource manager

Michał Stolarczyk et al.Jul 12, 2019
N
N
V
M
Reference genome assemblies are essential for high-throughput sequencing analysis projects. Typically, genome assemblies are stored on disk alongside related resources; for example, many sequence aligners require the assembly to be indexed . The resulting indexes are broadly applicable for downstream analysis, so it makes sense to share them. However, there is no simple tool to do this. To this end, we introduce refgenie, a reference genome assembly asset manager. Refgenie makes it easier to organize, retrieve, and share genome analysis resources. In addition to genome indexes, refgenie can manage any files related to reference genomes, including sequences and annotation files. Refgenie includes a command-line interface and a server application that provides a RESTful API, so it is useful for both tool development and analysis. Availability https://refgenie.databio.org
0
Citation5
0
Save
11

PEPATAC: An optimized pipeline for ATAC-seq data analysis with serial alignments

Jason Smith et al.Oct 22, 2020
+3
J
M
J
Motivation As chromatin accessibility data from ATAC-seq experiments continues to expand, there is continuing need for standardized analysis pipelines. Here, we present PEPATAC, an ATAC-seq pipeline that is easily applied to ATAC-seq projects of any size, from one-off experiments to large-scale sequencing projects. Results PEPATAC leverages unique features of ATAC-seq data to optimize for speed and accuracy, and it provides several unique analytical approaches. Output includes convenient quality control plots, summary statistics, and a variety of generally useful data formats to set the groundwork for subsequent project-specific data analysis. Downstream analysis is simplified by a standard definition format, modularity of components, and metadata APIs in R and Python. It is restartable, fault-tolerant, and can be run on local hardware, using any cluster resource manager, or in provided Linux containers. We also demonstrate the advantage of aligning to the mitochondrial genome serially, which improves the accuracy of alignment statistics and quality control metrics. PEPATAC is a robust and portable first step for any ATAC-seq project. Availability BSD2-licensed code and documentation at https://pepatac.databio.org .