DP
Dmitry Prokopenko
Author with expertise in Genomic Studies and Association Analyses
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
19
(68% Open Access)
Cited by:
313
h-index:
24
/
i10-index:
44
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Genetic landscape of chronic obstructive pulmonary disease identifies heterogeneous cell-type and phenotype associations

Phuwanat Sakornsakolpat et al.Feb 25, 2019
+95
M
D
P
Chronic obstructive pulmonary disease (COPD) is the leading cause of respiratory mortality worldwide. Genetic risk loci provide new insights into disease pathogenesis. We performed a genome-wide association study in 35,735 cases and 222,076 controls from the UK Biobank and additional studies from the International COPD Genetics Consortium. We identified 82 loci associated with P < 5 × 10
0
Citation292
0
Save
0

New genetic signals for lung function highlight pathways and pleiotropy, and chronic obstructive pulmonary disease associations across multiple ancestries

Nick Shrine et al.Jun 12, 2018
+110
Z
J
N
Abstract Reduced lung function predicts mortality and is key to the diagnosis of COPD. In a genome-wide association study in 400,102 individuals of European ancestry, we define 279 lung function signals, one-half of which are new. In combination these variants strongly predict COPD in deeply-phenotyped patient populations. Furthermore, the combined effect of these variants showed generalisability across smokers and never-smokers, and across ancestral groups. We highlight biological pathways, known and potential drug targets for COPD and, in phenome-wide association studies, autoimmune-related and other pleiotropic effects of lung function associated variants. This new genetic evidence has potential to improve future preventive and therapeutic strategies for COPD.
0
Citation9
0
Save
1

Single-cell multiregion dissection of Alzheimer’s disease

Hansruedi Mathys et al.Jul 24, 2024
+17
L
C
H
Abstract Alzheimer’s disease is the leading cause of dementia worldwide, but the cellular pathways that underlie its pathological progression across brain regions remain poorly understood 1–3 . Here we report a single-cell transcriptomic atlas of six different brain regions in the aged human brain, covering 1.3 million cells from 283 post-mortem human brain samples across 48 individuals with and without Alzheimer’s disease. We identify 76 cell types, including region-specific subtypes of astrocytes and excitatory neurons and an inhibitory interneuron population unique to the thalamus and distinct from canonical inhibitory subclasses. We identify vulnerable populations of excitatory and inhibitory neurons that are depleted in specific brain regions in Alzheimer’s disease, and provide evidence that the Reelin signalling pathway is involved in modulating the vulnerability of these neurons. We develop a scalable method for discovering gene modules, which we use to identify cell-type-specific and region-specific modules that are altered in Alzheimer’s disease and to annotate transcriptomic differences associated with diverse pathological variables. We identify an astrocyte program that is associated with cognitive resilience to Alzheimer’s disease pathology, tying choline metabolism and polyamine biosynthesis in astrocytes to preserved cognitive function late in life. Together, our study develops a regional atlas of the ageing human brain and provides insights into cellular vulnerability, response and resilience to Alzheimer’s disease pathology.
1
Citation7
0
Save
4

TMEM106B and CPOX are genetic determinants of cerebrospinal fluid Alzheimer’s disease biomarker levels

Shengjun Hong et al.Jun 1, 2020
+35
I
V
S
Abstract Background Neurofilament light (NF-L), chitinase-3-like protein 1 (YKL-40), and neurogranin (Ng) are utilized as biomarkers for Alzheimer’s disease (AD), to monitor axonal damage, astroglial activation, and synaptic degeneration, respectively. Here we performed genome-wide association study (GWAS) analyses using all three biomarkers as outcome. Methods DNA and cerebrospinal fluid (CSF) samples originated from the European Medical Information Framework AD Multimodal Biomarker Discovery (EMIF-AD MBD) study. Overlapping genotype/phenotype data were available for n=671 (NF-L), 677 (YKL-40), and 672 (Ng) individuals. GWAS analyses applied linear regression models adjusting for relevant covariates. Findings We identify novel genome-wide significant associations with markers in TMEM106B and CSF levels of NF-L. Additional novel signals were observed with DNA variants in CPOX and CSF levels of YKL-40. Lastly, we confirmed previous work suggesting that YKL-40 levels are regulated by cis protein quantitative trait loci (pQTL) in CHI3L1 . Interpretation Our study provides important new insights into the genetic architecture underlying inter-individual variation in all three tested AD-related CSF biomarkers. In particular, our data shed light on the sequence of events regarding the initiation and progression of neuropathological processes relevant in AD.
4
Citation2
0
Save
0

Chronic Obstructive Pulmonary Disease Exacerbations Increase the Risk of Subsequent Cardiovascular Events: A Longitudinal Analysis of the COPDGene Study

Han‐Mo Yang et al.May 31, 2024
+83
V
M
H
Background Cardiovascular disease (CVD) is the most important comorbidity in patients with chronic obstructive pulmonary disease (COPD). COPD exacerbations not only contribute to COPD progression but may also elevate the risk of CVD. This study aimed to determine whether COPD exacerbations increase the risk of subsequent CVD events using up to 15 years of prospective longitudinal follow‐up data from the COPDGene (Genetic Epidemiology of Chronic Obstructive Pulmonary Disease) study. Methods and Results The COPDGene study is a large, multicenter, longitudinal investigation of COPD, including subjects at enrollment aged 45 to 80 years with a minimum of 10 pack‐years of smoking history. Cox proportional hazards models and Kaplan‐Meier survival curves were used to assess the risk of a composite end point of CVD based on the COPD exacerbation rate. Frequent exacerbators exhibited a higher cumulative incidence of composite CVD end points than infrequent exacerbators, irrespective of the presence of CVD at baseline. After adjusting for covariates, frequent exacerbators still maintained higher hazard ratios (HRs) than the infrequent exacerbator group (without CVD: HR, 1.81 [95% CI, 1.47–2.22]; with CVD: HR, 1.92 [95% CI, 1.51–2.44]). This observation remained consistently significant in moderate to severe COPD subjects and the preserved ratio impaired spirometry population. In the mild COPD population, frequent exacerbators showed a trend toward more CVD events. Conclusions COPD exacerbations are associated with an increased risk of subsequent cardiovascular events in subjects with and without preexisting CVD. Patients with COPD experiencing frequent exacerbations may necessitate careful monitoring and additional management for subsequent potential CVD. Registration URL: https://www.clinicaltrials.gov ; Unique identifier: NCT00608764.
0
Citation1
0
Save
0

Polygenic hazard score models for the prediction of Alzheimer’s free survival using the lasso for Cox’s proportional hazards model

Georg Hahn et al.Apr 22, 2024
+5
J
D
G
Abstract The prediction of the susceptibility of an individual to a certain disease is an important and timely research area. An established technique is to estimate the risk of an individual with the help of an integrated risk model, that is a polygenic risk score with added epidemiological covariates. However, integrated risk models do not capture any time dependence, and may provide a point estimate of the relative risk with respect to a reference population. The aim of this work is twofold. First, we explore and advocate the idea of predicting the time dependent hazard and survival (defined as disease free time) of an individual for the onset of a disease. This provides a practitioner with a much more differentiated view of the absolute survival as a function of time. Second, to compute the time dependent risk of an individual, we use published methodology to fit a Cox’s proportional hazard model to data from a genetic SNP study of time to Alzheimer’s disease (AD) onset, using the lasso to incorporate further epidemiological variables such as sex, APOE (apolipoprotein E, a genetic risk factor for AD) status, ten leading principal components, and selected genomic loci. We apply the lasso for Cox’s proportional hazards to a dataset of 6792 AD patients (composed of 4102 cases and 2690 controls) and 87 covariates. We demonstrate that fitting a lasso model for Cox’s proportional hazards allows one to obtain more accurate survival curves than with state-of-the-art (likelihood-based) methods. Moreover, the methodology allows one to obtain personalized survival curves for a patient, thus giving a much more differentiated view of the expected progression of a disease than the view offered by integrated risk models. The runtime to compute personalized survival curves is under a minute for the entire dataset of AD patients, thus enabling it to handle datasets with 60, 000 to 100, 000 subjects in less than one hour.
0
Paper
Citation1
0
Save
0

Reporting correct p-values in VEGAS analyses

Julian Hecker et al.Jan 17, 2017
+2
D
A
J
Abstract VEGAS (versatile gene-based association study) is a popular methodological framework to perform gene-based tests based on summary statistics from single-variant analyses. The approach incorporates linkage disequilibrium information from reference panels to account for the correlation of test statistics. The gene-based test can utilize three different types of tests. In 2015, the improved framework VEGAS2, using more detailed reference panels, was published. Both versions provide user-friendly web- and offline-based tools for the analysis. However, the implementation of the popular top-percentage test is erroneous in both versions. The p-values provided by VEGAS2 are deflated/anti-conservative. Based on real data examples, we demonstrate that this can increase substantially the rate of false positive findings and can lead to inconsistencies between different test options. We also provide code that allows the user of VEGAS to compute correct p-values.
0
Citation1
0
Save
0

Expanded genetic landscape of chronic obstructive pulmonary disease reveals heterogeneous cell type and phenotype associations

Phuwanat Sakornsakolpat et al.Jun 26, 2018
+53
M
D
P
Chronic obstructive pulmonary disease (COPD) is the leading cause of respiratory mortality worldwide. Genetic risk loci provide novel insights into disease pathogenesis. To broaden COPD genetic risk loci discovery and identify cell type and phenotype associations we performed a genome-wide association study in 35,735 cases and 222,076 controls from the UK Biobank and additional studies from the International COPD Genetics Consortium. We identified 82 loci with P value < 5x10-8; 47 were previously described in association with either COPD or population-based lung function. Of the remaining 35 novel loci, 13 were associated with lung function in 79,055 individuals from the SpiroMeta consortium. Using gene expression and regulation data, we identified enrichment for loci in lung tissue, smooth muscle and alveolar type II cells. We found 9 shared genomic regions between COPD and asthma and 5 between COPD and pulmonary fibrosis. COPD genetic risk loci clustered into groups of quantitative imaging features and comorbidity associations. Our analyses provide further support to the genetic susceptibility and heterogeneity of COPD.
0

Quantifying polygenic effects in genome-wide association studies using generalized estimating equations

Julian Hecker et al.Nov 25, 2015
H
D
C
J
Recently, LD Score regression1 has been proposed as a computationally fast method to contrast confounding biases with polygenicity and to quantify their contribution to the inflation of test statistics in GWAS. In this communication, we extend the LD Score regression approach by applying the generalized estimation equations (GEE) framework, which is capable of incorporating more external information from reference panels about the correlation structure of test statistics. We apply our GEE approach and LD Score regression to simulated and real data to compare their performance. We show that our proposed methodology obtains more efficient estimates while preserving the robustness and desired properties of LD Score regression.
0

locStra: Fast analysis of regional/global stratification in whole genome sequencing (WGS) studies

Georg Hahn et al.Mar 8, 2020
+5
J
S
G
locStra is an R -package for the analysis of regional and global population stratification in whole genome sequencing studies, where regional stratification refers to the substructure defined by the loci in a particular region on the genome. Population substructure can be assessed based on the genetic covariance matrix, the genomic relationship matrix, and the unweighted/weighted genetic Jaccard similarity matrix. Using a sliding window approach, the regional similarity matrices are compared to the global ones, based on user-defined window sizes and metrics, e.g. the correlation between regional and global eigenvectors. An algorithm for the specification of the window size is provided. As the implementation fully exploits sparse matrix algebra and is written in C++, the analysis is highly efficient. Even on single cores, for realistic study sizes (several thousand subjects, several million RVs per subject), the runtime for the genome-wide computation of all regional similarity matrices does typically not exceed one hour, enabling an unprecedented investigation of regional stratification across the entire genome. The package is applied to three WGS studies, illustrating the varying patterns of regional substructure across the genome and its beneficial effects on association testing.
Load More