DZ
David Zhang
Author with expertise in Genomic Studies and Association Analyses
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
11
(64% Open Access)
Cited by:
25
h-index:
15
/
i10-index:
21
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Regulation of mitophagy by the NSL complex underlies genetic risk for Parkinson’s disease at Chr16q11.2 and on the MAPT H1 allele

Marc Soutar et al.Jan 7, 2020
ABSTRACT Parkinson’s disease (PD) is a common incurable neurodegenerative disease. The identification of genetic variants via genome-wide association studies (GWAS) has considerably advanced our understanding of the PD genetic risk. Understanding the functional significance of the risk loci is now a critical step towards translating these genetic advances into an enhanced biological understanding of the disease. Impaired mitophagy is a key causative pathway in familial PD, but its relevance to idiopathic PD is unclear. We used a mitophagy screening assay to evaluate the functional significance of risk genes identified through GWAS. We identified two new regulators of PINK1-mitophagy, KAT8 and KANSL1, previously shown to modulate lysine acetylation. We show that KAT8 and KANSL1 modulate PINK1 gene expression and subsequent PINK1-mitophagy. These findings suggest PINK1-mitophagy is a contributing factor to idiopathic PD. KANSL1 is located on chromosome 17q21 where the risk associated gene has long been considered to be MAPT . While our data does not exclude a possible association between the MAPT gene and PD, it provides strong evidence that KANSL1 plays a crucial role in the disease. Finally, these results enrich our understanding of physiological events regulating mitophagy and establish a novel pathway for drug targeting in neurodegeneration.
0
Citation11
0
Save
0

G2P: Using machine learning to understand and predict genes causing rare neurological disorders

Juan Botía et al.Mar 27, 2018
Abstract To facilitate precision medicine and neuroscience research, we developed a machine-learning technique that scores the likelihood that a gene, when mutated, will cause a neurological phenotype. We analysed 1126 genes relating to 25 subtypes of Mendelian neurological disease defined by Genomics England (March 2017) together with 154 gene-specific features capturing genetic variation, gene structure and tissue-specific expression and co-expression. We randomly re-sampled genes with no known disease association to develop bootstrapped decision-tree models, which were integrated to generate a decision tree-based ensemble for each disease subtype. Genes generating larger numbers of distinct transcripts and with higher probability of having missense mutations in normal individuals were significantly more likely to cause neurological diseases. Using mouse-mutant phenotypic data we tested the accuracy of gene-phenotype predictions and found that for 88% of all disease subtypes there was a significant enrichment of relevant phenotypic abnormalities when predicted genes were mutated in mice and in many cases mutations produced specific and matching phenotypes. Furthermore, using only newly identified genes included in the Genomics England November 2017 release, we assessed our gene-phenotype predictions and showed an 8.3 fold enrichment relative to chance for correct predictions. Thus, we demonstrate both the explanatory and predictive power of machine-learning-based models in neurological disease.
0
Citation8
0
Save
1

Rare coding variants in 35 genes associate with circulating lipid levels – a multi-ancestry analysis of 170,000 exomes

George Hindy et al.Dec 23, 2020
Abstract Large-scale gene sequencing studies for complex traits have the potential to identify causal genes with therapeutic implications. We performed gene-based association testing of blood lipid levels with rare (minor allele frequency<1%) predicted damaging coding variation using sequence data from >170,000 individuals from multiple ancestries: 97,493 European, 30,025 South Asian, 16,507 African, 16,440 Hispanic/Latino, 10,420 East Asian, and 1,182 Samoan. We identified 35 genes associated with circulating lipid levels. Ten of these: ALB , SRSF2 , JAK2, CREB3L3 , TMEM136 , VARS , NR1H3 , PLA2G12A , PPARG and STAB1 have not been implicated for lipid levels using rare coding variation in population-based samples. We prioritize 32 genes identified in array-based genome-wide association study (GWAS) loci based on gene-based associations, of which three: EVI5, SH2B3 , and PLIN1 , had no prior evidence of rare coding variant associations. Most of the associated genes showed evidence of association in multiple ancestries. Also, we observed an enrichment of gene-based associations for low-density lipoprotein cholesterol drug target genes, and for genes closest to GWAS index single nucleotide polymorphisms (SNP). Our results demonstrate that gene-based associations can be beneficial for drug target development and provide evidence that the gene closest to the array-based GWAS index SNP is often the functional gene for blood lipid levels.
1
Citation4
0
Save
50

Whole genome sequence analysis of blood lipid levels in >66,000 individuals

Margaret Selvaraj et al.Oct 12, 2021
Abstract Plasma lipids are heritable modifiable causal factors for coronary artery disease, the leading cause of death globally. Despite the well-described monogenic and polygenic bases of dyslipidemia, limitations remain in discovery of lipid-associated alleles using whole genome sequencing, partly due to limited sample sizes, ancestral diversity, and interpretation of potential clinical significance. Increasingly larger whole genome sequence datasets with plasma lipids coupled with methodologic advances enable us to more fully catalog the allelic spectrum for lipids. Here, among 66,329 ancestrally diverse (56% non-European ancestry) participants, we associate 428M variants from deep-coverage whole genome sequences with plasma lipids. Approximately 400M of these variants were not studied in prior lipids genetic analyses. We find multiple lipid-related genes strongly associated with plasma lipids through analysis of common and rare coding variants. We additionally discover several significantly associated rare non-coding variants largely at Mendelian lipid genes. Notably, we detect rare LDLR intronic variants associated with markedly increased LDL-C, similar to rare LDLR exonic variants. In conclusion, we conducted a systematic whole genome scan for plasma lipids expanding the alleles linked to lipids for multiple ancestries and characterize a clinically-relevant rare non-coding variant model for lipids.
50
Citation2
0
Save
0

The efficacy of obesity polygenic risk scores in an autistic population

David Zhang et al.Nov 9, 2019
Polygenic risk scores (PRS) bear great promise in understanding complex diseases and improving clinical diagnoses, but the competency of these risk scores in different populations is known to vary significantly, especially between those of European ancestry and those of other ethnic ancestries. However, the applicability of these risk scores across populations different by disease, instead of ethnicity, is poorly understood. A current and largely unexplored population for the accuracy of PRS is that of individuals with autism. Combined with the increased prevalence of obesity in autistic populations, we seek to evaluate the difference in efficacy of PRS for obesity in autistic versus non-autistic populations. We show that genetic variants strongly associated with obesity in non-autistic populations are significantly less representative of the disease in autistic populations. Rather, these cases of obesity phenocopies in patients with autism may follow a different and non-conventional mechanism of action involving the regulation of oxytocin in the brain among other potential behavioral factors. Our findings elucidate the limits of PRS across populations contrasting by disease and suggest that obesity may be regulated differently in individuals with autism as compared to those without autism.
0

Integration of eQTL and Parkinson's disease GWAS data implicates 11 disease genes

Demis Kia et al.May 5, 2019
Substantial genome-wide association study (GWAS) work in Parkinson's disease (PD) has led to an increasing number of loci shown reliably and robustly to be associated with the increased risk of the disease. Prioritising causative genes and pathways from these studies has proven problematic. Here, we present a comprehensive analysis of PD GWAS data with expression and methylation quantitative trait loci (eQTL/mQTL) using Colocalisation analysis (Coloc) and transcriptome-wide association analysis (TWAS) to uncover putative gene expression and splicing mechanisms driving PD GWAS signals. Candidate genes were further characterised by determining cell-type specificity, weighted gene co-expression (WGNCA) and protein-protein interaction (PPI) networks. Gene-level analysis of expression revealed 5 genes (WDR6, CD38, GPNMB, RAB29, TMEM163) that replicated using both Coloc and TWAS analyses in both GTEx and Braineac expression datasets. A further 6 genes (ZRANB3, PCGF3, NEK1, NUPL2, GALC, CTSB) showed evidence of disease-associated splicing effects. Cell-type specificity analysis revealed that gene expression was overall more prevalent in glial cell-types compared to neurons. The WGNCA analysis showed that NUPL2 is a key gene in 3 modules implicated in catabolic processes related with protein ubiquitination (protein ubiquitination (p=7.47e-10) and ubiquitin-dependent protein catabolic process (p = 2.57e-17) in nucleus accumbens, caudate and putamen, while TMEM163 and ZRANB3 were both important in modules indicating regulation of signalling (p=1.33e-65] and cell communication (p=7.55e-35) in the frontal cortex and caudate respectively. PPI analysis and simulations using random networks demonstrated that the candidate genes interact significantly more with known Mendelian PD and parkinsonism proteins than would be expected by chance. The proteins core proteins this network were enriched for regulation of the ERBB receptor tyrosine protein kinase signalling pathways. Together, these results point to a number of candidate genes and pathways that are driving the associations observed in PD GWAS studies.
0

Genetic variation within genes associated with mitochondrial function is significantly associated with later age at onset of Parkinson disease and contributes to disease risk

Kimberley Billingsley et al.Dec 4, 2018
ABSTRACT Mitochondrial dysfunction has been implicated in the aetiology of monogenic Parkinson’s disease (PD). Yet the role that mitochondrial processes play in the most common form of the disease; sporadic PD, is yet to be fully established. Here we comprehensively assessed the role of mitochondrial function associated genes in sporadic PD by leveraging improvements in the scale and analysis of PD GWAS data with recent advances in our understanding of the genetics of mitochondrial disease. First, we identified that a proportion of the “missing heritability” of the PD can be explained by common variation within genes implicated in mitochondrial disease (primary gene list) and mitochondrial function (secondary gene list). Next we calculated a mitochondrial-specific polygenic risk score (PRS) and showed that cumulative small effect variants within both our primary and secondary gene lists are significantly associated with increased PD risk. Most significantly we further report that the PRS of the secondary mitochondrial gene list was significantly associated with later age at onset. Finally, to identify possible functional genomic associations we implemented Mendelian randomisation, which showed that 14 of these mitochondrial function associated genes showed functional consequence associated with PD risk. Further analysis suggested that the 14 identified genes are not only involved in mitophagy but implicate new mitochondrial processes. Our data suggests that therapeutics targeting mitochondrial bioenergetics and proteostasis pathways distinct from mitophagy could be beneficial to treating the early stage of PD.
3

MEIG1/PACRG associated and non-associated functions of axonemal dynein light intermediate polypeptide 1 (DNALI1) in mammalian spermatogenesis

Yi Yap et al.Apr 30, 2022
Abstract Axonemal dynein light intermediate polypeptide 1 (DNALI1) was originally cloned from Chlamydomonas reinhardtii in an effort to find motor proteins essential for flagellar motility. Here we report that DNALI1 is a binding partner of parkin co-regulated gene 1 (PACRG), which forms a complex with meiosis expressed gene 1 (MEIG1) in the manchette, a transient and unique structure only present in the elongating spermatids and required for normal spermiogenesis of the male germ cell differentiation process. DNALI1 recruits the PACRG protein in transfected CHO cells, and also stabilizes PACRG in bacteria and transfected mammalian cells. The untagged DNALI1 could also be co-purified with His-tagged PACRG in the gel filtration assay. Immunofluorescence staining on isolated male germ cells revealed that DNALI1 was present in the manchette of elongating spermatids, and colocalized with PACRG in this structure. In Pacrg mutant mice, localization of DNALI1 in the manchette was not changed, suggesting that DNALI1 and PACRG form a complex in the manchette, with DNALI1 being an upstream molecule. Mice deficiency in DNALI1 specifically in male germ cells showed dramatically reduced sperm numbers and were infertile. In addition, majority of the sperm exhibited abnormal morphology including misshapen heads, bent tails and enlarged midpiece, discontinuous accessory structure, and loss of sperm individualization, emphasizing the importance of DNALI1 in sperm development. Examination of testis histology revealed impaired spermiogenesis in the conditional Dnali1 knockout mice. Electron microscopy revealed disrupted ultrastructure in sperm of the Dnali1 mutant mice. Testicular levels of MEIG1, PACRG and SPAG16L proteins were not changed in the Dnali1 mutant mice. However, MEIG1 and SPAG16L were no longer present in the manchette in the absence of DNALI1. These findings demonstrate that DNALI1 is involved in the connection of the MEIG1/PACRG complex to carry cargo proteins along the manchette microtubules for sperm flagella formation. Given that Dnali1 mutant mice showed impaired sperm individualization that was not observed in the MEIG1 nor PACRG-deficient mice, DNALI1 might fulfill other functions beyond its role associated with the MEIG1/PACRG complex. Thus, DNALI1 plays multiple roles in sperm cell differentiation and function. Summary statement Axonemal dynein light intermediate polypeptide 1 (DNALI1) is required for sperm formation and male fertility. It associates with the MEIG1/PACRG complex in the manchette and is involved in a cargo transport system. In addition, it might be related to IFT and sperm individualization.
19

Analysis of nucleus and cytoplasm-specific RNA fractions demonstrates that a significant proportion of the genetic regulation of gene expression across the human brain occurs post-transcriptionally

Karishma D’Sa et al.Jul 1, 2022
ABSTRACT Gaining insight into the genetic regulation of gene expression in human brain is key to the interpretation of genome-wide association studies for major neurological and neuropsychiatric diseases. Expression quantitative trait loci (eQTL) analyses have largely been used to achieve this, providing valuable insights into the genetic regulation of steady-state RNA in human brain, but not distinguishing between molecular processes regulating transcription and stability. RNA quantification within cellular fractions can disentangle these processes in cell types and tissues which are challenging to model in vitro. We investigated the underlying molecular processes driving the genetic regulation of gene expression specific to a cellular fraction using allele-specific expression (ASE). Applying ASE analysis to genomic and transcriptomic data from paired nuclear and cytoplasmic fractions of anterior prefrontal cortex, cerebellar cortex and putamen tissues from 4 post-mortem neuropathologically-confirmed control human brains, we demonstrate that a significant proportion of genetic regulation of gene expression occurs post-transcriptionally in the cytoplasm, with genes undergoing this form of regulation more likely to be synaptic. These findings have implications for understanding the structure of gene expression regulation in human brain, and importantly the interpretation of rapidly growing single-nucleus brain RNA-sequencing and eQTL datasets, where cytoplasm-specific regulatory events could be missed.
Load More