XS
Xia Shen
Author with expertise in Genetic Architecture of Quantitative Traits
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
18
(61% Open Access)
Cited by:
384
h-index:
35
/
i10-index:
79
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Genome-wide analysis identifies 12 loci influencing human reproductive behavior

Nicola Barban et al.Oct 31, 2016
+97
R
R
N
The genetic architecture of human reproductive behavior-age at first birth (AFB) and number of children ever born (NEB)-has a strong relationship with fitness, human development, infertility and risk of neuropsychiatric disorders. However, very few genetic loci have been identified, and the underlying mechanisms of AFB and NEB are poorly understood. We report a large genome-wide association study of both sexes including 251,151 individuals for AFB and 343,072 individuals for NEB. We identified 12 independent loci that are significantly associated with AFB and/or NEB in a SNP-based genome-wide association study and 4 additional loci associated in a gene-based effort. These loci harbor genes that are likely to have a role, either directly or by affecting non-local gene expression, in human reproduction and infertility, thereby increasing understanding of these complex traits.
0
Citation312
0
Save
1

A pangenome reference of 36 Chinese populations

Yang Gao et al.Jun 14, 2023
+39
H
X
Y
Human genomics is witnessing an ongoing paradigm shift from a single reference sequence to a pangenome form, but populations of Asian ancestry are underrepresented. Here we present data from the first phase of the Chinese Pangenome Consortium, including a collection of 116 high-quality and haplotype-phased de novo assemblies based on 58 core samples representing 36 minority Chinese ethnic groups. With an average 30.65× high-fidelity long-read sequence coverage, an average contiguity N50 of more than 35.63 megabases and an average total size of 3.01 gigabases, the CPC core assemblies add 189 million base pairs of euchromatic polymorphic sequences and 1,367 protein-coding gene duplications to GRCh38. We identified 15.9 million small variants and 78,072 structural variants, of which 5.9 million small variants and 34,223 structural variants were not reported in a recently released pangenome reference1. The Chinese Pangenome Consortium data demonstrate a remarkable increase in the discovery of novel and missing sequences when individuals are included from underrepresented minority ethnic groups. The missing reference sequences were enriched with archaic-derived alleles and genes that confer essential functions related to keratinization, response to ultraviolet radiation, DNA repair, immunological responses and lifespan, implying great potential for shedding new light on human evolution and recovering missing heritability in complex disease mapping.
1
Citation36
1
Save
17

Dissecting aneuploidy phenotypes by constructing Sc2.0 chromosome VII and SCRaMbLEing synthetic disomic yeast

Yue Shen et al.Sep 2, 2022
+32
J
J
Y
Abstract Aneuploidy compromises genomic stability, often leading to embryo inviability, and is frequently associated with tumorigenesis and aging. Different aneuploid chromosome stoichiometries lead to distinct transcriptomic and phenotypic changes, making it helpful to study aneuploidy in tightly controlled genetic backgrounds. By deploying the engineered SCRaMbLE system to the newly synthesized Sc2.0 megabase chromosome VII ( synVII ), we constructed a synthetic disomic yeast and screened hundreds of SCRaMbLEd derivatives with diverse chromosomal rearrangements. Phenotypic characterization and multi-omics analysis revealed that fitness defects associated with aneuploidy could be restored by i) removing most of the chromosome content, or ii) modifying specific regions in the duplicated chromosome. These findings indicate that both chromosome copy number and chromosomal regions contribute to the aneuploidy-related phenotypes, and the synthetic yeast resource opens new paradigms in studying aneuploidy. In brief Use of SCRaMbLE and newly synthesized Mb-scale Sc2.0 chromosome VII enables insights into genotype/phenotype relationships associated with aneuploidy Highlights De novo design and synthesis of a Mb-scale synthetic yeast chromosome VII, carrying 11.8% sequence modifications and representing nearly 10% of the yeast genome. A disomic yeast (n + synVII ) is constructed for dissecting the aneuploidy phenotype SCRaMbLE enables systematic exploration of regions causing aneuploidy phenotypes Chromosomal copy number and content both contribute to aneuploidy phenotypes A 20 Kb deletion on the right arm of synVII leads to fitness improvement linked to up-regulation of protein synthesis
17
Citation10
0
Save
1

Causality-Enriched Epigenetic Age Uncouples Damage and Adaptation

Kejun Ying et al.Oct 8, 2022
+7
A
H
K
Abstract Machine learning models based on DNA methylation data can predict biological age but often lack causal insights. By harnessing large-scale genetic data through epigenome-wide Mendelian Randomization, we identified CpG sites potentially causal for aging-related traits. Neither the existing epigenetic clocks nor age-related differential DNA methylation are enriched in these sites. These CpGs include sites that contribute to aging and protect against it, yet their combined contribution negatively affects age-related traits. We established a novel framework to introduce causal information into epigenetic clocks, resulting in DamAge and AdaptAge—clocks that track detrimental and adaptive methylation changes, respectively. DamAge correlates with adverse outcomes, including mortality, while AdaptAge is associated with beneficial adaptations. These causality-enriched clocks exhibit sensitivity to short-term interventions. Our findings provide a detailed land-scape of CpG sites with putative causal links to lifespan and healthspan, facilitating the development of aging biomarkers, assessing interventions, and studying reversibility of age-associated changes.
1
Citation10
0
Save
0

Beyond power: Multivariate discovery, replication, and interpretation of pleiotropic loci using summary association statistics

Ning Zheng et al.Jul 8, 2015
+9
S
Y
N
Abstract The ever-growing genome-wide association studies (GWAS) have revealed widespread pleiotropy. To exploit this, various methods which consider variant association with multiple traits jointly have been developed. However, most effort has been put on improving discovery power: how to replicate and interpret these discovered pleiotropic loci using multivariate methods has yet to be discussed fully. Using only multiple publicly available single-trait GWAS summary statistics, we develop a fast and flexible multi-trait framework that contains modules for (i) multi-trait genetic discovery, (ii) replication of locus pleiotropic profile, and (iii) multi-trait conditional analysis. The procedure is able to handle any level of sample overlap. As an empirical example, we discovered and replicated 23 novel pleiotropic loci for human anthropometry and evaluated their pleiotropic effects on other traits. By applying conditional multivariate analysis on the 23 loci, we discovered and replicated two additional multi-trait associated SNPs. Our results provide empirical evidence that multi-trait analysis allows detection of additional, replicable, highly pleiotropic genetic associations without genotyping additional individuals. The methods are implemented in a free and open source R package MultiABEL. Author summary By analyzing large-scale genomic data, geneticists have revealed widespread pleiotropy, i.e. single genetic variation can affect a wide range of complex traits. Methods have been developed to discover such genetic variants. However, we still lack insights into the relevant genetic architecture - What more can we learn from knowing the effects of these genetic variants? Here, we develop a fast and flexible statistical analysis procedure that includes discovery, replication, and interpretation of pleiotropic effects. The whole analysis pipeline only requires established genetic association study results. We also provide the mathematical theory behind the pleiotropic genetic effects testing. Most importantly, we show how a replication study can be essential to reveal new biology rather than solely increasing sample size in current genomic studies. For instance, we show that, using our proposed replication strategy, we can detect the difference in genetic effects between studies of different geographical origins. We applied the method to the GIANT consortium anthropometric traits to discover new genetic associations, replicated in the UK Biobank, and provided important new insights into growth and obesity. Our pipeline is implemented in an open-source R package MultiABEL, sufficiently efficient that allows researchers to immediately apply on personal computers in minutes.
0
Citation9
0
Save
0

Genomic underpinnings of lifespan allow prediction and reveal basis in modern risks

Paul Timmers et al.Jul 6, 2018
+11
K
N
P
Abstract We use a multi-stage genome-wide association of 1 million parental lifespans of genotyped subjects and data on mortality risk factors to validate previously unreplicated findings near CDKN2B-AS1 , ATXN2/BRAP , FURIN/FES , ZW10 , PSORS1C3 , and 13q21.31, and identify and replicate novel findings near GADD45G , KCNK3 , LDLR , POM121C , ZC3HC1 , and ABO . We also validate previous findings near 5q33.3/EBF1 and FOXO3, whilst finding contradictory evidence at other loci. Gene set and tissue-specific analyses show that expression in foetal brain cells and adult dorsolateral prefrontal cortex is enriched for lifespan variation, as are gene pathways involving lipid proteins and homeostasis, vesicle-mediated transport, and synaptic function. Individual genetic variants that increase dementia, cardiovascular disease, and lung cancer –but not other cancers-explain the most variance, possibly reflecting modern susceptibilities, whilst cancer may act through many rare variants, or the environment. Resultant polygenic scores predict a mean lifespan difference of around five years of life across the deciles.
0
Citation3
0
Save
1

Improved estimation of phenotypic correlations using summary association statistics

Ting Li et al.Dec 11, 2020
X
N
T
Estimating the phenotypic correlations between complex traits and diseases based on their genome-wide association summary statistics has been a useful technique in genetic epidemiology and statistical genetics inference. Two state-of-the-art strategies, Z-score correlation across null-effect SNPs and LD score regression intercept, were widely applied to estimate phenotypic correlations. Here, we propose an improved Z-score correlation strategy based on SNPs with low minor allele frequencies (MAFs), and show how this simple strategy can correct the bias generated by the current methods. Comparing to LDSC, the low-MAF estimator improves phenotypic correlation estimation thus is beneficial for methods and applications using phenotypic correlations inferred from summary association statistics.
1
Citation3
0
Save
0

Non-neoplastic B-cell predominant lymphoid proliferations at the organs exposed to external environment mimicking lymphoma: A potential diagnostic pitfall

Yue Fan et al.Jan 1, 2024
+3
O
B
Y
Background: Typically, lymphatic tissue proliferative lesions include either benign lesions or lymphoma. However, not all lymphatic lesions can currently be accurately classified into one category, particularly in mucosal areas that are in contact with the external environment. Aims: To explore the morphology, immunophenotype, and molecular changes of Non-neoplastic B-cell predominant lymphoid proliferations (NBPLP) in pathological areas that are exposed to external surroundings which mimicked lymphoma. Methods and Results: 18 cases of Atypical lymphoid hyperplasia (AtLP) were retrieved in this study. The biopsy samples were mucosal samples obtained from areas exposed to external surroundings, including intestines, urethra, cervix, tonsils, and tongue. Microscopically, there is a different level of B cell hyperplasia accompanied by morphological atypia. We categorized the morphology into 4 groups: type A (7/18), type B (3/18), type C (3/18), type D (5/18). Part of the AtLP was found positive for BCR gene rearrangement (6/15), and TCR gene rearrangement (1/4). The follow-up period ranged from 14.2 to 70 months. No evidence of lymphoma was found. Therefore, we diagnosed all of the presented cases as NBPLP. We illustrated the key differential points and provided valuable diagnostic experience on each subtype. Conclusions: Areas exposed to the external environment are commonly exposed to antigen and easily present with AtLP of NBPLP, accompanying with positive IGH rearrangement. Therefore, a comprehensive evaluation of macroscopic, morphology, immunophenotype, and molecular diagnostics is required to prevent the overdiagnosis of lymphoma.
0
Citation1
0
Save
0

A Genome-Wide Association Analysis Reveals Epistatic Cancellation of Additive Genetic Variance for Root Length in Arabidopsis thaliana

Jennifer Lachowiec et al.Sep 4, 2014
Ö
C
X
J
Efforts to identify loci underlying complex traits generally assume that most genetic variance is additive. Here, we examined the genetics of Arabidopsis thaliana root length and found that the narrow-sense heritability for this trait was statistically zero. This low additive genetic variance likely explains why no associations to root length could be found using standard additive-model-based genome-wide association (GWA) approaches. However, the broad-sense heritability for root length was significantly larger, and we therefore also performed an epistatic GWA analysis to map loci contributing to the epistatic genetic variance. This analysis revealed four interacting pairs involving seven chromosomal loci that passed a standard multiple-testing corrected significance threshold. Explorations of the genotype-phenotype maps for these pairs revealed that the detected epistasis cancelled out the additive genetic variance, explaining why these loci were not detected in the additive GWA analysis. Small population sizes, such as in our experiment, increase the risk of identifying false epistatic interactions due to testing for associations with very large numbers of multi-marker genotypes in few phenotyped individuals. Therefore, we estimated the false-positive risk using a new statistical approach that suggested half of the associated pairs to be true positive associations. Our experimental evaluation of candidate genes within the seven associated loci suggests that this estimate is conservative; we identified functional candidate genes that affected root development in four loci that were part of three of the pairs. In summary, statistical epistatic analyses were found to be indispensable for confirming known, and identifying several new, functional candidate genes for root length using a population of wild-collected A. thaliana accessions. We also illustrated how epistatic cancellation of the additive genetic variance resulted in an insignificant narrow-sense, but significant broad-sense heritability that could be dissected into the contributions of several individual loci using a combination of careful statistical epistatic analyses and functional genetic experiments.
0

Dual-trait pleiotropic analysis in highly stratified natural populations using genome-wide association summary statistics

Xiao Feng et al.Sep 25, 2017
+7
Y
F
X
Abstract Genome-wide association analysis is a powerful tool to identify genomic loci underlying complex traits. However, the application in natural populations comes with challenges, especially power loss due to population stratification. Here, we introduce a bivariate analysis approach to a GWAS dataset of Arabidopsis thaliana . We demonstrate the efficiency of double-phenotype analysisto uncover hidden genetic loci masked by population structure via a series of simulations. In real data analysis, acommon allele, strongly confounded with population structure, is discovered to be associated with late flowering and slow maturation of the plant. The discovered genetic effect on flowering time is further replicated in independent datasets. Using Mendelian randomization analysis based on summary statistics from our GWAS and expression QTL scans, we predicted and replicated a candidate gene AT1G11560 that potentially causes this association. Further analysis indicates that this locusis co-selected with flowering-time-related genes. The discovered pleiotropic genotypephenotype map provides new insights into understanding the genetic correlation of complex traits.
Load More