XF
Xiao Feng
Author with expertise in Genomic Studies and Association Analyses
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
12
(83% Open Access)
Cited by:
255
h-index:
13
/
i10-index:
18
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Genomics of 1 million parent lifespans implicates novel pathways and common diseases and distinguishes survival chances

Paul Timmers et al.Jan 15, 2019
We use a genome-wide association of 1 million parental lifespans of genotyped subjects and data on mortality risk factors to validate previously unreplicated findings near CDKN2B-AS1, ATXN2/BRAP, FURIN/FES, ZW10, PSORS1C3, and 13q21.31, and identify and replicate novel findings near ABO, ZC3HC1, and IGF2R. We also validate previous findings near 5q33.3/EBF1 and FOXO3, whilst finding contradictory evidence at other loci. Gene set and cell-specific analyses show that expression in foetal brain cells and adult dorsolateral prefrontal cortex is enriched for lifespan variation, as are gene pathways involving lipid proteins and homeostasis, vesicle-mediated transport, and synaptic function. Individual genetic variants that increase dementia, cardiovascular disease, and lung cancer - but not other cancers - explain the most variance. Resulting polygenic scores show a mean lifespan difference of around five years of life across the deciles.This article has been through an editorial process in which the authors decide how to respond to the issues raised during peer review. The Reviewing Editor's assessment is that all the issues have been addressed (see decision letter).Ageing happens to us all, and as the cabaret singer Maurice Chevalier pointed out, "old age is not that bad when you consider the alternative". Yet, the growing ageing population of most developed countries presents challenges to healthcare systems and government finances. For many older people, long periods of ill health are part of the end of life, and so a better understanding of ageing could offer the opportunity to prolong healthy living into old age. Ageing is complex and takes a long time to study – a lifetime in fact. This makes it difficult to discern its causes, among the countless possibilities based on an individual’s genes, behaviour or environment. While thousands of regions in an individual’s genetic makeup are known to influence their risk of different diseases, those that affect how long they will live have proved harder to disentangle. Timmers et al. sought to pinpoint such regions, and then use this information to predict, based on their DNA, whether someone had a better or worse chance of living longer than average. The DNA of over 500,000 people was read to reveal the specific ‘genetic fingerprints’ of each participant. Then, after asking each of the participants how long both of their parents had lived, Timmers et al. pinpointed 12 DNA regions that affect lifespan. Five of these regions were new and had not been linked to lifespan before. Across the twelve as a whole several were known to be involved in Alzheimer’s disease, smoking-related cancer or heart disease. Looking at the entire genome, Timmers et al. could then predict a lifespan score for each individual, and when they sorted participants into ten groups based on these scores they found that top group lived five years longer than the bottom, on average. Many factors beside genetics influence how long a person will live and our lifespan cannot be read from our DNA alone. Nevertheless, Timmers et al. had hoped to narrow down their search and discover specific genes that directly influence how quickly people age, beyond diseases. If such genes exist, their effects were too small to be detected in this study. The next step will be to expand the study to include more participants, which will hopefully pinpoint further genomic regions and help disentangle the biology of ageing and disease.
0
Citation232
0
Save
0

Beyond power: Multivariate discovery, replication, and interpretation of pleiotropic loci using summary association statistics

Ning Zheng et al.Jul 8, 2015
Abstract The ever-growing genome-wide association studies (GWAS) have revealed widespread pleiotropy. To exploit this, various methods which consider variant association with multiple traits jointly have been developed. However, most effort has been put on improving discovery power: how to replicate and interpret these discovered pleiotropic loci using multivariate methods has yet to be discussed fully. Using only multiple publicly available single-trait GWAS summary statistics, we develop a fast and flexible multi-trait framework that contains modules for (i) multi-trait genetic discovery, (ii) replication of locus pleiotropic profile, and (iii) multi-trait conditional analysis. The procedure is able to handle any level of sample overlap. As an empirical example, we discovered and replicated 23 novel pleiotropic loci for human anthropometry and evaluated their pleiotropic effects on other traits. By applying conditional multivariate analysis on the 23 loci, we discovered and replicated two additional multi-trait associated SNPs. Our results provide empirical evidence that multi-trait analysis allows detection of additional, replicable, highly pleiotropic genetic associations without genotyping additional individuals. The methods are implemented in a free and open source R package MultiABEL. Author summary By analyzing large-scale genomic data, geneticists have revealed widespread pleiotropy, i.e. single genetic variation can affect a wide range of complex traits. Methods have been developed to discover such genetic variants. However, we still lack insights into the relevant genetic architecture - What more can we learn from knowing the effects of these genetic variants? Here, we develop a fast and flexible statistical analysis procedure that includes discovery, replication, and interpretation of pleiotropic effects. The whole analysis pipeline only requires established genetic association study results. We also provide the mathematical theory behind the pleiotropic genetic effects testing. Most importantly, we show how a replication study can be essential to reveal new biology rather than solely increasing sample size in current genomic studies. For instance, we show that, using our proposed replication strategy, we can detect the difference in genetic effects between studies of different geographical origins. We applied the method to the GIANT consortium anthropometric traits to discover new genetic associations, replicated in the UK Biobank, and provided important new insights into growth and obesity. Our pipeline is implemented in an open-source R package MultiABEL, sufficiently efficient that allows researchers to immediately apply on personal computers in minutes.
0
Citation9
0
Save
0

Two decades of suspect evidence for adaptive DNA-sequence evolution – Less negative selection misconstrued as positive selection

Qipian Chen et al.Apr 23, 2020
Abstract Evidence for biological adaptation is often obtained by studying DNA sequence evolution. Since the analyses are affected by both positive and negative selection, studies usually assume constant negative selection in the time span of interest. For this reason, hundreds of studies that conclude adaptive evolution might have reported false signals caused by relaxed negative selection. We test this suspicion two ways. First, we analyze the fluctuation in population size, N, during evolution. For example, the evolutionary rate in the primate phylogeny could vary by as much as 2000 fold due to the variation in N alone. Second, we measure the variation in negative selection directly by analyzing the polymorphism data from four taxa ( Drosophila, Arabidopsis , primates, and birds, with 64 species in total). The strength of negative selection, as measured by the ratio of nonsynonymous/synonymous polymorphisms, fluctuates strongly and at multiple time scales. The two approaches suggest that the variation in the strength of negative selection may be responsible for the bulk of the reported adaptive genome evolution in the last two decades. This study corroborates the recent report 1 on the inconsistent patterns of adaptive genome evolution. Finally, we discuss the path forward in detecting adaptive sequence evolution.
0
Citation6
0
Save
1

Polygenic basis of strong and rapid flowering time response to environment perturbations in wildArabidopsis thalianapopulation

Jiye Yan et al.Jul 3, 2023
Abstract Despite the importance in understanding the impact of climate change, the genetics of rapid response to changing environments and its role in adaptive evolution remains elusive. Here, we studied flowering time response to environment changes using 514 Arabidopsis thaliana worldwide accessions with re-sequencing genomes and flowering time measurements from ten unique environments with variable temperature, drought, daylight and competition stresses. We revealed a polygenic basis of flowering time mean and plasticity, underpinned by 52 mean and plasticity QTL. Widespread interaction between mean QTL, polygenic background and surrounding environments considerably altered the amount of additive genetic variance and allelic effects of detected QTL. This caused variability in phenotype plasticity and across environment variation in genetic variance, resulting in rapid flowering time response to environment perturbations. In addition, the plastic alleles showed a higher correlation with the environment factors than that from randomly sampled alleles, suggesting a potential role in climate adaptation. We therefore proposed a polygenic interaction model, whereby large effect QTL and polygenic background simultaneously interacted with the surrounding environment, underlying rapid response to changing environments. Results from our study thus provided deeper insights into the genetics of plasticity, with potential benefit in genomic selection of crops in heterogeneous environments and predicting changes in species distribution and the evolutionary trajectory of wild populations.
1
Citation2
0
Save
8

Two decades of suspect evidence for adaptive molecular evolution – Negative selection confounding positive selection signals

Qipian Chen et al.Nov 22, 2021
Abstract There is a large literature in the last two decades affirming adaptive DNA sequences evolution between species. The main lines of evidence are from i) the McDonald-Kreitman (MK) test, which compares divergence and polymorphism data, and ii) the PAML test, which analyzes multi-species divergence data. Here, we apply these two tests concurrently on the genomic data of Drosophila and Arabidopsis . To our surprise, the >100 genes identified by the two tests do not overlap beyond random expectation. Because the non-concordance could be due to low powers leading to high false-negatives, we merge every 20 - 30 genes into a “supergene”. At the supergene level, the power of detection is large but the calls still do not overlap. We rule out methodological reasons for the non-concordance. In particular, extensive simulations fail to find scenarios whereby positive selection can only be detected by either MK or PAML, but not both. Since molecular evolution is governed by positive and negative selection concurrently, a fundamental assumption for estimating one (say, positive selection) is that the other is constant. However, in a broad survey of primates, birds, Drosophila and Arabidopsis , we found that negative selection rarely stays constant for long in evolution. As a consequence, the variation in negative selection is often mis-construed as signals of positive selection. In conclusion, MK, PAML or any method that examines genomic sequence evolution has to explicitly address the variation in negative selection before estimating positive selection. In a companion study, we propose a possible path forward in two stages – first, by mapping out the changes in negative selection and then using this map to estimate positive selection. For now, the large literature on positive selection between species has to await the re-assessment.
8
Citation2
0
Save
0

Preoperative prediction of MGMT promoter methylation in glioblastoma based on multiregional and multi-sequence MRI radiomics analysis

Lanqing Li et al.Jul 11, 2024
Abstract O6-methylguanine-DNA methyltransferase (MGMT) has been demonstrated to be an important prognostic and predictive marker in glioblastoma (GBM). To establish a reliable radiomics model based on MRI data to predict the MGMT promoter methylation status of GBM. A total of 183 patients with glioblastoma were included in this retrospective study. The visually accessible Rembrandt images (VASARI) features were extracted for each patient, and a total of 14676 multi-region features were extracted from enhanced, necrotic, “non-enhanced, and edematous” areas on their multiparametric MRI. Twelve individual radiomics models were constructed based on the radiomics features from different subregions and different sequences. Four single-sequence models, three single-region models and the combined radiomics model combining all individual models were constructed. Finally, the predictive performance of adding clinical factors and VASARI characteristics was evaluated. The ComRad model combining all individual radiomics models exhibited the best performance in test set 1 and test set 2, with the area under the receiver operating characteristic curve (AUC) of 0.839 (0.709–0.963) and 0.739 (0.581–0.897), respectively. The results indicated that the radiomics model combining multi-region and multi-parametric MRI features has exhibited promising performance in predicting MGMT methylation status in GBM. The Modeling scheme that combining all individual radiomics models showed best performance among all constructed moels.
0
Citation1
0
Save
0

Chromosomal‐Level Genome Suggests Adaptive Constraints Leading to the Historical Population Decline in an Extremely Endangered Plant

Shao Shao et al.Nov 22, 2024
Increased human activity and climate change have significantly impacted wild habitats and increased the number of endangered species. Exploring evolutionary history and predicting adaptive potential using genomic data will facilitate species conservation and biodiversity recovery. Here, we examined the genome evolution of a critically endangered tree Pellacalyx yunnanensis, a plant species with extremely small populations (PSESP) that is narrowly distributed in Xishuangbanna, China. The species has neared extinction due to economic exploitation in recent decades. We assembled a chromosome-level genome of 334 Mb, with the N50 length of 20.5 Mb. Using the genome, we discovered that P. yunnanensis has undergone several population size reductions, leading to excess deleterious mutations. The species may possess low adaptive potential due to reduced genetic diversity and the loss of stress-responsive genes. We estimate that P. yunnanensis is the basal species of its genus and diverged from its relatives during global cooling, suggesting it was stranded in unsuitable environments during periods of dramatic climate change. In particular, the loss of seed dormancy leads to germination under unfavourable conditions and reproduction challenges. This dormancy loss may have occurred through genetic changes that suppress ABA signalling and the loss of genes involved in seed maturation. The high-quality genome has also enabled us to reveal phenotypic trait evolution in Rhizophoraceae and identify divergent adaptation to intertidal and inland habitats. In summary, our study elucidates mechanisms underlying the decline and evaluates the adaptive potential of P. yunnanensis to future climate change, informing future conservation efforts.
Load More