LJ
Li Jin
Author with expertise in RNA Sequencing Data Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
10
(60% Open Access)
Cited by:
90
h-index:
60
/
i10-index:
272
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

A pangenome reference of 36 Chinese populations

Yang Gao et al.Jun 14, 2023
Human genomics is witnessing an ongoing paradigm shift from a single reference sequence to a pangenome form, but populations of Asian ancestry are underrepresented. Here we present data from the first phase of the Chinese Pangenome Consortium, including a collection of 116 high-quality and haplotype-phased de novo assemblies based on 58 core samples representing 36 minority Chinese ethnic groups. With an average 30.65× high-fidelity long-read sequence coverage, an average contiguity N50 of more than 35.63 megabases and an average total size of 3.01 gigabases, the CPC core assemblies add 189 million base pairs of euchromatic polymorphic sequences and 1,367 protein-coding gene duplications to GRCh38. We identified 15.9 million small variants and 78,072 structural variants, of which 5.9 million small variants and 34,223 structural variants were not reported in a recently released pangenome reference1. The Chinese Pangenome Consortium data demonstrate a remarkable increase in the discovery of novel and missing sequences when individuals are included from underrepresented minority ethnic groups. The missing reference sequences were enriched with archaic-derived alleles and genes that confer essential functions related to keratinization, response to ultraviolet radiation, DNA repair, immunological responses and lifespan, implying great potential for shedding new light on human evolution and recovering missing heritability in complex disease mapping.
1
Citation36
1
Save
9

Quartet DNA reference materials and datasets for comprehensively evaluating germline variants calling performance

Luyao Ren et al.Sep 28, 2022
Abstract Current methods for evaluating the accuracy of germline variant calls are restricted to easy-to-detect high-confidence regions, thus ignoring a substantial portion of difficult variants beyond the benchmark regions. We established four DNA reference materials from immortalized cell lines derived from a Chinese Quartet including parents and monozygotic twins. We integrated benchmark calls of 4.2 million small variants and 15,000 structural variants from multiple platforms and bioinformatic pipelines for evaluating the reliability of germline variant calls inside the benchmark regions. The genetic built-in-truth of the Quartet family design not only improved sensitivity of benchmark calls by removing additional false positive variants with apparently high quality, but also enabled estimation of the precision of variants calls outside the benchmark regions. Batch effects of variant calling in large-scale DNA sequencing efforts can be effectively identified with the concurrent use of the Quartet DNA reference materials along with study samples, and can be alleviated by training a machine learning model with the Quartet reference datasets to remove potential artifact calls. Matched RNA and protein reference materials were also established in the Quartet project, thereby enabling benchmark calls constructed from DNA reference materials for evaluation of variants calling performance on RNA and protein data. The Quartet DNA reference materials from this study are a resource for objective and comprehensive assessment of the accuracy of germline variant calls throughout the whole-genome regions.
9
Citation14
0
Save
0

LiBis: An ultrasensitive alignment method for low-input bisulfite sequencing

Yue Yin et al.May 16, 2020
Abstract The cell-free DNA (cfDNA) methylation profile in liquid biopsies has been utilized to diagnose early-stage disease and estimate therapy response. However, in typical clinical settings, only very small amounts of cfDNA can be purified. Whole-genome bisulfite sequencing (WGBS) is the gold standard to measure DNA methylation; however, WGBS using small amounts of fragmented DNA introduces a critical challenge for data analysis, namely a low mapping ratio. This, in turn, generates low sequencing depth and low coverage for CpG sites genome wide. The lack of informative CpGs has become a bottleneck for the clinical application of cfDNA-based WGBS assays. Hence, we developed LiBis (Low-input Bisulfite Sequencing), a novel method for low-input WGBS data alignment. By dynamically clipping initially unmapped reads and remapping clipped fragments, we judiciously rescued those reads and uniquely aligned them to the genome. By substantially increasing the mapping ratio by up to 88%, LiBis dramatically improved the number of informative CpGs and the precision in quantifying the methylation status of individual CpG sites. The high sensitivity and cost effectiveness afforded by LiBis for low-input samples will allow the discovery of genetic and epigenetic features suitable for downstream analysis and biomarker identification using liquid biopsy.
0
Citation1
0
Save
0

Dissecting dynamics and differences of selective pressures in the evolution of human pigmentation

X. Huang et al.Jan 25, 2018
Human pigmentation is a highly diverse and complex trait among populations, and has drawn particular attention from both academic and non-academic investigators for thousands of years. Previous studies detected selection signals in several human pigmentation genes, but few studies have integrated contribution from multiple genes to the evolution of human pigmentation. Moreover, none has quantified selective pressures on human pigmentation over epochs and between populations. Here, we dissect dynamics and differences of selective pressures during different periods and between distinct populations with new approaches. We propose a new model with multiple populations to estimate historical selective pressures by summarizing selective pressures on multiple genes. We use genotype data of 19 genes associated with human pigmentation from 17 datasets, and obtain data for 2346 individuals of six representative population groups from worldwide. Our results quantify selective pressures on light pigmentation not only in modern Europeans (0.0249/generation) but also in proto-Eurasians (0.00665/generation). Our results also support several derived alleles associated with human dark pigmentation may under directional selection by quantifying differences of selective pressures between populations. Our study provides a first attempt to quantitatively investigate the dynamics of selective pressures during different time periods in the evolution of human pigmentation, and may facilitate studies of the evolution of other complex traits.Author Summary The color variation of human skin, hair, and eye is affected by multiple genes with different roles. This diversity may be shaped by natural selection and adapted for ultraviolet radiation in different environments around the world. As human populations migrated out from Africa, the ultraviolet radiation in the environment they encountered also changed. It is possible that the selective pressures on human pigmentation varied throughout human evolutionary history. In this study, we develop a new approach and estimate historical selective pressures on light pigmentation not only in modern Europeans but also in proto-Eurasians. To our best knowledge, this is the first study that quantifies selective pressures during different time periods in the evolution of human pigmentation. Besides, we provide statistical evidence to support several genes associated with human dark pigmentation may be favored by natural selection. Thus, natural selection may not only affect light pigmentation in Eurasians, but also influence dark pigmentation in Africans.
0

Genome-wide Association study of facial morphology identifies novel genetic loci in Han Chinese

Yin Huang et al.Jul 3, 2019
Human face is a heritable surface with many complex sensory organs. In recent years, many genetic loci associated with facial features have been reported in different populations, yet there is a lack for the Han Chinese population. We report a genome-wide association analysis of 3D normal human faces in 2659 Han Chinese with two groups of phenotypes, the partial and whole face phenotypes and the distance and angle phenotypes. We found significant signals in five genomic regions with traits related to nose or eyes, including rs970797 in 2q31.1 near HOXD1 and MTX2, rs16897517 in 8q22.2 at intron of VPS13B, rs9995821 in 4q31.3 near DCHS2 and SFRP2, rs12636297 in 3q23 near PISRT1, and rs12948076 in 17q24.3 near SOX9 and CASC17. We visualized changes in facial morphology by comparing the volume of local areas and observed that these nose-related loci were associated with different features of the nose, including nose prominence, nasion height, and nostril shape, suggesting that the nose underlies precise genetic regulation. These results provide a more comprehensive understanding of the relationship between genetic loci and human facial morphology.
1

Combined genome-wide association study of 136 quantitative ear morphology traits in multiple populations reveal 8 novel loci

Yang Li et al.Jul 17, 2023
Human ear morphology, a complex anatomical structure represented by a multidimensional set of correlated and heritable phenotypes, has a poorly understood genetic architecture. In this study, we quantitatively assessed 136 ear morphology traits using deep learning analysis of digital face images in 14,921 individuals from five different cohorts in Europe, Asia, and Latin America. Through GWAS meta-analysis and C-GWASs, a recently introduced method to effectively combine GWASs of many traits, we identified 16 genetic loci involved in various ear phenotypes, eight of which have not been previously associated with human ear features. Our findings suggest that ear morphology shares genetic determinants with other surface ectoderm-derived traits such as facial variation, mono eyebrow, and male pattern baldness. Our results enhance the genetic understanding of human ear morphology and shed light on the shared genetic contributors of different surface ectoderm-derived phenotypes. Additionally, gene editing experiments in mice have demonstrated that knocking out the newly ear-associated gene (Intu) and a previously ear-associated gene (Tbx15) causes deviating mouse ear morphology.
0

Evaluation of the antifibrotic potency by knocking down SPARC, CCR2 and SMAD3

Weifeng Ding et al.Jul 24, 2018
The genes of SPARC, CCR2, and SMAD3 are implicated in orchestrating inflammation and fibrosis in scleroderma and other fibrotic disorders. Aim of the studies was to examine synergistic effect of inhibition of these genes in treating fibrosis. Triple combination of siRNAs targeting on Sparc, Ccr2 and Smad3 achieved favorable anti-inflammatory and anti-fibrotic effects. Inhibition of inflammation was evidenced by reduced inflammatory cells and proinflammatory cytokines in the BALF and/or the tissues. Activation of fibroblasts was suppressed in mouse tissues in which α-Sma and collagens were significantly reduced. Aberrant expression of the genes in fibroblasts, monocytes/macrophage, endothelial and epithelial cells were reinstalled after the treatment. In addition, transcriptome profiles indicated that some bleomycin-induced alterations of multiple biological pathways were recovered to varying degrees by the treatment. The results indicated that the triple combination of siRNAs systemically reinstated multiple biopathways, probably through controlling on different cell types including fibroblasts, monocytes/macrophages, endothelial cells and others. The multi-target-combined therapeutic approach examined herein may represent a novel and effective therapy for fibrosis.
0

PKD2 influence uric acid levels and gout risk by interacting with ABCG2

Zheng Dong et al.Mar 13, 2018
Background: Uric acid is the final product of purine metabolism and elevated serum urate levels can cause gout. Conflicting results were reported for the effect of PKD2 on serum urate levels and gout risk. Therefore, our study attempted to state the important role of PKD2 in influencing the pathogenesis of gout. Method: SNPs in PKD2 (s2725215 and rs2728121) and ABCG2 (rs2231137 and rs1481012) were tested in approximately 5,000 Chinese individuals. Results: Two epistatic interactions between loci in PKD2 (rs2728121) and ABCG2 (rs1481012 and rs2231137) showed distinct contributions to uric acid levels with Pint values of 0.018 and 0.004, respectively, and the associations varies by gender and BMI. The SNP pair of rs2728121 and rs1481012 justly played roles in uric acid in females (Pint = 0.006), while the other pair did in males (Pint = 0.017). Regarding BMI, the former SNP pair merely contributed in overweigh subjects (Pint = 0.022) and the latter one did in both normal and overweigh individuals (Pint = 0.013 and 0.047, respectively). Furthermore, the latter SNP pair was also associated with gout pathology (Pint = 0.001), especially in males (Pint = 0.001). Finally, functional analysis showed potential epistatic interactions in those genes region and PKD2 mRNA expression had a positive correlation with ABCG2's (r = 0.743, P = 5.83e-06). Conclusion: Our study for the first time identified that epistatic interactions between PKD2 and ABCG2 influenced serum urate concentrations and gout risk, and PKD2 might affect the pathogenesis from elevated serum urate to hyperuricemia to gout by modifying ABCG2.