HL
Heng Li
Author with expertise in RNA Sequencing Data Analysis
Hong Kong Polytechnic University, Nanjing University of Science and Technology, Southeast University
+ 10 more
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
29
(59% Open Access)
Cited by:
235
h-index:
119
/
i10-index:
1375
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
5

Structural basis of salicylic acid perception by Arabidopsis NPR proteins

Wei Wang et al.Aug 17, 2020
+9
H
J
W
Salicylic acid (SA) is a plant hormone that is critical for resistance to pathogens1-3. The NPR proteins have previously been identified as SA receptors4-10, although how they perceive SA and coordinate hormonal signalling remain unknown. Here we report the mapping of the SA-binding core of Arabidopsis thaliana NPR4 and its ligand-bound crystal structure. The SA-binding core domain of NPR4 refolded with SA adopts an α-helical fold that completely buries SA in its hydrophobic core. The lack of a ligand-entry pathway suggests that SA binding involves a major conformational remodelling of the SA-binding core of NPR4, which we validated using hydrogen-deuterium-exchange mass spectrometry analysis of the full-length protein and through SA-induced disruption of interactions between NPR1 and NPR4. We show that, despite the two proteins sharing nearly identical hormone-binding residues, NPR1 displays minimal SA-binding activity compared to NPR4. We further identify two surface residues of the SA-binding core, the mutation of which can alter the SA-binding ability of NPR4 and its interaction with NPR1. We also demonstrate that expressing a variant of NPR4 that is hypersensitive to SA could enhance SA-mediated basal immunity without compromising effector-triggered immunity, because the ability of this variant to re-associate with NPR1 at high levels of SA remains intact. By revealing the structural mechanisms of SA perception by NPR proteins, our work paves the way for future investigation of the specific roles of these proteins in SA signalling and their potential for engineering plant immunity.
5
Citation98
1
Save
5

The complete sequence of a human Y chromosome

Arang Rhie et al.Aug 26, 2023
+83
M
S
A
5
Paper
Citation88
3
Save
0

Genes Affecting Vocal and Facial Anatomy Went Through Extensive Regulatory Divergence in Modern Humans

David Gokhman et al.May 6, 2020
+38
L
M
D
Summary Regulatory changes are broadly accepted as key drivers of phenotypic divergence. However, identifying regulatory changes that underlie human-specific traits has proven very challenging. Here, we use 63 DNA methylation maps of ancient and present-day humans, as well as of six chimpanzees, to detect differentially methylated regions that emerged in modern humans after the split from Neanderthals and Denisovans. We show that genes affecting the face and vocal tract went through particularly extensive methylation changes. Specifically, we identify widespread hypermethylation in a network of face- and voice-affecting genes ( SOX9 , ACAN , COL2A1 , NFIX and XYLT1 ). We propose that these repression patterns appeared after the split from Neanderthals and Denisovans, and that they might have played a key role in shaping the modern human face and vocal tract.
0
Paper
Citation12
0
Save
1

A valid protective immune response elicited in rhesus macaques by an inactivated vaccine is capable of defending against SARS-CoV-2 infection

Hongbo Chen et al.Oct 24, 2023
+52
R
Z
H
Abstract With the relatively serious global epidemic outbreak of SARS-CoV-2 infection, public concerns focus on not only clinical therapeutic measures and public quarantine for this disease but also the development of vaccines. The technical design of our SARS-CoV-2 inactivated vaccine provides a viral antigen that enables the exposure of more than one structural protein based upon the antibody composition of COVID-19 patients’ convalescent serum. This design led to valid immunity with increasing neutralizing antibody titers and a CTL response detected post-immunization of this vaccine by two injections in rhesus macaques. Further, this elicited immunoprotection in macaques enables not only to restrain completely viral replication in tissues of immunized animals, compared to the adjuvant control and those immunized by an RBD peptide vaccine, but also to significantly alleviate inflammatory lesion in lung tissues in histo-pathologic detection, compared to the adjuvant control with developed interstitial pneumonia. The data obtained from these macaques immunized with the inactivated vaccine or RBD peptide vaccine suggest that immunity with a clinically protective effect against SARS-CoV-2 infection should include not only specific neutralizing antibodies but also specific CTL responses against at least the S and N antigens.
1
Citation10
0
Save
72

Identifying and correcting repeat-calling errors in nanopore sequencing of telomeres

Kian‐Lee Tan et al.Oct 24, 2023
H
M
M
K
Abstract Nanopore long-read genome sequencing is emerging as a potential approach for the study of genomes including long repetitive elements like telomeres. Here, we report extensive basecalling induced errors at telomere repeats across nanopore datasets, sequencing platforms, basecallers, and basecalling models. We found that telomeres which are represented by (TTAGGG) n and (CCCTAA) n repeats in many organisms were frequently miscalled (~40-50% of reads) as (TTAAAA) n , or as (CTTCTT) n and (CCCTGG) n repeats respectively in a strand-specific manner during nanopore sequencing. We showed that this miscalling is likely caused by the high similarity of current profiles between telomeric repeats and these repeat artefacts, leading to mis-assignment of electrical current profiles during basecalling. We further demonstrated that tuning of nanopore basecalling models, and selective application of the tuned models to telomeric reads led to improved recovery and analysis of telomeric regions, with little detected negative impact on basecalling of other genomic regions. Our study thus highlights the importance of verifying nanopore basecalls in long, repetitive, and poorly defined regions of the genome, and showcases how such artefacts in regions like telomeres can potentially be resolved by improvements in nanopore basecalling models.
0

Evidence for the Higgs Boson Decay to a Z Boson and a Photon at the LHC

Georges Aad et al.Jun 28, 2024
+5194
F
B
G
The first evidence for the Higgs boson decay to a Z boson and a photon is presented, with a statistical significance of 3.4 standard deviations. The result is derived from a combined analysis of the searches performed by the ATLAS and CMS Collaborations with proton-proton collision datasets collected at the CERN Large Hadron Collider (LHC) from 2015 to 2018. These correspond to integrated luminosities of around 140 fb^{-1} for each experiment, at a center-of-mass energy of 13 TeV. The measured signal yield is 2.2±0.7 times the standard model prediction, and agrees with the theoretical expectation within 1.9 standard deviations.
0
Citation5
0
Save
1

An enormous Paris polyphylla genome sheds light on genome size evolution and polyphyllin biogenesis

Jing Li et al.Oct 24, 2023
+23
L
M
J
Abstract The monocot family Melanthiaceae with varying genome sizes in a range of 230-fold is an ideal model to study the genome size fluctuation in plants. Its family member Paris genus demonstrates an evolutionary trend of bearing huge genomes characterized by an average c-value of 49.22 pg. Here, we report a 70.18 Gb genome assembly out of the 82.55 Gb genome of Paris polyphylla var. yunnanensis (PPY), which represents the biggest sequenced genome to date. We annotate 69.53% repetitive sequences in this genome and 62.50% of which are long-terminal repeat (LTR) transposable elements. Further evolution analysis indicates that the giant genome likely results from the joint effect of common and species-specific expansion of different LTR superfamilies, which might contribute to the environment adaptation after speciation. Moreover, we identify the candidate pathway genes for the biogenesis of polyphyllins, the PPY-specific medicinal saponins, by complementary approaches including genome mining, comprehensive analysis of 31 next-generation RNA-seq data and 55.23 Gb single-molecule circular consensus sequencing (CCS) RNA-seq reads, and correlation of the transcriptome and phytochemical data of five different tissues at four growth stages. This study not only provides significant insights into plant genome size evolution, but also paves the way for the following polyphyllin synthetic biology.
1
Paper
Citation5
0
Save
0

Worldwide genetic variation of the IGHV and TRBV immune receptor gene families in humans

Shishi Luo et al.May 7, 2020
Y
H
J
S
Abstract The immunoglobulin heavy variable (IGHV) and T cell beta variable (TRBV) loci are among the most complex and variable regions in the human genome. Generated through a process of gene duplication/deletion and diversification, these loci can vary extensively between individuals in copy number and contain genes that are highly similar, making their analysis technically challenging. Here, we present a comprehensive study of the functional gene segments in the IGHV and TRBV loci, quantifying their copy number and single nucleotide variation in a globally diverse sample of 109 (IGHV) and 286 (TRBV) humans from over a hundred populations. We find that the IGHV and TRBV gene families exhibit starkly different patterns of variation. In particular, with hundreds of copy number haplotypes (instances that have differences in the number of functional gene segments), the IGHV locus has undergone more frequent gene duplication/deletion compared to the TRBV locus, which has only a few copy number haplotypes. In contrast, the TRBV locus has a greater or at least equal propensity to mutate, as evidenced by greater single nucleotide variation, compared to the IGHV locus. Thus, despite common molecular and functional characteristics, the genes that comprise the IGHV and TRBV loci have evolved in strikingly different ways. As well as providing insight into the different evolutionary paths the IGHV and TRBV loci have taken, our results are also important to the adaptive immune repertoire sequencing community, where the lack of frequencies of common alleles and copy number variants is hampering existing analytical pipelines.
0
Paper
Citation3
0
Save
61

T1K: efficient and accurate KIR and HLA genotyping with next-generation sequencing data

Li Song et al.Oct 24, 2023
+2
X
G
L
Abstract Killer immunoglobulin-like receptor (KIR) genes and human leukocyte antigen (HLA) genes are highly polymorphic in a population and play important roles in innate and adaptive immunity. We have developed a novel computational method T1K that can efficiently and accurately infer the KIR or HLA alleles from next-generation sequencing data. T1K is flexible and is compatible with various sequencing platforms including RNA-seq and genomic sequencing data. We applied T1K on CD8+ T cell single-cell RNA-seq data, and identified that KIR2DL4 allele expression levels were enriched in tumor-specific CD8+ T cells.
0

A haplotype-aware de novo assembly of related individuals using pedigree graph

Shilpa Garg et al.May 6, 2020
+2
H
J
S
Motivation: Reconstructing high-quality haplotype-resolved assemblies for related individuals of various species has important applications in understanding Mendelian diseases along with evolutionary and comparative genomics. Through major genomics sequencing efforts such as the Personal Genome Project, the Vertebrate Genome Project (VGP), the Earth Biogenome Project (EBP) and the Genome in a Bottle project (GIAB), a variety of sequencing datasets from mother-father-child trios of various diploid species are becoming available. Current trio assembly approaches are not designed to incorporate long-read sequencing data from parents in a trio, and therefore require relatively high coverages of costly long-read data to produce high-quality assemblies. Thus, building a trio-aware assembler capable of producing accurate and chromosomal-scale diploid genomes in a pedigree, while being cost-effective in terms of sequencing costs, is a pressing need of the genomics community. Results: We present a novel pedigree-graph-based approach to diploid assembly using accurate Illumina data and long-read Pacific Biosciences (PacBio) data from all related individuals, thereby generalizing our previous work on single individuals. We demonstrate the effectiveness of our pedigree approach on a simulated trio of pseudo-diploid yeast genomes with different heterozygosity rates, and real data from Arabidopsis thaliana. We show that we require as little as 30x coverage Illumina data and 15x PacBio data from each individual in a trio to generate chromosomal-scale phased assemblies. Additionally, we show that we can detect and phase variants from generated phased assemblies. Availability: https://github.com/shilpagarg/WHdenovo
0
0
Save
Load More