HX
Haitao Xiang
Author with expertise in RNA Sequencing Data Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
10
(90% Open Access)
Cited by:
1,379
h-index:
22
/
i10-index:
37
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Spatiotemporal transcriptomic atlas of mouse organogenesis using DNA nanoball-patterned arrays

Ao Chen et al.May 1, 2022
+66
M
S
A
Spatially resolved transcriptomic technologies are promising tools to study complex biological processes such as mammalian embryogenesis. However, the imbalance between resolution, gene capture, and field of view of current methodologies precludes their systematic application to analyze relatively large and three-dimensional mid- and late-gestation embryos. Here, we combined DNA nanoball (DNB)-patterned arrays and in situ RNA capture to create spatial enhanced resolution omics-sequencing (Stereo-seq). We applied Stereo-seq to generate the mouse organogenesis spatiotemporal transcriptomic atlas (MOSTA), which maps with single-cell resolution and high sensitivity the kinetics and directionality of transcriptional variation during mouse organogenesis. We used this information to gain insight into the molecular basis of spatial cell heterogeneity and cell fate specification in developing tissues such as the dorsal midbrain. Our panoramic atlas will facilitate in-depth investigation of longstanding questions concerning normal and abnormal mammalian development.
0
Citation690
0
Save
0

Genome sequence of foxtail millet (Setaria italica) provides insights into grass evolution and biofuel potential

Gengyun Zhang et al.May 13, 2012
+34
Z
X
G
Completion of genome sequences for the diploid Setaria italica reveals features of C4 photosynthesis that could enable improvement of the polyploid biofuel crop switchgrass (Panicum virgatum). The genetic basis of biotechnologically relevant traits, including drought tolerance, photosynthetic efficiency and flowering control, is also highlighted. Foxtail millet (Setaria italica), a member of the Poaceae grass family, is an important food and fodder crop in arid regions and has potential for use as a C4 biofuel. It is a model system for other biofuel grasses, including switchgrass and pearl millet. We produced a draft genome (∼423 Mb) anchored onto nine chromosomes and annotated 38,801 genes. Key chromosome reshuffling events were detected through collinearity identification between foxtail millet, rice and sorghum including two reshuffling events fusing rice chromosomes 7 and 9, 3 and 10 to foxtail millet chromosomes 2 and 9, respectively, that occurred after the divergence of foxtail millet and rice, and a single reshuffling event fusing rice chromosome 5 and 12 to foxtail millet chromosome 3 that occurred after the divergence of millet and sorghum. Rearrangements in the C4 photosynthesis pathway were also identified.
0
Citation653
0
Save
231

Spatiotemporal transcriptomic atlas of mouse organogenesis using DNA nanoball patterned arrays

Ao Chen et al.Jan 19, 2021
+60
K
M
A
SUMMARY Spatially resolved transcriptomic technologies are promising tools to study cell fate decisions in a physical microenvironment, which is fundamental for enhancing our knowledge of mammalian development. However, the imbalance between resolution, transcript capture and field of view of current methodologies precludes their systematic application to analyze relatively large and three-dimensional mid- and late-gestation mammalian embryos. Here, we combined DNA nanoball (DNB) patterned arrays and tissue RNA capture to create SpaTial Enhanced REsolution Omics-sequencing (Stereo-seq). This approach allows transcriptomic profiling of large histological sections with high resolution and sensitivity. We have applied Stereo-seq to study the kinetics and directionality of transcriptional variation in a time course of mouse organogenesis. We used this information to gain insight into the molecular basis of regional specification, neuronal migration and differentiation in the developing brain. Furthermore, we mapped the expression of a panel of developmental disease-related loci on our global transcriptomic maps to define the spatiotemporal windows of tissue vulnerability. Our panoramic atlas constitutes an essential resource to investigate longstanding questions concerning normal and abnormal mammalian development.
231
Citation26
0
Save
0

EPIP: MHC-I epitope prediction integrating mass spectrometry derived motifs and tissue-specific expression profiles

Weipeng Hu et al.Mar 5, 2019
+16
W
L
W
Abstract Background Accurate prediction of epitopes presented by human leukocyte antigen (HLA) is crucial for personalized cancer immunotherapies targeting T cell epitopes. Mass spectrometry (MS) profiling of eluted HLA ligands, which provides high-throughput measurements of HLA associated peptides in vivo , can be used to faithfully model the presentation of epitopes on the cell surface. In addition, gene expression profiles measured by RNA-seq data in a specific cell/tissue type can significantly improve the performance of epitope presentation prediction. However, although large amount of high-quality MS data of HLA-bound peptides is being generated in recent years, few provide matching RNA-seq data, which makes incorporating gene expression into epitope prediction difficult. Methods We collected publicly available HLA peptidome and matching RNA-seq data of 34 cell lines derived from various sources. We built position score specific matrixes (PSSMs) for 21 HLA-I alleles based on these MS data, then used logistic regression (LR) to model the relationship among PSSM score, gene expression and peptide length to predict whether a peptide could be presented in each of the cell line. We further built a universal LR model, termed Epitope Presentation Integrated Prediction (EPIP), based on more than 180,000 unique HLA ligands collected from public sources and ~3,000 HLA ligands generated by ourselves, to predict epitope presentation for 66 common HLA-I alleles. Results When evaluating EPIP on large, independent HLA eluted ligand datasets, it performed substantially better than other popular methods, including MixMHCpred (v2.0), NetMHCpan (v4.0), and MHCflurry (v1.2.2), with an average 0.1% positive predictive value (PPV) of 52.01%, compared to 37.24%, 36.96%, 24.90% and 23.76% achieved by MixMHCpred, NetMHCpan-4.0 (EL), NetMHCpan-4.0 (BA) and MHCflurry, respectively. It is also comparable to EDGE, a recent deep learning-based model that is not publicly available, on predicting epitope presentation and selecting immunogenic cancer neoantigens. However, the simplicity and flexibility of EPIP makes it easier to be applied in diverse situations, and we demonstrated this by generating MS data for the HCC4006 cell line and adding the support of HLA-A*33:03 to EPIP. EPIP is publicly available as a web tool < http://epip.genomics.cn/ >. Conclusions we have developed an easy to use, publicly available epitope prediction tool, EPIP, that incorporates information from both MS and RNA-seq data, and demonstrated its superior performance over existing public methods.
0
Citation5
0
Save
5

Landscapes and dynamic diversifications of B-cell receptor repertoires in COVID-19 patients

Haitao Xiang et al.Dec 29, 2020
+40
P
X
H
ABSTRACT Severe acute respiratory syndrome coronavirus 2 (SARS-CoV-2) has caused the pandemic of coronavirus disease 2019 (COVID-19). Great international efforts have been put into the development of prophylactic vaccines and neutralizing antibodies. However, the knowledge about the B cell immune response induced by the SARS-CoV-2 virus is still limited. Here, we report a comprehensive characterization of the dynamics of immunoglobin heavy chain (IGH) repertoire in COVID-19 patients. By using next-generation sequencing technology, we examined the temporal changes in the landscape of the patient’s immunological status, and found dramatic changes in the IGH within the patients’ immune system after the onset of COVID-19 symptoms. Although different patients have distinct immune responses to SARS-CoV-2 infection, by employing clonotype overlap, lineage expansion and clonotype network analyses, we observed a higher clonotype overlap and substantial lineage expansion of B cell clones during 2-3 weeks of illness, which is of great importance to B-cell immune responses. Meanwhile, for preferences of V gene usage during SARS-CoV-2 infection, IGHV3-74 and IGHV4-34 and IGHV4-39 in COVID-19 patients were more abundant than that of healthy controls. Overall, we present an immunological resource for SARS-CoV-2 that could promote both therapeutic development as well as mechanistic research.
5
Citation2
0
Save
0

Gene mapping of nine agronomic traits and genome assembly by resequencing a foxtail millet RIL population

Xiliang Ni et al.Aug 15, 2016
+17
H
X
X
ABSTRACT Foxtail millet ( Setaria italica ) provides food and fodder in semi-arid regions and infertile land. Resequencing of 184 foxtail millet recombinant inbred lines (RILs) was carried out to aid essential research on foxtail millet improvement. Bin map were constructed based on the RILs’ recombination data. By anchoring some unseated scaffolds and filling gaps, we update two original millet reference genomes Zhanggu and Yugu to produce second editions. Gene mapping of nine agronomic traits were done based on this RIL population. The genome resequencing and QTL mapping provided important tools for foxtail millet research and breeding. Resequencing of the RILs could also provide an effective way for high quantity genome assembly and gene identification.
0
Citation1
0
Save
4

IntroSpect: motif-guided immunopeptidome database building tool to improve the sensitivity of HLA binding peptide identification

Le Zhang et al.Aug 4, 2021
+7
H
G
L
ABSTRACT Although database search tools originally developed for shotgun proteome have been widely used in immunopeptidomic mass spectrometry identifications, they have been reported to achieve undesirably low sensitivities and/or high false positive rates as a result of the hugely inflated search space caused by the lack of specific enzymic digestions in immunopeptidome. To overcome such a problem, we have developed a motif-guided immunopeptidome database building tool named IntroSpect, which is designed to first learn the peptide motifs from high confidence hits in the initial search and then build a targeted database for refined search. Evaluated on three representative HLA class I datasets, IntroSpect can improve the sensitivity by an average of 80% comparing to conventional searches with unspecific digestions while maintaining a very high accuracy (∼96%) as confirmed by synthetic validation experiments. A distinct advantage of IntroSpect is that it does not depend on any external HLA data so that it performs equally well on both well-studied and poorly-studied HLA types, unlike a previously developed method SpectMHC. We have also designed IntroSpect to keep a global FDR that can be conveniently controlled, similar to conventional database search engines. Finally, we demonstrate the practical value of IntroSpect by discovering neoantigens from MS data directly. IntroSpect is freely available at https://github.com/BGI2016/IntroSpect .
4
Citation1
0
Save
1

Proteomic characterization identifies clinically relevant subgroups of soft tissue sarcoma

Shaoshuai Tang et al.Feb 15, 2024
+23
R
Y
S
Abstract Soft tissue sarcoma is a broad family of mesenchymal malignancies exhibiting remarkable histological diversity. We portray the proteomic landscape of 272 soft tissue sarcomas representing 12 major subtypes. Hierarchical classification finds the similarity of proteomic features between angiosarcoma and epithelial sarcoma, and elevated expression of SHC1 in AS and ES is correlated with poor prognosis. Moreover, proteomic clustering classifies patients of soft tissue sarcoma into 3 proteomic clusters with diverse driven pathways and clinical outcomes. In the proteomic cluster featured with the high cell proliferation rate, APEX1 and NPM1 are found to promote cell proliferation and drive the progression of cancer cells. The classification based on immune signatures defines three immune subtypes with distinctive tumor microenvironments. Further analysis illustrates the potential association between immune evasion markers (PD-L1 and CD80) and tumor metastasis in soft tissue sarcoma. Overall, this analysis uncovers sarcoma-type-specific changes in proteins, providing insights about relationships of soft tissue sarcoma.
1
Citation1
0
Save
3

High-throughput screening of functional neo-antigens and their specific TCRs via the Jurkat reporter system combined with droplet microfluidics

Yijian Li et al.Feb 21, 2023
+28
X
H
Y
Summary T-cell receptor (TCR)-engineered T cells can precisely recognize a broad repertoire of targets derived from both intracellular and surface proteins of tumor cells. TCR-T adoptive cell therapy has shown safety and promising efficacy in solid tumor immunotherapy. However, antigen-specific functional TCR screening is time-consuming and expensive, which limits its application clinically. Here, we developed a novel integrated antigen-TCR screening platform based on droplet microfluidics technology, enabling high-throughput peptide-major histocompatibility complex (pMHC) library-to-TCR library screening with high sensitivity and low background signal. We introduced DNA barcoding technology to label peptide antigen candidate-loaded antigen-presenting cells (APCs) and Jurkat reporter cells to check the specificity of pMHC-TCR candidates. Coupled with the next-generation sequencing pipeline, interpretation of the DNA barcodes and the gene expression level of the Jurkat T-cell activation pathway provided a clear peptide-MHC-TCR recognition relationship. Our proof-of-principle study demonstrates that the platform could achieve unbiased pMHC-TCR library-on-library screening, which is expected to be used in the cross-reactivity and off-target testing of candidate pMHC-TCR libraries in clinical applications.
0

Dynamic chromosome rearrangements of the white-spotted bamboo shark shed light on cartilaginous fish diversification mechanisms

Yaolei Zhang et al.Apr 8, 2019
+37
H
H
Y
Cartilaginous fishes have a very high phenotypical diversity, a phenomenon for which the mechanisms have been largely unexplored. Here, we report the genome of the white-spotted bamboo shark as the first chromosome-level genome assembly of cartilaginous fish. Using this genome, we illustrated a dynamic chromosome rearrangement process in the bamboo shark, which resulted in the formation of 13 chromosomes, all of which were sparsely distributed with conserved genes and fast-evolving. We found the fast-evolving chromosomes to be enriched in immune-related genes with two chromosomes harboring the major genes for developing the single-chain antibody. We also found chromosome rearrangements to have resulted in the loss of two genes (p2rx3 and p2rx5) which we also showed were involved in cartilage development using a CRISPR/Cas9 approach in zebrafish. Our study highlighted the significance of chromosome rearrangements in the phenotypical evolution of cartilaginous fishes, providing clues to inform further studies on mechanisms for fish diversification.