JC
Jongsu Choi
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
5
(80% Open Access)
Cited by:
26
h-index:
5
/
i10-index:
4
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
39

Unbiased integration of single cell multi-omics data

Jun Dou et al.Dec 11, 2020
Abstract Acquiring accurate single-cell multiomics profiles often requires performing unbiased in silico integration of data matrices generated by different single-cell technologies from the same biological sample. However, both the rows and the columns can represent different entities in different data matrices, making such integration a computational challenge that has only been solved approximately by existing approaches. Here, we present bindSC, a single-cell data integration tool that realizes simultaneous alignment of the rows and the columns between data matrices without making approximations. Using datasets produced by multiomics technologies as gold standard, we show that bindSC generates accurate multimodal co-embeddings that are substantially more accurate than those generated by existing approaches. Particularly, bindSC effectively integrated single cell RNA sequencing (scRNA-seq) and single cell chromatin accessibility sequencing (scATAC-seq) data towards discovering key regulatory elements in cancer cell-lines and mouse cells. It achieved accurate integration of both common and rare cell types (<0.25% abundance) in a novel mouse retina cell atlas generated using the 10x Genomics Multiome ATAC+RNA kit. Further, it achieves unbiased integration of scRNA-seq and 10x Visium spatial transcriptomics data derived from mouse brain cortex samples. Lastly, it demonstrated efficacy in delineating immune cell types via integrating single-cell RNA and protein data. Thus, bindSC, available at https://github.com/KChen-lab/bindSC , can be applied in a broad variety of context to accelerate discovery of complex cellular and biological identities and associated molecular underpinnings in diseases and developing organisms.
39
Citation21
0
Save
0

Comprehensive single-cell atlas of the mouse retina

Jin Li et al.Jan 28, 2024
Abstract Single-cell RNA sequencing (scRNA-seq) has advanced our understanding of cellular heterogeneity at the single-cell resolution by classifying and characterizing cell types in multiple tissues and species. While several mouse retinal scRNA-seq reference datasets have been published, each dataset either has a relatively small number of cells or is focused on specific cell classes, and thus is suboptimal for assessing gene expression patterns across all retina types at the same time. To establish a unified and comprehensive reference for the mouse retina, we first generated the largest retinal scRNA-seq dataset to date, comprising approximately 190,000 single cells from C57BL/6J mouse whole retinas. This dataset was generated through the targeted enrichment of rare population cells via antibody-based magnetic cell sorting. By integrating this new dataset with public datasets, we conducted an integrated analysis to construct the Mouse Retina Cell Atlas (MRCA) for wild-type mice, which encompasses over 330,000 single cells. The MRCA characterizes 12 major classes and 138 cell types. It captured consensus cell type characterization from public datasets and identified additional new cell types. To facilitate the public use of the MRCA, we have deposited it in CELLxGENE, UCSC Cell Browser, and the Broad Single Cell Portal for visualization and gene expression exploration. The comprehensive MRCA serves as an easy-to-use, one-stop data resource for the mouse retina communities.
0
Citation3
0
Save
3

Systematic assessment of the contribution of structural variants to inherited retinal diseases

Shu Wen et al.Jan 3, 2023
ABSTRACT Despite increasing success in determining genetic diagnosis for patients with inherited retinal diseases (IRDs), mutations in about 30% of the IRD cases remain unclear or unsettled after targeted gene panel or whole exome sequencing. In this study, we aimed to investigate the contributions of structural variants (SVs) to settling the molecular diagnosis of IRD with whole-genome sequencing (WGS). A cohort of 755 IRD patients whose pathogenic mutations remain undefined was subjected to WGS. Four SV calling algorithms including include MANTA, DELLY, LUMPY, and CNVnator were used to detect SVs throughout the genome. All SVs identified by any one of these four algorithms were included for further analysis. AnnotSV was used to annotate these SVs. SVs that overlap with known IRD-associated genes were examined with sequencing coverage, junction reads, and discordant read pairs. PCR followed by Sanger sequencing was used to further confirm the SVs and identify the breakpoints. Segregation of the candidate pathogenic alleles with the disease was performed when possible. In total, sixteen candidate pathogenic SVs were identified in sixteen families, including deletions and inversions, representing 2.1% of patients with previously unsolved IRDs. Autosomal dominant, autosomal recessive, and X-linked inheritance of disease-causing SVs were observed in 12 different genes. Among these, SVs in CLN3, EYS, PRPF31 were found in multiple families. Our study suggests that the contribution of SVs detected by short-read WGS is about 0.25% of our IRD patient cohort and is significantly lower than that of single nucleotide changes and small insertions and deletions.
0

RefSoil+: A reference for antimicrobial resistance genes on soil plasmids

TK Dunivin et al.Oct 4, 2018
Plasmids harbor transferable genes that contribute to the functional repertoire of microbial communities, yet their contributions to metagenomes are often overlooked. Environmental plasmids have the potential to spread antibiotic resistance to clinical microbial strains. In soils, high microbiome diversity and high variability in plasmid characteristics present a challenge for studying plasmids. To improve understanding of soil plasmids, we present RefSoil+, a database containing plasmid sequences from 922 soil microorganisms. Soil plasmids were relatively larger than other described plasmids, which is a trait associated with plasmid mobility. There was no relationship between chromosome size and plasmid size or number, suggesting that these genomic traits are independent in soil. Soil-associated plasmids, but not chromosomes, had fewer antibiotic resistance genes than other microorganisms. These data suggest that soils may offer limited opportunity for plasmid-mediated transfer of described antibiotic resistance genes. RefSoil+ can serve as a baseline for the diversity, composition, and host-associations of plasmid-borne functional genes in soil, a utility that will be enhanced as the database expands. Our study improves understanding of soil plasmids and provides a resource for assessing the dynamics of the genes that they carry, especially genes conferring antibiotic resistances.