HZ
Hong Zhao
Author with expertise in RNA Sequencing Data Analysis
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
3
(100% Open Access)
Cited by:
13
h-index:
38
/
i10-index:
78
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

dbDEMC 3.0: Functional Exploration of Differentially Expressed miRNAs in Cancers of Human and Model Organisms

Feng Xu et al.Feb 10, 2022
Abstract microRNAs (miRNAs) are important regulators in gene expression. The deregulation of miRNA expression is widely reported in the transformation from physiological to pathological state of cells. A large amount of differentially expressed miRNAs (DEMs) have been identified in various human cancers by using high-throughput technologies, such as microarray and miRNA-seq. Through mining of published researches with high-throughput experiment information, the database of differentially expressed miRNAs in human cancers (dbDEMC) was constructed with the aim of providing a systematic resource for the storage and query of the DEMs. Here we report an update of the dbDEMC to version 3.0, containing two-fold more data entries than the previous version, now including also data from mouse and rat. The dbDEMC 3.0 contains 3,268 unique DEMs in 40 different cancer types. The current datasets for differential expression analysis have expanded to 9 generalized categories. Moreover, the current release integrates functional annotations of DEMs obtained from experimentally validated targets. The annotations can greatly benefit integrative analysis of DEMs. In summary, dbDEMC 3.0 provides a valuable resource for characterizing molecular functions and regulatory mechanisms of DEMs in human cancers. The dbDEMC 3.0 is freely accessible at https://www.biosino.org/dbDEMC .
1
Citation10
0
Save
8

Optimized SMRT-UMI protocol produces highly accurate sequence datasets from diverse populations â€“ application to HIV-1 quasispecies

Dylan Westfall et al.Feb 24, 2023
Abstract Pathogen diversity resulting in quasispecies can enable persistence and adaptation to host defenses and therapies. However, accurate quasispecies characterization can be impeded by errors introduced during sample handling and sequencing which can require extensive optimizations to overcome. We present complete laboratory and bioinformatics workflows to overcome many of these hurdles. The Pacific Biosciences s ingle m olecule r eal- t ime platform was used to sequence PCR amplicons derived from cDNA templates tagged with u niversal m olecular identifiers (SMRT-UMI). Optimized laboratory protocols were developed through extensive testing of different sample preparation conditions to minimize between-template recombination during PCR and the use of UMI allowed accurate template quantitation as well as removal of point mutations introduced during PCR and sequencing to produce a highly accurate consensus sequence from each template. Handling of the large datasets produced from SMRT-UMI sequencing was facilitated by a novel bioinformatic pipeline, Probabilistic Offspring Resolver for Primer IDs (PORPIDpipeline), that automatically filters and parses reads by sample, identifies and discards reads with UMIs likely created from PCR and sequencing errors, generates consensus sequences, checks for contamination within the dataset, and removes any sequence with evidence of PCR recombination or early cycle PCR errors, resulting in highly accurate sequence datasets. The optimized SMRT-UMI sequencing method presented here represents a highly adaptable and established starting point for accurate sequencing of diverse pathogens. These methods are illustrated through characterization of human immunodeficiency virus (HIV) quasispecies. Author Summary There is a great need to understand the genetic diversity of pathogens in an accurate and timely manner, but many errors can be introduced during the sample handling and sequencing steps which may prevent accurate analyses. In some cases, the errors introduced during these steps can be indistinguishable from real genetic variation and prevent analyses from identifying true sequence variation present in the pathogen population. There are established methods which can help to prevent these types of errors, but can involve many different steps and variables, all of which must be optimized and tested together to ensure the desired effect. Here we show results from testing different methods on a set of HIV+ blood plasma samples and arrive at a streamlined laboratory protocol and bioinformatic pipeline which prevents or corrects for different types of errors that can arise in sequence datasets. These methods should be an accessible starting point for anyone wanting accurate sequencing without extensive optimizations.
8
Citation2
0
Save
0

Tumor-specific changes in Kaposi sarcoma-associated herpesvirus genomes in Ugandan adults with Kaposi sarcoma

Jan Santiago et al.May 4, 2020
Abstract Intra-host evolved tumor virus variants have provided insights into the risk, pathogenesis and treatment responses of associated cancers. However, the intra-host variability of Kaposi sarcoma-associated herpesvirus (KSHV), the etiologic agent of Kaposi sarcoma (KS), has not been explored at the whole viral genome level. An accurate and detailed description of KSHV intra-host diversity in whole KSHV genomes from matching tumors and oral swabs from Ugandan adults with HIV-associated KS was obtained by deep, short read sequencing, using duplex unique molecular identifiers (dUMI) â€“ random double-stranded oligonucleotides that barcode individual DNA molecules before library amplification. This allowed suppression of PCR and sequencing errors down to âˆ¼10 âˆ’9 /base. KSHV genomes were assembled de novo , and identified rearrangements were confirmed by PCR. 131-kb KSHV genome sequences, excluding major repeat regions and averaging 2.3 Ã— 10 4 reads/base, were successfully obtained from 23 specimens from 9 individuals, including 7 tumor-oral pairs. Sampling more than 100 viral genomes in at least one specimen per individual showed that KSHV genomes were virtually homogeneous within samples and within individuals at the point mutational level. Heterogeneity, if present, was due to point mutations and genomic rearrangements in tumors. In 2 individuals, the same mutations were found in distinct KS tumors. The K8.1 gene was inactivated in tumors from 3 individuals, and all KSHV genomic aberrations retained the region surrounding the first major internal repeat (IR1). These findings suggest that lytic gene alterations may contribute to KS tumorigenesis or persistence. Author summary Kaposi sarcoma (KS) is a leading cancer in sub-Saharan Africa and in those with HIV co-infection. Infection by Kaposi sarcoma-associated herpesvirus (KSHV) is necessary for KS, yet why only few KSHV infections develop into KS is largely unknown. While strain differences or mutations in other tumor viruses are known to affect the risk and progression of their associated cancers, whether KSHV genetic variation is important to the natural history of KS is unclear. Most studies of KSHV diversity have characterized only âˆ¼4% of its 165-kb genome and may have been impacted by PCR or cloning artifacts. Here, we performed highly sensitive, single-molecule sequencing of whole KSHV genomes in paired KS tumors and oral swabs from 9 individuals with KS. We found that KSHV genomes were virtually identical within individuals, with no evidence of quasispecies formation nor multistrain infection. However, KSHV genome aberrations and inactivating mutations appeared to be a common, tumor-associated phenomenon, with some mutations shared by distinct tumors within an individual. Certain regions of the KSHV genome featured prominently among tumor-associated mutations, suggesting that they are important contributors to the pathogenesis or persistence of KS.
0
Citation1
0
Save