NH
Ning Huang
Author with expertise in RNA Sequencing Data Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
6
(67% Open Access)
Cited by:
202
h-index:
11
/
i10-index:
12
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

DeepSignal: detecting DNA methylation state from Nanopore sequencing reads using deep-learning

Peng Ni et al.Apr 11, 2019
Abstract Motivation The Oxford Nanopore sequencing enables to directly detect methylation states of bases in DNA from reads without extra laboratory techniques. Novel computational methods are required to improve the accuracy and robustness of DNA methylation state prediction using Nanopore reads. Results In this study, we develop DeepSignal, a deep learning method to detect DNA methylation states from Nanopore sequencing reads. Testing on Nanopore reads of Homo sapiens (H. sapiens), Escherichia coli (E. coli) and pUC19 shows that DeepSignal can achieve higher performance at both read level and genome level on detecting 6 mA and 5mC methylation states comparing to previous hidden Markov model (HMM) based methods. DeepSignal achieves similar performance cross different DNA methylation bases, different DNA methylation motifs and both singleton and mixed DNA CpG. Moreover, DeepSignal requires much lower coverage than those required by HMM and statistics based methods. DeepSignal can achieve 90% above accuracy for detecting 5mC and 6 mA using only 2× coverage of reads. Furthermore, for DNA CpG methylation state prediction, DeepSignal achieves 90% correlation with bisulfite sequencing using just 20× coverage of reads, which is much better than HMM based methods. Especially, DeepSignal can predict methylation states of 5% more DNA CpGs that previously cannot be predicted by bisulfite sequencing. DeepSignal can be a robust and accurate method for detecting methylation states of DNA bases. Availability and implementation DeepSignal is publicly available at https://github.com/bioinfomaticsCSU/deepsignal. Supplementary information Supplementary data are available at bioinformatics online.
1
Citation189
0
Save
1

miniBUSCO: a faster and more accurate reimplementation of BUSCO

Ning Huang et al.Jun 6, 2023
Assembly completeness evaluation of genome assembly is a critical assessment of the accuracy and reliability of genomic data. An incomplete assembly can lead to errors in gene predictions, annotation, and other downstream analyses. BUSCO is one of the most widely used tools for assessing the completeness of genome assembly by comparing the presence of a set of single-copy orthologs conserved across a wide range of taxa. However, the runtime of BUSCO can be long, particularly for some large genome assemblies. It is a challenge for researchers to quickly iterate the genome assemblies or analyze a large number of assemblies.Here, we present miniBUSCO, an efficient tool for assessing the completeness of genome assemblies. miniBUSCO utilizes the protein-to-genome aligner miniprot and the datasets of conserved orthologous genes from BUSCO. Our evaluation of the real human assembly indicates that miniBUSCO achieves a 14-fold speedup over BUSCO. Furthermore, miniBUSCO reports a more accurate completeness of 99.6% than BUSCO's completeness of 95.7%, which is in close agreement with the annotation completeness of 99.5% for T2T-CHM13.https://github.com/huangnengCSU/minibusco .hli@ds.dfci.harvard.edu.Supplementary data are available at Bioinformatics online.
29

Genome-wide Detection of Cytosine Methylations in Plant from Nanopore sequencing data using Deep Learning

Peng Ni et al.Feb 8, 2021
Abstract Methylation states of DNA bases can be detected from native Nanopore reads directly. At present, there are many computational methods that can detect 5mCs in CpG contexts accurately by Nanopore sequencing. However, there is currently a lack of methods to detect 5mCs in non-CpG contexts. In this study, we propose a computational pipeline which can detect 5mC sites in both CpG and non-CpG contexts of plant genomes by using Nanopore sequencing. And we sequenced two model plants Arabidopsis thaliana ( A. thaliana ) and Oryza sativa ( O. sativa ) by using Nanopore sequencing and bisulfite sequencing. The results of our proposed pipeline in the two plants achieved high correlations with bisulfite sequencing: above 0.98, 0.96, 0.85 for CpG, CHG, and CHH (H indicates A, C or T) motif, respectively. Our proposed pipeline also achieved high performance on Brassica nigra ( B. nigra ). Experiments also showed that our proposed pipeline can achieve high performance even with low coverage of reads. Moreover, by using Nanopore sequencing, our proposed pipeline is capable of profiling methylation of more cytosines than bisulfite sequencing.