WH
Weihua Huang
Author with expertise in RNA Sequencing Data Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
12
(58% Open Access)
Cited by:
4,814
h-index:
35
/
i10-index:
75
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

SOAPdenovo2: an empirically improved memory-efficient short-read de novo assembler

Ruibang Luo et al.Dec 1, 2012
There is a rapidly increasing amount of de novo genome assembly using next-generation sequencing (NGS) short reads; however, several big challenges remain to be overcome in order for this to be efficient and accurate. SOAPdenovo has been successfully applied to assemble many published genomes, but it still needs improvement in continuity, accuracy and coverage, especially in repeat regions.To overcome these challenges, we have developed its successor, SOAPdenovo2, which has the advantage of a new algorithm design that reduces memory consumption in graph construction, resolves more repeat regions in contig assembly, increases coverage and length in scaffold construction, improves gap closing, and optimizes for large genome.Benchmark using the Assemblathon1 and GAGE datasets showed that SOAPdenovo2 greatly surpasses its predecessor SOAPdenovo and is competitive to other assemblers on both assembly length and accuracy. We also provide an updated assembly version of the 2008 Asian (YH) genome using SOAPdenovo2. Here, the contig and scaffold N50 of the YH genome were ~20.9 kbp and ~22 Mbp, respectively, which is 3-fold and 50-fold longer than the first published version. The genome coverage increased from 81.16% to 93.91%, and memory consumption was ~2/3 lower during the point of largest memory consumption.
0
Citation4,814
0
Save
0

A novel core genome approach to enable prospective and dynamic monitoring of infectious outbreaks

Helen Aggelen et al.Sep 19, 2018
Whole-genome sequencing is increasingly adopted in clinical settings to identify pathogen transmissions. Currently, such studies are performed largely retrospectively, but to be actionable they need to be carried out prospectively, in which samples are continuously added and compared to previous samples. To enable prospective pathogen comparison, genomic relatedness metrics based on single nucleotide differences must be consistent across time, efficient to compute and reliable for a large variety of samples. The choice of genomic regions to compare, i.e., the core genome, is critical to obtain a good metric. We propose a novel core genome method that selects conserved sequences in the reference genome by comparing its k-mer content to that of publicly available genome assemblies. The conserved-sequence genome is sample set-independent, which enables prospective pathogen monitoring. Based on clinical data sets of 3436 S. aureus, 1523 K. pneumoniae and 348 E. faecium samples, we show that the conserved-sequence genome disambiguates same-patient samples better than a core genome consisting of conserved genes. The conserved-sequence genome confirms outbreak samples with high accuracy: in a set of 2335 S. aureus samples, it correctly identifies 44 out of 45 outbreak samples, whereas the conserved gene method confirms 38 out of 45 outbreak samples.
0

The genomic sequence and comparative genomic analysis of cultivated passion fruit(Passiflora edulis L.)

Yanyan Wu et al.Jan 16, 2019
Cultivated passion fruit is a fruit tree widely cultivated in southern China, but little is known about its genomics, which seriously restricts the molecular genetics research of passion fruit. In this study, we analyzed the 165.7Mb representative genome sequences. The results showed that the passion fruit genome contained a large number of simple sequence repeats (SSR). Compared to the cassava and peach genomes, the passion fruit genome has 23,053 predicted genes. These genes can be aligned to 282 plant genomes. GO annotation indicated that these genes are involved in metabolic pathways of carbohydrates, organic acids, lipids and other molecules. KEGG pathway enrichment assigned these genes into five major categories and 19 secondary functions. Cluster analysis of gene families showed that 12,767 genes could be clustered into 9,868 gene families and 291 unique gene families. On the evolutionary relationship, the passion fruit is closely related to Populus trichocarpa and Ricinus communis, but the rate of evolution is slower. In summary, this genomic analysis result is informative, and will facilitate the future studies on gene functions of passion fruit.
4

RBP45d is required for 5’splice site selection via binding to intronic U-rich elements and interaction with PRP39a inArabidopsis thaliana

Weihua Huang et al.Aug 14, 2022
Abstract A large number of cryptic splice sites in eukaryotic genome are generally dormant unless activated by mutations of authentic splice sites or splicing factors. How cryptic splice sites are used remains unknown in plants. Here, we identified two cryptic splicing regulators, RBP45d and PRP39a that are homologs of yeast U1 auxiliary protein Nam8 and Prp39, respectively, via genetic screening for suppressors of the virescent sot5 mutant, which results from a point mutation at the 5’ splice site (5’ ss) of intron 7. PCR and DNA sequencing data showed that loss-of-function mutations in RBP45d and PRP39a significantly increase the level of a cryptically spliced mRNA that encodes a mutated but partially functional sot5 protein, rescuing sot5 to the WT phenotype. Yeast two hybrid and bimolecular fluorescence complementation assays demonstrated that RBP45d and PRP39a interact each other and also with the U1C, a core subunit of U1 small nuclear ribonucleoprotein (U1 snRNP). RNA electronic mobility shift assay showed that RBP45d directly binds to the uridine (U)-rich RNA sequence downstream of the cryptic 5’ ss. Consistently, our transcriptomic analysis revealed that a set of introns with U-rich sequences are retained in rbp45d . However, we found that other RBP45/47 members do not function redundantly with RBP45d, at least in regulation of cryptic splicing. Collectively, our data suggest that RBP45d is required for 5’ ss selection via binding to intronic U-rich elements and PRP39a in plants. One sentence summary The Arabidopsis RBP45d interacting with U1C and PRP39a is required for 5’ ss selection via binding to intronic U-rich elements.
30

Whole genome sequencing ofBorrelia burgdorferiisolates reveals linked clusters of plasmid-borne accessory genome elements associated with virulence

Jacob Lemieux et al.Feb 27, 2023
Abstract Lyme disease is the most common vector-borne disease in North America and Europe. The clinical manifestations of Lyme disease vary based on the genospecies of the infecting Borrelia burgdorferi spirochete, but the microbial genetic elements underlying these associations are not known. Here, we report the whole genome sequence (WGS) and analysis of 299 patient-derived B. burgdorferi sensu stricto ( Bbss ) isolates from patients in the Eastern and Midwestern US and Central Europe. We develop a WGS-based classification of Bbss isolates, confirm and extend the findings of previous single- and multi-locus typing systems, define the plasmid profiles of human-infectious Bbss isolates, annotate the core and strain-variable surface lipoproteome, and identify loci associated with disseminated infection. A core genome consisting of ∼800 open reading frames and a core set of plasmids consisting of lp17, lp25, lp36, lp28-3, lp28-4, lp54, and cp26 are found in nearly all isolates. Strain-variable (accessory) plasmids and genes correlate strongly with phylogeny. Using genetic association study methods, we identify an accessory genome signature associated with dissemination and define the individual plasmids and genes that make up this signature. Strains within the RST1/WGS A subgroup, particularly a subset marked by the OspC type A genotype, are associated with increased rates of dissemination. OspC type A strains possess a unique constellation of strongly linked genetic changes including the presence of lp56 and lp28-1 plasmids and a cluster of genes that may contribute to their enhanced virulence compared to other genotypes. The patterns of OspC type A strains typify a broader paradigm across Bbss isolates, in which genetic structure is defined by correlated groups of strain-variable genes located predominantly on plasmids, particularly for expression of surface-exposed lipoproteins. These clusters of genes are inherited in blocks through strain-specific patterns of plasmid occupancy and are associated with the probability of invasive infection.
30
0
Save
1

RNA-sequencing reveals a gene expression signature in skeletal muscle of a mouse model of age-associated post-operative functional decline

Samantha Asche-Godin et al.Oct 6, 2021
Abstract This study aimed to characterize the effects of laparotomy on post-operative physical function and skeletal muscle gene expression in C57BL/6N mice at 3, 20 and 24 months of age to investigate late-life vulnerability and resiliency to acute surgical stress. Pre- and post-operative physical functioning were assessed by forelimb grip strength and motor coordination. Laparotomy induced an age-associated post-operative decline in forelimb grip strength that was greatest in the oldest mice. In contrast, while motor coordination declined with increasing age at baseline, it was unaffected by laparotomy. Moreover, baseline physical function as stratified by motor coordination performance (low vs. high functioning) in 24-month-old mice did not differentially affect post-laparotomy reduction in grip strength. RNA sequencing of soleus muscles showed that laparotomy induced age-associated differential gene expression and canonical pathway activation with the greatest effects in the youngest mice. Examples of such age-associated, metabolically important pathways that were only activated in the youngest mice after laparotomy included oxidative phosphorylation and NRF2-mediated oxidative stress response. Analysis of lipid mediators in serum and gastrocnemius muscle showed alterations in profiles of these mediators during aging and confirmed an association between such changes and functional status in gastrocnemius muscle. These findings demonstrate a mouse model of laparotomy which recapitulated some features of post-operative skeletal muscle decline in older adults following surgery, and identified age-associated, laparotomy-induced molecular signatures in skeletal muscles. Future research can build upon this mouse model to study molecular mechanisms of late-life vulnerability to acute surgical stress and resiliency to counter surgery-induced physical decline.
0

Differential Deep RNA Sequencing for Diagnostic Detection of Microbial Infections in Inflammatory Cardiomyopathy

Weihua Huang et al.Jun 24, 2024
BACKGROUND: Inflammatory heart disease can be triggered by a variety of causes, both infectious and noninfectious in nature. We hypothesized that inflammatory cardiomyopathy is potentially related to microbial infection. METHODS: In this retrospective study, we used deep RNA sequencing on formalin-fixed paraffin-embedded heart tissue specimens to detect pathogenic agents. We first investigated 4 single-sample cases to test the feasibility of this diagnostic protocol and further 3 control-sample paired cases to improve the protocol with differential metatranscriptomics next-generation sequencing (mtNGS) analysis. RESULTS: We demonstrate that differential mtNGS allows identification of various microbials as potentially pathogenic, for example, Cutibacterium acnes , Corynebacterium aurimucosum , and Pseudomonas denitrificans , which are usually commensal in healthy individuals. Differential mtNGS also allows characterization of human host response in each individual by profiling alterations of gene expression, networked pathways, and inferred immune cell compositions, information of which is beneficial for us to understand different etiologies and immunity roles in each case. Additionally, differential mtNGS allows the identification of genetic variants in patients that may contribute to their susceptibility to particular microbial infections. CONCLUSIONS: The demonstrated power of differential mtNGS in simultaneous capture of both the infectious microbial(s) and the status of human host immune response could help us better understand the pathogenesis of complex inflammatory cardiomyopathy, if conducted on a larger scale of the population. The developed differential mtNGS method could also shed light on its translation and adoption of such a laboratory test in clinic practice, allowing for a more effective diagnosis to guide therapeutic treatment of the disease.
Load More