YD
Youping Deng
Author with expertise in Diversity and Function of Gut Microbiome
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
18
(94% Open Access)
Cited by:
2,510
h-index:
53
/
i10-index:
170
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

The MicroArray Quality Control (MAQC)-II study of common practices for the development and validation of microarray-based predictive models

Leming Shi et al.Jul 30, 2010
+97
W
G
L
The Microarray Quality Control consortium pitted 36 teams against each other to evaluate methods for creating genomic classifiers, computational tools for interpreting gene expression profiles. The performance of the classifiers on blinded validation data—and metadata on the analytic methods—reveal the challenges facing the field. Gene expression data from microarrays are being applied to predict preclinical and clinical endpoints, but the reliability of these predictions has not been established. In the MAQC-II project, 36 independent teams analyzed six microarray data sets to generate predictive models for classifying a sample with respect to one of 13 endpoints indicative of lung or liver toxicity in rodents, or of breast cancer, multiple myeloma or neuroblastoma in humans. In total, >30,000 models were built using many combinations of analytical methods. The teams generated predictive models without knowing the biological meaning of some of the endpoints and, to mimic clinical reality, tested the models on data that had not been used for training. We found that model performance depended largely on the endpoint and team proficiency and that different approaches generated models of similar performance. The conclusions and recommendations from MAQC-II should be useful for regulatory agencies, study committees and independent investigators that evaluate methods for global gene expression analysis.
0

The concordance between RNA-seq and microarray data depends on chemical treatment and transcript abundance

Charles Wang et al.Aug 21, 2014
+43
P
B
C
A comparison of RNA-seq and microarray data from samples treated with diverse drugs highlights a dependency of cross-platform concordance on treatment effect. The concordance of RNA-sequencing (RNA-seq) with microarrays for genome-wide analysis of differential gene expression has not been rigorously assessed using a range of chemical treatment conditions. Here we use a comprehensive study design to generate Illumina RNA-seq and Affymetrix microarray data from the same liver samples of rats exposed in triplicate to varying degrees of perturbation by 27 chemicals representing multiple modes of action (MOAs). The cross-platform concordance in terms of differentially expressed genes (DEGs) or enriched pathways is linearly correlated with treatment effect size (R2≈0.8). Furthermore, the concordance is also affected by transcript abundance and biological complexity of the MOA. RNA-seq outperforms microarray (93% versus 75%) in DEG verification as assessed by quantitative PCR, with the gain mainly due to its improved accuracy for low-abundance transcripts. Nonetheless, classifiers to predict MOAs perform similarly when developed using data from either platform. Therefore, the endpoint studied and its biological complexity, transcript abundance and the genomic application are important factors in transcriptomic research and for clinical and regulatory decision making.
0
Citation475
0
Save
0

Risk Factors Associated With Clinical Outcomes in 323 Coronavirus Disease 2019 (COVID-19) Hospitalized Patients in Wuhan, China

Ling Hu et al.May 2, 2020
+16
Y
S
L
Abstract Background With evidence of sustained transmission in more than 190 countries, coronavirus disease 2019 (COVID-19) has been declared a global pandemic. Data are urgently needed about risk factors associated with clinical outcomes. Methods A retrospective review of 323 hospitalized patients with COVID-19 in Wuhan was conducted. Patients were classified into 3 disease severity groups (nonsevere, severe, and critical), based on initial clinical presentation. Clinical outcomes were designated as favorable and unfavorable, based on disease progression and response to treatments. Logistic regression models were performed to identify risk factors associated with clinical outcomes, and log-rank test was conducted for the association with clinical progression. Results Current standard treatments did not show significant improvement in patient outcomes. By univariate logistic regression analysis, 27 risk factors were significantly associated with clinical outcomes. Multivariate regression indicated age &gt;65 years (P &lt; .001), smoking (P = .001), critical disease status (P = .002), diabetes (P = .025), high hypersensitive troponin I (&gt;0.04 pg/mL, P = .02), leukocytosis (&gt;10 × 109/L, P &lt; .001), and neutrophilia (&gt;75 × 109/L, P &lt; .001) predicted unfavorable clinical outcomes. In contrast, the administration of hypnotics was significantly associated with favorable outcomes (P &lt; .001), which was confirmed by survival analysis. Conclusions Hypnotics may be an effective ancillary treatment for COVID-19. We also found novel risk factors, such as higher hypersensitive troponin I, predicted poor clinical outcomes. Overall, our study provides useful data to guide early clinical decision making to reduce mortality and improve clinical outcomes of COVID-19.
0

Comparison of RNA-seq and microarray-based models for clinical endpoint prediction

Wenqian Zhang et al.Jun 24, 2015
+73
F
Y
W
Gene expression profiling is being widely applied in cancer research to identify biomarkers for clinical endpoint prediction. Since RNA-seq provides a powerful tool for transcriptome-based applications beyond the limitations of microarrays, we sought to systematically evaluate the performance of RNA-seq-based and microarray-based classifiers in this MAQC-III/SEQC study for clinical endpoint prediction using neuroblastoma as a model.We generate gene expression profiles from 498 primary neuroblastomas using both RNA-seq and 44 k microarrays. Characterization of the neuroblastoma transcriptome by RNA-seq reveals that more than 48,000 genes and 200,000 transcripts are being expressed in this malignancy. We also find that RNA-seq provides much more detailed information on specific transcript expression patterns in clinico-genetic neuroblastoma subgroups than microarrays. To systematically compare the power of RNA-seq and microarray-based models in predicting clinical endpoints, we divide the cohort randomly into training and validation sets and develop 360 predictive models on six clinical endpoints of varying predictability. Evaluation of factors potentially affecting model performances reveals that prediction accuracies are most strongly influenced by the nature of the clinical endpoint, whereas technological platforms (RNA-seq vs. microarrays), RNA-seq data analysis pipelines, and feature levels (gene vs. transcript vs. exon-junction level) do not significantly affect performances of the models.We demonstrate that RNA-seq outperforms microarrays in determining the transcriptomic characteristics of cancer, while RNA-seq and microarray-based models perform similarly in clinical endpoint prediction. Our findings may be valuable to guide future studies on the development of gene expression-based predictive models and their implementation in clinical practice.
0
Citation342
0
Save
0

A comparison of batch effect removal methods for enhancement of prediction performance using MAQC-II microarray gene expression data

Jie Luo et al.Jul 30, 2010
+22
A
M
J
Batch effects are the systematic non-biological differences between batches (groups) of samples in microarray experiments due to various causes such as differences in sample preparation and hybridization protocols. Previous work focused mainly on the development of methods for effective batch effects removal. However, their impact on cross-batch prediction performance, which is one of the most important goals in microarray-based applications, has not been addressed. This paper uses a broad selection of data sets from the Microarray Quality Control Phase II (MAQC-II) effort, generated on three microarray platforms with different causes of batch effects to assess the efficacy of their removal. Two data sets from cross-tissue and cross-platform experiments are also included. Of the 120 cases studied using Support vector machines (SVM) and K nearest neighbors (KNN) as classifiers and Matthews correlation coefficient (MCC) as performance metric, we find that Ratio-G, Ratio-A, EJLR, mean-centering and standardization methods perform better or equivalent to no batch effect removal in 89, 85, 83, 79 and 75% of the cases, respectively, suggesting that the application of these methods is generally advisable and ratio-based methods are preferred.
119

A global metagenomic map of urban microbiomes and antimicrobial resistance

David Danko et al.Jun 1, 2021
+662
E
D
D
We present a global atlas of 4,728 metagenomic samples from mass-transit systems in 60 cities over 3 years, representing the first systematic, worldwide catalog of the urban microbial ecosystem. This atlas provides an annotated, geospatial profile of microbial strains, functional characteristics, antimicrobial resistance (AMR) markers, and genetic elements, including 10,928 viruses, 1,302 bacteria, 2 archaea, and 838,532 CRISPR arrays not found in reference databases. We identified 4,246 known species of urban microorganisms and a consistent set of 31 species found in 97% of samples that were distinct from human commensal organisms. Profiles of AMR genes varied widely in type and density across cities. Cities showed distinct microbial taxonomic signatures that were driven by climate and geographic differences. These results constitute a high-resolution global metagenomic atlas that enables discovery of organisms and genes, highlights potential public health and forensic applications, and provides a culture-independent view of AMR burden in cities.
119
Citation190
2
Save
13

Single-cell RNA sequencing reveals characteristics of myeloid cells in pulmonary post-acute sequelae of SARS-CoV-2

Hyundong Yoon et al.Aug 2, 2023
+8
B
L
H
Abstract Background Although our understanding of the immunopathology and subsequent risk and severity of COVID-19 disease is evolving, a detailed account of immune responses that contribute to the long-term consequences of pulmonary complication in COVID-19 infection remain unclear. Few studies have detailed the immune and cytokine profiles associated with post-acute sequalae of SARS-CoV-2 infection with persistent pulmonary symptoms (PPASC). However, the dysregulation of the immune system that drives pulmonary sequelae in COVID-19 survivors and PASC sufferers remains largely unknown. Results To characterize the immunological features of pulmonary PASC (PPASC), we performed droplet-based single-cell RNA sequencing to study the transcriptomic profiles of peripheral blood mononuclear cells (PBMCs) from participants naïve to SARS-CoV-2 (Control) and infected with SARS-CoV-2 with chronic pulmonary symptoms (PPASC). We analyzed more than 34,139 PBMCs by integrating our dataset with previously reported control datasets (GSM4509024) cell distribution. In total, 11 distinct cell populations were identified based on the expression of canonical markers. The proportion of myeloid-lineage cells ([MLCs]; CD14 + /CD16 + monocytes and dendritic cells) was increased in PPASC compared to controls. MLCs from PPASC displayed up-regulation of genes associated with pulmonary symptoms/fibrosis, while glycolysis metabolism-related genes were downregulated. Similarly, pathway analysis showed that fibrosis- related ( VEGF , WNT , and SMAD ) and cell death pathways were up-regulated, but immune pathways were down-regulated in PPASC. In PPASC, we observed interactive VEGF ligand- receptor pairs among MLCs, and network modules in CD14 + (cluster 4) and CD16 + (Cluster 5) monocytes displayed a significant enrichment for biological pathways linked to adverse COVID- 19 outcomes, fibrosis, and angiogenesis. Further analysis revealed a distinct metabolic alteration in MLCs with a down-regulation of glycolysis/gluconeogenesis in PPASC compared to SARS- CoV-2 naïve samples. Conclusion This study offers valuable insights into the immune response and cellular landscape in PPASC. The presence of elevated MLC levels and their corresponding gene signatures associated with fibrosis, immune response suppression, and altered metabolic states suggests their potential role as a driver of PPASC.
13
Citation2
0
Save
19

The First Geographic Identification by Country of Sustainable Mutations of SARS-COV2 Sequence Samples: Worldwide Natural Selection Trends

Mohammadamin Mahmanzar et al.Jul 19, 2022
+7
K
S
M
The high mutation rates of RNA viruses, coupled with short generation times and large population sizes, allow viruses to evolve rapidly and adapt to the host environment. The rapidity of viral mutation also causes problems in developing successful vaccines and antiviral drugs. With the spread of SARS-CoV-2 worldwide, thousands of mutations have been identified, some of which have relatively high incidences, but their potential impacts on virus characteristics remain unknown. The present study analyzed mutation patterns, SARS-CoV-2 AASs retrieved from the GISAID database containing 10,500,000 samples. Python 3.8.0 programming language was utilized to pre-process FASTA data, align to the reference sequence, and analyze the sequences. Upon completion, all mutations discovered were categorized based on geographical regions and dates. The most stable mutations were found in nsp1(8% S135R), nsp12(99.3% P323L), nsp16 (1.2% R216C), envelope (30.6% T9I), spike (97.6% D614G), and Orf8 (3.5% S24L), and were identified in the United States on April 3, 2020, and England, Gibraltar, and, New Zealand, on January 1, 2020, respectively. The study of mutations is the key to improving understanding of the function of the SARS-CoV-2, and recent information on mutations helps provide strategic planning for the prevention and treatment of this disease. Viral mutation studies could improve the development of vaccines, antiviral drugs, and diagnostic assays designed with high accuracy, specifically useful during pandemics. This knowledge helps to be one step ahead of new emergence variants.
19
Citation2
0
Save
19

The SEQC2 Epigenomics Quality Control (EpiQC) Study: Comprehensive Characterization of Epigenetic Methods, Reproducibility, and Quantification

Jonathan Foox et al.Dec 14, 2020
+54
C
J
J
Abstract Cytosine modifications in DNA such as 5-methylcytosine (5mC) underlie a broad range of developmental processes, maintain cellular lineage specification, and can define or stratify cancer and other diseases. However, the wide variety of approaches available to interrogate these modifications has created a need for harmonized materials, methods, and rigorous benchmarking to improve genome-wide methylome sequencing applications in clinical and basic research. Here, we present a multi-platform assessment and a global resource for epigenetics research from the FDA’s Epigenomics Quality Control (EpiQC) Group. The study design leverages seven human cell lines that are designated as reference materials and publicly available from the National Institute of Standards and Technology (NIST) and Genome in a Bottle (GIAB) consortium. These samples were subject to a variety of genome-wide methylation interrogation approaches across six independent laboratories, with a primary focus was on 5-methylcytosine modifications. Each sample was processed in two or more technical replicates by three whole-genome bisulfite sequencing (WGBS) protocols (TruSeq DNA methylation, Accel-NGS MethylSeq, and SPLAT), oxidative bisulfite sequencing (TrueMethyl), one enzymatic deamination method (EMseq), targeted methylation sequencing (Illumina Methyl Capture EPIC), and single-molecule long-read nanopore sequencing from Oxford Nanopore Technologies. After rigorous quality assessment and comparison to Illumina EPIC methylation microarrays and testing on a range of algorithms (Bismark, BitmapperBS, BWAMeth, and GemBS), we found overall high concordance between assays (R=0.87-R0.93), differences in efficency of read mapping and CpG capture and coverage, and platform performance. The data provided herein can guide continued used of these reference materials in epigenomics assays, as well as provide best practices for epigenomics research and experimental design in future studies.
19
Citation2
0
Save
1

SARS2Mutant: SARS-CoV-2 Amino-Acid Mutation Atlas Database

Karim Rahimian et al.Jun 13, 2022
+3
B
M
K
Abstract The coronavirus disease 19 (COVID-19) is a highly pathogenic viral infection of the novel severe acute respiratory syndrome coronavirus 2 (SARS-CoV-2), resulting in the global pandemic of 2020.A lack of therapeutic and preventive approaches including drugs and vaccines, has quickly posed significant threats to world health. A comprehensive understanding of the evolution and natural selection of SARS-CoV-2 against the host interaction and symptoms at the phenotype level could impact the candidate’s strategies for the fight against this virus. SARS -CoV- 2 Mutation (SARS2Mutant, http://sars2mutant.com/ ) is a database thatprovides comprehensive analysis results based on tens of thousands of high-coverage and high-quality SARS-CoV-2 complete protein sequences. The structure of this database is designed to allow the users to search for the three different strategies among amino acid substitution mutations based on gene name, geographical zone or comparative analysis. Based on each strategy, five data types are available to the user: mutated sample frequencies, heat map of the mutated amino acid positions, timeline trend for mutation survivals and natural selections, and charts of changed amino acids and their frequencies. Due to the increase of virus protein sequence samples published daily showing the latest trends of current results, all sequences in the database are reanalyzed and updated monthly. The SARS-2Mutant database providescurrent analysis and updated data of mutation patterns and conserved regions, helpful in developing and designing targeted vaccines, primers and drug discoveries.
1
Citation2
0
Save
Load More