YZ
Yangyong Zhu
Author with expertise in Coronavirus Disease 2019 Research
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
13
(69% Open Access)
Cited by:
1,728
h-index:
38
/
i10-index:
87
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

The Challenges of Data Quality and Data Quality Assessment in the Big Data Era

Li Cai et al.May 22, 2015
Y
L
High-quality data are the precondition for analyzing and using big data and for guaranteeing the value of the data. Currently, comprehensive analysis and research of quality standards and quality assessment methods for big data are lacking. First, this paper summarizes reviews of data quality research. Second, this paper analyzes the data characteristics of the big data environment, presents quality challenges faced by big data, and formulates a hierarchical data quality framework from the perspective of data users. This framework consists of big data quality dimensions, quality characteristics, and quality indexes. Finally, on the basis of this framework, this paper constructs a dynamic assessment process for data quality. This process has good expansibility and adaptability and can meet the needs of big data quality assessment. The research results enrich the theoretical scope of big data and lay a solid foundation for the future by establishing an assessment model and studying evaluation algorithms.
0
Citation780
0
Save
0

A Chaperome Subnetwork Safeguards Proteostasis in Aging and Neurodegenerative Disease

Marc Brehme et al.Oct 24, 2014
+9
T
C
M
Chaperones are central to the proteostasis network (PN) and safeguard the proteome from misfolding, aggregation, and proteotoxicity. We categorized the human chaperome of 332 genes into network communities using function, localization, interactome, and expression data sets. During human brain aging, expression of 32% of the chaperome, corresponding to ATP-dependent chaperone machines, is repressed, whereas 19.5%, corresponding to ATP-independent chaperones and co-chaperones, are induced. These repression and induction clusters are enhanced in the brains of those with Alzheimer’s, Huntington’s, or Parkinson’s disease. Functional properties of the chaperome were assessed by perturbation in C. elegans and human cell models expressing Aβ, polyglutamine, and Huntingtin. Of 219 C. elegans orthologs, knockdown of 16 enhanced both Aβ and polyQ-associated toxicity. These correspond to 28 human orthologs, of which 52% and 41% are repressed, respectively, in brain aging and disease and 37.5% affected Huntingtin aggregation in human cells. These results identify a critical chaperome subnetwork that functions in aging and disease.
0
Citation509
0
Save
0

Big Data for Remote Sensing: Challenges and Opportunities

Mingmin Chi et al.Sep 13, 2016
+3
J
A
M
Every day a large number of Earth observation (EO) spaceborne and airborne sensors from many different countries provide a massive amount of remotely sensed data. Those data are used for different applications, such as natural hazard monitoring, global climate change, urban planning, etc. The applications are data driven and mostly interdisciplinary. Based on this it can truly be stated that we are now living in the age of big remote sensing data. Furthermore, these data are becoming an economic asset and a new important resource in many applications. In this paper, we specifically analyze the challenges and opportunities that big data bring in the context of remote sensing applications. Our focus is to analyze what exactly does big data mean in remote sensing applications and how can big data provide added value in this context. Furthermore, this paper describes the most challenging issues in managing, processing, and efficient exploitation of big data for remote sensing problems. In order to illustrate the aforementioned aspects, two case studies discussing the use of big data in remote sensing are demonstrated. In the first test case, big data are used to automatically detect marine oil spills using a large archive of remote sensing data. In the second test case, content-based information retrieval is performed using high-performance computing (HPC) to extract information from a large database of remote sensing images, collected after the terrorist attack to the World Trade Center in New York City. Both cases are used to illustrate the significant challenges and opportunities brought by the use of big data in remote sensing applications.
0
Paper
Citation422
0
Save
12

ORF3a mediated-incomplete autophagy facilitates SARS-CoV-2 replication

Yafei Qu et al.Nov 12, 2020
+13
Y
X
Y
ABSTRACT SARS-CoV-2 is the causative agent for the COVID-19 pandemic and there is an urgent need to understand the cellular response to SARS-CoV-2 infection. Beclin-1 is an essential scaffold autophagy protein that forms two distinct subcomplexes with modulators Atg14 and UVRAG, responsible for autophagosome formation and maturation, respectively. In the present study, we found that SARS-CoV-2 infection triggers an incomplete autophagy response, elevated autophagosome formation but impaired autophagosome maturation, and declined autophagy by genetic knockout of essential autophagic genes reduces SARS-CoV-2 replication efficiency. By screening 28 viral proteins of SARS-CoV-2, we demonstrated that expression of ORF3a alone is sufficient to induce incomplete autophagy. Mechanistically, SARS-CoV-2 ORF3a interacts with autophagy regulator UVRAG to facilitate Beclin-1-Vps34-Atg14 complex but selectively inhibit Beclin-1-Vps34-UVRAG complex. Interestingly, although SARS-CoV ORF3a shares 72.7% amino acid identity with the SARS-CoV-2 ORF3a, the former had no effect on cellular autophagy response. Thus, our findings provide the mechanistic evidence of possible takeover of host autophagy machinery by ORF3a to facilitate SARS-CoV-2 replication and raises the possibility of targeting the autophagic pathway for the treatment of COVID-19.
12
Citation9
0
Save
6

Development of highly potent non-covalent inhibitors of SARS-CoV-2 3CLpro

Ningke Hou et al.Aug 11, 2022
+30
C
W
N
Abstract The SARS-CoV-2 virus is the causal agent of the ongoing pandemic of coronavirus disease 2019 (COVID-19). There is an urgent need for potent, specific antiviral compounds against SARS-CoV-2. The 3C-like protease (3CLpro) is an essential enzyme for the replication of SARS-CoV-2 and other coronaviruses, and thus is a target for coronavirus drug discovery. Nearly all inhibitors of coronavirus 3CLpro reported so far are covalent inhibitors. Here, we report the development of specific, non-covalent inhibitors of 3CLpro. The most potent one, WU-04, effectively blocks SARS-CoV-2 replications in human cells with EC 50 values in the 10-nM range. WU-04 also inhibits the 3CLpro of SARS-CoV and MERS-CoV with high potency, indicating that it is a pan-inhibitor of coronavirus 3CLpro. WU-04 showed anti-SARS-CoV-2 activity similar to that of PF-07321332 (Nirmatrelvir) in K18-hACE2 mice when the same dose was administered orally. Thus, WU-04 is a promising drug candidate for coronavirus treatment. One-Sentence Summary A oral non-covalent inhibitor of 3C-like protease effectively inhibits SARS-CoV-2 replication.
6
Citation5
0
Save
9

A novel cell culture system modeling the SARS-CoV-2 life cycle

Xiaohui Ju et al.Dec 13, 2020
+9
J
J
X
ABSTRACT Severe acute respiratory syndrome coronavirus 2 (SARS-CoV-2) causes the global pandemic of COVID-19, and no effective antiviral agents and vaccines are available. SARS-CoV-2 is classified as a biosafety level-3 (BLS-3) agent, impeding the basic research into its biology and the development of effective antivirals. Here, we developed a biosafety level-2 (BSL-2) cell culture system for production of transcription and replication-competent SARS-CoV-2 virus-like-particles (trVLP). This trVLP expresses a reporter gene (GFP) replacing viral nucleocapsid gene (N), which is required for viral genome packaging and virion assembly (SARS-CoV-2-GFP/ΔN trVLP). The complete viral life cycle can be achieved and exclusively confined in the cells ectopically expressing SARS-CoV or SARS-CoV-2 N proteins, but not MERS-CoV N. Genetic recombination of N supplied in trans into viral genome was not detected, as evidenced by sequence analysis after one-month serial passages in the N-expressing cells. Moreover, intein-mediated protein trans-splicing approach was utilized to split the viral N gene into two independent vectors, and the ligated viral N protein could function in trans to recapitulate entire viral life cycle, further securing the biosafety of this cell culture model. Based on this BSL-2 SARS-CoV-2 cell culture model, we developed a 96-well format high throughput screening for antivirals discovery. We identified salinomycin, tubeimoside I, monensin sodium, lycorine chloride and nigericin sodium as potent antivirals against SARS-CoV-2 infection. Collectively, we developed a convenient and efficient SARS-CoV-2 reverse genetics tool to dissect the virus life cycle under a BSL-2 condition. This powerful tool should accelerate our understanding of SARS-CoV-2 biology and its antiviral development.
9
Citation1
0
Save
12

Comparative analysis reveals the species-specific genetic determinants of ACE2 required for SARS-CoV-2 entry

Wenlin Ren et al.Sep 21, 2020
+16
X
G
W
ABSTRACT Coronavirus interaction with its viral receptor is a primary genetic determinant of host range and tissue tropism. SARS-CoV-2 utilizes ACE2 as the receptor to enter host cell in a species-specific manner. We and others have previously shown that ACE2 orthologs from New World monkey, koala and mouse cannot interact with SARS-CoV-2 to mediate viral entry, and this defect can be restored by humanization of the restrictive residues in New World monkey ACE2. To better understand the genetic determinants behind the ability of ACE2 orthologs to support viral entry, we compared koala and mouse ACE2 sequences with that of human and identified the key residues in koala and mouse ACE2 that restrict viral receptor activity. Humanization of these critical residues rendered both koala and mouse ACE2 capable of binding the spike protein and facilitating viral entry. The single mutation that allowed for mouse ACE2 to serve as a viral receptor provides a potential avenue for the development of SARS-CoV-2 mouse model.
12
Citation1
0
Save
1

Susceptibilities of human ACE2 genetic variants in coronavirus infection

Wenlin Ren et al.Jul 19, 2021
+18
H
Y
W
ABSTRACT The COVID-19 pandemic, caused by SARS-CoV-2, has resulted in more than 1603 million cases worldwide and 3.4 million deaths (as of May 2021), with varying incidences and death rates among regions/ethnicities. Human genetic variation can affect disease progression and outcome, but little is known about genetic risk factors for SARS-CoV-2 infection. The coronaviruses SARS-CoV, SARS-CoV-2 and HCoV-NL63 all utilize the human protein angiotensin-converting enzyme 2 (ACE2) as the receptor to enter cells. We hypothesized that the genetic variability in ACE2 may contribute to the variable clinical outcomes of COVID-19. To test this hypothesis, we first conducted an in silico investigation of single-nucleotide polymorphisms (SNPs) in the coding region of ACE2 gene. We then applied an integrated approach of genetics, biochemistry and virology to explore the capacity of select ACE2 variants to bind coronavirus spike protein and mediate viral entry. We identified the ACE2 D355N variant that restricts the spike protein-ACE2 interaction and consequently limits infection both in vitro and in vivo . In conclusion, ACE2 polymorphisms could modulate susceptibility to SARS-CoV-2, which may lead to variable disease severity.
1
Citation1
0
Save
0

TCGA-Assembler 2: Software Pipeline for Retrieval and Processing of TCGA/CPTAC Data

Lin Wei et al.Nov 5, 2017
+3
Y
Z
L
Motivation: The Cancer Genome Atlas (TCGA) program has produced huge amounts of cancer genomics data providing unprecedented opportunities for research. In 2014, we developed TCGA-Assembler (Zhu et al, 2014), a software pipeline for retrieval and processing of public TCGA data. In 2016, TCGA data were transferred from the TCGA data portal to the Genomic Data Commons (GDC), which is supported by a different set of data storage and retrieval mechanisms. In addition, new proteomics data of TCGA samples have been generated by the Clinical Proteomic Tumor Analysis Consortium (CPTAC) program, which were not available for downloading through TCGA-Assembler. It is desirable to acquire and integrate data from both GDC and CPTAC. Results: We develop TCGA-Assembler 2 (TA2) to automatically download and integrate data from GDC and CPTAC. We make substantial improvement on the functionality of TA2 to enhance user experience and software performance. TA2 together with its previous version have helped more than 2,000 researchers from 64 countries to access and utilize TCGA and CPTAC data in their research. Availability of TA2 will continue to allow existing and new users to conduct reproducible research based on TCGA and CPTAC data. Availability: http://www.compgenome.org/TCGA-Assembler/ .
0

Tumor Evolution Decoder (TED): Unveiling Tumor Evolution Based on Mutation Profiles of Subclones or Single Cells

Yangyong Zhu et al.May 9, 2019
+2
L
S
Y
Cancer cells constantly evolve accumulating somatic mutations. To describe the tumor evolution process, we develop the Tumor Evolution Decoder (TED), a novel algorithm for constructing phylogenetic tree based on somatic mutation profiles of tumor subclones or single cells. TED takes a unique strategy that reduces the total number of duplicated mutations and dropout mutations in the tumor evolution process, which has not been explored by previous phylogenetic tree methods. TED allows multiple types of somatic mutations as input, such as point mutations, copy number alterations, gene fusion, and their combinations. Theoretical properties of TED are derived while its numerical performance is examined using simulated data. We applied TED to analyze single-cell sequencing data from an essential thrombocythemia tumor and a clear cell renal cell carcinoma, to investigate the ancestral relationships between tumor cells, and found genes related to disease initialization and development mutated in the early steps of evolution. We also applied TED to the subclones of a breast invasive carcinoma and provided important insights on the evolution and metastasis of the tumor.
Load More