YH
Yufei Huang
Author with expertise in RNA Methylation and Modification in Gene Expression
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
23
(65% Open Access)
Cited by:
788
h-index:
47
/
i10-index:
154
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Particle Filtering

Petar Djurić et al.Sep 1, 2003
+4
J
J
P
Recent developments have demonstrated that particle filtering is an emerging and powerful methodology, using Monte Carlo methods, for sequential signal processing with a wide range of applications in science and engineering. It has captured the attention of many researchers in various communities, including those of signal processing, statistics and econometrics. Based on the concept of sequential importance sampling and the use of Bayesian theory, particle filtering is particularly useful in dealing with difficult nonlinear and non-Gaussian problems. The underlying principle of the methodology is the approximation of relevant distributions with random measures composed of particles (samples from the space of the unknowns) and their associated weights. First, we present a brief review of particle filtering theory; and then we show how it can be used for resolving many problems in wireless communications. We demonstrate its application to blind equalization, blind detection over flat fading channels, multiuser detection, and estimation and detection of space-time codes in fading channels.
0

reguloGPT: Harnessing GPT for Knowledge Graph Construction of Molecular Regulatory Pathways

Xidong Wu et al.Jan 30, 2024
+9
Y
S
X
Molecular Regulatory Pathways (MRPs) are crucial for understanding biological functions. Knowledge Graphs (KGs) have become vital in organizing and analyzing MRPs, providing structured representations of complex biological interactions. Current tools for mining KGs from biomedical literature are inadequate in capturing complex, hierarchical relationships and contextual information about MRPs. Large Language Models (LLMs) like GPT-4 offer a promising solution, with advanced capabilities to decipher the intricate nuances of language. However, their potential for end-to-end KG construction, particularly for MRPs, remains largely unexplored.
0

Quantification of Methane Emissions from Cold Heavy Oil Production with Sand Extraction in Alberta and Saskatchewan, Canada

Tianran Han et al.Jun 4, 2024
+14
M
O
T
Cold heavy oil production with sand (CHOPS) is an extraction process for heavy oil in Canada, with the potential to lead to higher CH4 venting than conventional oil sites, that have not been adequately characterized. In order to quantify CH4 emissions from CHOPS activities, a focused aerial measurement campaign was conducted in the Canadian provinces of Alberta and Saskatchewan in June 2018. Total CH4 emissions from each of 10 clusters of CHOPS wells (containing 22–167 well sites per cluster) were derived using a mass balance computation algorithm that uses in situ wind data measurement on board aircraft. Results show that there is no statistically significant difference in CH4 emissions from CHOPS wells between the two provinces. Cluster-aggregated emission factors (EF) were determined using correspondingly aggregated production volumes. The average CH4 EF was 70.4 ± 36.9 kg/m3 produced oil for the Alberta wells and 55.1 ± 13.7 kg/m3 produced oil for the Saskatchewan wells. Using these EF and heavy oil production volumes reported to provincial regulators, the annual CH4 emissions from CHOPS were estimated to be 121% larger than CHOPS emissions extracted from Canada's National Inventory Report (NIR) for Saskatchewan. The EF were found to be positively correlated with the percentage of nonpiped production volumes in each cluster, indicating higher emissions for nonpiped wells while suggesting an avenue for methane emission reductions. A comparison with recent measurements indicates relatively limited effectiveness of regulations for Saskatchewan compared to those in Alberta. The results of this study indicate the substantial contribution of CHOPS operations to the underreporting observed in the NIR and provide measurement-based EF that can be used to develop improved emissions inventories for this sector and mitigate CH4 emissions from CHOPS operations.
0

PPFlow: Target-Aware Peptide Design with Torsional Flow Matching

Haitao Lin et al.Mar 8, 2024
+6
Y
Z
H
Abstract Therapeutic peptides have proven to have great pharmaceutical value and potential in recent decades. However, methods of AI-assisted peptide drug discovery are not fully explored. To fill the gap, we propose a target-aware peptide design method called PPF low , based on conditional flow matching on torus manifolds, to model the internal geometries of torsion angles for the peptide structure design. Besides, we establish a protein-peptide binding dataset named PPBench2024 to fill the void of massive data for the task of structure-based peptide drug design and to allow the training of deep learning methods. Extensive experiments show that PPF low reaches state-of-the-art performance in tasks of peptide drug generation and optimization in comparison with baseline models, and can be generalized to other tasks including docking and side-chain packing.
0

Predicting sites of epitranscriptome modifications using unsupervised representation learning based on generative adversarial networks

Sirajul Salekin et al.Apr 29, 2020
+4
M
Y
S
ABSTRACT Epitranscriptome is an exciting area that studies different types of modifications in transcripts and the prediction of such modification sites from the transcript sequence is of significant interest. However, the scarcity of positive sites for most modifications imposes critical challenges for training robust algorithms. To circumvent this problem, we propose MR-GAN, a generative adversarial network (GAN) based model, which is trained in an unsupervised fashion on the entire pre-mRNA sequences to learn a low dimensional embedding of transcriptomic sequences. MR-GAN was then applied to extract embeddings of the sequences in a training dataset we created for eight epitranscriptome modifications, including m 6 A, m 1 A, m 1 G, m 2 G, m 5 C, m 5 U, 2′- O -Me, Pseudouridine (Ψ) and Dihydrouridine (D), of which the positive samples are very limited. Prediction models were trained based on the embeddings extracted by MR-GAN. We compared the prediction performance with the one-hot encoding of the training sequences and SRAMP, a state-of-the-art m 6 A site prediction algorithm and demonstrated that the learned embeddings outperform one-hot encoding by a significant margin for up to 15% improvement. Using MR-GAN, we also investigated the sequence motifs for each modification type and uncovered known motifs as well as new motifs not possible with sequences directly. The results demonstrated that transcriptome features extracted using unsupervised learning could lead to high precision for predicting multiple types of epitranscriptome modifications, even when the data size is small and extremely imbalanced.
0
Citation1
0
Save
0

Machine Learning and Deep Learning challenges for building 2′O site prediction

Milad Mostavi et al.May 12, 2020
Y
M
Abstract 2′-O-methylation (2′O) is one of the abundant post-transcriptional RNA modifications which can be found in all types of RNA. Detection and functional analysis of 2′O methylation have become challenging problems for biologists ever since its discovery. This paper addresses computational challenges for building Machine Learning and Deep Learning models for predicting 2′O sites. In particular, the impact of sequence length containing 2′O site, embedding method and the type of predictive model are each investigated separately. 30 different predictive models are built and each showed the impact of the mentioned parameters. The area under the precision-recall and receiving operating characteristics curves are utilized to test imbalanced case scenarios in the real world. By comparing the performance of these models, it is shown that embedding methods are crucial for Machine Learning models. However, they do not improve the performance of Deep Learning models. Furthermore, the best predictive model was further investigated to extract significant nucleotides surrounding 2′O sites. Interestingly, based on the significant score matrix achieved by all 2′O samples, it is depicted that model pays the highest attention at the location that the dominant 2′O motifs exist. Dataset and all of the codes are available at https://github.com/MMostavi/2_O_Me_sitePred
0
Citation1
0
Save
0

A New Methodology for High Spatiotemporal Resolution Measurements of Air Volatile Organic Compounds: From Sampling to Data Deconvolution

Yanrong Yang et al.Jul 3, 2024
+10
C
J
Y
Monitoring of volatile organic compounds (VOCs) in air is crucial for understanding their atmospheric impacts and advancing their emission reduction plans. This study presents an innovative integrated methodology suitable for achieving semireal-time high spatiotemporal resolution three-dimensional measurements of VOCs from ground to hundreds of meters above ground. The methodology integrates an active AirCore sampler, custom-designed for deployment from unmanned aerial vehicles (UAV), a proton-transfer-reaction mass spectrometry (PTR-MS) for sample analysis, and a data deconvolution algorithm for improved time resolution for measurements of multiple VOCs in air. The application of the deconvolution technique significantly improves the signal strength of data from PTR-MS analysis of AirCore samples and enhances their temporal resolution by 4 to 8 times to 4-11 s. A case study demonstrates that the methodology can achieve sample collection and analysis of VOCs within 45 min, resulting in >120-360 spatially resolved data points for each VOC measured and achieving a horizontal resolution of 20-55 m at a UAV flight speed of 5 m/s and a vertical resolution of 5 m. This methodology presents new possibilities for acquiring 3-dimensional spatial distributions of VOC concentrations, effectively tackling the longstanding challenge of characterizing three-dimensional VOC distributions in the lowest portion of the atmospheric boundary layer.
0
Paper
Citation1
0
Save
0

CRISPR-Cas9 screening of KSHV-transformed cells identifies XPO1 as a vulnerable target of cancer cells

Marion Gruffaz et al.Apr 6, 2019
+7
J
H
M
The abnormal proliferation of cancer cells is driven by deregulated oncogenes or tumor suppressors, of which the cancer vulnerable genes are attractive therapeutic targets. Targeting mislocalization of oncogenes and tumor suppressors resulting from aberrant nuclear export is effective for inhibiting growth transformation of cancer cells. We performed a CRISPR-Cas9 screening in a unique model of matched primary and oncogenic KSHV-transformed cells, and identified genes that were pro-growth and growth-suppressive of both cells, of which exportin XPO1 was demonstrated to be critical for the survival of transformed cells. Using XPO1 inhibitor KPT-8602 and by siRNA knockdown, we confirmed the essential role of XPO1 in cell proliferation and growth transformation of KSHV-transformed cells, and cell lines of other cancers including gastric cancer and liver cancer. XPO1 inhibition induced cell cycle arrest through p53 activation but the mechanism of p53 activation differed among different types of cancer cells. p53 activation depended on the formation of PML nuclear bodies in gastric cancer and liver cancer cells. Mechanistically, XPO1 inhibition induced relocalization of autophagy adaptor protein p62 (SQSTM1), recruiting p53 for activation in PML nuclear bodies. Taken together, we have identified novel pro-growth and growth-suppressive genes of primary and cancer cells, and demonstrated XPO1 as a vulnerable target of cancer cells. XPO1 inhibition induces cell arrest through a novel PML- and p62-dependent mechanism of p53 activation in some types of cancer cells.
0

Spatial mapping of greenhouse gases using a UAV monitoring platform over a megacity in China

Tianran Han et al.Aug 10, 2024
+10
Y
C
T
Urban environments are recognized as main anthropogenic contributors to greenhouse gas (GHG) emissions, characterized by unevenly distributed emission sources over the urban environments. However, spatial GHG distributions in urban regions are typically obtained through monitoring at only a limited number of locations, or through model studies, which can lead to incomplete insights into the heterogeneity in the spatial distribution of GHGs. To address such information gap and to evaluate the spatial representation of a planned GHG monitoring network, a custom-developed atmospheric sampler was deployed on a UAV platform in this study to map the CO
0

CASTOR1 phosphorylation as a predictor of survival in male patients with KRAS-mutated lung adenocarcinoma.

Suet Loo et al.Jun 1, 2024
+7
X
G
S
e20015 Background: Lung cancer, a leading global cause of cancer-related mortality, necessitates enhanced prognostic markers for improved treatment outcomes. This study focuses on the predictive value of phosphorylated cytosolic arginine sensor for mTORC1 subunit 1 at S14 (pCASTOR1) in lung adenocarcinoma (LUAD) patients, specifically in males with KRAS mutations. Methods: This retrospective study, approved by University of Pittsburgh IRB, utilized formaline-fixed paraffin embedded primary tissues from two independent cohorts of patients who underwent thoracic surgical procedures at the University of Pittsburgh Medical Center (UPMC) from 2002 to 2011. Comprehensive clinical, demographical and pathological information was obtained from UPMC Cancer Registry, with cases lacking incomplete information excluded from analysis. Study endpoints included overall survival (OS) and relapse-free survival (RFS). An antibody targeting pCASTOR1 was employed to analyze LUAD tumor and adjacent non-tumor lung tissues from both cohorts. A pathologist, blinded to patient information and survival outcomes, conducted scoring in 5% increments. Scores were categorized as low or high pCASTOR1 based on second or third quartile. Correlations between pCASTOR1 scores and OS/RFS were examined, stratifying by clinical, pathological, demographic, or genotype data. Univariate OS and RFS analyses were conducted using the Kaplan-Meier method and log-rank test, while multivariate survival significance was assessed via Cox regression analysis. Additionally, unpaired T-tests were utilized to compare pCASTOR1 levels between non-tumor and tumor cells. A significance threshold of p < 0.05 was applied for all analyses. Results: Tumor cells exhibited significantly elevated pCASTOR1 scores compared to non-tumor cells in both cohorts (P < 0.05). High pCASTOR1 scores predicted poor OS (HR = 3.3, P = 0.0008) and RFS (HR = 3.0, P = 0.0035) in male patients with KRAS mutations in Cohort 1. pCASTOR1 remained an independent predictor for OS (HR = 4.1, P = 0.0047) and RFS (HR = 3.5, P = 0.0342) after controlling for other factors. Cohort 2, comprised solely of smokers with incomplete genotype information, validated these findings, with high pCASTOR1 scores correlating with worse OS (HR = 4.8, P = 0.0363). Notably, in early-stage LUAD, elevated pCASTOR1 scores were associated with significantly worse OS (HR = 3.3, P = 0.0176) and RFS (HR = 3.1, P = 0.0277) in male patients with KRAS mutations in Cohort 1, and worse OS (HR = 5.0, P = 0.0069) and RFS (HR = 5.0, P = 0.0069) in Cohort 2, akin to late-stage patients. Conclusions: Elevated pCASTOR1 score serves as a robust biomarker predicting poor OS and RFS in male LUAD patients with KRAS mutations, offering potential clinical utility in optimizing treatment strategies for this subgroup.
Load More