YL
Yaqing Liu
Author with expertise in Real-Time Polymerase Chain Reaction
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
9
(100% Open Access)
Cited by:
26
h-index:
8
/
i10-index:
6
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
3

Quartet metabolite reference materials for assessing inter-laboratory reliability and data integration of metabolomic profiling

Naixin Zhang et al.Nov 3, 2022
Abstract Various laboratory-developed metabolomic methods lead to big challenges in inter-laboratory comparability and effective integration of diverse datasets. As part of the Quartet Project, we established a publicly available suite of four metabolite reference materials derived from B-lymphoblastoid cell lines from a family quartet of parents and monozygotic twin daughters. We generated comprehensive LC-MS based metabolomic data from the Quartet reference materials using targeted and untargeted strategies in different laboratories. High variabilities in the qualitative and quantitative metabolomic measurements were observed across laboratories. Moreover, the Quartet multi-sample-based quality metrics were developed for objectively assessing the reliability of metabolomic profiling in detecting intrinsic biological differences among difference groups of samples. Importantly, the ratio-based metabolomic profiling, by scaling the absolute values of a study sample relative to those of a universal reference sample, enables data integration in long-term measurements across difference laboratories or platforms. Thus, we constructed the ratio-based high-confidence reference datasets between two reference samples, providing “ground truth” for inter-laboratory proficiency test, which enables objective assessment of various metabolomic methods. Our study provided the community with rich resources and best practice for objective assessment of inter-laboratory measurements and data integration, ensuring reliable large-scale and longitudinal metabolomic profiling.
1

The Quartet Data Portal: integration of community-wide resources for multiomics quality control

Jingcheng Yang et al.Sep 28, 2022
Abstract The implementation of quality control for multiomic data requires the widespread use of well-characterized reference materials, reference datasets, and related resources. The Quartet Data Portal was built to facilitate community access to such rich resources established in the Quartet Project. A convenient platform is provided for users to request the DNA, RNA, protein, and metabolite reference materials, as well as multi-level datasets generated across omics, platforms, labs, protocols, and batches. Interactive visualization tools are offered to assist users to gain a quick understanding of the reference datasets. Crucially, the Quartet Data Portal continuously collects, evaluates, and integrates the community-generated data of the distributed Quartet multiomic reference materials. In addition, the portal provides analysis pipelines to assess the quality of user-submitted multiomic data. Furthermore, the reference datasets, performance metrics, and analysis pipelines will be improved through periodic review and integration of multiomic data submitted by the community. Effective integration of the evolving technologies via active interactions with the community will help ensure the reliability of multiomics-based biological discoveries. The Quartet Data Portal is accessible at https://chinese-quartet.org . Graphical Abstract
1
Citation9
0
Save
1

Correcting batch effects in large-scale multiomic studies using a reference-material-based ratio method

Ying Yu et al.Oct 21, 2022
Abstract Batch effects are notorious technical variations that are common in multiomic data and may result in misleading outcomes. With the era of big data, tackling batch effects in multiomic integration is urgently needed. As part of the Quartet Project for quality control and data integration of multiomic profiling, we comprehensively assess the performances of seven batch-effect correction algorithms (BECAs) for mitigating the negative impact of batch effects in multiomic datasets, including transcriptomics, proteomics, and metabolomics. Performances are evaluated based on accuracy of identifying differentially expressed features, robustness of predictive models, and the ability of accurately clustering cross-batch samples into their biological sample groups. Ratio-based method is more effective and widely applicable than others, especially in cases when batch effects are highly confounded with biological factors of interests. We further provide practical guidelines for the implementation of ratio-based method using universal reference materials profiled with study samples. Our findings show the promise for eliminating batch effects and enhancing data integration in increasingly large-scale, cross-batch multiomic studies.
0

A comprehensive personal omics clinical interpreter based on genomic and transcriptomic profiles

Yaqing Liu et al.Feb 23, 2024
Abstract Advances in precision medicine rely on the accurate identification and analysis of molecular alterations for personalized diagnostic, prognostic, and therapeutic decision-making. A critical obstacle is the integration of heterogeneous interpretations of clinically actionable alterations from various knowledgebases. Here, we present the Personal Omics Interpreter (POI), a web-based application engineered to aggregate and interpret therapeutic options, including targeted, immunological, and chemotherapeutic agents, by leveraging personal genomic and transcriptomic profiles. POI employs the Precision Medicine Knowledgebase (PreMedKB), an updated harmonized resource we previously reported, to annotate the clinically actionable somatic variants. It further incorporates a predictive algorithm to broaden therapeutic options according to established gene-gene interactions and offers insights into phenotypic responses of chemotherapeutic agents through phasing germline diplotypes. Validated against three cohort datasets encompassing over 22,000 cancer patients, POI demonstrates consistently high matching rates (94.7 ∼ 95.6%) between patients and suggested therapies, highlighting its potential in supporting precision-driven informed treatment strategies.
1

Quartet RNA reference materials and ratio-based reference datasets for reliable transcriptomic profiling

Ying Yu et al.Sep 27, 2022
Abstract As an indispensable tool for transcriptome-wide analysis of differential gene expression, RNA sequencing (RNAseq) has demonstrated great potential in clinical applications. However, the lack of multi-group RNA reference materials of biological relevance and the corresponding reference datasets for assessing the reliability of RNAseq hampers its wide clinical applications wherein the underlying biological differences among study groups are often small. As part of the Quartet Project for quality control and data integration of multiomic profiling, we established four RNA reference materials derived from immortalized B-lymphoblastoid cell lines from four members of a monozygotic twin family. Additionally, we constructed ratio-based transcriptome-wide reference datasets using multi-batch RNAseq datasets, providing “ground truth” for benchmarking. Moreover, Quartet-sample-based quality metrics were developed for assessing reliability of RNAseq technology in terms of intra-batch proficiency and cross-batch reproducibility. The small intrinsic biological differences among the Quartet samples enable sensitive assessment of performance of transcriptomic measurements. The Quartet RNA reference materials combined with the reference datasets can be served as unique resources for assessing data quality and improving reliability of transcriptomic profiling.
1

Plasma-free samples for transcriptomic analysis: a potential alternative to whole blood samples

Qingwang Chen et al.Apr 28, 2023
Abstract RNA sequencing (RNAseq) technology has become increasingly important in precision medicine and clinical diagnostics and emerged as a powerful tool for identifying protein-coding genes, performing differential gene analysis, and inferring immune cell composition. Human peripheral blood samples are widely used for RNAseq, providing valuable insights into individual biomolecular information. Blood samples can be classified as whole blood (WB), plasma, serum, and remaining sediment samples, including plasma-free blood (PFB) and serum-free blood (SFB) samples. However, the feasibility of using PFB and SFB samples for transcriptome analysis remains unclear. In this study, we aimed to assess the viability of employing PFB or SFB samples as substitute RNA sources in transcriptomic analysis and performed a comparative analysis of WB, PFB, and SFB samples for different applications. Our results revealed that PFB samples exhibit greater similarity to WB samples in terms of protein-coding gene expression patterns, differential expression gene profiling, and immunological characterizations, suggesting that PFB can be a viable alternative for transcriptomic analysis. This contributes to the optimization of blood sample utilization and the advancement of precision medicine research.
0

Toward Best Practice in Identifying Subtle Differential Expression with RNA-seq: A Real-World Multi-Center Benchmarking Study Using Quartet and MAQC Reference Materials

Duo Wang et al.Dec 10, 2023
Abstract Translating RNA-seq into clinical diagnostics requires ensuring the reliability of detecting clinically relevant subtle differential expressions, such as those between different disease subtypes or stages. Moreover, cross-laboratory reproducibility and consistency under diverse experimental and bioinformatics workflows urgently need to be addressed. As part of the Quartet project, we presented a comprehensive RNA-seq benchmarking study utilizing Quartet and MAQC RNA reference samples spiked with ERCC controls in 45 independent laboratories, each employing their in-house RNA-seq workflows. We assessed the data quality, accuracy and reproducibility of gene expression and differential gene expression and compared over 40 experimental processes and 140 combined differential analysis pipelines based on multiple ‘ground truths’. Here we show that real-world RNA-seq exhibited greater inter-laboratory variations when detecting subtle differential expressions between Quartet samples. Experimental factors including mRNA enrichment methods and strandedness, and each bioinformatics step, particularly normalization, emerged as primary sources of variations in gene expression and have a more pronounced impact on the subtle differential expression measurement. We underscored the pivotal role of experimental execution over the choice of experimental protocols, the importance of strategies for filtering low-expression genes, and optimal gene annotation and analysis tools. In summary, this study provided best practice recommendations for the development, optimization, and quality control of RNA-seq for clinical diagnostic purposes.
3

Ratio-based quantitative multiomics profiling using universal reference materials empowers data integration

Yuanting Zheng et al.Oct 26, 2022
Abstract Multiomics profiling is a powerful tool to characterize the same samples with complementary features orchestrating the genome, epigenome, transcriptome, proteome, and metabolome. However, the lack of ground truth hampers the objective assessment of and subsequent choice from a plethora of measurement and computational methods aiming to integrate diverse and often enigmatically incomparable omics datasets. Here we establish and characterize the first suites of publicly available multiomics reference materials of matched DNA, RNA, proteins, and metabolites derived from immortalized cell lines from a family quartet of parents and monozygotic twin daughters, providing built-in truth defined by family relationship and the central dogma. We demonstrate that the “ratio”-based omics profiling data, i.e ., by scaling the absolute feature values of a study sample relative to those of a concurrently measured universal reference sample, were inherently much more reproducible and comparable across batches, labs, platforms, and omics types, thus empower the horizontal (within-omics) and vertical (cross-omics) data integration in multiomics studies. Our study identifies “absolute” feature quantitation as the root cause of irreproducibility in multiomics measurement and data integration, and urges a paradigm shift from “absolute” to “ratio"-based multiomics profiling with universal reference materials.