CF
Cathy Fung
Author with expertise in Handling Imbalanced Data in Classification Problems
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
3
(100% Open Access)
Cited by:
2
h-index:
3
/
i10-index:
1
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

Commonly used software tools produce conflicting and overly-optimistic AUPRC values

Wenyu Chen et al.Feb 7, 2024
+9
Q
Z
W
Abstract The precision-recall curve (PRC) and the area under it (AUPRC) are useful for quantifying classification performance. They are commonly used in situations with imbalanced classes, such as cancer diagnosis and cell type annotation. We evaluated 10 popular tools for plotting PRC and computing AUPRC, which were collectively used in > 3,000 published studies. We found the AUPRC values computed by the tools rank classifiers differently and some tools produce overly-optimistic results.
2

Multi-Omic Analysis ofTyrophagus putrescentiaeReveals Insights into the Allergen Complexity of Storage Mites

Angel Wan et al.Oct 21, 2022
+15
X
T
A
Abstract Background The storage mite Tyrophagus putrescentiae is one of the major mites causing allergies in Chinese and Korean populations, but its allergen profile in incomplete when compared with that of house dust mites. Multiple genome-based methods have been introduced into the allergen study of mites and have enabled a better understanding of these medically important organisms. Objective We sought to reveal a comprehensive allergen profile of Tyrophagus putrescentiae and advance the allergen study of storage mites. Methods Based on a high-quality assembled and annotated genome, an in silico analysis was performed by searching reference sequences to identify allergens. Immunoassay ELISA assessed the allergenicities of recombinant proteins. MALDI-TOF mass spectrometry identified the IgE-binding proteins. Comparative genomics analysis was employed for the important allergen gene families. Results A complete allergen profile of Tyrophagus putrescentiae was revealed, including thirty-seven allergen groups (up to Tyr p 42). Among them, five novel allergens were verified using the sera of allergy patients. Massive allergen homologs were identified as the result of gene duplications in genome evolution. Proteomic identification again revealed a wide range of allergen homologs. In the NPC2 family and GSTs, comparative analysis shed light on the expansion and diversification of the allergen groups. Conclusion Using multi-omic approaches, the comprehensive allergen profile including massive homologs was disclosed in Tyrophagus putrescentiae , which revealed the allergen complexity of the storage mite and could ultimately facilitate the component-resolved diagnosis.
2
Citation1
0
Save
1

Endogenous Plasmids and Reductive Genome Evolution in Host-Associated Bacteria

Qing Xiong et al.Sep 10, 2022
+7
X
X
Q
Abstract Reductive genome evolution is commonly observed among host-associated bacteria including many important pathogens, such as Mycobacterium leprae but its molecular mechanism is not well understood 1–5 . One of the most widely accepted hypotheses to explain bacterial genome reduction is Muller’s ratchet, in which the associated bacteria tend to accumulate deleterious mutations for reduction in the absence of chromosomal recombination inside the eukaryotic host organism 1,2 . Cardinium species belong to the family Amoebophilaceae of the CFB group bacteria, which are a group of endosymbiont bacteria widely distributed among arthropods, that along with Wolbachia can cause cytoplasmic incompatibility 6,7 . In this study, we explored bacterial reductive evolution within the de novo assembled genomes of Cardinium endosymbionts in two astigmatic mites 8,9 . Our results shed light on the reduction mechanism driven by endogenous plasmids and their encoded enzymes.