WW
Wenya Wang
Author with expertise in Natural Language Processing
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
7
(86% Open Access)
Cited by:
762
h-index:
18
/
i10-index:
28
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Coupled Multi-Layer Attentions for Co-Extraction of Aspect and Opinion Terms

Wenya Wang et al.Feb 12, 2017
The task of aspect and opinion terms co-extraction aims to explicitly extract aspect terms describing features of an entity and opinion terms expressing emotions from user-generated texts. To achieve this task, one effective approach is to exploit relations between aspect terms and opinion terms by parsing syntactic structure for each sentence. However, this approach requires expensive effort for parsing and highly depends on the quality of the parsing results. In this paper, we offer a novel deep learning model, named coupled multi-layer attentions. The proposed model provides an end-to-end solution and does not require any parsers or other linguistic resources for preprocessing. Specifically, the proposed model is a multi-layer attention network, where each layer consists of a couple of attentions with tensor operators. One attention is for extracting aspect terms, while the other is for extracting opinion terms. They are learned interactively to dually propagate information between aspect terms and opinion terms. Through multiple layers, the model can further exploit indirect relations between terms for more precise information extraction. Experimental results on three benchmark datasets in SemEval Challenge 2014 and 2015 show that our model achieves state-of-the-art performances compared with several baselines.
0

HPClas: A data-driven approach for identifying halophilic proteins based on catBoost

Sheng Hu et al.Dec 1, 2023
Abstract Halophilic proteins possess unique structural properties and exhibit high stability under extreme conditions. Such distinct characteristic makes them invaluable for applications in various aspects such as bioenergy, pharmaceuticals, environmental clean-up and energy production. Generally, halophilic proteins are discovered and characterized through labor-intensive and time-consuming wetlab experiments. Here, we introduced HPClas, a machine learning-based classifier developed using the catBoost ensemble learning technique to identify halophilic proteins. Extensive in silico calculations were conducted on a large public data set of 12574 samples and an independent test set of 200 sample pairs, on which HPClas achieved an AUROC of 0.877 and 0.845, respectively. The source code and curated data set of HPClas are publicly available at https://github.com/Showmake2/HPClas . In conclusion, HPClas can be explored as a promising tool to aid in the identification of halophilic proteins and accelerate their applications in different fields. Impact Statement In this study, we used a method based on prediction of proteins secreted by extreme halophilic bacteria to successfully extract a large number of halophilic proteins. Using this data, we have trained an accurate halophilic protein classifier that could determine whether an input protein is halophilic with a high accuracy of 84.5%. This research could not only promote the exploration and mining of halophilic proteins in nature, but also provide guidance for the generation of mutant halophilic enzymes.
0

Study on genetic differentiation of Schistosome japonicum intermediate hosts Oncomelania hupensis robertsoni in hilly regions of China: using the complete mitochondrial genome

Jing Song et al.Jan 1, 2023
Objective: Oncomelania hupensis robertsoni is the only intermediate host of Schistosoma japonicum in western China, its genetic differentiation directly impacts the susceptibility of Schistosoma japonicum. This study aimed to sequence the complete mitochondrial genome of Oncomelania hupensis robertsoni Yunnan strain and analyze the genetic differentiation of Oncomelania hupensis robertsoni in hilly regions of China. Methods: Samples were from 14 administrative villages in Yunnan Province of China, with 30 Oncomelania hupensis per village, and the complete mitochondrial genome was sequenced. Additional, we retrieved 14 other region Oncomelania hupensis of complete mitochondrial sequences from GenBank, and a comprehensive analysis of the genetic differentiation of Oncomelania hupensis robertsoni was conducted by constructing phylogenetic trees, calculating genetic distances, and analyzing homogeneity. Results: A total of 26 complete mitochondrial sequences were determined. The length of genome ranged from 15,181 to 15,187 bp, and the base composition of the genome was A+T (67.5%) and G+C content (32.5%). This genome encoded 37 genes, including 13 protein-coding genes, 2 rRNA genes, 22 tRNA genes and a non-coding region rich in A+T. Using the Philippines genotypes as outgroup, the phylogenetic trees and homology analysis confirmed the existence of two distinct phylogroups, Oncomelania hupensis robertsoni and the remaining 9 provincial genotypes. Oncomelania hupensis robertsoni is subdivided into Oncomelania hupensis robertsoni Yunnan strain and Sichuan strain, with a genetic distance of 0.0834. Oncomelania hupensis robertsoni Yunnan strain is subdivided into two subbranches, "Yunnan North" and "Yunnan South", with a genetic distance of 0.0216, and the samples exhibited over 97% homology. Conclusion: Oncomelania hupensis robertsoni Yunnan strain exhibits a higher level of genetic homology and clear north-south differentiation, the distribution characteristics were closely associated with watershed distribution. This work reported the first mitochondrial genome of Oncomelania hupensis robertsoni Yunnan strain, which could be used as an important reference genome for Oncomelania hupensis, and also provide a theoretical basis for explaining the distribution pattern of Oncomelania hupensis robertsoni and control of schistosomiasis.
0

Re-emergence and influencing factors of mountain-type zoonotic visceral leishmaniasis in the extension region of Loess Plateau, China

Zhuowei Luo et al.May 31, 2024
Objective To understand the epidemiological distribution characteristics of mountain-type zoonotic visceral leishmaniasis (MT-ZVL) in Yangquan City, Shanxi Province, China, from 2006 to 2021, to explore the influencing factors leading to the re-emergence of the epidemic, and to provide a basis for the formulation of targeted control strategies. Methods Case information spanning from 2006 to 2021 in Yangquan City was collected for a retrospective case-control study conducted from June to September 2022. A 1:3 matched ratio was employed. A questionnaire was utilized to gather data on basic information, demographic characteristics, awareness of MT-ZVL knowledge, residence, and dog breeding and living habits. The study employed a multifactorial conditional stepwise logistic regression model to analyze the influencing factors. Results A total of 508 subjects was analyzed. Risk factors for MT-ZVL included the use of soil/stone/concrete as building materials ( OR = 3.932), presence of nearby empty/stone stack houses ( OR = 2.515), dog breeding ( OR = 4.215), presence of stray dogs ( OR = 2.767), and neighbor’s dog breeding ( OR = 1.953). Protective factors comprised knowledge of MT-ZVL ( OR = 0.113) and using mosquito repellents ( OR = 0.388). The findings indicate significant associations between environmental and behavioral factors and MT-ZVL incidence in Yangquan City, Shanxi Province, China, from 2006 to 2021. These results underscore the importance of public awareness campaigns and targeted interventions aimed at reducing exposure to risk factors and promoting protective measures to mitigate the re-emergence of MT-ZVL outbreaks. Conclusion House building materials, presence of neighboring empty houses, breeding domestic dogs and distribution of stray dogs surrounding the home are risk factors for MT-ZVL. Awareness of MT-ZVL and implementation of preventive measures during outdoor activities in summer and autumn are protective and may reduce the risk of MT-ZVL.
0

Dichotomy Law for a Modified Shrinking Target Problem in Beta Dynamical System

Wenya Wang et al.Nov 24, 2024
Let φ:N→(0,1] be a positive function. We consider the size of the set Ef(φ):={β>1:|Tβn(x)−f(β)|<φ(n)i.o.n}, where “i.o.n” stands for “infinitely often”, and f:(1,∞)→[0,1] is a Lipschitz function. For any x∈(0,1], it is proved that the Hausdorff measure of Ef(φ) fulfill a dichotomy law according to lim supn→∞logφ(n)n=−∞ or not, where Tβ is the β-transformation. In ergodic theory, the phenomenon of shrinking targets is crucial for understanding the long-term behavior of systems. By studying the shrinking target problem of the β dynamical system, we can reveal the relationship between randomness and determinism, which is significant for constructing more complex mathematical models. Moreover, there is a close connection between the β transformation and number theory. Investigating the contraction target problem helps uncover new properties and patterns in number theory, advancing the development of this field. In this work, we establish a significant relationship between the decay rate of the positive function φ(n) and the structural properties of the set Ef(φ). Specifically, we show that: The Hausdorff dimension of Ef(φ) either vanishes or is positive based on the behavior of φ(n) as n approaches infinity. The establishment of this dichotomy can help us more effectively understand the geometric characteristics and dynamical behavior of the system, thereby aiding our acceptance and comprehension of complex theories. Researching this shrinking target problem can help us uncover new properties in number theory, leading to a better understanding of the structure of numbers and promoting the development of related fields in number theory.