Healthy Research Rewards
ResearchHub is incentivizing healthy research behavior. At this time, first authors of open access papers are eligible for rewards. Visit the publications tab to view your eligible publications.
Got it
HF
Huan Fang
Author with expertise in QoS-Aware Web Services Composition and Semantic Matching
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
3
(67% Open Access)
Cited by:
1
h-index:
6
/
i10-index:
4
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Log-Driven Conformance Checking Approximation Method Based on Machine Learning Model

Huan Fang et al.Jan 1, 2024
Conformance checking techniques are usually used to determine to what degree a process model and real execution trace correspond to each other. Most of the state-of-the-art techniques to calculate conformance value provide an exact value under the circumstance that the reference model of a business system is known. However, in many real applications, the reference model is unknown or changed for various reasons, so the initial known reference model is no longer feasible, and only some historical event execution traces with its corresponding conformance value are retained. This paper proposes a log drivened conformance checking method, which tackles two perspective issues, the first is presenting an approach to calculate the approximate conformance checking value much faster than the existing methods using machine learning method. The second is presenting an approach to conduct conformance checking in probabilistic circumstances. Both kinds of approaches are from the perspective of no reference model is known and only historical event traces and their corresponding fitness can be used as train data. Specifically, for large event data, the computing time of the proposed methods is shorter than those align-based methods, and the baseling methods includes k-nearest neighboring, random forest, quadratic discriminant analysis, linear discriminant analysis, gated recurrent unit and long short-term memory. Experimental results show that adding a machine learning classification vector in the training set as preprocessing for train data can obtain a higher conformance checking value compared with the training sample without increasing the classification vector. Simultaneously, when conducted in processes with probabilities, the proposed log-log conformance checking approach can detect more inconsistent behaviors. The proposed method provides a new approach to improve the efficiency and accuracy of conformance checking. It enhances the management efficiency of business processes, potentially reducing costs and risks, and can be applied to conformance checking of complex processes in the future.
0

Log Clustering-based Method for Repairing Missing Traces with Context Probability Information

Huan Fang et al.Jan 1, 2024
In real business processes, low quality event logs due to outliers and missing values tend to degrade the performance of process mining related algorithms, which in turn affects the correct execution of decisions. In order to repair the missing values in event logs under the condition that the reference model of the process system is unknown, this paper proposes a method that can repair consecutive missing values. First, the event logs are divided according to the integrity of the trace, and then the cluster algorithm is applied to complete logs to generate homogeneous trace clusters. Then match the missing trace to the most similar sub log, generate candidate sequences according to the context of the missing part, calculate the context probability of each candidate sequence, and select the one with the highest probability as the repair result. When the number of missing items in the trace is 1, our method has the highest repair accuracy of 97.5 percent in the Small log and 93.3 percent in the real event logs bpic20. Finally, the feasibility of this method is verified on four event logs with different missing ratios and has certain advantages compared with existing methods.