HC
Han‐Chieh Chao
Author with expertise in Internet of Things and Edge Computing
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
11
(55% Open Access)
Cited by:
2,628
h-index:
56
/
i10-index:
242
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

A Survey of Utility-Oriented Pattern Mining

Wensheng Gan et al.Sep 20, 2019
The main purpose of data mining and analytics is to find novel, potentially useful patterns that can be utilized in real-world applications to derive beneficial knowledge. For identifying and evaluating the usefulness of different kinds of patterns, many techniques and constraints have been proposed, such as support, confidence, sequence order, and utility parameters (e.g., weight, price, profit, quantity, satisfaction, etc.). In recent years, there has been an increasing demand for utility-oriented pattern mining (UPM, or called utility mining). UPM is a vital task, with numerous high-impact applications, including cross-marketing, e-commerce, finance, medical, and biomedical applications. This survey aims to provide a general, comprehensive, and structured overview of the state-of-the-art methods of UPM. First, we introduce an in-depth understanding of UPM, including concepts, examples, and comparisons with related concepts. A taxonomy of the most common and state-of-the-art approaches for mining different kinds of high-utility patterns is presented in detail, including Apriori-based, tree-based, projection-based, vertical-/horizontal-data-format-based, and other hybrid approaches. A comprehensive review of advanced topics of existing high-utility pattern mining techniques is offered, with a discussion of their pros and cons. Finally, we present several well-known open-source software packages for UPM. We conclude our survey with a discussion on open and practical challenges in this field.
0

Secure Data Storage and Searching for Industrial IoT by Integrating Fog Computing and Cloud Computing

Jun-Song Fu et al.Jan 15, 2018
With the fast development of industrial Internet of things (IIoT), a large amount of data is being generated continuously by different sources. Storing all the raw data in the IIoT devices locally is unwise considering that the end devices' energy and storage spaces are strictly limited. In addition, the devices are unreliable and vulnerable to many threats because the networks may be deployed in remote and unattended areas. In this paper, we discuss the emerging challenges in the aspects of data processing, secure data storage, efficient data retrieval and dynamic data collection in IIoT. Then, we design a flexible and economical framework to solve the problems above by integrating the fog computing and cloud computing. Based on the time latency requirements, the collected data are processed and stored by the edge server or the cloud server. Specifically, all the raw data are first preprocessed by the edge server and then the time-sensitive data (e.g., control information) are used and stored locally. The non-time-sensitive data (e.g., monitored data) are transmitted to the cloud server to support data retrieval and mining in the future. A series of experiments and simulation are conducted to evaluate the performance of our scheme. The results illustrate that the proposed framework can greatly improve the efficiency and security of data storage and retrieval in IIoT.
0

A Survey of Parallel Sequential Pattern Mining

Wensheng Gan et al.Jun 7, 2019
With the growing popularity of shared resources, large volumes of complex data of different types are collected automatically. Traditional data mining algorithms generally have problems and challenges including huge memory cost, low processing speed, and inadequate hard disk space. As a fundamental task of data mining, sequential pattern mining (SPM) is used in a wide variety of real-life applications. However, it is more complex and challenging than other pattern mining tasks, i.e., frequent itemset mining and association rule mining, and also suffers from the above challenges when handling the large-scale data. To solve these problems, mining sequential patterns in a parallel or distributed computing environment has emerged as an important issue with many applications. In this paper, an in-depth survey of the current status of parallel sequential pattern mining (PSPM) is investigated and provided, including detailed categorization of traditional serial SPM approaches, and state of the art parallel SPM. We review the related work of parallel sequential pattern mining in detail, including partition-based algorithms for PSPM, Apriori-based PSPM, pattern growth based PSPM, and hybrid algorithms for PSPM, and provide deep description (i.e., characteristics, advantages, disadvantages and summarization) of these parallel approaches of PSPM. Some advanced topics for PSPM, including parallel quantitative / weighted / utility sequential pattern mining, PSPM from uncertain data and stream data, hardware acceleration for PSPM, are further reviewed in details. Besides, we review and provide some well-known open-source software of PSPM. Finally, we summarize some challenges and opportunities of PSPM in the big data era.
0

Dynamic Resource Prediction and Allocation for Cloud Data Center Using the Multiobjective Genetic Algorithm

Fan‐Hsun Tseng et al.Jul 21, 2017
In order to optimize the resource utilization of physical machines (PMs), the workload prediction of virtual machines (VMs) is vital but challenging. Most of existing literatures focus on either resource prediction or allocation individually, but both of them are highly correlated. In this paper, we propose a multiobjective genetic algorithm (GA) to dynamically forecast the resource utilization and energy consumption in cloud data center. We formulate a multiobjective optimization problem of resource allocation, which considers the CPU and memory utilization of VMs and PMs, and the energy consumption of data center. The proposed GA forecasts the resource requirement of next time slot according to the historical data in previous time slots. We further propose a VM placement algorithm to allocate VMs for next time slot based on the prediction results of GA. In our simulation-based analysis, the optimal solution for resource prediction under stable and unstable utilization tendency is found by the proposed GA. The prediction result is superior to the previous proposed Grey forecasting model. Results show that the proposed VM placement algorithm not only increases the average utilization level of CPU and memory but also decreases the energy consumption of cloud data center.
0

The Gate Control Method by Using Reinforcement Learning in Time-Sensitive Networking

Cheng‐En Liu et al.Apr 17, 2024
The time-sensitive networking (TSN) is one of the critical technologies for the future development of the industrial Internet of Things (IIoT). This is because TSN can ensure the delay and reliability of network transmission. On the other hand, TSN has also introduced the IEEE 802.1 Qbv. Since the scheduling of IEEE 802.1 Qbv is based on time control gates, the time synchronization (TAS) function can also allow TSN to communicate with fifth-generation wireless communication (5G) to support IEEE 802.1 Qbv. Because IEEE 802.1 Qbv will affect delay and jitter, it is one of the issues that urgently needs to be solved. Considering the problem of time synchronization, this paper focuses on the issue of queue gate control and proposes reinforcement learning (RL) to help us. Since reinforcement learning does not require over-examining the characteristics of past data but depends on environmental changes, adjustment will be more convenient. In addition, this paper also carefully explores the queuing status and defines in detail the problem to be solved. Finally, the experimental results show that the proposed gate control using RL is more efficient than other comparison methods.
Load More