ZL
Zhenjiang Li
Author with expertise in Wireless Indoor Localization Techniques and Systems
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
12
(17% Open Access)
Cited by:
1,049
h-index:
32
/
i10-index:
63
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Precise Power Delay Profiling with Commodity WiFi

Yaxiong Xie et al.Aug 27, 2015
Power delay profiles characterize multipath channel features, which are widely used in motion- or localization-based applications. Recent studies show that the power delay profile may be derived from the CSI traces collected from commodity WiFi devices, but the performance is limited by two dominating factors. The resolution of the derived power delay profile is determined by the channel bandwidth, which is however limited on commodity WiFi. The collected CSI reflects the signal distortions due to both the channel attenuation and the hardware imperfection. A direct derivation of power delay profiles using raw CSI measures, as has been done in the literature, results in significant inaccuracy. In this paper, we present Splicer, a software-based system that derives high-resolution power delay profiles by splicing the CSI measurements from multiple WiFi frequency bands. We propose a set of key techniques to separate the mixed hardware errors from the collected CSI measurements. Splicer adapts its computations within stringent channel coherence time and thus can perform well in presence of mobility. Our experiments with commodity WiFi NICs show that Splicer substantially improves the accuracy in profiling multipath characteristics, reducing the errors of multipath distance estimation to be less than $2m$. Splicer can immediately benefit upper-layer applications. Our case study with recent single-AP localization achieves a median localization error of $0.95m$.
0

Precise Power Delay Profiling with Commodity Wi-Fi

Yaxiong Xie et al.May 8, 2019
Power delay profiles characterize multipath channel features, which are widely used in motion- or localization-based applications. The performance of power delay profile obtained using commodity Wi-Fi devices is limited by two dominating factors. The resolution of the derived power delay profile is determined by the channel bandwidth, which is however limited on commodity WiFi. The collected CSI reflects the signal distortions due to both the channel attenuation and the hardware imperfection. A direct derivation of power delay profiles using raw CSI measures, as has been done in the literature, results in significant inaccuracy. In this paper, we present Splicer, a software-based system that derives high-resolution power delay profiles by splicing the CSI measurements from multiple WiFi frequency bands. We propose a set of key techniques to separate the mixed hardware errors from the collected CSI measurements. Splicer adapts its computations within stringent channel coherence time and thus can perform well in the presence of mobility. Our experiments with commodity WiFi NICs show that Splicer substantially improves the accuracy in profiling multipath characteristics, reducing the errors of multipath distance estimation to be less than 2 m. Splicer can immediately benefit upper-layer applications. Our case study with recent single-AP localization achieves a median localization error of 0.95 m.
0

Pantheon: Preemptible Multi-DNN Inference on Mobile Edge GPUs

Linghui Han et al.Jun 3, 2024
GPUs are increasingly utilized for running DNN tasks on emerging mobile edge devices. Beyond accelerating single task inference, their value is also particularly apparent in efficiently executing multiple DNN tasks, which often have strict latency requirements in applications. Preemption is the main technology to ensure multitasking timeliness, but mobile edges primarily offer two priorities for task queues, and existing methods thus achieve only coarse-grained preemption by categorizing DNNs into real-time and best-effort, permitting a real-time task to preempt best-effort ones. However, the efficacy diminishes significantly when other real-time tasks run concurrently, but this is already common in mobile edge applications. Due to different hardware characteristics, solutions from other platforms are unsuitable. For instance, GPUs on traditional mobile devices primarily assist CPU processing and lack special preemption support, mainly following FIFO in GPU scheduling. Clouds handle concurrent task execution, but focus on allocating one or more GPUs per complex model, whereas on mobile edges, DNNs mainly vie for one GPU. This paper introduces Pantheon, designed to offer fine-grained preemption, enabling real-time tasks to preempt each other and best-effort tasks. Our key observation is that the two-tier GPU stream priorities, while underexplored, are sufficient. Efficient preemption can be realized through software design by innovative scheduling and novel exploitation of the nested redundancy principle for DNN models. Evaluation on a diverse set of DNNs shows substantial improvements in deadline miss rate and accuracy of Pantheon over state-of-the-art methods.
0

LATTE: Layer Algorithm-aware Training Time Estimation for Heterogeneous Federated Learning

Kun Wang et al.Dec 4, 2024
Accurate estimation of on-device model training time is increasingly required for emerging learning paradigms on mobile edge devices, such as heterogeneous federated learning (HFL). HFL usually customizes the model architecture according to the different capabilities of mobile edge devices to ensure efficient use of local data from all devices for training. However, due to oversimplification of latency modeling, existing methods rely on a single coefficient to represent computational heterogeneity, resulting in sub-optimal HFL efficiency. We find that existing methods ignore the important impact of runtime optimization of deep learning frameworks, which we call development-chain diversity. Specifically, layers of a model may have different algorithm implementations, and deep learning frameworks often have different strategies for selecting the algorithm they believe is the best based on a range of runtime factors, resulting in different training latencies and invalid predictions from existing methods. In this paper, in addition to considering this diversity to ensure synchronized completion time of model training, we also study how to select the best algorithm each time to reduce the latency of the per-round training, thereby further improving the overall efficiency of federated training. To this end, we propose LATTE, which consists of a novel selector that identifies the best algorithm at runtime based on relative runtime factors. By further integrating it into our training latency model, LATTE provides accurate training time estimation. We develop LATTE as middleware, compatible with different deep learning frameworks. Extensive results show significantly improved training convergence speed and model accuracy compared to state-of-the-art methods.
0

A Self-Enhancement Solution for Standard RFIDs: Software-based Cross-protocol Communication and Localization

Cui Zhao et al.Nov 21, 2024
Radio Frequency Identification (RFID) is widely recognized for its cost-effectiveness, energy efficiency, and ease of manufacturing, promising versatile applications such as material recognition, vibration detection, and localization. However, these inherent lightweight characteristics necessitate extensive computations or tailored devices for specific tasks. Consequently, there is a critical imperative to explore and augment the sensing and communication capabilities of standard RFIDs to better accommodate a broader spectrum of Internet of Things (IoT) services. In this paper, we introduce SENSO, a self-enhancement solution designed to facilitate diverse tasks without the need for hardware modifications or additional device support. Our approach introduces two key innovations to enable cross-protocol communication (RFID-LoRa) and localization. Firstly, we seamlessly integrate Chirp Spread Spectrum (CSS) modulation into RFID, enabling simultaneous communication with commercial tags and LoRa devices. Secondly, we realize the transmission of wider-band chirps to activate and localize the tag concurrently. By harnessing these techniques, we developed a prototype while addressing several challenges. Our evaluation demonstrates that when maintaining the fundamental RFID communication, SENSO can effectively deliver additional messages to LoRa devices across various indoor scenarios, e.g., through multiple floors, rooms, and corners, and extending over outdoor distances spanning kilometers. Furthermore, it achieves an average accuracy of approximately 5 to 10 centimeters in tag ranging and localization. The source codes of SENSO are available at https://github.com/Cui-Zhao/SENSO.
Load More