iMIF2V2: intelligent multiple imputation federated fuzzy clustering with visualization and validation for longitudinal digital trials : a dissertation in Engineering and Applied Science

Hieu Ngo

doi:10.62791/20567

Back

iMIF2V2: intelligent multiple imputation federated fuzzy clustering with visualization and validation for longitudinal digital trials : a dissertation in Engineering and Applied Science

Dissertation

Open access

iMIF2V2: intelligent multiple imputation federated fuzzy clustering with visualization and validation for longitudinal digital trials : a dissertation in Engineering and Applied Science

Hieu Ngo

Doctor of Philosophy (PHD), University of Massachusetts Dartmouth

2026

DOI:

https://doi.org/10.62791/20567

Abstract

Artificial intelligence (AI)-driven behavior recognition and privacy-preserving machine learning frameworks offer transformative potential for digital behavioral trials. However, multisite longitudinal studies present unique challenges, including incomplete and high-dimensional data, non-normal distributions, evolving behavioral trajectories, and stringent privacy regulations such as HIPAA, where even anonymized datasets may risk re-identification. Soft clustering methods are well-suited for such complex data environments because they enable partial membership and capture overlapping, dynamic behavioral trajectories. When integrated with multiple imputation, they offer a robust approach for addressing missingness in longitudinal digital trial datasets. Despite progress, current approaches lack an efficient, fully integrated framework for soft encoder optimization, cluster validation, and visualization under federated constraints. To overcome these limitations, we propose the Intelligent Multiple Imputation Federated Fuzzy Clustering with Visualization and Validation (iMIF2V2) framework - a decentralized, intelligent, and distribution-free AI model designed to streamline the entire unsupervised clustering pipeline in federated digital health settings. iMIF2V2 unifies adaptive fuzzifier tuning, weighted rank aggregation, and visualization-guided validation within a privacy-preserving federated architecture. Empirical validation was conducted using harmonized longitudinal dietary datasets from four Massachusetts RCTs (n = 957) and two national studies (totaling over 3.3 million observations), alongside extensive simulation experiments that varied the number of clients, clusters, effect sizes, and correlation structures. The algorithm automatically detected optimal cluster numbers and fuzzifiers across studies, converged rapidly, and demonstrated high clustering accuracy, particularly for larger effect sizes and balanced site-level samples. Simulated results confirmed the robustness of the distribution-free design of iMIF2V2 across diverse data distributions and missingness patterns. A federated implementation, deployed across two GPU servers emulating separate clients, demonstrated practical feasibility. The accompanying web interface provides public access for exploratory visualization of local and global centroids, longitudinal trajectories, and optimized 2D/3D Sammon projections. By integrating intelligent fuzzy clustering, multiple imputation, visualization, and federated learning into a unified, streamlined, and privacy-preserving pipeline, iMIF2V2 establishes a scalable foundation for interpretable, reproducible, and secure analysis of multi-site longitudinal behavioral digital trials.

Files and links (1)

pdf

Ngo H. COE PhD Dissertation 20269.29 MBDownload View

Open Access CC BY-NC-ND V4.0

Metrics

1 Record Views

Details

Title: iMIF2V2
Creators: Hieu Ngo
ORCID: 0000-0003-2595-2166
Contributors: Hua Fang (Advisor) - University of Massachusetts Dartmouth, Department of Computer and Information Science
Honggang Wang (Committee Member) - University of Massachusetts Dartmouth, Department of Electrical and Computer Engineering
Long Jiao (Committee Member) - University of Massachusetts Dartmouth, Department of Computer and Information Science
Gang Zhou (Committee Member) - William & Mary
Number of pages: xiv, 107 pages
Illustrations: illustrations (some color)
Table of contents: List of figures -- List of tables -- Chapter 1. Introduction -- Background and motivation -- Federated learning for privacy-preserving analytics -- Challenges of missing data in longitudinal studies -- Federated multiple imputation-based fuzzy clustering -- Empirical and simulated evaluation -- Automated parameter optimization and visualization -- Contributions and dissertation structure -- Chapter 2. Background and literature review -- Introduction -- Digital clinical trials -- Federated learning and privacy challenges -- Fuzzy clustering and soft computing -- Multiple imputation and missing data handling -- MIFuzzy and federated extensions -- Summary -- Chapter 3. iFuzzifier -- Introduction -- Related work -- Methodology -- Analysis -- Conclusion -- Chapter 4. iMIF2V2: a fully automated intelligent system -- Introduction and chapter overview -- Candidate grading via multiple imputation -- Fuzzifier and cluster quantity optimization -- Visualization-aided validation -- Conclusion -- Chapter 5. Intelligent decentralized federated MIFuzzy clustering -- Introduction -- Multiple imputation (MI) -- Intelligent MIFuzzy clustering -- Intelligent Sammon mapping -- Intelligent federated global model -- Intelligent communication architecture -- Conclusion -- Chapter 6. iMIF2V2 empirical results -- Introduction -- Empirical evaluation of iMIF2V2 -- Automatic clustering and fuzzifier optimization -- Visualization of local and national clustering results -- Federated visualization results across six studies -- Discussion -- Conclusion -- Chapter 7. iMIF2V2 federated empirical results -- Introduction -- Evaluation on dietary study data -- Federated iMIF2V2 evaluation methods -- Empirical results -- Federated clustering across national studies -- Chapter 8. Simulation results -- Introduction -- iMIF2V2 simulation study design -- iMIF2V2 simulation results -- Voting method evaluation -- Discussion -- Conclusion -- Chapter 9. Implementation of the federated iMIF2V2 framework -- Introduction -- System architecture -- Data sources and harmonization -- Federated iMIF2V2 execution -- Web-based implementation and visualization -- Results and observations -- Summary -- Chapter 10. Discussion.
References: Includes bibliographical references (pages 100-107).
Awarding Institution: University of Massachusetts Dartmouth
Degree Awarded: Doctor of Philosophy (PHD)
Degree in: Engineering and Applied Science
Academic Unit: College of Engineering
Language: English
Resource Type: Dissertation
DOI: https://doi.org/10.62791/20567
Record Identifier: 9914528162301301