MR
Michael Rosenberg
Author with expertise in Molecular Mechanisms of Cardiac Arrhythmias
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
11
(36% Open Access)
Cited by:
3,402
h-index:
42
/
i10-index:
82
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Development of a Prediction Model for Incident Atrial Fibrillation using Machine Learning Applied to Harmonized Electronic Health Record Data

Premanand Tiwari et al.Jan 18, 2019
Abstract Atrial fibrillation (AF) is the most common sustained cardiac arrhythmia, whose early detection could lead to significant improvements in outcomes through appropriate prescription of anticoagulation. Although a variety of methods exist for screening for AF, there is general agreement that a targeted approach would be preferred. Implicit within this approach is the need for an efficient method for identification of patients at risk. In this investigation, we examined the strengths and weaknesses of an approach based on application of machine-learning algorithms to electronic health record (EHR) data that has been harmonized to the Observational Medical Outcomes Partnership (OMOP) common data model. We examined data from a total of 2.3M individuals, of whom 1.16% developed incident AF over designated 6-month time intervals. We examined and compared several approaches for data reduction, sample balancing (re-sampling) and predictive modeling using cross-validation for hyperparameter selection, and out-of-sample testing for validation. Although no approach provided outstanding classification accuracy, we found that the optimal approach for prediction of 6-month incident AF used a random forest classifier, raw features (no data reduction), and synthetic minority oversampling technique (SMOTE) resampling (F 1 statistic 0.12, AUC 0.65). This model performed better than a predictive model based only on known AF risk factors, and highlighted the importance of using resampling methods to optimize ML approaches to imbalanced data as exists in EHRs. Further studies using EHR data in other medical systems are needed to validate the clinical applicability of these findings.
3

Efficient DNA-based data storage using shortmer combinatorial encoding

Inbal Preuss et al.Aug 1, 2021
1 Abstract With the world generating digital data at an exponential rate, DNA has emerged as a promising archival medium. It offers a more efficient and long-lasting digital storage solution due to its durability, physical density, and high information capacity. Research in the field includes the development of encoding schemes, which are compatible with existing DNA synthesis and sequencing technologies. Recent studies suggest leveraging the inherent information redundancy of these technologies by using composite DNA alphabets. A major challenge in this approach involves the noisy inference process, which prevented the use of large composite alphabets. This paper introduces a novel approach for DNA-based data storage, offering a 6.5-fold increase in logical density over standard DNA-based storage systems, with near zero reconstruction error. Combinatorial DNA encoding uses a set of clearly distinguishable DNA shortmers to construct large combinatorial alphabets, where each letter represents a subset of shortmers. The nature of these combinatorial alphabets minimizes mix-up errors, while also ensuring the robustness of the system. As this paper will show, we formally define various combinatorial encoding schemes and investigate their theoretical properties, such as information density, reconstruction probabilities and required synthesis, and sequencing multiplicities. We then suggest an end-to-end design for a combinatorial DNA-based data storage system, including encoding schemes, two-dimensional error correction codes, and reconstruction algorithms. Using in silico simulations, we demonstrate our suggested approach and evaluate different combinatorial alphabets for encoding 10KB messages under different error regimes. The simulations reveal vital insights, including the relative manageability of nucleotide substitution errors over shortmer-level insertions and deletions. Sequencing coverage was found to be a key factor affecting the system performance, and the use of two-dimensional Reed-Solomon (RS) error correction has significantly improved reconstruction rates. Our experimental proof-of-concept validates the feasibility of our approach, by constructing two combinatorial sequences using Gibson assembly imitating a 4-cycle combinatorial synthesis process. We confirmed the successful reconstruction, and established the robustness of our approach for different error types. Subsampling experiments supported the important role of sampling rate and its effect on the overall performance. Our work demonstrates the potential of combinatorial shortmer encoding for DNA-based data storage, while raising theoretical research questions and technical challenges. These include the development of error correction codes for combinatorial DNA, the exploration of optimal sampling rates, and the advancement of DNA synthesis technologies that support combinatorial synthesis. Combining combinatorial principles with error-correcting strategies paves the way for efficient, error-resilient DNA-based storage solutions.
0

Applications of Machine Learning in Decision Analysis for Dose Management for Dofetilide

Andrew Levy et al.Jan 27, 2019
Initiation of the antiarrhythmic medication dofetilide requires an FDA-mandated 3 days of telemetry monitoring due to heightened risk of toxicity within this time period. Although a recommended dose management algorithm for dofetilide exists, there is a range of real-world approaches to dosing the medication. In this multicenter investigation, we examined the decision process for dose adjustment of dofetilide during the observation period using machine-learning approaches, including supervised, unsupervised, and reinforcement learning applications. Logistic regression approaches identified any dose-adjustment as a strong negative predictor of successful initiation of the medication (OR 0.19, 95%CI 0.12 - 0.31, p < 0.001 for discharge on dofetilide), indicating that these adjustments are strong determinants of whether patients 'tolerate' the medication. Using multiple supervised approaches, including regularized logistic regression, random forest, boosted gradient decision trees, and neural networks, we were unable to identify any model that predicted dose adjustments better than a naive approach. A reinforcement-learning algorithm, in contrast, predicted which patient characteristics and dosing decisions that resulted in the lowest risk of failure to be discharged on the medication. Future studies could apply this algorithm prospectively to examine improvement over standard approaches.
0

A polygenic risk score for the QT interval is an independent predictor of drug-induced QT prolongation

S. Simon et al.Jun 17, 2024
Drug-induced QT prolongation (diLQTS), and subsequent risk of torsade de pointes, is a major concern with use of many medications, including for non-cardiac conditions. The possibility that genetic risk, in the form of polygenic risk scores (PGS), could be integrated into prediction of risk of diLQTS has great potential, although it is unknown how genetic risk is related to clinical risk factors as might be applied in clinical decision-making. In this study, we examined the PGS for QT interval in 2500 subjects exposed to a known QT-prolonging drug on prolongation of the QT interval over 500ms on subsequent ECG using electronic health record data. We found that the normalized QT PGS was higher in cases than controls (0.212±0.954 vs. -0.0270±1.003, P = 0.0002), with an unadjusted odds ratio of 1.34 (95%CI 1.17–1.53, P<0.001) for association with diLQTS. When included with age and clinical predictors of QT prolongation, we found that the PGS for QT interval provided independent risk prediction for diLQTS, in which the interaction for high-risk diagnosis or with certain high-risk medications (amiodarone, sotalol, and dofetilide) was not significant, indicating that genetic risk did not modify the effect of other risk factors on risk of diLQTS. We found that a high-risk cutoff (QT PGS ≥ 2 standard deviations above mean), but not a low-risk cutoff, was associated with risk of diLQTS after adjustment for clinical factors, and provided one method of integration based on the decision-tree framework. In conclusion, we found that PGS for QT interval is an independent predictor of diLQTS, but that in contrast to existing theories about repolarization reserve as a mechanism of increasing risk, the effect is independent of other clinical risk factors. More work is needed for external validation in clinical decision-making, as well as defining the mechanism through which genes that increase QT interval are associated with risk of diLQTS.
Load More