NA
N. Aziz
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
National University of Malaysia, German Center for Neurodegenerative Diseases, University of Bonn
+ 14 more
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
5
(100% Open Access)
Cited by:
429
h-index:
31
/
i10-index:
67
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
64

Swarm Learning for decentralized and confidential clinical machine learning

Stefanie Warnat-Herresthal et al.May 26, 2021
+176
K
H
S
Abstract Fast and reliable detection of patients with severe and heterogeneous illnesses is a major goal of precision medicine 1,2 . Patients with leukaemia can be identified using machine learning on the basis of their blood transcriptomes 3 . However, there is an increasing divide between what is technically possible and what is allowed, because of privacy legislation 4,5 . Here, to facilitate the integration of any medical data from any data owner worldwide without violating privacy laws, we introduce Swarm Learning—a decentralized machine-learning approach that unites edge computing, blockchain-based peer-to-peer networking and coordination while maintaining confidentiality without the need for a central coordinator, thereby going beyond federated learning. To illustrate the feasibility of using Swarm Learning to develop disease classifiers using distributed data, we chose four use cases of heterogeneous diseases (COVID-19, tuberculosis, leukaemia and lung pathologies). With more than 16,400 blood transcriptomes derived from 127 clinical studies with non-uniform distributions of cases and controls and substantial study biases, as well as more than 95,000 chest X-ray images, we show that Swarm Learning classifiers outperform those developed at individual sites. In addition, Swarm Learning completely fulfils local confidentiality regulations by design. We believe that this approach will notably accelerate the introduction of precision medicine.
32

Swarm Learning as a privacy-preserving machine learning approach for disease classification

Stefanie Warnat-Herresthal et al.Oct 24, 2023
+29
K
H
S
Abstract Identification of patients with life-threatening diseases including leukemias or infections such as tuberculosis and COVID-19 is an important goal of precision medicine. We recently illustrated that leukemia patients are identified by machine learning (ML) based on their blood transcriptomes. However, there is an increasing divide between what is technically possible and what is allowed because of privacy legislation. To facilitate integration of any omics data from any data owner world-wide without violating privacy laws, we here introduce Swarm Learning (SL), a decentralized machine learning approach uniting edge computing, blockchain-based peer-to-peer networking and coordination as well as privacy protection without the need for a central coordinator thereby going beyond federated learning. Using more than 14,000 blood transcriptomes derived from over 100 individual studies with non-uniform distribution of cases and controls and significant study biases, we illustrate the feasibility of SL to develop disease classifiers based on distributed data for COVID-19, tuberculosis or leukemias that outperform those developed at individual sites. Still, SL completely protects local privacy regulations by design. We propose this approach to noticeably accelerate the introduction of precision medicine.
0

Next-generation phenotyping integrated in a national framework for patients with ultrarare disorders improves genetic diagnostics and yields new molecular findings

Axel Schmidt et al.Sep 6, 2024
+168
P
K
A
Abstract Individuals with ultrarare disorders pose a structural challenge for healthcare systems since expert clinical knowledge is required to establish diagnoses. In TRANSLATE NAMSE, a 3-year prospective study, we evaluated a novel diagnostic concept based on multidisciplinary expertise in Germany. Here we present the systematic investigation of the phenotypic and molecular genetic data of 1,577 patients who had undergone exome sequencing and were partially analyzed with next-generation phenotyping approaches. Molecular genetic diagnoses were established in 32% of the patients totaling 370 distinct molecular genetic causes, most with prevalence below 1:50,000. During the diagnostic process, 34 novel and 23 candidate genotype–phenotype associations were identified, mainly in individuals with neurodevelopmental disorders. Sequencing data of the subcohort that consented to computer-assisted analysis of their facial images with GestaltMatcher could be prioritized more efficiently compared with approaches based solely on clinical features and molecular scores. Our study demonstrates the synergy of using next-generation sequencing and phenotyping for diagnosing ultrarare diseases in routine healthcare and discovering novel etiologies by multidisciplinary teams.
0

Peripheral whole blood microRNA expression in relation to vascular function: a population-based study

Valentina Talevi et al.Sep 12, 2024
+6
G
K
V
Abstract Background As key regulators of gene expression, microRNAs affect many cardiovascular mechanisms and have been associated with several cardiovascular diseases. In this study, we aimed to investigate the relation of whole blood microRNAs with several quantitative measurements of vascular function, and explore their biological role through an integrative microRNA-gene expression analysis. Methods Peripheral whole blood microRNA expression was assessed through RNA-Seq in 2606 participants (45.8% men, mean age: 53.93, age range: 30 to 95 years) from the Rhineland Study, an ongoing population-based cohort study in Bonn, Germany. Weighted gene co-expression network analysis was used to cluster microRNAs with highly correlated expression levels into 14 modules. Through linear regression models, we investigated the association between each module’s expression and quantitative markers of vascular health, including pulse wave velocity, total arterial compliance index, cardiac index, stroke index, systemic vascular resistance index, reactive skin hyperemia and white matter hyperintensity burden. For each module associated with at least one trait, one or more hub-microRNAs driving the association were defined. Hub-microRNAs were further characterized through mapping to putative target genes followed by gene ontology pathway analysis. Results Four modules, represented by hub-microRNAs miR-320 family, miR-378 family, miR-3605-3p, miR-6747-3p, miR-6786-3p, and miR-330-5p, were associated with total arterial compliance index. Importantly, the miR-320 family module was also associated with white matter hyperintensity burden, an effect partially mediated through arterial compliance. Furthermore, hub-microRNA miR-192-5p was related to cardiac index. Functional analysis corroborated the relevance of the identified microRNAs for vascular function by revealing, among others, enrichment for pathways involved in blood vessel morphogenesis and development, angiogenesis, telomere organization and maintenance, and insulin secretion. Conclusions We identified several microRNAs robustly associated with cardiovascular function, especially arterial compliance and cardiac output. Moreover, our results highlight miR-320 as a regulator of cerebrovascular damage, partly through modulation of vascular function. As many of these microRNAs were involved in biological processes related to vasculature development and aging, our results contribute to the understanding of vascular physiology and provide putative targets for cardiovascular disease prevention.
0
Citation1
0
Save
0

Parameterizing Pantherinae: de novo mutation rate estimates from Panthera and Neofelis pedigrees

Ellie Armstrong et al.May 28, 2024
+10
A
S
E
Estimates of de novo mutation rates are essential for phylogenetic and demographic analyses, but their inference has previously been impeded by high error rates in sequence data and uncertainty in the fossil record. Here, we directly estimate de novo germline mutation rates for all extant members of Panthera, as well as the closely related outgroup Neofelis nebulosa, using pedigrees. We use a previously validated pipeline (RatesTools) to calculate mutation rate for each species and subsequently explore the impacts of the novel rates on historic effective population size estimates in each of these charismatic felids of conservation concern. Importantly, we find that the choice of reference genome, the data type and coverage, and the individual all impact estimates of the mutation rate. Despite these stochastic effects, we inferred that base pair mutation rates for all species fell between 0.5 and 1.4e-08 per generation per base pair (mean 0.81e-08 +/- 0.35-08 across Pantherinae). Our results provide a cautionary view on inter-species mutation rate comparisons, given the error associated with the reference genome choice and sequencing depth of coverage of the individuals.