JE
Jesper Eisfeldt
Author with expertise in Genomic Landscape of Cancer and Mutational Signatures
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
8
(75% Open Access)
Cited by:
9
h-index:
18
/
i10-index:
22
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
188

Long-read whole genome analysis of human single cells

Joanna Hård et al.Apr 13, 2021
+10
J
J
J
Abstract With long-read sequencing, we have entered an era where individual genomes are routinely assembled to near completion and where complex genetic variation can efficiently be resolved. Here, we demonstrate that long reads can be applied to study the genomic architecture of individual human cells. Clonally expanded CD8+ T-cells from a human donor were used as starting material for a droplet-based multiple displacement amplification (dMDA) to generate long molecules with minimal amplification bias. PacBio HiFi sequencing generated up to 20 Gb data and 40% genome coverage per single cell. The data allowed for accurate detection and haplotype phasing of single nucleotide variants (SNVs), structural variants (SVs), and tandem repeats, including in genomic regions inaccessible by short reads. Somatic SNVs were detected in the nuclear genome and mitochondrial DNA. An average of 1278 high-confidence SVs per cell were discovered in the PacBio data, nearly four times as many compared to those found in Illumina dMDA data from clonally related cells. Single-cell de novo assembly resulted in a genome size of up to 598 Mb and 1762 (12.8%) complete gene models. In summary, the work presented here demonstrates the utility of whole genome amplification combined with long-read sequencing toward the characterization of the full spectrum of genetic variation at the single-cell level.
188
Citation9
0
Save
0

pyCancerSig: subclassifying human cancer with comprehensive single nucleotide, structural and microsatellite mutational signature deconstruction from whole genome sequencing

Jessada Thutkawkorapin et al.Sep 30, 2019
D
E
J
J
Abstract Background DNA damage accumulates over the course of cancer development. The often-substantial amount of somatic mutations in cancer poses a challenge to traditional methods to characterize tumors based on driver mutations. However, advances in machine learning technology can take advantage of this substantial amount of data. Results We developed a command line interface python package, pyCancerSig, to perform sample profiling by integrating single nucleotide variation (SNV), structural variation (SV) and microsatellite instability (MSI) profiles into a unified profile. It also provides a command to decipher underlying cancer processes, employing an unsupervised learning technique, Non-negative Matrix Factorization, and a command to visualize the results. The package accepts common standard file formats (vcf, bam). The program was evaluated using a cohort of breast- and colorectal cancer from The Cancer Genome Atlas project (TCGA). The result showed that by integrating multiple mutations modes, the tool can correctly identify cases with known clear mutational signatures and can strengthen signatures in cases with unclear signal from an SNV-only profile. Conclusions pyCancerSig has demonstrated its capability in identifying known and unknown cancer processes, and at the same time, illuminates the association within and between the mutation modes.
0

A combination of long and short read genomics reveals frequent p-arm breakpoints within chromosome 21 complex genomic rearrangements

Jakob Schuy et al.Jun 1, 2024
+13
J
K
J
0

Sarek: A portable workflow for whole-genome sequencing analysis of germline and somatic variants

Maxime Garcia et al.May 9, 2018
+10
P
M
M
Summary: Whole-genome sequencing (WGS) is a cornerstone of precision medicine, but portable and reproducible open-source workflows for WGS analyses of germline and somatic variants are lacking. We present Sarek, a modular, comprehensive, and easy-to-install workflow, combining a range of software for the identification and annotation of single-nucleotide variants (SNVs), insertion and deletion variants (indels), structural variants, tumor sample heterogeneity, and karyotyping from germline or paired tumor/normal samples. Sarek is implemented in a bioinformatics workflow language (Nextflow) with Docker and Singularity compatible containers, ensuring easy deployment and full reproducibility at any Linux based compute cluster or cloud computing environment. Sarek supports the human reference genomes GRCh37 and GRCh38, and can readily be used both as a core production workflow at sequencing facilities and as a powerful stand-alone tool for individual research groups. Availability: Source code and instructions for local installation are available at GitHub (https://github.com/SciLifeLab/Sarek) under the MIT open-source license, and we invite the research community to contribute additional functionality as a collaborative open-source development project.
0

Rare variants in dynein heavy chain genes in two individuals with situs inversus and developmental dyslexia

Andrea Bieder et al.Mar 31, 2020
+9
H
E
A
Background: Developmental dyslexia (DD) is a neurodevelopmental learning disorder with high heritability. A number of candidate susceptibility genes have been identified, some of which are linked to the function of the cilium, an organelle regulating left-right asymmetry development in the embryo. Furthermore, it has been suggested that disrupted left-right asymmetry of the brain may play a role in neurodevelopmental disorders such as DD. Methods: Here, we studied two individuals with co-occurring situs inversus (SI) and DD using whole genome sequencing to identify single nucleotide variants or copy number variations of importance for DD and SI. Results: Individual 1 had primary ciliary dyskinesia (PCD), a rare, autosomal recessive disorder with oto-sino-pulmonary phenotype and SI. We identified two rare nonsynonymous variants in the dynein axonemal heavy chain 5 gene (DNAH5): c.7502G>C;p.(R2501P), a previously reported variant predicted to be damaging and c.12043T>G;p.(Y4015D), a novel variant predicted to be damaging. Ultrastructural analysis of the cilia revealed a lack of outer dynein arms and normal inner dynein arms. MRI of the brain revealed no significant abnormalities. Individual 2 had non-syndromic SI and DD. In individual 2, one rare variant (c.9110A>G;p.(H3037R)) in the dynein axonemal heavy chain 11 gene (DNAH11), coding for another component of the outer dynein arm, was identified. Conclusions: We identified the likely genetic cause of SI and PCD in one individual, and a possibly significant heterozygosity in the other, both involving dynein genes. Given the present evidence, it is unclear if the identified variants also predispose to DD, but further studies into the association are warranted.
0

Single-cell multimodal omics and directly reprogrammed neurons to probe reduced penetrance in Frontotemporal Dementia

Karthick Natarajan et al.Sep 22, 2020
+8
M
J
K
Disclaimer “This manuscript has been withdrawn by the authors as it was submitted and made public without the full consent of all the authors. Therefore, the authors do not wish this work to be cited as a reference for the project. If you have any questions, please contact the corresponding author.”
0
0
Save
0

Rare coding variants inNOX4link high superoxide levels to psoriatic arthritis mutilans

Sailan Wang et al.Jun 7, 2023
+12
L
P
S
Summary Psoriatic arthritis mutilans (PAM) is the rarest and most severe form of psoriatic arthritis. PAM is characterized by erosions of the small joints of hands and feet and osteolysis leading to joint disruption. Despite its severity, the underlying mechanisms are unknown, and no candidate susceptibility genes have hitherto been identified. We aimed to investigate the genetic basis of PAM. We performed massive parallel sequencing of sixty-one patients’ genomes from the PAM Nordic cohort. We validated the rare variants found by Sanger sequencing and genotyped additional psoriasis, psoriatic arthritis, and control cohorts. We then tested the role of the variants using in vivo and in vitro models. We found rare variants with a minor allele frequency (MAF) below 0.0001 in the NADPH oxidase 4 ( NOX4 ) in four patients. In silico predictions show that the identified variants are potentially damaging. NOXs are the only enzymes producing reactive oxygen species (ROS). ROS are highly reactive molecules important role in the regulation of signal transduction. NOX4 is specifically involved in the differentiation of osteoclasts, the cells implicated in bone resorption. Functional follow-up studies using cell culture, zebrafish models, and measurement of ROS in patients uncovered that the NOX4 variants found in this study increase the levels of ROS both in vitro and in vivo. We propose NOX4 as the first candidate susceptibility gene for PAM. Our study links high levels of ROS caused by NOX4 variants to the development of PAM, opening the possibility for a potential therapeutic target.
1

Linked-read whole-genome sequencing resolves common and private structural variants in multiple myeloma

Lucía Peña-Pérez et al.Dec 9, 2021
+12
N
A
L
ABSTRACT Multiple myeloma (MM) is an incurable and aggressive plasma cell malignancy characterized by a complex karyotype with multiple structural variants (SVs) and copy number variations (CNVs). Linked-read whole-genome sequencing (lrWGS) allows for refined detection and reconstruction of SVs by providing long-range genetic information from standard short-read sequencing. This makes lrWGS an attractive solution for capturing the full genomic complexity of MM. Here we show that high-quality lrWGS data can be generated from low numbers of FACS sorted cells without DNA purification. Using this protocol, we analyzed FACS sorted MM cells from 37 MM patients with lrWGS. We found high concordance between lrWGS and FISH for the detection of recurrent translocations and CNVs. Outside of the regions investigated by FISH, we identified >150 additional SVs and CNVs across the cohort. Analysis of the lrWGS data allowed for resolving the structure of diverse SVs affecting the MYC and t(11;14) loci causing the duplication of genes and gene regulatory elements. In addition, we identified private SVs causing the dysregulation of genes recurrently involved in translocations with the IGH locus and show that these can alter the molecular classification of the MM. Overall, we conclude that lrWGS allows for the detection of aberrations critical for MM prognostics and provides a feasible route for providing comprehensive genetics. Implementing lrWGS could provide more accurate clinical prognostics, facilitate genomic medicine initiatives, and greatly improve the stratification of patients included in clinical trials. KEY POINTS - Linked-read WGS can be performed without DNA purification and allows for resolving the diverse structural variants found in multiple myeloma. - Linked-read WGS can, as a stand-alone assay, provide comprehensive genetics in myeloma and other diseases with complex genomes.