KS
Katharina Sielemann
Author with expertise in RNA Sequencing Data Analysis
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
8
(75% Open Access)
Cited by:
2
h-index:
9
/
i10-index:
8
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

Repeat turnover meets stable chromosomes: repetitive DNA sequences mark speciation and gene pool boundaries in sugar beet and wild beets

Nicola Schmidt et al.Sep 1, 2023
ABSTRACT Background Sugar beet ( Beta vulgaris subsp. vulgaris ) and its crop wild relatives share a base chromosome number of nine and similar chromosome morphologies. Yet, interspecific breeding is impeded by chromosome and sequence divergence that is still not fully understood. Since repetitive DNA sequences represent the fastest evolving parts of the genome, they likely impact genomic variability and contribute to the separation of beet gene pools. Hence, we investigated if innovations and losses in the repeatome can be linked to chromosomal differentiation and speciation. Results We traced genome- and chromosome-wide evolution across sugar beet and twelve wild beets comprising all sections of the beet genera Beta and Patellifolia . For this, we combined data from short and long read sequencing, flow cytometry, and cytogenetics to build a comprehensive data framework for our beet panel that spans the complete scale from DNA sequence to chromosome up to the genome. Genome sizes and repeat profiles reflect the separation of the beet species into three gene pools. These gene pools harbor repeats with contrasting evolutionary patterns: We identified section- and species-specific repeat emergences and losses, e.g. of the retrotransposons causal for genome expansions in the section Corollinae/Nanae . Since most genomic variability was found in the satellite DNAs, we focused on tracing the 19 beetSat families across the three beet sections/genera. These taxa harbor evidence for contrasting strategies in repeat evolution, leading to contrasting satellite DNA profiles and fundamentally different centromere architectures, ranging from chromosomal uniformity in Beta and Patellifolia species to the formation of patchwork chromosomes in Corollinae/Nanae species. Conclusions We show that repetitive DNA sequences are causal for genome size expansion and contraction across the beet genera, providing insights into the genomic underpinnings of beet speciation. Satellite DNAs in particular vary considerably among beet taxa, leading to the evolution of distinct chromosomal setups. These differences likely contribute to the barriers in beet breeding between the three gene pools. Thus, with their isokaryotypic chromosome sets, beet genomes present an ideal system for studying the link between repeats, genome variability, and chromosomal differentiation/evolution and provide a theoretical basis for understanding barriers in crop breeding.
1
Citation1
0
Save
8

plASgraph - using graph neural networks to detect plasmid contigs from an assembly graph

Janik Sielemann et al.May 25, 2022
Abstract Identification of plasmids from sequencing data is an important and challenging problem related to antimicrobial resistance spread and other One-Health issues. In our work, we provide a new architecture for identifying plasmid contigs in fragmented genome assemblies built from short-read data. Unlike previous machine-learning approaches for this problem, which classify individual contigs separately, we employ graph neural networks (GNNs) to include information from the assembly graph. Propagation of information from nearby nodes in the graph allows accurate classification of even short contigs that are difficult to classify based on sequence features or database searches alone. Our new species-agnostic software tool plASgraph outperforms recently developed PlasForest, which uses database searches to supplement sequence-based features. Since our tool does not rely on existing plasmid databases, it is more suitable for classification of contigs in novel species and discovery of previously unknown plasmid sequences. Our tool can also be trained on a specific species, and in that scenario it outperforms mlplasmids trained on the same species. On one hand, our work provides a new, accurate, and easy to use tool for plasmid classification; on the other hand, it serves as a motivation for more widespread use of GNNs in bioinformatics, such as in pangenome sequence analysis, where sequence graphs serve as a fundamental data structure. Availability https://github.com/cchauve/plASgraph
8
Citation1
0
Save
0

Animal, fungi, and plant genome sequences harbour different non-canonical splice sites

Katharina Sielemann et al.Apr 23, 2019
Most protein encoding genes in eukaryotes contain introns which are interwoven with exons. After transcription, introns need to be removed in order to generate the final mRNA which can be translated into an amino acid sequence. Precise excision of introns by the spliceosome requires conserved dinucleotides which mark the splice sites. However, there are variations of the highly conserved combination of GT at the 5’ end and AG at the 3’ end of an intron in the genome. GC-AG and AT-AC are two major non-canonical splice site combinations which have been known for years. During the last years, various minor non-canonical splice site combinations were detected with numerous dinucleotide permutations. Here we expand systematic investigations of non-canonical splice site combinations in plants to all eukaryotes by analysing fungal and animal genome sequences. Comparisons of splice site combinations between these three kingdoms revealed several differences such as a substantially increased CT-AC frequency in fungal genome sequences. Canonical GT-AG splice site combinations in antisense transcripts could be one explanation for this observation. In addition, high numbers of GA-AG splice site combinations were observed in Eurytemora affinis and Oikopleura dioica . A variant in one U1 snRNA isoform might allow the recognition of GA as 5’ splice site. In depth investigation of splice site usage based on RNA-Seq read mappings indicates a generally higher flexibility of the 3’ splice site compared to the 5’ splice site across animals, fungi, and plants.
0

A Chromosome-level Sequence Assembly Reveals the Structure of the Arabidopsis thaliana Nd-1 Genome and its Gene Set

Boas Pucker et al.Sep 6, 2018
Background In addition to the BAC-based reference sequence of the accession Columbia-0 from the year 2000, several short read assemblies of THE plant model organism Arabidopsis thaliana were published during the last years. Also, a SMRT-based assembly of Landsberg erecta has been generated that identified translocation and inversion polymorphisms between two genotypes of the species.Results Here we provide a chromosome-arm level assembly of the A. thaliana accession Niederzenz-1 (AthNd-1\_v2c) based on SMRT sequencing data. The best assembly comprises 69 nucleome sequences and displays a contig length of up to 16 Mbp. Compared to an earlier Illumina short read-based NGS assembly (AthNd-1\_v1), a 75 fold increase in contiguity was observed for AthNd-1_v2c. To assign contig locations independent from the Col-0 gold standard reference sequence, we used genetic anchoring to generate a de novo assembly. In addition, we assembled the chondrome and plastome sequences.Conclusions Detailed analyses of AthNd-1_v2c allowed reliable identification of large genomic rearrangements between A. thaliana accessions contributing to differences in the gene sets that distinguish the genotypes. One of the differences detected identified a gene that is lacking from the Col-0 gold standard sequence. This de novo assembly extends the known proportion of the A. thaliana pan-genome.* NGS : next generation sequencing NOR : nucleolus organizing region RBH : reciprocal best hit SMRT : single molecule real time
53

Pangenome of cultivated beet and crop wild relatives reveals parental relationships of a tetraploid wild beet

Katharina Sielemann et al.Jun 30, 2023
Abstract Most crop plants, including sugar beet ( Beta vulgaris subsp. vulgaris ), suffer from domestication bottlenecks and low genetic diversity caused by extensive selection for few traits. However, crop wild relatives (CWRs) harbour useful traits relevant for crop improvement, including enhanced adaptation to biotic and abiotic stresses. Especially polyploids are interesting from an evolutionary perspective as genes undergo reorganisation after the polyploidisation event. Through neo-and subfunctionalisation, novel functions emerge, which enable plants to cope with changing environments and extreme/harsh conditions. Particularly in the face of climate change, specific stress and pathogen resistances or tolerances gain importance. To introduce such traits into breeding material, CWRs have already been identified as an important source for sustainable breeding. The identification of genes underlying traits of interest is crucial for crop improvement. For beets, the section Corollinae contains the tetraploid species Beta corolliflora (2n=4x=36) that harbours salt and frost tolerances as well as a wealth of pathogen resistances. The number of beneficial traits of B. corolliflora is increased compared to those of the known diploids in this section (all 2n=2x=18). Nevertheless, neither the parental relationships of B. corolliflora have been resolved, nor are genomic resources available to steer sustainable, genomics-informed breeding. To benefit from the resources offered by polyploid beet wild relatives, we generated a comprehensive pangenome dataset including B. corolliflora , Beta lomatogona , and Beta macrorhiza , as well as a more distant wild beet Patellifolia procumbens (2n=2x=18). Joined analyses with publicly available genome sequences of two additional wild beets allowed the identification of genomic regions absent from cultivated beet, providing a sequence database harbouring traits relevant for future breeding endeavours. In addition, we present strong evidence for the parental relationship of the B. corolliflora wild beet as an autotetraploid emerging from B. macrorhiza .
53
0
Save
1

Complete pan-plastome sequences enable high resolution phylogenetic classification of sugar beet and closely related crop wild relatives

Katharina Sielemann et al.Oct 9, 2021
Abstract Background As the major source of sugar in moderate climates, sugar-producing beets ( Beta vulgaris subsp. vulgaris ) have a high economic value. However, the low genetic diversity within cultivated beets requires introduction of new traits, for example to increase their tolerance and resistance attributes – traits that often reside in the crop wild relatives. For this, genetic information of wild beet relatives and their phylogenetic placements to each other are crucial. To answer this need, we sequenced and assembled the complete plastome sequences from a broad species spectrum across the beet genera Beta and Patellifolia , both embedded in the Betoideae (order Caryophyllales). This pan-plastome dataset was then used to determine the wild beet phylogeny in high-resolution. Results We sequenced the plastomes of 18 closely related accessions representing 11 species of the Betoideae subfamily and provided high-quality plastome assemblies which represent an important resource for further studies of beet wild relatives and the diverse plant order Caryophyllales. Their assembly sizes range from 149,723 bp ( Beta vulgaris subsp. vulgaris ) to 152,816 bp ( Beta nana ), with most variability in the intergenic sequences. Combining plastome-derived phylogenies with read-based treatments based on mitochondrial information, we were able to suggest a unified and highly confident phylogenetic placement of the investigated Betoideae species. Our results show that the genus Beta can be divided into the two clearly separated sections Beta and Corollinae . Our analysis confirms the affiliation of B. nana with the other Corollinae species, and we argue against a separate placement in the Nanae section. Within the Patellifolia genus, the two diploid species Patellifolia procumbens and Patellifolia webbiana are, regarding the plastome sequences, genetically more similar to each other than to the tetraploid Patellifolia patellaris . Nevertheless, all three Patellifolia species are clearly separated. Conclusion In conclusion, our wild beet plastome assemblies represent a new resource to understand the molecular base of the beet germplasm. Despite large differences on the phenotypic level, our pan-plastome dataset is highly conserved. For the first time in beets, our whole plastome sequences overcome the low sequence variation in individual genes and provide the molecular backbone for highly resolved beet phylogenomics. Hence, our plastome sequencing strategy can also guide genomic approaches to unravel other closely related taxa.
25

Genomic characterization of a nematode tolerance locus in sugar beet

Katharina Sielemann et al.Jun 22, 2023
Abstract Infection by beet cyst nematodes (BCN, Heterodera schachtii ) causes a serious disease of sugar beet, and climatic change is expected to improve the conditions for BCN infection. Yield and yield stability under adverse conditions are among the main breeding objectives. Breeding of BCN tolerant sugar beet cultivars offering high yield in the presence of the pathogen is therefore of high relevance. To identify causal genes providing tolerance against BCN infection, we combined several experimental and bioinformatic approaches. Relevant genomic regions were detected through mapping-by-sequencing using a segregating F2 population. DNA sequencing of contrasting F2 pools and analyses of allele frequencies for variant positions identified a single genomic region which confers nematode tolerance. The genomic interval was confirmed and narrowed down by genotyping with newly developed molecular markers. To pinpoint the causal genes within the nematode tolerance locus, we generated long read-based genome sequence assemblies of the tolerant parental breeding line Strube U2Bv and the susceptible reference line 2320Bv. We analyzed continuous sequences of the locus with regard to functional gene annotation and differential gene expression upon BCN infection. A cluster of genes with similarity to the Arabidopsis thaliana gene encoding nodule inception protein-like protein 7 (NLP7) was identified. Gene expression analyses confirmed transcriptional activity and revealed clear differences between susceptible and tolerant genotypes. Our findings provide new insights into the genomic basis of plant-nematode interactions that can be used to design and accelerate novel management strategies against BCN.