MK
Marcus Koch
Author with expertise in RNA Sequencing Data Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
18
(78% Open Access)
Cited by:
3,857
h-index:
63
/
i10-index:
185
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

One thousand plant transcriptomes and the phylogenomics of green plants

Mack Leebens et al.Oct 23, 2019
+97
G
S
M
Green plants (Viridiplantae) include around 450,000-500,000 species1,2 of great diversity and have important roles in terrestrial and aquatic ecosystems. Here, as part of the One Thousand Plant Transcriptomes Initiative, we sequenced the vegetative transcriptomes of 1,124 species that span the diversity of plants in a broad sense (Archaeplastida), including green plants (Viridiplantae), glaucophytes (Glaucophyta) and red algae (Rhodophyta). Our analysis provides a robust phylogenomic framework for examining the evolution of green plants. Most inferred species relationships are well supported across multiple species tree and supermatrix analyses, but discordance among plastid and nuclear gene trees at a few important nodes highlights the complexity of plant genome evolution, including polyploidy, periods of rapid speciation, and extinction. Incomplete sorting of ancestral variation, polyploidization and massive expansions of gene families punctuate the evolutionary history of green plants. Notably, we find that large expansions of gene families preceded the origins of green plants, land plants and vascular plants, whereas whole-genome duplications are inferred to have occurred repeatedly throughout the evolution of flowering plants and ferns. The increasing availability of high-quality plant genome sequences and advances in functional genomics are enabling research on genome evolution across the green tree of life.
0
Citation1,323
0
Save
0

Comparative Evolutionary Analysis of Chalcone Synthase and Alcohol Dehydrogenase Loci in Arabidopsis, Arabis, and Related Genera (Brassicaceae)

Marcus Koch et al.Oct 1, 2000
T
B
M
We analyzed sequence variation for chalcone synthase (Chs) and alcohol dehydrogenase (Adh) loci in 28 species in the genera Arabidopsis and Arabis and related taxa from tribe Arabideae. Chs was single-copy in nearly all taxa examined, while Adh duplications were found in several species. Phylogenies constructed from both loci confirmed that the closest relatives of Arabidopsis thaliana include Arabidopsis lyrata, Arabidopsis petraea, and Arabidopsis halleri (formerly in the genus Cardaminopsis). Slightly more distant are the North American n = 7 Arabis (Boechera) species. The genus Arabis is polyphyletic—some unrelated species appear within this taxonomic classification, which has little phylogenetic meaning. Fossil pollen data were used to compute a synonymous substitution rate of 1.5 × 10 substitutions per site per year for both Chs and Adh. Arabidopsis thaliana diverged from its nearest relatives about 5 MYA, and from Brassica roughly 24 MYA. Independent molecular and fossil data from several sources all provide similar estimates of evolutionary timescale in the Brassicaceae.
0
Citation941
0
Save
0

Chromosome triplication found across the tribe Brassiceae

Martin Lysak et al.Mar 21, 2005
I
A
M
M
We have used an approximately 8.7-Mb BAC contig of Arabidopsis thaliana Chromosome 4 to trace homeologous chromosome regions in 21 species of the family Brassicaceae. Homeologs of this segment could be identified in all tested species. Painting of pachytene chromosomes of Calepina, Conringia, and Sisymbrium species (2n = 14, 16), traditionally placed in tribe Brassiceae, showed one homeologous copy of the Arabidopsis contig, while the remaining taxa of the tribe (2n = 14-30) revealed three, and three Brassica species (2n = 34, 36, and 38) and Erucastrum gallicum (2n = 30) had six copies corresponding to the 8.7-Mb segment. The multiple homeologous copies corresponded structurally to the Arabidopsis segment or were rearranged by inversions and translocations within the diploidized genomes. These chromosome rearrangements accompanied by chromosome fusions/fissions led to the present-day chromosome number variation within the Brassiceae. Phylogenetic relationships based on the chloroplast 5'-trnL (UAA)-trnF(GAA) region and estimated divergence times based on sequence data of the chalcone synthase gene are congruent with comparative painting data and place Calepina, Conringia, and Sisymbrium outside the clade of Brassiceae species with triplicated genomes. Most likely, species containing three or six copy pairs descended from a common hexaploid ancestor with basic genomes similar to that of Arabidopsis. The presumed hexaploidization event occurred after the Arabidopsis-Brassiceae split, between 7.9 and 14.6 Mya.
0
Citation634
0
Save
0

Charting biologically relevant chemical space: A structural classification of natural products (SCONP)

Marcus Koch et al.Nov 21, 2005
+5
M
A
M
The identification of small molecules that fall within the biologically relevant subfraction of vast chemical space is of utmost importance to chemical biology and medicinal chemistry research. The prerequirement of biological relevance to be met by such molecules is fulfilled by natural product-derived compound collections. We report a structural classification of natural products (SCONP) as organizing principle for charting the known chemical space explored by nature. SCONP arranges the scaffolds of the natural products in a tree-like fashion and provides a viable analysis- and hypothesis-generating tool for the design of natural product-derived compound collections. The validity of the approach is demonstrated in the development of a previously undescribed class of selective and potent inhibitors of 11β-hydroxysteroid dehydrogenase type 1 with activity in cells guided by SCONP and protein structure similarity clustering. 11β-hydroxysteroid dehydrogenase type 1 is a target in the development of new therapies for the treatment of diabetes, the metabolic syndrome, and obesity.
0

Molecular systematics of the Brassicaceae: evidence from coding plastidic matK and nuclear Chs sequences

Marcus Koch et al.Mar 1, 2001
T
B
M
Phylogenetic relationships were inferred using nucleotide sequence variation of the nuclear‐encoded chalcone synthase gene ( Chs ) and the chloroplast gene matK for members of five tribes from the family Brassicaceae to analyze tribal and subtribal structures. Phylogenetic trees from individual data sets are mostly in congruence with the results from a combined matK‐Chs analysis with a total of 2721 base pairs, but with greater resolution and higher statistical support for deeper branching patterns. The analysis indicates that tribes Lepidieae, Arabideae, and Sisymbrieae are not monophyletic. Among taxa under study four different lineages each were detected in tribes Arabideae and Lepidieae, interspersed with taxa from tribes Sisymbrieae, Hesperideae, and Brassiceae. It is concluded that tribe Brassiceae might be the only monophyletic group of the traditional tribes. From our data we estimated several divergence times for different lineages among cruciferous plants: 5.8 mya (million years ago) for the Arabidopsis – Cardaminopsis split, 20 mya for the Brassica – Arabidopsis split, and ∼40 mya for the age of the deepest split between the most basal crucifer Aethionema and remaining cruciferous taxa.
0
Citation392
0
Save
0

Toward a Global Phylogeny of the Brassicaceae

C. Bailey et al.Aug 17, 2006
+5
M
M
C
The Brassicaceae is a large plant family (338 genera and 3,700 species) of major scientific and economic importance. The taxonomy of this group has been plagued by convergent evolution in nearly every morphological feature used to define tribes and genera. Phylogenetic analysis of 746 nrDNA internal transcribed spacer (ITS) sequences, representing 24 of the 25 currently recognized tribes, 146 genera, and 461 species of Brassicaceae, produced the most comprehensive, single-locus–based phylogenetic analysis of the family published to date. Novel approaches to nrDNA ITS analysis and extensive taxonomic sampling offered a test of monophyly for a large complement of the currently recognized tribes and genera of Brassicaceae. In the most comprehensive analysis, tribes Alysseae, Anchonieae plus Hesperideae, Boechereae, Cardamineae, Eutremeae, Halimolobeae, Iberideae, Noccaeeae, Physarieae, Schizopetaleae, Smelowskieae, and Thlaspideae were all monophyletic. Several broadly defined genera (e.g., Draba and Smelowskia) were supported as monophyletic, whereas others (e.g., Sisymbrium and Alyssum) were clearly polyphyletic. Analyses of ITS data identified several problematic sequences attributable to errors in sample identification or database submission. Results from parsimony ratchet and Bayesian analyses recovered little support for the backbone of the phylogeny, suggesting that many lineages of Brassicaceae have undergone rapid radiations that may ultimately be difficult to resolve with any single locus. However, the development of a preliminary supermatrix including the combination of 10 loci for 65 species provides an initial estimate of intertribal relations and suggests that broad application of such a method will provide greater understanding of relationships in the family.
0
Citation348
0
Save
0

The Scaffold Tree − Visualization of the Scaffold Universe by Hierarchical Scaffold Classification

Ansgar Schuffenhauer et al.Dec 2, 2006
+3
S
P
A
A hierarchical classification of chemical scaffolds (molecular framework, which is obtained by pruning all terminal side chains) has been introduced. The molecular frameworks form the leaf nodes in the hierarchy trees. By an iterative removal of rings, scaffolds forming the higher levels in the hierarchy tree are obtained. Prioritization rules ensure that less characteristic, peripheral rings are removed first. All scaffolds in the hierarchy tree are well-defined chemical entities making the classification chemically intuitive. The classification is deterministic, data-set-independent, and scales linearly with the number of compounds included in the data set. The application of the classification is demonstrated on two data sets extracted from the PubChem database, namely, pyruvate kinase binders and a collection of pesticides. The examples shown demonstrate that the classification procedure handles robustly synthetic structures and natural products.
24

Global Phylogeny of the Brassicaceae Provides Important Insights into Gene Discordance

Kasper Hendriks et al.Sep 1, 2022
+44
I
C
K
Abstract The mustard family (Brassicaceae) is a scientifically and economically important family, containing the model plant Arabidopsis thaliana and numerous crop species that feed billions worldwide. Despite its relevance, most published family phylogenies are incompletely sampled, generally contain massive polytomies, and/or show incongruent topologies between datasets. Here, we present the most complete Brassicaceae genus-level family phylogenies to date (Brassicaceae Tree of Life, or BrassiToL) based on nuclear (>1,000 genes, almost all 349 genera and 53 tribes) and plastome (60 genes, 79% of the genera, all tribes) data. We found cytonuclear discordance between nuclear and plastome-derived phylogenies, which is likely a result of rampant hybridisation among closely and more distantly related species, and highlight rogue taxa. To evaluate the impact of this rampant hybridisation on the nuclear phylogeny reconstruction, we performed four different sampling routines that increasingly removed variable data and likely paralogs. Our resulting cleaned subset of 297 nuclear genes revealed high support for the tribes, while support for the main lineages remained relatively low. Calibration based on the 20 most clock-like nuclear genes suggests a late Eocene to late Oligocene ‘icehouse origin’ of the family. Finally, we propose five new or re-established tribes, including the recognition of Arabidopsideae, a monotypic tribe to accommodate Arabidopsis . With a worldwide community of thousands of researchers working on this family, our new, densely sampled family phylogeny will be an indispensable tool to further highlight Brassicaceae as an excellent model family for studies on biodiversity and plant biology.
24
Citation15
0
Save
0

Convergence and novelty in adaptation to whole genome duplication in three independent polyploids

Sian Bray et al.Apr 1, 2020
+9
M
E
S
Abstract Convergent evolution is observed broadly across the web of life, but the degree of evolutionary constraint during adaptation of core intracellular processes is not known. High constraint has been assumed for conserved processes, such as cell division and DNA repair, but reports of nimble evolutionary shifts in these processes have confounded this expectation. Whole genome duplication (WGD) necessitates the concerted adjustment of a wide range of fundamental intracellular functions but nevertheless has been repeatedly survived in all kingdoms. Given this repeated adaptation to WGD despite obvious intracellular challenges to core processes such as meiosis, we asked: how do lineages not only survive WGD, but sometimes ultimately thrive? Are the solutions employed constrained or diverse? Here we detect genes and processes under selection following WGD in the Cochlearia species complex by performing a scan for selective sweeps following WGD in a large-scale survey of 73 resequenced individuals from 23 populations across Europe. We then contrast our results from two independent WGDs in Arabidopsis arenosa and Cardamine amara. We find that while WGD does require the adaptation of particular functional processes in all three cases, the specific genes recruited to respond are highly flexible. We also observe evidence of varying degrees of convergence between different cases. Our results point to a polygenic basis for the distributed adaptive systems that control meiotic crossover number, ionomic rewiring, cell cycle control, and nuclear regulation. Given the sheer number of loci under selection post-WGD, we surmise that this polygenicity may explain the general lack of convergence between these species that are ~30 million years diverged. Based on our results, we speculate that adaptive processes themselves – such as the rate of generation of structural genomic variants—may be altered by WGD in nascent autopolyploids, contributing to the occasionally spectacular adaptability of autopolyploids observed across kingdoms.
0
Citation8
0
Save
0

Impact of whole-genome duplications on structural variant evolution in Cochlearia

Tuomas Hämälä et al.Jun 25, 2024
+8
M
D
T
Abstract Polyploidy, the result of whole-genome duplication (WGD), is a major driver of eukaryote evolution. Yet WGDs are hugely disruptive mutations, and we still lack a clear understanding of their fitness consequences. Here, we study whether WGDs result in greater diversity of genomic structural variants (SVs) and how they influence evolutionary dynamics in a plant genus, Cochlearia (Brassicaceae). By using long-read sequencing and a graph-based pangenome, we find both negative and positive interactions between WGDs and SVs. Masking of recessive mutations due to WGDs leads to a progressive accumulation of deleterious SVs across four ploidal levels (from diploids to octoploids), likely reducing the adaptive potential of polyploid populations. However, we also discover putative benefits arising from SV accumulation, as more ploidy-specific SVs harbor signals of local adaptation in polyploids than in diploids. Together, our results suggest that SVs play diverse and contrasting roles in the evolutionary trajectories of young polyploids.
0
Citation4
0
Save
Load More