Hana Šimková
Author with expertise in Genome Evolution and Polyploidy in Plants
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
10
(70% Open Access)
Cited by:
22
h-index:
45
/
i10-index:
105
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

Anatomy, transcription dynamics and evolution of wheat ribosomal RNA loci deciphered by a multi-omics approach

Zuzana Tulpová et al.Aug 31, 2020
Abstract Background and Aims Three out of four RNA components of ribosomes are encoded by 45S rDNA loci, whose transcripts are processed into 18S, 5.8S and 26S ribosomal RNAs. The loci are organized as long head-to-tail tandem arrays of nearly identical units spanning over several megabases of sequence. Due to this peculiar structure, the number of rRNA genes, their sequence composition and expression status remain unclear, especially in complex polyploid genomes harbouring multiple loci. Here we conducted a complex study to decipher structure and activity of both major and minor rRNA loci in hexaploid bread wheat ( Triticum aestivum ). Methods We employed an original, multi-omics approach, combining chromosome flow sorting and optical mapping with transcriptome and methylome sequencing. Key Results The former two techniques enabled unbiased quantification of rDNA units in particular loci of the wheat genome. Total number of rRNA genes organized in tandem arrays was 4388, with 64.1, 31.4, 3.9 and 0.7% located in short arms of chromosomes 6B, 1B, 5D and 1A, respectively. At the expression level, only 1B and 6B loci contributed to transcription at roughly 2:1 ratio. The 1B:6B ratio varied among five analysed tissues (embryo, coleoptile, root tip, primary leaf, mature leaf), being the highest (2.64:1) in mature leaf and lowest (1.72:1) in coleoptile. Cytosine methylation was considerably higher in CHG contexts in the silenced 5D locus compared to the active 1B and 6B loci. Conclusions A fine genomic organization and tissue-specific expression of rRNA loci were deciphered, for the first time, in a complex polyploid species. We documented various mechanisms of rRNA dosage control, including gene elimination and stable inactivation related to nucleolar subdominance of A and D-genome loci, and a subtle, developmentally regulated silencing of one of the major loci. The results are discussed in the context of wheat evolution and transcription regulation.
1
Citation4
0
Save
0

A novel high-accuracy genome assembly method utilizing a high-throughput workflow

Qingdong Zeng et al.Nov 27, 2020
Abstract Across domains of biological research using genome sequence data, high-quality reference genome sequences are essential for characterizing genetic variation and understanding the genetic basis of phenotypes. However, the construction of genome assemblies for various species is often hampered by complexities of genome organization, especially repetitive and complex sequences, leading to mis-assembly and missing regions. Here, we describe a high-throughput gold standard genome assembly workflow using a large-scale bacterial artificial chromosome (BAC) library with a refined two-step pooling strategy and the Lamp assembler algorithm. This strategy minimizes the laborious processes of physical map construction and clone-by-clone sequencing, enabling inexpensive sequencing of several thousand BAC clones. By applying this strategy with a minimum tiling path BAC clone library for the short arm of chromosome 2D (2DS) of bread wheat, 98% of BAC sequences, covering 92.7% of the 2DS chromosome, were assembled correctly for this species with a highly complex and repetitive genome. We also identified 48 large mis-assemblies in the reference wheat genome assembly (IWGSC RefSeq v1.0) and corrected these large mis-assemblies in addition to filling 92.2% of the gaps in RefSeq v1.0. Our 2DS assembly represents a new benchmark for the assembly of complex genomes with both high accuracy and efficiency.
0
Citation1
0
Save
1

Prospects of telomere-to-telomere assembly in barley: analysis of sequence gaps in the MorexV3 reference genome

Pavla Navrátilová et al.Nov 10, 2021
Abstract The first gapless, telomere-to-telomere (T2T) sequence assemblies of plant chromosomes were reported recently. However, sequence assemblies of most plant genomes remain fragmented. Only recent breakthroughs in accurate long-read sequencing have made it possible to achieve highly contiguous sequence assemblies with a few tens of contigs per chromosome, i.e. a number small enough to allow for a systematic inquiry into the causes of the remaining sequence gaps and the approaches and resources needed to close them. Here, we analyze sequence gaps in the current reference genome sequence of barley cv. Morex (MorexV3). Optical map and sequence raw data, complemented by ChIP-seq data for centromeric histone variant CENH3, were used to estimate the abundance of centromeric, ribosomal DNA and subtelomeric repeats in the barley genome. These estimates were compared with copy numbers in the MorexV3 pseudomolecule sequence. We found that almost all centromeric sequences and 45S ribosomal DNA repeat arrays were absent from the MorexV3 pseudomolecules and that the majority of sequence gaps can be attributed to assembly breakdown in long stretches of satellite repeats. However, missing sequences cannot fully account for the difference between assembly size and flow cytometric genome size estimates. We discuss the prospects of gap closure with ultra-long sequence reads.
1
Citation1
0
Save
0

Sequencing of 15,622 gene-bearing BACs reveals new features of the barley genome

María Muñoz‐Amatriaín et al.May 5, 2015
Barley (Hordeum vulgare L.) possesses a large and highly repetitive genome of 5.1 Gb that has hindered the development of a complete sequence. In 2012, the International Barley Sequencing Consortium released a resource integrating whole-genome shotgun sequences with a physical and genetic framework. However, since only 6,278 BACs in the physical map were sequenced, detailed fine structure was limited. To gain access to the gene-containing portion of the barley genome at high resolution, we identified and sequenced 15,622 BACs representing the minimal tiling path of 72,052 physical mapped gene-bearing BACs. This generated about 1.7 Gb of genomic sequence containing 17,386 annotated barley genes. Exploration of the sequenced BACs revealed that although distal ends of chromosomes contain most of the gene-enriched BACs and are characterized by high rates of recombination, there are also gene-dense regions with suppressed recombination. Knowledge of these deviant regions is relevant to trait introgression, genome-wide association studies, genomic selection model development and map-based cloning strategies. Sequences and their gene and SNP annotations can be accessed and exported via http://harvest-web.org/hweb/utilmenu.wc or through the software HarvEST:Barley (download from harvest.ucr.edu). In the latter, we have implemented a synteny viewer between barley and Aegilops tauschii to aid in comparative genome analysis.
0

Optical and physical mapping with local finishing enables megabase-scale resolution of agronomically important regions in the wheat genome

Gabriel Keeble‐Gagnère et al.Jul 9, 2018
Background: Numerous scaffold-level sequences for wheat are now being released and, in this context, we report on a strategy for improving the overall assembly to a level comparable to that of the human genome. Results: Using chromosome 7A of wheat as a model, sequence-finished megabase scale sections of this chromosome were established by combining a new independent assembly based on a BAC-based physical map, BAC pool paired end sequencing, chromosome arm specific mate-pair sequencing and Bionano optical mapping with the IWGSC RefSeq v1.0 sequence and its underlying raw data. The combined assembly results in 18 super-scaffolds across the chromosome. The value of finished genome regions is demonstrated for two approximately 2.5 Mb regions associated with yield and the grain quality phenotype of fructan carbohydrate grain levels. In addition, the 50 Mb centromere region analysis incorporates cytological data highlighting the importance of non-sequence data in the assembly of this complex genome region. Conclusions: Sufficient genome sequence information is shown to be now available for the wheat community to produce sequence-finished releases of each chromosome of the reference genome. The high-level completion identified that an array of seven fructosyl transferase genes underpins grain quality and yield attributes are affected by five f-box-only-protein-ubiquitin ligase domain and four root-specific lipid transfer domain genes. The completed sequence also includes the centromere.