JJ
Johann Joets
Author with expertise in Genome Evolution and Polyploidy in Plants
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
8
(50% Open Access)
Cited by:
1,239
h-index:
21
/
i10-index:
30
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

A Large Maize (Zea mays L.) SNP Genotyping Array: Development and Germplasm Genotyping, and Genetic Mapping to Compare with the B73 Reference Genome

Martin Ganal et al.Dec 8, 2011
SNP genotyping arrays have been useful for many applications that require a large number of molecular markers such as high-density genetic mapping, genome-wide association studies (GWAS), and genomic selection. We report the establishment of a large maize SNP array and its use for diversity analysis and high density linkage mapping. The markers, taken from more than 800,000 SNPs, were selected to be preferentially located in genes and evenly distributed across the genome. The array was tested with a set of maize germplasm including North American and European inbred lines, parent/F1 combinations, and distantly related teosinte material. A total of 49,585 markers, including 33,417 within 17,520 different genes and 16,168 outside genes, were of good quality for genotyping, with an average failure rate of 4% and rates up to 8% in specific germplasm. To demonstrate this array's use in genetic mapping and for the independent validation of the B73 sequence assembly, two intermated maize recombinant inbred line populations - IBM (B73×Mo17) and LHRF (F2×F252) - were genotyped to establish two high density linkage maps with 20,913 and 14,524 markers respectively. 172 mapped markers were absent in the current B73 assembly and their placement can be used for future improvements of the B73 reference sequence. Colinearity of the genetic and physical maps was mostly conserved with some exceptions that suggest errors in the B73 assembly. Five major regions containing non-colinearities were identified on chromosomes 2, 3, 6, 7 and 9, and are supported by both independent genetic maps. Four additional non-colinear regions were found on the LHRF map only; they may be due to a lower density of IBM markers in those regions or to true structural rearrangements between lines. Given the array's high quality, it will be a valuable resource for maize genetics and many aspects of maize breeding.
0
Citation567
0
Save
12

Identification of key tissue-specific, biological processes by integrating enhancer information in maize gene regulatory networks

Maud Fagny et al.Jun 17, 2020
Abstract Enhancers are important regulators of gene expression during numerous crucial processes including tissue differentiation across development. In plants, their recent molecular characterization revealed their capacity to activate the expression of several target genes through the binding of transcription factors. Nevertheless, identifying these target genes at a genome-wide level remains a challenge, in particular in species with large genomes, where enhancers and target genes can be hundreds of kilobases away. Therefore, the contribution of enhancers to regulatory network is still poorly understood in plants. In this study, we investigate the enhancer-driven regulatory network of two maize tissues at different stages: leaves at seedling stage and husks (bracts) at flowering. Using a systems biology approach, we integrate genomic, epigenomic and transcriptomic data to model the regulatory relationship between transcription factors and their potential target genes. We identify regulatory modules specific to husk and V2-IST, and show that they are involved in distinct functions related to the biology of each tissue. We evidence enhancers exhibiting binding sites for two distinct transcription factor families (DOF and AP2/ERF) that drive the tissue-specificity of gene expression in seedling immature leaf and husk. Analysis of the corresponding enhancer sequences reveals that two different transposable element families (TIR transposon Mutator and MITE Pif/Harbinger ) have shaped the regulatory network in each tissue, and that MITEs have provided new transcription factor binding sites that are involved in husk tissue-specificity. Significance Enhancers play a major role in regulating tissue-specific gene expression in higher eukaryotes, including angiosperms. While molecular characterization of enhancers has improved over the past years, identifying their target genes at the genome-wide scale remains challenging. Here, we integrate genomic, epigenomic and transcriptomic data to decipher the tissue-specific gene regulatory network controlled by enhancers at two different stages of maize leaf development. Using a systems biology approach, we identify transcription factor families regulating gene tissue-specific expression in husk and seedling leaves, and characterize the enhancers likely to be involved. We show that a large part of maize enhancers is derived from transposable elements, which can provide novel transcription factor binding sites crucial to the regulation of tissue-specific biological functions.
12
Citation2
0
Save
0

High throughput genotyping of structural variations in a complex plant genome using an original Affymetrix® Axiom® array

Clément Mabire et al.Dec 28, 2018
Background Insertions/deletions (InDels) and more specifically presence/absence variations (PAVs) are pervasive in several species and have strong functional and phenotypic effect by removing or drastically modifying genes. Genotyping of such variants on large panels remains poorly addressed, while necessary for approaches such as association mapping or genomic selection.Results We have developed, as a proof of concept, a new high-throughput and affordable approach to genotype InDels. We first identified 141,000 InDels by aligning reads from the B73 line against the genome of three temperate maize inbred lines (F2, PH207, and C103) and reciprocally. Next, we designed an Affymetrix® Axiom® array to target these InDels, with a combination of probes selected at breakpoint sites (13%) or within the InDel sequence, either at polymorphic (25%) or non-polymorphic sites (63%) sites. The final array design is composed of 662,772 probes and targets 105,927 InDels, including PAVs ranging from 35bp to 129kbp. After Affymetrix® quality control, we successfully genotyped 86,648 polymorphic InDels (82% of all InDels interrogated by the array) on 445 maize DNA samples with 422,369 probes. Genotyping InDels using this approach produced a highly reliable dataset, with low genotyping error (~3%), high call rate (~98%), and high reproducibility (>95%). This reliability can be further increased by combining genotyping of several probes calling the same InDels (<0.1% error rate and >99.9% of call rate for 5 probes). This “proof of concept” tool was used to estimate the kinship matrix between 362 maize lines with 57,824 polymorphic InDels. This InDels kinship matrix was highly correlated with kinship estimated using SNPs from Illumina 50K SNP arrays.Conclusions We efficiently genotyped thousands of small to large InDels on a sizeable number of individuals using a new Affymetrix® Axiom® array. This powerful approach opens the way to studying the contribution of InDels to trait variation and heterosis in maize. The approach is easily extendable to other species and should contribute to decipher the biological impact of InDels at a larger scale.* List of abbreviations : GBA : Genotyping by array GBS : Genotyping by sequencing SNP : Single nucleotide polymorphism InDel : Insertion / Deletion BP : Breakpoint MONO : Monomorphic OTV : Off Target Variant QC : Quality control PHR : Poly High Resolyion VCF : Variant Call Format PAR : Presence / Absence Region PAV : Presence / Absence Variant SV : Structural variant CNV : Copy Number Variant TE : Transposable Element CGH : Comparative Genomic Hybridization NGS : Next Generation Sequencing FW : Forward REV : Reverse NAM : Nested Association Mapping DNA : Deoxyribonucleic Acid PCR : Polymerase Chain Reaction PcoA : Principal Coordinate Analysis Mbp : Millions of Base Pairs bp : base pair FreqDiff01 : Frequency of lines not fully consistent between probes within InDel
0

Assessing the response of small RNA populations to allopolyploidy using resynthesized Brassica napus allotetraploids

Paulina Palacios et al.Oct 19, 2018
Allopolyploidy, combining interspecific hybridization with whole genome duplication, has had significant impact on plant evolution. Its evolutionary success is related to the rapid and profound genome reorganizations that allow neo-allopolyploids to form and adapt. Nevertheless, how neo-allopolyploid genomes adapt to regulate their expression remains poorly understood. The hypothesis of a major role for small non-coding RNAs (sRNAs) in mediating the transcriptional response of neo-allopolyploid genomes has progressively emerged. Generally, 21-nt sRNAs mediate post-transcriptional gene silencing (PTGS) by mRNA cleavage whereas 24-nt sRNAs repress transcription (transcriptional gene silencing, TGS) through epigenetic modifications. Here, we characterize the global response of sRNAs to allopolyploidy in Brassica, using three independently resynthesized B. napus allotetraploids surveyed at two different generations in comparison with their diploid progenitors. Our results suggest an immediate but transient response of specific sRNA populations to allopolyploidy. These sRNA populations mainly target non-coding components of the genome but also target the transcriptional regulation of genes involved in response to stresses and in metabolism; this suggests a broad role in adapting to allopolyploidy. We finally identify the early accumulation of both 21- and 24-nt sRNAs involved in regulating the same targets, supporting a PTGS-to-TGS shift at the first stages of the neo-allopolyploid formation. We propose that reorganization of sRNA production is an early response to allopolyploidy in order to control the transcriptional reactivation of various non-coding elements and stress-related genes, thus ensuring genome stability during the first steps of neo-allopolyploid formation.
0

Introns structure patterns of variation in nucleotide composition in Arabidopsis thaliana and rice protein-coding genes

Adrienne Ressayre et al.Oct 28, 2014
Plant genomes are large, intron-rich and present a wide range of variation in coding region G+C content. Concerning coding regions, a sort of syndrome can be described in plants: the increase in G+C content is associated with both the increase in heterogeneity among genes within a genome and the increase in variation across genes. Taking advantage of the large number of genes composing plant genomes and the wide range of variation in gene intron number, we performed a comprehensive survey of the patterns of variation in G+C content at different scales from the nucleotide level to the genome scale in two species Arabidopsis thaliana and Oryza sativa, comparing the patterns in genes with different intron numbers. In both species, we observed a pervasive effect of gene intron number and location along genes on G+C content, codon and amino acid frequencies suggesting that in both species, introns have a barrier effect structuring G+C content along genes. In external gene regions (located upstream first or downstream last intron), species-specific factors are shaping G+C content while in internal gene regions (surrounded by introns), G+C content is constrained to remain within a range common to both species. In rice, introns appear as a major determinant of gene G+C content while in A. thaliana introns have a weaker but significant effect. The structuring effect of introns in both species is susceptible to explain the G+C content syndrome observed in plants.
0

Low temperature triggers genome-wide hypermethylation of transposable elements and centromeres in maize

Zeineb Achour et al.Mar 11, 2019
Characterizing the molecular processes developed by plants to respond to environmental cues is a major task to better understand local adaptation. DNA methylation is a chromatin mark involved in the transcriptional silencing of transposable elements (TEs) and gene expression regulation. While the molecular bases of DNA methylation regulation are now well described, involvement of DNA methylation in plant response to environmental cues remains poorly characterized. Here, using the TE-rich maize genome and analyzing methylome response to prolonged cold at the chromosome and feature scales, we investigate how genomic architecture affects methylome response to stress in a cold-sensitive genotype. Interestingly, we show that cold stress induces a genome-wide methylation increase through the hypermethylation of TE sequences and centromeres. Our work highlights a cytosine context-specific response of TE methylation that depends on TE types, chromosomal location and proximity to genes. The patterns observed can be explained by the parallel transcriptional activation of multiple DNA methylation pathways that methylate TEs in the various chromatin locations where they reside. Our results open new insights into the possible role of genome-wide DNA methylation in phenotypic response to stress.