JN
Jaclyn Noshay
Author with expertise in Genome Evolution and Polyploidy in Plants
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
12
(83% Open Access)
Cited by:
341
h-index:
13
/
i10-index:
15
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Widespread long-range cis-regulatory elements in the maize genome

William Ricci et al.Nov 18, 2019
Genetic mapping studies on crops suggest that agronomic traits can be controlled by gene–distal intergenic loci. Despite the biological importance and the potential agronomic utility of these loci, they remain virtually uncharacterized in all crop species to date. Here, we provide genetic, epigenomic and functional molecular evidence to support the widespread existence of gene–distal (hereafter, distal) loci that act as long-range transcriptional cis-regulatory elements (CREs) in the maize genome. Such loci are enriched for euchromatic features that suggest their regulatory functions. Chromatin loops link together putative CREs with genes and recapitulate genetic interactions. Putative CREs also display elevated transcriptional enhancer activities, as measured by self-transcribing active regulatory region sequencing. These results provide functional support for the widespread existence of CREs that act over large genomic distances to control gene expression. Long-range cis-regulatory elements play important roles in regulating agronomic traits, but they are largely uncharacterized in crops. This study provides genetic, epigenomic and functional molecular evidence to support their widespread existence in the maize genome.
0
Citation307
0
Save
47

Cis-regulatory elements within TEs can influence expression of nearby maize genes

Jaclyn Noshay et al.May 22, 2020
Abstract Transposable elements (TEs) have the potential to create regulatory variation both through disruption of existing DNA regulatory elements and through creation of novel DNA regulatory elements. In a species with a large genome, such as maize, the many TEs interspersed with genes creates opportunities for significant allelic variation due to TE presence/absence polymorphisms among individuals. We used information on putative regulatory elements in combination with knowledge about TE polymorphisms in maize to identify TE insertions that interrupt existing accessible chromatin regions (ACRs) in B73 as well as examples of polymorphic TEs that contain ACRs among four inbred lines of maize including B73, Mo17, W22, and PH207. The TE insertions in three other assembled maize genomes (Mo17, W22 or PH207) that interrupt ACRs that are present in the B73 genome can trigger changes to the chromatin suggesting the potential for both genetic and epigenetic influences of these insertions. Nearly 20% of the ACRs located over 2kb from the nearest gene are located within an annotated TE. These are regions of unmethylated DNA that show evidence for functional importance similar to ACRs that are not present within TEs. Using a large panel of maize genotypes we tested if there is an association between the presence of TE insertions that interrupt, or carry, an ACR and the expression of nearby genes. TEs that carry ACRs exhibit an enrichment for being associated with higher expression of nearby genes, suggesting that these TEs may create novel regulatory elements. These analyses highlight the potential for TEs to rewire transcriptional responses in eukaryotic genomes. Data Availability In this study we utilize previously published datasets that are available through the following accessions: SRX4727413, SRR8738272, and SRR8740852.
47
Citation10
0
Save
0

Transposable elements contribute to dynamic genome content in maize

Sarah Anderson et al.Feb 12, 2019
Abstract Transposable elements (TEs) are ubiquitous components of eukaryotic genomes and can create variation in genomic organization. The majority of maize genomes are composed of TEs. We developed an approach to define shared and variable TE insertions across genome assemblies and applied this method to four maize genomes (B73, W22, Mo17, and PH207). Among these genomes we identified 1.6 Gb of variable TE sequence representing a combination of recent TE movement and deletion of previously existing TEs. Although recent TE movement only accounted for a portion of the TE variability, we identified 4,737 TEs unique to one genome with defined insertion sites in all other genomes. Variable TEs are found for all superfamilies and are distributed across the genome, including in regions of recent shared ancestry among individuals. There are 2,380 genes annotated in the B73 genome located within variable TEs, providing evidence for the role of TEs in contributing to the substantial differences in gene content among these genotypes. The large scope of TE variation present in this limited sample of temperate maize genomes highlights the major contribution of TEs in driving variation in genome organization and gene content. Significance Statement The majority of the maize genome is comprised of transposable elements (TEs) that have the potential to create genomic variation within species. We developed a method to identify shared and non-shared TEs using whole genome assemblies of four maize inbred lines. Variable TEs are found throughout the maize genome and in comparisons of any two genomes we find ~20% of the genome is due to non-shared TEs. Several thousand maize genes are found within TEs that are variable across lines, highlighting the contribution of TEs to gene content variation. This study creates a comprehensive resource for genomic studies of TE variability among four maize genomes, which will enable studies on the consequences of variable TEs on genome function.
0
Citation8
0
Save
57

Stable unmethylated DNA demarcates expressed genes and their cis-regulatory space in plant genomes

Peter Crisp et al.May 23, 2020
Abstract The genomic sequences of crops continue to be produced at a frenetic pace. However, it remains challenging to develop complete annotations of functional genes and regulatory elements in these genomes. Here, we explore the potential to use DNA methylation profiles to develop more complete annotations. Using leaf tissue in maize, we define ∼100,000 unmethylated regions (UMRs) that account for 5.8% of the genome; 33,375 UMRs are found greater than 2 kilobase pairs from genes. UMRs are highly stable in multiple vegetative tissues and they capture the vast majority of accessible chromatin regions from leaf tissue. However, many UMRs are not accessible in leaf (leaf-iUMRs) and these represent a set of genomic regions with potential to become accessible in specific cell types or developmental stages. Leaf-iUMRs often occur near genes that are expressed in other tissues and are enriched for transcription factor (TF) binding sites of TFs that are also not expressed in leaf tissue. The leaf-iUMRs exhibit unique chromatin modification patterns and are enriched for chromatin interactions with nearby genes. The total UMRs space in four additional monocots ranges from 80-120 megabases, which is remarkably similar considering the range in genome size of 271 megabases to 4.8 gigabases. In summary, based on the profile from a single tissue, DNA methylation signatures pinpoint both accessible regions and regions poised to become accessible or expressed in other tissues. UMRs provide powerful filters to distill large genomes down to the small fraction of putative functional genes and regulatory elements. Significance Statement Crop genomes can be very large with many repetitive elements and pseudogenes. Distilling a genome down to the relatively small fraction of regions that are functionally valuable for trait variation can be like looking for needles in a haystack. The unmethylated regions in a genome are highly stable during vegetative development and can reveal the locations of potentially expressed genes or cis-regulatory elements. This approach provides a framework towards complete annotation of genes and discovery of cis-regulatory elements using methylation profiles from only a single tissue.
57
Citation6
0
Save
41

Genetic and epigenetic contributions to variation in transposable element expression responses to abiotic stress in maize

Zhikai Liang et al.Aug 27, 2020
Summary Transposable elements (TEs) pervade most eukaryotic genomes but the repetitive nature of TEs has complicated the analysis of their expression. Although the majority of TEs are silent, we document the activation of some TEs during abiotic stress. TE expression was monitored in seedling leaf tissue of maize inbreds subjected to heat or cold stress conditions. DNA methylation profiles and comparative genomics were used to probe the variability of TE expression responses. Although there was no evidence for a genome-wide activation of TEs, a subset of TE families generate transcripts only in stress conditions. There is substantial variation for which TE families exhibit stress-responsive expression in the three genotypes. The stress-responsive activation of a TE family can often be attributed to a small number of elements in the family. These elements that are activated often contain small regions lacking DNA methylation, while fully methylated elements are rarely expressed. A comparison of the expression of specific TEs in different maize genotypes reveals high levels of variability that can be attributed to both genome content differences and epigenetic variation. This study provides insights into the genetic and epigenetic factors that influence TE regulation in normal and stress conditions.
41
Citation5
0
Save
0

Whole Genome Variation of Transposable Element Insertions in a Maize Diversity Panel

Yefeng Qiu et al.Sep 26, 2020
ABSTRACT Intact transposable elements (TEs) account for 65% of the maize genome and can impact gene function and regulation. Although TEs comprise the majority of the maize genome and affect important phenotypes, genome wide patterns of TE polymorphisms in maize have only been studied in a handful of maize genotypes, due to the challenging nature of assessing highly repetitive sequences. We implemented a method to use short read sequencing data from 509 diverse inbred lines to classify the presence/absence of 445,418 non-redundant TEs that were previously annotated in four genome assemblies including B73, Mo17, PH207, and W22. Different orders of TEs (i.e. LTRs, Helitrons, TIRs) had different frequency distributions within the population. LTRs with lower LTR similarity were generally more frequent in the population than LTRs with higher LTR similarity, though high frequency insertions with very high LTR similarity were observed. LTR similarity and frequency estimates of nested elements and the outer elements in which they insert revealed that most nesting events occurred very near the timing of the outer element insertion. TEs within genes were at higher frequency than those that were outside of genes and this is particularly true for those not inserted into introns. Many TE insertional polymorphisms observed in this population were tagged by SNP markers. However, there were also 19.9% of the TE polymorphisms that were not well tagged by SNPs (R 2 < 0.5) that potentially represent information that has not been well captured in previous SNP based marker-trait association studies. This study provides a population scale genome-wide assessment of TE variation in maize, and provides valuable insight on variation in TEs in maize and factors that contribute to this variation.
0
Citation3
0
Save
1

Stability of DNA methylation and chromatin accessibility in structurally diverse maize genomes

Jaclyn Noshay et al.Mar 11, 2021
Abstract Accessible chromatin and unmethylated DNA are associated with many genes and cis-regulatory elements. Attempts to understand natural variation for accessible chromatin regions (ACRs) and unmethylated regions (UMRs) often rely upon alignments to a single reference genome. This limits the ability to assess regions that are absent in the reference genome assembly and monitor how nearby structural variants influence variation in chromatin state. In this study, de novo genome assemblies for four maize inbreds (B73, Mo17, Oh43 and W22) are utilized to assess chromatin accessibility and DNA methylation patterns in a pan-genome context. The number of UMRs and ACRs that can be identified is more accurate when chromatin data is aligned to the matched genome rather than a single reference genome. While there are UMRs and ACRs present within genomic regions that are not shared between genotypes, these features are substantially enriched within shared regions, as determined by chromosomal alignments. Characterization of UMRs present within shared genomic regions reveals that most UMRs maintain the unmethylated state in other genotypes with only a small number being polymorphic between genotypes. However, the majority of UMRs between genotypes only exhibit partial overlaps suggesting that the boundaries between methylated and unmethylated DNA are dynamic. This instability is not solely due to sequence variation as these partially overlapping UMRs are frequently found within genomic regions that lack sequence variation. The ability to compare chromatin properties among individuals with structural variation enables pan-epigenome analyses to study the sources of variation for accessible chromatin and unmethylated DNA. Article summary Regions of the genome that have accessible chromatin or unmethylated DNA are often associated with cis-regulatory elements. We assessed chromatin accessibility and DNA methylation in four structurally diverse maize genomes. There are accessible or unmethylated regions within the non-shared portions of the genomes but these features are depleted within these regions. Evaluating the dynamics of methylation and accessibility between genotypes reveals conservation of features, albeit with variable boundaries suggesting some instability of the precise edges of unmethylated regions.
1
Citation2
0
Save
1

Limited consequences for loss of RNA-directed DNA methylation in Setaria viridis domains rearranged methyltransferase (DRM) mutants

Andrew Read et al.Jan 5, 2022
Abstract The Domains Rearranged Methyltransferases (DRMs) are crucial for RNA-directed DNA methylation (RdDM) in plant species. Setaria viridis is a model monocot species with a relatively compact genome that has limited transposable element content. CRISPR-based genome editing approaches were used to create loss-of-function alleles for the two putative functional DRM genes in S. viridis to probe the role of RdDM. The analysis of drm1ab double mutant plants revealed limited morphological consequences for the loss of RdDM. Whole-genome methylation profiling provided evidence for wide-spread loss of methylation in CHH sequence contexts, particularly in regions with high CHH methylation in wild-type plants. Evidence was also found for locus-specific loss of CG and CHG methylation, even in some regions that lack CHH methylation. Transcriptome profiling identified a limited number of genes with altered expression in the drm1ab mutants. The majority of genes with elevated CHH methylation directly surrounding the transcription start site or in nearby promoter regions do not have altered expression in the drm1ab mutant even when this methylation is lost, suggesting limited regulation of gene expression by RdDM. Detailed analysis of the expression of transposable elements identified several transposons that are transcriptionally activated in drm1ab mutants. These transposons likely require active RdDM for maintenance of transcriptional repression. Significance statement Methylation profiling of Setaria viridis plants that lack functional Domains Rearranged Methyltransferase genes reveal widespread loss of DNA methylation in the CHH sequence context. Transcriptome analysis reveals a small set of genes and transposons that are silenced by RNA-directed DNA methylation.
7

Quantum biological insights into CRISPR-Cas9 sgRNA efficiency from explainable-AI driven feature engineering

Jaclyn Noshay et al.Jun 3, 2022
Abstract CRISPR-Cas9 tools have transformed genetic manipulation capabilities in the laboratory. Empirical rules-of-thumb have been established for only a narrow range of model organisms, and mechanistic underpinnings for sgRNA efficiency remain poorly understood. This work establishes a novel feature set and new public resource, produced with quantum chemical tensors, for interpreting and predicting sgRNA efficiency. Feature engineering for sgRNA efficiency is performed using an explainable-artificial intelligence model; iterative Random Forest (iRF). By encoding quantitative attributes of position-specific sequences for E. coli sgRNAs, we identify important traits for sgRNA design in bacterial species. Additionally, we show that expanding positional encoding to quantum descriptors of base-pair, dimer, trimer and tetramer sequences captures intricate interactions in local and neighboring nucleotides of the target DNA. These features highlight variation in CRISPR-Cas9 sgRNA dynamics between E. coli and H. sapien genomes. These novel encodings of sgRNAs greatly enhance our understanding of the elaborate quantum biological processes involved in CRISPR-Cas9 machinery.
Load More