YS
Yijing Shen
Author with expertise in Ribosome Structure and Translation Mechanisms
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
4
(100% Open Access)
Cited by:
2
h-index:
7
/
i10-index:
7
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Kinetic sequencing (k-Seq) as a massively parallel assay for ribozyme kinetics: utility and critical parameters

Yijing Shen et al.Dec 3, 2020
I
E
A
Y
ABSTRACT Characterization of genotype-phenotype relationships of genetically encoded molecules (e.g., ribozymes) requires accurate quantification of activity for a large set of molecules. Kinetic measurement using high-throughput sequencing (e.g., k -Seq) is an emerging assay applicable in various domains that potentially scales up measurement throughput to 10 5 ~ 10 6 unique sequences. However, technical challenges introduced by sequence heterogeneity and DNA sequencing must be understood to realize the utility and limitations of such assays. We characterized the k -Seq method in terms of model identifiability, effects of sequencing error, accuracy and precision using simulated datasets and experimental data from a variant pool constructed from previously identified ribozymes. Relative abundance, kinetic coefficients, and measurement noise were found to affect the measurement of each sequence. We introduced bootstrapping to robustly quantify the uncertainty in estimating model parameters and proposed interpretable metrics to quantify model identifiability. These efforts enabled the rigorous reporting of data quality for individual sequences in k -Seq experiments. Critical experimental factors were examined, and general guidelines are proposed to maximize the number of sequences having precisely estimated and identifiable kinetic coefficients from k -Seq data. Practices analogous to those laid out here could be applied to improve the rigor of similar sequencing-based assays.
0
Citation1
0
Save
1

Error minimization and specificity could emerge in a genetic code as by-products of prebiotic evolution

Evan Janzen et al.May 17, 2021
+2
Y
Z
E
Abstract The emergence of the genetic code was a major transition in the evolution from a prebiotic RNA world to the earliest modern cells 1 . A prominent feature of the standard genetic code is error minimization, or the tendency of mutations to be unusually conservative in preserving biophysical features of the amino acid 2–6 . While error minimization is often assumed to result from natural selection, it has also been speculated that error minimization may be a by-product of emergence of the genetic code 3 . During establishment of the genetic code in an RNA world, self-aminoacylating ribozymes would enforce the mapping of amino acids to anticodons. Here we show that expansion of the genetic code, through co-option of ribozymes for new substrates, could result in error minimization as an emergent property. Using self-aminoacylating ribozymes previously identified during an exhaustive search of sequence space 7 , we measured the activity of thousands of candidate ribozymes on alternative substrates (activated analogs for tryptophan, phenylalanine, leucine, isoleucine, valine, and methionine). Related ribozymes exhibited preferences for biophysically similar substrates, indicating that co-option of existing ribozymes to adopt additional amino acids into the genetic code would itself lead to error minimization. Furthermore, ribozyme activity was positively correlated with specificity, indicating that selection for increased activity would also lead to increased specificity. These results demonstrate that by-products of the evolution and functional expansion of a ribozyme system could lead to adaptive properties of a genetic code. Such ‘spandrels’ could thus underlie significant prebiotic developments.
1
Citation1
0
Save
2

Dynamics of the epigenetic landscape during development and in response to drought stress in sorghum

Yongfeng Hu et al.Apr 25, 2023
+8
C
Q
Y
Abstract Sorghum bicolor is a C4 plant with the characteristics of high stress tolerance, which may be conferred partly by the underlying epigenetic mechanism unique to sorghum. In this study, we revealed some epigenomic features in sorghum that have never been reported before. The long H3K27me3 regions clustered in four areas, which we defined as H3K27me3 islands, were identified in sorghum. H3K36me3 plays some role in inhibiting the deposition of both H3K27me3 and H2A.Z, which may serve as partial motivation for the removal of H3K27me3 and H2A.Z in leaf and root. All the 7 histone marks are involved in the regulation of tissue-specific genes, especially the specific expression of C4 genes in leaf and peroxidase (POD) encoding genes in root, which are involved in the photosynthesis in leaf and lignin synthesis in root, respectively. These marks except H3K36me3 and H3K27me3 also engage in the regulation of stress genes in response to PEG treatment. However, we found that differential enrichment of histone marks on many tissue-specific genes was observed only between leaf and root but hardly in response to PEG treatment, although expression of these genes changed after PEG treatment.
1

Discovering pathways through ribozyme fitness landscapes using information theoretic quantification of epistasis

Nathaniel Charest et al.May 24, 2023
+2
Y
Y
N
Abstract The identification of catalytic RNAs is typically achieved through primarily experimental means. However, only a small fraction of sequence space can be analyzed even with high-throughput techniques. Methods to extrapolate from a limited data set to predict additional ribozyme sequences, particularly in a human-interpretable fashion, could be useful both for designing new functional RNAs and for generating greater understanding about a ribozyme fitness landscape. Using information theory, we express the effects of epistasis (i.e., deviations from additivity) on a ribozyme. This representation was incorporated into a simple model of the epistatic fitness landscape, which identified potentially exploitable combinations of mutations. We used this model to theoretically predict mutants of high activity for a self-aminoacylating ribozyme, identifying potentially active triple and quadruple mutants beyond the experimental data set of single and double mutants. The predictions were validated experimentally, with nine out of nine sequences being accurately predicted to have high activity. This set of sequences included mutants that form a previously unknown evolutionary ‘bridge’ between two ribozyme families that share a common motif. Individual steps in the method could be examined, understood, and guided by a human, combining interpretability and performance in a simple model to predict ribozyme sequences by extrapolation.