RY
Robert Young
Author with expertise in Regulation of RNA Processing and Function
University of Edinburgh, Zhejiang University-University of Edinburgh Institute, Centre for Global Health Research
+ 7 more
Achievements
This user has not unlocked any achievements yet.
Key Stats
Upvotes received:
0
Publications:
10
(40% Open Access)
Cited by:
1
h-index:
24
/
i10-index:
35
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
18

Detecting oncogenic selection through biased allele retention in The Cancer Genome Atlas

Juliet Luft et al.Oct 24, 2023
M
A
R
J
Abstract Background The loss of genetic diversity in segments over a genome (loss-of-heterozygosity, LOH) is a common occurrence in many types of cancer. By analysing patterns of preferential allelic retention during LOH in approximately 10,000 cancer samples from The Cancer Genome Atlas (TCGA), we sought to systematically identify genetic polymorphisms currently segregating in the human population that are preferentially selected for, or against during cancer development. Results Experimental batch effects and cross-sample contamination were found to be substantial confounders in this widely used and well studied dataset. To mitigate these we developed a generally applicable classifier (GenomeArtiFinder) to quantify contamination and other abnormalities. We provide these results as a resource to aid further analysis of TCGA whole exome sequencing data. In total, 1,678 pairs of samples (14.7%) were found to be contaminated or affected by systematic experimental error. After filtering, our analysis of LOH revealed an overall trend for biased retention of cancer-associated risk alleles previously identified by genome wide association studies. Analysis of predicted damaging germline variants identified highly significant oncogenic selection for recessive tumour suppressor alleles. These are enriched for biological pathways involved in genome maintenance and stability. Conclusions Our results identified predicted damaging germline variants in genes responsible for the repair of DNA strand breaks and homologous repair as the most common targets of allele biased LOH. This suggests a ratchet-like process where heterozygous germline mutations in these genes reduce the efficacy of DNA double-strand break repair, increasing the likelihood of a second hit at the locus removing the wild-type allele and triggering an oncogenic mutator phenotype.
18
Paper
Citation1
0
Save
0

Functional Annotation of Human Long Non-Coding RNAs via Molecular Phenotyping

Jordan Ramilowski et al.May 6, 2020
+113
S
C
J
Long non-coding RNAs (lncRNAs) constitute the majority of transcripts in mammalian genomes and yet, their functions remain largely unknown. We systematically suppressed 285 lncRNAs in human dermal fibroblasts and quantified cellular growth, morphological changes, and transcriptomic responses using Capped Analysis of Gene Expression (CAGE). The resulting transcriptomic profiles recapitulated the observed cellular phenotypes, yielding specific roles for over 40% of analyzed lncRNAs in regulating distinct biological pathways, transcriptional machinery, alternative promoter activity and architecture usage. Overall, combining cellular and molecular profiling provided a powerful approach to unravel the distinct functions of lncRNAs, which we highlight with specific functional roles for ZNF213-AS1 and lnc-KHDC3L-2 .
0

An unexpected contribution of lincRNA splicing to enhancer function.

Jennifer Tan et al.May 7, 2020
A
R
A
J
Transcription is common at active mammalian enhancers sometimes giving rise to stable and unidirectionally transcribed enhancer-associated long intergenic noncoding RNAs (elincRNAs). ElincRNA expression is associated with changes in neighboring gene product abundance and local chromosome topology, suggesting that transcription at these loci contributes to gene expression regulation in cis. Despite the lack of evidence supporting sequence-dependent functions for most elincRNAs, splicing of these transcripts is unexpectedly common. Whether elincRNA splicing is a mere consequence of their cognate enhancer activity or if it directly impacts enhancer-associated cis-regulation remains unanswered. Here we show that elincRNAs are efficiently and rapidly spliced and that their processing rate is strongly associated with their cognate enhancer activity. This association is supported by: their enrichment in enhancer-specific chromatin signatures; elevated binding of co-transcriptional regulators, including CBP and p300; increased local intra-chromosomal DNA contacts; and strengthened cis-regulation on target gene expression. Using nucleotide polymorphisms at human elincRNA splice sites, we found that elincRNA splicing enhances their transcription and directly impacts cis-regulatory function of their cognate enhancers. Importantly, up to 90% of human elincRNAs have nucleotide variants that are associated with both their splicing and the expression levels of their proximal genes. Our results highlight the unexpected contribution of elincRNA splicing to enhancer function.
0

Bidirectional transcription marks accessible chromatin and is not specific to enhancers

Robert Young et al.May 6, 2020
M
W
Y
R
Bidirectional transcription initiating at enhancers has been proposed to represent the signature of enhancer activity. Here we show that bidirectional transcription is a pervasive feature of all forms of accessible chromatin, including enhancers, promoters, CTCF-bound sites and other DNase hypersensitive regions. Transcription is less predictive for enhancer activity than epigenetic modifications such as H3K4me1 or the accessibility of DNA when measured in both enhancer assays and at endogenous loci. Bidirectional transcription initiation from accessible chromatin is therefore not sufficient for, nor specific to, enhancer activity. The stability of enhancer initiated transcripts does not influence measures of enhancer activity and we cannot detect any evidence of purifying selection on the resulting enhancer RNAs within the human population. Our results suggest that transcription initiating at enhancers is frequently a by-product of promiscuous RNA polymerase activity at accessible chromatin, and may not generally play a functional role in enhancer activity.
0

Identification of a Nonsense-Mediated Decay pathway at the Endoplasmic Reticulum

Dáša Longman et al.May 7, 2020
+6
M
K
D
Nonsense-mediated decay (NMD) is a translation-dependent RNA quality control mechanism that occurs in the cytoplasm. However, it is unknown how NMD regulates the stability of RNAs translated at the Endoplasmic Reticulum (ER). Here, we identify a localized NMD pathway dedicated to ER-translated mRNAs. We previously identified NBAS, a component of the Syntaxin 18 complex involved in Golgi-to-ER trafficking, as a novel NMD factor. Here, we show that NBAS fulfils an independent function in NMD. This ER-NMD pathway requires the interaction of NBAS with the core NMD factor UPF1, which is partially localized at the ER in the proximity of the translocon. NBAS and UPF1 co-regulate the stability of ER-associated transcripts, in particular those associated with the cellular stress response. We propose a model where NBAS recruits UPF1 to the membrane of the ER and activates an ER-dedicated NMD pathway, thus providing an ER protective function by ensuring quality control of ER-translated mRNAs.
0

Genetic variation and RNA structure regulate microRNA biogenesis

Noemí Fernández et al.May 7, 2020
+3
R
R
N
MiRNA biogenesis is highly regulated at the post-transcriptional level; however, the role of sequence and secondary RNA structure in this process has not been extensively studied. A single G to A substitution present in the terminal loop of pri-mir-30c-1 in breast cancer patients had been previously described to result in increased levels of mature miRNA. Here, we report that this genetic variant directly affects Drosha-mediated processing of pri-mir-30c-1 in vitro and in cultured cells. Structural analysis of this variant revealed an altered RNA structure that facilitates the interaction with SRSF3, an SR protein family member that promotes pri-miRNA processing. Our results are compatible with a model whereby a genetic variant in pri-mir-30c-1 leads to a secondary RNA structure rearrangement that facilitates binding of SRSF3 resulting in increased levels of miR-30c. These data highlights that primary sequence determinants and RNA structure are key regulators of miRNA biogenesis.
0
0
Save
1

Functional archaic DNA regulates molecular variation and is associated with disease risk across global populations

Jianning Kang et al.Oct 24, 2023
R
L
A
J
Abstract The human genome contains many remnants of its evolutionary history, including a large number of evolutionarily volatile loci which have been introduced since our divergence from primates. One particularly intriguing source of novel DNA sequences is introgression events with archaic species which co-existed with modern humans. Both Neanderthals, who were common in Europe, and Denisovans, who have been observed only in Asia, have contributed genetic variants to the modern human genome but the functional consequences of these introgressed variants have yet to be investigated systematically. In this work, we show that Neanderthal and Denisovan DNA is most enriched for genetic variants which regulate gene expression in Europe and East Asia respectively, i.e. the populations in which the introgression event(s) most contributed to contemporary genetic variation. Neanderthal eQTLs, in particular, frequently upregulate gene expression. Archaic eQTLs from these two species regulate target genes with similar molecular functions which are distinct in each contemporary population, with the only common enrichment being for Neanderthal eQTLs to regulate taste receptor genes in both Europe and East Asia. We observed a correlated pattern of enrichment and depletion of medical phenotypes across Neanderthal and Denisovan eQTLs, including a shared enrichment for CNVs associated with developmental delay. Our results demonstrate the role of functional archaic DNA in regulating molecular phenotypes and disease risk across global populations and confirm the relevance of recently acquired DNA to contemporary human genetic variation. Author Summary Modern humans co-existed and interbred with two archaic human species (Neanderthals and Denisovans). The results of these events can still be detected as introgressed, archaic DNA sequences within the modern human genome. Here, we surveyed the contribution of functional archaic DNA across European and Asian populations by assessing their contribution to genetic variants which regulate gene expression in these two populations. We found that both species make a disproportionate functional contribution to the population with which they shared the most overlap (i.e. Neanderthals in Europe and Denisovans in East Asia). Although only Neanderthal DNA drives a higher level of gene expression compared to modern genetic variants, the DNA from both archaic species frequently regulates genes involved in many different biological processes and risk of disease, including a shared contribution to developmental delay. These results confirm the relevance of our recent evolutionary past in generating functional variation across global populations and the importance these recently introduced genetic sequences play in regulating current biological variation, such as disease risk.
3

Emergence of new enhancers at late DNA replicating regions

Paola Cornejo‐Páramo et al.Oct 24, 2023
+2
X
V
P
Abstract Unlike protein-coding regions, enhancers generally evolve rapidly. By examining enhancer turnover across mammalian species and in multiple tissue-types, we uncovered a relationship between the emergence of novel enhancers and genome organization, reflected by DNA replication time. While enhancers are most abundant in euchromatic regions, new enhancers emerged almost twice as often in late compared to early replicating regions, independent of transposable elements. Using a deep learning model, we demonstrate that new enhancers are enriched for mutations that alter transcription factor (TF) binding. Overall recent enhancers often exhibit neutral evolution, eQTL enrichment, and greater tissue specificity than their evolutionarily conserved counterparts. Accordingly, transcription factors that bind to these enhancers, inferred by their binding sequences, are also more recently evolved and more tissue-specific in gene expression. A similar relationship with DNA replication time is observed in multiple cancer types. Somatic mutations in cancer are consistently elevated in enhancers that have undergone turnover compared to those that remain unchanged. These results demonstrate a relationship between DNA replication time and enhancer evolution across diverse time scales, suggesting that these observations may be time-invariant principles of genome evolution.
0

Integrated analysis and systematic characterization of the regulatory network for human germline development

Yun Gu et al.May 27, 2024
+14
Z
J
Y
Abstract Primordial germ cells (PGCs) are the precursors of germline that are specified at embryonic stage. Recent studies reveal that humans employ different mechanisms for PGC specification compared with model organisms such as mice. Moreover, the specific regulatory machinery is still largely unexplored, mainly due to the inaccessible nature of this complex biological process. Here, we collect and integrate multi-omics data, including 581 RNA-seq, 54 ATAC-seq, 45 ChIP-seq, and 69 single-cell RNA-seq samples from different stages of human PGC development to recapitulate the precisely controlled and stepwise process, presenting an atlas in the human PGC database (hPGCdb). With these uniformly processed data and integrated analyses, we characterize the potential key transcription factors and regulatory networks governing human germ cell fate. We validate the important roles of some of the key factors in germ cell development by CRISPRi knockdown. We also identify the soma-germline interaction network and discover the involvement of SDC2 and LAMA4 for PGC development, as well as soma-derived NOTCH2 signaling for germ cell differentiation. Taken together, we have built a database for human PGCs and demonstrate that hPGCdb enables the identification of the missing pieces of mechanisms governing germline development, including both intrinsic and extrinsic regulatory programs.
0

Splicing buffers suboptimal codon usage in human cells

Christine Mordstein et al.May 7, 2020
+7
R
R
C
Although multiple studies have addressed the effects of codon usage on gene expression, such studies were typically performed in unspliced model genes. In the human genome, most genes undergo splicing and patterns of codon usage are splicing-dependent: guanine and cytosine (GC) content is highest within single-exon genes and within first exons of multi-exon genes. Intrigued by this observation, we measured the effects of splicing on expression in a panel of synonymous variants of GFP and mKate2 reporter genes that varied in nucleotide composition. We found that splicing promotes the expression of adenine and thymine (AT)-rich variants by increasing their steady-state protein and mRNA levels, in part through promoting cytoplasmic localization of mRNA. Splicing had little or no effect on the expression of GC-rich variants. In the absence of splicing, high GC content at the 5' end, but not at the 3' end of the coding sequence positively correlated with expression. Among endogenous human protein-coding transcripts, GC content has a more positive effect on various expression measures of unspliced, relative to spliced mRNAs. We propose that splicing promotes the expression of AT-rich genes, leading to selective pressure for the retention of introns in the human genome.