TM
Thomas Martínez
Author with expertise in Ribosome Structure and Translation Mechanisms
University of California, Irvine, University of Lille, Pasteur Institute of Lille
+ 11 more
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
6
(67% Open Access)
Cited by:
23
h-index:
14
/
i10-index:
15
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
101

A community-driven roadmap to advance research on translated open reading frames detected by Ribo-seq

Jonathan Mudge et al.Oct 24, 2023
+25
J
J
J
ABSTRACT Ribosome profiling (Ribo-seq) has catalyzed a paradigm shift in our understanding of the translational ‘vocabulary’ of the human genome, discovering thousands of translated open reading frames (ORFs) within long non-coding RNAs and presumed untranslated regions of protein-coding genes. However, reference gene annotation projects have been circumspect in their incorporation of these ORFs due to uncertainties about their experimental reproducibility and physiological roles. Yet, it is indisputable that certain Ribo-seq ORFs make stable proteins, others mediate gene regulation, and many have medical implications. Ultimately, the absence of standardized ORF annotation has created a circular problem: while Ribo-seq ORFs remain unannotated by reference biological databases, this lack of characterisation will thwart research efforts examining their roles. Here, we outline the initial stages of a community-led effort supported by GENCODE / Ensembl, HGNC and UniProt to produce a consolidated catalog of human Ribo-seq ORFs.
101
Paper
Citation20
0
Save
0

Comparison of software packages for detecting unannotated translated small open reading frames by Ribo-seq

Gregory Tong et al.Dec 31, 2023
T
N
G
SUMMARY Accurate and comprehensive annotation of microprotein-coding small open reading frames (smORFs) is critical to our understanding of normal physiology and disease. Empirical identification of translated smORFs is carried out primarily using ribosome profiling (Ribo-seq). While effective, published Ribo-seq datasets can vary drastically in quality and different analysis tools are frequently employed. Here, we examine the impact of these factors on identifying translated smORFs. We compared five commonly used software tools that assess ORF translation from Ribo-seq (RibORFv0.1, RibORFv1.0, RiboCode, ORFquant, and Ribo-TISH), and found surprisingly low agreement across all tools. Only ∼2% of smORFs were called translated by all five tools and ∼15% by three or more tools when assessing the same high- resolution Ribo-seq dataset. For larger annotated genes, the same analysis showed ∼72% agreement across all five tools. We also found that some tools are strongly biased against low- resolution Ribo-seq data, while others are more tolerant. Analyzing Ribo-seq coverage as a proxy for translation levels revealed that highly translated smORFs are more likely to be detected by more than one tool. Together these results support employing multiple tools to identify the most confident microprotein-coding smORFs, and choosing the tools based on the quality of the dataset and planned downstream characterization experiments of predicted smORFs.
0

Characterizing Long COVID in Children and Adolescents

Rachel Gross et al.Sep 12, 2024
+1009
J
L
R
Importance Most research to understand postacute sequelae of SARS-CoV-2 infection (PASC), or long COVID, has focused on adults, with less known about this complex condition in children. Research is needed to characterize pediatric PASC to enable studies of underlying mechanisms that will guide future treatment. Objective To identify the most common prolonged symptoms experienced by children (aged 6 to 17 years) after SARS-CoV-2 infection, how these symptoms differ by age (school-age [6-11 years] vs adolescents [12-17 years]), how they cluster into distinct phenotypes, and what symptoms in combination could be used as an empirically derived index to assist researchers to study the likely presence of PASC. Design, Setting, and Participants Multicenter longitudinal observational cohort study with participants recruited from more than 60 US health care and community settings between March 2022 and December 2023, including school-age children and adolescents with and without SARS-CoV-2 infection history. Exposure SARS-CoV-2 infection. Main Outcomes and Measures PASC and 89 prolonged symptoms across 9 symptom domains. Results A total of 898 school-age children (751 with previous SARS-CoV-2 infection [referred to as infected ] and 147 without [referred to as uninfected ]; mean age, 8.6 years; 49% female; 11% were Black or African American, 34% were Hispanic, Latino, or Spanish, and 60% were White) and 4469 adolescents (3109 infected and 1360 uninfected; mean age, 14.8 years; 48% female; 13% were Black or African American, 21% were Hispanic, Latino, or Spanish, and 73% were White) were included. Median time between first infection and symptom survey was 506 days for school-age children and 556 days for adolescents. In models adjusted for sex and race and ethnicity, 14 symptoms in both school-age children and adolescents were more common in those with SARS-CoV-2 infection history compared with those without infection history, with 4 additional symptoms in school-age children only and 3 in adolescents only. These symptoms affected almost every organ system. Combinations of symptoms most associated with infection history were identified to form a PASC research index for each age group; these indices correlated with poorer overall health and quality of life. The index emphasizes neurocognitive, pain, and gastrointestinal symptoms in school-age children but change or loss in smell or taste, pain, and fatigue/malaise–related symptoms in adolescents. Clustering analyses identified 4 PASC symptom phenotypes in school-age children and 3 in adolescents. Conclusions and Relevance This study developed research indices for characterizing PASC in children and adolescents. Symptom patterns were similar but distinguishable between the 2 groups, highlighting the importance of characterizing PASC separately for these age ranges.
0
Citation1
0
Save
0

Comparison of software packages for detecting unannotated translated small open reading frames by Ribo-seq

Gregory Tong et al.Sep 11, 2024
T
N
G
Abstract Accurate and comprehensive annotation of microprotein-coding small open reading frames (smORFs) is critical to our understanding of normal physiology and disease. Empirical identification of translated smORFs is carried out primarily using ribosome profiling (Ribo-seq). While effective, published Ribo-seq datasets can vary drastically in quality and different analysis tools are frequently employed. Here, we examine the impact of these factors on identifying translated smORFs. We compared five commonly used software tools that assess open reading frame translation from Ribo-seq (RibORFv0.1, RibORFv1.0, RiboCode, ORFquant, and Ribo-TISH) and found surprisingly low agreement across all tools. Only ~2% of smORFs were called translated by all five tools, and ~15% by three or more tools when assessing the same high-resolution Ribo-seq dataset. For larger annotated genes, the same analysis showed ~74% agreement across all five tools. We also found that some tools are strongly biased against low-resolution Ribo-seq data, while others are more tolerant. Analyzing Ribo-seq coverage revealed that smORFs detected by more than one tool tend to have higher translation levels and higher fractions of in-frame reads, consistent with what was observed for annotated genes. Together these results support employing multiple tools to identify the most confident microprotein-coding smORFs and choosing the tools based on the quality of the dataset and the planned downstream characterization experiments of the predicted smORFs.
0
Citation1
0
Save
21

Profiling Mouse Brown and White Adipocytes to Identify Metabolically Relevant Small ORFs and Functional Microproteins

Thomas Martínez et al.Oct 24, 2023
+26
A
S
T
SUMMARY The absence of thousands of recently annotated small open reading frame (smORF)-encoded peptides and small proteins (microproteins) from databases has precluded their analysis in metabolism and metabolic disease. Given the outsized importance of small proteins and peptides such as insulin, leptin, amylin, glucagon, and glucagon-like peptide-1 (GLP-1) in metabolism, microproteins are a potentially rich source of uncharacterized metabolic regulators. Here, we annotate smORFs in primary differentiated brown, white, and beige mouse adipose cells. Ribosome profiling (Ribo-Seq) detected a total of 3,877 unannotated smORFs. Analysis of RNA-Seq datasets revealed diet-regulated smORF expression in adipose tissues, and validated the adipose translation of the feeding-neuron marker gene Gm8773. Gm8773 encodes the mouse homolog of FAM237B, a neurosecretory protein that stimulates food intake and promotes weight gain in chickens. Testing of recombinant mFAM237B produced similar orexigenic activity in mice further supporting a role for FAM237B as a metabolic regulator and potentially part of the brain-adipose axis. Furthermore, we demonstrated that data independent acquisition mass spectrometry (DIA-MS) proteomics can provide a sensitive, flexible, and quantitative platform for identifying microproteins by mass spectrometry. Using this system led to the detection of 58 microproteins from cell culture and an additional 33 from mouse plasma. The proteomics data established the anti-inflammatory microprotein AW112010 as a circulating factor, and found that plasma levels of a microprotein translated from a FRS2 uORF is elevated in older obese mice. Together, the data highlight the value of this database in examining understudied smORFs and microproteins in metabolic research and identifying additional regulators of metabolism.
0

An Improved Human smORF Annnotation Workflow Combining De Novo Transcriptome Assembly and Ribo-Seq

Thomas Martínez et al.May 7, 2020
+3
C
Q
T
Protein-coding small open reading frames (smORFs) are emerging as an important class of genes, however, the coding capacity of smORFs in the human genome is unclear. By integrating de novo transcriptome assembly and Ribo-Seq, we confidently annotate thousands of novel translated smORFs in three human cell lines. We find that smORF translation prediction is noisier than for annotated coding sequences, underscoring the importance of analyzing multiple experiments and footprinting conditions. These smORFs are located within non-coding and antisense transcripts, the UTRs of mRNAs, and unannotated transcripts. Analysis of RNA levels and translation efficiency during cellular stress identifies regulated smORFs, providing an approach to select smORFs for further investigation. Sequence conservation and signatures of positive selection indicate that encoded microproteins are likely functional. Additionally, proteomics data from enriched human leukocyte antigen complexes validates the translation of hundreds of smORFs and positions them as a source of novel antigens. Thus, smORFs represent a significant number of important, yet unexplored human genes.