JT
J. Torres-Rodríguez
Author with expertise in Genetic Architecture of Quantitative Traits
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
10
(90% Open Access)
Cited by:
2
h-index:
3
/
i10-index:
2
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
52

Phenotypic variation in maize can be largely explained by genetic variation at transcription factor binding sites

Julia Engelhorn et al.Aug 9, 2023
+21
M
S
J
Abstract Comprehensive maps of functional variation at transcription factor (TF) binding sites ( cis -elements) are crucial for elucidating how genotype shapes phenotype. Here we report the construction of a pan-cistrome of the maize leaf under well-watered and drought conditions. We quantified haplotype-specific TF footprints across a pan-genome of 25 maize hybrids and mapped over two-hundred thousand genetic variants (termed binding-QTL) linked to cis -element occupancy. Three lines of evidence support the functional significance of binding-QTL: i) they coincide with numerous known causative loci that regulate traits, including VGT1 , Trehalase1 , and the MITE transposon near ZmNAC111 under drought; ii) their footprint bias is mirrored between inbred parents and by ChIP-seq; iii) partitioning genetic variation across genomic regions demonstrates that binding-QTL capture the majority of heritable trait variation across ∼70% of 143 phenotypes. Our study provides a promising approach to make previously hidden cis -variation more accessible for genetic studies and multi-target engineering of complex traits.
52
Citation2
0
Save
0

Transcripts and genomic intervals associated with variation in metabolite abundance in maize leaves under field conditions

R. Mathivanan et al.Aug 27, 2024
+5
J
C
R
Plants exhibit extensive environment-dependent intraspecific metabolic variation, which likely plays a role in determining variation in whole plant phenotypes. However, much of the work seeking to use natural variation to link genes and transcript's impacts on plant metabolism has employed data from controlled environments. Here we generate and employ data on variation in the abundance of twenty-six metabolites across 660 maize inbred lines under field conditions. We employ these data and previously published transcript and whole plant phenotype data reported for the same field experiment to identify both genomic intervals (through genome-wide association studies) and transcripts (through both transcriptome-wide association studies and an explainable AI approach based on the random forest) associated with variation in metabolite abundance. Both genome-wide association and random forest-based methods identified substantial numbers of significant associations including genes with plausible links to the metabolites they are associated with. In contrast, the transcriptome-wide association identified only six significant associations. In three cases, genetic markers associated with metabolic variation in our study colocalized with markers linked to variation in non-metabolic traits scored in the same experiment. We speculate that the poor performance of transcriptome-wide association studies in identifying transcript-metabolite associations may reflect a high prevalence of non-linear interactions between transcripts and metabolites and/or a bias towards rare transcripts playing a large role in determining intraspecific metabolic variation.
1

The pho1;2a’-m1.1 allele of Phosphate1 conditions mis-regulation of the phosphorus starvation response in maize (Zea mays ssp. mays L.)

Ana Alonso-Nieves et al.Mar 12, 2022
+5
J
M
A
ABSTRACT PHO1 proteins play a central role in plant inorganic phosphorus translocation and sensing. The maize ( Zea mays ssp. mays ) genome encodes two co-orthologs of the Arabidopsis PHO1 gene, designated ZmPho1;2a and ZmPho1;2b . Here, we report the characterization of the transposon-footprint allele Zmpho1;2a’-m1 . 1 , which we refer to hereafter as pho1;2a . The pho1;2a allele is a stable derivative formed by excision of an Activator element from the ZmPho1;2a gene. The pho1;2a allele contains an 8 bp insertion at the point of excision that disrupts the reading frame and is predicted to generate a premature translational stop. We show that the pho1;2a allele is linked to a dosage-dependent reduction in transcript accumulation and a mild reduction in seedling growth that is enhanced under nutrient deficient conditions. Characterization of the shoot and root transcriptomes of seedlings segregating the pho1;2a mutation under different nutrient conditions revealed pho1;2a to have a dominant effect on patterns of transcript accumulation. Gene set enrichment analysis of the transcripts mis-regulated in pho1;2a mutants suggests that Pho1;2a functions in the fine-tuning of the transcriptional phosphate starvation response. We discuss our results with reference to possible genetic redundancy among maize Pho1 genes and in the context of reports linking functional variation in Pho1;2a to agronomically important traits.
0

Off-the-shelf image analysis models outperform human visual assessment in identifying genes controlling seed color variation in sorghum

Nikee Shrestha et al.Jul 23, 2024
+6
J
H
N
Seed color is a complex phenotype linked to both the impact of grains on human health and consumer acceptance of new crop varieties. Today seed color is often quantified via either qualitative human assessment or biochemical assays for specific colored metabolites. Imaging-based approaches have the potential to be more quantitative than human scoring while lower cost than biochemical assays. We assessed the feasibility of employing image analysis tools trained on rice (Oryza sativa) or wheat (Triticum aestivum) seeds to quantify seed color in sorghum (Sorghum bicolor) using a dataset of > 1,500 images. Quantitative measurements of seed color from images were substantially more consistent across biological replicates than human assessment. Genome-wide association studies conducted using color phenotypes for 682 sorghum genotypes identified more signals near known seed color genes in sorghum with stronger support than manually scored seed color for the same experiment. Previously unreported genomic intervals linked to variation in seed color in our study co-localized with a gene encoding an enzyme in the biosynthetic pathway leading to anthocyanins, tannins, and phlobaphenes -- colored metabolites in sorghum seeds -- and with the sorghum ortholog of a transcription factor shown to regulate several enzymes in the same pathway in rice. The cross-species transferability of image analysis tools, without the retraining, may aid efforts to develop higher value and health-promoting crop varieties in sorghum and other specialty and orphan grain crops.
3

Measurement of expression from a limited number of genes is sufficient to predict flowering time in maize

J. Torres-Rodríguez et al.Dec 14, 2022
J
R
G
J
Abstract Changing patterns of weather and climate are limiting breeders’ ability to conduct trials in the same environments in which their released varieties will be grown 7-10 years later. Flowering time plays a crucial role in determining regional adaptation, and mismatch between flowering time and environment can substantially impair yield. Different approaches based on genetic markers or gene expression can be used to predict flowering time before conducting large scale field evaluation and phenotyping. The more accurate prediction of a trait using genetic markers could be hindered due to all the intermediate steps (i.e. transcription, translation, epigenetic modification, and epistasis among others) connecting the trait and their genetic basics. The use of some intermediate steps as predictors could improve the accuracy of the model. Here, we are using two public gene expression (RNA-Seq) data-sets from 14-day-old-maize-seedling roots and whole-seedling tissue at v1 stage (10 day after planting) for which flowering data (days to anthesis and days to silking expressed in growing degree days) and genetic markers were also available to test the predictability of flowering time. In total, 20 different combinations between phenotypic and gene expression data-sets were evaluated. To explore prediction accuracy a random forest model was trained with the expression values of 44,303 gene models hosted in the current B73 maize reference version 5 and then the feature importance was scored based on the decrease in root mean squared error. Later several random forest models with different subsets of the most important features (genes) were trained, and this process was repeated ten times. Results from these analyses show a curve in the prediction accuracy, with an increase in the prediction accuracy as the top most important genes were added. The maximum accuracy was attained when 500 genes for whole-seedling and 100 genes for root gene expression data were used in the analysis, and thereafter adding more genes lead to a decrease in the prediction accuracy. The highest prediction accuracy using the top-most important genes was higher than that of using randomly selected whole-genome 400,000 SNPs. Finally, we described the genes controlling flowering time by looking at the most important genes in the Random forest model with the expression data from all genes. We further found MADS-transcription factor 69 ( Mads69 ) using whole-seedling gene expression and the MADS-transcription factor 67 ( Mads67 ) using root gene expression data, both genes previously described with effect on flowering time. Here, we aim to demonstrate the potential of selecting and using the expression of most informative genes to predict a complex trait, also to demonstrate the robustness and limitations of this analysis by using phenotypic data-sets from different environments.
0

Data driven discovery and quantification of hyperspectral leaf reflectance phenotypes across a maize diversity panel

Michael Tross et al.Dec 16, 2023
+7
Y
B
M
Abstract Hyperspectral reflectance data can be collected from large plant populations in a high-throughput manner in both controlled and field environments. The efficacy of using hyperspectral leaf reflectance as a proxy for traits that typically require significant labor and time to collect has been evaluated in a number of studies. Commonly, estimating plant traits using hyperspectral reflectance involves collecting substantial amounts of ground truth data from plant populations, which may not be feasible for many researchers. In this study, we explore the potential of data-driven approaches to analyze hyperspectral reflectance data with little to no ground truth phenotypic measurements. Evaluations were performed using data on the reflectance of 2,151 individual wavelengths of light from the leaves of maize plants harvested from 1,658 field plots of a replicated trial including representatives of 752 maize genotypes from the Wisconsin Diversity Panel. We reduced the dimensionality of this dataset using an autoencoder neural network and principal component analyses, producing 10 latent variables and principal components, respectively. A subset of these principal components and latent variables demonstrated significant repeatability, indicating that a substantial proportion of the total variance in these variables was explained by genetic factors. Moreover, correlations were observed between variables derived from the autoencoder network and principal components with molecular traits. Notably, the most relevant latent variable (LV8) showed a much stronger correlation with chlorophyll content ( R 2 = 0.59) compared to the most correlated principal component (PC2; R 2 = 0.31). Furthermore, one latent variable exhibited modestly better performance than a partial least squares regression model in estimating leaf chlorophyll content (PLSR; R 2 = 0.58, LV8; R 2 = 0.59). A number of genetic markers in the maize genome were significantly correlated with variation in different latent variables in genome wide association studies. In a number of cases, significant signals in genome wide association studies were adjacent to genes with plausible links to traits expected to influence leaf hyperspectral reflectance patterns.
18

Low nitrogen availability inhibits the phosphorus starvation response in maize (Zea mays ssp. mays L.)

J. Torres-Rodríguez et al.Oct 29, 2020
+3
R
M
J
ABSTRACT Background Nitrogen (N) and phosphorus (P) are macronutrients essential for crop growth and productivity. In cultivated fields, N and P levels are rarely sufficient, contributing to the yield gap between realized and potential production. Fertilizer application increases nutrient availability, but not all farmers have access to fertilizers, nor are current rates of application sustainable or environmentally desirable. Transcriptomic studies of cereal crops have revealed dramatic responses to either low N or low P single stress treatments. In the field, however, levels of both N and P may be suboptimal. The interaction between N and P starvation responses remains to be fully characterized. Results We characterized growth and root and leaf transcriptomes of young maize plants under nutrient replete, low N, low P or combined low NP conditions. We identified 1,555 genes to respond to our nutrient treatments, in one or both tissues. A large group of genes, including many classical P starvation response genes, were regulated antagonistically between low N and P conditions. An additional experiment over a range of N availability indicated that a mild reduction in N levels was sufficient to repress the low P induction of P starvation genes. Although expression of P transporter genes was repressed under low N or low NP, we confirmed earlier reports of P hyper accumulation under N limitation. Conclusions Transcriptional responses to low N or P were distinct, with few genes responding in a similar way to the two single stress treatments. In combined NP stress, the low N response dominated, and the P starvation response was largely suppressed. A reduction in N availability was sufficient to repress the induction of P starvation associated genes. We conclude that activation of the transcriptional response to P starvation in maize is contingent on sufficient N availability.
0

Data driven discovery and quantification of hyperspectral leaf reflectance phenotypes across a maize diversity panel

Michael Tross et al.Jun 6, 2024
+7
T
M
M
Abstract Estimates of plant traits derived from hyperspectral reflectance data have the potential to efficiently substitute for traits, which are time or labor intensive to manually score. Typical workflows for estimating plant traits from hyperspectral reflectance data employ supervised classification models that can require substantial ground truth datasets for training. We explore the potential of an unsupervised approach, autoencoders, to extract meaningful traits from plant hyperspectral reflectance data using measurements of the reflectance of 2151 individual wavelengths of light from the leaves of maize ( Zea mays ) plants harvested from 1658 field plots in a replicated field trial. A subset of autoencoder‐derived variables exhibited significant repeatability, indicating that a substantial proportion of the total variance in these variables was explained by difference between maize genotypes, while other autoencoder variables appear to capture variation resulting from changes in leaf reflectance between different batches of data collection. Several of the repeatable latent variables were significantly correlated with other traits scored from the same maize field experiment, including one autoencoder‐derived latent variable (LV8) that predicted plant chlorophyll content modestly better than a supervised model trained on the same data. In at least one case, genome‐wide association study hits for variation in autoencoder‐derived variables were proximal to genes with known or plausible links to leaf phenotypes expected to alter hyperspectral reflectance. In aggregate, these results suggest that an unsupervised, autoencoder‐based approach can identify meaningful and genetically controlled variation in high‐dimensional, high‐throughput phenotyping data and link identified variables back to known plant traits of interest.
0

Population level gene expression can repeatedly link genes to functions in maize

J. Torres-Rodríguez et al.Jan 1, 2023
+10
J
D
J
Transcriptome-Wide Association Studies (TWAS) can provide single gene resolution for candidate genes in plants, complementing Genome-Wide Association Studies (GWAS) but efforts in plants have been met with, at best, mixed success. We generated expression data from 693 maize genotypes, measured in a common field experiment, sampled over a two-hour period to minimize diurnal and environmental effects, using full-length RNA-seq to maximize the accurate estimation of transcript abundance. TWAS could identify roughly ten times as many genes likely to play a role in flowering time regulation as GWAS conducted data from the same experiment. TWAS using mature leaf tissue identified known true positive flowering time genes known to act in the shoot apical meristem, and trait data from new environments enabled the identification of additional flowering time genes without the need for new expression data. eQTL analysis of TWAS-tagged genes identified at least one additional known maize flowering time gene through trans-eQTL interactions. Collectively these results suggest the gene expression resource described here can link genes to functions across different plant phenotypes expressed in a range of tissues and scored in different experiments.
0

Population‐level gene expression can repeatedly link genes to functions in maize

J. Torres-Rodríguez et al.May 29, 2024
+10
J
D
J
Transcriptome-wide association studies (TWAS) can provide single gene resolution for candidate genes in plants, complementing genome-wide association studies (GWAS) but efforts in plants have been met with, at best, mixed success. We generated expression data from 693 maize genotypes, measured in a common field experiment, sampled over a 2-h period to minimize diurnal and environmental effects, using full-length RNA-seq to maximize the accurate estimation of transcript abundance. TWAS could identify roughly 10 times as many genes likely to play a role in flowering time regulation as GWAS conducted data from the same experiment. TWAS using mature leaf tissue identified known true-positive flowering time genes known to act in the shoot apical meristem, and trait data from a new environment enabled the identification of additional flowering time genes without the need for new expression data. eQTL analysis of TWAS-tagged genes identified at least one additional known maize flowering time gene through trans-eQTL interactions. Collectively these results suggest the gene expression resource described here can link genes to functions across different plant phenotypes expressed in a range of tissues and scored in different experiments.