LJ
Luc Janss
Author with expertise in Genomics and Breeding of Legume Crops
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
9
(89% Open Access)
Cited by:
398
h-index:
41
/
i10-index:
92
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

The Value of Expanding the Training Population to Improve Genomic Selection Models in Tetraploid Potato

Elsa Sverrisdóttir et al.Aug 6, 2018
+5
H
E
E
Genomic selection (GS) is becoming increasingly applicable to crops as the genotyping costs continue to decrease, which makes it an attractive alternative to traditional selective breeding based on observed phenotypes. With genome-wide molecular markers, selection based on predictions from genotypes can be made in the absence of direct phenotyping. The reliability of predictions depends strongly on the number of individuals used for training the predictive algorithms, particularly in a highly genetically diverse organism such as potatoes; however, the relationship between the individuals also has an enormous impact on prediction accuracy. Here we have studied genomic prediction in three different panels of potato cultivars, varying in size, design, and phenotypic profile. We have developed genomic prediction models for two important agronomic traits of potato, dry matter content and chipping quality. We used genotyping-by-sequencing to genotype 1,146 individuals and generated genomic prediction models from 167,637 markers to calculate genomic estimated breeding values with genomic best linear unbiased prediction. Cross-validated prediction correlations of 0.75-0.83 and 0.39-0.79 were obtained for dry matter content and chipping quality, respectively, when combining the three populations. These prediction accuracies were similar to those obtained when predicting performance within each panel. In contrast, but not unexpectedly, predictions across populations were generally lower, 0.37-0.71 and 0.28-0.48 for dry matter content and chipping quality, respectively. These predictions are not limited by the number of markers included, since similar prediction accuracies could be obtained when using merely 7,800 markers (<5%). Our results suggest that predictions across breeding populations in tetraploid potato are presently unreliable, but that individual prediction models within populations can be combined in an additive fashion to obtain high quality prediction models relevant for several breeding populations.
0
Citation390
0
Save
1

Genetic analysis of global faba bean germplasm maps agronomic traits and identifies strong selection signatures for geographical origin

Cathrine Skovbjerg et al.Jul 18, 2022
+19
T
D
C
Abstract Faba bean ( Vicia faba L.) is a high-protein grain legume crop with great potential for further cultivation. However, little is known about the genetics underlying trait diversity. In this study, we use 21,345 high-quality SNP markers to genetically characterise 2,678 faba bean genotypes. We perform genome-wide association studies of key agronomic traits using a Seven-parent-MAGIC population and detect 238 significant marker-trait associations linked to 12 traits of agronomic importance, with 65 of these being stable across multiple environments. Using a non-redundant diversity panel of 685 accessions from 52 countries, we identify 3 subpopulations differentiated by geographical origin and 33 genomic regions subject to strong diversifying selection between subpopulations. We find that SNP markers associated with the differentiation of northern and southern accessions were able to explain a significant proportion of agronomic trait variance in the Seven-parent-MAGIC population, suggesting that some of these traits have played an important role in breeding. Altogether, our findings point to genomic regions associated with important agronomic traits and selection in faba bean, which can be used for breeding purposes. Key Message We identified marker-trait associations for key faba bean agronomic traits and genomic signatures of selection within a global germplasm collection.
1
Citation4
0
Save
51

The giant diploid faba genome unlocks variation in a global protein crop

Murukarthick Jayakodi et al.Sep 26, 2022
+52
J
A
M
Abstract Increasing the proportion of locally produced plant protein in currently meat-rich diets could substantially reduce greenhouse gas emission and loss of biodiversity. However, plant protein production is hampered by the lack of a cool-season legume equivalent to soybean in agronomic value. Faba bean ( Vicia faba L.) has a high yield potential and is well-suited for cultivation in temperate regions, but genomic resources are scarce. Here, we report a high-quality chromosome-scale assembly of the faba bean genome and show that it has grown to a massive 13 Gb in size through an imbalance between the rates of amplification and elimination of retrotransposons and satellite repeats. Genes and recombination events are evenly dispersed across chromosomes and the gene space is remarkably compact considering the genome size, though with significant copy number variation driven by tandem duplication. Demonstrating practical application of the genome sequence, we develop a targeted genotyping assay and use high-resolution genome-wide association (GWA) analysis to dissect the genetic basis of hilum colour. The resources presented constitute a genomics-based breeding platform for faba bean, enabling breeders and geneticists to accelerate improvement of sustainable protein production across Mediterranean, subtropical, and northern temperate agro-ecological zones.
51
Citation4
0
Save
3

Leveraging spatio-temporal genomic breeding value estimates of dry matter yield and herbage quality in ryegrass via random regression models

Elesandro Bornhofen et al.May 1, 2022
+5
I
D
E
Abstract Joint modeling of correlated multi-environment and multi-harvest data of perennial crop species may offer advantages in prediction schemes and a better understanding of the underlying dynamics in space and time. The goal of the present study was to investigate the relevance of incorporating the longitudinal dimension of within-season multiple harvests of biomass yield and nutritive quality traits of forage perennial ryegrass ( Lolium perenne L.) in a reaction norm model setup that additionally accounts for genotype-environment interactions. Genetic parameters and accuracy of genomic breeding value predictions were investigated by fitting three random regression (random coefficients) linear mixed models (gRRM) using Legendre polynomial functions to the data. All models accounted for heterogeneous residual variance and moving average-based spatial adjustments within environments. The plant material consisted of 381 bi-parental family pools and four check varieties of diploid perennial ryegrass evaluated in eight environments for biomass yield and nutritive quality traits. The longitudinal dimension of the data arose from multiple harvests performed four times annually. The specified design generated a total of 16,384 phenotypic data points for each trait. Genomic DNA sequencing was performed using DNA nanoball-based technology (DNBseq) and yielded 56,645 single nucleotide polymorphisms (SNPs) which were used to calculate the allele frequency-based genomic relationship matrix used in all genomic random regression models. Biomass yield’s estimated additive genetic variance and heritability values were higher in later harvests. The additive genetic correlations were moderate to low in early measurements and peaked at intermediates, with fairly stable values across the environmental gradient, except for the initial harvest data collection. This led to the conclusion that complex genotype-by-environment interaction (G×E) arises from spatial and temporal dimensions in the early season, with lower re-ranking trends thereafter. In general, modeling the temporal dimension with a second-order orthogonal polynomial in the reaction norm mixed model framework improved the accuracy of genomic estimated breeding value prediction for nutritive quality traits, but no gain in prediction accuracy was detected for dry matter yield. This study leverages the flexibility and usefulness of gRRM models for perennial ryegrass research and breeding and can be readily extended to other multi-harvest crops.
0

Automated Seminal Root Angle Measurement with Corrective Annotation

Abraham Smith et al.Mar 14, 2024
+5
L
M
A
Measuring seminal root angle is an important aspect of root phenotyping, yet automated methods are lacking. We introduce SeminalRootAngle, a novel open-source automated method that measures seminal root angles from images. To ensure our method is flexible and user-friendly we build on an established corrective annotation training method for image segmentation. We tested SeminalRootAngle on a heterogeneous dataset of 662 spring barley rhizobox images, which presented challenges in terms of image clarity and root obstruction. Validation of our new automated pipeline against manual measurements yielded a Pearson correlation coefficient of 0.71. We also measure inter-annotator agreement, obtaining a Pearson correlation coefficient of 0.68, indicating that our new pipeline provides similar root angle measurement accuracy to manual approaches. We use our new SeminalRootAngle tool to identify SNPs significantly associated with angle and length, shedding light on the genetic basis of root architecture.
2

Genetic architecture of inter-specific and -generic grass hybrids by network analysis on multi-omics data

Elesandro Bornhofen et al.Dec 23, 2022
+6
D
C
E
Abstract Understanding the mechanisms underlining forage production and its biomass nutritive quality at the omics level is crucial for boosting the output of high-quality dry matter per unit of land. Despite the advent of multiple omics integration for the study of biological systems in major crops, investigations on forage species are still scarce. Therefore, this study aimed to combine multi-omics from grass hybrids by prioritizing omic features based on the reconstruction of interacting networks and assessing their relevance in explaining economically important phenotypes. Transcriptomic and NMR-based metabolomic data were used for sparse estimation via the fused graphical lasso, followed by modularity-based gene expression and metabolite-metabolite network reconstruction, node hub identification, omic-phenotype association via pairwise fitting of a multivariate genomic model, and machine learning-based prediction study. Analyses were jointly performed across two data sets composed of family pools of hybrid ryegrass ( Lolium perenne × L. multiflorum ) and Festulolium loliaceum ( L. perenne × Festuca pratensis ), whose phenotypes were recorded for eight traits in field trials across two European countries in 2020/21. Our results suggest substantial changes in gene co-expression and metabolite-metabolite network topologies as a result of genetic perturbation by hybridizing L. perenne with another species within the genus relative to across genera. However, conserved hub genes and hub metabolomic features were detected between pedigree classes, some of which were highly heritable and displayed one or more significant edges with agronomic traits in a weighted omics-phenotype network. In spite of tagging relevant biological molecules as, for example, the light-induced rice 1 ( LIR1 ), hub features were not necessarily better explanatory variables for omics-assisted prediction than features stochastically sampled. The use of the graphical lasso method for network reconstruction and identification of biological targets is discussed with an emphasis on forage grass breeding.
1

Compositionally aware estimation of cross-correlations for microbiome data

Ib Jensen et al.May 23, 2023
R
S
L
I
Abstract In the field of microbiome studies, it is of interest to infer correlations between abundances of different microbes (here referred to as operational taxonomic units, OTUs). Several methods taking the compositional nature of the sequencing data into account exist. However, these methods cannot infer correlations between OTU abundances and other variables. In this paper we introduce the methods SparCEV (Sparse Correlations with External Variables) and SparXCC (Sparse Cross-Correlations between Compositional data) for quantifying correlations between OTU abundances and either continuous phenotypic variables or components of other compositional datasets, such as transcriptomic data. We compare these new methods to empirical Pearson cross-correlations after applying naive transformations of the data (log and log-TSS). Additionally, we test the centered log ratio transformation (CLR) and the variance stabilising transformation (VST). We find that CLR and VST outperform naive transformations, except when the correlation matrix is dense. For large numbers of OTUs, SparCEV and SparXCC perform similarly to CLR and VST. SparCEV outperforms all other tested methods when the number of OTUs is small (less than 100). SparXCC outperforms all tested methods when at least one of the compositional datasets has few variables (less than 50), and more so when both datasets have few variables. Author summary Sequencing data of the microbiome posses a unique and challenging structure that renders many standard statistical tools invalid. Features such as compositionality and sparsity complicates statistical analysis, and as a result, specialized tools are needed. Practitioners have long been interested in the construction of correlation networks within the microbiome, and several methods for accomplishing this exist. However, less attention has been paid to the estimation of cross-correlations between microbial abundances and other variables (such as gene expression data or environmental and phenotypic variables). Here, we introduce novel approaches, SparCEV and SparXCC, for inferring such cross-correlations, and compare these to transformation-based approaches, namely log, log-TSS, CLR and VST. In some cases, SparCEV and SparXCC yield superior results, while in other cases, a simpler transformation-based approach suffices. The methods are used to study cross-correlations between bacterial abundances in the skin microbiome and the severity of atopic dermatitis, as well as cross-correlations between fungal and bacterial OTUs in the root microbiome of the legume Lotus japonicus .
1

Nitrogen source and Nod factor signaling map out the assemblies ofLotus japonicusroot bacterial communities

Ke Tao et al.May 28, 2023
+10
Z
E
K
Abstract Symbiosis with soil-dwelling bacteria that fix atmospheric nitrogen allows legume plants to grow in nitrogen-depleted soil. Symbiosis impacts the assembly of root microbiota, but it is not known how this process takes place and whether it is independent of nitrogen nutrition. We use plant and bacterial mutants to address the role of Nod factor signaling on Lotus japonicus root microbiota assembly. We found that Nod factors are produced by symbionts to activate Nod factor signaling in the host, and this modulates the assembly of a symbiotic root microbiota. Lotus plants grown in symbiosis-permissive or suppressive soils delineated three nitrogen-dependent nutritional states: starved, symbiotic, or inorganic. We found that root and rhizosphere microbiomes associated with these states differ in composition and connectivity, demonstrating that symbiosis and inorganic nitrogen impact the legume root microbiota differently. Finally, we demonstrated that selected bacterial genera delineating state-dependent microbiomes have a high level of accurate prediction.
0

Evaluation of yield, yield stability and yield-protein trade-off in commercial faba bean cultivars

Cathrine Skovbjerg et al.Nov 15, 2019
+4
W
J
C
Faba bean is a legume crop with high protein content and large potential for cultivation in the Northern latitudes. However, it has a reputation for being an unstable crop with large inter-annual variability, mostly explained by yearly variation in rainfall. Consequently, the objective is to breed cultivars with high seed yield and high yield stability. In this study, 17 commercial cultivars of faba bean were evaluated for seed yield, yield stability and trade-off between seed yield and protein content in four locations in Denmark and Finland during 2016-2018. We found that location and year effects accounted for 72% of the total seed yield variation. Cultivar by environment interactions (GxE) were found to be small and did not cause re-ranking of cultivars in different environments. Yield stability contributed little to the mean yield of the cultivars because high-yielding cultivars consistently outperformed the lower yielding genotypes, even under the most adverse conditions. The latter was also the case for total protein yield quantified as total yield multiplied by seed protein percentage. Although we found a strong negative correlation of -0.64 between yield and protein content, a few cultivars produced high yields while maintaining a relatively high protein content, suggesting that these traits may to some degree be genetically separable.