DH
David Hufnagel
Author with expertise in Genetic Architecture of Quantitative Traits
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
11
(82% Open Access)
Cited by:
860
h-index:
12
/
i10-index:
13
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

MAKER-P: A Tool Kit for the Rapid Creation, Management, and Quality Control of Plant Genome Annotations

Michael Campbell et al.Dec 4, 2013
+13
C
M
M
Abstract We have optimized and extended the widely used annotation engine MAKER in order to better support plant genome annotation efforts. New features include better parallelization for large repeat-rich plant genomes, noncoding RNA annotation capabilities, and support for pseudogene identification. We have benchmarked the resulting software tool kit, MAKER-P, using the Arabidopsis (Arabidopsis thaliana) and maize (Zea mays) genomes. Here, we demonstrate the ability of the MAKER-P tool kit to automatically update, extend, and revise the Arabidopsis annotations in light of newly available data and to annotate pseudogenes and noncoding RNAs absent from The Arabidopsis Informatics Resource 10 build. Our results demonstrate that MAKER-P can be used to manage and improve the annotations of even Arabidopsis, perhaps the best-annotated plant genome. We have also installed and benchmarked MAKER-P on the Texas Advanced Computing Center. We show that this public resource can de novo annotate the entire Arabidopsis and maize genomes in less than 3 h and produce annotations of comparable quality to those of the current The Arabidopsis Information Resource 10 and maize V2 annotation builds.
0
Citation416
0
Save
1

De novo assembly, annotation, and comparative analysis of 26 diverse maize genomes

Matthew Hufford et al.Aug 5, 2021
+43
M
A
M
An a-maize-ing set of genomes Maize is an important crop cultivated worldwide. As maize spread across the world, selection for local environments resulted in variation, but the impact on differences between the genome has not been quantified. By producing high-quality genomic sequences of the 26 lines used in the maize nested association mapping panel, Hufford et al . map important traits and demonstrate the diversity of maize. Examining RNA and methylation of genes across accessions, the authors identified a core set of maize genes. Beyond this core set, comparative analysis across lines identified high levels of variation in the total set of genes, the maize pan-genome. The value of this resource was further exemplified by mapping quantitative traits of interest, including those related to pathogen resistance. —LMZ
1
Citation404
0
Save
173

De novo assembly, annotation, and comparative analysis of 26 diverse maize genomes

Matthew Hufford et al.Jan 16, 2021
+44
B
Y
M
Abstract We report de novo genome assemblies, transcriptomes, annotations, and methylomes for the 26 inbreds that serve as the founders for the maize nested association mapping population. The data indicate that the number of pan-genes exceeds 103,000 and that the ancient tetraploid character of maize continues to degrade by fractionation to the present day. Excellent contiguity over repeat arrays and complete annotation of centromeres further reveal the locations and internal structures of major cytological landmarks. We show that combining structural variation with SNPs can improve the power of quantitative mapping studies. Finally, we document variation at the level of DNA methylation, and demonstrate that unmethylated regions are enriched for cis-regulatory elements that overlap QTL and contribute to changes in gene expression. One sentence summary A multi-genome analysis of maize reveals previously unknown variation in gene content, genome structure, and methylation.
173
Citation29
0
Save
7

Interspecies transmission from pigs to ferrets of antigenically distinct swine H1 influenza A viruses with loss in reactivity to human vaccine virus antisera as measures of relative zoonotic risk

J. Kimble et al.Sep 13, 2022
+6
T
C
J
Abstract During the last decade, endemic swine H1 influenza A viruses (IAV) from six different genetic clades of the hemagglutinin gene caused zoonotic infections in humans. The majority of zoonotic events with swine IAV were restricted to a single case with no subsequent transmission. However, repeated introduction of human-seasonal H1N1, continual reassortment between endemic swine IAV, and subsequent drift in the swine host resulted in highly diverse swine IAV with human-origin genes that may become a risk to the human population. To prepare for the potential of a future swine-origin IAV pandemic in humans, public health laboratories selected candidate vaccine viruses (CVV) for use as vaccine seed strains. To assess the pandemic risk of contemporary US swine H1N1 or H1N2 strains, we quantified the genetic diversity of swine H1 HA genes, and identified representative strains from each circulating clade. We then characterized the representative swine IAV against human seasonal vaccine and CVV strains using ferret antisera in hemagglutination inhibition assays (HI). HI assays revealed that 1A.3.3.2 (pdm) and 1B.2.1 (delta-2) demonstrated strong cross reactivity to human seasonal vaccines or CVVs. However, swine IAV from three clades that represent more than 50% of the detected swine IAVs in the USA showed significant reduction in cross-reactivity compared to the closest CVV virus: 1A.1.1.3 (alpha-deletion), 1A.3.3.3-clade 3 (gamma), and 1B.2.2.1 (delta-1a). Representative viruses from these three clades were further characterized in a pig-to-ferret transmission model and shown to exhibit variable transmission efficiency. Our data prioritize specific genotypes of swine H1N1 and H1N2 to further investigate in the risk they pose to the human population. Importance Influenza A virus (IAV) is endemic in both humans and pigs and there is occasional bidirectional transmission of viruses. The process of interspecies transmission introduces novel viruses that increases the viral diversity in each host, impacting viral ecology and challenging control efforts through vaccine programs. Swine-origin IAVs have the potential to cause human pandemics, and pandemic preparation efforts include the identification and generation of candidate vaccine viruses (CVV) derived from epidemiologically relevant swine IAV surface proteins. The CVVs are derived from swine IAV detected and isolated in humans, and are updated infrequently; consequently the efficacy of these vaccines against contemporary swine IAV is unclear given rapid turnover and change of diversity. In this report we perform a risk assessment of contemporary swine H1 IAVs, determine whether current CVVs cross-react, and illustrate how swine-origin IAV replicate, transmit, and cause disease in a swine-to-ferret model system. In doing so, we identify the swine IAV that have lost cross-reactivity to current pandemic preparedness vaccines and demonstrate the utility of swine-to-ferret transmission experiments to further inform risk assessment.
7
Citation4
0
Save
0

SequelTools: A Suite of Tools for Working with PacBio Sequel Raw Sequence Data

David Hufnagel et al.Apr 18, 2019
A
M
D
Abstract Background PacBio sequencing is an incredibly valuable third-generation DNA sequencing method due to very long read lengths, ability to detect methylated bases, and its real-time sequencing methodology. Yet, hitherto no tool was available for analyzing the quality of, subsampling, and filtering PacBio data. Results Here we present SequelTools , a command-line program containing three tools: Quality Control, Read Subsampling, and Read Filtering. The Quality Control tool quickly processes PacBio Sequel raw sequence data from multiple SMRTcells producing multiple statistics and publication-quality plots describing the quality of the data including N50, read length and count statistics, PSR, and ZOR. The Read Subsampling tool allows the user to subsample reads by one or more of the following criteria: longest subreads per CLR or random CLR selection. The Read Filtering tool provides options for normalizing data by filtering out certain low-quality scraps reads and/or by minimum CLR length. SequelTools is implemented in bash, R, and Python using only standard libraries and packages and is platform independent. Conclusions SequelTools is a program that provides the only free, fast, and easy-to-use quality control tool, and the only program providing this kind of read sumbsampling and read filtering for PacBio Sequel raw sequence data, and is available at https://github.com/ISUgenomics/SequelTools
0
Citation2
0
Save
1

The genome of the camphor tree and the genetic and climatic relevance of the top-geoherbalism in this medicinal plant

Ri‐Hong Jiang et al.Oct 17, 2021
+10
X
X
R
Abstract Camphor tree ( Cinnamomum camphora (L.) J. Presl), a species in the magnoliid family Lauraceae, is known for its rich volatile oils and is used as a medical cardiotonic and as a scent in many perfumed hygiene products. Here, we present a high-quality chromosome-scale genome of C. camphora with a scaffold N50 of 64.34 Mb and an assembled genome size of 755.41 Mb. Phylogenetic inference revealed that the magnoliids are a sister group to the clade of eudicots and monocots. Comparative genomic analyses identified two rounds of ancient whole-genome duplication (WGD). Tandem duplicated genes exhibited a higher evolutionary rate, a more recent evolutionary history and a more clustered distribution on chromosomes, contributing to the production of secondary metabolites, especially monoterpenes and sesquiterpenes, which are the principal essential oil components. Three-dimensional analyses of the volatile metabolites, gene expression and climate data of samples with the same genotype grown in different locations showed that low temperature and low precipitation during the cold season modulate the expression of genes in the terpenoid biosynthesis pathways, especially TPS genes, which facilitates the accumulation of volatile compounds. Our study lays a theoretical foundation for policy-making regarding the agroforestry applications of camphor tree.
1
Citation2
0
Save
17

Evidence for Multiple Teosinte Hybrid Zones in Central Mexico

David Hufnagel et al.Feb 12, 2021
+4
J
J
D
1 Summary Hybrid zones provide an excellent opportunity for studying population dynamics and whether hybrid genetic architectures are locally adaptive. The genus Zea contains many diverse wild taxa collectively called teosinte. Zea mays ssp. parviglumis , the lowland progenitor of maize ( Zea mays ssp. mays ), and its highland relative Zea mays ssp. mexicana live parapatrically and, while putative hybrids have been identified in regions of range overlap, these have never been deeply explored. Here we use a broadly sampled SNP data set to identify and confirm 112 hybrids between Zea mays ssp. parviglumis and Zea mays ssp. mexicana , mostly clustered in three genetically and geographically distinct hybrid groups in Central Mexico. These hybrid groups inhabit intermediate environments relative to parental taxa. We demonstrate that these individuals are true hybrids and not products of isolation by distance or ancestral to parviglumis and mexicana. This work expands on previous studies, clearly identifying hybrid zones in Zea , genetically characterizing hybrid groups, and showing what appear to be unique genetic architectures of hybridization in distinct hybrid groups. With the potential for local adaptation, variable hybrid zone dynamics, and differential architectures of hybridization, we present these teosinte hybrids and parental taxa as a promising model system for studying hybridization and hybrid zones.
17
Citation2
0
Save
4

Characterizing a century of genetic diversity and contemporary antigenic diversity of N1 neuraminidase in IAV from North American swine

David Hufnagel et al.Nov 18, 2022
+6
Z
K
D
ABSTRACT Influenza A viruses (IAV) of the H1N1 classical swine lineage became endemic in North American swine following the 1918 pandemic. Additional human-to-swine transmission events after 1918, and a spillover of H1 viruses from wild birds in Europe, potentiated a rapid increase in genomic diversity via reassortment between introductions and the endemic classical swine lineage. To determine mechanisms affecting reassortment and evolution, we conducted a phylogenetic analysis of N1 and paired HA swine IAV genes in North America between 1930 and 2020. We described fourteen N1 clades within the N1 Eurasian avian lineage (including the N1 pandemic clade) and the N1 classical swine lineage. Seven N1 genetic clades had evidence for contemporary circulation. To assess antigenic drift associated with N1 genetic diversity, we generated a panel of representative swine N1 antisera and quantified the antigenic distance between wild-type viruses using enzyme-linked lectin assays and antigenic cartography. Within the N1 lineage, antigenic similarity was variable and reflected shared evolutionary history. Sustained circulation and evolution of N1 genes in swine had resulted in significant antigenic distance between the N1 pandemic clade and classical swine lineage. We also observed a significant increase in the rate of evolution in the N1 pandemic clade relative to the classical lineage. Between 2010 and 2020, N1 clades and N1-HA pairings fluctuated in detection frequency across North America, with hotspots of diversity generally appearing and disappearing within two years. We also identified frequent N1-HA reassortment events (n = 36), which were rarely sustained (n = 6) and sometimes also concomitant with the emergence of new N1 genetic clades (n = 3). These data form a baseline from which we can identify N1 clades that expand in range or genetic diversity that may impact viral phenotypes or vaccine immunity and subsequently the health of North American swine.
4
Citation1
0
Save
0

Inbreeding depression leads to reduced fitness in declining populations of wild maize

Aimee Schulz et al.Nov 21, 2023
M
P
D
A
Abstract Crop wild relatives can serve as a source of variation for the genetic improvement of modern varieties. However, the realization of this genetic potential depends critically on the conservation of wild populations. In this study, five populations of Zea mays ssp. parviglumi s, the closest relative of domesticated maize, were collected in Jalisco, Mexico and planted in a common garden. Eleven traits related to plant fitness were measured and evaluated in the context of genetic diversity and genetic load. Plants whose seed were sourced from larger, less disturbed populations had greater genetic diversity, lower genetic load, and possessed phenotypes associated with higher fitness, while plants sourced from smaller, heavily impacted populations had traits characteristic of lower fitness and increased genetic load. For example, plants from larger populations germinated more quickly, reached anthesis sooner, demonstrated a higher level of photosynthetic activity, and produced more above-ground biomass, suggesting a direct correlation between the fitness of a population, genetic diversity, and genetic load. These results emphasize the importance of preserving the habitat of populations of Zea mays ssp. parviglumis to limit inbreeding depression and maintain the genetic diversity and adaptive potential of this germplasm.
0

Effect of Sequence Depth and Length in Long-read Assembly of the Maize Inbred NC358

Shujun Ou et al.Nov 29, 2019
+21
A
S
S
Recent improvements in the quality and yield of long-read data and scaffolding technology have made it possible to rapidly generate reference-quality assemblies for complex genomes. Still, generating these assemblies is costly, and an assessment of critical sequence depth and read length to obtain high-quality assemblies is important for allocating limited resources. To this end, we have generated eight independent assemblies for the complex genome of the maize inbred line NC358 using PacBio datasets ranging from 20-75x genomic depth and N50 read lengths of 11-21 kb. Assemblies with 30x or less depth and N50 read length of 11 kb were highly fragmented, with even the low-copy genic fraction of the genome showing degradation at 20x depth. Distinct sequence-quality thresholds were observed for complete assembly of genes, transposable elements, and highly repetitive genomic features such as telomeres, heterochromatic knobs and centromeres. This study provides a useful resource allocation reference to the community as long-read technologies continue to mature.
Load More