DH
Daniel Hughes
Author with expertise in RNA Sequencing Data Analysis
Oxford University Hospitals NHS Trust, Coe College, Monash Medical Centre
+ 7 more
Achievements
This user has not unlocked any achievements yet.
Key Stats
Upvotes received:
0
Publications:
9
(22% Open Access)
Cited by:
3
h-index:
28
/
i10-index:
39
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Reproductive longevity predicts mutation rates in primates

Gregg Thomas et al.May 7, 2020
+14
A
R
G
Abstract Mutation rates vary between species across several orders of magnitude, with larger organisms having the highest per-generation mutation rates. Hypotheses for this pattern typically invoke physiological or population-genetic constraints imposed on the molecular machinery preventing mutations 1 . However, continuing germline cell division in multicellular eukaryotes means that organisms with longer generation times and of larger size will leave more mutations to their offspring simply as a by-product of their increased lifespan 2,3 . Here, we deeply sequence the genomes of 30 owl monkeys ( Aotus nancymaae ) from 6 multi-generation pedigrees to demonstrate that paternal age is the major factor determining the number of de novo mutations in this species. We find that owl monkeys have an average mutation rate of 0.81 × 10 −8 per site per generation, roughly 32% lower than the estimate in humans. Based on a simple model of reproductive longevity that does not require any changes to the mutational machinery, we show that this is the expected mutation rate in owl monkeys. We further demonstrate that our model predicts species-specific mutation rates in other primates, including study-specific mutation rates in humans based on the average paternal age. Our results suggest that variation in life history traits alone can explain variation in the per-generation mutation rate among primates, and perhaps among a wide range of multicellular organisms.
0
Citation3
0
Save
0

Molecular evolutionary trends and feeding ecology diversification in the Hemiptera, anchored by the milkweed bug genome

Kristen Panfilio et al.May 6, 2020
+79
J
I
K
Background: The Hemiptera (aphids, cicadas, and true bugs) are a key insect order whose members offer a close outgroup to the Holometabola, with high diversity within the order for feeding ecology and excellent experimental tractability for molecular genetics. Sequenced genomes have recently become available for hemipteran pest species such as phloem-feeding aphids and blood-feeding bed bugs. To complement and build upon these resources, we present the genome sequence and comparative analyses centered on the large milkweed bug, Oncopeltus fasciatus, a seed feeder of the family Lygaeidae. Results: The 926-Mb genome of Oncopeltus is relatively well represented by the current assembly and official gene set, which supports Oncopeltus as a fairly conservative hemipteran species for anchoring molecular comparisons. We use our genomic and RNA-seq data not only to characterize features of the protein-coding gene repertoire and perform isoform-specific RNAi, but also to elucidate patterns of molecular evolution and physiology. We find ongoing, lineage-specific expansion and diversification of repressive C2H2 zinc finger proteins and of intron gain and turnover in the Hemiptera. These analyses also weigh the relative importance of lineage and genome size as predictors of gene structure evolution in insects. Furthermore, we identify enzymatic gains and losses that correlate with hemipteran feeding biology, particularly for reductions in chemoreceptor family size and loss of metabolic reactions within species with derived, fluid-nutrition feeding modes. Conclusions: With the milkweed bug genome, for the first time we have a critical mass of sequenced species representing a hemimetabolous insect order, substantially improving the diversity of insect genomics beyond holometabolans such as flies and ants. We use this addition to define commonalities among the Hemiptera and then delve into how hemipteran species' genomes reflect their feeding ecology types. Our novel and detailed analyses integrate global and rigorous manual approaches, generating hypotheses and identifying specific sets of genes for future investigation. Given Oncopeltus's strength as an experimental research model, we take particular care to evaluate the sequence resources presented here, augmenting its foundation for molecular research and highlighting potentially general considerations exemplified in the assembly and annotation of this medium-sized genome.
0

Gene Content Evolution in the Arthropods

Gregg Thomas et al.May 6, 2020
+76
D
E
G
Background Arthropods comprise the largest and most diverse phylum on Earth and play vital roles in nearly every ecosystem. Their diversity stems in part from variations on a conserved body plan, resulting from and recorded in adaptive changes in the genome. Dissection of the genomic record of sequence change enables broad questions regarding genome evolution to be addressed, even across hyper-diverse taxa within arthropods.Results Using 76 whole genome sequences representing 21 orders spanning more than 500 million years of arthropod evolution, we document changes in gene and protein domain content and provide temporal and phylogenetic context for interpreting these innovations. We identify many novel gene families that arose early in the evolution of arthropods and during the diversification of insects into modern orders. We reveal unexpected variation in patterns of DNA methylation across arthropods and examples of gene family and protein domain evolution coincident with the appearance of notable phenotypic and physiological adaptations such as flight, metamorphosis, sociality and chemoperception.Conclusions These analyses demonstrate how large-scale comparative genomics can provide broad new insights into the genotype to phenotype map and generate testable hypotheses about the evolution of animal diversity.
0

The house spider genome reveals an ancient whole-genome duplication during arachnid evolution

Evelyn Schwager et al.May 6, 2020
+52
T
P
E
The duplication of genes can occur through various mechanisms and is thought to make a major contribution to the evolutionary diversification of organisms. There is increasing evidence for a large-scale duplication of genes in some chelicerate lineages including two rounds of whole genome duplication (WGD) in horseshoe crabs. To investigate this further we sequenced and analyzed the genome of the common house spider Parasteatoda tepidariorum. We found pervasive duplication of both coding and non-coding genes in this spider, including two clusters of Hox genes. Analysis of synteny conservation across the P. tepidariorum genome suggests that there has been an ancient WGD in spiders. Comparison with the genomes of other chelicerates, including that of the newly sequenced bark scorpion Centruroides sculpturatus, suggests that this event occurred in the common ancestor of spiders and scorpions and is probably independent of the WGDs in horseshoe crabs. Furthermore, characterization of the sequence and expression of the Hox paralogs in P. tepidariorum suggests that many have been subject to neofunctionalization and/or subfunctionalization since their duplication, and therefore may have contributed to the diversification of spiders and other pulmonate arachnids.
0

Primate phylogenomics uncovers multiple rapid radiations and ancient interspecific introgression

Dan Vanderpool et al.May 7, 2020
+9
R
B
D
Our understanding of the evolutionary history of primates is undergoing continual revision due to ongoing genome sequencing efforts. Bolstered by growing fossil evidence, these data have led to increased acceptance of once controversial hypotheses regarding phylogenetic relationships, hybridization and introgression, and the biogeographical history of primate groups. Among these findings is a pattern of recent introgression between species within all major primate groups examined to date, though little is known about introgression deeper in time. To address this and other phylogenetic questions, here we present new reference genome assemblies for three Old World Monkey species: Colobus angolensis ssp. palliatus (the black and white colobus), Macaca nemestrina (southern pig-tailed macaque), and Mandrillus leucophaeus (the drill). We combine these data with 23 additional primate genomes to estimate both the species tree and individual gene trees using thousands of loci. While our species tree is largely consistent with previous phylogenetic hypotheses, the gene trees reveal high levels of genealogical discordance associated with multiple primate radiations. We use strongly asymmetric patterns of gene tree discordance around specific branches to identify multiple instances of introgression between ancestral primate lineages. In addition, we exploit recent fossil evidence to perform fossil-calibrated molecular dating analyses across the tree. Taken together, our genome-wide data help to resolve multiple contentious sets of relationships among primates, while also providing insight into the biological processes and technical artifacts that led to the disagreements in the first place.### Competing Interest StatementThe authors have declared no competing interest.
0

Hemimetabolous genomes reveal molecular basis of termite eusociality

Mark Harrison et al.May 7, 2020
+38
H
E
M
Around 150 million years ago, eusocial termites evolved from within the cockroaches, 50 million years before eusocial Hymenoptera, such as bees and ants, appeared. Here, we report the first, 2GB genome of a cockroach, Blattella germanica, and the 1.3GB genome of the drywood termite, Cryptotermes secundus. We show evolutionary signatures of termite eusociality by comparing the genomes and transcriptomes of three termites and the cockroach against the background of 16 other eusocial and non-eusocial insects. Dramatic adaptive changes in genes underlying the production and perception of pheromones confirm the importance of chemical communication in the termites. These are accompanied by major changes in gene regulation and the molecular evolution of caste determination. Many of these results parallel molecular mechanisms of eusocial evolution in Hymenoptera. However, the specific solutions are remarkably different, thus revealing a striking case of convergence in one of the major evolutionary transitions in biological complexity.
1

Deep FASTQ and BAM co-compression in Genozip 15

Divon Lan et al.Oct 24, 2023
B
D
D
Abstract We introduce Genozip Deep, a method for losslessly co-compressing FASTQ and BAM files. Benchmarking demonstrates improvements of 75% to 96% versus the already-compressed source files, translating to 2.3X to 6.8X better compression than current state-of-the-art algorithms that compress FASTQ and BAM separately. The Deep method is independent of the underlying FASTQ and BAM compressors, and here we present its implementation in Genozip, an established genomic data compression software.
0

xAtlas: Scalable small variant calling across heterogeneous next-generation sequencing experiments

Jesse Farek et al.May 6, 2020
+10
A
D
J
The rapid development of next-generation sequencing (NGS) technologies has lowered the barriers to genomic data generation, resulting in millions of samples sequenced across diverse experimental designs. The growing volume and heterogeneity of these sequencing data complicate the further optimization of methods for identifying DNA variation, especially considering that curated high-confidence variant call sets commonly used to evaluate these methods are generally developed by reference to results from the analysis of comparatively small and homogeneous sample sets. We have developed xAtlas, an application for the identification of single nucleotide variants (SNV) and small insertions and deletions (indels) in NGS data. xAtlas is easily scalable and enables execution and retraining with rapid development cycles. Generation of variant calls in VCF or gVCF format from BAM or CRAM alignments is accomplished in less than one CPU-hour per 30× short-read human whole-genome. The retraining capabilities of xAtlas allow its core variant evaluation models to be optimized on new sample data and user-defined truth sets. Obtaining SNV and indels calls from xAtlas can be achieved more than 40 times faster than established methods while retaining the same accuracy.
0

Genome-enabled insights into the biology of thrips as crop pests

Dorith Rotenberg et al.May 7, 2020
+54
S
A
D
Background : The western flower thrips, Frankliniella occidentalis (Pergande), is a globally invasive pest and plant virus vector on a wide array of food, fiber and ornamental crops. While there are numerous studies centered on thrips pest and vector biology, feeding behaviors, ecology, and insecticide resistance, the underlying genetic mechanisms of the processes governing these areas of research are largely unknown. To address this gap, we present the F. occidentalis draft genome assembly and official gene set. Results : We report on the first genome sequence for any member of the insect order Thysanoptera. Benchmarking Universal Single-Copy Ortholog (BUSCO) assessments of the genome assembly (size = 415.8 Mb, scaffold N50 = 948.9 Kb) revealed a relatively complete and well-annotated assembly in comparison to other insect genomes. The genome is unusually GC-rich (50%) compared to other insect genomes to date. The official gene set (OGS v1.0) contains 16,859 genes, of which ~10% were manually verified and corrected by our consortium. We focused on manual annotation, phylogenetic and expression evidence analyses for gene sets centered on primary themes in the life histories and activities of plant-colonizing insects. Highlights include: 1) divergent clades and large expansions in genes associated with environmental sensing (chemosensory receptors) and detoxification (CYP4, CYP6 and CCE enzymes) of substances encountered in agricultural environments; 2) a comprehensive set of salivary gland-associated genes supported by enriched expression; 3) apparent absence of members of the IMD innate immune defense pathway; and 4) developmental- and sex-specific expression analyses of genes associated with progression from larvae to adulthood through neometaboly, a distinct form of maturation compared to complete metamorphosis in the Holometabola. Conclusions : Analysis of the F. occidentalis genome offers insights into the polyphagous behavior of this insect pest to find, colonize and survive on a widely diverse array of plants. The genomic resources presented here enable a more complete analysis of insect evolution and biology, providing a missing taxon for contemporary insect genomics-based analyses. Our study also offers a genomic benchmark for molecular and evolutionary investigations of other thysanopteran species.
0
0
Save