DW
David Weisz
Author with expertise in RNA Sequencing Data Analysis
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
13
(92% Open Access)
Cited by:
6
h-index:
12
/
i10-index:
14
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Three-dimensional genome architecture persists in a 52,000-year-old woolly mammoth skin sample

Marcela Sandoval‐Velasco et al.Jul 1, 2024
+53
J
O
M
Analyses of ancient DNA typically involve sequencing the surviving short oligonucleotides and aligning to genome assemblies from related, modern species. Here, we report that skin from a female woolly mammoth (†Mammuthus primigenius) that died 52,000 years ago retained its ancient genome architecture. We use PaleoHi-C to map chromatin contacts and assemble its genome, yielding 28 chromosome-length scaffolds. Chromosome territories, compartments, loops, Barr bodies, and inactive X chromosome (Xi) superdomains persist. The active and inactive genome compartments in mammoth skin more closely resemble Asian elephant skin than other elephant tissues. Our analyses uncover new biology. Differences in compartmentalization reveal genes whose transcription was potentially altered in mammoths vs. elephants. Mammoth Xi has a tetradic architecture, not bipartite like human and mouse. We hypothesize that, shortly after this mammoth's death, the sample spontaneously freeze-dried in the Siberian cold, leading to a glass transition that preserved subfossils of ancient chromosomes at nanometer scale.
0
Citation3
0
Save
0

Convergent selection on hormone signaling shaped social evolution in bees

Beryl Jones et al.Apr 14, 2021
+26
B
W
B
Abstract Sweat bees have repeatedly gained and lost eusociality, a transition from individual to group reproduction. Here, we generate chromosome-length genome assemblies for 17 species and identify genomic signatures of evolutionary trade-offs associated with transitions between social and solitary living. Both young genes and regulatory regions show enrichment for these molecular patterns. We also identify loci that show evidence of complementary signals of positive and relaxed selection linked specifically to the convergent gains and losses of eusociality in sweat bees. This includes two proteins that bind and transport juvenile hormone (JH) – a key regulator of insect development and reproduction. We find one of these JH binding proteins is primarily expressed in subperineurial glial cells that form the insect blood-brain barrier and that brain levels of JH vary by sociality. Our findings are consistent with a role of JH in modulating social behavior and suggest eusocial evolution was facilitated by alteration of the proteins that bind and transport JH, revealing how an ancestral, developmental hormone may have been co-opted during one of life’s major transitions. More broadly, our results highlight how trade-offs have structured the molecular basis of eusociality in these bees and demonstrate how both directional selection and release from constraint can shape trait evolution.
0
Citation2
0
Save
9

A Chromosome-length Assembly of the Black Petaltail (Tanypteryx hageni) Dragonfly

Ethan Tolman et al.Oct 21, 2022
+10
O
K
E
Abstract We present a chromosome-length genome assembly and annotation of the Black Petaltail dragonfly ( Tanypteryx hageni ). This habitat specialist diverged from its sister species over 70 million years ago, and separated from the most closely related Odonata with a reference genome 150 million years ago. Using PacBio HiFi reads and Hi-C data for scaffolding we produce one of the most high quality Odonata genomes to date. A scaffold N50 of 206.6 Mb and a BUSCO score of 96.8% indicate high contiguity and completeness. Significance We provide a chromosome-length assembly of the Black Petaltail dragonfly ( Tanypteryx hageni) , the first genome assembly for any non-libelluloid dragonfly. The Black Petaltail diverged from its sister species over 70 million years ago. T. hageni , like its confamilials, occupies fen habitats in its nymphal stage, a life history uncommon in the vast majority of dragonflies. We hope that the availability of this assembly will facilitate research on T. hageni and other petaltail species, to better understand their ecology and support conservation efforts.
9
Citation1
0
Save
0

Improved high quality sand fly assemblies enabled by ultra low input long read sequencing

Michelle Huang et al.Aug 24, 2024
+14
D
S
M
Abstract Phlebotomine sand flies are the vectors of leishmaniasis, a neglected tropical disease. High-quality reference genomes are an important tool for understanding the biology and eco-evolutionary dynamics underpinning disease epidemiology. Previous leishmaniasis vector reference sequences were limited by sequencing technologies available at the time and inadequate for high-resolution genomic inquiry. Here, we present updated reference assemblies of two sand flies, Phlebotomus papatasi and Lutzomyia longipalpis . These chromosome-level assemblies were generated using an ultra-low input library protocol, PacBio HiFi long reads, and Hi-C technology. The new P. papatasi reference has a final assembly span of 351.6 Mb and contig and scaffold N50s of 926 kb and 111.8 Mb, respectively. The new Lu. longipalpis reference has a final assembly span of 147.8 Mb and contig and scaffold N50s of 1.09 Mb and 40.6 Mb, respectively. Benchmarking Universal Single-Copy Orthologue (BUSCO) assessments indicated 94.5% and 95.6% complete single copy insecta orthologs for P. papatasi and Lu. longipalpis . These improved assemblies will serve as an invaluable resource for future genomic work on phlebotomine sandflies.
10

The ENCODE Uniform Analysis Pipelines

Benjamin Hitz et al.Apr 6, 2023
+57
A
M
B
Abstract The Encyclopedia of DNA elements (ENCODE) project is a collaborative effort to create a comprehensive catalog of functional elements in the human genome. The current database comprises more than 19000 functional genomics experiments across more than 1000 cell lines and tissues using a wide array of experimental techniques to study the chromatin structure, regulatory and transcriptional landscape of the Homo sapiens and Mus musculus genomes. All experimental data, metadata, and associated computational analyses created by the ENCODE consortium are submitted to the Data Coordination Center (DCC) for validation, tracking, storage, and distribution to community resources and the scientific community. The ENCODE project has engineered and distributed uniform processing pipelines in order to promote data provenance and reproducibility as well as allow interoperability between genomic resources and other consortia. All data files, reference genome versions, software versions, and parameters used by the pipelines are captured and available via the ENCODE Portal. The pipeline code, developed using Docker and Workflow Description Language (WDL; https://openwdl.org/ ) is publicly available in GitHub, with images available on Dockerhub ( https://hub.docker.com ), enabling access to a diverse range of biomedical researchers. ENCODE pipelines maintained and used by the DCC can be installed to run on personal computers, local HPC clusters, or in cloud computing environments via Cromwell. Access to the pipelines and data via the cloud allows small labs the ability to use the data or software without access to institutional compute clusters. Standardization of the computational methodologies for analysis and quality control leads to comparable results from different ENCODE collections - a prerequisite for successful integrative analyses. Database URL: https://www.encodeproject.org/
1

Chromosome size affects sequence divergence between species through the interplay of recombination and selection

Anna Tigano et al.Jan 17, 2021
+8
A
R
A
Abstract The structure of the genome shapes the distribution of genetic diversity and sequence divergence. To investigate how the relationship between chromosome size and recombination rate affects sequence divergence between species, we combined empirical analyses and evolutionary simulations. We estimated pairwise sequence divergence among 15 species from three different Mammalian clades - Peromyscus rodents, Mus mice, and great apes - from chromosome-level genome assemblies. We found a strong significant negative correlation between chromosome size and sequence divergence in all species comparisons within the Peromyscus and great apes clades, but not the Mus clade, suggesting that the dramatic chromosomal rearrangements among Mus species may have masked the ancestral genomic landscape of divergence in many comparisons. Our evolutionary simulations showed that the main factor determining differences in divergence among chromosomes of different size is the interplay of recombination rate and selection, with greater variation in larger populations than in smaller ones. In ancestral populations, shorter chromosomes harbor greater nucleotide diversity. As ancestral populations diverge, diversity present at the onset of the split contributes to greater sequence divergence in shorter chromosomes among daughter species. The combination of empirical data and evolutionary simulations revealed that chromosomal rearrangements, demography, and divergence times may also affect the relationship between chromosome size and divergence, and deepen our understanding of the role of genome structure on the evolution of species divergence.
0

The Gene-Rich Genome of the Scallop Pecten maximus

Nathan Kenny et al.Jan 9, 2020
+19
D
K
N
Background: The King Scallop, Pecten maximus, is distributed in shallow waters along the Atlantic coast of Europe. It forms the basis of a valuable commercial fishery and its ubiquity means that it plays a key role in coastal ecosystems and food webs. Like other filter feeding bivalves it can accumulate potent phytotoxins, to which it has evolved some immunity. The molecular origins of this immunity are of interest to evolutionary biologists, pharmaceutical companies and fisheries management. Findings: Here we report the genome sequencing of this species, conducted as part of the Wellcome Sanger 25 Genomes Project. This genome was assembled from PacBio reads and scaffolded with 10x Chromium and Hi-C data, and its 3,983 scaffolds have an N50 of 44.8 Mb (longest scaffold 60.1 Mb), with 92% of the assembly sequence contained in 19 scaffolds, corresponding to the 19 chromosomes found in this species. The total assembly spans 918.3 Mb, and is the best-scaffolded marine bivalve genome published to date, exhibiting 95.5% recovery of the metazoan BUSCO set. Gene annotation resulted in 67,741 gene models. Analysis of gene content revealed large numbers of gene duplicates, as previously seen in bivalves, with little gene loss, in comparison with the sequenced genomes of other marine bivalve species. Conclusions: The genome assembly of Pecten maximus and its annotated gene set provide a high quality platform for a wide range of investigations, including studies on such disparate topics as shell biomineralization, pigmentation, vision and resistance to algal toxins. As a result of our findings we highlight the sodium channel gene Nav1, known as a gene conferring resistance to saxitoxin and tetrodotoxin, as a candidate for further studies investigating immunity to domoic acid.
1

Three-dimensional genome architecture persists in a 52,000-year-old woolly mammoth skin sample

Marcela Sandoval‐Velasco et al.Jun 30, 2023
+29
L
J
M
Abstract Ancient DNA (aDNA) sequencing analysis typically involves alignment to a modern reference genome assembly from a related species. Since aDNA molecules are fragmentary, these alignments yield information about small-scale differences, but provide no information about larger features such as the chromosome structure of ancient species. We report the genome assembly of a female Late Pleistocene woolly mammoth ( Mammuthus primigenius ) with twenty-eight chromosome-length scaffolds, generated using mammoth skin preserved in permafrost for roughly 52,000 years. We began by creating a modified Hi-C protocol, dubbed PaleoHi-C, optimized for ancient samples, and using it to map chromatin contacts in a woolly mammoth. Next, we developed “reference-assisted 3D genome assembly,” which begins with a reference genome assembly from a related species, and uses Hi-C and DNA-Seq data from a target species to split, order, orient, and correct sequences on the basis of their 3D proximity, yielding accurate chromosome-length scaffolds for the target species. By means of this reference-assisted 3D genome assembly, PaleoHi-C data reveals the 3D architecture of a woolly mammoth genome, including chromosome territories, compartments, domains, and loops. The active (A) and inactive (B) genome compartments in mammoth skin more closely resemble those observed in Asian elephant skin than the compartmentalization patterns seen in other Asian elephant tissues. Differences in compartmentalization between these skin samples reveal sequences whose transcription was potentially altered in mammoth. We observe a tetradic structure for the inactive X chromosome in mammoth, distinct from the bipartite architecture seen in human and mouse. Generating chromosome-length genome assemblies for two other elephantids (Asian and African elephant), we find that the overall karyotype, and this tetradic Xi structure, are conserved throughout the clade. These results illustrate that cell-type specific epigenetic information can be preserved in ancient samples, in the form of DNA geometry, and that it may be feasible to perform de novo genome assembly of some extinct species.
1

MCPH1 inhibits condensin II during interphase by regulating its SMC2-kleisin interface

Martin Houlard et al.Jul 20, 2021
+8
M
E
M
ABSTRACT The dramatic change in morphology of chromosomal DNAs between interphase and mitosis is one of the defining features of the eukaryotic cell cycle. Two types of enzymes, namely cohesin and condensin confer the topology of chromosomal DNA by extruding DNA loops. While condensin normally configures chromosomes exclusively during mitosis, cohesin does so during interphase. The processivity of cohesin’s LE during interphase is limited by a regulatory factor called WAPL, which induces cohesin to dissociate from chromosomes via a mechanism that requires dissociation of its kleisin from the neck of SMC3. We show here that a related mechanism may be responsible for blocking condensin II from acting during interphase. Cells from patients carrying mutations in the Mcph1 gene undergo premature chromosome condensation but it has never been established for certain whether MCPH1 regulates condensin II directly. We show that deletion of Mcph1 in mouse embryonic stem cells unleashes an activity of condensin II that triggers formation of compact chromosomes in G1 and G2 phases, which is accompanied by enhanced mixing of A and B chromatin compartments, and that this occurs even in the absence of CDK1 activity. Crucially, inhibition of condensin II by MCPH1 depends on the binding of a short linear motif within MCPH1 to condensin II’s NCAPG2 subunit. We show that the activities of both Cohesin and Condensin II may be restricted during interphase by similar types of mechanisms as MCPH1’s ability to block condensin II’s association with chromatin is abrogated by the fusion of SMC2 with NCAPH2. Remarkably, in the absence of both WAPL and MCPH1, cohesin and condensin II transform chromosomal DNAs of G2 cells into chromosomes with a solenoidal axis showing that both SMC complexes must be tightly regulated to adjust both the chromatid’s structure and their segregation.
157

A rapid, low-cost, and highly sensitive SARS-CoV-2 diagnostic based on whole-genome sequencing

Per Adastra et al.Apr 25, 2020
+12
N
N
P
Abstract Early detection of infection with SARS-CoV-2 is key to managing the current global pandemic, as evidence shows the virus is most contagious on or before symptom onset. Here, we introduce a low-cost, high-throughput method for diagnosing and studying SARS-CoV-2 infection. Dubbed Pathogen-Oriented Low-Cost Assembly & Re-Sequencing (POLAR), this method amplifies the entirety of the SARS-CoV-2 genome. This contrasts with typical RT-PCR-based diagnostic tests, which amplify only a few loci. To achieve this goal, we combine a SARS-CoV-2 enrichment method developed by the ARTIC Network ( https://artic.network/ ) with short-read DNA sequencing and de novo genome assembly. Using this method, we can reliably (>95% accuracy) detect SARS-CoV-2 at a concentration of 84 genome equivalents per milliliter (GE/mL). Almost all diagnostic methods currently authorized for use by the United States Food and Drug Administration with the Coronavirus Disease 2019 (COVID-19) Emergency Use Authorization require larger concentrations of the virus to achieve this degree of accuracy. In addition, we can reliably assemble the SARS-CoV-2 genome in the sample, often with no gaps and perfect accuracy. The genotypic data contained in these genome assemblies enable the more effective analysis of disease spread than is possible with an ordinary binary diagnostic. These data can also help identify vaccine and drug targets. Finally, we show that the diagnoses obtained using POLAR of both positive and negative clinical nasopharyngeal swab samples 100% match the diagnoses obtained in a clinical diagnostic lab using the Center for Disease Control’s 2019-Novel Coronavirus test. Using POLAR, a single person can manually process 192 samples over an 8- hour experiment at the cost of ∼$36 per patient (as of December 7 th , 2022), enabling a 24-hour turnaround with sequencing and data analysis time. We anticipate that further testing and refinement will allow greater sensitivity in this approach.
Load More