MP
Melanie Pham
Author with expertise in RNA Sequencing Data Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
6
(67% Open Access)
Cited by:
539
h-index:
9
/
i10-index:
9
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

The genome sequence of segmental allotetraploid peanut Arachis hypogaea

David Bertioli et al.May 1, 2019
Like many other crops, the cultivated peanut (Arachis hypogaea L.) is of hybrid origin and has a polyploid genome that contains essentially complete sets of chromosomes from two ancestral species. Here we report the genome sequence of peanut and show that after its polyploid origin, the genome has evolved through mobile-element activity, deletions and by the flow of genetic information between corresponding ancestral chromosomes (that is, homeologous recombination). Uniformity of patterns of homeologous recombination at the ends of chromosomes favors a single origin for cultivated peanut and its wild counterpart A. monticola. However, through much of the genome, homeologous recombination has created diversity. Using new polyploid hybrids made from the ancestral species, we show how this can generate phenotypic changes such as spontaneous changes in the color of the flowers. We suggest that diversity generated by these genetic mechanisms helped to favor the domestication of the polyploid A. hypogaea over other diploid Arachis species cultivated by humans. The genome sequence of segmental allotetraploid peanut suggests that diversity generated by genetic deletions and homeologous recombination helped to favor the domestication of Arachis hypogaea over its diploid relatives.
0
Citation509
0
Save
107

Fine-mapping of nuclear compartments using ultra-deep Hi-C shows that active promoter and enhancer elements localize in the active A compartment even when adjacent sequences do not

Huiya Gu et al.Oct 3, 2021
Abstract Megabase-scale intervals of active, gene-rich and inactive, gene-poor chromatin are known to segregate, forming the A and B compartments. Fine mapping of the contents of these A and B compartments has been hitherto impossible, owing to the extraordinary sequencing depths required to distinguish between the long-range contact patterns of individual loci, and to the computational complexity of the associated calculations. Here, we generate the largest published in situ Hi-C map to date, spanning 33 billion contacts. We also develop a computational method, dubbed PCA of Sparse, SUper Massive Matrices (POSSUMM), that is capable of efficiently calculating eigenvectors for sparse matrices with millions of rows and columns. Applying POSSUMM to our Hi-C dataset makes it possible to assign loci to the A and B compartment at 500 bp resolution. We find that loci frequently alternate between compartments as one moves along the contour of the genome, such that the median compartment interval is only 12.5 kb long. Contrary to the findings in coarse-resolution compartment profiles, we find that individual genes are not uniformly positioned in either the A compartment or the B compartment. Instead, essentially all (95%) active gene promoters localize in the A compartment, but the likelihood of localizing in the A compartment declines along the body of active genes, such that the transcriptional termini of long genes (>60 kb) tend to localize in the B compartment. Similarly, nearly all active enhancers elements (95%) localize in the A compartment, even when the flanking sequences are comprised entirely of inactive chromatin and localize in the B compartment. These results are consistent with a model in which DNA-bound regulatory complexes give rise to phase separation at the scale of individual DNA elements.
107
Citation28
0
Save
0

Convergent selection on hormone signaling shaped social evolution in bees

Beryl Jones et al.Apr 14, 2021
Abstract Sweat bees have repeatedly gained and lost eusociality, a transition from individual to group reproduction. Here, we generate chromosome-length genome assemblies for 17 species and identify genomic signatures of evolutionary trade-offs associated with transitions between social and solitary living. Both young genes and regulatory regions show enrichment for these molecular patterns. We also identify loci that show evidence of complementary signals of positive and relaxed selection linked specifically to the convergent gains and losses of eusociality in sweat bees. This includes two proteins that bind and transport juvenile hormone (JH) – a key regulator of insect development and reproduction. We find one of these JH binding proteins is primarily expressed in subperineurial glial cells that form the insect blood-brain barrier and that brain levels of JH vary by sociality. Our findings are consistent with a role of JH in modulating social behavior and suggest eusocial evolution was facilitated by alteration of the proteins that bind and transport JH, revealing how an ancestral, developmental hormone may have been co-opted during one of life’s major transitions. More broadly, our results highlight how trade-offs have structured the molecular basis of eusociality in these bees and demonstrate how both directional selection and release from constraint can shape trait evolution.
0
Citation2
0
Save
33

A chromosome-length genome assembly and annotation of blackberry (Rubus argutus, cv. ‘Hillquist’)

Tomáš Brůna et al.Apr 30, 2022
Abstract Background Blackberries ( Rubus spp.) are the fourth most economically important berry crop worldwide. Genome assemblies and annotations have been developed for Rubus species in subgenus Idaeobatus , including black raspberry ( R. occidentalis ), red raspberry ( R. idaeus ), and R. chingii , but very few genomic resources exist for blackberries and their relatives in subgenus Rubus . Findings Here we present a chromosome-length assembly and annotation of the diploid blackberry germplasm accession ‘Hillquist’ ( R. argutus ). ‘Hillquist’ is the only known source of primocane-fruiting (annual-fruiting) in tetraploid fresh-market blackberry breeding programs and is represented in the pedigree of many important cultivars worldwide. The ‘Hillquist’ assembly, generated using PacBio long reads scaffolded with Hi-C sequencing, consisted of 298 Mb, of which 270 Mb (90%) was placed on seven chromosome-length scaffolds with an average length of 38.6 Mb. Approximately 52.8% of the genome was composed of repetitive elements. The genome sequence was highly collinear with a novel maternal haplotype-resolved linkage map of the tetraploid blackberry selection A-2551TN and genome assemblies of R. chingii and red raspberry. A total of 38,503 protein-coding genes were predicted using the assembly and Iso-Seq and RNA-seq data, of which 72% were functionally annotated. Conclusions The utility of the ‘Hillquist’ genome has been demonstrated here by the development of the first genotyping-by-sequencing based linkage map of tetraploid blackberry and the identification of several possible candidate genes for primocane-fruiting within the previously mapped locus. This chromosome-length assembly will facilitate future studies in Rubus biology, genetics, and genomics and strengthen applied breeding programs.
0

The Juicebox Assembly Tools module facilitates de novo assembly of mammalian genomes with chromosome-length scaffolds for under $1000

Olga Dudchenko et al.Jan 28, 2018
Hi-C contact maps are valuable for genome assembly (Lieberman-Aiden, van Berkum et al. 2009; Burton et al. 2013; Dudchenko et al. 2017). Recently, we developed Juicebox, a system for the visual exploration of Hi-C data (Durand, Robinson et al. 2016), and 3D-DNA, an automated pipeline for using Hi-C data to assemble genomes (Dudchenko et al. 2017). Here, we introduce "Assembly Tools," a new module for Juicebox, which provides a point-and-click interface for using Hi-C heatmaps to identify and correct errors in a genome assembly. Together, 3D-DNA and the Juicebox Assembly Tools greatly reduce the cost of accurately assembling complex eukaryotic genomes. To illustrate, we generated de novo assemblies with chromosome-length scaffolds for three mammals: the wombat, Vombatus ursinus (3.3Gb), the Virginia opossum, Didelphis virginiana (3.3Gb), and the raccoon, Procyon lotor (2.5Gb). The only inputs for each assembly were Illumina reads from a short insert DNA-Seq library (300 million Illumina reads, maximum length 2x150 bases) and an in situ Hi-C library (100 million Illumina reads, maximum read length 2x150 bases), which cost <$1000.