AR
Allison Rozanski
Author with expertise in Genome Evolution and Polyploidy in Plants
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
11
(91% Open Access)
Cited by:
29
h-index:
8
/
i10-index:
6
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
6

Increased mutation rate and interlocus gene conversion within human segmental duplications

Mitchell Vollger et al.Jul 7, 2022
ABSTRACT Single-nucleotide variants (SNVs) within segmental duplications (SDs) have not been systematically assessed because of the difficulty in mapping short-read sequence data to virtually identical repetitive sequences. Using 102 phased human haplotypes, we constructed 1:1 unambiguous alignments spanning high-identity SDs and compared the pattern of SNVs between unique and SD regions. We find that human SNVs are elevated 60% in SDs compared to unique regions. We estimate that at least 23% of this increase is due to interlocus gene conversion (IGC) with >7 Mbp of SD sequence converted on average per human haplotype. We develop a genome-wide map of IGC donors and acceptors, including 498 acceptor and 454 donor hotspots affecting the exons of ~800 protein-coding genes. The latter includes 171 genes that have “relocated” on average 1.61 Mbp in a subset of human haplotypes. Using a coalescent framework, we show that SD regions are evolutionarily older when compared to unique sequences with most of this signal originating from putative IGC loci. SNVs within SDs, however, also exhibit a distinct mutational spectrum where there is a 27.1% increase in transversions that convert cytosine to guanine or the reverse across all triplet contexts. In addition, we observe a 7.6% reduction in the frequency of CpG associated mutations when compared to unique DNA. We hypothesize that these distinct mutational properties help to maintain an overall higher GC content of SD DNA when compared to unique DNA, and we show that these GC-favoring mutational events are likely driven by GC-biased conversion between paralogous sequences.
6
Citation8
0
Save
43

Gaps and complex structurally variant loci in phased genome assemblies

David Porubský et al.Jul 6, 2022
ABSTRACT There has been tremendous progress in the production of phased genome assemblies by combining long-read data with parental information or linking read data. Nevertheless, a typical phased genome assembly generated by trio-hifiasm still generates more than ~140 gaps. We perform a detailed analysis of gaps, assembly breaks, and misorientations from 77 phased and assembled human genomes (154 unique haplotypes). We find that trio-based approaches using HiFi are the current gold standard although chromosome-wide phasing accuracy is comparable when using Strand-seq instead of parental data. We find two-thirds of defined contig ends cluster near the largest and most identical repeats [including segmental duplications (35.4%) or satellite DNA (22.3%) or to regions enriched in GA/AT rich DNA (27.4%)]. As a result, 1513 protein-coding genes overlap assembly gaps in at least one haplotype and 231 are recurrently disrupted or missing from five or more haplotypes. In addition, we estimate that 6-7 Mbp of DNA are incorrectly orientated per haplotype irrespective of whether trio-free or trio-based approaches are employed. 81% of such misorientations correspond to bona fide large inversion polymorphisms in the human species, most of which are flanked by large identical segmental duplications. In addition, we also identify large-scale alignment discontinuities consistent with an 11.9 Mbp deletion and 161.4 Mbp of insertion per human haploid genome. While 99% of this variation corresponds to satellite DNA, we identify 230 regions of the euchromatic DNA with frequent expansions and contractions, nearly half of which overlap with 197 protein-coding genes. Although not completely resolved, these regions include copy number polymorphic and biomedically relevant genic regions where complete resolution and a pangenome representation will be most useful, yet most challenging, to realize.
43
Citation7
0
Save
0

The variation and evolution of complete human centromeres

Glennis Logsdon et al.Apr 3, 2024
Abstract Human centromeres have been traditionally very difficult to sequence and assemble owing to their repetitive nature and large size 1 . As a result, patterns of human centromeric variation and models for their evolution and function remain incomplete, despite centromeres being among the most rapidly mutating regions 2,3 . Here, using long-read sequencing, we completely sequenced and assembled all centromeres from a second human genome and compared it to the finished reference genome 4,5 . We find that the two sets of centromeres show at least a 4.1-fold increase in single-nucleotide variation when compared with their unique flanks and vary up to 3-fold in size. Moreover, we find that 45.8% of centromeric sequence cannot be reliably aligned using standard methods owing to the emergence of new α-satellite higher-order repeats (HORs). DNA methylation and CENP-A chromatin immunoprecipitation experiments show that 26% of the centromeres differ in their kinetochore position by >500 kb. To understand evolutionary change, we selected six chromosomes and sequenced and assembled 31 orthologous centromeres from the common chimpanzee, orangutan and macaque genomes. Comparative analyses reveal a nearly complete turnover of α-satellite HORs, with characteristic idiosyncratic changes in α-satellite HORs for each species. Phylogenetic reconstruction of human haplotypes supports limited to no recombination between the short (p) and long (q) arms across centromeres and reveals that novel α-satellite HORs share a monophyletic origin, providing a strategy to estimate the rate of saltatory amplification and mutation of human centromeric DNA.
0
Citation4
1
Save
15

Differential investment in visual and olfactory brain regions mirrors the sensory needs of a paper wasp social parasite and its host

Allison Rozanski et al.Jan 19, 2021
ABSTRACT Obligate social parasites evolve traits to effectively locate and then exploit their hosts, whereas hosts have complex social behavioral repertoires, which include sensory recognition to reject potential conspecific intruders and heterospecific parasites. While social parasite and host behaviors have been studied extensively, less is known about how their sensory systems function to meet their specific selective pressures. Here, we compare investment in visual and olfactory brain regions in the paper wasp Polistes dominula , and its obligate social parasite P. sulcifer , to explore the link between sensory systems and brain plasticity. Our results show opposite and significant differences, consistent with their very different life-histories, in the sensory investments between these two closely-related species. Social parasites initially invest in the optic lobes to likely locate their hosts. After host colony usurpation, the parasite increases its brain volume, with specific investment in antennal lobes, which mirrors the behavioral switch from a usurping parasite to an integrated parasitic queen of the host colony. Contrastingly, hosts initially invest in the antennal lobes and sensory processing compared to social parasites, as predicted by their need to maintain social cohesion, allocate colony tasks, and recognize con- and heterospecific intruders. Host queens show a trend of higher investment in all sensory brain regions compared to workers, paralleling differences in task allocations. Our work provides novel insights into how intraspecific brain plasticity can facilitate the unique sensory adaptations needed to perform specific tasks by the host or to transition from searching to successful host exploitation by the social parasite.
15
Paper
Citation1
0
Save
22

Structurally divergent and recurrently mutated regions of primate genomes

Yafei Mao et al.Mar 7, 2023
ABSTRACT To better understand the pattern of primate genome structural variation, we sequenced and assembled using multiple long-read sequencing technologies the genomes of eight nonhuman primate species, including New World monkeys (owl monkey and marmoset), Old World monkey (macaque), Asian apes (orangutan and gibbon), and African ape lineages (gorilla, bonobo, and chimpanzee). Compared to the human genome, we identified 1,338,997 lineage-specific fixed structural variants (SVs) disrupting 1,561 protein-coding genes and 136,932 regulatory elements, including the most complete set of human-specific fixed differences. Across 50 million years of primate evolution, we estimate that 819.47 Mbp or ~27% of the genome has been affected by SVs based on analysis of these primate lineages. We identify 1,607 structurally divergent regions (SDRs) wherein recurrent structural variation contributes to creating SV hotspots where genes are recurrently lost ( CARDs , ABCD7 , OLAH ) and new lineage-specific genes are generated (e.g., CKAP2 , NEK5 ) and have become targets of rapid chromosomal diversification and positive selection (e.g., RGPDs ). High-fidelity long-read sequencing has made these dynamic regions of the genome accessible for sequence-level analyses within and between primate species for the first time.
0

Complete chromosome 21 centromere sequences from a Down syndrome family reveal size asymmetry and differences in kinetochore attachment

Francesco Mastrorosa et al.Feb 26, 2024
Down syndrome is the most common form of human intellectual disability caused by precocious segregation and nondisjunction of chromosome 21. Differences in centromere structure have been hypothesized to play a potential role in this process in addition to the well-established risk of advancing maternal age. Using long-read sequencing, we completely sequenced and assembled the centromeres from a parent-child trio where Trisomy 21 arose in the child as a result of a meiosis I error. The proband carries three distinct chromosome 21 centromere haplotypes that vary by 11-fold in length--both the largest (H1) and smallest (H2) originating from the mother. The longest H1 allele harbors a less clearly defined centromere dip region (CDR) as defined by CpG methylation and a significantly reduced signal by CENP-A chromatin immunoprecipitation sequencing when compared to H2 or paternal H3 centromeres. These epigenetic signatures suggest less competent kinetochore attachment for the maternally transmitted H1. Analysis of H1 in the mother indicates that the reduced CENP-A ChIP-seq signal, but not the CDR profile, pre-existed the meiotic nondisjunction event. A comparison of the three proband centromeres to a population sampling of 35 completely sequenced chromosome 21 centromeres shows that H2 is the smallest centromere sequenced to date and all three haplotypes (H1-H3) share a common origin of ~15 thousand years ago. These results suggest that recent asymmetry in size and epigenetic differences of chromosome 21 centromeres may contribute to nondisjunction risk.
Load More