NP
Nicole Perna
Author with expertise in RNA Sequencing Data Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
12
(75% Open Access)
Cited by:
23,593
h-index:
43
/
i10-index:
66
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

progressiveMauve: Multiple Genome Alignment with Gene Gain, Loss and Rearrangement

Aaron Darling et al.Jun 25, 2010
Background Multiple genome alignment remains a challenging problem. Effects of recombination including rearrangement, segmental duplication, gain, and loss can create a mosaic pattern of homology even among closely related organisms. Methodology/Principal Findings We describe a new method to align two or more genomes that have undergone rearrangements due to recombination and substantial amounts of segmental gain and loss (flux). We demonstrate that the new method can accurately align regions conserved in some, but not all, of the genomes, an important case not handled by our previous work. The method uses a novel alignment objective score called a sum-of-pairs breakpoint score, which facilitates accurate detection of rearrangement breakpoints when genomes have unequal gene content. We also apply a probabilistic alignment filtering method to remove erroneous alignments of unrelated sequences, which are commonly observed in other genome alignment methods. We describe new metrics for quantifying genome alignment accuracy which measure the quality of rearrangement breakpoint predictions and indel predictions. The new genome alignment algorithm demonstrates high accuracy in situations where genomes have undergone biologically feasible amounts of genome rearrangement, segmental gain and loss. We apply the new algorithm to a set of 23 genomes from the genera Escherichia, Shigella, and Salmonella. Analysis of whole-genome multiple alignments allows us to extend the previously defined concepts of core- and pan-genomes to include not only annotated genes, but also non-coding regions with potential regulatory roles. The 23 enterobacteria have an estimated core-genome of 2.46Mbp conserved among all taxa and a pan-genome of 15.2Mbp. We document substantial population-level variability among these organisms driven by segmental gain and loss. Interestingly, much variability lies in intergenic regions, suggesting that the Enterobacteriacae may exhibit regulatory divergence. Conclusions The multiple genome alignments generated by our software provide a platform for comparative genomic and population genomic studies. Free, open-source software implementing the described genome alignment approach is available from http://gel.ahabs.wisc.edu/mauve.
0
Citation3,611
0
Save
0

Extensive mosaic structure revealed by the complete genome sequence of uropathogenic Escherichia coli

Rodney Welch et al.Dec 5, 2002
We present the complete genome sequence of uropathogenic Escherichia coli , strain CFT073. A three-way genome comparison of the CFT073, enterohemorrhagic E. coli EDL933, and laboratory strain MG1655 reveals that, amazingly, only 39.2% of their combined (nonredundant) set of proteins actually are common to all three strains. The pathogen genomes are as different from each other as each pathogen is from the benign strain. The difference in disease potential between O157:H7 and CFT073 is reflected in the absence of genes for type III secretion system or phage- and plasmid-encoded toxins found in some classes of diarrheagenic E. coli . The CFT073 genome is particularly rich in genes that encode potential fimbrial adhesins, autotransporters, iron-sequestration systems, and phase-switch recombinases. Striking differences exist between the large pathogenicity islands of CFT073 and two other well-studied uropathogenic E. coli strains, J96 and 536. Comparisons indicate that extraintestinal pathogenic E. coli arose independently from multiple clonal lineages. The different E. coli pathotypes have maintained a remarkable synteny of common, vertically evolved genes, whereas many islands interrupting this common backbone have been acquired by different horizontal transfer events in each strain.
0
Citation1,456
0
Save
0

Genome Sequence of Yersinia pestis KIM

Wen‐Ling Deng et al.Aug 15, 2002
ABSTRACT We present the complete genome sequence of Yersinia pestis KIM, the etiologic agent of bubonic and pneumonic plague. The strain KIM, biovar Mediaevalis, is associated with the second pandemic, including the Black Death. The 4.6-Mb genome encodes 4,198 open reading frames (ORFs). The origin, terminus, and most genes encoding DNA replication proteins are similar to those of Escherichia coli K-12. The KIM genome sequence was compared with that of Y. pestis CO92, biovar Orientalis, revealing homologous sequences but a remarkable amount of genome rearrangement for strains so closely related. The differences appear to result from multiple inversions of genome segments at insertion sequences, in a manner consistent with present knowledge of replication and recombination. There are few differences attributable to horizontal transfer. The KIM and E. coli K-12 genome proteins were also compared, exposing surprising amounts of locally colinear “backbone,” or synteny, that is not discernible at the nucleotide level. Nearly 54% of KIM ORFs are significantly similar to K-12 proteins, with conserved housekeeping functions. However, a number of E. coli pathways and transport systems and at least one global regulator were not found, reflecting differences in lifestyle between them. In KIM-specific islands, new genes encode candidate pathogenicity proteins, including iron transport systems, putative adhesins, toxins, and fimbriae.
0
Citation539
0
Save
0

Host Range and Molecular Phylogenies of the Soft Rot Enterobacterial Genera Pectobacterium and Dickeya

Bing Ma et al.Aug 9, 2007
Pectobacterium and Dickeya spp. are related broad-host-range entero-bacterial pathogens of angiosperms. A review of the literature shows that these genera each cause disease in species from at least 35% of angiosperm plant orders. The known host ranges of these pathogens partially overlap and, together, these two genera are pathogens of species from 50% of angiosperm plant orders. Notably, there are no reported hosts for either genus in the eudicots clade and no reported Dickeya hosts in the magnoliids or eurosids II clades, although Pectobacterium spp. are pathogens of at least one plant species in the magnoliids and at least one in each of the three eurosids II plant orders. In addition, Dickeya but not Pectobacterium spp. have been reported on a host in the rosids clade and, unlike Pectobacterium spp., have been reported on many Poales species. Natural disease among nonangiosperms has not been reported for either genus. Phylogenetic analyses of sequences concatenated from regions of seven housekeeping genes (acnA, gapA, icdA, mdh, mtlD, pgi, and proA) from representatives of these genera demonstrated that Dickeya spp. and the related tree pathogens, the genus Brenneria, are more diverse than Pectobacterium spp. and that the Pectobacterium strains can be divided into at least five distinct clades, three of which contain strains from multiple host plants.
0
Citation462
0
Save
Load More