AA
Akshay Avvaru
Author with expertise in Structure and Function of the Nuclear Pore Complex
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
3
(67% Open Access)
Cited by:
1
h-index:
4
/
i10-index:
4
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
24

DiviSSR: Simple arithmetic for efficient identification of tandem repeats

Akshay Avvaru et al.Oct 6, 2021
Summary Numerical or vector representations of DNA sequences have been applied for identification of specific sequence characteristics and patterns which are not evident in their character (A, C, G, T) representations. These transformations often reveal a mathematical structure to the sequences which can be captured efficiently using established mathematical methods. One such transformation, the 2-bit format, represents each nucleotide using only two bits instead of eight for efficient storage of genomic data. Here we describe a mathematical property that exists in the 2-bit representation of tandemly repeated DNA sequences. Our tool, DiviSSR (pronounced divisor), leverages this property and subsequent arithmetic to achieve ultrafast and accurate identification of tandem repeats. DiviSSR can process the entire human genome in ∼30s, and short sequence reads at a rate of >1 million reads/s on a single CPU thread. Our work also highlights the implications of using simple mathematical properties of DNA sequences for faster algorithms in genomics. Availability DiviSSR can be installed directly using python pip. The source code and documentation of DiviSSR are available at https://github.com/avvaruakshay/divissr.git .
24
Citation1
0
Save
4

Biochemical deconstruction and reconstruction of Nuclear Matrix reveals the layers of nuclear organization

Ashish Bihani et al.Jan 29, 2023
ABSTRACT Nuclear Matrix (NuMat) is the fraction of the eukaryotic nucleus insoluble to detergents and high-salt extractions that manifests as a pan-nuclear fiber-granule network. NuMat consists of ribonucleoprotein complexes, members of crucial nuclear functional modules, and DNA fragments. Although NuMat captures the organization of non-chromatin nuclear space, very little is known about component organization within NuMat. To understand the organization of NuMat components, we subfractionated it with increasing concentrations of the chaotrope Guanidinium Hydrochloride (GdnHCl) and analyzed the proteomic makeup of the fractions. We observe that the solubilization of proteins at different concentrations of GdnHCl is finite and independent of the broad biophysical properties of the protein sequences. Looking at the extraction pattern of the Nuclear Envelope and Nuclear Pore Complex, we surmise that this fractionation represents easily-solubilized/loosely-bound and difficultly-solubilized/tightly-bound components of NuMat. Microscopic analyses of the localization of key NuMat proteins across sequential GdnHCl extractions of in situ NuMat further elaborate on the divergent extraction patterns. Furthermore, we solubilized NuMat in 8M GdnHCl and upon removal of GdnHCl through dialysis, en masse renaturation leads to RNA-dependent self-assembly of fibrous structures. The major proteome component of the self-assembled fibers comes from the difficultly-solubilized, tightly-bound component. This fractionation of the NuMat reveals different organizational levels within it which may reflect the structural and functional organization of nuclear architecture.
0

Patterns of microsatellite distribution reflect the evolution of biological complexity

Surabhi Srivastava et al.Jan 25, 2018
Microsatellites, also known as Simple Sequence Repeats (SSRs), are evolutionarily conserved repeat elements distributed non-randomly in all genomes. Many studies have investigated their pattern of occurrence in order to understand their role, but their identification has largely been non-exhaustive and limited to a few related species or model organisms. Here, we identify ~685 million microsatellites from 719 eukaryotes and analyze their evolutionary trends from protists to mammals. We document novel patterns uniquely demarcating closely related species, including in pathogens like Leishmania as well as in higher organisms such as Drosophila, birds, primates, and cereal crops. The distribution of SSRs in coding and non-coding regions reveals taxon-specific variations in their exonic, intronic and intergenic densities. We also show that specific SSRs accumulate at longer lengths in higher organisms indicating an evolutionary selection pressure. In general, we observe greater constraints in the SSR composition of multicellular organisms with complex cell types, while simpler organisms show more diversity. The conserved microsatellite trends and species-specific signatures identified in this study closely mirror phylogenetic relationships and we hypothesize that SSRs are integral components in speciation and the evolution of organismal complexity. The microsatellite dataset generated in this work provides a large number of candidates for functional analysis and unparalleled scope for understanding their roles across the evolutionary landscape.