MW
Matthias Weissensteiner
Author with expertise in RNA Sequencing Data Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
8
(63% Open Access)
Cited by:
808
h-index:
16
/
i10-index:
18
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Genomics and the challenging translation into conservation practice

Aaron Shafer et al.Dec 19, 2014
•There are few examples of genomic data being used in conservation biology. •Many uncertainties accompany genomic analyses and interpretations. •We discuss how best to deal with these uncertainties in a conservation setting. •We outline why uptake has been difficult for practitioners and offer a solution. The global loss of biodiversity continues at an alarming rate. Genomic approaches have been suggested as a promising tool for conservation practice as scaling up to genome-wide data can improve traditional conservation genetic inferences and provide qualitatively novel insights. However, the generation of genomic data and subsequent analyses and interpretations remain challenging and largely confined to academic research in ecology and evolution. This generates a gap between basic research and applicable solutions for conservation managers faced with multifaceted problems. Before the real-world conservation potential of genomic research can be realized, we suggest that current infrastructures need to be modified, methods must mature, analytical pipelines need to be developed, and successful case studies must be disseminated to practitioners. The global loss of biodiversity continues at an alarming rate. Genomic approaches have been suggested as a promising tool for conservation practice as scaling up to genome-wide data can improve traditional conservation genetic inferences and provide qualitatively novel insights. However, the generation of genomic data and subsequent analyses and interpretations remain challenging and largely confined to academic research in ecology and evolution. This generates a gap between basic research and applicable solutions for conservation managers faced with multifaceted problems. Before the real-world conservation potential of genomic research can be realized, we suggest that current infrastructures need to be modified, methods must mature, analytical pipelines need to be developed, and successful case studies must be disseminated to practitioners. a region of the genome under selection that encodes a phenotype (or is closely linked to a causative locus) with fitness consequences in a particular environment. the process of delineating and assigning function to genetic sequences. the loss of genetic diversity at neutrally evolving sites that are linked to sites under purifying selection. genes putatively underlying variation in a certain phenotype. a retrospective population genetics framework that traces genetic variants of a locus to the most recent common ancestor. Used to infer demographic parameters of population histories. uses genetic markers to help conserve biodiversity and manage species and populations. Traditional genetic markers include allozymes, microsatellites, and targeted gene sequences. uses genome-wide information to help conserve biodiversity and manage species and populations. Genomic data is derived from high-throughput sequencing technology. Relevant examples are whole genome resequencing and targeted approaches like exome sequencing, GBS, SNP genotyping, and transcriptome sequencing. a population genetics convention describing the number of breeding individuals in an ideal population that would lose genetic variation at the same rate as the observed population. DNA found in environmental samples (e.g., water, soil) that can be used in genetic or genomic analysis. This contrasts with traditional approaches that target a specific organism or tissue. the loss of genetic variants due to random sampling from one generation to the next. the process of ordering and orienting sequencing into a contiguous consensus sequence of the genome. the sequencing of a repeatable subset of the genome seeded by restriction enzyme recognition sites. Restriction site-associated DNA sequencing (RAD-seq) is another commonly used term. particular combinations of alleles at collinear positions along a stretch of DNA. the increase of genomic segments in identity by descent due to mating between closely related individuals. Results in an increase in homozygosity, potentially revealing detrimental recessive alleles with negative fitness consequences. the non-random association of alleles at two or more loci. homologous DNA sequence descended from a shared common ancestor. a region of the genome that, based on user-defined criteria (often extreme population differentiation), deviates from the rest of the entire genome. the process of genetic exchange between homologous chromosomes, often resulting in a new combination of alleles. the set of all RNA molecules transcribed from a DNA template.
0
Citation532
0
Save
7

Distinct sequencing success at non-B-DNA motifs

Matthias Weissensteiner et al.Jun 16, 2022
Abstract Modern sequencing technologies are not error-free, and might have elevated error rates at some locations of the genome. A potential cause for such elevated error rates is the formation of alternative DNA structures (non-B DNA), such as G-quadruplexes (G4s), Z-DNA, or cruciform structures, during sequencing. Approximately 13% of the human genome has the potential to form such structures, which have been previously shown to affect the activity of DNA polymerases and helicases. Here we tested whether motifs with the potential to form non-B DNA (non-B motifs) influence the sequencing success of three major sequencing technologies—Illumina, Pacific Biosciences (PacBio) HiFi, and Oxford Nanopore Technologies (ONT). We estimated sequencing success by computing the rates of single-nucleotide, insertion, and deletion errors, as well as by evaluating mean read depth and mean base quality. Overall, all technologies exhibited altered sequencing success for most non-B motif types. Single-nucleotide error rates were generally increased for G-quadruplexes (G4s) and Z-DNA motifs in all three technologies. Illumina and PacBio HiFi deletion error rates were also increased for all non-B types except for Z-DNA motifs, while in ONT they were increased substantially only for G4 motifs. Insertion error rates for non-B motifs were highly elevated in Illumina, moderately elevated in PacBio HiFi, and only slightly elevated in ONT. Using Poisson regression modeling, we evaluated how non-B DNA motifs and other factors influence sequencing error profiles. Using the error rates at non-B motifs, we developed a probabilistic approach to determine the number of false-positive single-nucleotide variants (SNVs) in different sample size and variant frequency cutoff scenarios, as well as in previously generated sequencing data sets (1000Genomes, Simons Genome Diversity Project, and gnomAD). Overall, the effect of non-B DNA on sequencing should be considered in downstream analyses, particularly in studies with limited read depth—e.g., single-cell and ancient DNA sequencing, as well as sequencing of pooled population samples—and when scoring variants with low frequency (e.g., singletons). Because each sequencing technology analyzed has a unique error profile at non-B motifs, a combination of different technologies should be considered in future sequencing studies of such motifs, to maximize accuracy.
7
Citation4
0
Save
0

Combining Individual‐Based Radio‐Tracking With Whole‐Genome Sequencing Data Reveals Candidate for Genetic Basis of Partial Migration in a Songbird

Matthias Weissensteiner et al.Jan 1, 2025
ABSTRACT Partial migration is a phenomenon where migratory and resident individuals of the same species co‐exist within a population, and has been linked to both intrinsic (e.g., genetic) as well as environmental factors. Here we investigated the genomic architecture of partial migration in the common blackbird, a songbird that comprises resident populations in the southern distribution range, partial migratory populations in central Europe, and exclusively migratory populations in northern and eastern Europe. We generated whole‐genome sequencing data for 60 individuals, each of which was phenotyped for migratory behavior using radio‐telemetry tracking. These individuals were sampled across the species' distribution range, including resident populations (Spain and France), obligate migrants (Russia), and a partial migratory population with equal numbers of migratory and resident individuals in Germany. We estimated genetic differentiation (F ST ) of single‐nucleotide variants (SNVs) in 2.5 kb windows between all possible population and migratory phenotype combinations, and focused our characterization on birds from the partial migratory population in Germany. Despite overall low differentiation within the partial migratory German population, we identified several outlier regions with elevated differentiation on four distinct chromosomes. The region with the highest relative and absolute differentiation was located on chromosome 9, overlapping PER2 , which has previously been shown to be involved in the control of the circadian rhythm across vertebrates. While this region showed high levels of differentiation, no fixed variant could be identified, supporting the notion that a complex phenotype such as migratory behavior is likely controlled by a large number of genetic loci.