NS
Nicholas Schork
Author with expertise in Genomic Studies and Association Analyses
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
13
(38% Open Access)
Cited by:
27
h-index:
25
/
i10-index:
64
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

Detecting boolean asymmetric relationships with a loop counting technique and its implications for analyzing heterogeneity within gene expression datasets

Haosheng Zhou et al.Aug 5, 2022
Abstract Many traditional methods for analyzing gene-gene relationships focus on positive and negative correlations, both of which are a kind of ‘symmetric’ relationship. Biclustering is one such technique that typically searches for subsets of genes exhibiting correlated expression among a subset of samples. However, genes can also exhibit ‘asymmetric’ relationships, such as ‘if-then’ relationships used in boolean circuits. In this paper we develop a very general method that can be used to detect biclusters within gene-expression data that involve subsets of genes which are enriched for these ‘boolean-asymmetric’ relationships (BARs). These BAR-biclusters can correspond to heterogeneity that is driven by asymmetric gene-gene interactions, e.g., reflecting regulatory effects of one gene on another, rather than more standard symmetric interactions. Unlike typical approaches that search for BARs across the entire population, BAR-biclusters can detect asymmetric interactions that only occur among a subset of samples. We apply our method to a single-cell RNA-sequencing data-set, demonstrating that the statistically-significant BAR-biclusters indeed contain additional information not present within the more traditional ‘boolean-symmetric’-biclusters. For example, the BAR-biclusters involve different subsets of cells, and highlight different gene-pathways within the data-set. Moreover, by combining the boolean-asymmetric- and boolean-symmetric-signals, one can build linear classifiers which outperform those built using only traditional boolean-symmetric signals.
1
Citation3
0
Save
0

Genome-wide association study of 40,000 individuals identifies two novel loci associated with bipolar disorder

Liping Hou et al.Mar 22, 2016
Bipolar disorder (BD) is a genetically complex mental illness characterized by severe oscillations of mood and behavior. Genome-wide association studies (GWAS) have identified several risk loci that together account for a small portion of the heritability. To identify additional risk loci, we performed a two-stage meta-analysis of >9 million genetic variants in 9,784 bipolar disorder patients and 30,471 controls, the largest GWAS of BD to date. In this study, to increase power we used ~2,000 lithium-treated cases with a long-term diagnosis of BD from the Consortium on Lithium Genetics, excess controls, and analytic methods optimized for markers on the X-chromosome. In addition to four known loci, results revealed genome-wide significant associations at two novel loci: an intergenic region on 9p21.3 (rs12553324, p = 5.87×10-9; odds ratio = 1.12) and markers within ERBB2 (rs2517959, p = 4.53×10-9; odds ratio = 1.13). No significant X-chromosome associations were detected and X-linked markers explained very little BD heritability. The results add to a growing list of common autosomal variants involved in BD and illustrate the power of comparing well-characterized cases to an excess of controls in GWAS.
0

Pan-Cancer Analysis Reveals Technical Artifacts in The Cancer Genome Atlas (TCGA) Germline Variant Calls

Alexandra Buckley et al.Dec 7, 2016
The degree to which germline variation drives cancer development and shapes tumor phenotypes remains largely unexplored, possibly due to a lack of large scale publicly available germline data for a cancer cohort. Here we called germline variants on 9,618 cases from The Cancer Genome Atlas (TCGA) database representing 31 cancer types. We identified batch effects affecting loss of function (LOF) variant calls that can be traced back to differences in the way the sequence data were generated both within and across cancer types. Overall, LOF indel calls were more sensitive to technical artifacts than LOF Single Nucleotide Variant (SNV) calls. In particular, whole genome amplification of DNA prior to sequencing led to an artificially increased burden of LOF indel calls, which confounded association analyses relating germline variants to tumor type despite stringent indel filtering strategies. Due to the inherent noise we chose to remove all 614 amplified DNA samples, including all acute myeloid leukemia and virtually all ovarian cancer samples, from the final dataset. This study demonstrates how insufficient quality control can lead to false positive germline-tumor type associations and draws attention to the need to be sensitive to problems associated with a lack of uniformity in data generation in TCGA data.
0

RASLseqTools: open-source methods for designing and analyzing RNA-mediated oligonucleotide Annealing, Selection, and, Ligation sequencing (RASL-seq) experiments

Erick Scott et al.Jan 7, 2016
RNA-mediated oligonucleotide Annealing, Selection, and Ligation (RASL-seq) is a method to measure the expression of hundreds of genes in thousands of samples for a fraction of the cost of competing methods. However, enzymatic inefficiencies of the original protocol and the lack of open source software to design and analyze RASL-seq experiments have limited its widespread adoption. We recently reported an Rnl2-based RASL-seq protocol (RRASL-seq) that offers improved ligation efficiency and a probe decoy strategy to optimize sequencing usage. Here, we describe an open source software package, RASLseqTools, that provides computational methods to design and analyze RASL-seq experiments. Furthermore, using data from a large RRASL-seq experiment, we demonstrate how normalization methods can be used for characterizing and correcting experimental, sequencing, and alignment error. We provide evidence that the three principal predictors of RRASL-seq reproducibility are barcode/probe sequence dissimilarity, sequencing read depth, and normalization strategy. Using dozens of technical and biological replicates across multiple 384-well plates, we find simple normalization strategies yield similar results to more statistically complex methods.
0

Shared Genetic Risk between Eating Disorder- and Substance-Use-Related Phenotypes: Evidence from Genome-Wide Association Studies

Melissa Munn‐Chernoff et al.Aug 23, 2019
Eating disorders and substance use disorders frequently co-occur. Twin studies reveal shared genetic variance between liabilities to eating disorders and substance use, with the strongest associations between symptoms of bulimia nervosa (BN) and problem alcohol use (genetic correlation [rg], twin-based=0.23-0.53). We estimated the genetic correlation between eating disorder and substance use and disorder phenotypes using data from genome-wide association studies (GWAS). Four eating disorder phenotypes (anorexia nervosa [AN], AN with binge-eating, AN without binge-eating, and a BN factor score), and eight substance-use-related phenotypes (drinks per week, alcohol use disorder [AUD], smoking initiation, current smoking, cigarettes per day, nicotine dependence, cannabis initiation, and cannabis use disorder) from eight studies were included. Significant genetic correlations were adjusted for variants associated with major depressive disorder (MDD). Total sample sizes per phenotype ranged from ~2,400 to ~537,000 individuals. We used linkage disequilibrium score regression to calculate single nucleotide polymorphism-based genetic correlations between eating disorder and substance-use-related phenotypes. Significant positive genetic associations emerged between AUD and AN (rg=0.18; false discovery rate q=0.0006), cannabis initiation and AN (rg=0.23; q<0.0001), and cannabis initiation and AN with binge-eating (rg=0.27; q=0.0016). Conversely, significant negative genetic correlations were observed between three non-diagnostic smoking phenotypes (smoking initiation, current smoking, and cigarettes per day) and AN without binge-eating (rgs=-0.19 to -0.23; qs<0.04). The genetic correlation between AUD and AN was no longer significant after co-varying for MDD loci. The patterns of association between eating disorder- and substance-use-related phenotypes highlights the potentially complex and substance-specific relationships between these behaviors.
Load More