AG
Anna Goldenberg
Author with expertise in Analysis of Gene Interaction Networks
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
20
(60% Open Access)
Cited by:
6,425
h-index:
41
/
i10-index:
115
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

A Survey of Statistical Network Models

Anna GoldenbergJan 1, 2009
Networks are ubiquitous in science and have become a focal point for discussion in everyday life. Formal statistical models for the analysis of data have emerged as a major topic of interest in diverse areas of study, and most of these involve a form of graphical representation. Probability models on graphs date back to 1959. Along with empirical studies in social psychology and sociology from the 1960s, these early works generated an active network community and a substantial literature in the 1970s. This effort moved into the statistical literature in the late 1970s and 1980s, and the past decade has seen a burgeoning literature in statistical physics and computer science. The growth of the World Wide Web and the emergence of online networking such as Facebook, MySpace, and LinkedIn, and a host of more specialized professional communities has intensified interest in the study of networks and data. Our goal in this review is to provide the reader with an entry point to this burgeoning literature. We begin with an overview of the historical development of statistical modeling and then we introduce a number of examples that have been studied in the literature. Our subsequent discussion focuses on a number of prominent static and dynamic models and their interconnections. We emphasize formal model descriptions, and pay special attention to the interpretation of parameters and their estimation. We end with a description of some open problems and challenges for machine learning and statistics.
1

Sensitive tumour detection and classification using plasma cell-free DNA methylomes

Shu Shen et al.Nov 1, 2018
The use of liquid biopsies for cancer detection and management is rapidly gaining prominence1. Current methods for the detection of circulating tumour DNA involve sequencing somatic mutations using cell-free DNA, but the sensitivity of these methods may be low among patients with early-stage cancer given the limited number of recurrent mutations2-5. By contrast, large-scale epigenetic alterations-which are tissue- and cancer-type specific-are not similarly constrained6 and therefore potentially have greater ability to detect and classify cancers in patients with early-stage disease. Here we develop a sensitive, immunoprecipitation-based protocol to analyse the methylome of small quantities of circulating cell-free DNA, and demonstrate the ability to detect large-scale DNA methylation changes that are enriched for tumour-specific patterns. We also demonstrate robust performance in cancer detection and classification across an extensive collection of plasma samples from several tumour types. This work sets the stage to establish biomarkers for the minimally invasive detection, interception and classification of early-stage cancers based on plasma cell-free DNA methylation patterns.
1
Citation682
0
Save
0

A new highly penetrant form of obesity due to deletions on chromosome 16p11.2

Robin Walters et al.Feb 1, 2010
Obesity is a highly heritable disorder but the genetic associations reported to date account for only a small percentage of the inherited variation in body mass index. Two groups report deletions on chromosome16p11.2 that may explain part of the 'missing heritability' in terms of 'high-penetrance' mutations that are rare but when present are very often associated with severe obesity. This is in contrast to more common gene defects that are less closely associated with clinical symptoms. Bochukova et al. identified rare recurrent copy number variants in 300 patients with severe early-onset obesity, caused by deletions involving several genes including SH2B1, known to be involved in leptin and insulin signalling. Many of the patients also suffered neurodevelopmental disorders. Walters et al. identified deletions of at least 593 kilobases on chromosome 16p11.2 in 31 patients with a previously unrecognized type of extreme obesity. The strategy they used to identify the lesion — using small well-phenotyped cohorts of extreme phenotypes with targeted follow-up in genome-wide association studies and population cohorts — shows promise as a means of identifying 'missing heritability' in complex metabolic diseases more generally. Recently, numerous single nucleotide polymorphisms have been identified as being associated with obesity, but these loci together account for only a small fraction of the known heritable component. Here, an association is reported between rare deletions of at least 593 kilobases at 16p11.2 and a highly penetrant form of obesity. The strategy used of combining study of extreme phenotypes with targeted follow-up is promising for identifying missing heritability in obesity. Obesity has become a major worldwide challenge to public health, owing to an interaction between the Western ‘obesogenic’ environment and a strong genetic contribution1. Recent extensive genome-wide association studies (GWASs) have identified numerous single nucleotide polymorphisms associated with obesity, but these loci together account for only a small fraction of the known heritable component1. Thus, the ‘common disease, common variant’ hypothesis is increasingly coming under challenge2. Here we report a highly penetrant form of obesity, initially observed in 31 subjects who were heterozygous for deletions of at least 593 kilobases at 16p11.2 and whose ascertainment included cognitive deficits. Nineteen similar deletions were identified from GWAS data in 16,053 individuals from eight European cohorts. These deletions were absent from healthy non-obese controls and accounted for 0.7% of our morbid obesity cases (body mass index (BMI) ≥ 40 kg m-2 or BMI standard deviation score ≥ 4; P = 6.4 × 10-8, odds ratio 43.0), demonstrating the potential importance in common disease of rare variants with strong effects. This highlights a promising strategy for identifying missing heritability in obesity and other complex traits: cohorts with extreme phenotypes are likely to be enriched for rare variants, thereby improving power for their discovery. Subsequent analysis of the loci so identified may well reveal additional rare variants that further contribute to the missing heritability, as recently reported for SIM1 (ref. 3). The most productive approach may therefore be to combine the ‘power of the extreme’4 in small, well-phenotyped cohorts, with targeted follow-up in case-control and population cohorts.
0
Citation520
0
Save
0

PharmacoGx: an R package for analysis of large pharmacogenomic datasets

Петр Смирнов et al.Dec 9, 2015
Pharmacogenomics holds great promise for the development of biomarkers of drug response and the design of new therapeutic options, which are key challenges in precision medicine. However, such data are scattered and lack standards for efficient access and analysis, consequently preventing the realization of the full potential of pharmacogenomics. To address these issues, we implemented PharmacoGx, an easy-to-use, open source package for integrative analysis of multiple pharmacogenomic datasets. We demonstrate the utility of our package in comparing large drug sensitivity datasets, such as the Genomics of Drug Sensitivity in Cancer and the Cancer Cell Line Encyclopedia. Moreover, we show how to use our package to easily perform Connectivity Map analysis. With increasing availability of drug-related data, our package will open new avenues of research for meta-analysis of pharmacogenomic data.PharmacoGx is implemented in R and can be easily installed on any system. The package is available from CRAN and its source code is available from GitHub.bhaibeka@uhnresearch.ca or benjamin.haibe.kains@utoronto.caSupplementary data are available at Bioinformatics online.
0

Single-cell mapper (scMappR): using scRNA-seq to infer cell-type specificities of differentially expressed genes

Dustin Sokolowski et al.Aug 25, 2020
Abstract RNA sequencing (RNA-seq) is widely used to identify differentially expressed genes (DEGs) and reveal biological mechanisms underlying complex biological processes. RNA-seq is often performed on heterogeneous samples and the resulting DEGs do not necessarily indicate the cell types where the differential expression occurred. While single-cell RNA-seq (scRNA-seq) methods solve this problem, technical and cost constraints currently limit its widespread use. Here we present single cell Mapper (scMappR), a method that assigns cell-type specificity scores to DEGs obtained from bulk RNA-seq by integrating cell-type expression data generated by scRNA-seq and existing deconvolution methods. After benchmarking scMappR using RNA-seq data obtained from sorted blood cells, we asked if scMappR could reveal known cell-type specific changes that occur during kidney regeneration. We found that scMappR appropriately assigned DEGs to cell-types involved in kidney regeneration, including a relatively small proportion of immune cells. While scMappR can work with any user supplied scRNA-seq data, we curated scRNA-seq expression matrices for ∼100 human and mouse tissues to facilitate its use with bulk RNA-seq data alone. Overall, scMappR is a user-friendly R package that complements traditional differential expression analysis available at CRAN. Highlights scMappR integrates scRNA-seq and bulk RNA-seq to re-calibrate bulk differentially expressed genes (DEGs). scMappR correctly identified immune-cell expressed DEGs from a bulk RNA-seq analysis of mouse kidney regeneration. scMappR is deployed as a user-friendly R package available at CRAN.
0
Citation3
0
Save
Load More