RI
Rafael Irizarry
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
73
(70% Open Access)
Cited by:
77,633
h-index:
96
/
i10-index:
203
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Exploration, normalization, and summaries of high density oligonucleotide array probe level data

Rafael Irizarry et al.Apr 1, 2003
In this paper we report exploratory analyses of high‐density oligonucleotide array data from the Affymetrix GeneChip® system with the objective of improving upon currently used measures of gene expression. Our analyses make use of three data sets: a small experimental study consisting of five MGU74A mouse GeneChip® arrays, part of the data from an extensive spike‐in study conducted by Gene Logic and Wyeth's Genetics Institute involving 95 HG‐U95A human GeneChip® arrays; and part of a dilution study conducted by Gene Logic involving 75 HG‐U95A GeneChip® arrays. We display some familiar features of the perfect match and mismatch probe (PM and MM) values of these data, and examine the variance–mean relationship with probe‐level data from probes believed to be defective, and so delivering noise only. We explain why we need to normalize the arrays to one another using probe level intensities. We then examine the behavior of the PM and MM using spike‐in data and assess three commonly used summary measures: Affymetrix's (i) average difference (AvDiff) and (ii) MAS 5.0 signal, and (iii) the Li and Wong multiplicative model‐based expression index (MBEI). The exploratory data analyses of the probe level data motivate a new summary measure that is a robust multi‐array average (RMA) of background‐adjusted, normalized, and log‐transformed PM values. We evaluate the four expression summary measures using the dilution study data, assessing their behavior in terms of bias, variance and (for MBEI and RMA) model fit. Finally, we evaluate the algorithms in terms of their ability to detect known levels of differential expression using the spike‐in data. We conclude that there is no obvious downside to using RMA and attaching a standard error (SE) to this quantity using a linear model which removes probe‐specific affinities.
0
0

A comparison of normalization methods for high density oligonucleotide array data based on variance and bias

Benjamin Bolstad et al.Jan 21, 2003
Abstract Motivation: When running experiments that involve multiple high density oligonucleotide arrays, it is important to remove sources of variation between arrays of non-biological origin. Normalization is a process for reducing this variation. It is common to see non-linear relations between arrays and the standard normalization provided by Affymetrix does not perform well in these situations. Results: We present three methods of performing normalization at the probe intensity level. These methods are called complete data methods because they make use of data from all arrays in an experiment to form the normalizing relation. These algorithms are compared to two methods that make use of a baseline array: a one number scaling based algorithm and a method that uses a non-linear normalizing relation by comparing the variability and bias of an expression measure. Two publicly available datasets are used to carry out the comparisons. The simplest and quickest complete data method is found to perform favorably. Availability: Software implementing all three of the complete data normalization methods is available as part of the R package Affy, which is a part of the Bioconductor project http://www.bioconductor.org. Contact: bolstad@stat.berkeley.edu. Supplementary information: Additional figures may be found at http://www.stat.berkeley.edu/~bolstad/normalize/index.html * To whom correspondence should be addressed.
0

Minfi: a flexible and comprehensive Bioconductor package for the analysis of Infinium DNA methylation microarrays

Martin Aryee et al.Jan 28, 2014
Abstract Motivation: The recently released Infinium HumanMethylation450 array (the ‘450k’ array) provides a high-throughput assay to quantify DNA methylation (DNAm) at ∼450 000 loci across a range of genomic features. Although less comprehensive than high-throughput sequencing-based techniques, this product is more cost-effective and promises to be the most widely used DNAm high-throughput measurement technology over the next several years. Results: Here we describe a suite of computational tools that incorporate state-of-the-art statistical techniques for the analysis of DNAm data. The software is structured to easily adapt to future versions of the technology. We include methods for preprocessing, quality assessment and detection of differentially methylated regions from the kilobase to the megabase scale. We show how our software provides a powerful and flexible development platform for future methods. We also illustrate how our methods empower the technology to make discoveries previously thought to be possible only with sequencing-based methods. Availability and implementation: http://bioconductor.org/packages/release/bioc/html/minfi.html. Contact: khansen@jhsph.edu; rafa@jimmy.harvard.edu Supplementary information: Supplementary data are available at Bioinformatics online.
0
Citation3,487
0
Save
0

Epigenetic memory in induced pluripotent stem cells

K. Kim et al.Jul 19, 2010
Somatic cell nuclear transfer and transcription-factor-based reprogramming revert adult cells to an embryonic state, and yield pluripotent stem cells that can generate all tissues. Through different mechanisms and kinetics, these two reprogramming methods reset genomic methylation, an epigenetic modification of DNA that influences gene expression, leading us to hypothesize that the resulting pluripotent stem cells might have different properties. Here we observe that low-passage induced pluripotent stem cells (iPSCs) derived by factor-based reprogramming of adult murine tissues harbour residual DNA methylation signatures characteristic of their somatic tissue of origin, which favours their differentiation along lineages related to the donor cell, while restricting alternative cell fates. Such an ‘epigenetic memory’ of the donor tissue could be reset by differentiation and serial reprogramming, or by treatment of iPSCs with chromatin-modifying drugs. In contrast, the differentiation and methylation of nuclear-transfer-derived pluripotent stem cells were more similar to classical embryonic stem cells than were iPSCs. Our data indicate that nuclear transfer is more effective at establishing the ground state of pluripotency than factor-based reprogramming, which can leave an epigenetic memory of the tissue of origin that may influence efforts at directed differentiation for applications in disease modelling or treatment. Induced pluripotent stem (iPS) cells are produced by reprogramming differentiated adult cells using a cocktail of transcription factors. They share many properties that are characteristic of embryonic stem (ES) cells generated by somatic-cell nuclear transfer (SCNT), and of ES cells from naturally fertilized embryos. The three cell types are not identical, however, and an interesting difference has now been discovered: iPS cells retain an 'epigenetic memory' of the donor tissue from which they derive, whereas SCNT-based reprogramming resets the DNA-methylation state of adult cells so it is closer to the ES cell-like state. In a separate study, Ji et al. examine the role of specific DNA methylation marks in the developmental progression of particular cell lineages. They present a genome-wide DNA-methylation analysis of haematopoietic cell populations that reveals remarkable epigenetic plasticity. Changes in DNA methylation emerge as perhaps a principal factor directing cell-fate choices such as commitment to myeloid or lymphoid development. Pluripotent stem cells can be generated in the laboratory through somatic cell nuclear transfer (generating nuclear transfer embryonic stem cells, ntESCs) or transcription-factor-based reprogramming (producing induced pluripotent stem cells, iPSCs). These methods reset the methylation signature of the genome — but to what extent? Here it is found that mouse iPSCs 'remember' the methylation status of their tissue of origin, but the methylation of ntESCs is more similar to that of naturally produced ES cells.
0
Citation2,145
0
Save
0

The human colon cancer methylome shows similar hypo- and hypermethylation at conserved tissue-specific CpG island shores

Rafael Irizarry et al.Jan 18, 2009
Andy Feinberg and colleagues show in a colon cancer model that most DNA methylation alterations occur in sequence regions distinct from promoters or canonical CpG islands, termed 'CpG island shores', and that this methylation is strongly related to gene expression and can discriminate tissue types regardless of species of origin. For the past 25 years, it has been known that alterations in DNA methylation (DNAm) occur in cancer, including hypomethylation of oncogenes and hypermethylation of tumor suppressor genes. However, most studies of cancer methylation have assumed that functionally important DNAm will occur in promoters, and that most DNAm changes in cancer occur in CpG islands. Here we show that most methylation alterations in colon cancer occur not in promoters, and also not in CpG islands, but in sequences up to 2 kb distant, which we term 'CpG island shores'. CpG island shore methylation was strongly related to gene expression, and it was highly conserved in mouse, discriminating tissue types regardless of species of origin. There was a notable overlap (45–65%) of the locations of colon cancer–related methylation changes with those that distinguished normal tissues, with hypermethylation enriched closer to the associated CpG islands, and hypomethylation enriched further from the associated CpG island and resembling that of noncolon normal tissues. Thus, methylation changes in cancer are at sites that vary normally in tissue differentiation, consistent with the epigenetic progenitor model of cancer, which proposes that epigenetic alterations affecting tissue-specific differentiation are the predominant mechanism by which epigenetic changes cause cancer.
0
Citation2,068
0
Save
Load More