MM
Matthew McCall
Author with expertise in Microarray Data Analysis and Gene Expression Profiling
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
24
(58% Open Access)
Cited by:
865
h-index:
24
/
i10-index:
38
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

The MicroArray Quality Control (MAQC)-II study of common practices for the development and validation of microarray-based predictive models

Leming Shi et al.Jul 30, 2010
The Microarray Quality Control consortium pitted 36 teams against each other to evaluate methods for creating genomic classifiers, computational tools for interpreting gene expression profiles. The performance of the classifiers on blinded validation data—and metadata on the analytic methods—reveal the challenges facing the field. Gene expression data from microarrays are being applied to predict preclinical and clinical endpoints, but the reliability of these predictions has not been established. In the MAQC-II project, 36 independent teams analyzed six microarray data sets to generate predictive models for classifying a sample with respect to one of 13 endpoints indicative of lung or liver toxicity in rodents, or of breast cancer, multiple myeloma or neuroblastoma in humans. In total, >30,000 models were built using many combinations of analytical methods. The teams generated predictive models without knowing the biological meaning of some of the endpoints and, to mimic clinical reality, tested the models on data that had not been used for training. We found that model performance depended largely on the endpoint and team proficiency and that different approaches generated models of similar performance. The conclusions and recommendations from MAQC-II should be useful for regulatory agencies, study committees and independent investigators that evaluate methods for global gene expression analysis.
0

Basal Contamination of Sequencing: Lessons from the GTEx dataset

Tim Nieuwenhuis et al.Apr 8, 2019
Abstract One of the challenges of next generation sequencing (NGS) is read contamination. We used the Genotype-Tissue Expression (GTEx) project, a large, diverse, and robustly generated dataset, to understand the factors that contribute to contamination. We obtained GTEx datasets and technical metadata and validating RNA-Seq from other studies. Of 48 analyzed tissues in GTEx, 26 had variant co-expression clusters of four known highly expressed and pancreas-enriched genes ( PRSS1 , PNLIP , CLPS , and/or CELA3A ). Fourteen additional highly expressed genes from other tissues also indicated contamination. Sample contamination by non-native genes was associated with a sample being sequenced on the same day as a tissue that natively expressed those genes. This was highly significant for pancreas and esophagus genes (linear model, p=9.5e-237 and p=5e-260 respectively). Nine SNPs in four genes shown to contaminate non-native tissues demonstrated allelic differences between DNA-based genotypes and contaminated sample RNA-based genotypes, validating the contamination. Low-level contamination affected 4,497 (39.6%) samples (defined as 10 PRSS1 TPM). It also led ≥ to eQTL assignments in inappropriate tissues among these 18 genes. We note this type of contamination occurs widely, impacting bulk and single cell data set analysis. In conclusion, highly expressed, tissue-enriched genes basally contaminate GTEx and other datasets impacting analyses. Awareness of this process is necessary to avoid assigning inaccurate importance to low-level gene expression in inappropriate tissues and cells.
0
Citation4
0
Save
44

A curated human cellular microRNAome based on 196 primary cell types

Arun Patil et al.May 17, 2022
Abstract Background An incomplete picture of the expression distribution of microRNAs (miRNAs) across human cell types has long hindered our understanding of this important regulatory class of RNA. With the continued increase in available public small RNA sequencing datasets, there is an opportunity to more fully understand the general distribution of miRNAs at the cell level. Results From the NCBI Sequence Read Archive, we obtained 6,054 human primary cell datasets and processed 4,184 of them through the miRge3.0 small RNA-seq alignment software. This dataset was curated down, through shared miRNA expression patterns, to 2,077 samples from 196 unique cell types derived from 175 separate studies. Of 2,731 putative miRNAs listed in miRBase (v22.1), 2,452 (89.8%) were detected. Among reasonably expressed miRNAs, 108 were designated as cell specific/near specific, 59 as infrequent, 52 as frequent, 54 as near ubiquitous and 50 as ubiquitous. The complexity of cellular microRNA expression estimates recapitulates tissue expression patterns and informs on the miRNA composition of plasma. Conclusions This study represents the most complete reference, to date, of miRNA expression patterns by primary cell type. The data is available through the human cellular microRNAome track at the UCSC Genome Browser ( https://genome.ucsc.edu/cgi-bin/hgHubConnect ) and an R/Bioconductor package ( https://bioconductor.org/packages/microRNAome/ ).
44
Citation3
0
Save
5

A Model-Based Hierarchical Bayesian Approach to Sholl Analysis

Erik VonKaenel et al.Jan 23, 2023
S ummary Due to the link between microglial morphology and function, morphological changes in microglia are frequently used to identify pathological immune responses in the central nervous system. In the absence of pathology, microglia are responsible for maintaining homeostasis, and their morphology can be indicative of how the healthy brain behaves in the presence of external stimuli and genetic differences. Despite recent interest in high throughput methods for morphological analysis, Sholl analysis is still the gold standard for quantifying microglia morphology via imaging data. Often, the raw data are naturally hierarchical, minimally including many cells per image and many images per animal. However, existing methods for performing downstream inference on Sholl data rely on truncating this hierarchy so rudimentary statistical testing procedures can be used. To fill this longstanding gap, we introduce a fully parametric model-based approach for analyzing Sholl data. We generalize our model to a hierarchical Bayesian framework so that inference can be performed without aggressive reduction of otherwise very rich data. We apply our model to three real data examples and perform simulation studies comparing the proposed method with a popular alternative.
5
Citation2
0
Save
3

A systems genomics approach uncovers molecular associates of RSV severity

Matthew McCall et al.Dec 19, 2020
Globally, RSV infection results in millions of hospitalizations and thousands of deaths each year. Specific factors that contribute to disease severity, such as premature birth and certain comorbidities, are well established. Additionally, genetic variants resulting in alterations in the adaptive and innate immune response appear to be associated with RSV severity. While previous studies focused on a single aspect of the disease, we jointly modeled the association of disparate data modalities with RSV severity. To investigate the host response to respiratory syncytial virus (RSV) infection in infants, we performed a systems-level study of RSV pathophysiology, incorporating high-throughput measurements of the peripheral innate and adaptive immune systems and the airway epithelium and microbiota. Specifically, we developed and employed a novel multi-omic data integration method based on multilayered principal component analysis, penalized regression, and feature weight back-propagation. Our novel approach enabled us to identify cell type specific and shared cellular pathways associated with RSV severity. Of particular interest was the association between RSV severity, activation of pathways controlling Th17 and acute phase response signaling, and inhibition of B cell receptor signaling, which were present in both airway and immune cells. These data identify specific aspects of dysregulation between the humoral and mucosal response to RSV that may play a critical role in determining illness severity.
3
Citation1
0
Save
0

Airway Gene-Expression Classifiers for Respiratory Syncytial Virus (RSV) Disease Severity in Infants

Lu Wang et al.May 5, 2019
Background RSV infection is common in infants, with a majority of those affected displaying mild clinical symptoms. However, a substantial number of infants infected with RSV develop severe symptoms requiring hospitalization. We currently lack sensitive and specific predictors to identify a majority of those who require hospitalization.Method We used our previously described methods to define comprehensive airway gene expression profiles from 106 full-tem previously healthy RSV infected subjects during acute infection (day 1-10 of illness; 106 samples), and during the convalescence stage (day 14-28 of illness; 69 samples). All subjects were assigned a cumulative clinical illness severity score (GRSS). High throughput RNA sequencing (RNAseq) defined airway gene expression patterns in RSV infected subjects. Using AIC-based model selection, we built a sparse linear predictor of GRSS based on the expression of 41 genes (NGSS1). Using a similar statistical approach, we built an alternate predictor based upon 13 genes displaying stable expression over time (NGSS2). We evaluated predictive performance of both models using leave-one-out cross-validation analyses.Results NGSS1 is strongly correlated with the disease severity, demonstrating a naïve correlation (ρ) of ρ=0.935 and cross-validated correlation of 0.813. As a binary classifier (mild versus severe), NGSS1 correctly classifies 89.6% of the subjects following cross-validation. NGSS2 has slightly less, but comparable, prediction accuracy with a cross-validated correlation of 0.741 and cross-validated classification accuracy of 84.0%.Conclusion Airway gene expression patterns, obtained following a minimally-invasive procedure, have potential utility as prognostic biomarkers for severe infant RSV infections.
0

Cardioprotection by the mitochondrial unfolded protein response (UPRmt) is mediated by activating transcription factor 5 (ATF5)

Yves Wang et al.Jun 12, 2018
Rationale: The mitochondrial unfolded protein response (UPRmt) is a conserved signaling pathway triggered by mitochondrial dysfunction. The transcription factor ATF5 is proposed to be central to mammalian UPRmt signaling. We hypothesized that UPRmt activation may be cardioprotective against ischemia-reperfusion (IR) injury, and that this protection would require ATF5. Objective: To determine whether pharmacologic UPRmt activation protects mouse hearts from acute IR injury in an ATF5-dependent manner. Methods and Results: Loss of ATF5 did not affect baseline IR injury in an ex-vivo perfused heart model. However, in-vivo administration of the UPRmt inducers oligomycin or doxycycline 6 h prior to ex-vivo IR injury was cardioprotective. Such protection was absent in hearts from Atf5-/- mice, as well as in hearts given doxycycline only during ex-vivo perfusion. Genes encoding known UPRmt-linked chaperones exhibited modest but significant cardiac induction by oligomycin after 6 h. In addition, cardiac gene expression analysis by RNA-Seq revealed mild induction of numerous genes in an ATF5-dependent manner, which may be important for cardioprotection. Conclusion: ATF5 is required for cardioprotection induced by drugs that activate the UPRmt.
0

In vivo imaging of the kinetics of microglial self-renewal and maturation in the adult visual cortex

Monique Mendes et al.Mar 6, 2020
Microglia are the resident immune cells in the brain with the capacity to autonomously self-renew. Under basal conditions, microglial self-renewal appears to be slow and stochastic, although microglia have the ability to proliferate very rapidly following depletion or in response to injury. Because microglial self-renewal has largely been studied using static tools, the mechanisms and kinetics by which microglia renew and acquire mature characteristics in the adult brain are not well understood. Using chronic in vivo two-photon imaging in awake mice and PLX5622 (Colony stimulating factor 1 receptor (CSF1R) inhibitor) to deplete microglia, we set out to understand the dynamic self-organization and maturation of microglia following depletion in the visual cortex. We confirm that under basal conditions, cortical microglia show limited turnover and migration. Following depletion, however, microglial repopulation is remarkably rapid and is sustained by the dynamic division of the remaining microglia in a manner that is largely independent of signaling through the P2Y12 receptor. Mathematical modeling of microglial division demonstrates that the observed division rates can account for the rapid repopulation observed in vivo . Additionally, newly-born microglia resemble mature microglia, in terms of their morphology, dynamics and ability to respond to injury, within days of repopulation. Our work suggests that microglia rapidly self-renew locally, without the involvement of a special progenitor cell, and that newly born microglia do not recapitulate a slow developmental maturation but instead quickly take on mature roles in the nervous system.Graphical Abstract (a) Microglial dynamics during control condition. Cartoon depiction of the heterogenous microglia in the visual cortex equally spaced. (b) During the early stages of repopulation, microglia are irregularly spaced and sparse. (c) During the later stages of repopulation, the number of microglia and the spatial distribution return to baseline. (d-f) We then created and ran a mathematical model that sampled the number of microglia, (d) the persistent doublets, (e) the rapid divisions of microglia and (f) the secondary divisions of microglia during the peak of repopulation day 2-day 3. The mathematical model suggested that residual microglia can account for the rapid repopulation we observed in vivo. ![Figure][1] [1]: pending:yes
Load More