MH
Michèle Hu
Author with expertise in Pathophysiology of Parkinson's Disease
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
41
(80% Open Access)
Cited by:
11,998
h-index:
94
/
i10-index:
304
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Evolution of genes and genomes on the Drosophila phylogeny

Andrew Clark et al.Nov 1, 2007
Comparative analysis of multiple genomes in a phylogenetic framework dramatically improves the precision and sensitivity of evolutionary inference, producing more robust results than single-genome analyses can provide. The genomes of 12 Drosophila species, ten of which are presented here for the first time (sechellia, simulans, yakuba, erecta, ananassae, persimilis, willistoni, mojavensis, virilis and grimshawi), illustrate how rates and patterns of sequence divergence across taxa can illuminate evolutionary processes on a genomic scale. These genome sequences augment the formidable genetic tools that have made Drosophila melanogaster a pre-eminent model for animal genetics, and will further catalyse fundamental research on mechanisms of development, cell biology, genetics, disease, neurobiology, behaviour, physiology and evolution. Despite remarkable similarities among these Drosophila species, we identified many putatively non-neutral changes in protein-coding genes, non-coding RNA genes, and cis-regulatory regions. These may prove to underlie differences in the ecology and behaviour of these diverse species. This issue includes a landmark collection of papers on the stalwart of the genetics lab, the Drosophila fruit fly. The centrepiece is the publication by the Drosophila 12 Genomes Consortium of the genomic sequence for ten Drosophila species. The paper compares the newly sequenced genomes (sechellia, simulans, yakuba, erecta, ananassae, persimilis, willistoni, mojavensis, virilis and grimshawi species), with the two previously known sequences for D. melanogaster and D. pseudoobscura. The resulting database of genetic variation will be invaluable for the study of the forces of evolutionary change. A second major collaboration has mined the dozen Drosophila genome sequences for conserved elements, and reports the relationship between conservation and function for many specific sequence motifs. A detailed regulatory network emerges, identifying protein-coding genes and exons, RNA genes, microRNAs and their targets. These papers are discussed in News and Views. Two further research papers use the new genomic data to study gene expression, first for genes with male-biased expression and those unique to each species and second, to track the evolution of gene dosage compensation on Drosophila sex chromosomes. Four new reviews focus on how the latest work on Drosophila is taking this genetically pliant lab model into exciting new fields. Pierre Leopold and Norbert Perrimon review advances in the study of endocrinology and homeostasis that are establishing Drosophila as a model for mammalian physiology. Drosophila has proved a powerful system in which to study the pathways controlling cell shape in growing tissue, as reported by Thomas Lecuit and Loïc Le Goff. Leslie Vosshall reviews the remarkable work linking neural circuits and behaviour and John Lis reviews work on Drosophila that has rewritten the textbook view of gene transcription. The cover shows anaesthetized individuals of all twelve Drosophila species. An international consortium reports the genomic sequence for ten Drosophila species, and compares them to two other previously published Drosophila species. These data are invaluable for drawing evolutionary conclusions across an entire phylogeny of species at once.
0
Citation2,032
0
Save
0

LAGAN and Multi-LAGAN: Efficient Tools for Large-Scale Multiple Alignment of Genomic DNA

Michael Brudno et al.Mar 12, 2003
To compare entire genomes from different species, biologists increasingly need alignment methods that are efficient enough to handle long sequences, and accurate enough to correctly align the conserved biological features between distant species. We present LAGAN, a system for rapid global alignment of two homologous genomic sequences, and Multi-LAGAN, a system for multiple global alignment of genomic sequences. We tested our systems on a data set consisting of greater than 12 Mb of high-quality sequence from 12 vertebrate species. All the sequence was derived from the genomic region orthologous to an ∼1.5-Mb region on human chromosome 7q31.3. We found that both LAGAN and Multi-LAGAN compare favorably with other leading alignment methods in correctly aligning protein-coding exons, especially between distant homologs such as human and chicken, or human and fugu. Multi-LAGAN produced the most accurate alignments, while requiring just 75 minutes on a personal computer to obtain the multiple alignment of all 12 sequences. Multi-LAGAN is a practical method for generating multiple alignments of long genomic sequences at any evolutionary distance. Our systems are publicly available at http://lagan.stanford.edu .
0
Citation1,090
0
Save
0

Risk and predictors of dementia and parkinsonism in idiopathic REM sleep behaviour disorder: a multicentre study

Ronald Postuma et al.Jan 26, 2019
Idiopathic REM sleep behaviour disorder (iRBD) is a powerful early sign of Parkinson’s disease, dementia with Lewy bodies, and multiple system atrophy. This provides an unprecedented opportunity to directly observe prodromal neurodegenerative states, and potentially intervene with neuroprotective therapy. For future neuroprotective trials, it is essential to accurately estimate phenoconversion rate and identify potential predictors of phenoconversion. This study assessed the neurodegenerative disease risk and predictors of neurodegeneration in a large multicentre cohort of iRBD. We combined prospective follow-up data from 24 centres of the International RBD Study Group. At baseline, patients with polysomnographically-confirmed iRBD without parkinsonism or dementia underwent sleep, motor, cognitive, autonomic and special sensory testing. Patients were then prospectively followed, during which risk of dementia and parkinsonsim were assessed. The risk of dementia and parkinsonism was estimated with Kaplan-Meier analysis. Predictors of phenoconversion were assessed with Cox proportional hazards analysis, adjusting for age, sex, and centre. Sample size estimates for disease-modifying trials were calculated using a time-to-event analysis. Overall, 1280 patients were recruited. The average age was 66.3 ± 8.4 and 82.5% were male. Average follow-up was 4.6 years (range = 1–19 years). The overall conversion rate from iRBD to an overt neurodegenerative syndrome was 6.3% per year, with 73.5% converting after 12-year follow-up. The rate of phenoconversion was significantly increased with abnormal quantitative motor testing [hazard ratio (HR) = 3.16], objective motor examination (HR = 3.03), olfactory deficit (HR = 2.62), mild cognitive impairment (HR = 1.91–2.37), erectile dysfunction (HR = 2.13), motor symptoms (HR = 2.11), an abnormal DAT scan (HR = 1.98), colour vision abnormalities (HR = 1.69), constipation (HR = 1.67), REM atonia loss (HR = 1.54), and age (HR = 1.54). There was no significant predictive value of sex, daytime somnolence, insomnia, restless legs syndrome, sleep apnoea, urinary dysfunction, orthostatic symptoms, depression, anxiety, or hyperechogenicity on substantia nigra ultrasound. Among predictive markers, only cognitive variables were different at baseline between those converting to primary dementia versus parkinsonism. Sample size estimates for definitive neuroprotective trials ranged from 142 to 366 patients per arm. This large multicentre study documents the high phenoconversion rate from iRBD to an overt neurodegenerative syndrome. Our findings provide estimates of the relative predictive value of prodromal markers, which can be used to stratify patients for neuroprotective trials.
0

CONTRAfold: RNA secondary structure prediction without physics-based models

Michèle Hu et al.Jul 15, 2006
Abstract Motivation: For several decades, free energy minimization methods have been the dominant strategy for single sequence RNA secondary structure prediction. More recently, stochastic context-free grammars (SCFGs) have emerged as an alternative probabilistic methodology for modeling RNA structure. Unlike physics-based methods, which rely on thousands of experimentally-measured thermodynamic parameters, SCFGs use fully-automated statistical learning algorithms to derive model parameters. Despite this advantage, however, probabilistic methods have not replaced free energy minimization methods as the tool of choice for secondary structure prediction, as the accuracies of the best current SCFGs have yet to match those of the best physics-based models. Results: In this paper, we present CONTRAfold, a novel secondary structure prediction method based on conditional log-linear models (CLLMs), a flexible class of probabilistic models which generalize upon SCFGs by using discriminative training and feature-rich scoring. In a series of cross-validation experiments, we show that grammar-based secondary structure prediction methods formulated as CLLMs consistently outperform their SCFG analogs. Furthermore, CONTRAfold, a CLLM incorporating most of the features found in typical thermodynamic models, achieves the highest single sequence prediction accuracies to date, outperforming currently available probabilistic and physics-based techniques. Our result thus closes the gap between probabilistic and thermodynamic models, demonstrating that statistical learning procedures provide an effective alternative to empirical measurement of thermodynamic parameters for RNA secondary structure prediction. Availability: Source code for CONTRAfold is available at . Contact: chuongdo@cs.stanford.edu
0
Citation548
0
Save
0

Web-Based Genome-Wide Association Study Identifies Two Novel Loci and a Substantial Genetic Component for Parkinson's Disease

Michèle Hu et al.Jun 23, 2011
Although the causes of Parkinson's disease (PD) are thought to be primarily environmental, recent studies suggest that a number of genes influence susceptibility. Using targeted case recruitment and online survey instruments, we conducted the largest case-control genome-wide association study (GWAS) of PD based on a single collection of individuals to date (3,426 cases and 29,624 controls). We discovered two novel, genome-wide significant associations with PD-rs6812193 near SCARB2 (p = 7.6 × 10(-10), OR = 0.84) and rs11868035 near SREBF1/RAI1 (p = 5.6 × 10(-8), OR = 0.85)-both replicated in an independent cohort. We also replicated 20 previously discovered genetic associations (including LRRK2, GBA, SNCA, MAPT, GAK, and the HLA region), providing support for our novel study design. Relying on a recently proposed method based on genome-wide sharing estimates between distantly related individuals, we estimated the heritability of PD to be at least 0.27. Finally, using sparse regression techniques, we constructed predictive models that account for 6%-7% of the total variance in liability and that suggest the presence of true associations just beyond genome-wide significance, as confirmed through both internal and external cross-validation. These results indicate a substantial, but by no means total, contribution of genetics underlying susceptibility to both early-onset and late-onset PD, suggesting that, despite the novel associations discovered here and elsewhere, the majority of the genetic component for Parkinson's disease remains to be discovered.
0
Citation508
0
Save
0

Improved Detection of Common Variants Associated with Schizophrenia by Leveraging Pleiotropy with Cardiovascular-Disease Risk Factors

Ole Andreassen et al.Jan 31, 2013
Several lines of evidence suggest that genome-wide association studies (GWASs) have the potential to explain more of the “missing heritability” of common complex phenotypes. However, reliable methods for identifying a larger proportion of SNPs are currently lacking. Here, we present a genetic-pleiotropy-informed method for improving gene discovery with the use of GWAS summary-statistics data. We applied this methodology to identify additional loci associated with schizophrenia (SCZ), a highly heritable disorder with significant missing heritability. Epidemiological and clinical studies suggest comorbidity between SCZ and cardiovascular-disease (CVD) risk factors, including systolic blood pressure, triglycerides, low- and high-density lipoprotein, body mass index, waist-to-hip ratio, and type 2 diabetes. Using stratified quantile-quantile plots, we show enrichment of SNPs associated with SCZ as a function of the association with several CVD risk factors and a corresponding reduction in false discovery rate (FDR). We validate this “pleiotropic enrichment” by demonstrating increased replication rate across independent SCZ substudies. Applying the stratified FDR method, we identified 25 loci associated with SCZ at a conditional FDR level of 0.01. Of these, ten loci are associated with both SCZ and CVD risk factors, mainly triglycerides and low- and high-density lipoproteins but also waist-to-hip ratio, systolic blood pressure, and body mass index. Together, these findings suggest the feasibility of using genetic-pleiotropy-informed methods for improving gene discovery in SCZ and identifying potential mechanistic relationships with various CVD risk factors. Several lines of evidence suggest that genome-wide association studies (GWASs) have the potential to explain more of the “missing heritability” of common complex phenotypes. However, reliable methods for identifying a larger proportion of SNPs are currently lacking. Here, we present a genetic-pleiotropy-informed method for improving gene discovery with the use of GWAS summary-statistics data. We applied this methodology to identify additional loci associated with schizophrenia (SCZ), a highly heritable disorder with significant missing heritability. Epidemiological and clinical studies suggest comorbidity between SCZ and cardiovascular-disease (CVD) risk factors, including systolic blood pressure, triglycerides, low- and high-density lipoprotein, body mass index, waist-to-hip ratio, and type 2 diabetes. Using stratified quantile-quantile plots, we show enrichment of SNPs associated with SCZ as a function of the association with several CVD risk factors and a corresponding reduction in false discovery rate (FDR). We validate this “pleiotropic enrichment” by demonstrating increased replication rate across independent SCZ substudies. Applying the stratified FDR method, we identified 25 loci associated with SCZ at a conditional FDR level of 0.01. Of these, ten loci are associated with both SCZ and CVD risk factors, mainly triglycerides and low- and high-density lipoproteins but also waist-to-hip ratio, systolic blood pressure, and body mass index. Together, these findings suggest the feasibility of using genetic-pleiotropy-informed methods for improving gene discovery in SCZ and identifying potential mechanistic relationships with various CVD risk factors.
0
Citation455
0
Save
0

Glocal alignment: finding rearrangements during alignment

Michael Brudno et al.Jul 3, 2003
Abstract Motivation: To compare entire genomes from different species, biologists increasingly need alignment methods that are efficient enough to handle long sequences, and accurate enough to correctly align the conserved biological features between distant species. The two main classes of pairwise alignments are global alignment, where one string is transformed into the other, and local alignment, where all locations of similarity between the two strings are returned. Global alignments are less prone to demonstrating false homology as each letter of one sequence is constrained to being aligned to only one letter of the other. Local alignments, on the other hand, can cope with rearrangements between non-syntenic, orthologous sequences by identifying similar regions in sequences; this, however, comes at the expense of a higher false positive rate due to the inability of local aligners to take into account overall conservation maps. Results: In this paper we introduce the notion of glocal alignment, a combination of global and local methods, where one creates a map that transforms one sequence into the other while allowing for rearrangement events. We present Shuffle-LAGAN, a glocal alignment algorithm that is based on the CHAOS local alignment algorithm and the LAGAN global aligner, and is able to align long genomic sequences. To test Shuffle-LAGAN we split the mouse genome into BAC-sized pieces, and aligned these pieces to the human genome. We demonstrate that Shuffle-LAGAN compares favorably in terms of sensitivity and specificity with standard local and global aligners. From the alignments we conclude that about 9% of human/mouse homology may be attributed to small rearrangements, 63% of which are duplications. Availability: Our systems, supplemental information, and the alignment of the human and mouse genomes using Shuffle-LAGAN are available at http://lagan.stanford.edu/glocal Contact: serafim@cs.stanford.edu *To whom correspondence should be addressed. †These authors contributed equally to the work.
0
Citation433
0
Save
Load More