MD
Mark Daly
Author with expertise in Standards and Guidelines for Genetic Variant Interpretation
Massachusetts General Hospital, Harvard University, Broad Institute
+ 11 more
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
95
(20% Open Access)
Cited by:
6,674
h-index:
210
/
i10-index:
661
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
4

Initial sequencing and comparative analysis of the mouse genome

R Waterston et al.Dec 16, 2023
+219
E
K
R
The sequence of the mouse genome is a key informational tool for understanding the contents of the human genome and a key experimental tool for biomedical research. Here, we report the results of an international collaboration to produce a high-quality draft sequence of the mouse genome. We also present an initial comparative analysis of the mouse and human genomes, describing some of the insights that can be gleaned from the two sequences. We discuss topics including the analysis of the evolutionary forces shaping the size, structure and sequence of the genomes; the conservation of large-scale synteny across most of the genomes; the much lower extent of sequence orthology covering less than half of the genomes; the proportions of the genomes under selection; the number of protein-coding genes; the expansion of gene families related to reproduction and immunity; the evolution of proteins; and the identification of intraspecies polymorphism.
4
Paper
Citation6,592
1
Save
0

Comparative genetic architectures of schizophrenia in East Asian and European populations

Max Lam et al.May 6, 2020
+55
Z
C
M
Author summary Schizophrenia is a severe psychiatric disorder with a lifetime risk of about 1% world-wide. Most large schizophrenia genetic studies have studied people of primarily European ancestry, potentially missing important biological insights. Here we present a study of East Asian participants (22,778 schizophrenia cases and 35,362 controls), identifying 21 genome-wide significant schizophrenia associations in 19 genetic loci. Over the genome, the common genetic variants that confer risk for schizophrenia have highly similar effects in those of East Asian and European ancestry (r g =0.98), indicating for the first time that the genetic basis of schizophrenia and its biology are broadly shared across these world populations. A fixed-effect meta-analysis including individuals from East Asian and European ancestries revealed 208 genome-wide significant schizophrenia associations in 176 genetic loci (53 novel). Trans-ancestry fine-mapping more precisely isolated schizophrenia causal alleles in 70% of these loci. Despite consistent genetic effects across populations, polygenic risk models trained in one population have reduced performance in the other, highlighting the importance of including all major ancestral groups with sufficient sample size to ensure the findings have maximum relevance for all populations.
1

Genome-wide maps of enhancer regulation connect risk variants to disease genes

Joseph Nasser et al.Oct 24, 2023
+27
C
D
J
Abstract Genome-wide association studies have now identified tens of thousands of noncoding loci associated with human diseases and complex traits, each of which could reveal insights into biological mechanisms of disease. Many of the underlying causal variants are thought to affect enhancers, but we have lacked genome-wide maps of enhancer-gene regulation to interpret such variants. We previously developed the Activity-by-Contact (ABC) Model to predict enhancer-gene connections and demonstrated that it can accurately predict the results of CRISPR perturbations across several cell types. Here, we apply this ABC Model to create enhancer-gene maps in 131 cell types and tissues, and use these maps to interpret the functions of fine-mapped GWAS variants. For inflammatory bowel disease (IBD), causal variants are >20-fold enriched in enhancers in particular cell types, and ABC outperforms other regulatory methods at connecting noncoding variants to target genes. Across 72 diseases and complex traits, ABC links 5,036 GWAS signals to 2,249 unique genes, including a class of 577 genes that appear to influence multiple phenotypes via variants in enhancers that act in different cell types. Guided by these variant-to-function maps, we show that an enhancer containing an IBD risk variant regulates the expression of PPIF to tune mitochondrial membrane potential. Together, our study reveals insights into principles of genome regulation, illuminates mechanisms that influence IBD, and demonstrates a generalizable strategy to connect common disease risk variants to their molecular and cellular functions.
1
Citation10
0
Save
0

Mapping and characterization of structural variation in 17,795 human genomes

Haley Abel et al.Sep 14, 2024
+97
A
D
H
0

Geographic variation and bias in polygenic scores of complex diseases and traits in Finland

Sini Kerminen et al.May 7, 2020
+9
J
A
S
Abstract Polygenic scores (PS) are becoming a useful tool to identify individuals with high genetic risk for complex diseases and several projects are currently testing their utility for translational applications. It is also tempting to use PS to assess whether genetic variation can explain a part of the geographic distribution of a phenotype. However, it is not well known how population genetic properties of the training and target samples affect the geographic distribution of PS. Here, we evaluate geographic differences, and related biases, of PS in Finland with geographically well-defined sample of 2,376 individuals from the National FINRISK study. First, we detect geographic differences in PS for coronary artery disease (CAD), rheumatoid arthritis, schizophrenia, waits-hip ratio (WHR), body-mass index (BMI) and height, but not for Crohn’s disease or ulcerative colitis. Second, we use height as a model trait to thoroughly assess the possible population genetic biases in PS and apply similar approaches to the other phenotypes. Most importantly, we detect suspiciously large accumulation of geographic differences for CAD, WHR, BMI and height, suggesting bias arising from population genetic structure rather than from a direct genotype-phenotype association. This work demonstrates how sensitive the geographic patterns of current PS are for small biases even within relatively homogenous populations and provides simple tools to identify such biases. A thorough understanding of the effects of population genetic structure on PS is essential for translational applications of PS.
0
Paper
Citation9
0
Save
0

New mutations, old statistical challenges

Jeffrey Barrett et al.May 6, 2020
+11
K
J
J
Based on targeted sequencing of 208 genes in 11,730 neurodevelopmental disorder cases, Stessman et al. report the identification of 91 genes associated (at a False Discovery Rate [FDR] of 0.1) with autism spectrum disorders (ASD), intellectual disability (ID), and developmental delay (DD)-including what they characterize as 38 novel genes, not previously reported as connected with these diseases. If true, this would represent a substantial step forward. Unfortunately, each of the two discovery analyses (1. De novo mutation analysis and, 2. a comparison of private mutations with public control data) contain critical statistical flaws. When one accounts for these problems, fewer than half of the genes - and very few, if any, of the novel findings - survive. These errors have implications for how future analyses should be conducted, for understanding the genetic basis of these disorders, and for genomic medicine.
0
Paper
Citation9
0
Save
66

Low-coverage sequencing cost-effectively detects known and novel variation in underrepresented populations

Alicia Martin et al.Oct 24, 2023
+36
S
E
A
Abstract Background Genetic studies of biomedical phenotypes in underrepresented populations identify disproportionate numbers of novel associations. However, current genomics infrastructure--including most genotyping arrays and sequenced reference panels--best serves populations of European descent. A critical step for facilitating genetic studies in underrepresented populations is to ensure that genetic technologies accurately capture variation in all populations. Here, we quantify the accuracy of low-coverage sequencing in diverse African populations. Results We sequenced the whole genomes of 91 individuals to high-coverage (≥20X) from the Neuropsychiatric Genetics of African Population-Psychosis (NeuroGAP-Psychosis) study, in which participants were recruited from Ethiopia, Kenya, South Africa, and Uganda. We empirically tested two data generation strategies, GWAS arrays versus low-coverage sequencing, by calculating the concordance of imputed variants from these technologies with those from deep whole genome sequencing data. We show that low-coverage sequencing at a depth of ≥4X captures variants of all frequencies more accurately than all commonly used GWAS arrays investigated and at a comparable cost. Lower depths of sequencing (0.5-1X) performed comparable to commonly used low-density GWAS arrays. Low-coverage sequencing is also sensitive to novel variation, with 4X sequencing detecting 45% of singletons and 95% of common variants identified in high-coverage African whole genomes. Conclusion These results indicate that low-coverage sequencing approaches surmount the problems induced by the ascertainment of common genotyping arrays, including those that capture variation most common in Europeans and Africans. Low-coverage sequencing effectively identifies novel variation (particularly in underrepresented populations), and presents opportunities to enhance variant discovery at a similar cost to traditional approaches.
66
Citation8
0
Save
0

A missense variant in Mitochondrial Amidoxime Reducing Component 1 gene and protection against liver disease

Connor Emdin et al.May 6, 2020
+26
A
M
C
Analyzing 5770 all-cause cirrhosis cases and 572,850 controls from seven cohorts, we identify a missense variant in the Mitochondrial Amidoxime Reducing Component 1 gene ( MARC1 p.A165T) that associates with protection from all-cause cirrhosis (OR 0.88, p=2.1*10 −8 ). This same variant also associates with lower levels of hepatic fat on computed tomographic imaging and lower odds of physician-diagnosed fatty liver as well as lower blood levels of alanine transaminase (−0.012 SD, 1.4*10 −8 ), alkaline phosphatase (−0.019 SD, 6.6*10 −9 ), total cholesterol (−0.037 SD, p=1*10 −18 ) and LDL cholesterol (−0.035 SD, p=7.3*10 −16 ). Carriers of rare protein-truncating variants in MARC1 had lower liver enzyme levels, cholesterol levels, and reduced odds of liver disease (OR 0.19, p= 0.04) suggesting that deficiency of the MARC1 enzyme protects against cirrhosis.
50

Epigenetic aging of classical monocytes from healthy individuals

Irina Shchukina et al.Oct 24, 2023
+25
O
J
I
ABSTRACT The impact of healthy aging on molecular programming of immune cells is poorly understood. Here, we report comprehensive characterization of healthy aging in human classical monocytes, with a focus on epigenomic, transcriptomic, and proteomic alterations, as well as the corresponding proteomic and metabolomic data for plasma, using healthy cohorts of 20 young and 20 older individuals (~27 and ~64 years old on average). For each individual, we performed eRRBS-based DNA methylation profiling, which allowed us to identify a set of age-associated differentially methylated regions (DMRs) – a novel, cell-type specific signature of aging in DNA methylome. Optimized ultra-low-input ChIP-seq (ULI-ChIP-seq) data acquisition and analysis pipelines applied to 5 chromatin marks for each individual revealed lack of large-scale age-associated changes in chromatin modifications and allowed us to link hypo- and hypermethylated DMRs to distinct chromatin modification patterns. Specifically, hypermethylation events were associated with H3K27me3 in the CpG islands near promoters of lowly-expressed genes, while hypomethylated DMRs were enriched in H3K4me1 marked regions and associated with normal pattern of expression. Furthermore, hypo- and hypermethylated DMRs followed distinct functional and genetic association patterns. Hypomethylation events were associated with age-related increase of expression of the corresponding genes, providing a link between DNA methylation and age-associated transcriptional changes in primary human cells. Furthermore, these locations were also enriched in genetic regions associated by GWAS with asthma, total blood protein, hemoglobin levels and MS. On the other side, acceleration of epigenetic age in HIV and asthma stems only from changes in hypermethylated DMRs but not from hypomethylated loci.
0

Haplotype sharing provides insights into fine-scale population history and disease in Finland

Alicia Martin et al.May 7, 2020
+24
S
K
A
Abstract Finland provides unique opportunities to investigate population and medical genomics because of its adoption of unified national electronic health records, detailed historical and birth records, and serial population bottlenecks. We assemble a comprehensive view of recent population history (≤100 generations), the timespan during which most rare disease-causing alleles arose, by comparing pairwise haplotype sharing from 43,254 Finns to geographically and linguistically adjacent countries with different population histories, including 16,060 Swedes, Estonians, Russians, and Hungarians. We find much more extensive sharing in Finns, with at least one ≥ 5 cM tract on average between pairs of unrelated individuals. By coupling haplotype sharing with fine-scale birth records from over 25,000 individuals, we find that while haplotype sharing broadly decays with geographical distance, there are pockets of excess haplotype sharing; individuals from northeast Finland share several-fold more of their genome in identity-by-descent (IBD) segments than individuals from southwest regions containing the major cities of Helsinki and Turku. We estimate recent effective population size changes over time across regions of Finland and find significant differences between the Early and Late Settlement Regions as expected; however, our results indicate more continuous gene flow than previously indicated as Finns migrated towards the northernmost Lapland region. Lastly, we show that haplotype sharing is locally enriched among pairs of individuals sharing rare alleles by an order of magnitude, especially among pairs sharing rare disease causing variants. Our work provides a general framework for using haplotype sharing to reconstruct an integrative view of recent population history and gain insight into the evolutionary origins of rare variants contributing to disease.
0
Citation3
0
Save
Load More