GH
Gisli Halldorsson
Author with expertise in Genomic Studies and Association Analyses
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
10
(80% Open Access)
Cited by:
1,217
h-index:
31
/
i10-index:
52
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

The sequences of 150,119 genomes in the UK Biobank

Bjarni Halldórsson et al.Jul 20, 2022
Detailed knowledge of how diversity in the sequence of the human genome affects phenotypic diversity depends on a comprehensive and reliable characterization of both sequences and phenotypic variation. Over the past decade, insights into this relationship have been obtained from whole-exome sequencing or whole-genome sequencing of large cohorts with rich phenotypic data1,2. Here we describe the analysis of whole-genome sequencing of 150,119 individuals from the UK Biobank3. This constitutes a set of high-quality variants, including 585,040,410 single-nucleotide polymorphisms, representing 7.0% of all possible human single-nucleotide polymorphisms, and 58,707,036 indels. This large set of variants allows us to characterize selection based on sequence variation within a population through a depletion rank score of windows along the genome. Depletion rank analysis shows that coding exons represent a small fraction of regions in the genome subject to strong sequence conservation. We define three cohorts within the UK Biobank: a large British Irish cohort, a smaller African cohort and a South Asian cohort. A haplotype reference panel is provided that allows reliable imputation of most variants carried by three or more sequenced individuals. We identified 895,055 structural variants and 2,536,688 microsatellites, groups of variants typically excluded from large-scale whole-genome sequencing studies. Using this formidable new resource, we provide several examples of trait associations for rare variants with large effects not found previously through studies based on whole-exome sequencing and/or imputation.
1
Citation274
0
Save
0

Large-scale plasma proteomics comparisons through genetics and disease associations

Grímur Eldjárn et al.Oct 4, 2023
High-throughput proteomics platforms measuring thousands of proteins in plasma combined with genomic and phenotypic information have the power to bridge the gap between the genome and diseases. Here we performed association studies of Olink Explore 3072 data generated by the UK Biobank Pharma Proteomics Project1 on plasma samples from more than 50,000 UK Biobank participants with phenotypic and genotypic data, stratifying on British or Irish, African and South Asian ancestries. We compared the results with those of a SomaScan v4 study on plasma from 36,000 Icelandic people2, for 1,514 of whom Olink data were also available. We found modest correlation between the two platforms. Although cis protein quantitative trait loci were detected for a similar absolute number of assays on the two platforms (2,101 on Olink versus 2,120 on SomaScan), the proportion of assays with such supporting evidence for assay performance was higher on the Olink platform (72% versus 43%). A considerable number of proteins had genomic associations that differed between the platforms. We provide examples where differences between platforms may influence conclusions drawn from the integration of protein levels with the study of diseases. We demonstrate how leveraging the diverse ancestries of participants in the UK Biobank helps to detect novel associations and refine genomic location. Our results show the value of the information provided by the two most commonly used high-throughput proteomics platforms and demonstrate the differences between them that at times provides useful complementarity.
0
Citation45
-1
Save
193
0

The correlation between CpG methylation and gene expression is driven by sequence variants

Ólafur Stefánsson et al.Jul 24, 2024
Gene promoter and enhancer sequences are bound by transcription factors and are depleted of methylated CpG sites (cytosines preceding guanines in DNA). The absence of methylated CpGs in these sequences typically correlates with increased gene expression, indicating a regulatory role for methylation. We used nanopore sequencing to determine haplotype-specific methylation rates of 15.3 million CpG units in 7,179 whole-blood genomes. We identified 189,178 methylation depleted sequences where three or more proximal CpGs were unmethylated on at least one haplotype. A total of 77,789 methylation depleted sequences (~41%) associated with 80,503 cis-acting sequence variants, which we termed allele-specific methylation quantitative trait loci (ASM-QTLs). RNA sequencing of 896 samples from the same blood draws used to perform nanopore sequencing showed that the ASM-QTL, that is, DNA sequence variability, drives most of the correlation found between gene expression and CpG methylation. ASM-QTLs were enriched 40.2-fold (95% confidence interval 32.2, 49.9) among sequence variants associating with hematological traits, demonstrating that ASM-QTLs are important functional units in the noncoding genome.
0
Citation2
0
Save
0

Homozygosity for a stop-gain variant in CCDC201 causes primary ovarian insufficiency

Ásmundur Oddsson et al.Aug 27, 2024
Age at menopause (AOM) has a substantial impact on fertility and disease risk. While many loci with variants that associate with AOM have been identified through genome-wide association studies (GWAS) under an additive model, other genetic models are rarely considered1. Here through GWAS meta-analysis under the recessive model of 174,329 postmenopausal women from Iceland, Denmark, the United Kingdom (UK; UK Biobank) and Norway, we study low-frequency variants with a large effect on AOM. We discovered that women homozygous for the stop-gain variant rs117316434 (A) in CCDC201 (p.(Arg162Ter), minor allele frequency ~1%) reached menopause 9 years earlier than other women (P = 1.3 × 10−15). The genotype is present in one in 10,000 northern European women and leads to primary ovarian insufficiency in close to half of them. Consequently, homozygotes have fewer children, and the age at last childbirth is 5 years earlier (P = 3.8 × 10−5). The CCDC201 gene was only found in humans in 2022 and is highly expressed in oocytes. Homozygosity for CCDC201 loss-of-function has a substantial impact on female reproductive health, and homozygotes would benefit from reproductive counseling and treatment for symptoms of early menopause. Genome-wide analysis of age at menopause under a recessive model identifies a stop-gain variant in CCDC201 associated with primary ovarian insufficiency. This homozygous genotype is present in 1 in 10,000 women of northern European ancestry.
0
Citation1
0
Save
0

Mutations in RPL3L and MYZAP increase risk of atrial fibrillation

Rósa Þórólfsdóttir et al.Nov 21, 2017
We performed a meta-analysis of genome-wide association studies on atrial fibrillation (AF) among 14,710 cases and 373,897 controls from Iceland and 14,792 cases and 393,863 controls from the UK Biobank, focusing on low frequency coding and splice mutations, with follow-up in samples from Norway and the US. We observed associations with two missense (OR=1.19 for both) and one splice-donor mutation (OR=1.52) in RPL3L, encoding a ribosomal protein primarily expressed in skeletal muscle and heart. Analysis of 167 RNA samples from the right atrium revealed that the splice donor mutation in RPL3L results in exon skipping. AF is the first disease associated with RPL3L and RPL3L is the first ribosomal gene implicated in AF. This finding is consistent with tissue specialization of ribosomal function. We also found an association with a missense variant in MYZAP (OR=1.37), encoding a component of the intercalated discs of cardiomyocytes, the organelle harbouring most of the mutated proteins involved in arrhythmogenic right ventricular cardiomyopathy. Both discoveries emphasize the close relationship between the mechanical and electrical function of the heart.