SP
Sara Pulit
Author with expertise in Genomic Studies and Association Analyses
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
27
(41% Open Access)
Cited by:
4,931
h-index:
45
/
i10-index:
74
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Whole-genome sequence variation, population structure and demographic history of the Dutch population

Laurent Beaugerie et al.Jun 29, 2014
Paul de Bakker, Cisca Wijmenga and colleagues report on The Genome of the Netherlands Project, including whole-genome sequencing of 769 individuals of Dutch ancestry from 250 parent-offspring families and construction of a phased haplotype map. Their intermediate-coverage population sequencing data set provides a complementary resource to other publicly available data sets, including the 1000 Genomes Project. Whole-genome sequencing enables complete characterization of genetic variation, but geographic clustering of rare alleles demands many diverse populations be studied. Here we describe the Genome of the Netherlands (GoNL) Project, in which we sequenced the whole genomes of 250 Dutch parent-offspring families and constructed a haplotype map of 20.4 million single-nucleotide variants and 1.2 million insertions and deletions. The intermediate coverage (∼13×) and trio design enabled extensive characterization of structural variation, including midsize events (30–500 bp) previously poorly catalogued and de novo mutations. We demonstrate that the quality of the haplotypes boosts imputation accuracy in independent samples, especially for lower frequency alleles. Population genetic analyses demonstrate fine-scale structure across the country and support multiple ancient migrations, consistent with historical changes in sea level and flooding. The GoNL Project illustrates how single-population whole-genome sequencing can provide detailed characterization of genetic variation and may guide the design of future population studies.
0
Citation672
0
Save
0

Genome-wide association analyses identify new risk variants and the genetic architecture of amyotrophic lateral sclerosis

Wouter Rheenen et al.Jul 25, 2016
Ammar Al-Chalabi, Jan Veldink and colleagues perform a genome-wide association study for amyotrophic lateral sclerosis (ALS) in 15,156 cases and 26,242 controls. They identify three new genome-wide-significant variants and establish ALS as a complex trait with a polygenic architecture, but with a distinct and important role for low-frequency variants. To elucidate the genetic architecture of amyotrophic lateral sclerosis (ALS) and find associated loci, we assembled a custom imputation reference panel from whole-genome-sequenced patients with ALS and matched controls (n = 1,861). Through imputation and mixed-model association analysis in 12,577 cases and 23,475 controls, combined with 2,579 cases and 2,767 controls in an independent replication cohort, we fine-mapped a new risk locus on chromosome 21 and identified C21orf2 as a gene associated with ALS risk. In addition, we identified MOBP and SCFD1 as new associated risk loci. We established evidence of ALS being a complex genetic trait with a polygenic architecture. Furthermore, we estimated the SNP-based heritability at 8.5%, with a distinct and important role for low-frequency variants (frequency 1–10%). This study motivates the interrogation of larger samples with full genome coverage to identify rare causal variants that underpin ALS risk.
0
Citation540
0
Save
0

HLA-B*13:01and the Dapsone Hypersensitivity Syndrome

Furen Zhang et al.Oct 23, 2013
Dapsone is used in the treatment of infections and inflammatory diseases. The dapsone hypersensitivity syndrome, which is associated with a reported mortality of 9.9%, develops in about 0.5 to 3.6% of persons treated with the drug. Currently, no tests are available to predict the risk of the dapsone hypersensitivity syndrome.We performed a genomewide association study involving 872 participants who had received dapsone as part of multidrug therapy for leprosy (39 participants with the dapsone hypersensitivity syndrome and 833 controls), using log-additive tests of single-nucleotide polymorphisms (SNPs) and imputed HLA molecules. For a replication analysis, we genotyped 24 SNPs in an additional 31 participants with the dapsone hypersensitivity syndrome and 1089 controls and performed next-generation sequencing for HLA-B and HLA-C typing at four-digit resolution in an independent series of 37 participants with the dapsone hypersensitivity syndrome and 201 controls.Genomewide association analysis showed that SNP rs2844573, located between the HLA-B and MICA loci, was significantly associated with the dapsone hypersensitivity syndrome among patients with leprosy (odds ratio, 6.18; P=3.84×10(-13)). HLA-B*13:01 was confirmed to be a risk factor for the dapsone hypersensitivity syndrome (odds ratio, 20.53; P=6.84×10(-25)). The presence of HLA-B*13:01 had a sensitivity of 85.5% and a specificity of 85.7% as a predictor of the dapsone hypersensitivity syndrome, and its absence was associated with a reduction in risk by a factor of 7 (from 1.4% to 0.2%). HLA-B*13:01 is present in about 2 to 20% of Chinese persons, 1.5% of Japanese persons, 1 to 12% of Indians, and 2 to 4% of Southeast Asians but is largely absent in Europeans and Africans.HLA-B*13:01 was associated with the development of the dapsone hypersensitivity syndrome among patients with leprosy. (Funded by the National Natural Science Foundation of China and others.).
0
Citation271
0
Save
0

The Genome of the Netherlands: design, and project goals

Dorret Boomsma et al.May 29, 2013
Within the Netherlands a national network of biobanks has been established (Biobanking and Biomolecular Research Infrastructure-Netherlands (BBMRI-NL)) as a national node of the European BBMRI. One of the aims of BBMRI-NL is to enrich biobanks with different types of molecular and phenotype data. Here, we describe the Genome of the Netherlands (GoNL), one of the projects within BBMRI-NL. GoNL is a whole-genome-sequencing project in a representative sample consisting of 250 trio-families from all provinces in the Netherlands, which aims to characterize DNA sequence variation in the Dutch population. The parent–offspring trios include adult individuals ranging in age from 19 to 87 years (mean=53 years; SD=16 years) from birth cohorts 1910–1994. Sequencing was done on blood-derived DNA from uncultured cells and accomplished coverage was 14–15x. The family-based design represents a unique resource to assess the frequency of regional variants, accurately reconstruct haplotypes by family-based phasing, characterize short indels and complex structural variants, and establish the rate of de novo mutational events. GoNL will also serve as a reference panel for imputation in the available genome-wide association studies in Dutch and other cohorts to refine association signals and uncover population-specific variants. GoNL will create a catalog of human genetic variation in this sample that is uniquely characterized with respect to micro-geographic location and a wide range of phenotypes. The resource will be made available to the research and medical community to guide the interpretation of sequencing projects. The present paper summarizes the global characteristics of the project.
0
Citation261
0
Save
0

Loci associated with ischaemic stroke and its subtypes (SiGN): a genome-wide association study

Sara Pulit et al.Dec 19, 2015

Summary

Background

 The discovery of disease-associated loci through genome-wide association studies (GWAS) is the leading genetic approach to the identification of novel biological pathways underlying diseases in humans. Until recently, GWAS in ischaemic stroke have been limited by small sample sizes and have yielded few loci associated with ischaemic stroke. We did a large-scale GWAS to identify additional susceptibility genes for stroke and its subtypes. 

Methods

 To identify genetic loci associated with ischaemic stroke, we did a two-stage GWAS. In the first stage, we included 16 851 cases with state-of-the-art phenotyping data and 32 473 stroke-free controls. Cases were aged 16 to 104 years, recruited between 1989 and 2012, and subtypes of ischaemic stroke were recorded by centrally trained and certified investigators who used the web-based protocol, Causative Classification of Stroke (CCS). We constructed case-control strata by identifying samples that were genotyped on nearly identical arrays and were of similar genetic ancestral background. We cleaned and imputed data by use of dense imputation reference panels generated from whole-genome sequence data. We did genome-wide testing to identify stroke-associated loci within each stratum for each available phenotype, and we combined summary-level results using inverse variance-weighted fixed-effects meta-analysis. In the second stage, we did in-silico lookups of 1372 single nucleotide polymorphisms identified from the first stage GWAS in 20 941 cases and 364 736 unique stroke-free controls. The ischaemic stroke subtypes of these cases had previously been established with the Trial of Org 10 172 in Acute Stroke Treatment (TOAST) classification system, in accordance with local standards. Results from the two stages were then jointly analysed in a final meta-analysis. 

Findings

 We identified a novel locus (G allele at rs12122341) at 1p13.2 near TSPAN2 that was associated with large artery atherosclerosis-related stroke (first stage odds ratio [OR] 1·21, 95% CI 1·13–1·30, p=4·50 × 10−8; joint OR 1·19, 1·12–1·26, p=1·30 × 10−9). Our results also supported robust associations with ischaemic stroke for four other loci that have been reported in previous studies, including PITX2 (first stage OR 1·39, 1·29–1·49, p=3·26 × 10−19; joint OR 1·37, 1·30–1·45, p=2·79 × 10−32) and ZFHX3 (first stage OR 1·19, 1·11–1·27, p=2·93 × 10−7; joint OR 1·17, 1·11–1·23, p=2·29 × 10−10) for cardioembolic stroke, and HDAC9 (first stage OR 1·29, 1·18–1·42, p=3·50 × 10−8; joint OR 1·24, 1·15–1·33, p=4·52 × 10−9) for large artery atherosclerosis stroke. The 12q24 locus near ALDH2, which has previously been associated with all ischaemic stroke but not with any specific subtype, exceeded genome-wide significance in the meta-analysis of small artery stroke (first stage OR 1·20, 1·12–1·28, p=6·82 × 10−8; joint OR 1·17, 1·11–1·23, p=2·92 × 10−9). Other loci associated with stroke in previous studies, including NINJ2, were not confirmed. 

Interpretation

 Our results suggest that all ischaemic stroke-related loci previously implicated by GWAS are subtype specific. We identified a novel gene associated with large artery atherosclerosis stroke susceptibility. Follow-up studies will be necessary to establish whether the locus near TSPAN2 can be a target for a novel therapeutic approach to stroke prevention. In view of the subtype-specificity of the associations detected, the rich phenotyping data available in the Stroke Genetics Network (SiGN) are likely to be crucial for further genetic discoveries related to ischaemic stroke. 

Funding

 US National Institute of Neurological Disorders and Stroke, National Institutes of Health.
0
Citation242
0
Save
1

Ancestral diversity improves discovery and fine-mapping of genetic loci for anthropometric traits - the Hispanic/Latino Anthropometry Consortium

Lindsay Fernández‐Rhodes et al.May 29, 2021
ABSTRACT Hispanic/Latinos have been underrepresented in genome-wide association studies (GWAS) for anthropometric traits despite notable anthropometric variability with ancestry proportions, and a high burden of growth stunting and overweight/obesity in Hispanic/Latino populations. This address this knowledge gap, we analyzed densely-imputed genetic data in a sample of Hispanic/Latino adults, to identify and fine-map common genetic variants associated with body mass index (BMI), height, and BMI-adjusted waist-to-hip ratio (WHRadjBMI). We conducted a GWAS of 18 studies/consortia as part of the Hispanic/Latino Anthropometry (HISLA) Consortium (Stage 1, n=59,769) and validated our findings in 9 additional studies (HISLA Stage 2, n=9,336). We conducted a trans-ethnic GWAS with summary statistics from HISLA Stage 1 and existing consortia of European and African ancestries. In our HISLA Stage 1+2 analyses, we discovered one novel BMI locus, as well two novel BMI signals and another novel height signal, each within established anthropometric loci. In our trans-ethnic meta- analysis, we identified three additional novel BMI loci, one novel height locus, and one novel WHRadjBMI locus. We also identified three secondary signals for BMI, 28 for height, and two for WHRadjBMI. We replicated >60 established anthropometric loci in Hispanic/Latino populations at genome-wide significance—representing up to 30% of previously-reported index SNP anthropometric associations. Trans-ethnic meta-analysis of the three ancestries showed a small-to-moderate impact of uncorrected population stratification on the resulting effect size estimates. Our novel findings demonstrate that future studies may also benefit from leveraging differences in linkage disequilibrium patterns to discover novel loci and additional signals with less residual population stratification.
1
Citation2
0
Save
Load More