CK
Chiea Khor
Author with expertise in Genomic Studies and Association Analyses
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
9
(44% Open Access)
Cited by:
27
h-index:
37
/
i10-index:
73
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
3

A Saturated Map of Common Genetic Variants Associated with Human Height from 5.4 Million Individuals of Diverse Ancestries

Loïc Yengo et al.Jan 10, 2022
+569
C
T
L
ABSTRACT Common SNPs are predicted to collectively explain 40-50% of phenotypic variation in human height, but identifying the specific variants and associated regions requires huge sample sizes. Here we show, using GWAS data from 5.4 million individuals of diverse ancestries, that 12,111 independent SNPs that are significantly associated with height account for nearly all of the common SNP-based heritability. These SNPs are clustered within 7,209 non-overlapping genomic segments with a median size of ~90 kb, covering ~21% of the genome. The density of independent associations varies across the genome and the regions of elevated density are enriched for biologically relevant genes. In out-of-sample estimation and prediction, the 12,111 SNPs account for 40% of phenotypic variance in European ancestry populations but only ~10%-20% in other ancestries. Effect sizes, associated regions, and gene prioritization are similar across ancestries, indicating that reduced prediction accuracy is likely explained by linkage disequilibrium and allele frequency differences within associated regions. Finally, we show that the relevant biological pathways are detectable with smaller sample sizes than needed to implicate causal genes and variants. Overall, this study, the largest GWAS to date, provides an unprecedented saturated map of specific genomic regions containing the vast majority of common height-associated variants.
3
Citation16
0
Save
0

The Trans-Ancestral Genomic Architecture of Glycaemic Traits

Ji Chen et al.Jul 25, 2020
+411
J
T
J
Abstract Glycaemic traits are used to diagnose and monitor type 2 diabetes, and cardiometabolic health. To date, most genetic studies of glycaemic traits have focused on individuals of European ancestry. Here, we aggregated genome-wide association studies in up to 281,416 individuals without diabetes (30% non-European ancestry) with fasting glucose, 2h-glucose post-challenge, glycated haemoglobin, and fasting insulin data. Trans-ancestry and single-ancestry meta-analyses identified 242 loci (99 novel; P <5×10 -8 ), 80% with no significant evidence of between-ancestry heterogeneity. Analyses restricted to European ancestry individuals with equivalent sample size would have led to 24 fewer new loci. Compared to single-ancestry, equivalent sized trans-ancestry fine-mapping reduced the number of estimated variants in 99% credible sets by a median of 37.5%. Genomic feature, gene-expression and gene-set analyses revealed distinct biological signatures for each trait, highlighting different underlying biological pathways. Our results increase understanding of diabetes pathophysiology by use of trans-ancestry studies for improved power and resolution.
0
Citation10
0
Save
57

A multi-layer functional genomic analysis to understand noncoding genetic variation in lipids

Shweta Ramdas et al.Dec 8, 2021
+535
S
J
S
Abstract A major challenge of genome-wide association studies (GWAS) is to translate phenotypic associations into biological insights. Here, we integrate a large GWAS on blood lipids involving 1.6 million individuals from five ancestries with a wide array of functional genomic datasets to discover regulatory mechanisms underlying lipid associations. We first prioritize lipid-associated genes with expression quantitative trait locus (eQTL) colocalizations, and then add chromatin interaction data to narrow the search for functional genes. Polygenic enrichment analysis across 697 annotations from a host of tissues and cell types confirms the central role of the liver in lipid levels, and highlights the selective enrichment of adipose-specific chromatin marks in high-density lipoprotein cholesterol and triglycerides. Overlapping transcription factor (TF) binding sites with lipid-associated loci identifies TFs relevant in lipid biology. In addition, we present an integrative framework to prioritize causal variants at GWAS loci, producing a comprehensive list of candidate causal genes and variants with multiple layers of functional evidence. Two prioritized genes, CREBRF and RRBP1 , show convergent evidence across functional datasets supporting their roles in lipid biology.
57
Citation1
0
Save
0

Large-scale whole-genome sequencing of three diverse Asian populations in Singapore

Degang Wu et al.Aug 11, 2018
+24
A
C
D
Asian populations are currently underrepresented in human genetics research. Here we present whole-genome sequencing data of 4,810 Singaporeans from three diverse ethnic groups: 2,780 Chinese, 903 Malays, and 1,127 Indians. Despite a medium depth of 13.7X, we achieved essentially perfect (>99.8%) sensitivity and accuracy for detecting common variants and good sensitivity (>89%) for detecting extremely rare variants with <0.1% allele frequency. We found 89.2 million single-nucleotide polymorphisms (SNPs) and 9.1 million small insertions and deletions (INDELs), more than half of which have not been cataloged in dbSNP. In particular, we found 126 common deleterious mutations (MAF>0.01) that were absent in the existing public databases, highlighting the importance of local population reference for genetic diagnosis. We describe fine-scale genetic structure of Singapore populations and their relationship to worldwide populations from the 1000 Genomes Project. In addition to revealing noticeable amounts of admixture among three Singapore populations and a Malay-related novel ancestry component that has not been captured by the 1000 Genomes Project, our analysis also identified some fine-scale features of genetic structure consistent with two waves of prehistoric migration from south China to Southeast Asia. Finally, we demonstrate that our data can substantially improve genotype imputation not only for Singapore populations, but also for populations across Asia and Oceania. These results highlight the genetic diversity in Singapore and the potential impacts of our data as a resource to empower human genetics discovery in a broad geographic region.
0

A large cross-ancestry meta-analysis of genome-wide association studies identifies 69 novel risk loci for primary open-angle glaucoma and includes a genetic link with Alzheimer's disease

Puya Gharahkhani et al.Feb 3, 2020
+74
P
E
P
We conducted a large multi-ethnic meta-analysis of genome-wide association studies for primary open-angle glaucoma (POAG) on a total of 34,179 cases vs 349,321 controls, and identified 127 independent risk loci, almost doubling the number of known loci for POAG. The majority of loci have broadly consistent effect across European, Asian and African ancestries. We identify a link, both genome-wide and at specific loci, between POAG and Alzheimer's disease. Gene expression data and bioinformatic functional analyses provide further support for the functional relevance of the POAG risk genes. Several drug compounds target these risk genes and may be potential candidates for developing novel POAG treatments.
0

Neonatal genetics of gene expression reveal the origins of autoimmune and allergic disease risk

Qin Huang et al.Jun 27, 2019
+13
S
S
Q
Chronic immune-mediated diseases of adulthood often originate in early childhood. To investigate genetic associations between neonatal immunity and disease, we collected cord blood samples from a birth cohort and mapped expression quantitative trait loci (eQTLs) in resting monocytes and CD4+ T cells as well as in response to lipopolysaccharide (LPS) or phytohemagglutinin (PHA) stimulation, respectively. Cis -eQTLs were largely specific to cell type or stimulation, and response eQTLs were identified for 31% of genes with cis -eQTLs (eGenes) in monocytes and 52% of eGenes in CD4+ T cells. We identified trans -eQTLs and mapped cis regulatory factors which act as mediators of trans effects. There was extensive colocalisation of causal variants for cell type- and stimulation-specific neonatal cis -eQTLs and those of autoimmune and allergic diseases, in particular CTSH (Cathepsin H) which showed widespread colocalisation across diseases. Mendelian randomisation showed causal neonatal gene transcription effects on disease risk for BTN3A2 , HLA-C and many other genes. Our study elucidates the genetics of gene expression in neonatal conditions and cell types as well as the aetiological origins of autoimmune and allergic diseases.
10

RAPTOR: A Five-Safes approach to a secure, cloud native and serverless genomics data repository

Chih Shih et al.Oct 28, 2022
+40
S
Z
C
Abstract Genomic researchers are increasingly utilizing commercial cloud platforms (CCPs) to manage their data and analytics needs. Commercial clouds allow researchers to grow their storage and analytics capacity on demand, keeping pace with expanding project data footprints and enabling researchers to avoid large capital expenditures while paying only for IT capacity consumed by their project. Cloud computing also allows researchers to overcome common network and storage bottlenecks encountered when combining or re-analysing large datasets. However, cloud computing presents a new set of challenges. Without adequate security controls, the risk of unauthorised access may be higher for data stored on the cloud. In addition, regulators are increasingly mandating data access patterns and specific security protocols on the storage and use of genomic data to safeguard rights of the study participants. While CCPs provide tools for security and regulatory compliance, utilising these tools to build the necessary controls required for cloud solutions is not trivial as such skill sets are not commonly found in a genomics lab. The Research Assets Provisioning and Tracking Online Repository (RAPTOR) by the Genome Institute of Singapore is a cloud native genomics data repository and analytics platform focusing on security and regulatory compliance. Using a “five-safes” framework (Safe Purpose, Safe People, Safe Settings, Safe Data and Safe Output), RAPTOR provides security and governance controls to data contributors and users leveraging cloud computing for sharing and analysis of large genomic datasets without the risk of security breaches or running afoul of regulations. RAPTOR can also enable data federation with other genomic data repositories using GA4GH community-defined standards, allowing researchers to boost the statistical power of their work and overcome geographic and ancestry limitations of data sets
1

Variation in predicted COVID-19 risk among lemurs and lorises

Amanda Melin et al.Feb 3, 2021
+31
R
G
A
Abstract The novel coronavirus SARS-CoV-2, which in humans leads to the disease COVID-19, has caused global disruption and more than 1.5 million fatalities since it first emerged in late 2019. As we write, infection rates are currently at their highest point globally and are rising extremely rapidly in some areas due to more infectious variants. The primary viral target is the cellular receptor angiotensin-converting enzyme-2 (ACE2). Recent sequence analyses of the ACE2 gene predicts that many nonhuman primates are also likely to be highly susceptible to infection. However, the anticipated risk is not equal across the Order. Furthermore, some taxonomic groups show high ACE2 amino acid conservation, while others exhibit high variability at this locus. As an example of the latter, analyses of strepsirrhine primate ACE2 sequences to date indicate large variation among lemurs and lorises compared to other primate clades despite low sampling effort. Here, we report ACE2 gene and protein sequences for 71 individual strepsirrhines, spanning 51 species and 19 genera. Our study reinforces previous results and finds additional variability in other strepsirrhine species, and suggests several clades of lemurs have high potential susceptibility to SARS-CoV-2 infection. Troublingly, some species, including the rare and Endangered aye-aye ( Daubentonia madagascariensis ), as well as those in the genera Avahi and Propithecus , may be at high risk. Given that lemurs are endemic to Madagascar and among the primates at highest risk of extinction globally, further understanding of the potential threat of COVID-19 to their health should be a conservation priority. All feasible actions should be taken to limit their exposure to SARS-CoV-2.
0

Recurrent PD-L1 Structural Rearrangements in Natural Killer/T Cell Lymphoma Patients with Complete Response to PD-1 Blockade Therapy

Jing Lim et al.Jul 19, 2018
+47
Q
T
J
Natural killer/ T-cell lymphoma (NKTL) patients failing L-asparaginase regimens have extremely poor treatment outcomes. Previous case series showed promising activity when relapsed or refractory NKTL patients were treated with anti-programmed death 1 (PD1) inhibitors. Here, we continue to unravel the molecular profiles with whole-genome sequencing (WGS) on an extended cohort of 11 pembrolizumab-treated patients (median age at diagnosis, 42 years; range, 27-66 years) with a median follow-up of 11 months (range, 2 - 25 months) since starting anti-PD1 therapy. Seven patients achieved complete response (CR) and four patients had progressive disease (PD). Using WGS, we found structural rearrangements of the PD-L1 gene, JAK3-activating mutations and ARID1B homozygous insertion in four, two and one of the CR patient's tumors, respectively. Interesting, these alterations, especially PD-L1 rearrangements, were absent in the four PD cases. Expression of PD1 ligand (PD-L1) was strong in nine patients (5 CR and 4 PD cases) and weak in two patients (both CR). PD1 blockade with pembrolizumab was a potent strategy for NKTL patients and genomic screening could potentially accompany PD-L1 immunohistochemical screening to better select patients for anti-PD1 therapy.