KW
Kim Wong
Author with expertise in RNA Sequencing Data Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
13
(69% Open Access)
Cited by:
7,614
h-index:
42
/
i10-index:
66
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

ABySS: A parallel assembler for short read sequence data

Jared Simpson et al.Feb 27, 2009
+3
S
K
J
Widespread adoption of massively parallel deoxyribonucleic acid (DNA) sequencing instruments has prompted the recent development of de novo short read assembly algorithms. A common shortcoming of the available tools is their inability to efficiently assemble vast amounts of data generated from large-scale sequencing projects, such as the sequencing of individual human genomes to catalog natural genetic variation. To address this limitation, we developed ABySS ( A ssembly By S hort S equences), a parallelized sequence assembler. As a demonstration of the capability of our software, we assembled 3.5 billion paired-end reads from the genome of an African male publicly released by Illumina, Inc. Approximately 2.76 million contigs ≥100 base pairs (bp) in length were created with an N50 size of 1499 bp, representing 68% of the reference human genome. Analysis of these contigs identified polymorphic and novel sequences not present in the human reference assembly, which were validated by alignment to alternate human assemblies and to other primate genomes.
0
Citation3,470
0
Save
0

Mouse genomic variation and its effect on phenotypes and gene regulation

Thomas Keane et al.Sep 1, 2011
+38
P
L
T
We report genome sequences of 17 inbred strains of laboratory mice and identify almost ten times more variants than previously known. We use these genomes to explore the phylogenetic history of the laboratory mouse and to examine the functional consequences of allele-specific variation on transcript abundance, revealing that at least 12% of transcripts show a significant tissue-specific expression bias. By identifying candidate functional variants at 718 quantitative trait loci we show that the molecular nature of functional variants and their position relative to genes vary according to the effect size of the locus. These sequences provide a starting point for a new era in the functional analysis of a key model organism.
0
Citation1,511
0
Save
0

The UK10K project identifies rare variants in health and disease

Klaudia Walter et al.Sep 14, 2015
+84
J
J
K
The contribution of rare and low-frequency variants to human traits is largely unexplored. Here we describe insights from sequencing whole genomes (low read depth, 7×) or exomes (high read depth, 80×) of nearly 10,000 individuals from population-based and disease collections. In extensively phenotyped cohorts we characterize over 24 million novel sequence variants, generate a highly accurate imputation reference panel and identify novel alleles associated with levels of triglycerides (APOB), adiponectin (ADIPOQ) and low-density lipoprotein cholesterol (LDLR and RGAG1) from single-marker and rare variant aggregation tests. We describe population structure and functional annotation of rare and low-frequency variants, use the data to estimate the benefits of sequencing for association studies, and summarize lessons from disease-specific collections. Finally, we make available an extensive resource, including individual-level genetic and phenotypic data and web-based tools to facilitate the exploration of association results.
0
Citation1,084
0
Save
0

A comparative phenotypic and genomic analysis of C57BL/6J and C57BL/6N mouse strains

Michelle Simon et al.Jan 1, 2013
+66
E
E
M
The mouse inbred line C57BL/6J is widely used in mouse genetics and its genome has been incorporated into many genetic reference populations. More recently large initiatives such as the International Knockout Mouse Consortium (IKMC) are using the C57BL/6N mouse strain to generate null alleles for all mouse genes. Hence both strains are now widely used in mouse genetics studies. Here we perform a comprehensive genomic and phenotypic analysis of the two strains to identify differences that may influence their underlying genetic mechanisms.We undertake genome sequence comparisons of C57BL/6J and C57BL/6N to identify SNPs, indels and structural variants, with a focus on identifying all coding variants. We annotate 34 SNPs and 2 indels that distinguish C57BL/6J and C57BL/6N coding sequences, as well as 15 structural variants that overlap a gene. In parallel we assess the comparative phenotypes of the two inbred lines utilizing the EMPReSSslim phenotyping pipeline, a broad based assessment encompassing diverse biological systems. We perform additional secondary phenotyping assessments to explore other phenotype domains and to elaborate phenotype differences identified in the primary assessment. We uncover significant phenotypic differences between the two lines, replicated across multiple centers, in a number of physiological, biochemical and behavioral systems.Comparison of C57BL/6J and C57BL/6N demonstrates a range of phenotypic differences that have the potential to impact upon penetrance and expressivity of mutational effects in these strains. Moreover, the sequence variants we identify provide a set of candidate genes for the phenotypic differences observed between the two strains.
0
Citation437
0
Save
0

Increased HIV-1 vaccine efficacy against viruses with genetic signatures in Env V2

Morgane Rolland et al.Sep 10, 2012
+42
J
M
M
Genetic analysis of breakthrough infections in people vaccinated against HIV-1 show that vaccine efficacy increased by up to 80% against viruses carrying two mutations in Env V2, but also raises the possibility of population-level adaptation to the vaccine. A major clinical trial involving more than 16,000 volunteers, known as the RV144 trial, tested a combination of two vaccines (ALVAC-HIV and AIDSVAX B/E gp120) for its ability to prevent HIV infection, as well as for safety. The vaccine was 31% effective against HIV-1 infection, and antibodies against the HIV-1 envelope variable loop 1 and 2 (V1/V2) domain correlated inversely with infection risk. Rolland et al. present a genetic analysis of breakthrough infections in RV144 trial participants and identify signatures associated with vaccine-induced immune pressure, thereby gaining support for a causal relationship between vaccination and protection. Viral amino-acid changes at positions 169 and 181 in the second variable loop of the viral envelope are shown to be most associated with efficacy — and represent possible targets for future vaccines. The RV144 trial demonstrated 31% vaccine efficacy at preventing human immunodeficiency virus (HIV)-1 infection1. Antibodies against the HIV-1 envelope variable loops 1 and 2 (Env V1 and V2) correlated inversely with infection risk2. We proposed that vaccine-induced immune responses against V1/V2 would have a selective effect against, or sieve, HIV-1 breakthrough viruses. A total of 936 HIV-1 genome sequences from 44 vaccine and 66 placebo recipients were examined. We show that vaccine-induced immune responses were associated with two signatures in V2 at amino acid positions 169 and 181. Vaccine efficacy against viruses matching the vaccine at position 169 was 48% (confidence interval 18% to 66%; P = 0.0036), whereas vaccine efficacy against viruses mismatching the vaccine at position 181 was 78% (confidence interval 35% to 93%; P = 0.0028). Residue 169 is in a cationic glycosylated region recognized by broadly neutralizing and RV144-derived antibodies. The predicted distance between the two signature sites (21 ± 7 Å) and their match/mismatch dichotomy indicate that multiple factors may be involved in the protection observed in RV144. Genetic signatures of RV144 vaccination in V2 complement the finding of an association between high V1/V2-binding antibodies and reduced risk of HIV-1 acquisition, and provide evidence that vaccine-induced V2 responses plausibly had a role in the partial protection conferred by the RV144 regimen.
0
Citation411
0
Save
0

High-Throughput In Vivo Analysis of Gene Expression in Caenorhabditis elegans

Rebecca Hunt-Newbury et al.Aug 31, 2007
+22
R
R
R
Using DNA sequences 5′ to open reading frames, we have constructed green fluorescent protein (GFP) fusions and generated spatial and temporal tissue expression profiles for 1,886 specific genes in the nematode Caenorhabditis elegans. This effort encompasses about 10% of all genes identified in this organism. GFP-expressing wild-type animals were analyzed at each stage of development from embryo to adult. We have identified 5′ DNA regions regulating expression at all developmental stages and in 38 different cell and tissue types in this organism. Among the regulatory regions identified are sequences that regulate expression in all cells, in specific tissues, in combinations of tissues, and in single cells. Most of the genes we have examined in C. elegans have human orthologs. All the images and expression pattern data generated by this project are available at WormAtlas (http://gfpweb.aecom.yu.edu/index) and through WormBase (http://www.wormbase.org).
0
Citation383
0
Save
0

Sequence-based characterization of structural variation in the mouse genome

Binnaz Yalcin et al.Sep 1, 2011
+15
L
C
B
The laboratory mouse has become the workhorse of biomedical research. The draft sequence of the mouse reference genome was published in 2002, but some forms of variation are still poorly documented. Two papers in this issue go a long way towards filling the gaps. The generation and analysis of sequence from 17 key mouse genomes, including most of the commonly used inbred strains and their progenitors, reveal extensive genetic variation and provide insights into the molecular nature of functional variants as well as the phylogenetic history of the lab mouse. The data will be an important resource for a new era of functional analysis. The second paper describes the landscape of structural variants in the genomes of 13 classical and four wild-derived inbred mouse strains, mapping many of them to base-pair resolution. Despite their prevalence, structural variants are shown to have a relatively small impact on phenotypic variation. Structural variation is widespread in mammalian genomes1,2 and is an important cause of disease3, but just how abundant and important structural variants (SVs) are in shaping phenotypic variation remains unclear4,5. Without knowing how many SVs there are, and how they arise, it is difficult to discover what they do. Combining experimental with automated analyses, we identified 711,920 SVs at 281,243 sites in the genomes of thirteen classical and four wild-derived inbred mouse strains. The majority of SVs are less than 1 kilobase in size and 98% are deletions or insertions. The breakpoints of 160,000 SVs were mapped to base pair resolution, allowing us to infer that insertion of retrotransposons causes more than half of SVs. Yet, despite their prevalence, SVs are less likely than other sequence variants to cause gene expression or quantitative phenotypic variation. We identified 24 SVs that disrupt coding exons, acting as rare variants of large effect on gene function. One-third of the genes so affected have immunological functions.
0
Citation305
0
Save
0

Multiple laboratory mouse reference genomes define strain specific haplotypes and novel functional loci

Jingtao Lilue et al.Feb 12, 2018
+56
I
A
J
Abstract The most commonly employed mammalian model organism is the laboratory mouse. A wide variety of genetically diverse inbred mouse strains, representing distinct physiological states, disease susceptibilities, and biological mechanisms have been developed over the last century. We report full length draft de novo genome assemblies for 16 of the most widely used inbred strains and reveal for the first time extensive strain-specific haplotype variation. We identify and characterise 2,567 regions on the current Genome Reference Consortium mouse reference genome exhibiting the greatest sequence diversity between strains. These regions are enriched for genes involved in defence and immunity, and exhibit enrichment of transposable elements and signatures of recent retrotransposition events. Combinations of alleles and genes unique to an individual strain are commonly observed at these loci, reflecting distinct strain phenotypes. Several immune related loci, some in previously identified QTLs for disease response have novel haplotypes not present in the reference that may explain the phenotype. We used these genomes to improve the mouse reference genome resulting in the completion of 10 new gene structures, and 62 new coding loci were added to the reference genome annotation. Notably this high quality collection of genomes revealed a previously unannotated gene (Efcab3-like) encoding 5,874 amino acids, one of the largest known in the rodent lineage. Interestingly, Efcab3-like −/− mice exhibit severe size anomalies in four regions of the brain suggesting a mechanism of Efcab3-like regulating brain development.
0
Citation12
0
Save
51

HIRA loss transforms FH-deficient cells

Lorea Valcárcel-Jiménez et al.Jun 5, 2022
+15
D
G
L
ABSTRACT Fumarate Hydratase (FH) is a mitochondrial enzyme that catalyses the reversible hydration of fumarate to malate in the TCA cycle. Germline mutations of FH lead to HLRCC, a cancer syndrome characterised by a highly aggressive form of renal cancer( 1 ). Although HLRCC tumours metastasise rapidly, FH-deficient mice develop premalignant cysts in the kidneys, rather than carcinomas ( 2 ). How Fh1 -deficient cells overcome these tumour suppressive events during transformation is unknown. Here, we perform a genome-wide CRISPR/Cas9 screen to identify genes that, when ablated, enhance the proliferation of Fh1 -deficient cells. We found that the depletion of HIRA enhances proliferation and invasion of Fh1 -deficient cells in vitro and in vivo . Mechanistically, Hira loss enables the activation of MYC and its target genes, increasing nucleotide metabolism specifically in Fh1 -deficient cells, independent of its histone chaperone activity. These results are instrumental for understanding mechanisms of tumorigenesis in HLRCC and the development of targeted treatments for patients.
51
Citation1
0
Save
0

A screen for combination therapies in BRAF/NRAS wild type melanoma identifies nilotinib plus MEK inhibitor as a synergistic combination

Marco Ranzani et al.Sep 28, 2017
+38
A
M
M
Despite recent therapeutic advances in the management of BRAFV600-mutant melanoma, there is still a compelling need for more effective treatments for patients who developed BRAF/NRAS wild type disease. Since the activity of single targeted agents is limited by innate and acquired resistance, we performed a high-throughput drug screen using 180 drug combinations to generate over 18,000 viability curves, with the aim of identifying agents that synergise to kill BRAF/NRAS wild type melanoma cells. From this screen we observed strong synergy between the tyrosine kinase inhibitor nilotinib and MEK inhibitors and validated this combination in an independent cell line collection. We found that AXL expression was associated with synergy to the nilotinib/MEK inhibitor combination, and that both drugs work in concert to suppress pERK. This finding was supported by genome-wide CRISPR screening which revealed that resistance mechanisms converge on regulators of the MAPK pathway. Finally, we validated the synergy of nilotinib/trametinib combination in vivo using patient-derived xenografts. Our results indicate that a nilotinib/MEK inhibitor combination may represent an effective therapy in BRAF/NRAS wild type melanoma patients.
Load More