NC
Nigel Carter
Author with expertise in Genomic Rearrangements and Copy Number Variations
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
24
(75% Open Access)
Cited by:
31,069
h-index:
67
/
i10-index:
108
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Global variation in copy number in the human genome

Richard Redon et al.Nov 1, 2006
Copy number variation (CNV) of DNA sequences is functionally significant but has yet to be fully ascertained. We have constructed a first-generation CNV map of the human genome through the study of 270 individuals from four populations with ancestry in Europe, Africa or Asia (the HapMap collection). DNA from these individuals was screened for CNV using two complementary technologies: single-nucleotide polymorphism (SNP) genotyping arrays, and clone-based comparative genomic hybridization. A total of 1,447 copy number variable regions (CNVRs), which can encompass overlapping or adjacent gains or losses, covering 360 megabases (12% of the genome) were identified in these populations. These CNVRs contained hundreds of genes, disease loci, functional elements and segmental duplications. Notably, the CNVRs encompassed more nucleotide content per genome than SNPs, underscoring the importance of CNV in genetic diversity and evolution. The data obtained delineate linkage disequilibrium patterns for many CNVs, and reveal marked variation in copy number among populations. We also demonstrate the utility of this resource for genetic disease studies. Where to next after sequencing the human genome? We want to know how human genomes differ from each other. Last year the International HapMap Project published a map of single nucleotide changes, and now an international consortium has mapped even larger areas of differences, called copy number variants (CNVs). Each CNV involves at least 1,000 base-pair differences between individuals, and they have been linked to both benign and disease-causing changes in the genome. The new map is based on analysis of DNA from 270 individuals. Over 1,400 CNVs were found, covering 12% of the genome. This makes them far more prevalent than was thought, and suggests that unless analysed for directly, these differences could be missed by present strategies used to identify genes mutated in genetic diseases. Last year the first map of single nucleotide changes was published; now an international consortium has mapped even larger areas of differences, called copy number variants. These variants are at least 1,000-base-pair differences between individual people, and have been linked to both benign and disease-causing changes in the human genome.
0
Citation4,201
0
Save
0

The zebrafish reference genome sequence and its relationship to the human genome

Kerstin Howe et al.Apr 16, 2013
A high-quality sequence assembly of the zebrafish genome reveals the largest gene set of any vertebrate and provides information on key genomic features, and comparison to the human reference genome shows that approximately 70% of human protein-coding genes have at least one clear zebrafish orthologue. The genome of the zebrafish — a key model organism for the study of development and human disease — has now been sequenced and published as a well-annotated reference genome. Zebrafish turns out to have the largest gene set of any vertebrate so far sequenced, and few pseudogenes. Importantly for disease studies, comparison between human and zebrafish sequences reveals that 70% of human genes have at least one obvious zebrafish orthologue. A second paper reports on an ongoing effort to identify and phenotype disruptive mutations in every zebrafish protein-coding gene. Using the reference genome sequence along with high-throughput sequencing and efficient chemical mutagenesis, the project's initial results — covering 38% of all known protein-coding genes — they describe phenotypic consequences of more than 1,000 alleles. The long-term goal is the creation of a knockout allele in every protein-coding gene in the zebrafish genome. All mutant alleles and data are freely available at go.nature.com/en6mos . Zebrafish have become a popular organism for the study of vertebrate gene function1,2. The virtually transparent embryos of this species, and the ability to accelerate genetic studies by gene knockdown or overexpression, have led to the widespread use of zebrafish in the detailed investigation of vertebrate gene function and increasingly, the study of human genetic disease3,4,5. However, for effective modelling of human genetic disease it is important to understand the extent to which zebrafish genes and gene structures are related to orthologous human genes. To examine this, we generated a high-quality sequence assembly of the zebrafish genome, made up of an overlapping set of completely sequenced large-insert clones that were ordered and oriented using a high-resolution high-density meiotic map. Detailed automatic and manual annotation provides evidence of more than 26,000 protein-coding genes6, the largest gene set of any vertebrate so far sequenced. Comparison to the human reference genome shows that approximately 70% of human genes have at least one obvious zebrafish orthologue. In addition, the high quality of this genome assembly provides a clearer understanding of key genomic features such as a unique repeat content, a scarcity of pseudogenes, an enrichment of zebrafish-specific genes on chromosome 4 and chromosomal regions that influence sex determination.
0
Citation4,154
1
Save
0

Accurate whole human genome sequencing using reversible terminator chemistry

David Bentley et al.Nov 1, 2008
DNA sequence information underpins genetic research, enabling discoveries of important biological or medical benefit. Sequencing projects have traditionally used long (400–800 base pair) reads, but the existence of reference sequences for the human and many other genomes makes it possible to develop new, fast approaches to re-sequencing, whereby shorter reads are compared to a reference to identify intraspecies genetic variation. Here we report an approach that generates several billion bases of accurate nucleotide sequence per experiment at low cost. Single molecules of DNA are attached to a flat surface, amplified in situ and used as templates for synthetic sequencing with fluorescent reversible terminator deoxyribonucleotides. Images of the surface are analysed to generate high-quality sequence. We demonstrate application of this approach to human genome sequencing on flow-sorted X chromosomes and then scale the approach to determine the genome sequence of a male Yoruba from Ibadan, Nigeria. We build an accurate consensus sequence from >30× average depth of paired 35-base reads. We characterize four million single-nucleotide polymorphisms and four hundred thousand structural variants, many of which were previously unknown. Our approach is effective for accurate, rapid and economical whole-genome re-sequencing and many other biomedical applications. The power of the latest massively parallel synthetic DNA sequencing technologies is demonstrated in two major collaborations that shed light on the nature of genomic variation with ethnicity. The first describes the genomic characterization of an individual from the Yoruba ethnic group of west Africa. The second reports a personal genome of a Han Chinese, the group comprising 30% of the world's population. These new resources can now be used in conjunction with the Venter, Watson and NIH reference sequences. A separate study looked at genetic ethnicity on the continental scale, based on data from 1,387 individuals from more than 30 European countries. Overall there was little genetic variation between countries, but the differences that do exist correspond closely to the geographic map. Statistical analysis of the genome data places 50% of the individuals within 310 km of their reported origin. As well as its relevance for testing genetic ancestry, this work has implications for evaluating genome-wide association studies that link genes with diseases.
0
Citation3,512
0
Save
0

Origins and functional impact of copy number variation in the human genome

Donald Conrad et al.Oct 7, 2009
Structural variations of DNA greater than 1 kilobase in size account for most bases that vary among human genomes, but are still relatively under-ascertained. Here we use tiling oligonucleotide microarrays, comprising 42 million probes, to generate a comprehensive map of 11,700 copy number variations (CNVs) greater than 443 base pairs, of which most (8,599) have been validated independently. For 4,978 of these CNVs, we generated reference genotypes from 450 individuals of European, African or East Asian ancestry. The predominant mutational mechanisms differ among CNV size classes. Retrotransposition has duplicated and inserted some coding and non-coding DNA segments randomly around the genome. Furthermore, by correlation with known trait-associated single nucleotide polymorphisms (SNPs), we identified 30 loci with CNVs that are candidates for influencing disease susceptibility. Despite this, having assessed the completeness of our map and the patterns of linkage disequilibrium between CNVs and SNPs, we conclude that, for complex traits, the heritability void left by genome-wide association studies will not be accounted for by common CNVs. Copy number variations or CNVs are a common form of genetic variation between individuals, caused by genomic rearrangements, either inherited or due to de novo mutation. A major collaborative effort using tiling oligonucleotide microarrays and HapMap samples has generated a comprehensive working map of 11,700 CNVs in the human genome. About half of these were also genotyped in individuals of different ancestry — European, African or East Asian. Thirty loci with CNVs that are candidates for influencing disease susceptibility were identified. Published online last October, this vast data set is a landmark in terms of completeness and spatial resolution, and as John Armour wrote in News & Views , is likely to stand as a definitive resource for years to come. This resource is the main focus of a new genome-wide association study, from the Wellcome Trust Case Control Consortium, of the links between common CNVs and eight common human diseases. Providing a wealth of technical insights to inform future study design and analysis, the Wellcome study also implies that common CNVs that can be genotyped using existing platforms are unlikely to have a major role in the genetic basis of common diseases. Much genetic variation among humans can be accounted for by structural DNA differences that are greater than 1 kilobase in size. Here, using tiling oligonucleotide arrays and HapMap samples, a map of 11,700 copy number variations (CNVs) bigger than 443 base pairs has been generated. About half of these CNVs were also genotyped in individuals of different ancestry. The results offer insight into the relative prevalence of mechanisms that generate CNVs, their evolution, and their contribution to complex genetic diseases.
0
Citation1,899
0
Save
0

DECIPHER: Database of Chromosomal Imbalance and Phenotype in Humans Using Ensembl Resources

Helen Firth et al.Apr 1, 2009
Many patients suffering from developmental disorders harbor submicroscopic deletions or duplications that, by affecting the copy number of dosage-sensitive genes or disrupting normal gene expression, lead to disease. However, many aberrations are novel or extremely rare, making clinical interpretation problematic and genotype-phenotype correlations uncertain. Identification of patients sharing a genomic rearrangement and having phenotypic features in common leads to greater certainty in the pathogenic nature of the rearrangement and enables new syndromes to be defined. To facilitate the analysis of these rare events, we have developed an interactive web-based database called DECIPHER (Database of Chromosomal Imbalance and Phenotype in Humans Using Ensembl Resources) which incorporates a suite of tools designed to aid the interpretation of submicroscopic chromosomal imbalance, inversions, and translocations. DECIPHER catalogs common copy-number changes in normal populations and thus, by exclusion, enables changes that are novel and potentially pathogenic to be identified. DECIPHER enhances genetic counseling by retrieving relevant information from a variety of bioinformatics resources. Known and predicted genes within an aberration are listed in the DECIPHER patient report, and genes of recognized clinical importance are highlighted and prioritized. DECIPHER enables clinical scientists worldwide to maintain records of phenotype and chromosome rearrangement for their patients and, with informed consent, share this information with the wider clinical research community through display in the genome browser Ensembl. By sharing cases worldwide, clusters of rare cases having phenotype and structural rearrangement in common can be identified, leading to the delineation of new syndromes and furthering understanding of gene function. Many patients suffering from developmental disorders harbor submicroscopic deletions or duplications that, by affecting the copy number of dosage-sensitive genes or disrupting normal gene expression, lead to disease. However, many aberrations are novel or extremely rare, making clinical interpretation problematic and genotype-phenotype correlations uncertain. Identification of patients sharing a genomic rearrangement and having phenotypic features in common leads to greater certainty in the pathogenic nature of the rearrangement and enables new syndromes to be defined. To facilitate the analysis of these rare events, we have developed an interactive web-based database called DECIPHER (Database of Chromosomal Imbalance and Phenotype in Humans Using Ensembl Resources) which incorporates a suite of tools designed to aid the interpretation of submicroscopic chromosomal imbalance, inversions, and translocations. DECIPHER catalogs common copy-number changes in normal populations and thus, by exclusion, enables changes that are novel and potentially pathogenic to be identified. DECIPHER enhances genetic counseling by retrieving relevant information from a variety of bioinformatics resources. Known and predicted genes within an aberration are listed in the DECIPHER patient report, and genes of recognized clinical importance are highlighted and prioritized. DECIPHER enables clinical scientists worldwide to maintain records of phenotype and chromosome rearrangement for their patients and, with informed consent, share this information with the wider clinical research community through display in the genome browser Ensembl. By sharing cases worldwide, clusters of rare cases having phenotype and structural rearrangement in common can be identified, leading to the delineation of new syndromes and furthering understanding of gene function. Advances in molecular cytogenetic techniques and sequencing of the human genome now enable chromosome rearrangements to be analyzed at an unprecedented level of accuracy. The resolution of conventional Giemsa-banded chromosome analysis is approximately 5–10 Mb, whereas that of a typical high-density genomic array is approximately 100 kb or less, resulting in an at least 50-fold improvement in sensitivity. With high-resolution genomic-array analysis, disorders of chromosome imbalance (copy number change) can now be identified with such precision that mapping the rearrangements onto the reference sequence of the human genome becomes a realistic proposition. Array comparative genomic hybridization (array-CGH) and genomic copy-number analysis with SNP genotyping arrays are proving particularly effective for the investigation of patients with developmental delay, learning disability, dysmorphic features, and/or congenital anomalies and are identifying the probable underlying cause of the disease phenotype in approximately 15% of previously undiagnosed cases.1Lu X. Shaw C.A. Patel A. Li J. Cooper M.L. Wells W.R. Sullivan C.M. Sahoo T. Yatsenko S.A. Bacino C.A. et al.Clinical implementation of chromosomal microarray analysis: Summary of 2513 postnatal cases.PLoS ONE. 2007; 2: e327Crossref PubMed Scopus (178) Google Scholar, 2Shaw-Smith C. Redon R. Rickman L. Rio M. Willatt L. Fiegler H. Firth H. Sanlaville D. Winter R. Colleaux L. et al.Microarray based comparative genomic hybridisation (array-CGH) detects submicroscopic chromosomal deletions and duplications in patients with learning disability/mental retardation and dysmorphic features.J. Med. Genet. 2004; 41: 241-248Crossref PubMed Scopus (419) Google Scholar, 3Stankiewicz P. Beaudet A.L. Use of array CGH in the evaluation of dysmorphology, malformations, developmental delay, and idiopathic mental retardation.Curr. Opin. Genet. Dev. 2007; 17: 182-192Crossref PubMed Scopus (261) Google Scholar, 4Veltman J.A. Genomic microarrays in clinical diagnosis.Curr. Opin. Pediatr. 2006; 18: 598-603Crossref PubMed Scopus (31) Google Scholar, 5Vissers L.E. de Vries B.B. Osoegawa K. Janssen I.M. Feuth T. Choy C.O. Straatman H. van der Vliet W. Huys E.H. van Rijk A. et al.Array-based comparative genomic hybridization for the genomewide detection of submicroscopic chromosomal abnormalities.Am. J. Hum. Genet. 2003; 73: 1261-1270Abstract Full Text Full Text PDF PubMed Scopus (370) Google Scholar Moreover, a genomic basis to several later-onset disorders, e.g., early-onset Alzheimer disease with amyloid angiopathy (EOAD)6Rovelet-Lecrux A. Hannequin D. Raux G. Le Meur N. Laquerriere A. Vital A. Dumanchin C. Feuillette S. Brice A. Vercelletto M. et al.APP locus duplication causes autosomal dominant early-onset Alzheimer disease with cerebral amyloid angiopathy.Nat. Genet. 2006; 38: 24-26Crossref PubMed Scopus (857) Google Scholar and adult-onset autosomal-dominant leukodystrophy7Padiath Q.S. Saigoh K. Schiffmann R. Asahara H. Yamada T. Koeppen A. Hogan K. Ptacek L.J. Fu Y.H. Lamin B1 duplications cause autosomal dominant leukodystrophy.Nat. Genet. 2006; 38: 1114-1123Crossref PubMed Scopus (285) Google Scholar, has now been defined. However, copy-number changes in many patients are novel or extremely rare, such that uncertainty remains as to whether the aberration is pathogenic or simply a benign variant. Identification of additional patients who share a region of genomic deletion or duplication and have phenotypic features in common allows greater certainty to be given to the pathogenic nature of the rearrangement and delineation of new syndromes. Several studies have highlighted the presence of large numbers of deletions, insertions, and duplications, ranging from a few kilobases to several megabases in size, in the normal population.8Iafrate A.J. Feuk L. Rivera M.N. Listewnik M.L. Donahoe P.K. Qi Y. Scherer S.W. Lee C. Detection of large-scale variation in the human genome.Nat. Genet. 2004; 36: 949-951Crossref PubMed Scopus (2232) Google Scholar, 9Sebat J. Lakshmi B. Troge J. Alexander J. Young J. Lundin P. Maner S. Massa H. Walker M. Chi M. et al.Large-scale copy number polymorphism in the human genome.Science. 2004; 305: 525-528Crossref PubMed Scopus (1899) Google Scholar For example, using the complementary technologies of single-nucleotide polymorphism (SNP) genotyping arrays and clone-based comparative genomic hybridization, Redon et al10Redon R. Ishikawa S. Fitch K.R. Feuk L. Perry G.H. Andrews T.D. Fiegler H. Shapero M.H. Carson A.R. Chen W. et al.Global variation in copy number in the human genome.Nature. 2006; 444: 444-454Crossref PubMed Scopus (3066) Google Scholar generated a global map of copy-number variable regions (CNVRs) in the human genome and found 1447 CNVRs covering approximately 12% of the human genome. As more studies are completed and as the resolution of genomic array analysis increases, more CNVRs are being discovered. There are currently more than 6000 copy-number-variant loci listed in the Database of Genomic Variants (DGV). These regions contain several hundreds of genes, disease loci, and segmental duplication regions. Because patients also have these normal copy-number variants it has become a challenge to identify which changes are normal variants and which are likely to be associated with a phenotype. Although many clinical centers are now applying genomic microarray technology to investigate patients with developmental delay, learning disability, and congenital malformation,11Vermeesch J.R. Fiegler H. de Leeuw N. Szuhai K. Schoumans J. Ciccone R. Speleman F. Rauch A. Clayton-Smith J. Van Ravenswaaij C. et al.Guidelines for molecular karyotyping in constitutional genetic diagnosis.Eur. J. Hum. Genet. 2007; 15: 1105-1114Crossref PubMed Scopus (129) Google Scholar the sporadic nature and rarity of the majority of these cases limits the ability of the individual clinician to interpret the molecular findings from genome-wide array analysis. Thus, there is a great need for international collaboration in the reporting and cataloguing of genotype-phenotype correlations such that clusters of individuals sharing similar genomic rearrangements and phenotypes can be identified. This will not only facilitate diagnosis and genetic counseling but also improve our understanding of gene function and disease. The DECIPHER database (Database of Chromosomal Imbalance and Phenotype in Humans Using Ensembl Resources) and project (Figure 1) was initiated in 2004 with the general aim of providing a clinical and research tool to (1) aid in the interpretation of data from genomic microarray analysis, e.g., the differentiation between pathogenic and polymorphic copy-number changes; (2) utilise the human genome map via the Ensembl genome browser to define genes involved in a specific microdeletion, microduplication, translocation, or inversion; and (3) facilitate collaboration between clinical geneticists and molecular cytogeneticists to accelerate progress in the delineation of new syndromes and of gene function. The acronym DECIPHER was chosen for the database because the word means “To give the key to, to discover the meaning of [something obscure and perplexing].”12Brown L. The New Shorter Oxford English Dictionary. Oxford University Press, New York1993Google Scholar DECIPHER was granted Multi-Centre Research Ethics Committee (MREC) approval (04/MRE05/50) in the UK. The project has been made possible by several independent but interlinked developments, including the Human Genome Mapping Project, bioinformatic integration of genomic information in genome browsers, and advances in molecular cytogenetics. The Human Genome Mapping Project provided a finished human genome sequence in October 200413International Human Genome Sequencing ConsortiumFinishing the euchromatic sequence of the human genome.Nature. 2004; 431: 931-945Crossref PubMed Scopus (3138) Google Scholar, 14Lander E.S. Linton L.M. Birren B. Nusbaum C. Zody M.C. Baldwin J. Devon K. Dewar K. Doyle M. FitzHugh W. et al.Initial sequencing and analysis of the human genome.Nature. 2001; 409: 860-921Crossref PubMed Scopus (16517) Google Scholar, and this acts as a reference sequence, or assembly map, onto which chromosome rearrangements and the order and position of genes and predicted genes can be placed. Crucial to the operation of DECIPHER was the development of the Ensembl genome browser15Flicek P. Aken B.L. Beal K. Ballester B. Caccamo M. Chen Y. Clarke L. Coates G. Cunningham F. Cutts T. et al.Ensembl 2008.Nucleic Acids Res. 2008; 36: D707-D714Crossref PubMed Scopus (364) Google Scholar which allows users to select and view an annotated segment of the human genome map and connect to other relevant resources via hyperlinks. The clone resources developed in the Human Genome Mapping Project, the SNP Consortium Project, and indeed, the sequence itself have provided cytogeneticists with a new suite of molecular tools with which to analyze chromosome rearrangements. The use of fluorescence in situ hybridization (FISH) and, in particular, the introduction of genomic array analysis (“molecular karyotyping”) using array-CGH or high-density SNP genotyping has revolutionized the identification of subtle (and hitherto unidentifiable) cytogenetic imbalances. Contributing to the DECIPHER database is a Consortium, comprising an international network of academic departments of clinical genetics now numbering more than 100 centers and having uploaded more than 2000 cases (current statistics can be found on the DECIPHER homepage). Each contributing center has a nominated clinical geneticist (with expertise in dysmorphology) and a nominated molecular cytogeneticist who are jointly responsible for data entry for their center. Each center maintains control of its own patient data (which are password protected within the center's own DECIPHER project) until patient consent is given to allow anonymous genomic and phenotypic data to become viewable within Ensembl. Once data are shared, consortium members are able to gain access to the patient report and contact each other to discuss patients of mutual interest, thus facilitating the delineation of new microdeletion and microduplication syndromes. With patient consent, positional genomic information together with a brief description of the associated phenotype becomes viewable without password protection via the DECIPHER track in Ensembl. This is of benefit not only to clinicians advising patients with similar findings but also to researchers working on the specific disorders (e.g., congenital heart disease or cleft lip) seen in that patient or working on the role of genes contained within the aberration. (1) DECIPHER integrates seamlessly with the Ensembl genome browser and interrogates the current version of the human genome assembly displayed in the Ensembl genome browser. Because DECIPHER is a dynamic system, each time it is interrogated the most recent data with regard to gene content are returned into the patient report. Ensembl itself builds all its annotated genes and associated features onto the most recent version of the human genome assembly created by the NCBI (current assembly NCBI-36). The annotation of genes and their features are continually being reviewed, refined, and updated, culminating bimonthly in a new version of the annotation released onto the Ensembl website. New features and types of data are continually and routinely added via the distributed annotation system (DAS16Dowell R.D. Jokerst R.M. Day A. Eddy S.R. Stein L. The distributed annotation system.BMC Bioinformatics. 2001; 2: 7Crossref PubMed Scopus (332) Google Scholar), which allows a set of data to be dropped into place and viewed across the genome as a new feature (e.g., copy-number variation (CNV) data). This approach makes the whole process configurable and allows rapid updates to data to be made available. (2) DECIPHER links to other genetic and medical databases, including HUGO Gene Nomenclature Committee (HGNC), On-line Mendelian Inheritance in Man (OMIM), PubMed, GeneReviews, Ensembl genes, Swiss-Prot, and a frequently updated list of emerging bioinformatics databases. DECIPHER not only displays detected aberrations in relation to the genome sequence but has also been programmed to allow the clinician or researcher to rapidly obtain clinically relevant information (publications) about the genes located in these regions. (3) DECIPHER is designed to work with any number of technologies where position data can be mapped onto the reference sequence. For DECIPHER to interact directly with the Ensembl genome browser, positional data regarding the probes used for analysis must first be mapped onto the reference sequence. DECIPHER can be configured to utilize any molecular method (e.g., FISH, MAPH, MLPA, PCR, array-CGH, or SNP-genotyping) where the probes or SNPs are positioned on the reference sequence or simply base-pair position (sequence) itself. Any structural rearrangement defined in this way, including copy-number changes, translocations, and inversions, can be catalogued within DECIPHER. (4) DECIPHER uses a restricted ontology of phenotype terms and speciically the well-known hierarchy of phenotype terms developed for the The Baraitser-Winter Neurogenetics Database. In this way, clinicians in different centers use a common set of terms, which facilitates consistent phenotype description and enables efficient data sharing and database searching. (5) DECIPHER facilitates the characterization of copy-number changes. A major problem in the identification of potentially pathogenic changes is the large number of normal variants that are identified, particularly as array resolution increases. DECIPHER includes a feature graph tool that displays patient copy-number changes together with data from the DGV as well as variants identified in a selection of the major studies of copy-number variation in normal individuals. Together with the analysis of parental samples (see analysis of trios, number 8 below), each copy-number change in the patient can then be classified as de novo, CNV (normal variant), or familial variant. Only de novo changes and familial variants are then displayed, with consent, in Ensembl. (6) DECIPHER provides detailed gene lists for rearrangements. The gene lists and gene displays generated by DECIPHER are filtered via HGNC to eliminate redundancy caused by synonyms and to ensure that DECIPHER is using currently approved gene names. Genes included in the OMIM Morbid database, i.e., those of known importance in human disease, are denoted with the suffix M so that the clinician is immediately alerted to the need to explore their potential clinical significance. Similarly, imprinted genes listed at the website GeneImprint are denoted by the suffix I because, in this instance, an inherited deletion or duplication, although present in a normal parent, can be potentially pathogenic. (7) DECIPHER provides a comprehensive search facility. All of the consented data held within the DECIPHER database are searchable. Features that can be queried include chromosomal band, genomic position, chromosomes, and phenotypes or a combination of these. DECIPHER members can also use this search function to interrogate nonconsented data within their own project group. (Figure 2). (8) DECIPHER includes novel software to assist in the analysis of trios (DNA samples from a patient and both parents). DECIPHER collects information from array analysis of both parents and displays this in relation to copy-number changes found in the patient. This enables the user to identify whether a genomic aberration identified in a patient is of parental origin or has occurred as a de novo event. (9) DECIPHER provides advanced text-mining tools for gene prioritization and for genotype-phenotype correlation. Identifying which gene or genes in a deleted or duplicated region may be responsible for features of the phenotype involves considerable literature and database searching. DECIPHER includes advanced text-mining tools that order genes in the region according to their likelihood of being associated in the literature with a phenotypic feature or group of features.17Rebholz-Schuhmann D. Kirsch H. Arregui M. Gaudan S. Riethoven M. Stoehr P. EBIMed–text crunching to gather facts for proteins from Medline.Bioinformatics. 2007; 23: e237-e244Crossref PubMed Scopus (135) Google Scholar, 18Van Vooren S. Thienpont B. Menten B. Speleman F. De Moor B. Vermeesch J. Moreau Y. Mapping biomedical concepts onto the human genome by mining literature on chromosomal aberrations.Nucleic Acids Res. 2007; 35: 2533-2543Crossref PubMed Scopus (25) Google Scholar In addition, because DECIPHER is directly linked to Ensembl, clinicians and researchers can identify and query genes that are located in affected regions of the genome by accessing gene-specific databases. (10) DECIPHER generates both detailed clinical reports and summary family reports. Once all the phenotype and genotype data of a patient have been entered into DECIPHER, two types of printable reports are directly available from the website. The first report comprises a summary of the full clinical phenotypic description and an overview of genes affected by the aberration. This report can be used as a clinical report and includes the karyotype and ideogram of the affected chromosome(s) and any uploaded patient images. Alternatively, a simplified version of the full clinical report can be printed out for counseling patients and families. (11) In order to protect patient privacy, data in DECIPHER are served over an encrypted SSL (secure socket layer) connection, similar to a security level employed by banks and financial institutions. Clinical photographs are an optional element of DECIPHER. When consent is given for these to be held in DECIPHER, they are password protected so that they are only accessible to logged-in members of the consortium. Photographs are digitally watermarked for additional security. Only cases with documented full informed consent are visible within the Ensembl genome browser. Nonconsented data are viewable only by the submitting center. Public access to consented data is restricted to a basic report identifying copy-number changes and the phenotype but not the identity of the submitting center. Requests for further patient information are made to the DECIPHER administration, who pass on the request to the submitting center. (12) DECIPHER maintains a series of syndrome reports. The syndromes pages within DECIPHER provide a single, curated resource of information and web links. As shown in Figure 3, for each syndrome entity DECIPHER provides the following: a brief clinical synopsis; information regarding the size and origin of a deletion or duplication; an ideogram of the location of the deletion or duplication on the relevant chromosome; a list of the genes contained within the aberrant interval; a direct clickable link to a visualization of the deletion or duplication in Ensembl; an up-to-date publication reference list and; a link to relevant support groups and further information (e.g., GeneReviews). DECIPHER Syndromes is supported by a panel of expert advisors (see Acknowledgments), each responsible for reviewing and updating the entry for a specific syndrome on an annual basis. Cases are entered into DECIPHER from standard web browsers, and the data are mapped directly to the latest human genome assembly via the Ensembl genome browser. For consenting patients, the aberrant region is displayed within Ensembl with phenotype information and any other similar cases within the database, as well as with other genomic features such as gene content, segmental duplication, and regions of normal copy-number variation. A 28-year-old woman presented to the genetics clinic for diagnosis. She had mild to moderate learning difficulties and dysmorphic facial features (See Figure 4A). After an uneventful pregnancy, she was born with bilateral talipes, which required surgery in infancy. As a young child, she had been reviewed by pediatricians and geneticists and had been given a diagnosis of “peroneal muscular atrophy.” (A) Case 1. (B) Case 2. (C) Case 3. At the clinic she reported experiencing fatigue and lassitude. She appeared anaemic, but there was no history of menorrhagia, blood loss, or dietary deficiency. Investigations revealed a severe iron-deficiency anaemia, Hb 7.1g/dl, and ferritin < 1, and chromosome analysis revealed a visible deletion of 5q21-q22. FISH analysis refined the breakpoints, and the deletion was then uploaded into DECIPHER. Genes located within the deleted region included the APC gene (MIM 611731). Germline mutations of the APC gene have been found to be responsible for Familial adenomatous polyposis (FAP [MIM 175100])19Nishisho I. Nakamura Y. Miyoshi Y. Miki Y. Ando H. Horii A. Koyama K. Utsunomiya J. Baba S. Hedge P. Mutations of chromosome 5q21 genes in FAP and colorectal cancer patients.Science. 1991; 253: 665-669Crossref PubMed Scopus (1561) Google Scholar, 20Bodmer W.F. Bailey C.J. Bodmer J. Bussey H.J. Ellis A. Gorman P. Lucibello F.C. Murday V.A. Rider S.H. Scambler P. et al.Localization of the gene for familial adenomatous polyposis on chromosome 5.Nature. 1987; 328: 614-616Crossref PubMed Scopus (1090) Google Scholar, a cancer-predisposition syndrome in which hundreds to thousands of precancerous colonic polyps develop during adolescence. Most mutations in the APC gene are protein truncating and are spread throughout the coding region of the gene. However, exonic deletions and whole-gene deletions are also described.20Bodmer W.F. Bailey C.J. Bodmer J. Bussey H.J. Ellis A. Gorman P. Lucibello F.C. Murday V.A. Rider S.H. Scambler P. et al.Localization of the gene for familial adenomatous polyposis on chromosome 5.Nature. 1987; 328: 614-616Crossref PubMed Scopus (1090) Google Scholar, 21Michils G. Tejpar S. Thoelen R. van Cutsem E. Vermeesch J.R. Fryns J.P. Legius E. Matthijs G. Large deletions of the APC gene in 15% of mutation-negative patients with classical polyposis (FAP): A Belgian study.Hum. Mutat. 2005; 25: 125-134Crossref PubMed Scopus (104) Google Scholar In view of the high risk of colorectal malignancy in adults with FAP, young people with a diagnosis of FAP are usually enrolled in a colorectal surveillance program from the ages of 10–12 years and undergo prophylactic colectomy in early adult life.22Galiatsatos P. Foulkes W.D. Familial adenomatous polyposis.Am. J. Gastroenterol. 2006; 101: 385-398Crossref PubMed Scopus (414) Google Scholar As a result of these findings, the patient was referred urgently to a colorectal surgeon for further investigation and management. Colonoscopy revealed relative sparing of the rectum, but numerous adenomas were seen throughout the colon, and there was a large sessile lesion at the splenic flexure. Furthermore, upper GI endoscopy demonstrated some gastric fundal and duodenal polyps. These findings confirmed the diagnosis of FAP, which had been predicted from the molecular cytogenetic results. On account of her high risk of colorectal malignancy, the patient was admitted for a colectomy with ileorectal anastamosis, and periodic surveillance of the upper GI tract and rectum was instituted. Sadly, despite this intervention, she died 18 months later from metastatic carcinoma. An 8-year-old boy with complex cyanotic congenital heart disease, including an atrioventricular septal defect, reflux nephropathy, behavioural problems (impulsivity and hyperkinetic conduct disorder), and mild learning disability was seen in the genetics clinic (see Figure 4B). His first cardiac surgery was undertaken at the age of 4 months, and he had a stormy post-operative course, during which he spent several weeks in intensive care. He was reviewed by a number of pediatricians and a pediatric psychiatrist, and it was uncertain to what extent his perioperative complications were the cause of his learning and behavior problems. An array-CGH study revealed a small deletion of approximately 4 Mb in size on chromosome 8p23.1.2Shaw-Smith C. Redon R. Rickman L. Rio M. Willatt L. Fiegler H. Firth H. Sanlaville D. Winter R. Colleaux L. et al.Microarray based comparative genomic hybridisation (array-CGH) detects submicroscopic chromosomal deletions and duplications in patients with learning disability/mental retardation and dysmorphic features.J. Med. Genet. 2004; 41: 241-248Crossref PubMed Scopus (419) Google Scholar From DECIPHER it was immediately apparent that this deletion is a rare syndrome, the “8p23.1 deletion syndrome,” which includes the gene GATA4 (MIM 600576), which encodes a transcription factor involved in heart formation.23Garg V. Kathiriya I.S. Barnes R. Schluterman M.K. King I.N. Butler C.A. Rothrock C.R. Eapen R.S. Hirayama-Yamada K. Joo K. et al.GATA4 mutations cause human congenital heart defects and reveal an interaction with TBX5.Nature. 2003; 424: 443-447Crossref PubMed Scopus (899) Google Scholar The 8p23.1 deletion syndrome is characterized by “developmental delay and a characteristic behavior profile with hyperactivity and impulsiveness,” which explains many aspects of this child's phenotype, including his behavioral and developmental problems. This case has been previously reported.24Zahir F. Firth H.V. Baross A. Delaney A.D. Eydoux P. Gibson W.T. Langlois S. Martin H. Willatt L. Marra M.A. et al.Novel deletions of 14q11.2 associated with developmental delay, cognitive impairment and similar minor anomalies in three children.J. Med. Genet. 2007; 44: 556-561Crossref PubMed Scopus (55) Google Scholar A 4-year-old girl with developmental delay and poor eye contact was seen in the genetics clinic for diagnosis (Figure 4C). She was hypotonic in infancy, and the first year of her life was characterized by a lack of social interaction: she did not develop eye contact or a social smile. She had a normal G-banded karyotype but harbored a de novo submicroscopic deletion of approximately 1.1 Mb defined by clones RP11-203M5 (19.853 Mb to 20.059 Mb) and RP11-524O1 (20.736 Mb to 20.932 Mb) mapping to chromosome 14q11.2. The case was entered into DECIPHER, and initially no overlap
0
Citation1,771
0
Save
Load More