MC
Manuel Corpas
Author with expertise in Standards and Guidelines for Genetic Variant Interpretation
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
11
(55% Open Access)
Cited by:
3,448
h-index:
21
/
i10-index:
30
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Shifting the limits in wheat research and breeding using a fully annotated reference genome

R. Appels et al.Aug 17, 2018
+87
N
A
R
Insights from the annotated wheat genome Wheat is one of the major sources of food for much of the world. However, because bread wheat's genome is a large hybrid mix of three separate subgenomes, it has been difficult to produce a high-quality reference sequence. Using recent advances in sequencing, the International Wheat Genome Sequencing Consortium presents an annotated reference genome with a detailed analysis of gene content among subgenomes and the structural organization for all the chromosomes. Examples of quantitative trait mapping and CRISPR-based genome modification show the potential for using this genome in agricultural research and breeding. Ramírez-González et al. exploited the fruits of this endeavor to identify tissue-specific biased gene expression and coexpression networks during development and exposure to stress. These resources will accelerate our understanding of the genetic basis of bread wheat. Science , this issue p. eaar7191 ; see also p. eaar6089
0
Citation2,652
0
Save
0

The transcriptional landscape of polyploid wheat

Brande Wulff et al.Aug 17, 2018
+79
V
R
B
Insights from the annotated wheat genome Wheat is one of the major sources of food for much of the world. However, because bread wheat's genome is a large hybrid mix of three separate subgenomes, it has been difficult to produce a high-quality reference sequence. Using recent advances in sequencing, the International Wheat Genome Sequencing Consortium presents an annotated reference genome with a detailed analysis of gene content among subgenomes and the structural organization for all the chromosomes. Examples of quantitative trait mapping and CRISPR-based genome modification show the potential for using this genome in agricultural research and breeding. Ramírez-González et al. exploited the fruits of this endeavor to identify tissue-specific biased gene expression and coexpression networks during development and exposure to stress. These resources will accelerate our understanding of the genetic basis of bread wheat. Science , this issue p. eaar7191 ; see also p. eaar6089
0
Citation792
0
Save
0

Low-coverage whole genome sequencing for a highly selective cohort of severe COVID-19 patients

Renato Santos et al.Jun 20, 2024
+4
I
V
R
Despite the advances in genetic marker identification associated with severe COVID-19, the full genetic characterisation of the disease remains elusive. This study explores imputation in low-coverage whole genome sequencing for a severe COVID-19 patient cohort. We generated a dataset of 79 imputed variant call format files using the GLIMPSE1 tool, each containing an average of 9.5 million single nucleotide variants. Validation revealed a high imputation accuracy (squared Pearson correlation ≈0.97) across sequencing platforms, showcasing GLIMPSE1’s ability to confidently impute variants with minor allele frequencies as low as 2% in individuals with Spanish ancestry. We carried out a comprehensive analysis of the patient cohort, examining hospitalisation and intensive care utilisation, sex and age-based differences, and clinical phenotypes using a standardised set of medical terms developed to characterise severe COVID-19 symptoms. The methods and findings presented here can be leveraged for future genomic projects to gain vital insights into health challenges like COVID-19.
0
Citation1
0
Save
0

A Complete Public Domain Family Genomics Dataset

Manuel Corpas et al.Nov 12, 2013
+4
A
M
M
BACKGROUND: The availability of open access genomic data is essential for the personal genomics field. Public genomic data allow comparative analyses, testing of new tools and genotype-phenotype association studies. Personal genomics data of unrelated individuals are available in the public domain, notably the Personal Genome Project; however, to date genomics family data and metadata are severely lacking, mainly due to cost, privacy concerns or restricted access to Next Generation Sequencing (NGS) technology. Family data have a lot to offer as they allow the study of heritability, something which is impossible to do just by using unrelated individuals. FINDINGS: A whole family from Southern Spain decided to genotype, sequence and analyse their personal genomes making them publicly available under a Creative Commons 0 license (CC0; commonly denominated as public domain). These data include a) five 23andMe SNP chip genotype bed files, b) four raw exomes with their assorted bam files and VCF files, c) a metagenomic raw sequencing data file and d) derived data of likely phenotypes using SNPedia-derived tools. CONCLUSIONS: To our knowledge this is the first CC0 released set of genomic, phenotypic and metagenomic data for a whole family. This dataset is also unique in that it was obtained through direct-to-consumer genetic tests. Hence any ordinary citizen with enough budget and samples should be able to reproduce this experiment. We envisage this dataset to be a useful resource for a variety of applications in the personal genomics field as a) negative control data for trait association discovery, b) testing data for development of new software and c) sample data for heritability studies. We encourage prospective users to share with us derived results so that they can be added to our existing collection.
0
Citation1
0
Save
0

Mapping the Pharmacogenetic Landscape in a Ugandan Population: Implications for Personalized Medicine in an Underrepresented Population

Sumudu Samarasinghe et al.Jun 4, 2024
+3
M
S
S
Africans are extremely underrepresented in global genomic research. African populations face high burdens of communicable and non‐communicable diseases and experience widespread polypharmacy. As population‐specific genetic studies are crucial to understanding unique genetic profiles and optimizing treatments to reduce medication‐related complications in this diverse population, the present study aims to characterize the pharmacogenomics profile of a rural Ugandan population. We analyzed low‐pass whole genome sequencing data from 1998 Ugandans to investigate 18 clinically actionable pharmacogenes in this population. We utilized PyPGx to identify star alleles (haplotype patterns) and compared allele frequencies across populations using the Pharmacogenomics Knowledgebase PharmGKB. Clinical interpretations of the identified alleles were conducted following established dosing guidelines. Over 99% of participants displayed actionable phenotypes across the 18 pharmacogenes, averaging 3.5 actionable genotypes per individual. Several variant alleles known to affect drug metabolism (i.e., CYP3A5*1 , CYP2B6*9 , CYP3A5*6 , CYP2D6*17 , CYP2D6*29 , and TMPT*3C )—which are generally more prevalent in African individuals—were notably enriched in the Ugandan cohort, beyond reported frequencies in other African peoples. More than half of the cohort exhibited a predicted impaired drug response associated with CFTR, IFNL3, CYP2B6, and CYP2C19, and approximately 31% predicted altered CYP2D6 metabolism. Potentially impaired CYP2C9, SLCO1B1, TPMT, and DPYD metabolic phenotypes were also enriched in Ugandans compared with other African populations. Ugandans exhibit distinct allele profiles that could impact drug efficacy and safety. Our findings have important implications for pharmacogenomics in Uganda, particularly with respect to the treatment of prevalent communicable and non‐communicable diseases, and they emphasize the potential of pharmacogenomics‐guided therapies to optimize healthcare outcomes and precision medicine in Uganda.
0
Citation1
0
Save
0

Low-coverage whole genome sequencing for a highly selective cohort of severe COVID-19 patients

Renato Santos et al.Jan 29, 2024
+4
C
I
R
Abstract Despite advances in identifying genetic markers associated to severe COVID-19, the full genetic characterisation of the disease remains elusive. This study explores the use of imputation in low-coverage whole genome sequencing for a severe COVID-19 patient cohort. We generated a dataset of 79 imputed variant call format files using the GLIMPSE1 tool, each containing an average of 9.5 million single nucleotide variants. Validation revealed a high imputation accuracy (squared Pearson correlation ≈0.97) across sequencing platforms, showing GLIMPSE1’s ability to confidently impute variants with minor allele frequencies as low as 2% in Spanish ancestry individuals. We conducted a comprehensive analysis of the patient cohort, examining hospitalisation and intensive care utilisation, sex and age-based differences, and clinical phenotypes using a standardised set of medical terms developed to characterise severe COVID-19 symptoms. The methods and findings presented here may be leveraged in future genomic projects, providing vital insights for health challenges like COVID-19.
0
Citation1
0
Save
0

PGP-UK: a research and citizen science hybrid project in support of personalized medicine

Stephan Beck et al.Mar 27, 2018
+40
G
A
S
Molecular analyses such as whole-genome sequencing have become routine and are expected to be transformational for future healthcare and lifestyle decisions. Population-wide implementation of such analyses is, however, not without challenges, and multiple studies are ongoing to identify what these are and explore how they can be addressed. Defined as a research project, the Personal Genome Project UK (PGP-UK) is part of the global PGP network and focuses on open data sharing and citizen science to advance and accelerate personalized genomics and medicine. Here we report our findings on using an open consent recruitment protocol, active participant involvement, open access release of personal genome, methylome and transcriptome data and associated analyses, including 47 new variants predicted to affect gene function and innovative reports based on the analysis of genetic and epigenetic variants. For this pilot study, we recruited ten participants willing to actively engage as citizen scientists with the project. In addition, we introduce Genome Donation as a novel mechanism for openly sharing previously restricted data and discuss the first three donations received. Lastly, we present GenoME, a free, open-source educational app suitable for the lay public to allow exploration of personal genomes. Our findings demonstrate that citizen science-based approaches like PGP-UK have an important role to play in the public awareness, acceptance and implementation of genomics and personalized medicine.
0

Crowdsourced analysis of ash and ash dieback through the Open Ash Dieback project: A year 1 report on datasets and analyses contributed by a self-organising community.

Diane Saunders et al.Apr 25, 2014
+24
C
K
D
Ash dieback is a fungal disease of ash trees caused by Hymenoscyphus pseudoalbidus that has swept across Europe in the last two decades and is a significant threat to the ash population. This emergent pathogen has been relatively poorly studied and little is known about its genetic make-up. In response to the arrival of this dangerous pathogen in the UK we took the unusual step of providing an open access database and initial sequence datasets to the scientific community for analysis prior to performing an analysis of our own. Our goal was to crowdsource genomic and other analyses and create a community analysing this pathogen. In this report on the evolution of the community and data and analysis obtained in the first year of this activity, we describe the nature and the volume of the contributions and reveal some preliminary insights into the genome and biology of H. pseudoalbidus that emerged. In particular our nascent community generated a first-pass genome assembly containing abundant collapsed AT-rich repeats indicating a typically complex genome structure. Our open science and crowdsourcing effort has brought a wealth of new knowledge about this emergent pathogen within a short time-frame. Our community endeavour highlights the positive impact that open, collaborative approaches can have on fast, responsive modern science.
0

10 Simple Rules for Sharing Human Genomic Data

Manuel Corpas et al.Dec 15, 2016
+4
N
C
M
These 10 Simple Rules have been developed from our combined experiences of working with human genomic data, data repositories and data users. We do not claim that these rules will eliminate every possible risk of data misuse. Rather, we hope that these will help researchers to increase the reusability of their human genomic data, whilst also ensuring that the privacy of their subjects is maintained according to their consent frameworks. Many of the principles presented are also applicable to other types of clinical research data, where participant privacy is a concern.
0

A global perspective on bioinformatics training needs

Michelle Brazas et al.Feb 27, 2017
+15
R
C
M
In the last decade, life-science research has become increasingly data-intensive and computational. Nevertheless, basic bioinformatics and data stewardship are still only rarely taught in life-science degree programmes, creating a widening skills gap that spans educational levels and career roles. To better understand this situation, we ran surveys to determine how the skills dearth is affecting the need for bioinformatics training worldwide. Perhaps unsurprisingly, we found that respondents wanted more short courses to help boost their expertise and confidence in data analysis and interpretation. However, it was evident that most respondents appreciated their need for training only after designing their experiments and collecting their data. This is clearly rather late in the research workflow, and suboptimal from a training perspective, as skills acquired to address a specific need at a particular time are seldom retained, engendering a cycle of low confidence in trainees. To ensure that such skill gaps do not continue to create barriers to the progress of research, we argue that universities should strive to bring their life-science curricula into the digital-data era. Meanwhile, the demand for point-of-need training in bioinformatics and data stewardship will grow. While this situation persists, international groups like GOBLET are increasing their efforts to enlarge the community of trainers and quench the global thirst for bioinformatics training.
Load More