OR
Oscar Rodriguez
Author with expertise in Natural Killer Cells in Immunity
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
6
(67% Open Access)
Cited by:
11
h-index:
4
/
i10-index:
1
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
54

Genetic variation in the immunoglobulin heavy chain locus shapes the human antibody repertoire

Oscar Rodriguez et al.Jul 4, 2022
Abstract Variation in the antibody response has been linked to differential outcomes in disease, and suboptimal vaccine and therapeutic responsiveness, the determinants of which have not been fully elucidated. Countering models that presume antibodies are generated largely by stochastic processes, we demonstrate that polymorphisms within the immunoglobulin heavy chain locus (IGH) significantly impact the naive and antigen-experienced antibody repertoire, indicating that genetics predisposes individuals to mount qualitatively and quantitatively different antibody responses. We pair recently developed long-read genomic sequencing methods with antibody repertoire profiling to comprehensively resolve IGH genetic variation, including novel structural variants, single nucleotide variants, and genes and alleles. We show that IGH germline variants determine the presence and frequency of antibody genes in the expressed repertoire, including those enriched in functional elements linked to V(D)J recombination, and overlapping disease-associated variants. These results illuminate the power of leveraging IGH genetics to better understand the regulation, function and dynamics of the antibody response in disease.
54
Citation8
0
Save
24

Targeted long-read sequencing facilitates phased diploid assembly and genotyping of the human T cell receptor alpha, delta and beta loci

Oscar Rodriguez et al.May 25, 2022
Abstract T cell receptors (TCRs) recognize peptide fragments presented by the major histocompatibility complex (MHC) and are critical to T cell mediated immunity. Early studies demonstrated an enrichment of polymorphisms within TCR-encoding (TR) gene loci. However, more recent data indicate that variation in these loci are underexplored, limiting understanding of the impact of TR polymorphism on TCR function in disease, even though: (i) TCR repertoire signatures are heritable and (ii) associate with disease phenotypes. TR variant discovery and curation has been difficult using standard high-throughput methods. To address this, we expanded our published targeted long-read sequencing approach to generate highly accurate haplotype resolved assemblies of the human TR beta (TRB) and alpha/delta (TRA/D) loci, facilitating the detection and genotyping of single nucleotide polymorphisms (SNPs), insertion-deletions (indels), structural variants (SVs) and TR genes. We validate our approach using two mother-father-child trios and 5 unrelated donors representing multiple populations. Comparisons of long-read derived variants to short-read datasets revealed improved genotyping accuracy, and TR gene annotation led to the discovery of 79 previously undocumented V, D, and J alleles. This demonstrates the utility of this framework to resolve the TR loci, and ultimately our understanding of TCR function in disease.
24
Citation2
0
Save
19

IGHV allele similarity clustering improves genotype inference from adaptive immune receptor repertoire sequencing data

Ayelet Peres et al.Dec 27, 2022
Abstract In adaptive immune receptor repertoire analysis, determining the germline variable (V) allele associated with each T- and B-cell receptor sequence is a crucial step. This process is highly impacted by allele annotations. Aligning sequences, assigning them to specific germline alleles, and inferring individual genotypes are challenging when the repertoire is highly mutated, or sequence reads do not cover the whole V region. Here, we propose an alternative naming scheme for the V alleles as well as a novel method to infer individual genotypes. We demonstrate the strength of the two by comparing their outcomes to other genotype inference methods and validated the genotype approach with independent genomic long read data. The naming scheme is compatible with current annotation tools and pipelines. Analysis results can be converted from the proposed naming scheme to the nomenclature determined by the International Union of Immunological Societies (IUIS). Both the naming scheme and the genotype procedure are implemented in a freely available R package (PIgLET). To allow researchers to explore further the approach on real data and to adapt it for their future uses, we also created an interactive website ( https://yaarilab.github.io/IGHV_reference_book ).
19
Citation1
0
Save
0

Addressing technical pitfalls in pursuit of molecular factors that mediate immunoglobulin gene regulation

Eric Engelbrecht et al.Mar 8, 2024
Abstract The expressed antibody repertoire is a critical determinant of immune-related phenotypes. Antibody-encoding transcripts are distinct from other expressed genes because they are transcribed from somatically rearranged gene segments. Human antibodies are composed of two identical heavy and light chain polypeptides derived from genes in the immunoglobulin heavy chain (IGH) locus and one of two light chain loci. The combinatorial diversity that results from antibody gene rearrangement and the pairing of different heavy and light chains contributes to the immense diversity of the baseline antibody repertoire. During rearrangement, antibody gene selection is mediated by factors that influence chromatin architecture, promoter/enhancer activity, and V(D)J recombination. Interindividual variation in the composition of the antibody repertoire associates with germline variation in IGH, implicating polymorphism in antibody gene regulation. Determining how IGH variants directly mediate gene regulation will require integration of these variants with other functional genomic datasets. Here, we argue that standard approaches using short reads have limited utility for characterizing regulatory regions in IGH at haplotype-resolution. Using simulated and ChIP-seq reads, we define features of IGH that limit use of short reads and a single reference genome, namely 1) the highly duplicated nature of DNA sequence in IGH and 2) structural polymorphisms that are frequent in the population. We demonstrate that personalized diploid references enhance performance of short-read data for characterizing mappable portions of the locus, while also showing that long-read profiling tools will ultimately be needed to fully resolve functional impacts of IGH germline variation on expressed antibody repertoires.
0

A novel framework for characterizing genomic haplotype diversity in the human immunoglobulin heavy chain locus

Oscar Rodriguez et al.Apr 20, 2020
An incomplete ascertainment of genetic variation within the highly polymorphic immunoglobulin heavy chain locus (IGH) has hindered our ability to define genetic factors that influence antibody and B cell mediated processes. To date, methods for locus-wide genotyping of all IGH variant types do not exist. Here, we combine targeted long-read sequencing with a novel bioinformatics tool, IGenotyper, to fully characterize genetic variation within IGH in a haplotype-specific manner. We apply this approach to eight human samples, including a haploid cell line and two mother-father-child trios, and demonstrate the ability to generate high-quality assemblies (>98% complete and >99% accurate), genotypes, and gene annotations, including 2 novel structural variants and 17 novel gene alleles. We show that multiplexing allows for scaling of the approach without impacting data quality, and that our genotype call sets are more accurate than short-read (>35% increase in true positives and >97% decrease in false-positives) and array/imputation-based datasets. This framework establishes a foundation for leveraging IG genomic data to study population-level variation in the antibody response.### Competing Interest StatementE.E.E. is on the scientific advisory board (SAB) of DNAnexus, Inc.
0

A survey of rare epigenetic variation in 23,116 human genomes identifies disease-relevant epivariations and novel CGG expansions

Paras Garg et al.Mar 26, 2020
There is growing recognition that epivariations, most often recognized as promoter hypermethylation events that lead to gene silencing, are associated with a number of human diseases. However, little information exists on the prevalence and distribution of rare epigenetic variation in the human population. In order to address this, we performed a survey of methylation profiles from 23,116 individuals using the Illumina 450k array. Using a robust outlier approach, we identified 4,452 unique autosomal epivariations, including potentially inactivating promoter methylation events at 384 genes linked to human disease. For example, we observed promoter hypermethylation of BRCA1 and LDLR at population frequencies of ~1 in 3,000 and ~1 in 6,000 respectively, suggesting that epivariations may underlie a fraction of human disease which would be missed by purely sequence-based approaches. Using expression data, we confirmed that many epivariations are associated with outlier gene expression. Analysis of SNV data and monozygous twin pairs suggests that approximately two thirds of epivariations segregate in the population secondary to underlying sequence mutations, while one third are likely sproradic events that occur post-zygotically. We identified 25 loci where rare hypermethylation coincided with the presence of an unstable CGG tandem repeat, and validated the presence of novel CGG expansions at several of these, identifying the molecular defect underlying most of the known folate-sensitive fragile sites in the genome. Our study provides a catalog of rare epigenetic changes in the human genome, gives insight into the underlying origins and consequences of epivariations, and identifies many novel hypermethylated CGG repeat expansions.