AP
Ayelet Peres
Author with expertise in Regulatory T Cell Development and Function
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
11
(82% Open Access)
Cited by:
18
h-index:
9
/
i10-index:
9
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
22

T Cell Receptor Beta Germline Variability is Revealed by Inference From Repertoire Data

Aviv Omer et al.May 17, 2021
Abstract Background T and B cell receptor (TCR, BCR) repertoires constitute the foundation of adaptive immunity. Adaptive immune receptor repertoire sequencing (AIRR-seq) is a common approach to study immune system dynamics. Understanding the genetic factors influencing the composition and dynamics of these repertoires is of major scientific and clinical importance. The chromosomal loci encoding for the variable regions of TCRs and BCRs are challenging to decipher due to repetitive elements and undocumented structural variants. Methods To confront this challenge, AIRR-seq-based methods have recently been developed for B cells, enabling genotype and haplotype inference and discovery of undocumented alleles. However, this approach relies on complete coverage of the receptors’ variable regions, whereas most T cell studies sequence a small fraction of that region. Here, we adapted a B cell pipeline for undocumented alleles, genotype, and haplotype inference for full and partial TCR sequences. The pipeline also deals with gene assignment ambiguities, which is especially important in the analysis of data-sets of partial sequences. Results We identified 39 undocumented polymorphisms in T cell receptor Beta V (TRBV) and 31 undocumented 5’ UTR sequences. A subset of these inferences was also observed using independent genomic approaches. We found that a single nucleotide polymorphism differentiating between the two documented T cell receptor Beta D2 (TRBD2) alleles is strongly associated with dramatic changes in the expressed repertoire. Conclusions We reveal a rich picture of germline variability, and demonstrate how a single nucleotide polymorphism dramatically affects the composition of the whole repertoire. Our findings provide a basis for annotation of TCR repertoires for future basic and clinical studies.
22
Citation9
0
Save
15

Alternative splice variants and germline polymorphisms in human immunoglobulin light chain genes

Ivana Mikocziova et al.Feb 6, 2021
ABSTRACT Immunoglobulin loci are rich in germline polymorphisms and identification of novel polymorphic variants can be facilitated by germline inference of B cell receptor repertoires. Germline gene inference is complicated by somatic hypermutations, errors arising from PCR amplification, and DNA sequencing as well as from the varying length of reference alleles. Inference of light chain genes is even more challenging than inference of heavy chain genes due to large gene duplication events on the kappa locus as well as absence of D genes in the rearranged light chain transcripts. Here, we analyzed the light chain cDNA sequences from naïve BCR repertoires of a Norwegian cohort of 100 individuals. We optimized light chain allele inference by tweaking parameters within TIgGER functions, extending the germline reference sequences, and establishing mismatch frequency patterns at polymorphic positions to filter out false positive candidates. As a result, we identified 48 previously unreported variants of light chain variable genes. Altogether, we selected 14 candidates for novel light chain polymorphisms for validation and successfully validated 11 by Sanger sequencing. Additional clustering of light chain 5’UTR, L-PART1 and L-PART2 revealed partial intron retention in alternative splice variants in 11 kappa and 9 lambda V alleles. The alternatively spliced transcripts were only observed in genes with low expression levels, suggesting a possible role in expression regulation. Our results provide novel insight into germline variation in human light chain immunoglobulin loci.
15
Citation4
0
Save
9

A BALB/c IGHV Reference Set, defined by haplotype analysis of long-read VDJ-C sequences from F1 (BALB/c / C57BL/6) mice

Katherine Jackson et al.Mar 1, 2022
Abstract The immunoglobulin genes of inbred mouse strains that are commonly used in models of antibody-mediated human diseases are poorly characterized. This compromises data analysis. To infer the immunoglobulin genes of BALB/c mice, we used long-read SMRT sequencing to amplify VDJ-C sequences from F1 (BALB/c x C57BL/6) hybrid animals. Previously unreported strain variations were identified in the Ighm and Ighg2b genes, and analysis of VDJ rearrangements led to the inference of 278 germline IGHV alleles. 169 alleles are not present in the C57BL/6 genome reference sequence. To establish a set of expressed BALB/c IGHV germline gene sequences, we computationally retrieved IGHV haplotypes from the IgM dataset. Haplotyping led to the confirmation of 162 BALB/c IGHV gene sequences. A musIGHV398 pseudogene variant also appears to be present in the BALB/cByJ substrain, while a functional musIGHV398 gene is highly expressed in the BALB/cJ substrain. Only four of the BALB/c alleles were also observed in the C57BL/6 haplotype. The full set of inferred BALB/c sequences has been used to establish a BALB/c IGHV reference set, hosted at https://ogrdb.airr-community.org . We assessed whether assemblies from the Mouse Genome Project (MGP) are suitable for the determination of the genes of the IGH loci. Only 37 (43.5%) of the 85 confirmed IMGT-named BALB/c IGHV and 33 (42.9%) of the 77 confirmed non-IMGT IGHV were found in a search of the MGP BALB/cJ genome assembly. This suggests that Adaptive Immune Receptor Repertoire sequencing (AIRR-Seq) data, but not currently-available genome assemblies, are suited to the documentation of germline IGHV genes.
9
Citation3
0
Save
1

FLAIRR-seq: A novel method for single molecule resolution of near full-length immunoglobulin heavy chain repertoires

Easton Ford et al.Sep 26, 2022
Abstract Current Adaptive Immune Receptor Repertoire Sequencing (AIRR-seq) strategies resolve expressed antibody (Ab) transcripts with limited resolution of the constant region. Here we present a novel near full-length AIRR-seq (FLAIRR-Seq) method that utilizes targeted amplification by 5’ rapid amplification of cDNA ends (RACE), combined with single molecule, real-time sequencing to generate highly accurate (>Q40, 99.99%) IG heavy chain transcripts. FLAIRR-seq was benchmarked by comparing IG heavy chain variable (IGHV), diversity (IGHD), and joining (IGHJ) gene usage, complementarity-determining region 3 (CDR3) length, and somatic hypermutation to matched datasets generated with standard 5’ RACE AIRR-seq and full-length isoform sequencing. Together these data demonstrate robust, unbiased FLAIRR-seq performance using RNA samples derived from peripheral blood mononuclear cells, purified B cells, and whole blood, which recapitulated results generated by commonly used methods, while additionally resolving novel IG heavy chain constant (IGHC) gene features. FLAIRR-seq data provides, for the first time, simultaneous, single-molecule characterization of IGHV, IGHD, IGHJ, and IGHC region genes and alleles, allele-resolved subisotype definition, and high-resolution identification of class-switch recombination within a clonal lineage. In conjunction with genomic sequencing and genotyping of IGHC genes, FLAIRR-seq of the IgM and IgG repertoires from 10 individuals resulted in the identification of 32 unique IGHC alleles, 28 (87%) of which were previously uncharacterized. Together, these data demonstrate the capabilities of FLAIRR-seq to characterize IGHV, IGHD, IGHJ, and IGHC gene diversity for the most comprehensive view of bulk expressed Ab repertoires to date.
1
Citation1
0
Save
19

IGHV allele similarity clustering improves genotype inference from adaptive immune receptor repertoire sequencing data

Ayelet Peres et al.Dec 27, 2022
Abstract In adaptive immune receptor repertoire analysis, determining the germline variable (V) allele associated with each T- and B-cell receptor sequence is a crucial step. This process is highly impacted by allele annotations. Aligning sequences, assigning them to specific germline alleles, and inferring individual genotypes are challenging when the repertoire is highly mutated, or sequence reads do not cover the whole V region. Here, we propose an alternative naming scheme for the V alleles as well as a novel method to infer individual genotypes. We demonstrate the strength of the two by comparing their outcomes to other genotype inference methods and validated the genotype approach with independent genomic long read data. The naming scheme is compatible with current annotation tools and pipelines. Analysis results can be converted from the proposed naming scheme to the nomenclature determined by the International Union of Immunological Societies (IUIS). Both the naming scheme and the genotype procedure are implemented in a freely available R package (PIgLET). To allow researchers to explore further the approach on real data and to adapt it for their future uses, we also created an interactive website ( https://yaarilab.github.io/IGHV_reference_book ).
19
Citation1
0
Save
33

AIRR-C Human IG Reference Sets: curated sets of immunoglobulin heavy and light chain germline genes

Andrew Collins et al.Sep 1, 2023
Abstract Analysis of an individual’s immunoglobulin (IG) gene repertoire requires the use of high-quality germline gene Reference Sets. The Adaptive Immune Receptor Repertoire-Community (AIRR-C) Reference Sets have been developed to include only human IG heavy and light chain alleles that have been confirmed by evidence from multiple high-quality sources. By including only those alleles with a high level of support, including some new sequences that currently lack official names, AIRR-seq analysis will have greater accuracy and studies of the evolution of immunoglobulin genes, their allelic variants and the expressed immune repertoire will be facilitated. Although containing less than half the previously recognised IG alleles (e.g. just 198 IGHV sequences), the Reference Sets eliminated erroneous calls and provided excellent coverage when tested on a set of repertoires from 99 individuals comprising over 4 million V(D)J rearrangements. To improve AIRR-seq analysis, some alleles have been extended to deal with short 3’ or 5’ truncations that can lead them to be overlooked by alignment utilities. To avoid other challenges for analysis programs, exact paralogs (e.g. IGHV1-69*01 and IGHV1-69D*01) are only represented once in each set, though alternative sequence names are noted in accompanying metadata. The Reference Sets also include novel alleles: 8 IGHV alleles, 2 IGKV alleles and 5 IGLV alleles. The version-tracked AIRR-C Reference Sets are freely available at the OGRDB website ( https://ogrdb.airr-community.org/germline_sets/Human ) and will be regularly updated to include newly-observed and previously-reported sequences that can be confirmed by new high-quality data.
0

Mosaic deletion patterns of the human antibody heavy chain gene locus as revealed by Bayesian haplotyping

Moriah Gidoni et al.May 4, 2018
Analysis of antibody repertoires by high throughput sequencing is of major importance in understanding adaptive immune responses. Our knowledge of variations in the genomic loci encoding antibody genes is incomplete, mostly due to technical difficulties in aligning short reads to these highly repetitive loci. The partial knowledge results in conflicting V-D-J gene assignments between different algorithms, and biased genotype and haplotype inference. Previous studies have shown that haplotypes can be inferred by taking advantage of IGHJ6 heterozygosity, observed in approximately one third of the population. Here, we propose a robust novel method for determining V-D-J haplotypes by adapting a Bayesian framework. Our method extends haplotype inference to IGHD- and IGHV -based analysis, thereby enabling inference of complex genetic events like deletions and copy number variations in the entire population. We generated the largest multi individual data set, to date, of naïve B-cell repertoires, and tested our method on it. We present evidence for allele usage bias, as well as a mosaic, tiled pattern of deleted and present IGHD and IGHV nearby genes, across the population. The inferred haplotypes and deletion patterns may have clinical implications for genetic predispositions to diseases. Our findings greatly expand the knowledge that can be extracted from antibody repertoire sequencing data.
Load More