XD
Xiaofeng Dai
Author with expertise in RNA Sequencing Data Analysis
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
8
(50% Open Access)
Cited by:
5
h-index:
33
/
i10-index:
91
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Nanopore-based genome assembly and the evolutionary genomics of basmati rice

Jae Choi et al.Aug 20, 2018
+7
S
Z
J
ABSTRACT BACKGROUND The circum- basmati group of cultivated Asian rice ( Oryza sativa ) contains many iconic varieties and is widespread in the Indian subcontinent. Despite its economic and cultural importance, a high-quality reference genome is currently lacking, and the group’s evolutionary history is not fully resolved. To address these gaps, we used long-read nanopore sequencing and assembled the genomes of two circum -basmati rice varieties, Basmati 334 and Dom Sufid. RESULTS We generated two high-quality, chromosome-level reference genomes that represented the 12 chromosomes of Oryza . The assemblies showed a contig N50 of 6.32Mb and 10.53Mb for Basmati 334 and Dom Sufid, respectively. Using our highly contiguous assemblies we characterized structural variations segregating across circum- basmati genomes. We discovered repeat expansions not observed in japonica—the rice group most closely related to circum- basmati—as well as presence/absence variants of over 20Mb, one of which was a circum- basmati-specific deletion of a gene regulating awn length. We further detected strong evidence of admixture between the circum- basmati and circum- aus groups. This gene flow had its greatest effect on chromosome 10, causing both structural variation and single nucleotide polymorphism to deviate from genome-wide history. Lastly, population genomic analysis of 78 circum- basmati varieties showed three major geographically structured genetic groups: (1) Bhutan/Nepal group, (2) India/Bangladesh/Myanmar group, and (3) Iran/Pakistan group. CONCLUSION Availability of high-quality reference genomes from nanopore sequencing allowed functional and evolutionary genomic analyses, providing genome-wide evidence for gene flow between circum -aus and circum -basmati, the nature of circum -basmati structural variation, and the presence/absence of genes in this important and iconic rice variety group.
0
Citation4
0
Save
25

Selection on old variants drives adaptive radiation ofMetrosiderosacross the Hawaiian Islands

Jae Choi et al.Nov 3, 2020
+8
J
X
J
Abstract Some of the most spectacular adaptive radiations begin with founder populations on remote islands. How genetically limited founder populations give rise to the striking phenotypic and ecological diversity characteristic of adaptive radiations is a paradox of evolutionary biology. We conducted an evolutionary genomic analysis of genus Metrosideros , a landscape-dominant, incipient adaptive radiation of woody plants that spans a striking range of phenotypes and environments across the Hawaiian Islands. Using nanopore-sequencing, we created a chromosome-level genome assembly for M. polymorpha var. incana and analyzed wholegenome sequences of 131 individuals from 11 taxa sampled across the islands. We found evidence of population structure that grouped taxa by island. Demographic modeling showed concordance between the divergence times of island-specific lineages and the geological formation of individual islands. Gene flow was also detected within and between island taxa, suggesting a complex reticulated evolutionary history. We investigated genomic regions with increased differentiation as these regions may harbor variants involved in local adaptation or reproductive isolation, thus forming the genomic basis of adaptive radiation. We discovered differentiation outliers have arisen from balancing selection on ancient divergent haplotypes that formed before the initial colonization of the archipelago. These regions experienced recurrent divergent selection as lineages colonized and diversified on new islands, and hybridization likely facilitated the transfer of these ancient variants between taxa. Balancing selection on multiple ancient haplotypes–or time-tested variants–may help to explain how lineages with limited gene pools can rapidly diversify to fill myriad ecological niches on remote islands. Significance statement Some of the most spectacular adaptive radiations of plants and animals occur on remote oceanic islands, yet such radiations are preceded by founding events that severely limit genetic variation. How genetically depauperate founder populations give rise to the spectacular phenotypic and ecological diversity characteristic of island adaptive radiations is not known. We generated novel genomic resources for Hawaiian Metrosideros ––a hyper-variable incipient adaptive radiation of woody taxa—for insights into the paradox of remote island radiations. We found that Metrosideros colonized each island shortly after formation and diversified within islands through recurrent selection on ancient variations that predate the radiation. Recurring use of ancient variants may explain how genetically depauperate lineages can diversify to fill countless niches on remote islands.
25
Citation1
0
Save
72

Borg extrachromosomal elements of methane-oxidizing archaea have conserved and expressed genetic repertoires

Marie Schoelmerich et al.Aug 1, 2023
+16
J
L
M
Abstract Borgs are huge extrachromosomal elements (ECE) of anaerobic methane-consuming “ Candidatus Methanoperedens” archaea. Here, we used nanopore sequencing to validate published complete genomes curated from short reads and to reconstruct new genomes. 13 complete and four near-complete linear genomes share 40 genes that define a largely syntenous genome backbone. We use these conserved genes to identify new Borgs from peatland soil and to delineate Borg phylogeny, revealing two major clades. Remarkably, Borg genes encoding OmcZ nanowire-like electron-exporting cytochromes and cell surface proteins are more highly expressed than those of host Methanoperedens , indicating that Borgs augment the Methanoperedens activity in situ . We reconstructed the first complete 4.00 Mbp genome for a Methanoperedens that is inferred to be a Borg host and predicted its methylation motifs, which differ from pervasive TC and CC methylation motifs of the Borgs. Thus, methylation may enable Methanoperedens to distinguish their genomes from those of Borgs. Very high Borg to Methanoperedens ratios and structural predictions suggest that Borgs may be capable of encapsulation. The findings clearly define Borgs as a distinct class of ECE with shared genomic signatures, establish their diversification from a common ancestor with genetic inheritance, and raise the possibility of periodic existence outside of host cells.
72
0
Save
0

Assembly-free single-molecule nanopore sequencing recovers complete virus genomes from natural microbial communities

John Beaulaurier et al.Apr 26, 2019
+8
J
E
J
Viruses are the most abundant biological entities on Earth, and play key roles in host ecology, evolution, and horizontal gene transfer. Despite recent progress in viral metagenomics, the inherent genetic complexity of virus populations still poses technical difficulties for recovering complete virus genomes from natural assemblages. To address these challenges, we developed an assembly-free, single-molecule nanopore sequencing approach enabling direct recovery of high-quality viral genome sequences from environmental samples. Our method yielded over a thousand high quality, full-length draft virus genome sequences that could not be fully recovered using short read assembly approaches applied to the same samples. Additionally, novel DNA sequences were discovered whose repeat structures, gene contents and concatemer lengths suggested that they represent phage-inducible chromosomal islands that were packaged as concatemers within phage particles. Our new approach provided novel insight into genome structures, population biology, and ecology of naturally occurring viruses and viral parasites.
0

Complete assembly of novel environmental bacterial genomes by MinIONTM sequencing

Daniel Turner et al.Sep 19, 2015
+2
S
X
D
In this study, we adapt a protocol for the growth of previously uncultured environmental bacterial isolates, to make it compatible with whole genome sequencing. We demonstrate that in combination with the MinION sequencing device, complete assemblies can be derived, allowing genomic comparisons to be made. This approach allows rapid, inexpensive and straightforward discovery, and genomic analysis, of previously uncultured prokaryotic genomes, and brings greater ownership of all parts of the sequencing process back to individual researchers.
0

What's in my pot? Real-time species identification on the MinION

Sissel Juul et al.Nov 6, 2015
+6
A
F
S
Whole genome sequencing on next-generation instruments provides an unbiased way to identify the organisms present in complex metagenomic samples. However, the time-to-result can be protracted because of fixed-time sequencing runs and cumbersome bioinformatics workflows. This limits the utility of the approach in settings where rapid species identification is crucial, such as in the quality control of food-chain components, or in during an outbreak of an infectious disease. Here we present What′s in my Pot? (WIMP), a laboratory and analysis workflow in which, starting with an unprocessed sample, sequence data is generated and bacteria, viruses and fungi present in the sample are classified to subspecies and strain level in a quantitative manner, without prior knowledge of the sample composition, in approximately 3.5 hours. This workflow relies on the combination of Oxford Nanopore Technologies′ MinION ™ sensing device with a real-time species identification bioinformatics application.
0

Natural-abundance 17O NMR spectroscopy of magnetically aligned lipid nanodiscs

Thirupathi Ravula et al.May 31, 2020
A
B
X
T
Natural-abundance 17 O NMR experiments are used to investigate the hydrated water in magnetically alligned synthetic polymer based lipid-nanodiscs. Residual quadrupole couplings (RQCs) measured from the observed five 17 O (central and satellite) transitions, and molecular dynamics simulations, are used to probe the ordering of water moecules across the lipid bilayer.
0

Nanopore sequencing of DNA concatemers reveals higher-order features of chromatin structure

Netha Ulahannan et al.Nov 7, 2019
+16
A
M
N
Higher-order chromatin structure arises from the combinatorial physical interactions of many genomic loci. To investigate this aspect of genome architecture we developed Pore-C, which couples chromatin conformation capture with Oxford Nanopore Technologies (ONT) long reads to directly sequence multi-way chromatin contacts without amplification. In GM12878, we demonstrate that the pairwise interaction patterns implicit in Pore-C multi-way contacts are consistent with gold standard Hi-C pairwise contact maps at the compartment, TAD, and loop scales. In addition, Pore-C also detects higher-order chromatin structure at 18.5-fold higher efficiency and greater fidelity than SPRITE, a previously published higher-order chromatin profiling technology. We demonstrate Pore-C's ability to detect and visualize multi-locus hubs associated with histone locus bodies and active / inactive nuclear compartments in GM12878. In the breast cancer cell line HCC1954, Pore-C contacts enable the reconstruction of complex and aneuploid rearranged alleles spanning multiple megabases and chromosomes. Finally, we apply Pore-C to generate a chromosome scale de novo assembly of the HG002 genome. Our results establish Pore-C as the most simple and scalable assay for the genome-wide assessment of combinatorial chromatin interactions, with additional applications for cancer rearrangement reconstruction and de novo genome assembly.