MK
Minji Kim
Author with expertise in Regulation of Chromatin Structure and Function
Ewha Womans University, Keimyung University, Samsung Medical Center
+ 7 more
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
11
(55% Open Access)
Cited by:
700
h-index:
53
/
i10-index:
356
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
7

Wearable smart sensor systems integrated on soft contact lenses for wireless ocular diagnostics

Joohee Kim et al.May 16, 2022
+10
M
M
J
Wearable contact lenses which can monitor physiological parameters have attracted substantial interests due to the capability of direct detection of biomarkers contained in body fluids. However, previously reported contact lens sensors can only monitor a single analyte at a time. Furthermore, such ocular contact lenses generally obstruct the field of vision of the subject. Here, we developed a multifunctional contact lens sensor that alleviates some of these limitations since it was developed on an actual ocular contact lens. It was also designed to monitor glucose within tears, as well as intraocular pressure using the resistance and capacitance of the electronic device. Furthermore, in-vivo and in-vitro tests using a live rabbit and bovine eyeball demonstrated its reliable operation. Our developed contact lens sensor can measure the glucose level in tear fluid and intraocular pressure simultaneously but yet independently based on different electrical responses.
1

A Glance into the Destiny of Transcriptomic Activity, Embodied by the HOX Genes, in Neonatal and Aging Dermal Cells

Doyeong Ko et al.Oct 24, 2023
+5
Y
M
D
ABSTRACT Skin is an organ having a crucial role in the protection of muscle, bone, and internal organs and undergoing continuous self-renewal and aged. The growing interest in the prevention of skin aging and rejuvenation has sparked a surge of industrial and research studies focusing on the biological and transcriptional changes that occur during skin development and aging. In this study, we aimed to identify transcriptional differences between two main types of human skin cells: the HDFs and the HEK isolated from 30 neonatal and 30 adults (old) skin. Through differentially expressed gene (DEG) profiling using DEseq2, 604 up-, and 769 down-regulated genes were identified in the old group. The functional classification analysis using Metascape Gene Ontology and Reactome pathway was performed. We report the systematic transcriptomic changes in key biological markers involved in skin formation and maintenance and a unique difference in HOX gene families which are important for developing embryonic formation and regulating numerous biological processes. Among the 39 human HOX genes, 10 genes ( HOXA10 , 11 , 13 , HOXB13 , HOXC11 , and HOXD9 - 13 ) were significantly down-regulated, and 25 genes HOXA2 - 7 , HOXB1 - 9 , HOXC4 - 6 and 8 - 9 , and HOXD1 , 3 , 4 and 8 ) were up-regulated, especially in the old HDFs. We have successfully established a correlation between HOX genes and the process of skin aging, thereby proposing HOX genes as a novel marker for assessing skin aging. Our findings provide compelling evidence supporting the involvement of HOX genes in this biological phenomenon such as skin aging.
0

Integrative Spatial Analysis of H&E and IHC Images Identifies Prognostic Immune Subtypes Correlated with Progression-Free Survival in HPV-Related Oropharyngeal Squamous Cell Carcinoma

Sumanth Nakkireddy et al.Sep 18, 2023
+10
M
I
S
Purpose: Deep learning techniques excel at identifying tumor-infiltrating lymphocytes (TILs) and immune phenotypes in hematoxylin and eosin (H&E)-stained slides. However, their ability to elucidate detailed functional characteristics of diverse cellular phenotypes within tumor immune microenvironment (TME) is limited. We aimed to enhance our understanding of cellular composition and functional characteristics across TME regions and improve patient stratification by integrating H&E with adjacent immunohistochemistry (IHC) images. Methods: A retrospective study was conducted on patients with HPV(+) oropharyngeal squamous cell carcinoma (OPSCC). Using paired H&E and IHC slides for 11 proteins, a DL pipeline was used to quantify tumor, stroma, and TILs in the TME. Patients were classified into immune inflamed (IN), immune excluded (IE), or immune desert (ID) phenotypes. By registering the IHC and H&E slides, we integrated IHC data to capture protein expression in the corresponding tumor regions. We further stratified patients into specific immune subtypes, such as IN, with increased or reduced CD8+ cells, based on the abundance of these proteins. This characterization provided functional insight into the H&E-based subtypes. Results: Analysis of 88 primary tumors and 70 involved lymph node tissue images revealed an improved prognosis in patients classified as IN in primary tumors with high CD8 and low CD163 expression (p = 0.007). Multivariate Cox regression analysis confirmed a significantly better prognosis for these subtypes. Conclusions: Integrating H&E and IHC data enhances the functional characterization of immune phenotypes of the TME with biological interpretability, and improves patient stratification in HPV(+) OPSCC.
0

Interpretable Online Network Dictionary Learning for Inferring Long-Range Chromatin Interactions

Vishal Rana et al.Dec 25, 2023
+4
C
J
V
Abstract Dictionary learning (DL), implemented via matrix factorization (MF), is commonly used in computational biology to tackle ubiquitous clustering problems. The method is favored due to its conceptual simplicity and relatively low computational complexity. However, DL algorithms produce results that lack interpretability in terms of real biological data. Additionally, they are not optimized for graph-structured data and hence often fail to handle them in a scalable manner. In order to address these limitations, we propose a novel DL algorithm called online convex network dictionary learning (online cvxNDL). Unlike classical DL algorithms, online cvxNDL is implemented via MF and designed to handle extremely large datasets by virtue of its online nature. Importantly, it enables the interpretation of dictionary elements, which serve as cluster representatives, through convex combinations of real measurements. Moreover, the algorithm can be applied to data with a network structure by incorporating specialized subnetwork sampling techniques. To demonstrate the utility of our approach, we apply cvxNDL on 3D-genome RNAPII ChIA-Drop data with the goal of identifying important long-range interaction patterns (long-range dictionary elements). ChIA-Drop probes higher-order interactions, and produces data in the form of hypergraphs whose nodes represent genomic fragments. The hyperedges represent observed physical contacts. Our hypergraph model analysis has the objective of creating an interpretable dictionary of long-range interaction patterns that accurately represent global chromatin physical contact maps. Through the use of dictionary information, one can also associate the contact maps with RNA transcripts and infer cellular functions. To accomplish the task at hand, we focus on RNAPII-enriched ChIA-Drop data from Drosophila Melanogaster S2 cell lines. Our results offer two key insights. First, we demonstrate that online cvxNDL retains the accuracy of classical DL (MF) methods while simultaneously ensuring unique interpretability and scalability. Second, we identify distinct collections of proximal and distal interaction patterns involving chromatin elements shared by related processes across different chromosomes, as well as patterns unique to specific chromosomes. To associate the dictionary elements with biological properties of the corresponding chromatin regions, we employ Gene Ontology (GO) enrichment analysis and perform multiple RNA coexpression studies. Availability and Implementation The code and test datasets are available at:\ https://github.com/rana95vishal/chromatin_DL/ Author summary We introduce a novel method for dictionary learning termed online convex Network Dictionary Learning (online cvxNDL). The method operates in an online manner and utilizes representative subnetworks of a network dataset as dictionary elements. A key feature of online cvxNDL is its ability to work with graph-structured data and generate dictionary elements that represent convex combinations of real data points, thus ensuring interpretability. Online cvxNDL is used to investigate long-range chromatin interactions in S2 cell lines of Drosophila Melanogaster obtained through RNAPII ChIA-Drop measurements represented as hypergraphs. The results show that dictionary elements can accurately and efficiently reconstruct the original interactions present in the data, even when subjected to convexity constraints. To shed light on the biological relevance of the identified dictionaries, we perform Gene Ontology enrichment and RNA-seq coexpression analyses. These studies uncover multiple long-range interaction patterns that are chromosome-specific. Furthermore, the findings affirm the significance of convex dictionaries in representing TADs cross-validated by imaging methods (such as 3-color FISH (fluorescence in situ hybridization)).
0

ChIPWig: A Random Access-Enabling Lossless And Lossy Compression Method For ChIP-Seq Data

Vida Ravanmehr et al.May 7, 2020
O
Z
M
V
Motivation: The past decade has witnessed a rapid development of data acquisition technologies that enable integrative genomic and proteomic analysis. One such technology is chromatin immunoprecipitation sequencing (ChIP-seq), developed for analyzing interactions between proteins and DNA via next-generation sequencing technologies. As ChIP-seq experiments are inexpensive and time-efficient, massive datasets from this domain have been acquired, introducing significant storage and maintenance challenges. To address the resulting Big Data problems, we propose a state-of-the-art lossless and lossy compression framework specifically designed for ChIP-seq Wig data, termed ChIPWig. Wig is a standard file format, which in this setting contains relevant read density information crucial for visualization and downstream processing. ChIPWig may be executed in two different modes: lossless and lossy. Lossless ChIPWig compression allows for random access and fast queries in the file through careful variable-length block-wise encoding. ChIPWig also stores the summary statistics of each block needed for guided access. Lossy ChIPWig, in contrast, performs quantization of the read density values before feeding them into the lossless ChIPWig compressor. Nonuniform lossy quantization leads to further reductions in the file size, while maintaining the same accuracy of the ChIP-seq peak calling and motif discovery pipeline based on the NarrowPeaks method tailor-made for Wig files. The compressors are designed using new statistical modeling approaches coupled with delta and arithmetic encoding. Results: We tested the ChIPWig compressor on a number of ChIP-seq datasets generated by the ENCODE project. Lossless ChIPWig reduces the file sizes to merely 6% of the original, and offers an average 6-fold compression rate improvement compared to bigWig. The running times for compression and decompression are comparable to those of bigWig. The compression and decompression speed rates are of the order of 0.2 MB/sec using general purpose computers. ChIPWig with random access only slightly degrades the performance and running time when compared to the standard mode. In the lossy mode, the average file sizes reduce by 2-fold compared to the lossless mode. Most importantly, near-optimal nonuniform quantization with respect to mean-square distortion does not affect peak calling and motif discovery results on the data tested.
0

ChIA-DropBox: a novel analysis and visualization pipeline for multiplex chromatin interactions

Simon Tian et al.May 7, 2020
+3
M
D
S
ChIA-Drop is a new experimental method for mapping multiplex chromatin interactions with single-molecule precision by barcoding chromatin complexes inside microfluidics droplets, followed by pooled DNA sequencing. The chromatin DNA reads with the same droplet-specific barcodes are inferred to be derived from the same chromatin interaction complex. Here, we describe an integrated computational pipeline, named ChIA-DropBox, that is specifically designed for reconstructing chromatin reads in each droplet and refining multiplex chromatin complexes from raw ChIA-Drop sequencing reads, and then visualizing the results. First, ChIA-DropBox maps and filters sequencing reads, and then reconstructs the chromatin droplets by parsing the barcode sequences and grouping together chromatin reads with the same barcode. Based on the concept of chromosome territories that most chromatin interactions take place within the same chromosome, potential mixing up of chromatin complexes derived from different chromosomes could be readily identified and separated. Accordingly, ChIA-DropBox refines these chromatin droplets into purely intra-chromosomal chromatin complexes, ready for downstream analysis. For visualization, ChIA-DropBox converts the ChIA-Drop data to pairwise format and automatically generates input files for viewing 2D contact maps in Juicebox and viewing loops in BASIC Browser. Finally, ChIA-DropBox introduces a new browser, named ChIA-View, for interactive visualization of multiplex chromatin interactions.
1

Gut microbiota analysis of the western honeybee (Apis mellifera L.) infested with the mite Varroa destructor reveals altered bacterial and archaeal community

Minji Kim et al.Oct 24, 2023
S
W
M
Abstract The western honeybee, Apis mellifera L., is a crop pollinator that makes royal jelly and other hive products. However, widespread concerns arise about opportunistic diseases (e.g., bacteria, fungi, or mites) or chemicals that have an effect on the health and number of colonies, as well as their activity. The relationships between the gut microbiota and its host are currently being researched extensively. The effects of Varroa destructor infection on the gut microbial community, in particular, have received little investigation. This work utilized amplicon sequencing of the bacterial and archaeal 16S rRNA genes to assess the bacterial and archaeal communities of adult bee groups (healthy and affected by Varroa designed in NG and VG, respectively) and larvae from Varroa destructor -infected hives. Our results suggest that the genus Bombella was substantially dominant in larvae, while the genera Gillamella , unidentified Lactobacillaceae , and Snodgrassella were significantly dominant in adult bees. NG and VG, on the other hand, did not differ statistically significantly. The PICRUSt study revealed a significant difference in the KEGG classifications of larvae and adult bee groups. A greater number of genes involved in cofactor and vitamin production were identified in larvae. Additionally, despite the complexity of the honeybee’s bacterial community, all groups exhibited a straightforward archaeal community structure. Surprisingly, methanogen was detected in low abundance in the microbiota of honeybees. In summary, larvae and adult bees infected with Varroa destructor exhibit altered gut microbiota composition and function.
1
0
Save
4

Inferring Single-Molecule Chromatin Interactions via Online Convex Network Dictionary Learning

Jianhao Peng et al.Oct 24, 2023
+3
H
C
J
ABSTRACT Motivation Genomes of multicellular systems are compartmentalized and dynamically folded within the three-dimensional (3D) confines of the nucleus in order to facilitate gene regulation. Among the 3D-genome mapping technologies currently in use, droplet-based, barcode-linked sequencing (ChIA-Drop) has the unique capability to capture complex multi-way chromatin interactions at the single-molecule level. ChIA-Drop data gives rise to higher-order interaction networks in which nodes represent genomic fragments while (hyper)edges capture observed physical contacts. The problem of interest is to use this data to create a “dictionary” of interaction patterns (subnetworks) that accurately describe all global chromatin structures and associate dictionary elements with cellular functions. Results To construct interpretable chromatin dictionaries, we introduce a new algorithm termed online convex network dictionary learning (online cvxNDL). Unlike classical dictionary learning for image or text processing, online cvxNDL uses special subgraph sampling methods and produces interpretable subnetwork representatives corresponding to “convex mixtures” of patterns observed in real data. To demonstrate the utility of the method, we perform an in-depth study of RNAPII-enriched ChIA-Drop data from Drosophila Melanogaster S2 cell lines. Our results are two-fold: First, we show that online cvxNDL allows for accurate reconstruction of the original interaction network data using only a collection of roughly 25 dictionary elements and their “representatives” directly observed in the data. Second, we identify collections of interaction patterns of chromatin elements shared by related processes on different chromosomes and those unique to certain chromosomes. This is accomplished through Gene Ontology (GO) enrichment analysis that allows us to associate dictionary element representatives with functional properties of their corresponding chromatin region and in the process, determine what we call the “span” and “density” of chromatin interaction patterns. Availability and Implementation The code and dataset are available at: https://github.com/jianhao2016/online_cvxNDL/ Contact milenkov@illinois.edu
0

pyBedGraph: a Python package for fast operations on 1-dimensional genomic signal tracks

Henry Zhang et al.May 7, 2020
Y
J
M
H
Motivation: Modern genomic research relies heavily on next-generation sequencing experiments such as ChIP-seq and ChIA-PET that generate coverage files for transcription factor binding, as well as DHS and ATAC-seq that yield coverage files for chromatin accessibility. Such files are in a bedGraph text format or a bigWig binary format. Obtaining summary statistics in a given region is a fundamental task in analyzing protein binding intensity or chromatin accessibility. However, the existing Python package for operating on coverage files is not optimized for speed. Results: We developed pyBedGraph, a Python package to quickly obtain summary statistics for a given interval in a bedGraph file. When tested on 8 ChIP-seq and ATAC-seq datasets, pyBedGraph is on average 245 times faster than the existing program. Notably, pyBedGraph can look up the exact mean signal of 1 million regions in ~0.26 second on a conventional laptop. An approximate mean for 10,000 regions can be computed in ~0.0012 second with an error rate of less than 5 percent. Availability: pyBedGraph is publicly available at https://github.com/TheJacksonLaboratory/pyBedGraph under the MIT license.
5

Multi-Wavelength Analytical Ultracentrifugation of Biopolymer Mixtures and Interactions

Amy Henrickson et al.Oct 24, 2023
+7
A
G
A
Abstract Multi-wavelength analytical ultracentrifugation (MW-AUC) is a recent development made possible by new analytical ultracentrifuge optical systems. MW-AUC is suitable for a wide range of applications and biopolymer systems and is poised to become an essential tool to characterize macromolecular interactions. It adds an orthogonal spectral dimension to the traditional hydrodynamic characterization by exploiting unique chromophores in analyte mixtures that may or may not interact. Here we illustrate the utility of MW-AUC for representative classes of challenging biopolymer systems, including interactions between mixtures of different sized proteins with small molecules, mixtures of loaded and empty viral AAV capsids contaminated with free DNA, and mixtures of different proteins, where some have identical hydrodynamic properties, all of which are difficult to resolve with traditional AUC methods. We explain the improvement in resolution and information content obtained by this technique compared to traditional single- or dual-wavelength approaches. We discuss experimental design considerations and limitations of the method, and address the advantages and disadvantages of the two MW optical systems available today, and the differences in data analysis strategies between the two systems.
Load More