MM
Muhammad Mujahid
Author with expertise in Deep Learning in Medical Image Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
7
(71% Open Access)
Cited by:
186
h-index:
8
/
i10-index:
7
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Sentiment Analysis and Topic Modeling on Tweets about Online Education during COVID-19

Muhammad Mujahid et al.Sep 12, 2021
Amid the worldwide COVID-19 pandemic lockdowns, the closure of educational institutes leads to an unprecedented rise in online learning. For limiting the impact of COVID-19 and obstructing its widespread, educational institutions closed their campuses immediately and academic activities are moved to e-learning platforms. The effectiveness of e-learning is a critical concern for both students and parents, specifically in terms of its suitability to students and teachers and its technical feasibility with respect to different social scenarios. Such concerns must be reviewed from several aspects before e-learning can be adopted at such a larger scale. This study endeavors to investigate the effectiveness of e-learning by analyzing the sentiments of people about e-learning. Due to the rise of social media as an important mode of communication recently, people’s views can be found on platforms such as Twitter, Instagram, Facebook, etc. This study uses a Twitter dataset containing 17,155 tweets about e-learning. Machine learning and deep learning approaches have shown their suitability, capability, and potential for image processing, object detection, and natural language processing tasks and text analysis is no exception. Machine learning approaches have been largely used both for annotation and text and sentiment analysis. Keeping in view the adequacy and efficacy of machine learning models, this study adopts TextBlob, VADER (Valence Aware Dictionary for Sentiment Reasoning), and SentiWordNet to analyze the polarity and subjectivity score of tweets’ text. Furthermore, bearing in mind the fact that machine learning models display high classification accuracy, various machine learning models have been used for sentiment classification. Two feature extraction techniques, TF-IDF (Term Frequency-Inverse Document Frequency) and BoW (Bag of Words) have been used to effectively build and evaluate the models. All the models have been evaluated in terms of various important performance metrics such as accuracy, precision, recall, and F1 score. The results reveal that the random forest and support vector machine classifier achieve the highest accuracy of 0.95 when used with Bow features. Performance comparison is carried out for results of TextBlob, VADER, and SentiWordNet, as well as classification results of machine learning models and deep learning models such as CNN (Convolutional Neural Network), LSTM (Long Short Term Memory), CNN-LSTM, and Bi-LSTM (Bidirectional-LSTM). Additionally, topic modeling is performed to find the problems associated with e-learning which indicates that uncertainty of campus opening date, children’s disabilities to grasp online education, and lagging efficient networks for online education are the top three problems.
0

Data oversampling and imbalanced datasets: an investigation of performance for machine learning and feature engineering

Muhammad Mujahid et al.Jun 17, 2024
Abstract The classification of imbalanced datasets is a prominent task in text mining and machine learning. The number of samples in each class is not uniformly distributed; one class contains a large number of samples while the other has a small number. Overfitting of the model occurs as a result of imbalanced datasets, resulting in poor performance. In this study, we compare different oversampling techniques like synthetic minority oversampling technique (SMOTE), support vector machine SMOTE (SVM-SMOTE), Border-line SMOTE, K-means SMOTE, and adaptive synthetic (ADASYN) oversampling to address the issue of imbalanced datasets and enhance the performance of machine learning models. Preprocessing significantly enhances the quality of input data by reducing noise, redundant data, and unnecessary data. This enables the machines to identify crucial patterns that facilitate the extraction of significant and pertinent information from the preprocessed data. This study preprocesses the data using various top-level preprocessing steps. Furthermore, two imbalanced Twitter datasets are used to compare the performance of oversampling techniques with six machine learning models including random forest (RF), SVM, K-nearest neighbor (KNN), AdaBoost (ADA), logistic regression (LR), and decision tree (DT). In addition, the bag of words (BoW) and term frequency and inverse document frequency (TF-IDF) features extraction approaches are used to extract features from the tweets. The experiments indicate that SMOTE and ADASYN perform much better than other techniques thus providing higher accuracy. Additionally, overall results show that SVM with ’linear’ kernel tends to attain the highest accuracy and recall score of 99.67% and 1.00% on ADASYN oversampled datasets and 99.57% accuracy on SMOTE oversampled dataset with TF-IDF features. The SVM model using 10-fold cross-validation experiments achieved 97.40 mean accuracy with a 0.008 standard deviation. Our approach achieved 2.62% greater accuracy as compared to other current methods.
0
Citation1
0
Save
1

Efficient deep learning-based approach for malaria detection using red blood cell smears

Muhammad Mujahid et al.Jun 10, 2024
Malaria is an extremely malignant disease and is caused by the bites of infected female mosquitoes. This disease is not only infectious among humans, but among animals as well. Malaria causes mild symptoms like fever, headache, sweating and vomiting, and muscle discomfort; severe symptoms include coma, seizures, and kidney failure. The timely identification of malaria parasites is a challenging and chaotic endeavor for health staff. An expert technician examines the schematic blood smears of infected red blood cells through a microscope. The conventional methods for identifying malaria are not efficient. Machine learning approaches are effective for simple classification challenges but not for complex tasks. Furthermore, machine learning involves rigorous feature engineering to train the model and detect patterns in the features. On the other hand, deep learning works well with complex tasks and automatically extracts low and high-level features from the images to detect disease. In this paper, EfficientNet, a deep learning-based approach for detecting Malaria, is proposed that uses red blood cell images. Experiments are carried out and performance comparison is made with pre-trained deep learning models. In addition, k-fold cross-validation is also used to substantiate the results of the proposed approach. Experiments show that the proposed approach is 97.57% accurate in detecting Malaria from red blood cell images and can be beneficial practically for medical healthcare staff.
0

Early‐Stage Melanoma Cancer Diagnosis Framework for Imbalanced Data From Dermoscopic Images

Amjad Rehman et al.Nov 21, 2024
Skin problems are a serious condition that affects people all over the world. Prolonged exposure to ultraviolet rays' damages melanocyte cells, leading to the uncontrolled proliferation of melanoma, a form of skin cancer. However, the dearth of qualified expertise increases the processing time and cost of diagnosis. Early detection of melanoma in dermoscopy images significantly enhances its chance of survival. Pathologists benefit substantially from the precise and efficient melanoma cancer diagnosis using automated methods. Nevertheless, the diagnosis of melanoma has consistently been a challenging procedure due to the imbalance images and limited data. Our objective was to employ a novel deep method to diagnose melanoma from dermoscopic images automatically. The research has proposed a novel framework for detecting skin malignancies. The proposed plan, which includes CNN, DenseNet, a batch normalization layer, maxpooling, and a ReLU layer activation function, solves the overfitting problem well. Furthermore, we used a large number of samples for testing and effectively employed data augmentation to prevent any issues related to class imbalance. The Adam optimizer is the most efficient deep learning optimizer for addressing challenges associated with large datasets, such as lengthy processing times. This is due to its specifically designed algorithm. Experiments ensure that the proposed framework achieved 95.70% micro average accuracy on the ISIC-2019 dataset and 93.24% accuracy on the HAM-10000 dataset. Comprehensive evaluation and analysis were used to evaluate our framework's performance. The results show that the proposed approach performs better with cross-validation by 94.8% accuracy than the most sophisticated deep learning-based technique. During studies, medical professionals will employ the proposed model to identify skin cancer in its early stages.
0

Breast histopathological imaging using ultra‐fast fluorescence confocal microscopy to identify cancer lesions at early stage

Muhammad Mujahid et al.Aug 10, 2024
Ultrafast fluorescent confocal microscopy is a hypothetical approach for breast cancer detection because of its potential to achieve instantaneous, high-resolution images of cellular-level tissue features. Traditional approaches such as mammography and biopsy are laborious, invasive, and inefficient; confocal microscopy offers many benefits over these approaches. However, confocal microscopy enables the exact differentiation of malignant cells, the expeditious examination of extensive tissue sections, and the optical sectioning of tissue samples into tiny slices. The primary goal should be to prevent cancer altogether, although detecting it early can help achieve that objective. This research presents a novel Breast Histopathology Convolutional Neural Network (BHCNN) for feature extraction and recursive feature elimination method for selecting the most significant features. The proposed approach utilizes full slide images to identify tissue in regions affected by invasive ductal carcinoma. In addition, a transfer learning approach is employed to enhance the performance and accuracy of the models in detecting breast cancer, while also reducing computation time by modifying the final layer of the proposed model. The results showed that the BHCNN model outperformed other models in terms of accuracy, achieving a testing accuracy of 98.42% and a training accuracy of 99.94%. The confusion matrix results show that the IDC positive (+) class achieved 97.44% accuracy and 2.56% inaccurate results, while the IDC negative (-) class achieved 98.73% accuracy and 1.27% inaccurate results. Furthermore, the model achieved less than 0.05 validation loss. RESEARCH HIGHLIGHTS: The objective is to develop an innovative framework using ultra-fast fluorescence confocal microscopy, particularly for the challenging problem of breast cancer diagnosis. This framework will extract essential features from microscopy and employ a gradient recurrent unit for detection. The proposed research offers significant potential in enhancing medical imaging through the provision of a reliable and resilient system for precise diagnosis of breast cancer, thereby propelling the progression of state-of-the-art medical technology. The most suitable feature was determined using BHRFE optimization techniques after retrieving the features by proposed model. Finally, the features chosen are integrated into a proposed methodology, which is then classified using a GRU deep model. The aforementioned research has significant potential to improve medical imaging by providing a complex and reliable system for precise evaluation of breast cancer, hence advancing the development of cutting-edge medical technology.