A machine learning and deep learning-based integrated multi-omics technique for leukemia prediction

Artificial neural network Cancer Research Artificial intelligence Science (General) Support vector machine Deep Learning in Medical Image Analysis Boosting (machine learning) Breast Cancer Diagnosis Q1-390 Deep Learning Automated Analysis of Blood Cell Images Artificial Intelligence Biochemistry, Genetics and Molecular Biology Machine learning Decision tree Leukemia Classification H1-99 Multi-omics Leukemia Naive Bayes classifier Life Sciences Deep learning Genomics Computer science Genomic Landscape of Cancer and Mutational Signatures Social sciences (General) Computer Science Physical Sciences Gradient boosting Medical Image Analysis Cancer Prognosis Computer Vision and Pattern Recognition Research Article Random forest
DOI: 10.1016/j.heliyon.2024.e25369 Publication Date: 2024-02-02T01:44:47Z
ABSTRACT
En los últimos años, los datos científicos sobre el cáncer se han ampliado, proporcionando potencial para una mejor comprensión de las neoplasias malignas y una mejor atención personalizada. Los avances en el poder de procesamiento de la inteligencia artificial (IA) y el desarrollo algorítmico posicionan al aprendizaje automático (ML) y al aprendizaje profundo (DL) como actores cruciales en la predicción de la leucemia, un cáncer de la sangre, utilizando tecnología multiómica integrada. Sin embargo, la realización de estos objetivos exige enfoques novedosos para aprovechar este diluvio de datos. Este estudio presenta un nuevo enfoque de diagnóstico de leucemia, analizando datos multiómicos para obtener precisión utilizando algoritmos de ML y DL. Se comparan las técnicas de ML, incluyendo Random Forest (RF), Naive Bayes (NB), Decision Tree (DT), Logistic Regression (LR), Gradient Boosting (GB) y métodos DL como Recurrent Neural Networks (RNN) y Feedforward Neural Networks (FNN). GB logró un 97 % de precisión en ML, mientras que RNN superó al lograr un 98 % de precisión en DL. Este enfoque filtra los datos no clasificados de manera efectiva, lo que demuestra la importancia de la DL para la predicción de la leucemia. La validación de la prueba se basó en 17 características diferentes, como la edad del paciente, el sexo, el tipo de mutación, los métodos de tratamiento, los cromosomas y otros. Nuestro estudio compara las técnicas de ML y DL y elige la mejor técnica que da resultados óptimos. El estudio enfatiza las implicaciones de la tecnología de alto rendimiento en la atención médica, ofreciendo una mejor atención al paciente.<br/>Ces dernières années, les données scientifiques sur le cancer se sont multipliées, offrant la possibilité de mieux comprendre les tumeurs malignes et d'améliorer les soins sur mesure. Les progrès de la puissance de traitement de l'intelligence artificielle (IA) et du développement algorithmique positionnent le Machine Learning (ML) et le Deep Learning (DL) comme des acteurs cruciaux dans la prédiction de la leucémie, un cancer du sang, en utilisant une technologie multi-omique intégrée. Cependant, la réalisation de ces objectifs exige de nouvelles approches pour exploiter ce déluge de données. Cette étude introduit une nouvelle approche de diagnostic de la leucémie, en analysant les données multi-omiques pour en déterminer la précision à l'aide d'algorithmes de ML et de DL. Les techniques ML, y compris les méthodes Random Forest (RF), Naive Bayes (NB), Decision Tree (DT), Logistic Regression (LR), Gradient Boosting (GB) et DL telles que les réseaux neuronaux récurrents (RNN) et Feedforward Neural Networks (FNN) sont comparées. Le GB a atteint une précision de 97 % en ML, tandis que le RNN a surperformé en atteignant une précision de 98 % en DL. Cette approche filtre efficacement les données non classifiées, démontrant l'importance de la DL pour la prédiction de la leucémie. La validation des tests était basée sur 17 caractéristiques différentes telles que l'âge du patient, le sexe, le type de mutation, les méthodes de traitement, les chromosomes et autres. Notre étude compare les techniques ML et DL et choisit la meilleure technique qui donne des résultats optimaux. L'étude met l'accent sur les implications de la technologie à haut débit dans les soins de santé, offrant de meilleurs soins aux patients.<br/>In recent years, scientific data on cancer has expanded, providing potential for a better understanding of malignancies and improved tailored care. Advances in Artificial Intelligence (AI) processing power and algorithmic development position Machine Learning (ML) and Deep Learning (DL) as crucial players in predicting Leukemia, a blood cancer, using integrated multi-omics technology. However, realizing these goals demands novel approaches to harness this data deluge. This study introduces a novel Leukemia diagnosis approach, analyzing multi-omics data for accuracy using ML and DL algorithms. ML techniques, including Random Forest (RF), Naive Bayes (NB), Decision Tree (DT), Logistic Regression (LR), Gradient Boosting (GB), and DL methods such as Recurrent Neural Networks (RNN) and Feedforward Neural Networks (FNN) are compared. GB achieved 97 % accuracy in ML, while RNN outperformed by achieving 98 % accuracy in DL. This approach filters unclassified data effectively, demonstrating the significance of DL for leukemia prediction. The testing validation was based on 17 different features such as patient age, sex, mutation type, treatment methods, chromosomes, and others. Our study compares ML and DL techniques and chooses the best technique that gives optimum results. The study emphasizes the implications of high-throughput technology in healthcare, offering improved patient care.<br/>في السنوات الأخيرة، توسعت البيانات العلمية حول السرطان، مما يوفر إمكانية لفهم أفضل للأورام الخبيثة وتحسين الرعاية المخصصة. يضع التقدم في قوة معالجة الذكاء الاصطناعي (AI) والتطوير الخوارزمي التعلم الآلي (ML) والتعلم العميق (DL) كلاعبين حاسمين في التنبؤ بسرطان الدم، باستخدام تقنية متكاملة متعددة الأجزاء. ومع ذلك، فإن تحقيق هذه الأهداف يتطلب مناهج جديدة لتسخير هذا الطوفان من البيانات. تقدم هذه الدراسة نهجًا جديدًا لتشخيص سرطان الدم، حيث تقوم بتحليل بيانات الأوميكس المتعددة للتأكد من دقتها باستخدام خوارزميات ML و DL. تتم مقارنة تقنيات ML، بما في ذلك الغابات العشوائية (RF)، و Naive Bayes (NB)، وشجرة القرار (DT)، والانحدار اللوجستي (LR)، وتعزيز التدرج (GB)، وطرق DL مثل الشبكات العصبية المتكررة (RNN) والشبكات العصبية المغذية (FNN). حقق GB دقة 97 ٪ في ML، في حين تفوق RNN من خلال تحقيق دقة 98 ٪ في DL. يعمل هذا النهج على تصفية البيانات غير المصنفة بشكل فعال، مما يدل على أهمية DL للتنبؤ بسرطان الدم. استند التحقق من صحة الاختبار إلى 17 ميزة مختلفة مثل عمر المريض والجنس ونوع الطفرة وطرق العلاج والكروموسومات وغيرها. تقارن دراستنا تقنيات التعلم الآلي والتعلم الرقمي وتختار أفضل التقنيات التي تعطي أفضل النتائج. تؤكد الدراسة على الآثار المترتبة على التكنولوجيا عالية الإنتاجية في مجال الرعاية الصحية، مما يوفر رعاية محسنة للمرضى.<br/>
SUPPLEMENTAL MATERIAL
Coming soon ....
REFERENCES (93)
CITATIONS (12)
EXTERNAL LINKS
PlumX Metrics
RECOMMENDATIONS
FAIR ASSESSMENT
Coming soon ....
JUPYTER LAB
Coming soon ....