A machine learning and deep learning-based integrated multi-omics technique for leukemia prediction
Artificial neural network
Cancer Research
Artificial intelligence
Science (General)
Support vector machine
Deep Learning in Medical Image Analysis
Boosting (machine learning)
Breast Cancer Diagnosis
Q1-390
Deep Learning
Automated Analysis of Blood Cell Images
Artificial Intelligence
Biochemistry, Genetics and Molecular Biology
Machine learning
Decision tree
Leukemia Classification
H1-99
Multi-omics
Leukemia
Naive Bayes classifier
Life Sciences
Deep learning
Genomics
Computer science
Genomic Landscape of Cancer and Mutational Signatures
Social sciences (General)
Computer Science
Physical Sciences
Gradient boosting
Medical Image Analysis
Cancer Prognosis
Computer Vision and Pattern Recognition
Research Article
Random forest
DOI:
10.1016/j.heliyon.2024.e25369
Publication Date:
2024-02-02T01:44:47Z
AUTHORS (8)
ABSTRACT
En los últimos años, los datos científicos sobre el cáncer se han ampliado, proporcionando potencial para una mejor comprensión de las neoplasias malignas y una mejor atención personalizada. Los avances en el poder de procesamiento de la inteligencia artificial (IA) y el desarrollo algorítmico posicionan al aprendizaje automático (ML) y al aprendizaje profundo (DL) como actores cruciales en la predicción de la leucemia, un cáncer de la sangre, utilizando tecnología multiómica integrada. Sin embargo, la realización de estos objetivos exige enfoques novedosos para aprovechar este diluvio de datos. Este estudio presenta un nuevo enfoque de diagnóstico de leucemia, analizando datos multiómicos para obtener precisión utilizando algoritmos de ML y DL. Se comparan las técnicas de ML, incluyendo Random Forest (RF), Naive Bayes (NB), Decision Tree (DT), Logistic Regression (LR), Gradient Boosting (GB) y métodos DL como Recurrent Neural Networks (RNN) y Feedforward Neural Networks (FNN). GB logró un 97 % de precisión en ML, mientras que RNN superó al lograr un 98 % de precisión en DL. Este enfoque filtra los datos no clasificados de manera efectiva, lo que demuestra la importancia de la DL para la predicción de la leucemia. La validación de la prueba se basó en 17 características diferentes, como la edad del paciente, el sexo, el tipo de mutación, los métodos de tratamiento, los cromosomas y otros. Nuestro estudio compara las técnicas de ML y DL y elige la mejor técnica que da resultados óptimos. El estudio enfatiza las implicaciones de la tecnología de alto rendimiento en la atención médica, ofreciendo una mejor atención al paciente.<br/>Ces dernières années, les données scientifiques sur le cancer se sont multipliées, offrant la possibilité de mieux comprendre les tumeurs malignes et d'améliorer les soins sur mesure. Les progrès de la puissance de traitement de l'intelligence artificielle (IA) et du développement algorithmique positionnent le Machine Learning (ML) et le Deep Learning (DL) comme des acteurs cruciaux dans la prédiction de la leucémie, un cancer du sang, en utilisant une technologie multi-omique intégrée. Cependant, la réalisation de ces objectifs exige de nouvelles approches pour exploiter ce déluge de données. Cette étude introduit une nouvelle approche de diagnostic de la leucémie, en analysant les données multi-omiques pour en déterminer la précision à l'aide d'algorithmes de ML et de DL. Les techniques ML, y compris les méthodes Random Forest (RF), Naive Bayes (NB), Decision Tree (DT), Logistic Regression (LR), Gradient Boosting (GB) et DL telles que les réseaux neuronaux récurrents (RNN) et Feedforward Neural Networks (FNN) sont comparées. Le GB a atteint une précision de 97 % en ML, tandis que le RNN a surperformé en atteignant une précision de 98 % en DL. Cette approche filtre efficacement les données non classifiées, démontrant l'importance de la DL pour la prédiction de la leucémie. La validation des tests était basée sur 17 caractéristiques différentes telles que l'âge du patient, le sexe, le type de mutation, les méthodes de traitement, les chromosomes et autres. Notre étude compare les techniques ML et DL et choisit la meilleure technique qui donne des résultats optimaux. L'étude met l'accent sur les implications de la technologie à haut débit dans les soins de santé, offrant de meilleurs soins aux patients.<br/>In recent years, scientific data on cancer has expanded, providing potential for a better understanding of malignancies and improved tailored care. Advances in Artificial Intelligence (AI) processing power and algorithmic development position Machine Learning (ML) and Deep Learning (DL) as crucial players in predicting Leukemia, a blood cancer, using integrated multi-omics technology. However, realizing these goals demands novel approaches to harness this data deluge. This study introduces a novel Leukemia diagnosis approach, analyzing multi-omics data for accuracy using ML and DL algorithms. ML techniques, including Random Forest (RF), Naive Bayes (NB), Decision Tree (DT), Logistic Regression (LR), Gradient Boosting (GB), and DL methods such as Recurrent Neural Networks (RNN) and Feedforward Neural Networks (FNN) are compared. GB achieved 97 % accuracy in ML, while RNN outperformed by achieving 98 % accuracy in DL. This approach filters unclassified data effectively, demonstrating the significance of DL for leukemia prediction. The testing validation was based on 17 different features such as patient age, sex, mutation type, treatment methods, chromosomes, and others. Our study compares ML and DL techniques and chooses the best technique that gives optimum results. The study emphasizes the implications of high-throughput technology in healthcare, offering improved patient care.<br/>في السنوات الأخيرة، توسعت البيانات العلمية حول السرطان، مما يوفر إمكانية لفهم أفضل للأورام الخبيثة وتحسين الرعاية المخصصة. يضع التقدم في قوة معالجة الذكاء الاصطناعي (AI) والتطوير الخوارزمي التعلم الآلي (ML) والتعلم العميق (DL) كلاعبين حاسمين في التنبؤ بسرطان الدم، باستخدام تقنية متكاملة متعددة الأجزاء. ومع ذلك، فإن تحقيق هذه الأهداف يتطلب مناهج جديدة لتسخير هذا الطوفان من البيانات. تقدم هذه الدراسة نهجًا جديدًا لتشخيص سرطان الدم، حيث تقوم بتحليل بيانات الأوميكس المتعددة للتأكد من دقتها باستخدام خوارزميات ML و DL. تتم مقارنة تقنيات ML، بما في ذلك الغابات العشوائية (RF)، و Naive Bayes (NB)، وشجرة القرار (DT)، والانحدار اللوجستي (LR)، وتعزيز التدرج (GB)، وطرق DL مثل الشبكات العصبية المتكررة (RNN) والشبكات العصبية المغذية (FNN). حقق GB دقة 97 ٪ في ML، في حين تفوق RNN من خلال تحقيق دقة 98 ٪ في DL. يعمل هذا النهج على تصفية البيانات غير المصنفة بشكل فعال، مما يدل على أهمية DL للتنبؤ بسرطان الدم. استند التحقق من صحة الاختبار إلى 17 ميزة مختلفة مثل عمر المريض والجنس ونوع الطفرة وطرق العلاج والكروموسومات وغيرها. تقارن دراستنا تقنيات التعلم الآلي والتعلم الرقمي وتختار أفضل التقنيات التي تعطي أفضل النتائج. تؤكد الدراسة على الآثار المترتبة على التكنولوجيا عالية الإنتاجية في مجال الرعاية الصحية، مما يوفر رعاية محسنة للمرضى.<br/>
SUPPLEMENTAL MATERIAL
Coming soon ....
REFERENCES (93)
CITATIONS (12)
EXTERNAL LINKS
PlumX Metrics
RECOMMENDATIONS
FAIR ASSESSMENT
Coming soon ....
JUPYTER LAB
Coming soon ....