Machine learning prediction of gestational age from metabolic screening markers resistant to ambient temperature transportation: Facilitating use of this technology in low resource settings of South Asia and East Africa

Pulmonary and Respiratory Medicine Technology Clinical Biochemistry Gestational Age Tanzania Environmental science Analyte Machine Learning 03 medical and health sciences 0302 clinical medicine Pregnancy Biochemistry, Genetics and Molecular Biology Dry Ice Health Sciences FOS: Mathematics Genetics Humans Pakistan Neonatal Lung Development and Respiratory Morbidity Molecular Biology Biology Internal medicine Chromatography Inborn Errors of Metabolism Confidence interval Statistics Infant, Newborn Temperature Infant Life Sciences Gestational age Articles Advances in Metabolomics Research Chemistry Environmental health FOS: Biological sciences Medicine Mean squared error Female Metabolic Disorders and Biochemical Genetics Gestation Mathematics
DOI: 10.7189/jogh.12.04021 Publication Date: 2022-04-21T16:56:22Z
ABSTRACT
Contexte La connaissance de l'âge gestationnel est essentielle pour guider les soins néonatals prématurés. Au cours de la dernière décennie, des approches de datation métabolique gestationnelle ont émergé en réponse à un besoin de santé mondial ; parce que dans la plupart des pays en développement, des estimations précises de l'âge gestationnel prénatal ne sont pas réalisables. Ces méthodes initialement développées en Amérique du Nord ont maintenant été validées en externe dans deux études dans les pays en développement, mais nécessitent l'expédition d'échantillons à une température inférieure à zéro. Méthodes Un sous-ensemble de 330 paires d'échantillons de taches de sang séché par piqûre au talon ont été expédiés sur de la glace sèche et à température ambiante de sites de terrain en Tanzanie, au Bangladesh et au Pakistan au laboratoire de l'Iowa (États-Unis). Nous avons évalué l'impact sur la récupération des analytes de la température d'expédition, développé et évalué des modèles pour prédire l'âge gestationnel en utilisant un ensemble limité d'analytes de dépistage métabolique après avoir exclu 17 analytes qui ont été impactés par les conditions d'expédition d'un total de 44 analytes. Résultats : Avec le modèle d'apprentissage automatique utilisant tous les analytes, les échantillons expédiés dans de la glace sèche ont donné une erreur quadratique moyenne (RMSE) de 1,19 semaine contre 1,58 semaine pour les échantillons expédiés à température ambiante. Sur les 44 analytes de criblage, la récupération de 17 analytes était significativement différente entre les deux méthodes d'expédition et celles-ci ont été exclues du développement ultérieur du modèle d'apprentissage automatique. Le modèle final, limité aux analytes stables, a donné une RMSE de 1,24 (intervalle de confiance à 95 % (IC) = 1,10-1,37)semaines pour les échantillons expédiés sur de la glace sèche et une RMSE de 1,28 (IC à 95 % = 1,15-1,39)pour les échantillons expédiés à température ambiante. L'analyse pour discriminer les naissances prématurées (âge gestationnel <37 semaines), a donné une aire sous la courbe (ASC) de 0,76 (IC à 95 % = 0,71-0,81)pour les échantillons expédiés sur de la glace sèche et une ASC de 0,73 (IC à 95 % = 0,67-0,78)pour les échantillons expédiés à température ambiante. ConclusionsDans cette étude, nous démontrons que les algorithmes d'apprentissage automatique développés à l'aide d'un sous-ensemble d'analytes de dépistage néonatals qui ne sont pas sensibles à l'expédition à température ambiante, peuvent fournir avec précision des estimations de l'âge gestationnel comparables à celles des modèles de régression publiés en Amérique du Nord utilisant tous les analytes. Si elles sont validées dans des échantillons plus grands, en particulier avec plus de nouveau-nés <34 semaines, cette technologie pourrait considérablement faciliter la mise en œuvre dans les PRFI.<br/>Antecedentes El conocimiento de la edad gestacional es fundamental para guiar la atención neonatal prematura. En la última década, los enfoques de datación gestacional metabólica surgieron en respuesta a una necesidad de salud global; porque en la mayor parte del mundo en desarrollo, las estimaciones precisas de la edad gestacional prenatal no son factibles. Estos métodos desarrollados inicialmente en América del Norte ahora se han validado externamente en dos estudios en países en desarrollo, sin embargo, requieren el envío de muestras a temperatura bajo cero. Métodos Un subconjunto de 330 pares de muestras de manchas de sangre seca en el talón se enviaron en hielo seco y a temperatura ambiente desde sitios de campo en Tanzania, Bangladesh y Pakistán al laboratorio en Iowa (EE. UU.). Evaluamos el impacto en la recuperación de analitos de la temperatura de envío, desarrollamos y evaluamos modelos para predecir la edad gestacional utilizando un conjunto limitado de analitos de detección metabólica después de excluir 17 analitos que se vieron afectados por las condiciones de envío de un total de 44 analitos. ResultadosCon el modelo de aprendizaje automático que utiliza todos los analitos, las muestras enviadas en hielo seco produjeron un error cuadrático medio (RMSE) de 1,19 semanas en comparación con 1,58 semanas para las muestras enviadas a temperatura ambiente. De los 44 analitos de selección, la recuperación de 17 analitos fue significativamente diferente entre los dos métodos de envío y estos se excluyeron del desarrollo posterior del modelo de aprendizaje automático. El modelo final, restringido a analitos estables, proporcionó un RMSE de 1,24 (intervalo de confianza (IC) del 95% = 1,10-1,37)semanas para las muestras enviadas en hielo seco y un RMSE de 1,28 (IC del 95% = 1,15-1,39)para las muestras enviadas a temperatura ambiente. El análisis para discriminar los nacimientos prematuros (edad gestacional <37 semanas), produjo un área bajo la curva (AUC) de 0,76 (IC del 95% = 0,71-0,81)para las muestras enviadas en hielo seco y un AUC de 0,73 (IC del 95% = 0,67-0,78)para las muestras enviadas a temperatura ambiente. Conclusiones En este estudio, demostramos que los algoritmos de aprendizaje automático desarrollados utilizando un subconjunto de analitos de detección de recién nacidos que no son sensibles al envío a temperatura ambiente, pueden proporcionar con precisión estimaciones de la edad gestacional comparables a las de los modelos de regresión publicados de América del Norte utilizando todos los analitos. Si se valida en muestras más grandes, especialmente con más recién nacidos <34 semanas, esta tecnología podría facilitar sustancialmente la implementación en LMIC.<br/>المعرفة الأساسية بعمر الحمل أمر بالغ الأهمية لتوجيه رعاية الأطفال حديثي الولادة قبل الأوان. في العقد الماضي، ظهرت مناهج التأريخ الحملي الأيضي استجابة لحاجة صحية عالمية ؛ لأنه في معظم العالم النامي، لا يمكن إجراء تقديرات دقيقة لعمر الحمل قبل الولادة. وقد تم الآن التحقق من صحة هذه الأساليب التي تم تطويرها في البداية في أمريكا الشمالية في دراستين في البلدان النامية، ومع ذلك، تتطلب شحن عينات عند درجة حرارة دون الصفر. تم شحن مجموعة فرعية من 330 زوجًا من عينات بقع الدم المجففة ذات الكعب على الجليد الجاف وفي درجة الحرارة المحيطة من المواقع الميدانية في تنزانيا وبنغلاديش وباكستان إلى المختبر في ولاية أيوا (الولايات المتحدة الأمريكية). تم تقييم التأثير على استرداد تحليلات درجة حرارة الشحن، وتطوير وتقييم نماذج للتنبؤ بعمر الحمل باستخدام مجموعة محدودة من تحليلات الفحص الأيضي بعد استبعاد 17 تحليلًا تأثرت بظروف الشحن لما مجموعه 44 تحليلًا. النتائج مع نموذج التعلم الآلي باستخدام جميع التحليلات، أسفرت العينات التي تم شحنها في الثلج الجاف عن خطأ مربع متوسط الجذر (RMSE) لمدة 1.19 أسبوعًا مقارنة بـ 1.58 أسبوعًا للعينات التي تم شحنها في درجة الحرارة المحيطة. من بين 44 تحليلًا للفحص، كان استرداد 17 تحليلًا مختلفًا اختلافًا كبيرًا بين طريقتي الشحن وتم استبعادهما من تطوير نموذج التعلم الآلي. قدم النموذج النهائي، الذي يقتصر على التحليلات المستقرة، RMSE بنسبة 1.24 (فاصل ثقة 95 ٪ (CI) = 1.10-1.37)أسبوعًا للعينات التي تم شحنها على الثلج الجاف و RMSE بنسبة 1.28 (95 ٪ CI = 1.15-1.39)للعينات التي تم شحنها في درجة الحرارة المحيطة. تحليل لتمييز الولادات قبل الولادة (عمر الحمل أقل من 37 أسبوعًا)، أسفرت عن منطقة تحت المنحنى (AUC) بنسبة 0.76 (95 ٪ CI = 0.71-0.81)للعينات التي تم شحنها على الثلج الجاف و AUC بنسبة 0.73 (95 ٪ CI = 0.67-0.78)للعينات التي تم شحنها في درجة الحرارة المحيطة. الاستنتاجات في هذه الدراسة، نثبت أن خوارزميات التعلم الآلي التي تم تطويرها باستخدام مجموعة فرعية من تحليلات فحص حديثي الولادة غير الحساسة للشحن في درجة الحرارة المحيطة، يمكن أن توفر بدقة تقديرات لعمر الحمل مماثلة لتلك الموجودة في نماذج الانحدار المنشورة من أمريكا الشمالية باستخدام جميع التحليلات. إذا تم التحقق من صحتها في عينات أكبر خاصة مع المزيد من الأطفال حديثي الولادة <34 أسبوعًا، يمكن لهذه التقنية أن تسهل التنفيذ بشكل كبير في البلدان منخفضة ومتوسطة الدخل.<br/>Background Knowledge of gestational age is critical for guiding preterm neonatal care.In the last decade, metabolic gestational dating approaches emerged in response to a global health need; because in most of the developing world, accurate antenatal gestational age estimates are not feasible.These methods initially developed in North America have now been externally validated in two studies in developing countries, however, require shipment of samples at sub-zero temperature.Methods A subset of 330 pairs of heel prick dried blood spot samples were shipped on dry ice and in ambient temperature from field sites in Tanzania, Bangladesh and Pakistan to laboratory in Iowa (USA).We evaluated impact on recovery of analytes of shipment temperature, developed and evaluated models for predicting gestational age using a limited set of metabolic screening analytes after excluding 17 analytes that were impacted by shipment conditions of a total of 44 analytes. ResultsWith the machine learning model using all the analytes, samples shipped in dry ice yielded a Root Mean Square Error (RMSE) of 1.19 weeks compared to 1.58 weeks for samples shipped in ambient temperature.Out of the 44 screening analytes, recovery of 17 analytes was significantly different between the two shipment methods and these were excluded from further machine learning model development.The final model, restricted to stable analytes provided a RMSE of 1.24 (95% confidence interval (CI) = 1.10-1.37)weeks for samples shipped on dry ice and RMSE of 1.28 (95% CI = 1.15-1.39)for samples shipped at ambient temperature.Analysis for discriminating preterm births (gestational age <37 weeks), yielded an area under curve (AUC) of 0.76 (95% CI = 0.71-0.81)for samples shipped on dry ice and AUC of 0.73 (95% CI = 0.67-0.78)for samples shipped in ambient temperature. ConclusionsIn this study, we demonstrate that machine learning algorithms developed using a sub-set of newborn screening analytes which are not sensitive to shipment at ambient temperature, can accurately provide estimates of gestational age comparable to those from published regression models from North America using all analytes.If validated in larger samples especially with more newborns <34 weeks, this technology could substantially facilitate implementation in LMICs.<br/>
SUPPLEMENTAL MATERIAL
Coming soon ....
REFERENCES (50)
CITATIONS (1)