Classificatori di machine learning per lo screening della steatosi epatica non alcolica negli adulti in generale

Classificatori di machine learning per lo screening della steatosi epatica non alcolica negli adulti in generale

In questo studio, abbiamo sviluppato modelli di classificazione utilizzando albero decisionale, RF, XGBoost e SVM per eseguire lo screening di soggetti con NAFLD da adulti normali e asintomatici. Tutti i modelli sono stati valutati da Accuracy, PPV, F1, AUROC e AUPRC. Le migliori prestazioni sono state mostrate nel modello basato su SVM, seguito da RF.

I nostri risultati hanno mostrato che il modello con SVM aveva le migliori prestazioni, seguito dal modello RF. Il modello RF ha mostrato buone prestazioni nello studio di screening pre-NAFLD5. SVM ha dimostrato di funzionare bene nello sviluppo di modelli medici, compresi quelli per la classificazione dei pazienti con NAFLD5, 6, 8. Pertanto, i nostri risultati erano coerenti con gli studi precedenti5,6.

Inoltre, i nostri risultati hanno mostrato che i modelli RF e XGBoost hanno funzionato meglio dell’albero decisionale, in particolare il modello RF. Poiché i modelli RF e XGBoost hanno alberi decisionali integrati9,10Questi modelli hanno ottenuto risultati migliori rispetto al modello ad albero decisionale singolo. Nel nostro studio, il modello RF ha mostrato prestazioni leggermente migliori rispetto al modello XGBoost. Ciò può essere correlato in parte ai nostri dati, che non erano completamente bilanciati tra i due gruppi (gruppo non NAFLD vs. gruppo NAFLD = 10.028 vs 4.411). L’algoritmo RF può bilanciare l’errore dei dati sbilanciati e quindi ottenere un buon risultato9. Sebbene le prestazioni del modello di XGBoost fossero molto vicine a quelle di RF, la maggior parte dei risultati valutati per le prestazioni erano entro 0,01 tra di loro (Tabella 2). Inoltre, poiché i nostri modelli si basano sulla prevalenza della NAFLD nel mondo reale, i nostri modelli potrebbero essere più applicabili di quelli provenienti da campioni deliberatamente progettati nel mondo reale senza un campione completamente bilanciato.

READ  Resti di dinosauri trovati all'interno di uno scheletro di 95 milioni di anni fa di un coccodrillo appena scoperto in Australia | notizie dal mondo

Le prestazioni dei nostri modelli in termini di accuratezza, PPV, AUROC e AUPRC erano simili a quelle riportate negli studi precedenti5,6 (Tabella supplementare 1). Rispetto ai modelli che utilizzano gli stessi algoritmi nel lavoro di Liu, il PPV nei nostri modelli con XGBoost e SVM era simile a quello dello studio precedente.6 (PPV: XGBoost: 0,778 contro 0,806, SVM: 0,792 contro 0,768). Per AUROC, era leggermente migliore per XGBoost nel modello precedente rispetto al nostro modello, mentre era simile per SVM in entrambi gli studi (XGBoost: 0,833 vs. 0,873; SVM: 0,850 vs. 0,865). Per AUPRC, i modelli con XGBoost e SVM nel rapporto di Liu hanno ottenuto risultati leggermente migliori dei nostri6 (XGBoost: 0,704 contro 0,810; SVM: 0,712 contro 0,800). La precisione nei nostri modelli con RF e SVM era leggermente inferiore rispetto al precedente rapporto Ma5 (RF: 0,789 contro 0,827, SVM: 0,798 contro 0,827). Al contrario, i nostri modelli hanno mostrato un punteggio F1 leggermente superiore rispetto al rapporto di Ma e al rapporto di Liu5,6 (Rispetto al rapporto di Ma: Albero decisionale: 0,764 contro 0,569; RF: 0,782 contro 0,579; SVM: 0,792 contro 0,557. Rispetto al rapporto di Liu: XGBoost: 0,779 contro 0,695; SVM: 0,792 contro 0,713). Il punteggio F1 è un indicatore più appropriato del punteggio di accuratezza per valutare l’accuratezza del modello utilizzando dati senza equilibrio assoluto in entrambi i gruppi. Pertanto, è stato dimostrato che i nostri modelli si comportano in modo simile al modello precedente.

quello studio precedente6 Comprendeva caratteristiche da esame fisico, emocromo completo, test di funzionalità epatica, pannello lipidico, test di funzionalità renale e marcatori tumorali. Le caratteristiche, vicine o meno a NAFLD, possono aumentare le prestazioni dei modelli. Tuttavia, più funzionalità e un modello più complesso possono portare a maggiori difficoltà di ridimensionamento e applicazione per i medici di base. Al contrario, le caratteristiche nei nostri modelli erano più semplici, che includevano risultati dell’esame fisico, emocromo completo, test di funzionalità epatica e pannello lipidico (Tabella Supplementare 2). Pertanto, i nostri modelli potrebbero avere più applicazioni nella pratica delle cure primarie e avere anche prestazioni simili rispetto ai modelli precedenti.

READ  Sintomi di demenza: questo è il segnale di avvertimento più comune della demenza

Dai nostri modelli, le caratteristiche più importanti erano BMI, livello di TG, VLDL-C, ALT e rapporto sierico AST/ALT. I nostri risultati erano coerenti con quelli di studi precedenti5,6. BMI e TG sono fattori di rischio per la steatosi epatica non alcolica negli adulti11,12, che sono identificati in tutti i nostri modelli. Potrebbe essere correlato alla regolazione aberrante dell’accumulo epatico di TG mediante lipogenesi de novo nella NAFLD13. Inoltre, il fegato secerne TG sotto forma di VLDL per il suo rilascio ai tessuti periferici. La sovrapproduzione di VLDL-C è una caratteristica della NAFLD13. Ciò riflette un aumento della lipogenesi de novo e della lipolisi intraepatica e intra-addominale nella NAFLD14. Inoltre, nei soggetti cinesi non obesi, l’aumento del rapporto ALT/AST è associato al rischio di NAFLD di nuova insorgenza.15. Il basso rapporto di AST/ALT nella NAFLD nel nostro studio era coerente con il risultato precedente15. Può essere dovuto a molte cause, ad esempio, un basso rapporto AST/ALT è associato a infiammazione cronica del fegato, insulino-resistenza o degenerazione grassa del fegato, che porta alla NAFLD16, 17. Pertanto, i modelli nel nostro studio hanno determinato il significato di BMI, TG, VLDL-C, ALT e rapporto AST/ALT nella NAFLD. Abbiamo inoltre suggerito che queste caratteristiche potrebbero essere importanti nello screening per la NAFLD in generale e negli adulti asintomatici.

Abbiamo riconosciuto che nel nostro studio la diagnosi di NAFLD era basata sull’ecografia addominale, piuttosto che sulla biopsia epatica. Questo perché la biopsia epatica non era autorizzata a esaminare il fegato grasso analcolico tra la popolazione generale e in salute secondo i principi etici e la Dichiarazione di Helsinki. L’ecografia addominale è stata ampiamente accettata come strumento accurato e non invasivo nella diagnosi di NAFLD18. Nel nostro studio, la prevalenza di NAFLD era del 30,5% (4.411/14.439). Questo è simile alla prevalenza nazionale del 29,2% in Cina, basata sul database dal 2008 al 2018 e aumentata nel corso degli anni.19. Pertanto, la diagnosi di NAFLD dall’ecografia addominale potrebbe essere accurata e affidabile nel nostro studio. Inoltre, una storia di diabete di tipo 2 (T2D) non è stata inclusa nelle caratteristiche candidate. Questo perché non possiamo diagnosticare il T2D dai nostri soggetti sulla base dei nostri dati e non è possibile escludere un bias della storia personale segnalato. Poiché T2D è un fattore di rischio di NAFLD11,12le prestazioni dei nostri modelli dovrebbero essere migliorate se T2D fosse inclusa come funzionalità candidata.

READ  Scopri nuovi segnali radio dalle più lontane gamme di spazio e tempo

In conclusione, i modelli di classificazione possono essere sviluppati utilizzando l’apprendimento automatico basato sui dati di screening sanitari annuali, che possono eseguire lo screening per la NAFLD negli adulti in generale senza screening ridondanti. Il modello che utilizza SVM è il migliore, seguito dal modello che utilizza RF. Questi modelli possono fornire uno strumento prontamente disponibile per i medici e i medici di base per lo screening della NAFLD nella popolazione generale, che può beneficiare i pazienti con NAFLD dalla diagnosi precoce.

Giustina Rizzo

"Appassionato di musica. Giocatore. Professionista dell'alcol. Lettore professionista. Studioso del web."

Related Posts

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Read also x