ISSN: 2161-0932
ライナーハート・ジョン
背景:臨床意思決定のジレンマは、臨床医が治療選択の判断材料となる予測を行える大規模なデータセットが頻繁に生成されることを考えると、体外受精の実践においては特に顕著です。本研究では、2 つ以上の胚が移植可能な場合に双子のリスクを判断するために体外受精データを使用して機械学習を適用しました。ほとんどの分類器は精度の推定値を提供できますが、本研究ではさらに精度と曲線下面積 (AUC) の両方で分類器を比較しました。
方法:研究データは、140 を超える体外受精クリニックで使用されている 135,000 回の体外受精サイクルを含む大規模な電子医療記録システムから取得されました。データセットは 88 の変数から 40 に削減され、2 つ以上の胚盤胞胚が作成された体外受精サイクルのみが含まれていました。精度と AUC の観点から、次の分類器が比較されました: 一般化線型モデル、線型判別分析、二次判別分析、K 近傍法、サポート ベクター マシン、ランダム フォレスト、およびブースティング。分類器からの予測を使用して新しいモデルを作成するために、スタッキング アンサンブル学習アルゴリズムも適用されました。
結果:アンサンブル分類器が最も正確でしたが、他の分類器よりも大幅に優れている分類器はありませんでした。結果によると、分類器のブースティング メソッドのパフォーマンスは低く、ロジスティックおよび線型判別分析分類器は二次判別分析分類器よりもパフォーマンスが高く、サポート ベクター マシンはツリー分類器とほぼ同等のパフォーマンスでした。AUC の結果は、精度の比較と一致していました。588 の観測値を含む別のデータセットを使用して、外部検証も実行されました。すべてのモデルは外部検証データセットを使用してパフォーマンスが向上し、ランダム フォレスト分類器は他のどの分類器よりも著しく優れたパフォーマンスを示しました。
結論: これらの結果は、ビッグ データが臨床意思決定プロセスで価値を持つ可能性があるという印象を裏付けていますが、単一の統計アルゴリズムですべてのデータベースに対して最大の精度を提供することはできません。したがって、特定のデータセットに対してどのアルゴリズムが最も正確であるかを判断するには、さまざまなデータセットを調査する必要があります。これらの調査結果は、大量のデータにアクセスできる臨床医が高度な予測分析モデルを使用して、患者ケアにとって極めて重要な堅牢な臨床情報を作成できるという前提を強調しています。