This is soft place, between days

머신러닝 기반 사망률을 본 클러스터 분석한 논문 본문

배움의 길목/생각의 채집기

머신러닝 기반 사망률을 본 클러스터 분석한 논문

honeymung 2025. 6. 18. 17:28
논문정보 대상자특성 데이터출처 변수구성 클러스터링기법 클러스터 수 결정기준 주요군집유형 사망률/예후 분석방법
Flerlage et al., 2023, Critical Care Explorations 2017–2018년, 종양∙이식∙면역결핍 아동 324명(중환자실 입원 364회) 단일 소아 전문병원 PICU EMR 후향적 코호트 입원 시점 35개 임상·랩 지표(다장기부전(MOF), 호흡장애, 생체징후 등) LCA(잠재계층분석)  + Consensus K-means 클러스터링 (unsupervised ML) consensus 방법으로 4개 군집 지정 PedOnc1–4:
1/2 = 낮은 사망률/단일 장기 기능장애
3 = 패혈증∙다장기부전↑
4 = 호흡부전(IMV), 신경장애, 패혈증 - 사망률 가장 높음
ICU 사망률 비교 (Kaplan–Meier 없음), 다변량 Cox 회귀
Banerjee et al., 2023, Lancet Digit Health 30세 이상 심부전 환자, CPRD n=188 800, THIN n=124 263, UKB 유전자 검증 n=9 573 다기관 EHR (CPRD, THIN) 및 UK Biobank 유전자 데이터 인구통계·과거력·혈액·약물 포함 총 645개 → 클러스터링에 87개 변수 사용 K-means, 계층, K-medoids, 혼합모형 (4가지 unsupervised) 실루엣, 외부/예후/유전자 검증 기반 -> 5개 군집  (1) 조기 발병, (2) 후기 발병, (3) 심방세동 관련, (4) 대사 및 (5) 심장대사로 분류 1년 사망률 차이, 외래·입원·비치명성 CVD, 유전자 연관성
Iwase et al., 2022, Scientific Reports 2019년 Chiba 대학병원 ICU 입원 환자 12,747명 단일기관 EMR → training/test Cohort 무작위 분리 입원 시점 초기 변수 (생체징후, SOFA/APACHE 지표, 혈액검사 등 수십 개) 테스트 코호트에서 클러스터링분석(어떤 방법이라고는 안나와있음) UMAP 시각화 결과 -> 클러스터링 분석과 각 변수의 분포는 ICU 환자를 ICU 사망 위험에 따라 5개 클러스터로 분류 Cluster 1 –  수술 후 입원 Cluster 2 – 응급실 입원 환자
Cluster 3 – 고 LDH
Cluster 4 – 저 혈소판
Cluster 5 – 진단/부서 기반 그룹
군집 간 ICU 사망률 차이 확인 → 특히 LDH 높은 Cluster 3, 혈소판 낮은 Cluster 4에서 사망률 높음
Matetic et al., 2024, International Journal of Cardiology 470,960명 ST‑elevation MI 환자 (2015–2019, 처음 진단된 경우) 미국 National Inpatient Sample (NIS) 퇴원 기록, 다기관 EMR 데이터셋 총 21개 임상 변수 (고혈압, 당뇨, 비만, 심부전, CKD, 흡연, 심혈관 질환 등 주요 위험인자) Unsupervised ML 기반 클러스터링 (구체 예상: K-means 또는 PAM 기반) 데이터 기반 흐름에서 4개 군집으로 도출됨 (실루엣/gap 수치 대신 외형적 분포 기반 판단) Cluster 0: Behavioural risk (흡연·음주 등 라이프스타일 위험집단)
Cluster 1: Least comorbidity (저위험 다발병 없음)
Cluster 2: Diabetes with end‑organ damage (당뇨 및 장기 손상)
Cluster 3: Cardiometabolic cluster (심대사 고위험군)
병원 내 사망률, 주요 심혈관사건(MACCE), 허혈성 뇌졸중 비교
→ 다변량 로지스틱 회귀 (aOR 및 95% CI 포함) 수행
Josephson et al., 2023, Seizure ≥65세, 후향적 영국 일반인 코호트에서 새로 진단된 후기 발병(epilepsy) 환자 1,048명, Controls 10,259명 1998–2019년 영국 1차진료/병원 EHR 및 사망통계 연계 리소스 공통 기저질환(aetiologies), 사회경제 지표 등 멀티모달 변수 (정밀 명시 없음) 계층적 응집적 군집분석 (hierarchical agglomerative clustering) 데이터 기반으로 10개 군집 도출 (시각화 및 군집 해석 기준) Healthy males/females

Ischaemic stroke

ICH

ICH + alcohol misuse

Dementia + anxiety

Anxiety (m/f)

Brain tumours 등 총 10개 그룹
특히 Dementia + anxiety, Brain tumour, ICH + alcohol misuse, Ischaemic stroke 그룹에서 **사망 위험(HR 2.8–5.36)**이 통계적으로 유의하게 높은 것으로 확인됨.