This is soft place, between days
머신러닝 기반 사망률을 본 클러스터 분석한 논문 본문
| 논문정보 | 대상자특성 | 데이터출처 | 변수구성 | 클러스터링기법 | 클러스터 수 결정기준 | 주요군집유형 | 사망률/예후 분석방법 |
| Flerlage et al., 2023, Critical Care Explorations | 2017–2018년, 종양∙이식∙면역결핍 아동 324명(중환자실 입원 364회) | 단일 소아 전문병원 PICU EMR 후향적 코호트 | 입원 시점 35개 임상·랩 지표(다장기부전(MOF), 호흡장애, 생체징후 등) | LCA(잠재계층분석) + Consensus K-means 클러스터링 (unsupervised ML) | consensus 방법으로 4개 군집 지정 | PedOnc1–4: 1/2 = 낮은 사망률/단일 장기 기능장애 3 = 패혈증∙다장기부전↑ 4 = 호흡부전(IMV), 신경장애, 패혈증 - 사망률 가장 높음 |
ICU 사망률 비교 (Kaplan–Meier 없음), 다변량 Cox 회귀 |
| Banerjee et al., 2023, Lancet Digit Health | 30세 이상 심부전 환자, CPRD n=188 800, THIN n=124 263, UKB 유전자 검증 n=9 573 | 다기관 EHR (CPRD, THIN) 및 UK Biobank 유전자 데이터 | 인구통계·과거력·혈액·약물 포함 총 645개 → 클러스터링에 87개 변수 사용 | K-means, 계층, K-medoids, 혼합모형 (4가지 unsupervised) | 실루엣, 외부/예후/유전자 검증 기반 -> 5개 군집 | (1) 조기 발병, (2) 후기 발병, (3) 심방세동 관련, (4) 대사 및 (5) 심장대사로 분류 | 1년 사망률 차이, 외래·입원·비치명성 CVD, 유전자 연관성 |
| Iwase et al., 2022, Scientific Reports | 2019년 Chiba 대학병원 ICU 입원 환자 12,747명 | 단일기관 EMR → training/test Cohort 무작위 분리 | 입원 시점 초기 변수 (생체징후, SOFA/APACHE 지표, 혈액검사 등 수십 개) | 테스트 코호트에서 클러스터링분석(어떤 방법이라고는 안나와있음) | UMAP 시각화 결과 -> 클러스터링 분석과 각 변수의 분포는 ICU 환자를 ICU 사망 위험에 따라 5개 클러스터로 분류 | Cluster 1 – 수술 후 입원 Cluster 2 – 응급실 입원 환자 Cluster 3 – 고 LDH Cluster 4 – 저 혈소판 Cluster 5 – 진단/부서 기반 그룹 |
군집 간 ICU 사망률 차이 확인 → 특히 LDH 높은 Cluster 3, 혈소판 낮은 Cluster 4에서 사망률 높음 |
| Matetic et al., 2024, International Journal of Cardiology | 470,960명 ST‑elevation MI 환자 (2015–2019, 처음 진단된 경우) | 미국 National Inpatient Sample (NIS) 퇴원 기록, 다기관 EMR 데이터셋 | 총 21개 임상 변수 (고혈압, 당뇨, 비만, 심부전, CKD, 흡연, 심혈관 질환 등 주요 위험인자) | Unsupervised ML 기반 클러스터링 (구체 예상: K-means 또는 PAM 기반) | 데이터 기반 흐름에서 4개 군집으로 도출됨 (실루엣/gap 수치 대신 외형적 분포 기반 판단) | Cluster 0: Behavioural risk (흡연·음주 등 라이프스타일 위험집단) Cluster 1: Least comorbidity (저위험 다발병 없음) Cluster 2: Diabetes with end‑organ damage (당뇨 및 장기 손상) Cluster 3: Cardiometabolic cluster (심대사 고위험군) |
병원 내 사망률, 주요 심혈관사건(MACCE), 허혈성 뇌졸중 비교 → 다변량 로지스틱 회귀 (aOR 및 95% CI 포함) 수행 |
| Josephson et al., 2023, Seizure | ≥65세, 후향적 영국 일반인 코호트에서 새로 진단된 후기 발병(epilepsy) 환자 1,048명, Controls 10,259명 | 1998–2019년 영국 1차진료/병원 EHR 및 사망통계 연계 리소스 | 공통 기저질환(aetiologies), 사회경제 지표 등 멀티모달 변수 (정밀 명시 없음) | 계층적 응집적 군집분석 (hierarchical agglomerative clustering) | 데이터 기반으로 10개 군집 도출 (시각화 및 군집 해석 기준) | Healthy males/females Ischaemic stroke ICH ICH + alcohol misuse Dementia + anxiety Anxiety (m/f) Brain tumours 등 총 10개 그룹 |
특히 Dementia + anxiety, Brain tumour, ICH + alcohol misuse, Ischaemic stroke 그룹에서 **사망 위험(HR 2.8–5.36)**이 통계적으로 유의하게 높은 것으로 확인됨. |