안녕하세요, 이번 포스팅에서는 SIMCA ® 를 사용하여 더 효과적이고 직관적인 분석을 위해 모델 최적화 작업에 필요한 Loading Vector 와 관련된 값에 대해 알아보겠습니다. 1. P (Loading): 각 예측 변수 (X 변수 ) 에 대한 로딩 (Loading) 은 해당 변수가 모델에 얼마나 기여하는지를 나타내는 값입니다 . 높은 로딩 값은 해당 변수가 모델에서 중요한 역할을 한다는 것을 의미합니다 . 2. Residual Sum of Squares (SS) : 잔차 제곱합은 모델의 예측값과 실제 관측값 간의 차이를 측정합니다. SS는 잔차(실제 값과 예측 값의 차이)를 제곱한 값들의 합으로, 모델이 관찰 데이터를 얼마나 잘 설명하는지 나타냅니다. 작은 잔차 제곱합은 모델이 데이터를 잘 설명하고 있다는 것을 의미하며, 모델의 예측력이 높다는 것을 시사합니다. 3. Standard error (SE): 표준 오차는 모델의 예측 값의 변동성을 나타내는 측정 지표입니다. 표준 오차는 모델의 예측 값에 대한 예상 오차의 표준 편차로, 모델의 불확실성을 측정합니다. 작은 표준 오차는 모델이 일관되고 정확한 예측을 제공한다는 것을 나타내며, 큰 표준 오차는 모델의 불확실성이 높다는 것을 나타냅니다. 따라서 잔차 제곱합은 모델의 적합도를 평가하는 데 사용되는 반면, 표준 오차는 모델의 예측 불확실성을 평가하는 데 사용됩니다. 4. cvSE (Cross-Validation Standard Error): 모델의 결과에 대한 교차검증 ( CV) 의 모든 결과로 계산된 표준 오차를 의미합니다 . 이러한 표준 오차는 모델의 예측 불확실성을 나타내며 , 교차 검증 결과를 통합하여 모델의 일반화 성능에 대한 신뢰 구간을 제공하는 데 사용될 수 있습니다 . 5. pcvSE (Jack-knife Standard Error of Loading): pcvSE 는 각 예측 변수 X 의 로딩 p 에 대한 표준 오차를 계산한 값입니다 . 이 표준오차는 로딩
싸토리우스 데이터 분석(DA) 기술 블로그
PC기준 가로 해상도 1600px 이상에 최적화 되어있습니다. ^^;