기본 콘텐츠로 건너뛰기

SIMCA의 데이터 분석편 (Workset 설정하기)

안녕하세요~

이번 포스팅에서는 불러온 데이터를 시각화한 자료로 바꾸기 위해 필요한 기능에 대해 알아보고자 합니다. 
Home 탭에서 Workset 메뉴에 있는 New 기능을 위주로 우선 소개 드리겠습니다. 
그래프에 대한 부분은 후속편에서 자세히 다루겠습니다~ 


데이터를 불러오면 제일 먼저 해야할 것이 바로 '모델 생성' 입니다.
모델은 여러 가지 그래프로 확인할 수 있는, 기초가 되는 부분이기 때문에 생성 시에 정확하게 이해하고 만들어야 합니다. 


처음 모델 생성 창으로 진입하면 여러가지 형태의 모델을 선택할 수 있습니다. 
각 모델의 특징 및 어플리케이션과 생성 과정에 있는 메뉴에 대해 소개해 드리겠습니다. 

Overview - PCA 
  • 모든 변수는 X 속성입니다. 
  • 샘플 데이터의 그룹간 특징을 비교할 때 주로 사용합니다. 
  • 샘플링 장비에서 추출한 데이터에 적합합니다. 
Regression - PLS or OPLS 
  • 변수는 X 속성과 Y 속성을 가진 것으로 나뉘게 됩니다. 
  • X-Y 변수 간의 관계를 설명할 때 주로 사용합니다. 
  • 회귀분석 모델, 배치 트렌드와 같이 판단 기준이 되는 Y 변수가 있는 데이터에 적합합니다. 
Class differences - DA or class models
  • 모든 변수는 X 속성입니다. 
  • 모든 변수는 Class ID를 가지고 있어야 합니다. 
  • 샘플 데이터를 강제로 그룹화(Class)하여 그룹간 비교를 할 때 주로 사용합니다. 
  • Class는 데이터 분석 시에 Y 속성으로 간주됩니다. 
  • Loading에서 Class group의 위치와 샘플의 산포를 통해 그룹 데이터의 신뢰성을 파악할 수 있습니다. 
  • 주로 실험군과 대조군을 비교하는 임상 데이터에 적합합니다. 
  • 혹은 다양한 군체의 특성을 비교하는 데이터에도 적합합니다. 

이외 MOCA, Hierarchical, Generic 모델의 경우 특수한 경우에 사용해서 대표적인 3가지 경우를 우선 소개 드렸습니다. 
Hierarchical은 이전에 기술 포스팅에서 잠시 소개 드렸던 계층 구조 분석의 그 모델이 맞습니다. 
다음으로는 각 과정에 대한 설명입니다. 

  • Start : 모델의 형태를 선택합니다. 
  • Variables : 변수의 속성을 확인합니다. 해당 메뉴에서 X, Y 속성을 변경할 수 있습니다.
  • Observations : 샘플의 속성을 확인합니다. 해당 메뉴에서 Class를 지정할 수 있습니다. 
  • Scale : 샘플 데이터의 스케일링을 변경합니다. UV / Par / Ctr 을 지정할 수 있습니다. 
  • Finish : 생성한 모델의 정보를 보여줍니다. 

이 과정에서 눈여겨 볼 부분은 Scale입니다. 
Variables와 Observations의 경우 앞선 포스트에서 이미 소개를 드렸기 때문에, Scale에 대해 보다 자세히 풀어보겠습니다. 
Scale은 각 변수들의 영향 효과를 동일하게 보기 위해 원본 데이터의 분포를 조절하는 것을 의미합니다. 


대부분의 경우엔 UV로 설정하면 되지만, 스펙트럼 데이터와 같이 피크를 검출해야 하는 경우는 Par 혹은 Ctr로 설정하는 경우가 많습니다. 이는 분석하고자 하는 데이터의 종류에 따라 자유롭게 편집이 가능합니다. 




댓글