기본 콘텐츠로 건너뛰기

SIMCA® Python 스크립팅: 자동화와 확장 분석의 시작

안녕하세요, 이번 포스팅에서는 SIMCA®에서 Python 스크립트를 활용하는 방법 과 이를 통해 얻을 수 있는 장점에 대해 소개드리겠습니다. 최근 많은 고객분들께서 SIMCA®의 기능을 넘어서는 자동화, 반복 업무 최소화, 커스터마이징 분석 구현 을 원하고 계시며, 이러한 니즈를 충족시켜 줄 수 있는 기능이 바로 SIMCA® 스크립팅(Scripting)입니다. 왜 Python 스크립팅인가요? SIMCA®는 본래 GUI 기반의 모델링 도구지만, Python 스크립트를 통해 다음과 같은 확장이 가능합니다: 반복 분석 자동화 변수 생성, 필터링 등 데이터 처리 자동화 SIMCA 내 모델 정보를 외부 분석으로 연동 사용자 정의 알고리즘이나 통계 검정 구현 즉, Python 스크립팅을 활용하면 수작업 반복에서 벗어나 분석 워크플로우를 표준화 하고, 팀원 간 협업이나 재현성 확보에도 큰 도움이 됩니다. 누가 스크립팅을 활용할 수 있나요? Python 스크립트는 다음과 같은 사용자들에게 특히 유용합니다: 사용자 유형 스크립팅을 통해 얻는 이점 SIMCA® Power User             반복 업무 자동화, 모델링 확장 신규 사용자          분석 워크플로우를 스크립트로 쉽게 재현 Data Operations 팀          SIMCA 사용자에게 표준 스크립트 배포 가능 연구개발 조직         내부 전용 알고리즘 적용 및 실험 설계 자동화 SIMCA® 스크립팅 환경은 어떻게 구성되어 있나요? SIMCA®는 내부에 자체 Python 실행 환경 을 포함하고 있습니다. 기본 설치된 Python 버전: 3.7.9 사전 설치된 주요 라이브러리: numpy, pandas, scipy ...

SIMCA® Heatmap Python Script

안녕하세요, 이번 포스팅에서는 SIMCA® 사용자들이 오믹스 기반 실험 데이터를 더욱 직관적으로 시각화 할 수 있도록 돕는 Heatmap 자동 생성 파이썬 스크립트 를 소개드립니다. 이 스크립트는 .usp 파일로부터 데이터를 직접 추출하고, 별도의 복잡한 설정 없이 히트맵(Heatmap)을 자동으로 생성해줍니다. 또한 GUI 기반의 인터페이스를 통해 파일과 데이터셋 선택이 가능하여, 누구나 쉽게 사용할 수 있도록 구성되어 있습니다. 함께 제공되는 데모 .usp 파일을 통해 즉시 실행해보실 수 있도록 준비했습니다. 왜 Heatmap이 필요할까요? 히트맵은 변수(예: 유전자, 대사체 등)와 샘플 간의 값을 색상으로 표현하여, 데이터 내 패턴, 클러스터링, 이상치 등을 한눈에 파악 할 수 있도록 도와주는 시각화 도구입니다. 특히 GC/MS, LC/MS, RNA-Seq 등 오믹스 기반의 분석 에서는 많은 수의 변수와 관측치가 존재하기 때문에 Heatmap은 데이터 탐색 및 클래스 간 차이 파악 에 필수적으로 사용됩니다. 하지만 SIMCA® 자체에는 Heatmap 생성 기능이 내장되어 있지 않기 때문에, 이번에 소개하는 파이썬 스크립트를 통해 이 기능을 보완하실 수 있습니다. 제공되는 구성 파이썬 스크립트 : .usp 파일에서 데이터를 자동으로 불러와 히트맵을 생성 예제 .usp 파일 : 테스트용 GC/MS 오믹스 데이터 포함 GUI 기반 인터페이스 : 파일 및 데이터셋 선택을 위한 대화창 자동 생성 자동 전처리 : 결측값 제거, 숫자형 변환 등 자동 처리           SIMCA® Heatmap 다운로드 주요 기능 안내 스크립트를 실행하면 먼저 사용자는 .usp 형식의 SIMCA® 프로젝트 파일을 선택하게 됩니다. 해당 파일에 여러 개의 데이터셋이 포함되어 있는 경우, GUI 창을 통해 원하는 데이터셋을 직접 선택할 수 있어 매우 직관적으로 구성되...

SIMCA® Volcano Plot Python Script

안녕하세요, 이번 포스팅에서는 SIMCA®에서 기본적으로 제공하지 않는 Volcano Plot 기능을 보완 하기 위해 제작한 파이썬 스크립트를 소개드리고자 합니다. 특히 오믹스(omics) 기반 실험 데이터를 다루는 고객분들 께 실질적인 도움이 될 수 있도록, SIMCA 프로젝트 파일(.usp) 형식의 데모 데이터와 함께 제공 하며, 별도의 전처리 없이도 곧바로 실행해보실 수 있도록 구성되어 있습니다. 내부에 포함된 데모 .usp 데이터셋은 이 Volcano Plot 스크립트를 테스트해볼 수 있도록 설계된 예제 파일입니다. 왜 Volcano Plot이 필요할까요? Volcano Plot은 두 클래스 간의 변화량(Fold Change)과 통계적 유의성(p-value)을 동시에 시각화할 수 있는 그래프입니다. 유전자 발현, 단백질 정량, 메타볼로믹스 분석 등에서 특정 특징(Feature)의 중요도를 빠르게 파악할 수 있어 오믹스 분석에서 필수적인 시각화 도구 로 꼽힙니다. 하지만 아쉽게도, SIMCA®는 기본적으로 Volcano Plot을 생성하는 기능을 지원하지 않습니다. 그래서 이번에 제작한 이 스크립트를 활용하면, SIMCA에서 추출한 데이터를 바탕으로 Volcano Plot을 자동으로 생성할 수 있습니다. 복잡한 코딩 지식 없이도 GUI 기반으로 클래스 선택부터 시각화까지 편리하게 처리할 수 있습니다. 제공되는 구성 파이썬 스크립트 : Volcano Plot을 자동 생성하는 기능을 담고 있습니다. 예제 .usp 파일 : 실제 분석 흐름을 따라가며 직접 실행해볼 수 있는 데모 프로젝트입니다. GUI 인터페이스 : 클래스 선택과 분석 대상 선택을 대화창으로 간편하게 처리 통계분석 내장 : log2 Fold Change 및 P-value 계산 포함                  SIMCA® Volano Plot 다운로드 주요...