카테고리 없음

ADsP 2과목 데이터 분석 기획

이응 2024. 10. 10. 21:48

1. 데이터 분석 기획의 이해

분석 기획 방향성 도출

 

분석 대상과 방법

방법\대상 Known UnKnown
Known 최적화 (Optimization) 통찰(Insight)
Un-Known 솔루션 (Solution) 발견(Discovery)

 

 

분석 기획 방안

  과제중심적접근 장기적 마스터플랜
목적 빠르게 해결 지속적 분석 원인 해결
1차목표 Speed & Test Accuracy & Deploy
과제유형 Quick & Win Long Term View
접근방식 Problem Solving Problem Definition

 

 

분석 기획서 고려사항

1) 가용 데이터 : 분석의 기본이 되는 데이터 확보 및 파악

2) 적절한 유스케이스 탐색 : 기존에 잘 구현 되어있는 유사 시나리오 활용

3) 장애요소에 대한 사전계획 수립 : 조직의 역량으로 내제화

 

의사결정을 가로막는 요소

고정 관념 편향된 생각

프레이밍 효과 : 동일상황임에도 개인의 판단, 결정이 달라짐

 

 

분석 방법론

분석 방법론의 구성요소

-절차, 방법, 도구와 기법, 템플릿과 산출물

 

분석 방법론 모델

(1) 폭포수 모델 : 이전 단계 완료되어야 다음 단계 진행 (Top-Down)

(2) 나선형 모델 : 여러 개발과정 거쳐 점진적으로 완성, 위험요소 제거 초점

(3) 프로토타입 모델 : 일부분 (프로토타입)을 우선 개발하고 보완

(4) 애자일 : 일정한 주기를 가지고 프로토타입을 끊임없이 수정하여 고객의 Needs 반영

 

KDD 분석 방법론

-데이터 선택 -> 전처리 -> 변환 -> 마이닝 -> 결과 평가

1) 전처리 : 이상값, 잡음 식별 등 데이터 가공

2) 변환 : 변수 선택 및 차원 축소

 

Crip -DM 분석 방법론

-업무이해 -> 데이터 이해 -> 데이터준비 -> 모델링 -> 평가 -> 전개

1) 모델링 단계에서 모델 평가 수행하고 평가 과정 단계에서 모델 적용성 평가 수행

2) 평가 -> 전개에서 위대한 실패 발생 가능

 

 

빅데이터 분석 방법론

 

1) 분석 기획

- 비즈니스 범위 설정 : SOW(Statement of Works) : 구조화된 프로젝트 정의서

- 위험 계획 수립 (회피, 전이, 완화, 수용)

2) 데이터분석

- 추가적인 데이터 확보 필요 시 데이터 준비 단계로 다시 진행

3) 데이터 분석 - 모델링

- 가설 설정 통해 통계 모델이나 기계학습을 이용한 분류, 예측 등의 모델을 만드는 과정

- 의사 코드 : 일반적인 언어로 프로그래밍 언어의 알고리즘을 유사한 형식으로 써 놓은 것

 

 

분석 과제 발굴

 

디자인 싱킹 

사용자에 공감으로 시작해서 아이디어 발산 / 수령 과정을 통한 피드백으로 발전하는 과정

-공감하기 -> 문제정의 -> 아이디어 도출 -> 프로토타입 -> 테스트

 

하향식 접근 방법

문제가 주어지고 해답을 찾기 위해 진행

문제탐색 -> 문제 정의 -> 해결방안 -> 타당성 검토

 

문제 탐색

1) 빠짐없이 문제를 도출하고 식별하며 솔루션 초점보다는 가치에 초점

2) 기존 시스템 개선하여 사용 가능하면 개선하여 활용

3) 비즈니스 모델 캔버스 단순화 측면 : 업무, 제품 , 고객, 규제와 감사, 지원 인프라

👉🏻 지원 인프라 업무중에 고객이 제품을 규제와 감사 했다

4) 관점

거시적관점 : STEEP(사회, 기술, 경제, 환경, 정치)

경쟁자 확대 관점 : 대체자 , 경쟁자, 신규 진입자

시장의 니즈 탐색관점 : 고객, 채널, 영향자

5) 분석 유스 케이스

발굴한 분석 기회들을 구체적 과제로 만들기 전에 상세한 설명과 효과를 명시

 

타당성 검토

경제적 타당성 : 비용대비 편익 분석관점 접근

데이터 타당성 : 데이터 존재여부, 분석역량 이 필요

기술적 타당성 : 역량 확보 방안 사전에 수립

 

 

상향식 접근 방법

: 문제 정의 자체가 어려울 때, 사물을 그대로 인식하는 What 관점 

주로 비지도 학습

 

지도학습 / 비지도 학습

(1) 지도 학습

정답이 있는 데이터를 학습 

분류분석, 회귀분석, 의사결정트리 , KNN , SVM

(2) 비지도학습

정답이 없는 데이터를 학습

군집분석, 차원축소, 연관규칙분석

 

분석 프로젝트 관리방안

 

분석과제에서 고려해야할 5가지 요소

데이터 크기, 속도, 데이터 복잡도, 분석 복잡도, 정확도 / 정밀도

정확도와 정밀도는 Trade - Off 관계

 

프로젝트 관리 지식 체계 10가지 영역

통합 , 범위 , 시간(일정) , 원가(비용) , 품질, 인적자원, 의사소통, 리스트(위험), 조달, 이해관계자

 

 

분석 마스터 플랜

마스터 플랜 수립

 

우선순위 선정

1) 전력적 중요도 : 전략적 필요성 , 시급성

2) 실행 용이성 : 투자 용이성, 기술 용이성

 

ISP

중장기 마스터 플랜을 수립하는 절차

 

ROI 관점

시급성 관점 : 비즈니스 효과 (Return) : Value

난이도 관점 : 투자비용 요소 (Investment) : Volume , Variey, Velocity

 

 

분석 거버넌스 체계 수립

 

분석 거버넌스 체계 구성 요소

조직 , 프로세스, 시스템, 데이터 분석관련 교육 및 마인드 육성 체계

 

데이터 분석 수준 진단

(1) 분석 준비도 

1) 분석 업무 파악 : 사실 분석, 예측, 시뮬레이션, 최적화, 분석 업무 정기적 개선

2) 분석 인력 및 조직 : 분석 전문가 , 관리자, 조직, 경영진 이해

3) 분석 기법 : 적합한 기법 사용, 분석 기법 라이브러리/평가/개선

4) 분석 데이터 : 데이터 관리, 외부 데이터 활용, 기준 데이터 관리(MDM)

5) 분석 문화 : 의사결정, 회의에서 활용, 공유 및 협업 문화

6) IT 인프라 : 운영 시스템 통합 환경

 

(2) 분석 성숙도

CMMI 모델 기반 (1~5단계)

비즈니스 / 조직 , 역량 / IT 부문 관점으로 구분

1) 도입  : 환경 , 시스템 구축

2) 활용 : 업무에 적용

3) 확산 : 전사 차원 관리 , 공유

4) 최적화 : 혁신, 성과 향상에 기여

 

 

 

1) 준비형 : 낮은 준비도 , 낮은 성숙도

- 데이터 , 인력, 조직, 분석업무, 분석기법 적용 안되어 사전 준비 필요

2) 정착형 : 낮은 준비도 , 높은 성숙도

- 인력, 조직, 분석업무, 분석기법 등을 제한적으로 사용

3) 도입형 : 높은 준비도 , 낮은 성숙도

- 조직 및 인력 등 준비도는 높으나, 분석업무 및 기법 부족

4) 확산형 : 높은 준비도, 높은 성숙도

- 6가지 분석 구성 요소가 모두 갖추고 있으며 지속적 확산이 가능

 

 

분석 지원 인프라 방안 수립

: 확장성을 고려한 플랫폼 구조 적용 (중앙집중적 관리)

 

데이터 거버넌스

(1) 데이터 거버넌스

1) 전사 차원에서 데이터 대해 표준화된 관리 체계 수립

2) 구성요소 : 원칙, 조직, 프로세스

3) 중요 관리대상 : 마스터 데이터, 메타 데이터, 데이터 사전 등

- 마스터 데이터 : 자료 처리에 기준이 되는 자료

- 메타 데이터 : 다른 데이터를 설명해 주는 데이터

- 데이터 사전 : DB에 저장된 정보를 요약

 

(2) 데이터 거버넌스 체계

1) 데이터 표준화 : 메타 데이터 및 사전 구축

2) 데이터 관리 체계 : 효율성을 위함

3) 데이터 저장소 관리 : 저장소 구성

4) 표준화 활동 : 모니터링 , 표준 개선 활동

 

빅데이터 거버넌스

데이터 거버넌스 체계 + 빅데이터 효율적 관리, 데이터 최적화 , 정보보호 데이터 카테고리 별 관리 책임자 지정등을 포함

 

조직 및 인력방안 수립 (DSCoE : 분석 조직)

- 집중 구조 : 독립적인 전담 조직 구성 (중복 업무 가능성 존재)

- 기능 구조 : 해당 부서에서 직접 분석(DSCOE 가 없음)

- 분산 구조 : 분석 조직 인력을 현업 부서에 배치