ADsP 2과목.
카테고리 | 취미 |
---|---|
태그 | |
수정일 | May 9, 2024 |
작성일 | Jan 24, 2024 |
2. 데이터 분석 기획의 이해
2.1. 분석 기획
분석 기획 정의
- 분석을 수행 할 과제의 정의 및 의도한 결과를 도출하기 위한 관리 방안을 계획하는 작업
- 분석 목표를 달성하기 위하여 어떤 분석 방식을 수행 할 지 일련의 계획을 수립하는 활동
분석 기획 특징
- 분석 지식, 분석 기술, 비즈니스 이해, 전문성, 시각
분석 주제 (방대한 최통발솔)
Untitled.png
분석 방식 | 분석 대상 | ⇒ | 분석 주제 |
---|---|---|---|
Know | Know | ⇒ | 최적화 |
Know | Unknown | ⇒ | 통찰력 |
Unknown | Unknown | ⇒ | 발견 |
Unknown | Know | ⇒ | 솔루션 |
분석 기획 유형
- 과제 중심 : 빠르게 문제 해결을 하는 경우
- Speed&Test
- Quick&Win
- Problem solving
- 마스터플랜 : 문제 정의를 위해 정확도를 가지고 지속적인 해결하는 경우
- Accuracy&Deploy
- Long term view
- Problem Definition
분석 기획 고려 사항
- 가용 데이터
- 적절한 활용 방안 및 유즈케이스
- 장애 요소 사전 계획
2.2. 분석방법론
분석방법론 정의
주어진 과제를 해결하기 위해 조직이 수행 해야하는 일련의 절차를 정의하는 전략
구성요소 (절방산기도템)
- 절차 : 작업을 수행하기 위한 절차
- 방법 : 해당 절차를 수행하기 위한 방법
- 산출물 : 작업 종료 후 작성되는 문서
- 기법 : 작업 수행 필요 방식
- 도구 : 작업 수행 필요 도구
- 템플릿 : 문서 작성 참고 양식
문제점, 방해요소
- 고정 관념
- 편향
- 프레이밍 효과
분석 방법론 생성과정
Untitled.png
암묵지 (개인) → 형식지 (조직) → 방법론
분석 방법론 모델
- 업무 특성 별
- 폭포수 : 단계적, 순차적, 하향식
- 프로토타입 : 사용자 중심, 요구도출, 점진적
- 나선형 : 점증적, 위험요소 사전제거, 복잡도 높음
-
계층적 프로세스 : 단계 → 테스크 → 스텝 구성 (스텝 = input → process & tool → output)
adcc3e62-3554-4b63-a529-95488e7669ee.png
-
전통적
Untitled.png
- KDD (knowledge discovery In database)
- 정의 : 데이터로 부터 통계적 패턴이나 지식을 찾기 위래 체계적으로 정리한 데이터마이닝 프로세스
-
프로세스 (선전변마평)
선택 → 전처리 → 변환 → 마이닝 → 평가
- CRISP-DM
- 정의 : 비즈니스와 데이터 이해를 기반으로 6단계의 프로세스를 반복하는 계층적 프로세스 모델
-
계층 (단테프)
단계, 일반화 테스크, 세분화 테스크, 프로세스 실행
-
프로세스 (비데준모평전)
비즈니스 이해 → 데이터 이해 → 준비 → 모델링 → 평가 → 전개
- KDD (knowledge discovery In database)
- 빅데이터 분석방법론
- 구성
- 계층 : 단계(Phase), 태스크(Task), 스탭(Step)
-
프로세스 (기준분시평)
Untitled.png
- 구성
**[Phase 1]** 분석 기획
**[Task]** 비즈니스 이해 및 범위 설정
- **[Step]** 비즈니스 이해 - **[Step]** 프로젝트 범위 설정**[Task]** 프로젝트 정의 및 계획 수립
- **[Step]** 데이터 분석 프로젝트 정의 - **[Step]** 프로젝트 수행 계획 수립**[Task]** 프로젝트 위험 계획 수립
- **[Step]** 데이터 분석 위험 식별 - **[Step]** 위험 대응 계획 수립**[Phase 2]** 데이터 준비
**[Task]** 필요 데이터 정의
- **[Step]** 데이터 정의 - **[Step]** 데이터 획득 방안 수립**[Task]** 데이터 스토어 설계
- **[Step]** 정형 데이터 스토어 설계 - **[Step]** 비정형 데이터 스토어 설계**[Task]** 데이터 수집 및 정합성 검정
- **[Step]** 데이터 수집 및 저장 - **[Step]** 데이터 정합성 검정**[Phase 3]** 데이터 분석
**[Task]** 분석용 데이터 준비
- **[Step]** 비즈니스 룰 확인 - **[Step]** 분석용 데이터셋 준비**[Task]** 텍스트 분석
- **[Step]** 텍스트 데이터 확인 및 추출 - **[Step]** 텍스트 데이터 분석**[Task]** 탐색적 분석
- **[Step]** 탐색적 데이터 분석 - **[Step]** 데이터 시각화**[Task]** 모델링
- **[Step]** 데이터 분할 - **[Step]** 데이터 모델링 - **[Step]** 모델 적용 및 운영 방안**[Task]** 모델 평가 및 검증
- **[Step]** 모델 평가 - **[Step]** 모델 검증**[Phase 4]** 시스템 구현
**[Task]** 설계 및 구현
- **[Step]** 시스템 분석 및 설계 - **[Step]** 시스템 구현**[Task]** 시스템 테스트 및 운영
- **[Step]** 시스템 테스트 - **[Step]** 시스템 운영 계획**[Phase 5]** 평가 및 전개
**[Task]** 모델 발전 계획
- **[Step]** 모델 발전 계획**[Task]** 프로젝트 평가 및 복고
- **[Step]** 프로젝트 성과 평가 - **[Step]** 프로젝트 종료2.3. 분석 과제 발굴
분석 과제 탐색 방법
- 하향식: 분석 대상 아는 경우
- 상향식: 분석 대상 모르는 경우
디자인사고
-
더블 다이아몬드 프로세스 (발정개전)
Untitled.png
발견(Discover) ⇒ 정의(Define) ⇒ 개발(Develop) ⇒ 전개(Deliver)
-
d.school (공정아프테)
Untitled.png
공감(Empathize) → 문제정의 → 아이디어 도출 → 프로토타입 → 테스트 → 평가
하향식 접근법 (탐정해타)
Untitled.png
- 문제 탐색
- 비즈니스 모델 기반 탐색 (업제고 규감지)
- 문제 발굴 : 업무, 제품, 고객 단위
- 기회 : 규제와 감사, 지원 인프라
- 분석기회 발굴 범위 확장
- 거시적 : 사회, 정치,경제, 환경, 기술
- 경쟁자 확대 : 대체제, 경쟁자, 신규진입자
- 시장 수요 : 고객, 채널, 영향자
- 역량 : 내부, 파트너
- 외부참조모델 기반 문제 탐색
- 벤치마킹, 브레인스토밍, 분석 유즈케이스
- 비즈니스 모델 기반 탐색 (업제고 규감지)
- 문제 정의
- 비즈니스 문제를 데이터 문제로 변환하여 정의
- 최종 사용자 관점
- 해결방안 탐색
-
프로세스
기존 시스템 가능 여부 판단 → 분석 역량 판단
-
해결 방안
- 기존 유지
- 역량 확보
- 시스템 고도화
- 아웃 소싱
-
- 타당성 검토
- 경제적 타당성 : volume, valocity, variety, value
- 데이터 및 기술적 타당성
상향식 접근법
- 디자인싱킹
- 다이아몬드 프로세스 (발정개전)
- dschool (공정아프테)
- 기계 학습
- 지도 학습 : 머신러닝, 의사결정트리, 인공신경망, 분류분석
- 비지도 학습 : 기술통계, 프로파일링, 군집분석, 주성분분석, 다차원척도
- 프로토타이핑 (시행착오 해결법)
-
프로세스
가설생성 → 디자인 실험 → 테스트 → 인사이트도출 및 가설 검증
-
2.3. 분석 프로젝트 관리방안
특성
- 분석의 정확도 높이는 것 뿐만 아니라 사용자가 원활하게 활용할 수 있도록 고려.
- 데이터 영역과 비즈니스 영역의 중간에서 조정자 역할
- 지속적 모델 개선 관리 방안 수립 필요
고려사항 (양복분속정)
- 데이터 양
- 데이터 복잡도
- 분석 복잡도
- 분석 속도
- 정확도 & 정밀도
2.4. 분석 마스터플랜
정의
데이터 분석 기획의 특성을 고려하여 기업에서 필요한 데이터 분석 과제를 도출 및 우선순위를 결정하고, 단기 및 중/장기로 나누어 계획하는 활동
전사차원에서 식별된 다양한 분석 주제 또는 과제를 대상으로 적용의 우선순위를 선정하고, 이를 실행하기 위한 구체적인 일정계획, 단계적 구현 로드맵, 소요 인력, 예산 등 실행계획을 수립하는 과정
분석 마스터플랜 수립 프레임워크 (전비실 업분기)
Untitled.png
- 우선순위 선정
- 전략적 중요도
- 시급성
- 난이도
- ROI
- 실행 용이성
- 전략적 중요도
- 적용 범위 및 방식 선정
- 업무내재화 적용 수준
- 분석데이터 적용 수준
- 기술 적용 수준
- 분석 구현 로드맵 수립
수행과제 우선순위 평가
- 일반
- 전략적 중요도: 전략적 필요성, 시급성
- 실행 용이성: 투자 용이성, 기술 용이성
- 빅데이터 특징 기반
- 투자비용 요소 : Volume, Variety, Velocity
- 비즈니스 효과 : Value
- ROI 활용 기반
- 시급성 : 전략적 중요도, KPI
- 난이도 : 데이터 처리 비용, 분석 비용
💡ROI는 시급성 → 난이도 판단 순에 비해 포트폴리오는 동시에 고려하여 판단한다. -
포트폴리오 분석 활용
Untitled.png
- 시급성 우선 : III ⇒ IV ⇒ II
- 난이도 우선 : III ⇒ I ⇒ II
이행계획 수립
-
로드맵 수립
[1단계] 분석 체계 도입
[2단계] 분석 유효성 검증
[3단계] 분석 확산 및 고도화
-
세부 이행계획 수립
-
폭포수(Waterfall)
설계 ⇒ 구현 ⇒ 테스트
-
혼합형(Analytics) : 모델링 단계를 반복적 수행
분석 데이터 수집/확보 ⇒ 분석 데이터 준비 ⇒ 모델링 및 평가 ⇒ 모델링 및 평가 ⇒ (반복)
-
2.5. 분석 거버넌스
분석 거버넌스 구성요소 (조프시데교)
- 분석 조직
- 분석 프로세스
- 분석 관련 시스템
- 데이터
- 분석 교육
분석 수준 진단 프레임워크
- 분석 준비도 (업인기데문인)
- 분석 업무파악
- 분석 인력 및 조직
- 분석 기법
- 분석 데이터
- 분석 문화
- IT 인프라
- 분석 성숙도 (도활확최 비아조)
- 모델: CMMI (초기, 관리, 정의, 정량관리, 최적화)
- 단계:
- 도입 : 분석을 시작하기 위한 환경과 시스템 구축
- 활용 : 분석결과를 실업무에 적용
- 확산 : 전사차원에서 분석을 관리하고 공유
- 최적화 : 전사차원의 혁신으로 연결시키고 성과를 향상시키는 단계
- 부문: 비즈니스, 조직 및 역량, IT
-
진단 결과 (정확도준)
5cd9db5d-91ec-4078-aa78-ad3e77efc4fc.png
데이터 거버넌스
- 정의 : 전사 데이터에 대해 표준화된 관리체계를 수립하고 운영을 위한 프레임워크 및 저장소를 구축하는 활동
- 관리 대상
- 마스터 데이터
- 데이터 사전
- 메타데이터
- 구성요소
- 원칙 : 보안, 품질기준, 변경관리 등
- 조직 : 데이터 관리자, DB관리자, 데이터 아키텍트 등
- 프로세스 : 작업절차, 모니터링 활동, 측정 활동 등
- 체계 (표관저활)
- 데이터 표준화
- 표준용어 설정
- 명명규칙 수립 : CamelCase, snake_case 등
- 메타 데이터 구축
- 데이터 사전 구축
- 데이터 관리 체계
- 메타데이터, 데이터 사전 관리 원칙 수립
- 데이터 생명주기 관리방안 수립
- 데이터 저장소 관리
- 메타데이터, 표준 데이터 저장소 구성
- 사전 영향 평가 수행
- 표준화 활동
- 모니터링
- 지속적 점검 관리 및 교육
- 표준화 개선 활동
- 데이터 표준화
데이터 조직
- 목표: 기업의 경쟁력 확보를 위하여 비즈니스 질문과 이에 부합하는 가치를 찾고 비즈니스를 최적화 하는 것.
- 역할: 분석 업무 발굴, 빅데이터에서 인사이트를 찾아 전파하고 실행하는 것.
- 구성
- 집중형 : 별도 전담 조직, 우선순위 도출 용이, 분석 업무 중복 및 이원화 가능성
- 기능중심 : 업무 부서 소속, 전사 관점 부족, 일부 중복 가능성
- 분산형 : 분석조직 인력을 현업 부서에 배치, 우선순위 도출 용이, 분석 결과 신속 적용
-
유형
Untitled.png
- 집중형 : 조직 내 별도 분석 전담 조직 구성
- 기능 중심 : 각 부서에서 직접 분석
- 분산형 : 분석 조직의 인력을 현업에 배치
분석과제 관리 프로세스
Untitled.png
- 과제 발굴
- 분석 아이디어 발굴
- 분석 과제 후보 제안
- 분석 과제 확정
- 과제 수행
- 팀 구성
- 분석 과제 실행
- 분석 과제 진행 관리
- 결과 공유 및 개선
분석 교육 및 변화관리
- 문화 측면 : 모든 구성원이 데이터를 분석, 즉시 활용할 수 있는 문화 정착
- 교육 측면 : 툴 교육이 아닌 분석 역량 확보 및 강화에 초점
고객 니즈를 구성하는 4가지 가치 유형
기능적
재무적
무형
감성
감성가치 즐거움, 자긍심, 자유 등
무형가치 공유성, 확장성, 접근성 등
분석의 내재화 적용을 위한 고려요소
- 어떤 프로세스에 어떤 분석요소를 내재화 할 것인가?
- 분석 알고리즘(로직)을 어떻게 설계할 것인가?
- 분석 결과를 시각적으로 즉시 인지하고 행동할 수 있게 어떻게 구성할 것인가?
- 개인화 된 분석결과를 제공하고, 쉽게 동료에게 전달하여 커뮤니케이션 할 수 있는가?
- 독립된 정보계와는 달리 업무운영 시스템에 내재될 수 있는 융합성을 가지는가?
- 기업 외부에서 접근을 위한 보안과 다양한 플랫폼이 제공되는가?
- 대용량 데이터에 대해 필요한 시점에 적합한 속도로 분석을 제공하는가?
- 기업 내외부에서 산재한 구조화 및 비구조화 된 데이터 소스에 접근할 수 있는가?
비즈니스 모델이란 ▶ ‘기업운영방식의 표현’ ▶ ‘하나의 조직이 가치를 어떻게 만들고, 제공하며, 획득하는지에 대한 근본적 원리의 표현’ ▶ ‘1) 가치제안의 정립, 2) 세분시장의 정의, 3) 가치사슬구조의 정의, 4) 비용구조와 잠재적 이익 추정, 5) 공급자와 고객을 잇는 가치네트워크상에서의 위치 감수, 6) 경쟁전략의 형성’ ▶ ‘기업을 어떻게 경영하느냐를 설명하는 이야기’ 라고 정의할 수 있다. 비즈니스 모델과 전략을 비교해 볼 때, 가장 큰 차이점은 전략은 자사가 경쟁사보다 잘할 수 있 을지를 설명하는 것이라고 할 수 있다. 경쟁자의 활동들과는 다른 활동들을 수행하거나 유사한 활동들을 다른 방식으로 수행하는 것은 전략에 대한 설명이다.
해설 : 전략 프로파일링 단계를 통해 고객에게 제공할 효용 가치 측면에서 전략 캔버스를 정의하 고, 전략 캔버스의 효용 가치를 실현하기 위해 ERRC 관점에서 실행요소들을 도출하고, 전략 캔버 스와 ERRC 테이블을 기준으로 전략테마와 실행요소간의 관계를 정의할 수 있다. 고객이 제공받기를 원하는 효용에 대해 자사 및 경쟁서가 제공하고 있는 가치수준을 비교 평가하 고, 경쟁사와 차별화 된 고객 효용 제공을 위한 가치요소를 발굴하여, 미래의 전략 프로파일을 설 정하고 실행요소를 발굴한다. 전략캔버스를 통해 확인된 전략적 경쟁요소와 ERRC 분석을 통해 도출된 고객 효용 제공을 위한 실행 요소들 간의 연관성을 파악 한 후, ACtivity System Map으로 전략테마와 연관된 실행활동들 을 매핑하여 표현한다.
« ADsP 1과목. 데이터의 이해
ADsP 3과목. 데이터 분석 »