Croot Blog

Home About Tech Hobby Archive

DAP 3과목. 데이터 표준화

제1장 데이터 표준화 개요

제1절 데이터 표준화 필요성

1. 데이터 관리 현황 및 개선 방안

데이터 활용상의 문제점

  • 데이터 중복, 불일치 발생
  • 데이터 의미 파악 지연 → 정보 제공 적시성 결여
  • 데이터 통합 어려움
  • 변경 및 유지 보수 곤란

데이터 문제점의 원인

  • 동시 다발적 정보시스템 개발
  • 전사 데이터 관리 마인드 부재
  • 전사 데이터 관리 인력 부재
  • 전사 데이터 표준 관리 도구 부재

데이터 관리 개선 방안

  • 데이터 표준화 기본 방침 설정
  • 전사적 공통 데이터 요소 도출
  • 전사적 데이터 등록 및 관리 체계 구축
  • 개발 및 유지보수 시 승인된 데이터 요소 활용

2. 데이터 표준화 기대 효과

  • 의사소통 : 명칭 통일로 명확한 의사소통 증대
  • 일정 : 데이터 파악 시간 및 노력 감소
  • 품질 : 일관된 데이터 형식 및 규칙으로 데이터 품질 향상
  • 비용 : 데이터 인터페이스 비용 감소

제2절 데이터 표준화 개념

1. 데이터 표준화 정의

시스템별로 산재해 있는 데이터 정보 요소에 대한 명칭, 정의, 형식, 규칙에 대한 원칙을 수립하여 전사적으로 적용하는 것

데이터 명칭

해당 기업 내 데이터를 유일하게 구별하는 이름으로 아래의 원칙에 부합해야한다.

  • 유일성
  • 업무적 관점의 보편성
  • 의미 전달의 충분성

데이터 정의

해당 데이터가 의미하는 범위 및 자격 요건을 규정하며 데이터 소유자를 결정하는 기준

  • 업무를 모르는 제3자 입장에서 기술
  • 의미 전달이 어려운 경우 데이터 값도 같이 기술
  • 서술, 약어, 전문 용어는 가급적 배제

데이터 형식

데이터 입력 오류와 통제 위험을 최소화하는 역할

  • 데이터 타입
  • 데이터 길이 및 소수점 자리

데이터 규칙

발생 가능한 데이터 값을 사전에 정의하여 입력 오류와 통제 위험을 최소화하는 역할

  • 기본 값 : 미입력 시 적용
  • 허용 값 : 입력 가능 데이터 값을 제한
  • 허용 범위

2. 데이터 표준화 구성요소

0Untitled.png

데이터 표준

관리 대상은 용어, 단어, 도메인, 코드

  • 표준 용어
    • 업무적 용어 : 보고서나 업무 매뉴얼 상 사용
    • 기술적 용어 : 테이블명, 칼럼명 등
  • 표준 단어
    • 중복 개념의 용어 방지
    • 영문명 작성 기준
  • 표준 도메인
    • 동일 성질의 칼럼 일관성 확보
    • 공통 검증 규칙 적용 가능
  • 기타 데이터 표준 관련 요소

데이터 표준 관리 조직

  • 데이터 관리자 주요 역할
    • 데이터 정책 및 표준 정의
    • 부서 간 데이터 구조 조율
    • 데이터 보안 관리
    • 데이터 모델 관리
    • 효율적인 활용 방안 계획
  • 데이터 관리자 세부 역할
    • 전사 데이터 관리자 : 데이터 표준화 정책 결정, 표준 제안 승인
    • 업무 데이터 관리자 : 업무 기능 데이터 표준 정의, 업무 데이터 표준 변경 제안 검토
    • 업무 시스템 데이터 관리자 : 시스템 관리 데이터 표준 정의, 데이터 모델의 표준 적용 체크
  • 데이터베이스 관리자와 비교
구분 데이터 관리자 데이터베이스 관리자
관리 대상 데이터 모델 및 표준 데이터베이스
주업무 메타데이터 정의 및 데이터 모델 관리 데이터베이스 관리
품질 확보 활동 데이터 표준 관리 및 적용 데이터 정합성 관리
전문 기술 업무 지식 및 데이터 모델링 모델 해독능력 및 데이터베이스 지식

데이터 표준화 절차

  • 요구사항 수집
    • 개발 시스템 데이터 표준 수집
    • 데이터 표준화 요구 사항 수집
  • 데이터 표준 정의
    • 표준화 원칙
    • 용어, 단어, 도메인, 코드 의 표준 정의
  • 데이터 표준 확정
    • 표준 검토 및 확정
    • 표준 공표
  • 데이터 표준 관리
    • 표준 이행
    • 관리 절차 수립

제3절 데이터 표준 관리 도구

수립된 전사 데이터 표준 정보의 관리, 데이터 표준에 의한 개발 및 유지 보수 지원, 데이터 표준 준수 및 변경 영향도 평가를 담당하는 기능으로 구성

1. 확장된 데이터 표준 관리 도구의 기능

  • 데이터 모델 관리
  • 데이터 표준 관리
  • 데이터 품질 관리
  • OLAP 정보 관리
  • 사용자 권한 관리
  • 변경 영향도 분석
  • ETL 정보 관리
  • 표준 요청 관리
  • JOB 관리
  • DB 스키마 관리

2. 데이터 표준 관리 시스템 기능

데이터 표준 관리 기능

  • 단어 관리 : 전사 단어 사전 및 금칙어
  • 용어 관리 : 용어 사전
  • 도메인 관리 : 도메인 사전
  • 표준 코드 관리 : 전사 표준 코드, 코드 변환 매핑
  • 멀티 표준 관리 : 멀티 표준

데이터 구조 관리 기능

  • ER 모델 구조 관리 : 모델, 테이블 구조 정보
  • DB 스키마 관리 : 다양한 DBMS 지원 및 DB 스키마 로드
  • 가변 속성 관리 : 모델 사용자 속성 자동 생성
  • 이력 관리 : 이력 관리
  • 모델 비교 관리 : 충실도 및 준수도 검사

프로세스 관리 기능

  • 표준 등록 : 표준 요청 프로세스 지원
  • 모델 등록 : 모델 등록 요청 프로세스 지원

3. 데이터 표준 관리 시스템 도입 시 고려사항

  • 확장성
  • 유연성
  • 편의성

4. 데이터 표준 관리 시스템 부재시 관리 방법

  • 모델링 도구 사전 활용
  • 엑셀 등의 문서로 관리

제2장 데이터 표준 수립

제1절 데이터 표준화 원칙 정의

1. 데이터 표준화 요구 사항 수집

현업 및 개발자로부터 인터뷰 및 설문 조사 등을 통하여 조사함으로써 전사 데이터 표준 대상 후보를 식별하고 개선점을 도출하기 위한 자료를 마련한다.

전체적인 관점 및 제3자의 관점에서 기술 할 수 있도록 유도한다.

  • 영역 간의 인터페이스 부분에서 발생하는 불편 및 개선 사항을 파악
  • 영역에 익숙하지 않은 관련자 관점이 더 유용하다

2. 현행 데이터 표준 원칙 분석

현행 데이터 표준 원칙 및 데이터 표준을 수집, 식별된 데이터 표준의 관리 대상 및 현황 파악

현행 데이터 표준 원칙 수립

  • 현행 정보시스템 개발 지침 문서 및 데이터 표준의 확보
  • 현행 정보시스템 모델의 분석

데이터 표준 원칙 사용 현황 분석

수집된 데이터 표준 원칙 자료를 토대로 데이터 표준 대상 및 관리 항목을 도출

데이터 표준 대상 별로 적용된 정보시스템, 관리되는 관리항목, 관리 차이점 등을 조사한다.

3. 데이터 표준 개선 방안 정의

현행 데이터 표준 사용 현황 명세서와 표준화 요구 사항 정의서를 토대로 표준 대상별 문제점 및 개선 방안 도출

전사적인 관점에서 접근하며 필요성을 검토, 기존 데이터 관리 정책에 부합 되어야 한다.

4. 데이터 표준 원칙 수립

개선 방안을 토대로 향후 적용할 전사 데이터 표준 기본 원칙을 정의하고 작성하여 문서화한다.

데이터 표준 기본 원칙 정의

데이터 표준 개선 방안을 참고하여 기본 원칙을 수립하면 표준화 방향을 사전에 정의할 수 있다.

데이터 표준 지침 작성

  • 데이터 표준 지침 기본 구성
    • 개요 : 목적
    • 데이터 표준화 관련자의 역할과 책임 : 사용자 정의, 역할 및 책임 규정
    • 데이터 표준 관리 절차 : 작업 프로세스 규정
    • 데이터 표준 기본 원칙
    • 데이터 표준 대상별 명명 규칙 : 대상별 명칭 작성 방법 구체적 기술
    • 데이터 형식 정의에 대한 기준 : 데이터 표현 형태 정의 기준 및 방법 기술
    • 기타
  • 데이터 표준 대상별 지침 일반 구성
    • 표준 단어
    • 표준 용어
    • 표준 도메인
    • 표준 코드
  • 유의 사항
    • 범용성 고려하여 정의
    • 적용 대상 DBMS에 모두 적용 가능하도록 고려
    • 데이터 타입이 상이한 각 DBMS에 따라 적용 방안 고려

제2절 데이터 표준 정의

1. 표준 단어 사전 정의

표준 단어 사전

  • 관리 기준
    • 표준성
    • 일반성
    • 대표성
  • 작성 형식
    • 번호, 한글명, 정의, 영문명, 영문약어, 단어종류, 단어유형, 분류단어 여부, 비고
    • 엔티티와 속성을 개별 단위로 추출
    • 물리명, 유사용어, 단어 간 구조 정의

표준 단어 정의

  1. 현행 용어 수집
  2. 단어 분할
  3. 단어 정련
  4. 표준 단어 사전 정의

표준 단어 정의 시 고려 사항

  • 고유의미인 경우 조합 단어를 표준 단어로 정의
  • 표준단어 영문명은 알파벳으로 시작
  • 접두어, 접미어는 조합하여 표준 단어로 정의

2. 표준 도메인 사전 정의

업무적인 용도, 사용 빈도와 데이터의 물리적인 특성 등을 고려하여 도메인을 분류하고 도메인별 데이터 타입을 부여

표준 도메인 사전

도메인 : 속성에 정의된 조건을 만족시키는 값의 범위

표준도메인 : 논리적, 물리적으로 유사한 유형의 데이터를 그룹화하여 유형과 길이를 정의한 것.

  • 관리 기준
    • 표준성
    • 유일성
    • 업무 지향성
  • 작성 형식
    • 번호, 도메인명, 정의, 데이터타입/길이, 비고
    • DBMS에 동일한 형태로 구현되는 속성들을 추출하여 그룹화
    • 속성과 도메인은 상호 매핑하여 관리

표준 도메인 정의

정보시스템별로 혼재되어 사용되고 있는 칼럼명, 데이터 타입, 길이 등을 정리하여 정립

  1. 현행 용어 정보 분석
    • 동일한 타입과 길이의 데이터를 그룹핑
    • 끝 단어가 유사한 속성의 용어 그룹핑
  2. 표준 도메인 정의
    • 업무적으로 의미 있는 도메인 부여
    • 호환성 및 범용성 고려 (그룹핑된 용어 중 가장 큰 데이터 타입 길이를 표준)

표준 도메인 정의 시 고려 사항

  • 모든 용어를 포괄하는 표준 도메인 불필요
  • 데이터 형식 정의 및 DBMS 적용 고려

3. 표준 코드 사전 정의

수집된 용어로부터 코드를 선별하여 현 코드의 코드 값 조사

통합 대상 파악하여 표준 코드를 정의하고 현 코드와 매핑 설계 및 코드 권한 관리를 위한 오너십 정의

표준 코드 사전

  • 관리기준
    • 재사용성
    • 일관성
    • 정보 분석성
  • 작성 형식
    • 코드유형번호, 코드명, 코드구조, 코드번호, 코드값, 오너쉽부서, 사용부서
    • 코드는 표준화 팀에서 엄격히 관리되어야 함
    • 도메인 값의 범위가 명확한 경우 코드화 불필요

표준 코드 정의

  1. 현행 코드 수집
    • 단독 코드 테이블 : 코드인지 정보성 데이터인지 구분 뒤 추출 여부 판단
    • 통합 코드 테이블 : 모두 수집
    • 애플리케이션 정의 : 사용자 인터페이스 조회, 데이터 값 추출 등 간접적인 방법으로 수집
  2. 현행 코드 상세 분석
    • 동일한 모든 코드 인스턴스 확인 후 식별
    • (코드 많을 시) 업무 기능별로 코드 분류 후 분석
  3. 표준 코드 정의
    • 통합 대상이 없을 시 현행 유지
    • 통합 대상 존재 및 코드번호 상이할 경우 새로운 코드 번호 부여

표준 코드 활용

일부 코드 값만 사용 시 파생코드를 정의하며 파생코드의 코드번호, 코드값은 표준 코드에 정의

표준 코드 정의 시 고려 사항

  • 향후 확장성 고려 및 일관성 유지
  • 삭제 대신 상태 변경 및 코드 값 교체
  • 표준 코드-현행 코드 매핑 정보 기록

4. 표준 용어 사전 정의

표준 용어 사전

  • 관리 기준
    • 표준성
    • 일반성
    • 업무 지향성
  • 작성 형식
    • 번호, 용어유형, 표준한글명, 표준영문명, 설명, 데이터 타입/길이, 표준 도메인, 비고
    • 엔티티 용어 사전과 속성 용어 사전으로 구분 관리

표준 용어 정의

  1. 현행 용어에 대한 표준 단어 도출 및 표준 용어 정의
  2. 표준 단어에 대한 도메인/코드 정의

표준 용어 정의 시 고려 사항

  • 데이터 표준 원칙에서 정의한 허용 길이 준수

제3절 데이터 표준 확정

1. 데이터 표준 검토

데이터 관리자가 정의한 표준 단어 사전, 표준 도메인 사전, 표준 코드, 표준 용어 사전 등을 확인하고 해당 용어가 현재 사용되고 있는 용어로 정확하게 정의되어 있는지 확인하고 승인 처리한다.

데이터 표준 검토 계획 수립

주요 검증 기준

  • 유일성
  • 완전성
  • 정확성
  • 범용성

데이터 표준 검토

  • 검토 기준 및 산출물 준비 후 참여 대상자에게 배포
  • 제반 준비 수행 및 검토 담당자 별 역할 주지
  • 검토 시 제기 이슈 목록 정리 및 일정 준수
  • 종료 시 세션별 결과 정리 및 보완 사항 작성

데이터 표준 보완 및 승인

  • 보완 결과 확인 준비
  • 보완 대상의 데이터 표준 반영 여부 확인

2. 데이터 표준 공표

  • 데이터 표준 배포
  • 데이터 표준 교육

제3장 데이터 표준 관리

제1절 데이터 표준 관리

1. 데이터 표준 관리 개요

데이터 표준 정의 단계에서 수립된 데이터 표준에 근거하여 관리 프로세스를 정립하여 데이터 표준을 관리

2. 데이터 표준 관리 프로세스 유형

  • 데이터 표준 신규 요건 발생 프로세스
  • 변경 or 삭제 시 영향도 분석 프로세스
  • 준수 여부 확인 프로세스

제2절 데이터 표준 관리 프로세스

1. 데이터 표준 관리 프로세스 구성요소

  • 프로세스
  • 태스크
  • 역할 및 담당업무

2. 구성요소별 설명

프로세스

1Untitled.png

태스크

  • 표준 신규/변경 요청
  • 표준 준수 검토

역할과 담당 업무

  • 업무 담당자
    • 표준 신규 및 변경 요청
    • 변경 내용 적용
  • 데이터베이스 관리자
    • 변경 내용 적용
    • 테스트 및 검증
    • 반영 결과 통보
  • 데이터 관리자
    • 요청 검토 및 표준 준수 여부 체크
    • 영향도 분석 및 변경 계획 수립
    • 메타 DB 표준 등록 및 배포
  • 전사 데이터 관리자
    • 전사 관점 표준 가이드 제시