2021. 3. 14. 18:27ㆍTopcit 정리/기술 영역 - 데이터베이스 구축과 운영
데이터웨어하우스
개념
외부 데이터를 주제별로 통합하여 별도의 프로그래밍 없이 즉시 분석할 수 있도록 하는 시스템
특징
주제지향 : 의사결정에 필요한 특정 주제의 데이터만을 저장
통합적 : 데이터의 정합성과 물리적 통일성을 갖는 구조
시계열적 : 데이터를 일련의 스냅숏 형태로 오랜기간 보유
비휘발성 : 한번 적재되면 이후에 삭제 및 수정이 불가능하다.
데이터웨어하우스 모델링
모델링 기법
스타 스키마 : 데이터를 분리하여 설계하는 모델링 기법
스노우플레이크 스키마 : 중복이 적지만 스타 스키마에 비해 조인 연산이 늘어남
ETL(Extraction/Transformation/Loading)의 개념
추출 (Extraction) : 원본 파일로 부터 데이터웨어 하우스에 저장될 데이터를 추출
변환 (Transformation) : 추출한 데이터를 정제하고 이를 형태에 맞게 변환
적재 (Loading) : 변환 가공된 데이터를 데이터웨어하우스로 전송하여 저장
OLAP(OnLine Analytical Processing)의 개념 및 탐색기법
OLAP는 최종 사용자가 다차원 정보에 중간 매개자나 매개체 없이 정보에 직접 접근하여 대화식으로
정보를 분석하고 의사결정에 활용하는 과정을 의미한다.
OLAP 탐색기법
Drill Down : 특정한 주제에 대하여 높은 요약 수준에서 낮은 수준으로 접근 (예 : 년->월->일)
Roll Up : Drill Down 반대
Drill Across : 하나의 분석 주제에 대한 특정 분석 관점을 이용하여 다른 방향으로 접근
Pivot : 분석 주제에 대하여 분석 관점의 축을 바꾸는 기법
Slice : 한 차원의 멤버에 대하여 특정한 값을 선택하여 부분 집합을 생성
Dice : 두개 이상의 차원을 Slice하여 부분집합에 생성
데이터마이닝의 개념 및 알고리즘
데이터마이닝이란 대용량의 데이터 안에서 체계적인 통계적 규칙이나 패턴을 탐색하고
이를 의미 있는 정보로 변환하여 의사결정에 적용하는 일련의 과정을 의미한다.
데이터마이닝 알고리즘
연관 분석 : 거래 데이터 등에서 관련성이 강한 데이터 조합을 통해 패턴을 발견하는 분석 알고리즘
순차 분석 : 연관 분석에 시간 개념을 추가하여 상호 연관성 탐색
분류 : 데이터집합이 주어졌을 때 그 데이터들을 분석하여 특정 속성값을 분류
군집 분석 : 주어진 레코드들을 여러 가지 속성들을 고려하여 비슷한 레코드들로 분류
'Topcit 정리 > 기술 영역 - 데이터베이스 구축과 운영' 카테고리의 다른 글
15. 빅데이터 및 NoSQL (0) | 2021.03.17 |
---|---|
14. XML에 대한 이해 (0) | 2021.03.15 |
12. 데이터베이스 종류 (0) | 2021.03.12 |
11. 데이터베이스 복구 (0) | 2021.03.10 |
10. 동시성제어 (0) | 2021.03.09 |