1. 데이터베이스란? ★
: 특정 조직의 업무를 수행하는 데 필요한 상호 관련된 데이터들의 모임.
- 통합된 데이터(Integrated Data): 자료의 중복을 최소화한 데이터의 모임.
- 저장된 데이터(Stored Data): 컴퓨터가 접근할 수 있는 저장매체에 저장된 자료.
- 운영 데이터(Operational Data): 없어서는 안 될 반드시 필요한 데이터.
- 공용 데이터(Shared Data): 공동으로 소유하고 유지하는 데이터.
2. DBMS(DataBase Management System)
: 사용자와 데이터베이스 사이에서 사용자의 요구에 따라 정보를 생성하고, DB를 관리해 주는 SW.
– 장점: 데이터의 중복 배제, 자료 공동 이용 가능, 데이터 무결성⋅일관성 유지.
– 단점: DB전문가 부족, 전산화 비용 증가.
2. 1. DBMS의 필수 기능 ★★
- 정의 기능
– DB에 저장될 데이터 형과 구조에 대한 정의⋅이용방식⋅제약조건 등을 명시.
- 조작 기능
– 데이터 검색⋅갱신⋅삽입 등을 체계적으로 처리하기 위해 사용자와 DB간의 인터페이스 수단을 제공.
- 제어 기능
– 데이터 무결성이 유지되도록 제어.
– 보안 유지, 권한 검사.
– 여러 사용자가 DB를 동시 접근하여 데이터를 처리할 때, 결과가 정확성을 유지하도록 병행 제어.
3. 데이터베이스의 구성
3. 1. 스키마(Schema) ★
: 데이터베이스의 구조(개체, 속성, 관계)에 대한 정의.
- 외부 스키마: 사용자의 관점에서 보여주는 데이터베이스 구조, 전체 데이터베이스의 일부(=서브 스키마)
- 내부 스키마: 저장장치의 입장에서 데이터베이스 전체가 저장되는 방법을 명세. 단 하나만 존재.
- 개념 스키마: 전체 사용자, 모든 응용 시스템이 필요한 데이터베이스 구조로 조직 전체의 데이터베이스. 단 하나만 존재.
4. 데이터베이스 용어 ★
- 데이터웨어하우스
– 다량의 데이터를 효과적으로 분석하여 정보화.
– 다양한 원본 데이터베이스로부터 정제되어 추출된 데이터만을 저장.
-
- OLAP(On-Line Analytical Processing)
– 대용량 데이터를 고속으로 처리⋅분석하는 도구.
– OLAP 연산 종류: Roll-Up, Drill-Down, Dicing, Slicing
- 데이터 마트
– 특정 사용자과 관심을 갖는 데이터를 담은 작은 규모의 데이터 웨어하우스.
- 빅데이터
– 데이터의 생성 양, 주기, 형식이 매우 커서 수집⋅저장⋅검색⋅분석이 어려운 방대한 데이터.
- 데이터 마이닝
– 데이터웨어하우징에서 수집되고 분석된 자료를 사용자에게 제공하기 위해 분류⋅가공되는 기술.
- 하둡(Hadoop)
– 소규모 일반 컴퓨터를 다수 연결하여 가상화된 대형 스토리지를 구현.
– 거대한 데이터 세트를 병렬로 처리할 수 있도록 빅데이터 분산처리를 돕는 자바 소프트웨어 오픈소스 프레임워크