1. 분산 데이터베이스의 정의
: 여러 곳으로 분산되어 있는 데이터베이스를 하나의 가상 시스템으로 사용할 수 있도록 한 데이터 베이스.
2. 분산 데이터베이스의 구성요소
- 분산 처리기: 자체적으로 처리 능력을 가진 시스템.
- 분산 데이터베이스: 지리적으로 분산되어 있는 데이터베이스.
- 통신 네트워크: 분산 처리기를 통신망으로 연결하여 논리적으로 하나의 시스템처럼 작동할 수 있도록 하는 통신 네트워크.
3. 분산 데이터베이스의 목표 ★★ *투명성 조건
- 위치 투명성(Location): 실제 위치를 알 필요없이 논리적인 명칭으로 엑세스 가능.
- 분할 투명성(Division): 각 단편의 사본을 여러 위치에 저장.
- 지역사상 투명성(Local Mapping): 각 지역시스템 이름과 무관한 이름 사용 가능.
- 중복 투명성(Replication): 동일 데이터가 여러 곳에 중복되어 있어도 하나처럼 사용 가능.
- 병행 투명성(Concurrency): 다수의 트랜잭션들이 동시에 실현되더라도 결과는 영향받지 않음.
- 장애 투명성(Failure): 장애에도 불구하고 트랜잭션을 정확하게 처리.
*투명성(Transparency): 어떠한 사실이 존재함에도 마치 투명하여 보이지 않는 것처럼 염두에 두지 않아도 되는 성질.
4. 분산 데이터베이스의 장⋅단점
4. 1. 분산 데이터베이스의 장점
– 지역 자치성이 높음.
– 자료의 공유성 향상.
– 중앙 컴퓨터의 장애가 전체의 시스템에 영향을 끼치지 않음.
– 신뢰성 및 가용성이 높음.
4. 2. 분산 데이터베이스의 단점
– DBMS가 수행할 기능이 복잡함.
– 데이터베이스 설계가 어려움.
– 소프트웨어 개발 비용 및 처리 비용 증가.
– 잠재적 오류 증가.
5. CAP이론
: 어떤 분산 환경에서도 일관성(C), 가용성(A), 분산 허용성(P) 세 가지 속성 중, 두 가지만 가질 수 있다는 이론.