본문 바로가기
Major Review (학부)/Database

[DB] Ch01. 데이터베이스 환경

by 삼준 2023. 4. 4.
반응형

1. 정보 처리 시스템

1.1. 정보와 데이터
데이터 : 단순한 관찰이나 측정을 통해서 수집된 사실이나 값.
정보 : 어떤 상황에 대한 적절한 결정을 할 수 있게 하는 지식으로서 데이터의 유효한 해석이나 데이터 상호 간의 관계. 데이터를 처리해서 얻어진 결과라고 할 수 있음.
정보를 추출하는 방법은 중요하며, 데이터를 수집만 해놓는 것은 의미가 없음.
정보 추출 방법을 '데이터 처리', 넓게는 '정보 처리'라고 함.
정보가 유용하기 위해선 정확성과 현재성을 가지고 있어야 함. 또한 언제라도 이용할 수 있도록 수집, 조직, 저장되어 있어야 함.

1.2. 정보 시스템(Information System)
정보 시스템 : 필요시에 처리해서 의사 결정에 유효한 정보를 생성하여 분배하는 수단. 사용 목적에 따라 여러가지 이름으로 불림. (ex. 경영[MIS], 군사:[MIS], 행정:[AIS], 인사:[PIS], 등)
의사 결정 지원 시스템(DSS, Descision Support System) : 하나의 목적보다 여러 가지 복합적이고 광범위한 의사 결정 목적을 위한 통합적인 기능을 수행하는 정보 시스템
데이터 웨어하우스 : 다양한 소스의 데이터를 별도로 추출하여 관리하는 것.
데이터 마이닝 : 대형 데이터 웨어하우스에서 관련 데이터를 찾아내고 필요한 정보 또는 지식을 생성하는 과정.
지식 관리 시스템 : 지식을 직접 저장하고 관리하여 활용하게 하는 시스템.
응용 시스템 : 조직의 한 부서가 필요로 하는 정보를 제공해주는 서브 시스템.
응용 프로그램 : 응용 시스템의 기능을 수행하는 프로그램.


2. 데이터 처리 시스템

데이터 처리 형태에 따라 세 가지로 분류함.
2.1. 일괄 처리 시스템(Batch Processing)
데이터를 수집해서 분류하고 정렬시킨 다음에 일괄 처리하는 방법.
유사한 트랜잭션을 모아 한번에 처리함으로써 효율성을 높임.
+ 트랜잭션 : 하나의 단위로 처리되어야 하는 분리될 수 없는 연산 그룹
한꺼번에 처리할 필요가 있고 그룹별로 분류시킬 수 있는 성질을 가지고 있음. 처리 요건이 일괄적인 성격을 띠고 있는 방식에 적합함.
장점)
트랜잭션 당 적은 처리 비용
시간당 처리되는 작업 수가 많음 > 시스템 성능 높음
단점)
개인적인 처리 결과를 위해 대기해야됨 > 개인의 측면에서 불편함
사전 준비 작업이 필요함

2.2. 온라인 처리 시스템(On-line Processing System)
사전 준비 없이 곧바로 데이터를 처리하는 방식
데이터는 생성되는 출처로부터 곧바로 컴퓨터에 전송되고 즉시 처리되어 원하는 장소로 보내짐. 온라인 실시간 처리라고도 함.
대기 시간이 없기 때문에 사용자로서는 편리하며 사용자 중심 처리 방식이라고 함.
장점)
데이터의 입력에 따른 데이터의 분류 및 정리 작업이 절약됨.
오류도 입력 시에 즉시 발견, 교정할 수 있어서 데이터 처리의 회전 주기를 단축 시킴.
단점)
원격 터미널들과 통신을 유지해야 되고, 이를 위한 통신 제어기가 필요하기 때문에 구조가 복잡해짐.
작업량이 많지 않으면 CPU의 효율성이 낮아짐.
시스템이 계속적인 가동 상태를 유지해야 됨 > 작업 당 처리 비용이 높게 되는 원인이 될 수 있음.

2.3. 분산 처리 시스템(Distrivuted Processing System)
지리적(물리적)으로 분산되어 있는 처리기와 DB를 네트워크로 연결시켜 사용자가 하나의 시스템을 사용하는 것처럼 데이터를 처리해 주는 시스템.
분산 처리기 : 분산 설치되어 있는 복수의 컴퓨터, 지역 처리기를 말함.
통신 네트워크 : 지역적으로 분산되어 독립적으로 운영될 수 있는 처리기들을 연결시켜 자원을 공유하게 함으로써 논리적으로 하나의 시스템과 같이 운영되도록 하는 네트워크.
노드들끼리 연결되어 있지 않고 분산되어 있는 시스템을 비 중앙 집중 시스템이라 함.
분산 데이터베이스 : 지리적으로 분산 저장되어 있는 형태의 데이터베이스, 논리적으로 하나의 데이터베이스로 취급됨.
데이터를 처리해 주거나 전송해 주는 컴퓨터 처리기를 서버, 데이터의 처리나 전송을 요청하는 컴퓨터 처리기를 클라이언트라고 함.
중앙 집중 시스템 = 하나의 서버 + 여러 클라이언트
분산 시스템 = 처리기 한 대가 서버/클라이언트 역할 모두 함.
각 시스템은 별개로 독립, 분할 통제되는 것은 아니고 범 시스템적인 규정에 따라 통제를 받음.
장점)
시스템 장애에 대비한 신뢰성 증대.
확장이 쉬움.


3. 데이터베이스의 정의

: 여러 응용 시스템들이 공용할 수 있도록 통합, 저장된 운영 데이터의 집합.
정의가 함축하고 있는 의미

  • 통합 데이터 : 원칙적으로 중복되지 않음. 효율을 위해 불가피하게 의도적으로 중복된 사항 = 최소의 중복/통제된 중복이라고 함.
  • 저장 데이터 : 저장 매체에 저장됨.
  • 운영 데이터 : 조직의 존재 목적이나 기능을 수행하는데 없어서는 안 됨.
  • 공용 데이터 : 조직에 있는 여러 응용 시스템이 공동으로 소유, 유지, 이용함.


4. 데이터베이스의 특성

  • 실시간 접근성
    쿼리에 대해 실시간 처리(몇 초 이내)로 응답할 수 있어야 함. 일반적으로 온라인 처리라고 하면 실시간 처리를 의미함.
  • 계속적인 변화
    새로운 데이터의 삽입, 삭제, 갱신으로 내용이 변하며, 이 변화 속에서 현재의 정확한 데이터를 유지해야 함.
  • 동시 공용
    여러 사용자가 동시에 접근하여 이용할 수 있어야 함.
  • 내용에 의한 참조
    데이터의 참조는 레코드의 주소나 위치가 아니라 사용자가 요구하는 데이터의 내용, 값에 따라 참조됨.

 

 

5. 데이터베이스의 개념적 구성요소

데이터베이스를 구성하는 요소는 사용자 관점에서의 "논리적/개념적 구성요소"와 시스템 관점의 "물리적 구성요소"로 나누어 생각할 수 있음. 개념적 구성요소로는 개체와 관계가 있음.
5.1. 개체(Entity)
객체로써 서로 구별되는 것. 컴퓨터가 취급하는 파일의 레코드에 대응됨. 단독으로 존재할 수 있으며, 정보로서의 역할을 함.
하나의 개체는 하나 이상의 속성(Attribute)으로 구성되고 각 속성은 그 개체의 특성이나 상태를 기술함.
+ 속성(Attribute) : 이름을 가진, 데이터의 가장 작은 논리적 단위. 파일 구조에서는 데이터 항목 또는 필드라고 함. 단독으로 존재하지는 못함.
한 개체는 속성들이 어떤 구체적인 값을 가짐으로써 실체화됨.
실체화된 개체를 '개체 인스턴스'(또는 '개체 어커런스')라고 하며 인스턴스들의 집합을 '개체 집합'이라고 함.
속성 이름들로만 기술된 개체의 정의를 '개체 타입'이라고 함.
같은 논리로,
필드 이름으로만 표현된 레코드 정의를 '레코드 타입'이라 하고, 필드 값으로 표현된 레코드를 '레코드 어커런스'(또는 '레코드 인스턴스')라고 함.

5.2. 관계(Relationship)
개체 집합 간에는 여러 유형의 관계가 존재할 수 있으며, 이 관계는 저장 대상임. 개체들을 연관시켜 어떤 의미를 나타내어 개체와 다름이 없기 때문.
속성 관계 : 속성들 간의 관계, 개체 내 관계
개체 관계 : 개체들 간의 관계, 개체 간 관계
보통 개체 관계만 명시적으로 취급하고, 속성 관계는 묵시적/암시적으로 취급함.
개체와 관계를 도식으로 표현한 다이어그램을 E-R 다이어그램이라고 함.

6. 데이터베이스의 구조

데이터베이스의 값들은 처리를 위해 물리적 저장 장치 위에 저장되어야 하는데, 사용자 입장에서 보냐, 시스템 입장에서 보냐에 따라 논리적 구조와 물리적 구조로 구별됨.
논리적 구조 : 사용자가 생각하는 데이터의 논리적 표현. 여기서 취급하는 데이터 레코드를 '논리적 레코드'라고 함.
물리적 구조 : 물리적으로 저장되어 있는 데이터의 실제 구조. 여기서 취급하는 데이터 레코드들을 '저장 레코드'라고 함.
논리적 구조와 물리적 구조는 당연히 서로 대응 관계를 가져야 함.

반응형

댓글