본문 바로가기
공부/데이터 베이스

[데이터 베이스] 1장_데이터베이스 기본 개념

by xladmt 2021. 10. 7.

01 데이터베이스의 필요성

  1. 데이터와 정보

  • 데이터(data) : 현실 세계에서 단순히 관찰하거나 측정하여 수집한 사실(fact)이나 값(value)으로, 자료라고도 함.
  • 정보(Information) : 데이터를 의사 결정에 유용하게 활용할 수 있도록 처리하여 체계적으로 조직한 결과물
  • 정보처리(Information Processing) : 데이터에서 정보를 추출하는 과정 또는 방법

  2. 정보 시스템과 데이터베이스

      정보 시스템(Information System) : 조직 운영에 필요한 데이터를 수집하여 저장해두었다가 의사 결정이 필요할 때 처리하여 유용한 정보를 만들어주는 수단

 

정보 시스템의 역할과 구성

 

02 데이터베이스의 정의와 특징

     데이터베이스(DB : DataBase) : 특정 조직의 여러 사용자가 '공유'하여 사용할 수 있도록 '통합'해서 '저장'한 '운영'데이터의 집합

     

   <데이터 베이스의 정의>

    - 공유 데이터(shared data)

      : 데이터베이스는 특정 조직의 여러 사용자가 함께 소유하고 이용할 수 있어야 하는 공용 데이터.

       그러므로 사용 목적이 다른 사용자들을 두루 고려하여 데이터베이스를 구성해야 함.

    - 통합 데이터(integrated data)

       : 데이터베이스는 똑같은 데이터가 여러 개 존재하는 것을 허용하지 않음(데이터 중복 성).  데이터의 중복을 최소화하고 통제가 가능한 중복만 허용하는 데이터라는 의미

    - 저장 데이터(stored data)

       : 데이터베이스의 데이터는 주로 컴퓨터가 처리하므로, 컴퓨터가 접근할 수 있는 매체에 데이터베이스 저장

    - 운영 데이터(operational data)

       : 데이터베이스는 조직을 운영하고 조직의 주요 기능을 수행하기 위해 꼭 필요. 

        일시적으로 사용하고 마는 것이 아닌 지속적으로 유지해야 함.

 

   <데이터 베이스의 특징>

    - 실시간 접근성

    - 계속 변화

    - 내용 기반 참조

    - 동시 공유

 

03 데이터와 데이터베이스

     -데이터를 수집하기 위해서는 데이터의 유형을 파악해야하고, 유형별로 저장 및 처리 기술을 적합하게 선택해야 함. 데이터는 정형데이터, 반정형데이터, 비정형데이터로 분류

 

     1. 정형 데이터(structured data)

        : 구조화된 데이터, 즉 미리 정해진 구조에 따라 저장된 데이터

        ex) 엑셀의 스프레드시트(표 안에서 행과 열에 의해 지적된 각 칸에 데이터를 저장)

             * 미리 정해진 데이터 구조를 스키마(schema)라고 함.

 

     2. 반정형 데이터(semi-structured data)

        : 구조에 따라 저장된 데이터이지만 정형 데이터와 달리 데이터 내용 안에 구조에 대한 설명이 함께 존재

        ex) HTML, XML, JSON 문서, 웹 로그, 센서 데이터, ...

 

     3. 비정형 데이터(unstructured data)

        : 정해진 구조가 없이 저장된 데이터

        ex) 소셜 데이터의 텍스트, 영상, 이미지, 워드, PDF 문서(멀티미디어 데이터) 

 

 

 

[출처] : <도서> 데이터베이스개론 2판 / 김연희 지음 / 한빛 아카데미