Home 1. 데이터
Post
Cancel

1. 데이터

1.1 데이터

데이터에 대한 정의

  1. 해석할 수 있는 의미를 가진 기호
  2. 정성적 또는 정량적 변수 값의 집합

숫자처럼 양으로 측정할 수 있는 데이터를 정량적, 텍스트나 이미지처럼 양으로 측정할 수 없는 데이터를 정성적 데이터라고 한다. 또 정량적 데이터는 구조화되어 저장되기 때문에 정형 데이터, 정성적 데이터는 비정형 데이터라고 부른다. SQL은 정형 분석에 사용되는 프로그래밍 언어이다.

데이터, 정보, 지식, 지혜는 순환 관계를 가진다. 데이터를 분석하여 정보를 생성하고, 정보를 해석함으로써 지식을 축적하고, 축적한 지식에서 지혜를 얻고, 지혜를 실천함으로써 새로운 데이터가 발생하는 과정이 반복된다.

1.2 데이터베이스

데이터베이스는 ‘데이터를 정리해서 모아둔 것’으로 해석할 수 있다. 데이터 초기에는 파일 시스템으로 관리되었지만, 데이터 증가에 따라 데이터를 효율적으로 관리할 수 있는 방법이 필요해졌다. 이런 방법을 데이터베이스 모델이라고 한다.

현재는 주로 관계형 모델이 사용되고 있다. 관계형 모델은 릴레이션에 데이터를 저장한다. 릴레이션은 2차원 형태의 표로 구성되고, 릴레이션은 튜플의 집합이고, 튜플은 속성의 집합이다.

관계형 모델을 채택한 데이터베이스를 관계형 데이터베이스(RDB)라고 한다. 현재는 관계형 데이터베이스를 확장한 객체-관계형 데이터베이스가 주류를 이루고 있다.

또 최근에는 NoSQL 데이터베이스도 널리 활용되고 있다. 이는 관계형 데이터베이스보다 느슨한 일관성 모델을 채택한 데이터베이스로 빅 데이터와 실시간 웹 애플리케이션 영역에 널리 활용되고 있다.

1.3 데이터베이스 관리 시스템

데이터베이스 관리 시스템(DBMS)은 데이터베이스를 관리하기 위한 응용 프로그램이다.

1.4 IT 시스템

IT 시스템은 데이터의 발생 유형과 사용 목적에 따라 운영 시스템, EDW 영역, BI 영역으로 구분된다.

  • 운영 시스템 - 기업 운영에 필요한 데이터를 관리
  • EDW - 분석을 위한 데이터를 저장
  • BI - 기업의 효율적인 의사 결정을 지원

각각의 시스템은 아래의 목적으로 운영된다. 목적에 따라 사용하는 SQL 유형 또한 다르다.

  • OLTP - 온라인 트랜잭션 처리
  • ODS - 운영 데이터를 원본의 형태로 보관
  • DW - 운영 데이터를 통일된 형식으로 저장
  • DM - DW 데이터를 사용 목적에 따라 요약
  • OLAP - DM 데이터를 분석

1.5 직종과 직무

  • EA - 전사 아키텍처를 설계
  • BA - 업무 아키텍쳐를 설계
  • AA - 애플리케이션 아키텍처를 설계
  • TA - 하드웨어 아키텍처와 네트워크 아키텍처를 설계
  • DA - 데이터 아키텍처를 설계
This post is licensed under CC BY 4.0 by the author.