데이터 종속성과 정규화

티스토리 뷰

3학년 2학기/DB

데이터 종속성과 정규화

Hading 2016. 12. 6. 22:02

관계 데이터베이스에서는 데이터 값들을 테이블 형태의 릴레이션으로 표현하므로 현실 세계를 정확하게 표현하기 위해서 어떤 릴레이션들이 필요하고, 또 각 릴레이션은 어떤 애트리뷰트들로 구성해야 하는가를 결정하는 문제가 중요하다.

곧 릴레이션 스키마(relation schema)가 중요하다.

관계 스킴을 설계하기 위해서 필요한것

=> 에트리뷰트들 사이에 존재하는 관계성(relationship)

즉, 데이터 종속성(data dependency), 효율적인 데이터 처리, 그리고 데이터의 일관성 유지 등이 포함되어야함.

데이터의 중복성은 이상(anomaly)를 발생시킨다.

이상(anomaly)

삭제 이상(deletion anomaly)

 연쇄 삭제(triggered deletion)를 유발하여 정보 손실이 발생

예) 200번 학생이 ‘C123’ 과목을 등록 취소 -> 200번 학생의 학년정 보 소실

삽입 이상(insertion anomaly)

 600번 학생이 2학년 정보(투플)을 삽입 -> 불필요한 정보(임시 과목번호)를 채워줘야함

갱신 이상(update anomaly)

 400번 학생의 학년을 4->3로 변경 -> 4개의 투플을 모두 갱신해야함

Anomaly가 발생한 이유?

=> 상이한 종류의 정보를 하나의 릴레이션으로 표현했기 때문!

• 속성들 사이에 존재하는 종속관계(의존관계)를 인식하지 못하고 무리하게 하나의 릴레이션으로 표현

• 데이터의 중복을 발생시킴

정규화(Normalization)

속성들간의 종속관계별로 별도의 릴레이션으로 분해 (decomposition)하는 과정 -> 스키마 변환(schema transformation)

• 동등한 정보를 나타낼 수 있으면서 더 좋은 스키마로 변환!

※스키마 변환은 3 가지 원리에 기초하고 있다.

1. 정보 표현의 무손실 - 변환된 스키마는 변환전 스키마의 정보를 포함하고 구조적으로는 더 바람직해야함

2. 최소의 데이터 중복성 - 중복으로 인한 anomaly를 제거

3. 분리의 원칙 - 속성들간의 의존성별로 별도의 릴레이션으로 분리시켜 표현해야 함

함수 종속(FD)

X : 사번 Y : 이름

X가 Y를 함수적으로 결정한다. ( X -> Y )

< 역은 성립하지 않는다>

X의 값이 고유한(유일한) Y값을 결정한다. (두 개는 같은 말이다.) => X의 값에 따라서 Y의 값이 변한다.(X)

Y는 X에 함수적으로 종속한다. Y가 달라지면 X값은 반드시 달라진다.(O)

예를 들어 설명하면

X : 0 1 -1 2 -2

Y : 0 1 1 4 4

Y값은 같은 값이 존재 한다 그에 따라 X의 값은 반드시 달라지게 되어 있다.

X값은 값은 다르지만 Y값이 같은 동명이인이 존재한다고 생각할 수 있다. 즉, X라는 사번이라는 고유의 번호에 하나의 이름만 연결될 수 있다.

어떤 릴레이션 R에서 X와 Y를 각각 R의 애트리뷰트 집합의 부분집합이라 할 때, 시간에 관계없이 속성 X의 값에 대해 Y의 값이 오직 하나만 연관됨
함수 종속 관계는 릴레이션이 계속해서 변경되더라도 항상 지켜지는 의미적 관계여야 됨.

Key point! => 완전 함수 종속 && 부분 함수 종속

[다시 되집고 가기] 슈퍼키, 후보키, 기본키

슈퍼키 + [아무거나] => 슈퍼키

- 애트리뷰트의 집합

- 고유하게 식별됨

[사번, 부양가족 이름(아무거나)] => 슈퍼키

[주민번호 앞자리, 뒷자리, 이름] => 주민번호 앞자리 와 뒷자리를 합하면 키가 슈퍼키가 되고 그 뒤에 아무거나 와도 슈퍼키가 된다.

후보키

- 구성 애트리뷰트중 하나라도 제거하면 슈퍼키가 아닌 것

[사번 ], 부양가족 이름] => 후보키

[주민번호 앞자리, 뒷자리 ], 이름] => 후보키

기본키

- 여러 후보키 중 대표적인 키 하나가 table의 기본키가 됨

제 1 정규형(1NF : First Normal Form)

릴레이션 R에 속한 모든 도메인이 원자 값만으로 되어 있다면 제 1 정규형에 속한다.

제 2 정규형(2NF : Second Normal Form)

어떤 릴레이션 R이 1NF이고 키(기본)에 속하지 않은 애트리뷰트 모두가 기본 키에 완전 함수 종속이면, 제 2정규형(2NF)에 속한다.

제 3 정규형(3NF : Third Normal Form)

릴레이션 R이 2NF이고 기본키에 속하지 않은 모든 속성 이 기본키에 이행적 함수 종속이 아닌 경우

Key word!! => 보이스/코드 정규형(BCNF)

: 릴레이션 R의 결정가가 모두 후보 키 이면 릴레이션 R은 보이스/코드 정규형에 속한다.

'3학년 2학기 > DB' 카테고리의 다른 글

ER 다이어그램 예제2 (1)	2016.12.07
ER다이어그램 예제 1 (1)	2016.12.07
트리거 (0)	2016.11.04
함수 (0)	2016.11.04
저장 프로시저 (0)	2016.11.04

공지사항

최근에 올라온 글

최근에 달린 댓글

Total

Today

Yesterday

링크

TAG more

« 2025/09 »
일	월	화	수	목	금	토
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

글 보관함

티스토리 뷰

데이터 종속성과 정규화

'3학년 2학기 > DB' 카테고리의 다른 글

티스토리툴바