[SQL] SQLD 핵심 요약 - [1과목] Part1. 데이터 모델링의 이해
in Development on DataBase, Sql, Sqld
#목차
데이터 모델링의 이해
모델링의 특징
- 추상화 : 현실세계를 인정한 형식에 맞추어 표현
- 단순화 : 복잡한 현실세계를 약속된 규약에 의해 제한된 표기법이나 언어로 표현
- 명확화 : 누구나 이해하기 쉽게 대상에 대한 애매모호함 제거
모델링의 세 가지 관점
- 데이터 관점 : 업무가 어떤 데이터와 관련이 있는지, 데이터간 관계가 무엇인지 (What, Data)
- 프로세스 관점 : 업무가 실제로 하고있는 일이 무엇인, 무엇을 해야하는지 (How, Process)
- 상관 관점 : 업무 처리하는 방법에 따라 데이터가 어떻게 영향을 받고 있는지 (Interaction)
데이터 모델링의 기능
- 명세화, 구조화, 문서화, 다양한 관점, 상세수준 표현
데이터 모델링의 중요성 및 유의점
- 중복 : 같은 시간 같은 데이터 제공
- 비유연성 : 사소한 업무변화에 데이터 모델이 수시로 변경되면 안됨
- 비일관성 : 신용 상태에 대한 갱신 없이 고객의 납부이력 정보 갱신 안됨(연계성이 떯어짐)
데이터 모델링의 3단계 진행
- (추상적)개념적 -> 논리적 -> 물리적(구체적)
- 개념적 데이터 모델링(in계획분석단계) : 추상화, 업무중심적, 포괄적, 전사적, EA수립시 사용
- 논리적 데이터 모델링(in분석단계) : KEY, 속성, 관계 표현, 재사용성 높음(정규화)
- 물리적 데이터 모델링(in설계단계) : 실제 데이터베이스를 이식할 수 있도록 성능, 저장 등 무릴적 성격 고려
데이터 독립성 요소
- 왜부 스키마 : 개개 사용자가 보는 개인적 DB 스키마
- 개념 스키마 : 모든 사용자 관점을 통합한 전체 DB
- 내부 스키마 : 물리적 장치에서 데이터가 실제적 저장
데이터 독립성
- 논리적 독립성 : 개념 스키마가 변경되어도 외부 스키마에 영향X
- 물리적 독립성 : 내부 스키마가 변경되어도 외부/개념 스키마는 영향X
Mapping(사상)
- 상호 독립적인 개념을 연결시켜주는 다리
데이터 모델링의 3요소
- 어떤 것(Things), 성격(Attributes), 관계(Relationships)
- 데이터 모델링은 프로젝트에 참여한 모두가 알아야 한다
- 엔티티: 집합 / 인스턴스 : 단수
데이터 모델 표기법
- 1976년 피터첸이 Entity Relationships Model 개발
ERD 작업 순서
- 엔티티를 그림
- 엔티티를 적절하게 배치
- 엔티티간 관계를 설정
- 관계명을 기술
- 관계의 참여도를 기술
- 관계의 필수여부를 기술
좋은 데이터 모델의 요소
- 완전성 : 업무에 필요한 모든 데이터가 모델에 정의
- 중복배제 : 하나의 DB내에 동일한 사실은 한번만
- 업무규칙 : 많은 규칙을 사용자가 공유하도록 제공
- 데이터 재사용 : 데이터가 독립적으로 설계돼야 함
- 의사소통 : 업무규칙은 엔티티, 서브타입, 속성, 관계 등의 형태로 퇴대한 자세히 표현
- 통합성 : 동일한 데이터는 한 번만 정의, 참조활용
엔티티란?
- 업무에 필요하고 유용한 정보를 저장하고 관리하기 위한 집합적인 것, 보이지 않는 개념 포함
엔티티의 특징
- 반드시 해당 업무에서 필요하고 관리하고자 함
- 유일한 식별자에 의해 식별 가능
- 두 개 이상의 인스턴스의 집합
- 업무 프로세스에 의해 이용되어야 함
- 반드시 속성이 있어야 함(예외적으로 관계엔티티 경우는 주식별자 속성만 가지고 있어도 엔티티로 인정)
- 다른 엔티티와 최소 1개 이상의 관계가 있어야 함(관계를 생략하여 표현해야하는 경우는 통계성 엔티티, 코드성 엔티티, 시스템 처리시 내부 필요에 의한 엔티티 도출과 같은 경우)
엔티티의 분류
유무형에 따른 분류
- 유형 : 물리적 형태, 안정적, 지속적 ex)사원, 물품, 강사
- 개념 : 개념적 정보, 물리적 형태X ex)조직, 보험상품
- 사건 : 업무수행시 발생, 통계자료 이용 ex)주문, 청구, 미납
발생시접에 따른 분류
- 기본 : 그 업무에 원래 존재하는 정보, 타 엔티티의 부모 역할, 자신의 고유한 주식별자 가짐 ex)사원, 부서
- 중심 : 기본 엔티티로부터 발생, 다른 엔티티와의 관계로 많은 행위 엔티티 생성 ex)계약, 사고, 주문
- 행위 : 2개 이상의 부모엔티티로부터 발생, 자주 바뀌거나 양이 증가 ex)주문목록, 사원변경이력
엔티티의 명명
- 현업업무에서 사용하는 용어 사용, 약어 사용금지, 단수명사 사용, 고유한 이름 사용, 생성의미대로 부여
속성
- 업무에서 필요로 하는 인스턴스로 관리하고자 하는 의미상 분리되지 않는 최소의 데이터 단위
- 한 개의 엔티티는 2개 이상의 인스턴스 집합
- 한 개의 엔티티는 2개 이상의 속성을 가짐
- 한 개의 속성은 1개의 속성값을 가짐
속성의 분류
- 기본 : 업무로부터 추출한 모든 일반적인 속성
- 설계 : 업무를 규칙화하기 위해 새로 만들거나 변형, 정의하는 속성 ex)일련번호
- 파생 : 다른 속성에 영향을 받아 발생하는 속성, 빠른 성능을 낼 수 있도록 원래 속성의 값을 계산 ex)합
도메인
- 각 속성이 가질 수 잇는 값의 범위 ex)5글
속성의 명명
- 해당업무에서 사용하는 이름 부여
- 서술식 속성명은 사용 금지
- 약어 사용 금지
- 전체 데이터모델에서 유일성 확보
관계
- ** 엔티티의 인스턴스 사이의 논리적인 연관성으로서 존재의 형태로서나 행위로서 서로에게 연관성이 부여된 상태
- 존재에 의한 관계 ex)소속된다
- 행위에 의한 관계 ex)주문한다
패어링
- 엔티티 안에 인스턴스가 개별적으로 관계를 가지는 것
UML
- UML에는 연관관계와 의존관계가 있는데, 연관(존재적)관계는 항상 이용하는 관계이고 의존관계는 상대방 행위에 의해 발생하는 관계
ERD
- ERD에서는 존재적 관계와 행위에 의한 관계를 구분하지 않고 표기했지만 UML에서는 이를 구분하여 연관관계는 실선, 의존관계는 점선으로 표현
관계의 표기법
- 관계명 : 관계의 이름
- 관계차수 : 1:1(One to One), 1:M(One to Many), M:N(Many to Many(n개))
- 관계선택성(관계선택사양) : 필수관계, 선택관계
관계 체크사항
- 2개의 엔티티 사이에 관심있는 연관 규칙 O/X?
- 2개의 엔티티 사이에 정보의 조합 발생 O/X?
- 업무기술서, 장표에 관계연결에 대한 규칙 서술 O/X?
- 업무기술서, 장표에 관계연결을 가능케 하는 동사 O/X?
식별자
- 엔티티내에서 인스턴스를 구분하는 구분자 식별자는 논리 데이터 모델링 단계에 사용
- key는 물리 데이터 모델링 단계에 사용
식별자의 특징 : 유일성, 최소성, 불변성, 존재성
- 주식별자에 의해 모든 인스턴스들이 유일하게 구분
- 주식별자를 구성하는 속성의 수는 유일성을 만족하는 최소의 수가 되어야 함
- 지정된 주식별자의 값은 자주 변하지 않아야 함
- 주식별자가 지정이 되면 반드시 값이 들어와야 함
식별자 분류
대표성여부 : 주식별자, 보조식별자
- 주식별자 : 엔티티 내에서 각 어커런스를 구분할 수 있는 구분자, 타 엔티티와 참조관계를 연결할 수 있음
- 보조식별자 : 어커런스를 구분할 수 있는 구분자이나 대표성을 가지지 못해 참조관계 연결 불가
스스로 생성여부 : 내부식별자, 외부식별자
- 내부식별자 : 스스로 생성되는 식별자
- 외부식별자 : 타 엔티티로부터 받아오는 식별자
속성의 수 : 단일식별자, 복합식별자
- 단일식별자 : 하나의 속성으로 구성
- 복합식별자 : 2개 이상의 속성으로 구성
대체 여부 : 본질식별자, 인조식별자
- 본질식별자 : 업무에 의해 만들어지는 식별자
- 인조식별자 : 인위적으로 만든 식별자
주식별자 도출기준
- 해당 업무에서 자주 이용되는 속석임
- 명칭, 내역 등과 같이 이름으로 기술되는 것들은 X
- 복합으로 주식별자로 구성할 경우 너무 많은 속성 X
식별자 관계
주식별자
- 자식의 주식별자로 부모의 주식별자 상속
- 부모로부터 받은 식별자를 자식엔티티의 주식별자로 이용하는 경우
비식별자
- 부모 속성을 자식의 일반 속성으로 사용
- 부모 없는 자식이 생성될 수 있는 경우
- 부모와 자식의 생명주기가 다른 경우
- 여러개의 엔티티가 하나의 엔티티로 통합되어 표현되었는데 각각의 엔티티가 별도의 관계를 가진 경우
- 자식엔티티에 별도의 주식별자를 생성하는 것이 더 유리한 경우
- SQL 문장이 길어져 복잡성 증가되는 것 방지
- 약한 연결관계 표현, 점선 표기
- 자식 주식별자구성을 독립적으로 구성
Continue with [SQL] SQLD 핵심 요약 - [1과목] Part2. 데이터 모델과 성능