본문 바로가기

정보

정형 데이터? 반정형 데이터? 비정형 데이터?

NoSQL을 공부하다 보니깐


NoSQL은 비정형 데이터를 처리한다는 구문이 많았다.


그래서 이번에는 정형데이터, 반정형데이터, 비정형데이터를 알아보도록하자




정형데이터란?


일단 정형데이터가 무엇인지 알기전에 정형이란 단어에 뜻을 알아보자


정형의 사전적 의미를 찾아보면 다음과 같이 나온다.






즉 정형데이터란 일정한 형식이나 틀이있는 데이터라는 것이다.


다른 의미로 형태가 있고, 데이터 모델을 준수하는 데이터를 정형데이터라고한다.

 

반정형 데이터란?


형태가 있으나 데이터 모델을 준수하지 않는 데이터이다.


그 예로는 다음과 같다. 

  • 마크 업 언어 XML 이것은 반 구조화 된 문서 언어입니다. XML은 인간 및 기계가 읽을 수있는 형식을 정의하는 문서 인코딩 규칙 집합입니다. (XML은 사람이 읽을 수 있다고 말하면서도 큰 효과를 내지 못한다 : XML 문서를 읽으려는 사람은 누구나 자신의 시간에 더 잘 할 수있다.) 그 가치는 태그 기반 구조가 매우 융통성 있고 코더는 웹에서 데이터 구조, 저장 장치 및 전송을 보편화하기 위해이를 채택하십시오.
  • 공개 표준 JSON (JavaScript Object Notation) JSON은 반 구조화 된 또 다른 데이터 교환 형식입니다. Java는 이름에 함축되어 있지만 다른 C와 유사한 프로그래밍 언어가이를 인식합니다. 구조는 이름 / 값 쌍 (또는 객체, 해시 테이블 등) 및 정렬 된 값 목록 (또는 배열, 시퀀스, 목록)으로 구성됩니다. 구조가 언어간에 상호 교환 가능하기 때문에 JSON은 웹 응용 프로그램과 서버간에 데이터를 전송하는 데 뛰어납니다.
  • NoSQL 반 구조화 된 데이터는 많은 NoSQL 데이터베이스 ( "SQL뿐 아니라") 데이터베이스의 중요한 요소이기도합니다. NoSQL 데이터베이스는 조직 (스키마)과 데이터를 분리하지 않기 때문에 관계형 데이터베이스와 다릅니다. 이로 인해 다양한 길이의 텍스트와 같이 레코드 및 테이블 형식에 적합하지 않은 정보를 저장하는 더 나은 선택이 NoSQL이됩니다. 또한 데이터베이스 간의 데이터 교환을 쉽게 할 수 있습니다. MongoDB 및 Couchbase 와 같은 일부 새로운 NoSQL 데이터베이스 는 반 구조화 된 문서를 기본적으로 JSON 형식으로 저장하여 통합합니다


비정형 데이터란?


비정형 데이터는 데이터 모델이 없거나 미리 정의되지 않은 정보를 비정형데이터라고한다.


텍스트, 영상, 음성 등의 형태로 나타난다.


저장구조에도 차이가 있다. 정형 데이터는 RDBMS로 저장되고, 반정형 데이터는 파일로, 비정형 데이터는 NoSQL이라는 저장구조를 갖게 된다.



참고자료


https://ko.wikipedia.org/wiki/%EB%B9%84%EC%A0%95%ED%98%95_%EB%8D%B0%EC%9D%B4%ED%84%B0


https://ko.wikipedia.org/wiki/%EB%B0%98%EC%A0%95%ED%98%95_%EB%8D%B0%EC%9D%B4%ED%84%B0


https://smith3015.blogspot.com/2014/08/blog-post.html


https://www.datamation.com/big-data/structured-vs-unstructured-data.html


http://www.kinews.net

'정보' 카테고리의 다른 글

storage engine 이란?  (0) 2018.11.07
하이퍼링크 클릭시 크롬으로 여는 방법  (2) 2018.10.30
acid란?  (0) 2018.09.30
프레임워크를 사용하는 이유  (0) 2018.08.27
context switching이란?  (0) 2018.08.12