IT/SQL3 3. SQL 데이터의 종류 앞으로 SQL을 다루면서 알아야할 데이터의 종류는 크게 두 종류가 존재합니다. 이번 글은 이 두 종류의 데이터를 알아보는 시간을 가져보겠습니다. 1. 업무 데이터 첫 번째는 업무 데이터입니다. 구매, 리뷰, 상품 데이터 등 서비스와 시스템 운용 목적으로 구축된 데이터 베이스에 존재하는 데이터들을 말합니다. 이 데이터들은 갱신형 데이터입니다. 즉, 변경/제거가 가능한 데이터입니다. 갱신형 데이터이기 때문에 데이터의 정합성이 보증 되어 데이터 신뢰도가 높습니다. 그래서 다뤄야하는 테이블 수가 많아 ER 다이어그램* 같은 것으로 설계 파악 하고 테이블 결합을 해야 데이터를 더 잘 파악할 수 있습니다. 또한, 추출 시점에 따라 데이터가 바뀝니다. * ER 다이어그램(ERD, 개체 관계도) : 현실 세계에 존재하.. 2022. 3. 26. 2. 대표적인 빅데이터 처리 시스템 SQL을 시작하기에 앞서 대표적인 빅데이터 처리 시스템을 알아보겠습니다. 대표적인 시스템으로 PostgreSQL, Apache Hive, Amazon Redshift, Google BigQuery, SparkSQL 이렇게 5가지가 있습니다. 이 5가지를 차례대로 소개드리겠습니다. 1. PostgreSQL 무료로 제공되는 대표적인 오픈소스 관계형 데이터베이스(RDB, Relational Database)입니다. 다양한 플랫폼을 지원하고 있어서 설치도 용이합니다. 표준 SQL을 준수하고 있으며, SQL 학습과 소규모 데이터 분석에 자주 활용됩니다. 2. Apache Hive 대량의 데이터 처리에 발생 하는 보틀넥* 현상을 해결하기 위해 분산 파일 시스템을 활용해 구현한 시스템입니다. HDFS(하둡 파일 시스.. 2022. 3. 25. 1. [데이터 분석을 위한 SQL 레시피] - START 안녕하십니까! 오늘부터 데이터 분석을 위한 SQL 레시피를 꾸준히 읽고 학습한 내용을 포스팅 하려 합니다! 2022. 3. 20. 이전 1 다음