Data Base/BigQuery

데이터 탐색

Eprld 2025. 5. 8. 13:45

데이터를 다룬다

-원본 데이터를 가공하는 과정

-집계 

  • Raw 데이터를 특정 기준으로 집계(일자별, 유저별)
  • Raw 데이터를 압축해서 더 적은 Raw로 만들게 됨

-SELECT 절의 다양한 함수

  • 컬럼을 변환
  • total_amount의 합
  • 새로운 컬럼 추가

-UNION ALL : 데이터를 Row 단위로 추가하고 싶은 경우

>쿼리를 실행해서 여러 결과를 낸 후에 UNION ALL을 해서 데이터를 합치는 경우

 

OLTP

-거래를 하기 위해 사용되는 데이터베이스

-보류, 중간 상태가 없음 - 주문을 완료하거나 안하거나 : 데이터가 무결하다

-데이터의 추가, 변경이 많이 발생한다.

 

데이터 웨어하우스

-데이터를 한 곳에 모아서 저장

-여러 곳에 저장된 데이터 예시

-Database, 웹 크롤링, 파일, API의 결과

-OLTP : Online Analytical Process

-분석을 위한 기능 제공

 

Big query 장점

-난이도 : SQL을 사용해 쉽게 데이터 추출 가능

-속도 : OLTP 도구이므로 속도가 빠름

-Firebase, Google Analytics 4의 데이터를 쉽게 추출 가능

-데이터 웨어하우스를 사용하기 위해 서버를 띄울 필요 없이 구글에서 인프라를 관리함

 

GROUP BY

-같은 값끼리 모아서 그룹화한다.

 

COUNT

-어떤 것을 세는 것 GRUOUP BY랑 다름

 

집계할 컬럼믈 SELECT에 명시하고 그 컬럼을 GROUP BY에 작성

SELECT

  집계할_컬럼1,

  집계 함수

FROM Table

GROUP BY
  집계할_컬럼1

 

DISTINCT

고유값을 알고 싶은 경우 / 중복 제거

SELECT

  집계할 컬럼,

  COUNT(DISTINCT count할-컬럼)

FROM table

GROUP BY

  집계할 컬럼

 

메인 페이지 VIEW 수는? : 4번

COUNT(user_id)

메인 페이지 VIEW 한 유저의 수는? : 3명

COUNT(DISTINCT user_id)

 

WHERE

-Table에 바로 조건을 설정하고 싶은 경우 사용

-원본데이터를 사용하고 싶을 때

 

HAVING

-GROUP BY한 후 조건을 설정하고 싶은 경우 사용

 

ORDER BY

-쿼리 맨 마지막에 두고, 쿼리의 맨 마지막에만 작성하면 됨

-정렬 순차 DESC(내림차순), ASC(오름차순)

 

LIMIT

-쿼리문의 결과 Row 수를 제한하고 싶은 경우 사용

-쿼리문 제일 마지막에 작성

 

 

'Data Base > BigQuery' 카테고리의 다른 글

제품 성장 단계에 따른 지표 정의  (0) 2025.05.12
지표  (0) 2025.05.12
JOIN 연습 문제  (0) 2025.05.06
JOIN  (0) 2025.05.06
조건문 문제 풀이  (0) 2025.05.04