데이터를 다룬다
-원본 데이터를 가공하는 과정
-집계
- Raw 데이터를 특정 기준으로 집계(일자별, 유저별)
- Raw 데이터를 압축해서 더 적은 Raw로 만들게 됨
-SELECT 절의 다양한 함수
- 컬럼을 변환
- total_amount의 합
- 새로운 컬럼 추가
-UNION ALL : 데이터를 Row 단위로 추가하고 싶은 경우
>쿼리를 실행해서 여러 결과를 낸 후에 UNION ALL을 해서 데이터를 합치는 경우
OLTP
-거래를 하기 위해 사용되는 데이터베이스
-보류, 중간 상태가 없음 - 주문을 완료하거나 안하거나 : 데이터가 무결하다
-데이터의 추가, 변경이 많이 발생한다.
데이터 웨어하우스
-데이터를 한 곳에 모아서 저장
-여러 곳에 저장된 데이터 예시
-Database, 웹 크롤링, 파일, API의 결과
-OLTP : Online Analytical Process
-분석을 위한 기능 제공
Big query 장점
-난이도 : SQL을 사용해 쉽게 데이터 추출 가능
-속도 : OLTP 도구이므로 속도가 빠름
-Firebase, Google Analytics 4의 데이터를 쉽게 추출 가능
-데이터 웨어하우스를 사용하기 위해 서버를 띄울 필요 없이 구글에서 인프라를 관리함
GROUP BY
-같은 값끼리 모아서 그룹화한다.
COUNT
-어떤 것을 세는 것 GRUOUP BY랑 다름
집계할 컬럼믈 SELECT에 명시하고 그 컬럼을 GROUP BY에 작성
SELECT
집계할_컬럼1,
집계 함수
FROM Table
GROUP BY
집계할_컬럼1
DISTINCT
고유값을 알고 싶은 경우 / 중복 제거
SELECT
집계할 컬럼,
COUNT(DISTINCT count할-컬럼)
FROM table
GROUP BY
집계할 컬럼
메인 페이지 VIEW 수는? : 4번
COUNT(user_id)
메인 페이지 VIEW 한 유저의 수는? : 3명
COUNT(DISTINCT user_id)
WHERE
-Table에 바로 조건을 설정하고 싶은 경우 사용
-원본데이터를 사용하고 싶을 때
HAVING
-GROUP BY한 후 조건을 설정하고 싶은 경우 사용
ORDER BY
-쿼리 맨 마지막에 두고, 쿼리의 맨 마지막에만 작성하면 됨
-정렬 순차 DESC(내림차순), ASC(오름차순)
LIMIT
-쿼리문의 결과 Row 수를 제한하고 싶은 경우 사용
-쿼리문 제일 마지막에 작성
'Data Base > BigQuery' 카테고리의 다른 글
제품 성장 단계에 따른 지표 정의 (0) | 2025.05.12 |
---|---|
지표 (0) | 2025.05.12 |
JOIN 연습 문제 (0) | 2025.05.06 |
JOIN (0) | 2025.05.06 |
조건문 문제 풀이 (0) | 2025.05.04 |