키보드워리어

【SQL】Group by와 Order by를 활용해서 데이터 추출해보자 본문

개발 관련/Database

【SQL】Group by와 Order by를 활용해서 데이터 추출해보자

꽉 쥔 주먹속에 안경닦이 2022. 8. 17. 20:08
728x90

 

안녕하세요 【키보드 워리어】
블로그 방문자 여러분, 안경닦이입니다.

 


 

오늘은 데이터베이스, sql 대해 작성합니다

 

 

저번에는 select문과 where문으로 다양한 데이터를 읽어보았는데요

 

 

여기에 추가로 group by와 order by문을 사용하면

 

 

원하는 쿼리의 결과를 항목별로 정리해주는 기능이 됩니다!

 

 


 

 

Group by | Order by

 

 

1. 동일한 범주위 데이터를 묶어서 통계를 내주는 Group by (그룹대로)를 이해해봅니다

 


2. 출력하는 데이터를 필드의 값으로 정렬하여 출력하는 Order by(순서대로)를 이해해봅니다

 


3. 조금 더 복잡한 분석을 위해 자주 사용되는 유용한 문법을 익혀보겠습니다

 

 


 


데이터 분석의 목적은 날것의 데이터(raw)를

 

의미를 갖는 '정보'로의 변환시키기 위함입니다

 

 

SQL을 쓰는 이유

 

 

더 나아가 정보에서 범주(category) 내의 각각의 정보가 궁금할 수 있습니다

 


하지만 저희가 배운 select, where 같은 기존 방법만으로는 한계가 있습니다

 


예를 들어

어떤 컬럼에 특정값을 가진 데이터를 구하고자 할 때

 

 

데이터별로 수를 구할 때 아래와 같은 방법을 거쳐야 합니다

 

select count(*) from 테이블명
where 컬럼명 = 'value1';

 

위 쿼리문 1번 작성

 

select count(*) from 테이블명
where 컬럼명 = 'value2';

 

위 쿼리문 1번 작성

 

 

총 2번의 입력을 거쳐야 합니다


만약 이때 value의 값이 1~2개면 괜찮겠지만,

 

 

100개가 넘는 group이 존재한다면

 

 

100개의 개수대로 쿼리를 작성해야 할까요?

 

 

 그럼  누가 sql를 쓰죠?ㅋㅋ

 

 

그렇게 불편한 일을 할 수는 없겠죠

 

 

그래서 group는 동일한 범주의 데이터를 묶어주어 이러한 불편이 발생하지 않도록 합니다



Group by란?

 

 

동일한 범주를 갖는 데이터를 하나로 묶어서

 

 

범주별 통계를 내주는 것을 의미합니다

 

 

※ Group by 사용 방법

 

 

1) 원하는 컬럼에서 같은 'value'의 데이터를 하나로 묶어주기 위해 group by를 사용합니다

 

2) group by로 묶은 컬럼은 select문에서도 포함시켜야 합니다

 


예)

select 컬럼명, count(*) from 테이블명
group by 컬럼명;


결과물) 컬럼명의 value1의 값 N개, 컬럼명의 value2의 값 N개...

 


그리고 참고로 덧붙이자면, 이 결과물에 또 다른 정리 함수 기능을 가진

 

 

order by라는 기능을 넣어주면 위의 값을 내림차순으로 정렬해줍니다

 

 


Count | Min | Max | Avg | Sum

 

 

  Count 함수의 쓰임
  •   count(*)는 불려진 데이터에 모든 값을 가지고 결과를 출력합니다
  •   count(컬럼명) 해당 컬럼 not null인 row의 수만 셉니다
  •   count(disnct (컬럼)) 해당 컬럼 중복 제거하고, not null인 row의 수만 셉니다

 

 

  MIN | MAX | AVG | SUM
  •    최소 값을 구할 때 MIN
  •    최대 값을 구할 때 MAX
  •    평균값을 구할 때 AVG
  •    합계를 구할 때 SUM

 

select 컬럼명, count(컬럼명) from 테이블명
group by 컬럼명;

select 컬럼명, min(컬럼명) from 테이블명
group by 컬럼명;

select 컬럼명, max(컬럼명) from 테이블명
group by 컬럼명;

select 컬럼명, avg(컬럼명) from 테이블명
group by 컬럼명;

select 컬럼명, sum(컬럼명) from 테이블명
group by 컬럼명;

 

범주를 내주고 싶은 컬럼명과 함께 count(*)함수와 여려 함수를 사용하여

 

 

group by로 합쳐진 데이터의 개수를 편하게

 

 

세어주는 기능을 할 수 있습니다

 

 

 

Order by란?

 

 

조회된 결과의 데이터들을 정렬하여

 

 

보기 좋게 만들어주는 함수로 결과에 대한 분석을 빨리 할 수 있도록 도와줍니다

 

 

※ Order by 사용 방법

 

 

1) 원하는 컬럼에서  '기준'이 되는 데이터를 나열해주기 위해 order by를 사용합니다

 

2) order by로 묶은 컬럼은 select문에서도 포함시켜야 합니다

 

예)

select 컬럼명, count(*) from 테이블명
group by 컬럼명
order by count(*); desc  |  asc

 


Desc |  Asc

 

  DESC | ACS
  • DESC는 내림차순으로 정렬해줍니다
  • ASC는 오름차순으로 정렬해줍니다

 

 

  쿼리가 실행되는 순서
  1. From 
  2. Where
  3. Group by
  4. Select
  5. Order by


From으로 부른 테이블에서 컬럼 데이터들을 읽어오고

 

 


Where를 통해 원하는 컬럼의 데이터만 남기고

 

 


해당 데이터를 그룹화하고 그룹화한 컬럼을

 

 


보기 쉽게 정렬해준다!

 


천천히 과정을 밟아볼게요

 

 

select * from 테이블명
group by 범주로 잡고 싶은 컬럼명;


만약 이렇게 쿼리를 적는다면

 

 

 

데이터 정보는 나오겠지만 원하는 결과는 나오지 않을 거예요

 

 


그 이유는 '어떤 통계치'로 출력해달라는지 명령어가 없기 때문이겠죠?


select count(*) from 테이블명
group by 범주로 잡고 싶은 컬럼명;

 

위와 같은 쿼리문은 어떤 통계치인지는 count(*)를 통해서 작성했지만

 

 

 

해당 값이 어떤 값인지 알 수 없죠?

 

 


'어떤 범주'에 대한 통계치인지는 적지 않아서 그래요

 

 

select 범주로 잡고 싶은 컬럼명, count(*) from 테이블명
group by 범주로 잡고 싶은 컬럼명;


그래서, group by에 들어간 컬럼명을 select문에서도 작성하여

 

 


위와 같이 작성해주어야 합니다

 

 


order by와 group by를 같이 연습해보겠습니다

 

 


(1) 원하는 테이블

 

 


(2) 범주로 사용할 컬럼

 

 


(3) 범주에 따라 통계를 계산하고 싶은 컬럼

 



이 세 가지만 기억하면 됩니다!

 

 


[01]  where문, group by를 이용하여 특정 value를 사용한 사람들을 범주로 잡아보기

 

select 범주로 잡고 싶은 컬럼명, count(*) from 테이블명
where 특정 데이터 잡고 싶은 컬럼명 = 'value'
group by 범주로 잡고 싶은 컬럼명


[02] where문과 like를 써보면서 특정 value을 쓰는 컬럼을 범주로 잡아보기

select 범주로 잡고 싶은 컬럼명, count(*) from 테이블명
where 특정 데이터로 잡고 싶은 컬럼명 like '%xxxxxxxx'
group by 범주로 잡고 싶은 컬럼명;


[03] 범주로 잡고 싶은 컬럼명 별로 정해진 데이터의 평균값을 구해보자

select 범주로 잡고 싶은 컬럼명, avg(정해진 값이 있는 컬럼명) from 테이블명
group by 범주로 잡고 싶은 컬럼명;



 

 

 

쿼리를 작성할 때 아래와 같은 순서를

 

 

 

지키면, 한결 편하실 거예요

 

 

 

※ 꿀팁 정리할게요

 

  1. show tables로 테이블을 한 번 훑어보자
  2. select * from 테이블명 해보자
  3. 원하는 정보가 나올 때까지 2번 해보자
  4. 테이블을 찾았다면, 범주를 나눠 보고 싶은 컬럼을 찾아보자
  5. 범주별로 어떤 수치 통계를 보고 싶은 컬럼을 찾아볼까?
  6. 위 순서를 지켜서 마지막으로 SQL 쿼리문을 작성해보자

 

728x90