데이터 시각화와 DDDM 1탄 | 코드스테이츠 PMB 17기 W6D4
오늘은 실무에서 데이터 분석을 수행하는 데 필요한 리소스를 선택하고,
문제 해결을 위해 주어진 데이터를 활용하여 분석하는 방법을 공부해보자.
.
.
데이터 시각화
"데이터 분석 결과를 쉽게 이해할 수 있도록 시각적으로 표현하고 전달되는 과정”, "수치 데이터를 시각 형태로 전환하여 이해할 수 있도록 하는 것"을 데이터 시각화라고 한다. 데이터 시각화는 단순하게 시각적인 표현을 사용하는 것이 아니다. 다양한 데이터 시각화의 종류가 있으며 일반적인 그래프뿐 아니라 데이터의 내용과 특성에 맞게 다양한 시각화 기법들을 사용할 수 있다. 대부분 데이터 분석툴이 시각화 기능을 가지고 있지만, 그 가운데 Tableau와 Google Data Stusio는 특히 시각화에 초점을 맞추고 있다.
분석한 결과를 빠르게 이해해 제품의 개선점을 쉽게 발견할 수 있고, 제품팀에게 제품 분석 결과를 빠르게 공유하고, 이해관계자를 설득하여 제품의 문제를 빠르게 개선할 수 있다는 점에서, PM에게 데이터 시각화는 매우 중요하다.
데이터 시각화를 할 때 주의할 점!!
1) 데이터의 특성에 맞는 적당한 시각화를 선택해야 한다. 제품과 고객을 둘러싼 데이터의 중요한 인사이트와 차이점은 PM이 가장 잘 파악하고 있어야 한다, 따라서 이를 표현할 적당한 시각화 형태를 선택할 수 있어야 한다.
2) 예쁘고 화려하게 꾸밀 줄 아는 것이 좋은 시각화는 아니다. 시각화의 목적은 정보를 빠르게 이해할 수 있도록 가공하는 것이다. 미적 수준도 중요하지만, 선택한 표현이 원하는 정보를 빠르게 이해하는 데 도움이 되는지를 기준으로 시각화를 선정해야 한다. 많은 데이터를 담는 것 보다 핵심 지표를 잘 보이게 하는 것이 중요!!
데이터 다뤄보기
데이터를 무료로 구할 수 있는 사이트:
Kaggle – 공개 데이터를 바탕으로 데이터 분석을 연습해 보고 서로 공유하는 포럼 형식의 사이트.
공공데이터포털 – 국가에서 제공하는 무료 데이터 포털 사이트. 주로 공공정보 관련 데이터를 제공.
데이터 분석 포트폴리오를 만들 수 있는 도구:
1) 엑셀을 사용한 분석. 엑셀은 데이터를 함수로 정리하고 표시하는 기본 툴.
2) 빅쿼리 & SQL을 사용한 분석. SQL지식이 있다면 Google BigQuery가 좋은 선택지이다.
* Google BigQuery
구글 클라우드에서 돌아가는 데이터 웨어하우스. 데이터 웨어하우스란 용어 그대로 데이터를 모아둔 창고로, 분석할 수 있는 형태의 데이터를 모아놓은 저장소이다. 프로그램 운여보다 분석에 초점을 맞춘 도구이다. 빅쿼리를 활용하면 찾은 데이터를 SQL로 써볼 수 있다. 빅쿼리는 데이터만 업로드하면 기본적인 관계형 DBMS와 분석 기능을 제공한다. 따라서 복잡하게 직접 DB를 만들 필요 없이 SQL을 사용할 수 있다. 다만, GCP 계정 생성부터 단계가 복잡하다.
3) GA, Amplitude 등 데이터 시각화 도구를 사용해 분석. 분석과 시각화 등 핵심 단계를 적용해볼 수 있다.
4) Python과 라이브러리를 사용해 분석. 코딩 지식이 뒷받침된다면, 프로그래밍 언어, 파이썬을 활용하는 것도 추천. 주요 라이버리의 도움을 받으면, 좀 더 전문적으로 데이터를 정리하고 시각화할 수 있다.
데이터 기반 의사결정 (DDDM)
DDDM은 데이터를 활용하여 비즈니스적 의사결정을 하는 것으로, 수집, 가공, 분석을 거쳐 정량화된 객관적인 데이터를 활용하기 때문에, 과거 경험과 직관으로 의사결정을 하는 것보다 객관적이고 효과적이다.
프로덕트에서의 DDDM을 어떻게 활용하나?
프로덕트에서는 데이터 기반 의사결정을 통해 고객 가치를 최대화하고, 비용을 줄이며 매출을 높이는 기회를 찾는다. 특정 기준으로 고객 집단을 나누어 특성을 파악하는 유저 세그먼트와 코호트 분석, 고객 경험을 정량화하는 설문조사와 VOC 분석, 전환율과 이탈률을 파악하여 문제를 정의하고 개선하는 퍼널 분석과 A/B 테스트, 그 가운데 가장 중요하게 설정해야 하는 지표인 KPI 등도 DDDM을 활용한 것이다. 모두 데이터 드리븐을 위한 데이터 그자체이거나, 분류한 데이터 그룹이다. 프로덕트를 둘러싼 많은 개념들은 데이터의 설정과 수집, 가공, 분석과 연관이 깊다.
데이터 기반 의사결정이 중요한 이유와 장점:
1) 리스크 편차 감소: 데이터는 현재 상황에 대한 진단과 검증, 예측의 수단으로, 예측 모델이 발달할 수록 리스크 편차는 줄어든다.
2) 목표 달성을 위한 중요한 역할: 데이터 기반 의사결정은 프로덕트 팀이 목표 달성을 위해 필요한 중요한 역할을 수행한다. 명확한 숫자인 데이터로 소통하기 때문에 설득에 필요한 커뮤니케이션 비용을 줄이고, 목표에 집중할 수 있도록 한다.
3) 고객 니즈에 대한 대응: 데이터를 수집하고 분석하는 것은 다양한 고객의 행동과 니즈를 파악하는 것에 유용하다. 이는 개인 맞춤형으로 서비스를 제공하는 데 도움을 준다.
4) 다양한 분야에서 의사결정에 활용: 데이터 기반 의사결정은 프로모션 중인 제품의 판매량이 비이상적으로 낮을 경우 문제를 해결하고 가격 표시가 잘못된 경우 이를 발견하여 수정하는 등 다양한 분야에서 의사결정에 활용될 수 있다.
따라서 데이터 기반 의사결정은 가격 표시가 잘못된 경우 이를 발견하여 수정하는 일부터, 넓게는 조직 인사 관리까지 적용되는 등 다양한 분야에서 의사결정에 활용될 수 있다. 조직의 생산성과 효율성을 높이고, 시간과 비용을 절감할 수 있으며, 기존 비즈니스 모델을 개선하거나 새로운 비즈니스 모델을 창출하는 것에도 도움을 준다.
데이터기반 의사결정 5단계
DDDM은 프로덕트뿐만 아니라, 비즈니스 의사결정에도 중요한 데이터 기반 의사결정을 실행할 수 있다고 했다. 그래서 그럼 어떻게 진행되는지 한 번 살펴보자.
데이터 기반 의사결정의 5단계:
1) 목표와 전략 수립
데이터를 통해 무엇을, 어떻게 달성할지 정하는 것. 기업/팀의 미션, 비전, 로드맵, 전략 등과 얼라인되어야 한다. 달성하고자 하는 목표와 그 목표를 달성하기 위해 필요한 데이터를 구체화하는 단계이다.
2) 데이터 수집과 가공
정확한 데이터를 수집하고 분석하기 쉽도록 가공하는 것이 중요하다. 전 단계에서 필요한 데이터를 구체화했다면, 해당 단계에서는 어떤 데이터를 어디서 얼마나 수집할 것인지를 결정한다. 수집 후에는 정리되지 않은 데이터를 분석하기 쉽도록 정리하는 등 가공해야 하는 것도 잊어서는 안된다.
3) 데이터 분석과 인사이트 도출
이전 단계에서 필요한 데이터를 수집하고 추출했다면, 해당 단계에서는 수집한 데이터 간의 상관 관계나 인과 관계를 파악하고, 이해하기 쉽도록 데이터 시각화를 진행해야 한다. 그리고 데이터 분석 결과를 비즈니스 도메인에 맞게 해석하여 인사이트를 도출해야 한다. 인사이트는 데이터 분석을 통해 얻은 식별되지 않은 문제나 기회를 의미한다.
4) 액션 수립과 실행
이전 단계에서 데이터를 분석하고 인사이트를 도출했다면, 해당 단계에서는 인사이트를 기반으로, 프로덕트 팀 내외 이해관계자가 문제 해결을 위해 실제로 수행해야 하는 액션 아이템을 수립하고 실행한다. 인사이트를 비즈니스 목표와 연결하고 적절한 대응 방안을 찾아 수립하는 것이 필요하다.
5) 결과 공유 및 회고
수립한 목표에 대한 결과를 기대와 비교하고, 프로세스 전체를 평가하며, 향후 개선 방안을 논의하자. 목표와 결과뿐만 아니라 DDDM 프로세스에 대한 평가와 개선 방안 논의 등 회고가 이뤄져야 한다.

데이터 기반 의사결정을 위한 4가지 주요 요소:
1) 데이터의 양
분석 결과의 신뢰도와 연관된다. 충분한 양의 데이터를 수집하지 않으면 분석 결과가 정확하지 않을 수 있으며, 통계적인 신뢰도가 떨어지고 결과를 왜곡할 가능성이 크다. 따라서 데이터를 분석하여 의사결정을 내리기 이전, 충분한 양의 데이터를 확보해야 한다.
2) 데이터의 품질
데이터의 품질은 분석 결과의 정확성에 영향을 미친다. 좋은 데이터 품질은 분석 결과의 높은 정확도로 이어지고, 이는 더 좋은 의사결정 결과를 만들 수 있다. 따라서 데이터를 정제하고 관리하여 신뢰도를 확보해야 한다.
3) 데이터 분석 도구
적절한 분석 도구는 방대한 양의 데이터를 살펴보기 위해 필요하다. 효과적인 데이터 기반 의사결정을 위해서는 분석 도구가 사용하기 쉬워야 하며, 팀원들 누구나 다룰 수 있도록 교육이 수반되어야 한다. 대표적인 데이터 분석 도구에는 통계적 분석에 활용되는 R, 파이썬, SQL이 있고, 데이터 시각화에 활용되는 도구는 태블로, 앰플리튜드, Google Looker Studio가 있다고 앞서 언급한 바 있다.
4) 피드백 루프
적절한 피드백 루프가 필요하다. 결과를 측정하고 그 경험을 통해 학습해야, 향후 더 나은 의사결정을 할 수 있습니다. 따라서 이전 결정의 결과를 평가하고 의사결정 모델을 개선하기 위해 적절한 피드백 루프를 구축해야 한다.

더 나은 의사결정을 위해서..
데이터 기반 의사결정은 데이터 마이닝, 예측 분석, 통계 분석 등 다양한 분석 기법을 활용하여 데이터를 분석하고, 분석 결과를 시각화하여 조직 내 의사결정에 활용하는 것이다. 성공적인 데이터 드리븐은 데이터 분석을 통해 예측의 정확도를 높이는 효과가 있다. 문제를 미리 발견하거나 정확한 의사결정이 가능하도록 한다. 또 정량적인 데이터를 기반으로 빠르게 의사결정할 수 있다.
데이터 드리븐한 PM이 되는 그날까지! 열심히 공부해보자!