데이터분석가의 역할

데이터분석가 포지션은 PM/PO, 개발자 등에 비해 역할이 애매하게 느껴질 때가 많습니다. 예측모델링 위주의 업무를 하는 데이터분석가가 아니라면 때로는 데이터 많이 잘 하는 PM/PO도 할 수 있어 보이는 겹치는 업무가 많기 때문에 그렇게 느껴지는 것 같습니다 (어쩌면 PM/PO가 잡부 업무도 수행하기 때문에 그럴 수도 있겠네요). 그럼에도 데이터분석가의 역할을 정리하면서, 데이터분석가가 가져야 할 뾰족한 포인트가 무엇일지 정리해보겠습니다.

데이터분석가의 역할

의사결정권자의 데이터 레버리지 (Leverage)
정량화 (Quantification / Measurement)
인사이트 및 기회 발굴 (Insight / Opportunity)

의사결정권자의 데이터 레버리지 (Leverage)

각 단어를 설명하자면 우선 의사결정권자는 C-Level일 수도 있고 요즘 많이 언급되는 PO/PM일 수도 있습니다.
레버리지는 사람, 도구 등을 통해 대신 혹은 더 효과적으로 무언가를 달성하는 것을 의미합니다. 기본적으로 채용도 레버리지고, 태블로 같은 BI툴을 구입하는 것도 레버리지고, 얼마전 제가 LG에너지솔루션 청약하는데 150만원이 없어서 주택청약통장을 담보로 돈을 빌리고 청약 후 바로 갚아버린 것도 레버리지를 이용한 것입니다.

의사결정권자는 작은 조직, 작은 업무일수록 (볼 수 있는 건 얼마 안 되지만 가진 것에 한해서는) 데이터를 더 긴밀히 봅니다. 하지만 조직과 업무가 커지면서 시간을 할애하기 어려워집니다. 따라서 이 업무를 돈 주고 대신, 더 잘 해줄 사람이 필요한데, 이 때 데이터분석가를 돈 주고 고용하게 되죠. 그렇기에 의사결정권자들이 원하는 데이터를 잘 제공해주는 것은 분석가 입장에서는 수동적일 수 있으나 반드시 해야 하는 업무라 할 수 있습니다. 필요한 데이터가 있으면 뽑아주고, 대시보드를 만들고, 데이터가 어떻게 남겨야하는지 얘기하고 잘 남는지 확인하고, 필요시 데이터마트를 관리하는 것도 모두 레버리지의 영역이라고 생각됩니다.

물론 일부 회사에서는 데이터분석가를 쿼리 머신으로 사용하는데 이것은 2, 3번의 비중을 극단적으로 0으로 만들어버리는 것으로 볼 수 있습니다. 이는 해당 회사 혹은 의사결정권자가 2, 3번 일도 할 수 있다는 것을 몰라서일 수도 있고, 데이터분석가에 대한 신뢰가 낮아 알고도 굳이 원치 않아 권한을 부여하지 않는 것으로 보고 있습니다. 힙데비에 참가했을 때 한 PO님께서 지표정의를 잘 해야 된다는 얘기를 하시면서 지표 정의가 잘 되어야 ‘DA님 이렇게 뽑아주세요’하기 좋다는 말씀을 하셨는데 사실 굉장히 놀랐습니다. 표현과 뉘앙스로 미루어보아 해당 회사에서는 데이터분석가의 역할이 100% 레버리지구나라는 생각이 들었거든요.

개인적으로는 데이터 레버리지 업무의 비중이 0%가 되면 각종 테크닉으로 무장했지만 현업에는 아무런 변화를 주지 못하는 탁상공론식 데이터분석이 된다고 생각하기 때문에 의사결정 사이클 안에서 같이 분석하기 위해 일정 수준 이상 데이터 레버리지 역할은 수행해야 한다고 생각합니다. 하지만 반대로 많은 분석가들이 쿼리머신(100% 레버리지)으로 일하는 것이 현실인데 왜 위 케이스가 놀라웠을까요? 데이터분석가의 롤이 1번에만 한정된 회사는 일정 수준 이상의 성장이 어렵(다고 믿)기 때문입니다. 프로덕트를 기준으로 사실 PMF(Product Market Fit)를 찾는 단계까지 그리고 찾고 나서 일정 기간 이후까지는 PO/PM, 개발자가 먼저 필요하지 분석가는 필요하지 않습니다. 웹/앱 런칭도 안했는데 분석가를 적극적으로 뽑고 있다면 그 회사가 잘못된 겁니다. 그러나 PMF를 찾고나서는 이제 성공공식에 올라탄 것이고 해야될 업무는 큰 틀에서 정해져 있습니다(큰 틀에서 정해져 있다는 게 그러니 이제 쉽다는 건 절대 아니며 이때부터 미친듯이 발버둥 쳐야만 살아남을 수 있습니다). 소위 J커브 성장은 1~2주 스프린트를 통해 빡 성장하는 것이 아니라 1~2주 스프린트를 반복적으로 하여 꾸준히 일정 수준 이상의 성장을 하고 이것이 복리 효과가 되어 나중에 돌아보니 J커브 형태가 되는 것인데요, 이 일정 수준 이상 + 꾸준함에 있어 데이터를 통한 의사결정이 좋습니다 (우리는 이것을 data-driven이라고 부르기로 했어요). 비유를 하자면 3년동안 1개월 한 번 2000%라는 역사적인 수익률을 기록하고 나머지 35개월이 마이너스인 펀드 A와 3년동안 꾸준히 10% 수익률을 기록한 펀드 B를 비교하면 B가 3년동안 수익률이 50% 이상 더 좋습니다. 뉴스에는, 링크드인에는 2000%가 남겠지만 펀드는 10%씩 성장한 B가 살아남습니다.

이러한 이유로 데이터분석가는 데이터 레버리지 외의 역할을 많이 수행해 회사의 생존에 기여해야 합니다. 이 내용은 아래 두 파트에서 설명해보겠습니다.

필요한 스킬

SQL
데이터시각화
데이터 스케줄링
프로덕트 지표 이해도
커뮤니케이션

정량화 (Quantification / Measurement)

1주 리텐션이 몇%p 증가했는지, 퍼널 전환율은 얼마인지 등은 모두 데이터를 통해 정량화 가능한 부분입니다. 이런 간단한 정량화부터 복잡한 정량화까지 모두 데이터분석가가 뾰족하게 기여할 수 있는 분야라고 생각합니다. 개인적으로 오늘의집 블로그에 몇 번씩 다시 읽은 좋아하는 아티클이 있는데요, 별도의 ID가 남지 않는 TV 광고의 효과를 정량화하는 것도 데이터를 잘 남기고 효과의 정량화를 어떻게 정의할 것인지 결정하면 가능해지는 것이죠(오늘의집 아티클이 참고한 Wayfair의 아티클은 더 심도깊은 내용을 다루고 있어 인과추론에 대한 이해도가 있으시다면 추가적으로 보기 좋습니다).
다음으로 온라인 플랫폼에서 실험은 이 정량화를 가장 효과적으로 잘 할 수 있는 방법이라고 생각합니다. 실험을 잘 설계하고 결과를 공유하는 것 모두 데이터분석가의 역할이고, 실험에서 주요하게 볼 지표를 정의하는 것 더 나아가 장기적으로 중요한 지표를 결정하는 것 모두 데이터분석가가 의사결정권자와 같이 정해야 합니다. 실험이 가능하다면 최대한 고도화 시키는 것이 좋다는 입장이라 많은 테크 기업들이 실험 위주로 많은 결정을 진행할 거라고 믿고 있고, 실험을 위한 하드스킬보다는 노하우 같은 소프트스킬이 경쟁력 있어지지 않을까 생각됩니다.
마지막으로 국내에서는 인과추론을 통한 성과 공유를 보기 쉽지 않지만 해외 빅테크 기업의 테크블로그에는 어렵지 않게 인과추론 기법을 통한 정량화 사례가 공유됩니다. 인과추론을 잘 녹여내면 실험의 결과를 더 풍부하게 해석해낼 수도 있고, 실험이 어려운 상황에서 효과를 추론해낼 수도 있습니다. 정량화를 고도화해준다는 점에서 인과추론은 굉장히 매력적인 분야라는 생각이 듭니다. 다만, 인과추론 영역이 대부분 Ground-Truth (실제값)이 없는 상태에서 잘 추론하려는 방법론이다보니 탁상공론의 굴레에 빠지기 쉬운 것 같습니다. 개인적으로는 실험 위주로 정량화를 잘 하면서 one more thing으로 인과추론을 한 번씩 사용하는 것이 생산성 있는 업무 방식인 것 같습니다.

필요한 스킬

SQL
가설 설정
실험설계
지표 선정
인과추론
논리적 사고
커뮤니케이션

인사이트 및 기회 발굴 (Insight / Opportunity)

데이터가 강조되는 요즘이지만 사실 1970년대에도 80년대에도, 더 나아가 고대 문명부터 데이터를 통해 문제를 해결하기는 했습니다. 이런 데이터 활용 방식은 데이터 레버리지 영역에서 다뤘던 내용들과 가깝습니다. 심지어 논리(연역적 사고)의 끝판왕이라 볼 수 있는 컨설팅 업계에서도 모든 논리에 데이터 수치가 들어가죠. 최근 소위 빅데이터의 시대에 들어서면서 데이터의 변화라 하면 미세한 (granular) 데이터 단위로 수집된다는 것에 있습니다. 세세한 데이터를 남기면서 생각할 거리는 늘어나고 복잡해졌지만 더 많이 인사이트를 얻을 수 있고 기회를 발굴할 수 있게 되었죠.
온라인 쇼핑을 통한 애견용품 소비가 늘었다는 명제에 대해 과거에는 월/분기/연 단위 애견용품 구매량 데이터만 보고 늘고 있지 않냐는 얘기를 했을 것이고 사실 이것은 세세한 정보를 얻을 수 없으니 몇 가지 가정을 그냥 생략하고 낸 결론이었습니다. 하지만 데이터를 미세한 단위까지 얻을 수 있게 되면서 더 자세한 정보를 제공할 수 있게 되었고 이렇게 얻을 수 있는 인사이트가 많아졌다고 생각합니다. 애견용품 소비가 늘었으니 펫 시장이 잘 되고 있다라는 결론을 내렸는데 소비량이 크게 증가한 소비처가 동물병원이라면 종합 데이터로 내린 결론과 세세한 데이터로 내린 결론이 달라지게 되죠. 마찬가지로 우리 앱이 A라는 용도로 쓸 일이 거의 없는데 왜 여기서 쓰는 사람이 은근 있지 하면서 A에 기회가 있구나 알게 될 수도 있구요. 이런 부분은 데이터를 가장 가깝게 쳐다보고 있는 사람인 데이터분석가에게 유리한 포인트인 것 같습니다.
물론 이렇게 관측데이터로 얻은 정보는 가짜 상관관계일 수도 있습니다. 하지만 몇 번 실패하더라도 레슨런을 얻고 그 중 몇 개가 얻어걸리면 굉장한 성장으로 이어질 수 있습니다.

필요한 스킬

호기심
가설 설정
실행을 통한 피드백 수용
커뮤니케이션

마치며

세 가지 역할은 사실 데이터를 활용하는 방법과도 연관이 깊습니다(정확히 일치하진 않지만). 의사결정권자의 데이터 레버리지는 Data-Informed, 정량화는 Data-Driven, 인사이트 및 기회 발굴은 Data-Inspired와 가까운 형태입니다. 회사의 단계와 상황에 따라 비중은 달라질 수 있겠으나 세 가지 역할을 잘 수행하는 것이 데이터분석가에게 요구되는 역량 같이 느껴집니다. 저도 세 가지 다 잘하고 싶네요…
처음 문제의식이었던 데이터 분석가의 뾰족한 역할 포인트는 정량화와 인사이트 및 기회 발굴이라고 생각되는데요. 본문에서도 밝혔듯이 데이터 레버리지 업무의 비중이 0%가 되면 탁상공론식 데이터분석이 될 가능성이 높으니 뾰족히 다듬으면서도 항상 의사결정권자와 긴밀히 소통하고 도움을 주려 노력해야겠다는 생각이 들었습니다.

이전[글또] 2021년 회고글

다음TV 광고의 효과를 분석하는 법