데이터 컨퍼런스에 처음으로 참여했다!

업데이트:

데이터 컨퍼런스에 참여하다

/assets/images/datayanolja/Untitled.png

  • 데이터야놀자2020 이라는 데이터 컨퍼런스에 참여했다.
    • 처음 참여하는 컨퍼런스!

좋았던것들!

  • 다양한 분들이 나와서 좋은 이야기를 많이 해주셨는데, 내가 좋다고 느끼고 배운것들은,
    • 데이터를 어떻게 비즈니스와 연결시킬지?
    • 분석 결과를 어떻게 구성원들에게 공유할지?
    • 기업에서는 어떤 데이터 분석 프로젝트를 진행하는지?
    • 생활데이터 분석의 중요성! 이다.
  • 가장 좋았던 세션은 큐피스트 카야님이 진행해주신 세션이다.
    • 난 이전 회사에서 데이터 리포트를 만들고 공유하는 업무를 맡은 경험이 있다.
    • 이 때 페인포인트가, 나 혼자 분석하고 공유하고 거기서 그친다는 느낌을 받는다는것이었다.
      • 물론 이때는 나도 분석에 대해 잘 몰랐기때문에, 지표의 증감만 공유하는 등의 오류를 범하긴 했다.
    • 근데 카야님께서는, 현재 비즈니스의 방향과 일치하는 주제로 데이터를 분석하고, 이를 개선시킬 수 있는 실험을 다른 팀원분들과 기획한다.
    • 그리고 이 실험 결과들을 주기적으로 공유한다.
    • 또한, 구두로도 데이터 인사이트를 공유하시면서 구성원들이 데이터와 더 친해지고, 이해가 높아질 수 있도록 노력하신다고 한다.
    • (여담으로 카야님 유튜브도 몇 번 본적이 있는데, 코카콜라를 엄청 좋아하시는 것 같다…. 항상 책상에 콜라캔이 ㄷㄷ)

아쉬웠던것들!

  • 컨퍼런스에 대해 아쉬웠던 점은,
    • 아무래도 온라인으로 진행되다보니 소통이 원활하다는 느낌은 받지 못했다.
    • 그리고 사전 녹화를 해서 그런지, 컨퍼런스라기보단 강의같다는 느낌을 많이 받았다.
    • 또한, 세션당 시간이 짧다보니, 내용이 깊지는 않았다.

컨퍼런스를 참여하고 느낀 점!

  • 책속에 빠지지 말고 실제로 데이터를 분석하는 프로젝트를 많이 해보자.
  • 어떻게 데이터로 돈을 벌게 할 수 있는지에 대해 고민해보자.
  • 기업에서 좋아하는 주니어(신입)은 스킬이 좋은 사람보다는, 분석을 좋아하고 성장 의지가 있는 사람이 아닐까?
  • 컨퍼런스에 자주 참여하자!

여기부터는 내가 들었던 컨퍼런스 세션 정리!

당근마켓이 데이터와 함께 노는 법

  • 분석, 모델링을 하기 전에 문제를 잘 정의해야 좋은 해결책을 낼 수 있음
  • 당근마켓에서 정의한 문제는,
    • 동네생활 서비스에 올라오는 글이 당근마켓스러운지?
      • 동네생활은 정말 동네에서의 정보를 공유하는 플랫폼
      • 그래서 판매 홍보등과 같은 글은 필터링해야함.
    • 위와 같이 당근마켓스러운지? 에 대한 것들을 잘 정의해야함.
  • 어떻게 모델링했는가?
    • 동네생활에 올라오는 글들에 대해 데이터 라벨링 진행
      • 0: 괜찮은 글, 1: 부적절한 글
    • 글들을 토큰화하여 이를 다시 숫자로 표현
    • BERT라는 모델을 활용
  • 모델링에 대한 이야기보다는 어떤 문제를 풀고 이를 어떻게 접근하는지에 대한 내용이 흥미로웠음

지금 나만 애호박에 진심이야?

  • 생활데이터를 어떻게 분석했는지?
    • 관심있는 주제에 대하여 일상적인 소재를 분석하다보니 어떤 데이터가 필요한지 잘 알고있는것이 좋았음.
    • 가설이 기각되었는데,
      • 단순히 가설이 기각되었고, 결과가 ~했다. 라고 마무리짓는 것이 아니라,
      • 어떤 부분이 부족했고, 고려하지 못한 부분은 어떤것이 있는지 회고하는것이 인상적이었음.
  • 데이터, 숫자로만 분석하는 것이 아니라, 실제 도메인 전문가 (예를들면 농부)에게 조언을 구할 수 있다는 첨언도 인상적이었음.

출근길에 생각한 토이 프로젝트

  • 내 문제를 데이터로 풀어보자!
  • 크롤링을 위해 클라우드서비스를 이용하는 점이 흥미로웠다.
  • 출퇴근이나 이동을 할 때 실제 지하철 시간표보다 늦거나 빠르게 지하철이 오는 경우가 잦다.
    • 사람이 많아서 지연출발되거나,
    • 급행열차를 먼저 기다리며 신호대기를 함으로 인해 늦어지거나 등의 원인이 있을텐데,
    • 이를 데이터를 통해 시각화하고 분석해내는 과정이 재미있었다.

데이터를 중심으로 성장 전략과 문화 만들기

  • 서비스의 목표를 데이터로 풀어낼 수 있어야한다!
    • 예를들어 business goal이 재방문율 증대라면, 이를 어떻게 데이터 분석으로 풀어낼것인지?
    • 익숙해져서 수치만 확인하고 넘어가는 비즈니스 지표는 없는지?
    • 그 지표들에서 유의미한 자료는 찾을 수 없는지?
  • 데이터를 통해 얻은 내용을 어떻게 공유하는지?
    • 레포트에서 지표만 보고 읊는 것이 아니라,
    • 어떤 실험을 했는데 어떤 결과가 나왔다. 지금의 현황은 이렇다 등의 내용을 공유
    • 다만 실험 중 좋지 않은 결과가 나오지 않는 것들은 과감하게 기각함.
      • 이에 대한 후속 대응 방향도 같이 공유함.
    • 그리고 잦은 공유를 일상화하기! (구두로)
      • 사내 메신저로 내용을 공유하면 모두가 이해하지는 않음.
      • 그래서 구두로 전달을 하는데,
      • 진행 과정의 맥락을 구성원들에게 이해시키고
      • 구성원들이 능동적으로 데이터를 찾도록!

우아한 형제들에서 데이터로 일하는 방법

  • 분석팀에서 하고있는 일들
    • 데이터 마트 생성
      • 데이터마트: 평소 자주 필요한 데이터들을 모아놓아서 편리하게 이용할 수 있게 모아두는 것
    • 탐지, 예측모델링
      • 허위 주문, 리뷰 어뷰징 사례 등과 같은 이상 징후 탐색
  • 데이터프로덕트팀
    • 챗봇
      • 고객센터의 부담을 덜고, 사용자 서비스 사용감을 향상
    • 추천
      • 뭐 시켜먹지? 에 대한 고민을 해결해줄 수 있도록
    • 이미지
      • 사용자 리뷰 내 부적절한 단어나 이미지를 탐지하는 분류모델
        • 예를들어 영수증 내 개인정보 노출
        • 음식과 무관한 강아지, 연예인 등 이미지
        • 음란성 이미지 등
  • 스킬이 좋은것보다는
    • 고객이 원하는 것이 무엇인지 궁금해하고,
    • 필요한 지식을 학습, 습득하려는 의지, 능력이 더 중요하다.
    • 그리고 수치적인 감각

데이터 주제로 방송하면 아무도 안 들을 줄 알았지

  • 내가 좋아하는 데이터홀릭! 도 데이터야놀자에 참여했다.
  • 데이터 장인분들이 풀어나가는 데이터 이야기.
  • 나는 데이터홀릭도 원래 알고있었고, 거의 모든 콘텐츠들을 봤기떄문에 새로운 내용을 얻지는 못했다.
    • 다만 어떻게 방송이 만들어지는지 재미있게 들었다.

데이터로 대화하는 재미

  • 딥러닝과 같은 고급 기술보다는 데이터 추출이나 지표 관리가 더 중요하다고 느꼈음
  • 데이터 분석가는 커뮤니케이션 해야하는 담당자들이 많다.
    • 그래서 데이터 추출 요청이 많을 수 있는데,
    • 모든 담당자들이 데이터에 대한 지식이 있는 것은 아니기에, 막연하게 요청이 오는 경우가 잦음.
    • 데이터를 잘 추출하고 잘 커뮤니케이션해서.. 일을 원할하게 돌아가도록 해야 함
  • 한 마디로, 커뮤니케이션 능력이 아주 중요하다!

댓글남기기