데이터 컨퍼런스에 처음으로 참여했다!
업데이트:
데이터 컨퍼런스에 참여하다
- 데이터야놀자2020 이라는 데이터 컨퍼런스에 참여했다.
- 처음 참여하는 컨퍼런스!
좋았던것들!
- 다양한 분들이 나와서 좋은 이야기를 많이 해주셨는데, 내가 좋다고 느끼고 배운것들은,
- 데이터를 어떻게 비즈니스와 연결시킬지?
- 분석 결과를 어떻게 구성원들에게 공유할지?
- 기업에서는 어떤 데이터 분석 프로젝트를 진행하는지?
- 생활데이터 분석의 중요성! 이다.
- 가장 좋았던 세션은 큐피스트 카야님이 진행해주신 세션이다.
- 난 이전 회사에서 데이터 리포트를 만들고 공유하는 업무를 맡은 경험이 있다.
- 이 때 페인포인트가, 나 혼자 분석하고 공유하고 거기서 그친다는 느낌을 받는다는것이었다.
- 물론 이때는 나도 분석에 대해 잘 몰랐기때문에, 지표의 증감만 공유하는 등의 오류를 범하긴 했다.
- 근데 카야님께서는, 현재 비즈니스의 방향과 일치하는 주제로 데이터를 분석하고, 이를 개선시킬 수 있는 실험을 다른 팀원분들과 기획한다.
- 그리고 이 실험 결과들을 주기적으로 공유한다.
- 또한, 구두로도 데이터 인사이트를 공유하시면서 구성원들이 데이터와 더 친해지고, 이해가 높아질 수 있도록 노력하신다고 한다.
- (여담으로 카야님 유튜브도 몇 번 본적이 있는데, 코카콜라를 엄청 좋아하시는 것 같다…. 항상 책상에 콜라캔이 ㄷㄷ)
아쉬웠던것들!
- 컨퍼런스에 대해 아쉬웠던 점은,
- 아무래도 온라인으로 진행되다보니 소통이 원활하다는 느낌은 받지 못했다.
- 그리고 사전 녹화를 해서 그런지, 컨퍼런스라기보단 강의같다는 느낌을 많이 받았다.
- 또한, 세션당 시간이 짧다보니, 내용이 깊지는 않았다.
컨퍼런스를 참여하고 느낀 점!
- 책속에 빠지지 말고 실제로 데이터를 분석하는 프로젝트를 많이 해보자.
- 어떻게 데이터로 돈을 벌게 할 수 있는지에 대해 고민해보자.
- 기업에서 좋아하는 주니어(신입)은 스킬이 좋은 사람보다는, 분석을 좋아하고 성장 의지가 있는 사람이 아닐까?
- 컨퍼런스에 자주 참여하자!
여기부터는 내가 들었던 컨퍼런스 세션 정리!
당근마켓이 데이터와 함께 노는 법
- 분석, 모델링을 하기 전에 문제를 잘 정의해야 좋은 해결책을 낼 수 있음
- 당근마켓에서 정의한 문제는,
- 동네생활 서비스에 올라오는 글이 당근마켓스러운지?
- 동네생활은 정말 동네에서의 정보를 공유하는 플랫폼
- 그래서 판매 홍보등과 같은 글은 필터링해야함.
- 위와 같이 당근마켓스러운지? 에 대한 것들을 잘 정의해야함.
- 동네생활 서비스에 올라오는 글이 당근마켓스러운지?
- 어떻게 모델링했는가?
- 동네생활에 올라오는 글들에 대해 데이터 라벨링 진행
- 0: 괜찮은 글, 1: 부적절한 글
- 글들을 토큰화하여 이를 다시 숫자로 표현
- BERT라는 모델을 활용
- 동네생활에 올라오는 글들에 대해 데이터 라벨링 진행
- 모델링에 대한 이야기보다는 어떤 문제를 풀고 이를 어떻게 접근하는지에 대한 내용이 흥미로웠음
지금 나만 애호박에 진심이야?
- 생활데이터를 어떻게 분석했는지?
- 관심있는 주제에 대하여 일상적인 소재를 분석하다보니 어떤 데이터가 필요한지 잘 알고있는것이 좋았음.
- 가설이 기각되었는데,
- 단순히 가설이 기각되었고, 결과가 ~했다. 라고 마무리짓는 것이 아니라,
- 어떤 부분이 부족했고, 고려하지 못한 부분은 어떤것이 있는지 회고하는것이 인상적이었음.
- 데이터, 숫자로만 분석하는 것이 아니라, 실제 도메인 전문가 (예를들면 농부)에게 조언을 구할 수 있다는 첨언도 인상적이었음.
출근길에 생각한 토이 프로젝트
- 내 문제를 데이터로 풀어보자!
- 크롤링을 위해 클라우드서비스를 이용하는 점이 흥미로웠다.
- 출퇴근이나 이동을 할 때 실제 지하철 시간표보다 늦거나 빠르게 지하철이 오는 경우가 잦다.
- 사람이 많아서 지연출발되거나,
- 급행열차를 먼저 기다리며 신호대기를 함으로 인해 늦어지거나 등의 원인이 있을텐데,
- 이를 데이터를 통해 시각화하고 분석해내는 과정이 재미있었다.
데이터를 중심으로 성장 전략과 문화 만들기
- 서비스의 목표를 데이터로 풀어낼 수 있어야한다!
- 예를들어 business goal이 재방문율 증대라면, 이를 어떻게 데이터 분석으로 풀어낼것인지?
- 익숙해져서 수치만 확인하고 넘어가는 비즈니스 지표는 없는지?
- 그 지표들에서 유의미한 자료는 찾을 수 없는지?
- 데이터를 통해 얻은 내용을 어떻게 공유하는지?
- 레포트에서 지표만 보고 읊는 것이 아니라,
- 어떤 실험을 했는데 어떤 결과가 나왔다. 지금의 현황은 이렇다 등의 내용을 공유
- 다만 실험 중 좋지 않은 결과가 나오지 않는 것들은 과감하게 기각함.
- 이에 대한 후속 대응 방향도 같이 공유함.
- 그리고 잦은 공유를 일상화하기! (구두로)
- 사내 메신저로 내용을 공유하면 모두가 이해하지는 않음.
- 그래서 구두로 전달을 하는데,
- 진행 과정의 맥락을 구성원들에게 이해시키고
- 구성원들이 능동적으로 데이터를 찾도록!
우아한 형제들에서 데이터로 일하는 방법
- 분석팀에서 하고있는 일들
- 데이터 마트 생성
- 데이터마트: 평소 자주 필요한 데이터들을 모아놓아서 편리하게 이용할 수 있게 모아두는 것
- 탐지, 예측모델링
- 허위 주문, 리뷰 어뷰징 사례 등과 같은 이상 징후 탐색
- 데이터 마트 생성
- 데이터프로덕트팀
- 챗봇
- 고객센터의 부담을 덜고, 사용자 서비스 사용감을 향상
- 추천
- 뭐 시켜먹지? 에 대한 고민을 해결해줄 수 있도록
- 이미지
- 사용자 리뷰 내 부적절한 단어나 이미지를 탐지하는 분류모델
- 예를들어 영수증 내 개인정보 노출
- 음식과 무관한 강아지, 연예인 등 이미지
- 음란성 이미지 등
- 사용자 리뷰 내 부적절한 단어나 이미지를 탐지하는 분류모델
- 챗봇
- 스킬이 좋은것보다는
- 고객이 원하는 것이 무엇인지 궁금해하고,
- 필요한 지식을 학습, 습득하려는 의지, 능력이 더 중요하다.
- 그리고 수치적인 감각
데이터 주제로 방송하면 아무도 안 들을 줄 알았지
- 내가 좋아하는 데이터홀릭! 도 데이터야놀자에 참여했다.
- 데이터 장인분들이 풀어나가는 데이터 이야기.
- 나는 데이터홀릭도 원래 알고있었고, 거의 모든 콘텐츠들을 봤기떄문에 새로운 내용을 얻지는 못했다.
- 다만 어떻게 방송이 만들어지는지 재미있게 들었다.
데이터로 대화하는 재미
- 딥러닝과 같은 고급 기술보다는 데이터 추출이나 지표 관리가 더 중요하다고 느꼈음
- 데이터 분석가는 커뮤니케이션 해야하는 담당자들이 많다.
- 그래서 데이터 추출 요청이 많을 수 있는데,
- 모든 담당자들이 데이터에 대한 지식이 있는 것은 아니기에, 막연하게 요청이 오는 경우가 잦음.
- 데이터를 잘 추출하고 잘 커뮤니케이션해서.. 일을 원할하게 돌아가도록 해야 함
- 한 마디로, 커뮤니케이션 능력이 아주 중요하다!
댓글남기기