본문 바로가기
Review/IT Conference & Summit

쏘카 데이터 밋업 2022 후기 (feat. 데이터 엔지니어의 관점에서)

by Steve-Lee 2022. 10. 30.

SOCAR DATA MEET-UP 2022


이미지 출처: 쏘카 링크드인 공식 계정

안녕하세요 Steve Lee입니다. 잘 지내고 계신가요?

저는 지난주 목요일 저녁 성수동에 소재한 모빌리티 기업 SOCAR(쏘카)에서 주관한 SOCAR DATA MEEP-UP 2022에 다녀왔습니다. 주말을 맞이하여 행사에서 느꼈던 점들을 정리해서 공유하고자 본 포스팅을 작성하게 되었습니다.

데이터 엔지니어로 커리어를 시작한지 약 2년이 다돼가는 지금, 데이터 기반의 서비스를 지향하는 쏘카의 데이터 활용 및 데이터에 기반한 문제 해결 방법이 궁금했었는데요. 이번 밋업의 다양한 세션과 네트워킹 시간을 통해 궁금증을 해소할 수 있어서 좋았습니다!

그럼 리뷰를 시작하도록 하겠습니다!

 

시작에 앞서


  • O2O 비즈니스 기업에서는 데이터를 어떻게 활용하고 있을까?
  • 데이터 기반의 문제 해결을 추구하는 SOCAR의 이야기를 들어보자

 

Overview


  • 행사 개요
  • 핵심: 팀과 함께 네트워킹 할 수 있는 시간을 준비했습니다

행사 개요


  • 기술과 데이터로 내일의 이동을 실현하는 쏘카의 데이터 이야기
  • 기업에서 Data를 주제로 밋업을 주관하는 경우는 많지 않은데 좋은 기회로 참여하게 되었다
  • 행사 관련 포스트
 

LinkedIn SOCAR(쏘카) 페이지: #SOCAR #쏘카 #쏘카채용

🚙 2022 SOCAR Data Meet Up Day 🚙 📢10/27(목) 쏘카 데이터 Meetup을 진행합니다. 기술과 데이터로 내일의 이동을 만들어 나가는 쏘카 데이터비즈니스본부는 약 50명의 인원으로 데이터 분석, 데이터

www.linkedin.com

DK님의 축사로 시작

개발자를 위한 행사는 많지만 데이터를 위한 행사는 많지 않았다

 

  • 내용이 좋았으면 주변에 많은 추천 부탁드립니다!
  • (이런 기회를 준비해주셔서 감사합니다!)

 

MEET-UP


시작하기

한 사람이 몇 대를 관리할까?

 

밋업의 시작은 쏘카 그룹의 데이터 그룹장님이신 DK님의 연설로 시작됐습니다.

쏘카가 데이터를 활용하는 방법을 소개하기에 앞서, 쏘카가 어떤 회사인지,

쏘카 산업 도메인에 대한 이해와 데이터 회사를 지향하는 쏘카의 이야기를 들려주셨습니다!

 

기존에는 한 사람이 50대 정도를 관리했다면 2022년 현재는 한 사람이 1000대를 관리한다

 

  • (What) 차량의 상태를 극단적으로 효율적으로 관리하고 있음
  • (How) 데이터와 AI에 기반하여 차량을 관리함

 

데이터 비즈니스 본부

쏘카 데이터 비즈니스 본부의 구성원은 어떻게 이루어져 있을까?

 

  • 50여 명 9개의 팀
  • 구성원
    • 데이터 엔지니어
    • 데이터 과학자
    • IoT 개발자
    • 등등…
  • 데이터 관련 조직으로는 국내 IT 기업 중에서도 큰 편에 속한다고 한다

 

모빌리티 산업

 

  • 교통 + IT + 스타트업이다
  • 오래된 산업인 교통 산업을 빠르게 발전하고 있는 IT로 재포장하며 스타트업이 주도하고 있다
  • 키워드는?
    • 스마트폰, IoT, O2O, AI, 최적화
  • 우버, 리프트, 그랩 등이 글로벌 스타플레이어며 국내는 쏘카, 카카오 모빌리티 등이 있다
  • 사람의 이동, 물류(택배), 음식 배달 등 생활에 밀접한 다양한 하위분야라고 할 수 있다

 

(모빌리티 산업의) 힘든 점들

 

    • 거친 간접 경쟁환경
      • 자가용, 대중교통과 경쟁해야 하는 카쉐어링
      • 따릉이와도 경쟁을 해야 한다! ← 공유 자전거
    • 곳곳에 산재한 수많은 문제
      • e.g.
        • 주차장 부족 문제, 이전 사용자의 매너 문제, 과잉정비 문제, 교통 정체 문제…

 

로켓을 띄우려면 로켓을 띄우기 전에 수많은 문제를 해결해야 하는 것처럼 어떤 문제를 해결하려면 관련된 많은 영역을 커버해야 한다

 

(모빌리티 산업의) 좋은 점들

 

  • 전동화, 자율주행
  • 새로운 모빌리티와 유연근무 등으로 완전히 다른 라이프스타일로 바뀌고 있음
    • 새로운 라이프스타일로 인해 자동차의 소유보다는 공유를 선호하는 방향으로 변하는 중

 

도전 과제

1%의 확실한 개선을 10개, 20개 쌓으면 산업을 바꿀 수 있다고 믿습니다. 쏘카는 1%의 확실한 개선을 위해 노력하고 있습니다.

 

오퍼레이션 최적화를 통한 비즈니스 운영 효율화 및 수익성 확장이 무엇보다 중요하다

 

  • 경쟁으로 인한 매우 얇은 마진 or 적자구조
  • 효율성 제고를 통한 수익 개선 - 유닛 이코노믹스 확보
  • 데이터/최적화/AI, 자동화 오퍼레이션을 통한 비즈니스 및 운영 효율화

—> 이를 해결하기 위해 쏘카는 1% 개선의 힘을 믿고 산업을 바꾸기 위해 노력한다고 한다

1%의 확실한 개선을 10개, 20개 쌓아서 산업을 바꾼다! 는 멋진 도전을 이어가고 있는 쏘카 그룹이었습니다!

 

마치며


Session 1. 데이터로 비즈니스 급속 성장 부스터 달기


Overview

  • 팀 소개
  • 데이터로부터 차량 땡처리하기
  • 다이나믹 프라이싱

 

비즈니스에 대하여

비즈니스에서 데이터가 해야 할 일은 무엇인가?

  • 실험
  • 그로스 해킹
  • 비즈니스 알고리즘
  • 등…

 

전국에 차량을 어떻게 배차해야 최적의 매출을 달성할 수 있을까?

데이터로 땡처리 하기

쏘카 슈퍼딜

  • 누구나 1일 9,900
  • 특별한 존들만 선별적으로 판매
  • 쏘카에도 땡처리가 있다

 

쏘카 서비스에서 필연적으로 발생하는 문제!

놀고 있는 차량이 발생한다

 

→ 현실, 그래서 어떤 차량이 안 팔리는 차량인데?

(해당 파트는 정확하게 기억이 나지 않습니다)

영상 또는 발표자료가 공개되면 리마인드 및 업데이트하도록 하겠습니다!

 

이상한 현상을 그대로 믿지 말자
데이터를 그대로 믿으면 속는 것과 같다!

 

슈퍼딜 결론

수기 대비 연 20억 매출 증가!

(밋업 영상이 공개되면 해당 과정을 다시 한번 리뷰해보도록 하겠습니다!)

 

다이나믹 프라이싱

 

시간, 공간에 따라 수요가 다른데 이를 가격에 반영하는 것

 

Q. 왜 가격을 다르게 하는 걸까?

A. 시기나 지역별로 매출을 극대화하는 방법이 다르기 때문이다

 

Q. 고/저 수요 존에 가격을 얼마나 더 올리고 내려야 할까?

  • 주기적으로 A/B 테스팅을 하고 있음
  • 지역에 따른 가격 탄력성을 지속적으로 파악하고 있음

 

존별로 군집을 나눈다

  • A/B 테스트 시 사용자가 아닌 존별로 군집을 나눔
  • 해당 부분은 발표자료가 공유되는 시점에 다시 확인해보려고 합니다
    • 기존 유저 그룹을 나누는 방식과 달리 SOCAR에서는 A/B테스트를 위해 군집을 존(Zone) 별로 나눴습니다
    • 보다 효과적인 것으로 확인되었습니다

 

다이나믹 프라이싱 효과

기존 가격과 수요의 미스매치 문제를 해결하기 위해 일자별 세세한 수요(가동률) 차이에 가격이 자동으로 즉각 반영되도록 다이나믹 프라이싱을 적용했습니다!

 

  • 수요와 가격의 추이가 일정해짐
  • 매출 증가로 이어짐

→ 재밌어 보인다!

 

앞으로 비즈니스 데이터팀은

  • 더 발전된 로직을 통해 만족과 회사의 매출 보전 두 마리 토끼를 잡고 싶음
  • 기존 로직의 역효과/한계를 극복하고 싶음
  • 다양한 로직/예측 모델 추가 개발을 통해 효율적인 비즈니스 운영 환경을 만들고 싶음!

 

질문

  • 보통 다이나믹 프라이싱은 공급으로 조정하는데 SOCAR의 경우, 공급을 조정하기 어려울 것 같습니다. 어떻게 프라이싱을 조정하시나요?
    • 여름에는 조금 많이 공급
  • A/B 테스트 시 사용자가 아닌 존별로 군집을 나눔

 

 

Session 2. 데이터로 비즈니스 급속 성장 부스터 달기


Overview


  • 예약 전환율
  • 부정 주유 적발

 

1. 고객가치 증대와 수익창출을 위한 wheel 만들기

  • 다른 점
    • 한정된 인벤토리를 가지고 서비스를 하고 있음
    • Offline을 고객 경험에 포함해야 함

 

모닝 사려다가 롤스로이스 사는 심리

쏘카 고객이 예약을 위해 탐색하는 옵션

  • 존 위치
  • 차종
  • 시간
  • 가격
  • 니즈…!

 

2. 기름 도둑을 잡아보자

반드시 잡힙니다

  • 기름 카드로 편의점을 가는 경우
  • 자기 차에 넣는 경우

⇒ 문제가 없으면 문제를 만들어야 한다

→ 발표를 들을수록 상당히 어려운 비즈니스 같다는 생각이 들었다

 

Session 3. 기술로 쏘카의 핵심 비즈니스 문제 해결하기


리규정 님 발표

  • 4년 전에 인턴으로 입사 현재 Value Discovery 팀 리드 중
  • 쏘카 비즈니스에서 큰 임팩트를 낼 수 있는 데이터 프로젝트를 자체적으로 발굴하고 문제 정의부터 분석, 실험, 운영까지 수행하고 있습니다
  •  

Overview


  • 예약 테트리스 프로젝트
  • 안전운전 스코어링 문제

 

1. 예약 테트리스 프로젝트

수학적 최적화를 통해 문제를 해결함

 

2. 안전운전 스코어링 문제

배경지식

  • 대여 요금
  • 면책 상품 요금 ← 추상적

면책 상품 요금

  • 인구통계학적 데이터 특성
    • 연대 책임을 물고 있음
    • e.g.
      • 연령
      • 나이가 어릴수록 사고율이 높기 때문에 나이가 어리면 보험비를 높게 받음
      • 유저를 단순하게 평가하는 방법이 됨
  • 개인의 실제 특성에 따라서 면책 상품의 가격을 정한다

 

안전운전 스코어링 모델

  • 목적
    • 쏘카가 장기간 축적해온 다양한 주행 데이터를 기반으로 유저의 개인행동 특성에서 비롯되는 사고 위험도를 평가
  • 평가 기반 가설
    • 운전자의 운전 능숙도에 따라 주행 중 정차 패턴에 차이가 있을 것
  • 사용한 피쳐 데이터
    • 한 예약의 절차 시퀀스 동안 초당 속도 변화량, 3축 가속도/각회전 속도등을 활용

→ 데이터에 기반하여 유저 개인 행동 특성에서 비롯되는 사고 위험도를 평가하기 위해 예약 기간 동안의 다양한 피쳐 데이터를 활용한 평가 모델( Scoring Model)

 

 

 

Session 4. 무려 2만 대의 차량을 AI로 관리하는 방법


  • KT(박경호 님)

 

Overview


  • 왜 쏘카가 AI를 연구하는가? → AI를 하지 않으면 살아남을 수 없다
  • Case Study
  • SOCAR AI

 

1. 왜 쏘카가 AI를 연구하는가?

  • 회사의 비전
    • 자유롭고 행복한 이동 경험
  • 많은 오퍼레이션이 필요함
    • 차량 유지. 관리
    • Operation

 

규모의 경제

늘어나는 차량 수만큼 운영 리소스가 증가한다면 규모의 경제를 달성할 수 없다

 

Case Study: 세차 자동화

SOCAR AI

  • AlphaGo
  • AlphaStar
  • AlphaFold

 

Alpha(최고) + __(Something)

Alpha + Car

 

AlphaCar

연구를 정말 열심히 하고 있구나

 

  • Business Impact
  • Academic Contribution

 

마치며

  • 마무리 굿!
  • 워크숍 발표로…!

 

 

밋업을 마치며


DK님의 마무리

 

  • 오늘은 멋진 것만 발표했지만 싸우는 시간도 많음

더 나은 서비스를 위해 많은 대화를 나누고 근본적인 문제를 해결하기 위해 많은 노력을 기울이고 있다고 생각했습니다!

 

 


 

 

개인적인 후기


데이터 분석가/사이언스분들은 정말 어려운 문제를 해결하고 계신다는 인상을 받음

  • 전반적으로 세션이 빠르게 진행되는 점이 조금 아쉬웠음
    • 시간이 조금 지연되더라도 조금은 차분한 발표를 진행했으면 어땠을까 하는 아쉬움
  • 데이터 엔지니어링 팀의 세션이 없어서 아쉬웠다
    • (네트워킹 시간에 말씀해주시길) 내년에는 데이터 엔지니어팀의 세션도 기대할 수 있다고 말씀해주셨다!

 

[네트워킹] with 데이터 엔지니어링팀


쏘카 데이터 엔지니어링 팀의 구성

  • 데이터 웨어하우스 엔지니어
  • 데이터 플랫폼 엔지니어

 

Q & A


Q1. DBT 도입 관련

  • 데이터 리니지 관련
  • 어떻게 협업하고 계신지
    • Ad-hoc 한 리퀘스트가 많이 오실 것 같은데
    • 사이언스 분들이 DAG 정도는 다 사용하심

Q2. 데이터 웨어하우스

  • 마트 쿼리 최적화는 어떻게?
  • 아직까지 성능이 안 좋진 않았다

Q3. 서빙 관련

  • GCP에서 서빙하는지?
  • 서빙은 cpu 사용
  • 온라인 인퍼런스는 아직 안 함
  • DataOps, MLOps 관련 현행

Q4. 데이터웨어하우스 외에 데이터 레이크 구성 및 관리는?

  • Ai 세션에서 차량 관리 이미지 데이터 이미 수집되어있었다고 하는데
  • 휴먼 리소스로 데이터를 전처리하는지?
  • 데이터 엔지니어링 조직에서 개발한 코드의 유닛 테스트 및 cicd는 어떻게??

Q5. 10년 된 서비스, 데이터 엔지니어링 팀의 과제는?

  • 데이터 엔지니어링팀의 KPI는 어떻게 정하는지?
    • 아쉽게도 해당 질문을 하지 못함

Q6. 서비스 특성상 일과시간에 수요가 몰릴 것 같음

  • 오토스케일링을 하는지?
  • 레이크는 따로 없음
  • MSA방식으로 관리 중
    • 히스토리 파악에 문제
    • 중도 퇴사자가 발생하기도 하고…

Q7. 데이터 거버넌스 관련

  • 어떻게 관리하고 있는지
  • 마스킹

Q8. 데이터 허브

  • 도입 전 있는 건 다 채워 넣자
  • 거버넌스 관리 중
  • 어려운 작업인 것 같음

Q9. 주니어 데이터 엔지니어 또는 데이터 엔지니어에게 바라는 점

  • 태도
    • 의견 피력 등을 강조
    • 역량. 열정. 배우려는 의지
    • 어디다 내놔도 부끄럽지 않은 사람이 돼라
    • 호기심을 넓게 가져봐라
    • 험프리 님
      • 문제 정의
      • 왜 했는지
        • 왜 문제라고 느꼈는지
        • 본질은 소프트웨어 엔지니어링
        • 그랩의 블로그
        • 본질적인 접근. 태도

Q10. 현재 주요 문제

  • 웨어하우스팀
    • 마트 테이블 구성
    • 마트 테이블 체계화
    • 분석 테이블을 더 관리하려고 함
  • 플랫폼팀
    • 전사
    • 스트리밍 모빌리티
    • 스트리밍 데이터 내재화
    • 이슈는?
    • 플랫폼팀이 하는 일
      • 플랫폼 어떻게 정의
      • 문제 정의

 

기술 문화 관련

  • 팀 간 공유가 많은 편
  • 왜 안될까
  • 데일리 때 많이 말함
  • 혼자 고민은 많이 안 하는 편
  • 파이프라인 스크립트 형상관리는 어떻게 하는지?
    • 도메인 지식 습득
  • rested data를 어떻게 플랫 하는지

 

이상으로 쏘카 데이터 밋업 2022 후기를 마무리하도록 하겠습니다!

회사 기밀이나 민감한 정보가 포함됐을 경우 추후에 삭제할 수 있도록 하겠습니다.

 

감사합니다! 좋은 주말 보내세요!

이상 Steve-Lee였습니다! 감사합니다~

댓글