[네이버웹툰] Data Engineer (경력)
Tech
NAVER WEBTOON Ltd.(경기도 성남시 분당구 분당내곡로 131 판교테크원 타워1)
Full time
2024.11.20 ~ 2024.12.15
조직 소개
네이버웹툰의 데이터 조직은 글로벌 데이터를 기반으로 혁신적인 솔루션을 개발하고 제공하는 데이터 중심의 조직입니다.
데이터 엔지니어링은 핵심 비즈니스에서 매우 중요한 역할을 하며, 대량의 데이터를 효율적으로 수집,
처리 및 분석하여 고객에게 가치를 전달하는 데 주력하고 있습니다.
Data Engineering에서는 데이터를 쉽게 가공하고 높은 안정성을 보장하는
데이터 오케스트레이션(Data Orchestration) 시스템을 개발 및 운영하고 있습니다.
재가공된 데이터의 품질을 분석하는 시스템을 개발하고 있으며 이를 통해 수집된 데이터가
기존의 기준에 부합하는지를 판단하고, 필요한 경우 즉각적으로 조치를 취할 수 있는 환경을
만들어 나가고 있습니다.
열린 소통의 문화를 지향하며, 팀원들이 자유롭게 의견을 나누고 새로운 아이디어를 제안할 수 있는 환경을 조성하고 있습니다.
직무 성격상 기술적인 도전 과제가 많지만, 이를 함께 해결해 나가며 협력하고 성장하는 것을 중요하게 생각합니다.
담당 업무
Data Orchestration System
- DBT(Data Build Tool)를 활용한 데이터 가공 파이프라인을 운영 하며 자동화와 최적화 업무를 합니다.
- 데이터 웨어하우스에 저장된 데이터에 대한 안정성 보장을 위한 pre/post 검증 모듈을 개발합니다.
- 복잡한 데이터 처리를 위한 spark job을 개발합니다.
- 데이터에 대한 메타데이터 관리를 위한 어드민 환경을 운영합니다.
- 서비스별로 운영할 수 있는 SaaS(Software as a Service) 패키지를 지원합니다.
Data Quality Management
- GX(great expectations) 기술을 활용하여 여러 데이터 소스에서 수집된 정보의 품질을 검사하고
결과를 산출하는 도구를 개발합니다.
- ELT 과정에서 발생할 수 있는 오류를 사전에 감지하여 데이터 품질 보장을 위한 대시보드를 운영합니다.
필요 역량
- 유관 업무 경력 3년 이상이신 분
- Hadoop 관련 기본 지식을 갖추고 있으며, 분산 환경에서 대용량 데이터 처리 경험이 있으신 분
- 분산 처리 엔진(Spark, Hive, Impala, Trino 등)을 활용한 데이터 처리 경험이 있으신 분
- Java / Python 언어 개발 경험과 프로그래밍 기본 지식을 가지신 분
- Airflow 운영 경험이 있으신 분
- Kubernetes 기반 개발 경험이 있으신 분
우대 사항
- 글로벌 데이터 처리 경험이 있으신 분
- Dbt, trino-hive를 활용한 ETL 경험이 있으신 분
- Spark를 활용한 대용량 데이터 처리 경험이 있으신 분
- GX(great expectations) 활용 경험이 있으신 분
- MSA(Microservice Architecture) 아키텍처 운영 경험이 있으신 분
- 성능 최적화 및 문제 해결에 즐거움을 느끼시는 분
- 데이터 분석에 관심이 많으신 분
- Vue, React 기반 Frontend 개발 경험이 있으신 분
전형 절차 및 안내 사항
- 전형절차: 지원서 리뷰 ▶ 프리 인터뷰 ▶ 실무 인터뷰(*코딩테스트 포함) ▶ Culture-Fit 인터뷰(*기업문화 적합도 검사 포함)
- 고용형태: 정규직
- 근무 장소: 정자동 그린팩토리
- 근무 형태: 월 평균 주 2회 이상 오피스 출근 or 주 5일 원격근무
* 전형 절차는 일정 및 상황에 따라 변경될 수 있습니다.
* 지원서 내용 중 허위사실이 있는 경우에는 합격이 취소될 수 있습니다.
* 국가유공자 및 장애인 등 취업보호대상자는 관계법령에 따라 우대합니다.
* 문의사항은 "네이버웹툰 채용 홈페이지 > 1:1 문의"로 접수해주시기 바랍니다.