ㅇ 데이터 아키텍처 및 플랫폼 총괄
• 데이터 플랫폼(크롤링 ETL Data Lake Data Warehouse Data Mart)의 전체 구조 설계 및 고도화
• AWS 기반 데이터 인프라 구성/운영 (S3, EC2, Lambda, ECS, CloudWatch 등)
• 데이터 저장 포맷, 파티셔닝 전략, 인덱싱 정책, 스키마 표준 등 **데이터 엔지니어링 규칙 수립**
ㅇ 대용량 데이터 파이프라인 설계·개발·운영
• Airflow 기반 배치/스트리밍 파이프라인 설계 및 DAG 개발
• 크롤러팀과 협업하여 수집 정제 변환 파이프라인 전반을 관리
• ClickHouse, PostgreSQL 등 적재 스토리지의 성능 최적화 및 운영
• 장애 자동 복구, 재시도 전략, 모니터링 체계 설계
ㅇ 데이터 품질 및 신뢰성 관리
• 데이터 검증 체계 구축 (Null/이상값 탐지, 중복 관리, 스키마 Drift 감지)
• 데이터 신뢰성 확보를 위한 SLA/SLO 설정 및 품질 리포트 작성
• 서비스/BI 팀 요구사항을 위한 데이터 품질 개선 프로세스 운영
ㅇ데이터 품질 및 신뢰성 관리
• 데이터 검증 체계 구축 (Null/이상값 탐지, 중복 관리, 스키마 Drift 감지)
• 데이터 신뢰성 확보를 위한 SLA/SLO 설정 및 품질 리포트 작성
• 서비스/BI 팀 요구사항을 위한 데이터 품질 개선 프로세스 운영
ㅇ팀 리딩 및 협업 구조 구축
• 데이터 엔지니어(ETL/파이프라인), 크롤러 엔지니어와의 유기적 협업 체계 구축
• 우선순위 정리, 업무 분배, 코드 리뷰 및 기술 가이드 제공
• 서비스 개발팀 및 BI/분석 팀과 협업하여 데이터 요구사항 명확화
• DSL 전체 데이터 인프라의 로드맵 수립 및 실행
ㅇ성능·비용 최적화
• AWS 비용 최적화 전략 수립 (S3 Storage Class, EC2 타입, 파티셔닝 전략 등)
• 쿼리 성능 개선 및 ClickHouse 최적화
• 장애/성능 이슈 분석 및 지속적 개선