[포지션 상세]
큐픽스는 360도 영상으로부터 4D Digital Twin을 생성하는 기술을 바탕으로 CupixWorks 서비스를 글로벌하게 제공합니다. 건설, 석유 및 가스, 제조업, 공공기관 등의 다양한 산업의 수천개의 글로벌 기업들이 큐픽스를 통해 대규모 현장을 디지털화하고 있습니다.
[Backend Unit 소개]
Backend Unit 은 Infrastructure, Reliability, Application 3개 Part로 구성되어 있으며, AWS 기반의 클라우드 인프라를 바탕으로 큐픽스의 모든 제품과 서비스를 지탱하는 핵심 조직입니다.
Infrastructure 파트는 클라우드 및 온프레미스 환경의 인프라와 데이터레이크·데이터웨어하우스를 설계, 구축, 운영합니다. IaC 기반 인프라 관리, CI/CD 파이프라인, 모니터링/로깅, 보안 및 네트워크 설계를 수행하고, 데이터 파이프라인을 통해 서비스 데이터의 수집·가공·분석 환경을 제공합니다. 이를 통해 글로벌 서비스의 안정적인 운영과 확장을 뒷받침하는 인프라와 데이터 기반을 만들어 갑니다.
[큐픽스 Backend Unit에 합류하신다면]
- 대한민국에서 개발되어 전 세계로 배포되는 글로벌 B2B SaaS를 직접 경험할 수 있습니다
- 다양한 산업 분야의 4D Digital Twin 사례를 가장 빠르게 접하고, 최신 기술을 통해 문제를 해결합니다
- AI 도구(Claude Code 등)를 적극 활용하여 생산성을 극대화하는 개발 문화를 경험합니다
- 외부 교육 및 컨퍼런스 참가를 지원받으며 지속적으로 성장할 수 있습니다
[데브옵스 엔지니어]
Infrastructure 파트 엔지니어는 큐픽스의 글로벌 서비스를 뒷받침하는 클라우드·온프레미스 인프라와 데이터 플랫폼을 설계, 구축, 운영합니다. IaC 기반의 인프라 관리, CI/CD 파이프라인 자동화, Observability 체계 구축, 그리고 데이터 파이프라인을 통한 수집·가공·분석 환경 제공까지 담당합니다
주요 기술 스택: AWS, GCP, Azure, Terraform, CloudFormation, Snowflake, Bigquery, Elasticsearch
[주요 업무]
1. 클라우드 인프라 설계 및 운영
- AWS 기반 아키텍처 고도화: AWS(ECS, SQS 등)를 활용하여 글로벌 서비스에 최적화된 고가용성 인프라를 설계하고 운영합니다.
- IaC(Infrastructure as Code): Terraform, CloudFormation 등을 활용하여 인프라를 코드로 관리하고 운영 효율성을 극대화합니다.
- 비용 및 성능 최적화: 리소스 사용량을 분석하여 비용 효율적인 인프라 운영 전략을 수립하고 실행합니다.
2. CI/CD 및 배포 자동화 (GitOps)
- 배포 파이프라인 구축: GitHub Actions 등을 활용하여 빌드-테스트-배포 전 과정을 자동화합니다.
- GitOps 체계 확립: 선언적 배포 방식을 통해 서비스 릴리즈의 안정성과 투명성을 확보합니다.
3. 온프레미스 인프라 구축 및 운영
- 온프레미스 환경 설계: 클라우드 기반 서비스를 격리된 네트워크 환경에서도 동일하게 운영할 수 있도록 온프레미스 아키텍처를 설계하고 구축합니다.
- 온프레미스 배포 자동화: 온프레미스 환경에 맞는 배포 파이프라인을 구축하고 운영합니다.
- 온프레미스 운영: 온프레미스 환경의 모니터링/로깅 체계를 구축하고, 안정적인 서비스 운영을 위한 가시성을 확보합니다.
4. 데이터 엔지니어링
- 데이터 파이프라인 구축: Snowflake, BigQuery 등을 활용하여 서비스 데이터의 수집·가공·적재(ETL/ELT) 파이프라인을 설계하고 운영합니다.
- 데이터 웨어하우스/레이크 운영: 분석 및 리포팅에 활용할 수 있는 데이터 웨어하우스와 데이터레이크를 구축하고 관리합니다.
- 데이터 거버넌스: 데이터 품질 관리, 접근 제어, 메타데이터 관리를 통해 신뢰할 수 있는 데이터 환경을 유지합니다.
5. Observability 및 장애 대응 (SRE)
- 모니터링 체계 구축: Prometheus, Grafana, ELK Stack 등을 활용해 인프라와 애플리케이션의 가시성을 확보합니다.
- SLI/SLO 관리: 서비스 핵심 지표를 정의하고, 장애 발생 시 신속한 복구(MTTR 단축)를 위한 인시던트 리스폰스(IR) 프로세스를 주도합니다.
- RCA(근본 원인 분석): 장애 사후 분석을 통해 구조적인 결함을 개선하고 재발 방지책을 마련합니다.
운영 및 온콜 체계
- 온콜 시스템: Level 1(초기 대응), Level 2(심화 대응)로 구분된 체계적인 온콜 운영
- 협업 구조: Infrastructure Part와 협업하여 안정적인 서비스 운영 (인프라 구축은 Infrastructure Part 담당)
- 글로벌 운영: 전 세계 고객을 대상으로 하는 24/7 서비스 경험
기술적 챌린지
- 글로벌 스케일: 전 세계 수천 개 기업이 사용하는 서비스의 안정성과 성능 최적화
- AI 통합: LLM을 활용한 차세대 Digital Twin 분석 기능 개발
- 대용량 처리: 수백만 장의 360도 이미지 처리 및 메타데이터 관리
- 실시간 협업: 글로벌 팀원들과 함께하는 현장 데이터 실시간 분석