logo
logo
https://groupby-public-image.s3.ap-northeast-2.amazonaws.com/startups/1741/1767858826/스크린샷 2026-01-08 165336.png
엘리스그룹배우고, 만들고, 실행까지 AI는 엘리스에서 인프라・클라우드・플랫폼을 잇는 End-to-End AI 솔루션
서울 강남구AI
인프라 SRE 엔지니어
포지션네트워크 엔지니어
경력 구분무관
특이사항원격근무 없음
스킬
Python
Kubernetes
Linux
주요업무
  • SLI/SLO 기반 신뢰성 운영
  • 서비스의 핵심 지표(Latency, Error Rate 등)를 정의하고 SLO 달성을 위한 운영 전략 및 프로세스 설계
  • Observability 스택 운영
  • Prometheus, Grafana, ELK 등 모니터링, 알림, 로그 플랫폼을 구축하고 지속적으로 최적화
  • 장애 대응 체계 및 Incident Response 리딩
  • 서비스 장애 발생 시 신속한 복구(MTTR 단축)를 위한 대응 프로세스(IR) 주도 및 개선
  • RCA 및 구조적 개선
  • 발생한 장애의 근본 원인을 철저히 분석하고, 시스템 아키텍처, 배포 파이프라인 등 구조적 결함에 대한 개선 사항을 도출 및 적용
  • 운영 자동화 및 효율화
  • 반복적인 수동 업무(Toil)를 식별하고, 스크립팅 및 IaC(Infrastructure as Code)를 활용하여 자동화 및 제거


자격요건
  • Linux 시스템, Kubernetes 클러스터, 네트워크(TCP/IP)에 대한 깊은 기본 지식 및 운영 경험
  • 모니터링, 알림, 로그 플랫폼 등 Observability 스택 구축 또는 운영 경험
  • Python 또는 Shell 등 스크립팅 언어를 활용한 시스템 운영 및 자동화 경험
  • 서비스 장애 발생 시 침착하게 원인을 분석하고 대응할 수 있는 문제 해결 능력


우대사항
  • Prometheus, Grafana, ELK/Loki 등 오픈소스 Observability 스택 심층 운영 경험이 있으신 분
  • GitOps 또는 CI/CD 파이프라인을 활용한 배포 안정성 개선 경험을 하신 분
  • Chaos Engineering 도입 또는 실행 경험이 있으신 분
  • 클라우드 환경(AWS, Azure, GCP) 기반 인프라 운영을 경험하신 분


채용절차

1 서류 전형

후보자의 경력과 엘리스에서 필요로 하는 역량을 매칭하는 첫번째 단계입니다.


2 인터뷰

직무 경험에 대한 심도 있는 대화를 진행하며, 후보자가 일하는 방식과 엘리스의 문화를 비교합니다.


3 미니 프로젝트

실제로 담당하게 될 업무와 유사한 과제를 수행해 봄으로써 직무 적합성을 판단합니다.


4 평판 조회

과거에 함께 일한 동료와 매니저가 자신을 어떻게 평가하는지 공유합니다.


5 입사 조건 협의

처우와 입사일 등의 조건을 최종 협의하며, 엘리스에 합류하기 위한 마지막 단계입니다.


6 최종 합격

"Hello, New Elicer!" 엘리스에 오신 것을 진심으로 환영합니다!🎉

근무지
서울특별시 강남구 테헤란로 418 스파크플러스 13층 (서울, 강남구)
logo
(주)그룹바이HR | 서울특별시 영등포구 영등포로 150 C동 908호대표 : 임진하 / 박상민사업자등록 : 333-88-02226유료직업소개업 등록번호 : 제 2005-3180270-14-5-00019호직업정보제공사업 신고번호 : J1200020230023문의 : hello_world@groupby.biz | 070-8018-7502 (평일 오전 10시 ~ 오후 6시)
instagramkakaotalkyoutube