logo
logo
https://groupby-public-image.s3.ap-northeast-2.amazonaws.com/startups/1621/1763080549/스크린샷 2025-11-14 093520.png
페이스웹AI·CLOUD 기반의 글로벌 원격 진료 플랫폼을 개발/운영합니다.
서울 서초구AI ‧ 클라우드
의료 도메인 LLM SLM 개발 엔지니어 (인턴)
빠른 응답
포지션대표인공지능 · 머신러닝, 데이터 엔지니어, 풀스택, 정보보안
경력 구분인턴 (정규직 전환 고려)
기간3개월
특이사항사수 있음, 원격근무 없음
스킬
LLM
주요업무

지원자는 LinkBee가 보유한 의료 '실전 데이터'를 기반으로 오픈소스 모델(Llama-3, Mistral 등)을 파인튜닝(Fine-tuning)하여, 범용 모델이 처리하지 못하는 '도메인 특화 문맥 보정'과 '전문 용어 인식'을 수행할 수 있는 AI 모델링 역량이 필수적임. 또한, 연구 목적을 넘어 저지연(Low-latency) 및 온디바이스 환경에서 구동 가능한 경량화 및 배포 엔지니어링 능력 및 연구 역량을 겸비해야함


품질 혁신: 범용 API가 해결하지 못하는 고유 명사 및 전문 용어에 대한 인식률과 문맥 이해도를 획기적으로 개선.


비용 효율화: 고비용의 상용 LLM API 의존도를 낮추고, 최적화된 자체 모델 운용을 통해 트래픽 증가에 따른 비용 리스크 해소.


데이터 자산화: 실전 데이터를 지속적으로 학습 모델에 반영하여, 서비스가 운영될수록 지능이 고도화되는 선순환 기술 구조 확립.

자격요건

A.

SLM 모델링 및 최적화 (Core AI)오픈소스 LLM/SLM 활용: Llama-3, Mistral, Gemma 등 최신 소형 언어 모델(SLM)의 아키텍처 이해 및 핸들링 능력.

Fine-tuning (미세 조정): LoRA, QLoRA 등 효율적인 파인튜닝(PEFT) 기법을 활용한 자체 데이터 학습 경험.

STT 오인식 문장에 대한 후처리(Post-processing) 및 문맥 기반 교정 모델 개발 경험.

RAG (검색 증강 생성) 구현: Vector DB(Pinecone, Milvus 등) 연동을 통해 모델이 학습하지 않은 최신/내부 정보를 참조하여 답변 정확도를 높이는 기술 구현.


B.

데이터 엔지니어링 (Data Engineering)Instruction Dataset 구축: 서비스 내 발생하는 비정형 텍스트 데이터를 모델 학습용 포맷(Instruction/Input/Output)으로 전처리 및 가공.

Data Augmentation(증강)을 통한 학습 데이터셋 품질 확보.

Tokenizer 최적화: 한국어 및 특정 도메인(현장 용어, 약어 등) 처리를 위한 토크나이저 확장 및 임베딩 최적화 경험.


C.

시스템 연동 및 배포 (MLOps & Engineering)모델 경량화 (Quantization):

Inference 비용 절감 및 속도 향상을 위한 모델 양자화(Quantization, FP16 → INT8/INT4) 수행 (GGUF, AWQ 활용).

Inference Pipeline 구축: ONNX, TensorRT, vLLM 등을 활용한 고성능 서빙 환경 구축.

Whisper (STT)의 스트리밍 출력값을 실시간으로 받아 SLM이 즉시 처리하도록 파이프라인 설계 및 API 연동.

우대사항

관련 전공, 연구경험, 스타트업경험,

채용절차

서류전형> 1차면접 >2차면접 >최종합격

근무지
서울 서초구 서초대로 397 (서초동, 부띠크 모나코) 1310호 (서울, 서초구)
logo
(주)그룹바이HR | 서울특별시 영등포구 영등포로 150 C동 908호대표 : 임진하 / 박상민사업자등록 : 333-88-02226유료직업소개업 등록번호 : 제 2005-3180270-14-5-00019호직업정보제공사업 신고번호 : J1200020230023문의 : hello_world@groupby.biz | 070-8018-7502 (평일 오전 10시 ~ 오후 6시)
instagramkakaotalkyoutube