1. Computer Vision 또는 Deep Learning 분야 실무/연구 경력 3년 이상.
2. Vision-Language Model (VLM) 연구/개발 및 상용화 프로젝트 경험 (파인튜닝/모듈 결합 포함).
3. VLM 모델의 내부 동작 원리 및 Document Understanding 구조에 대한 깊은 이해를 바탕으로, 기존 모델 구조의 성능을 극한으로 고도화해 본 경험이 있는 분.
4. Deep Learning 프레임워크 (PyTorch) 능숙자, 대규모 이미지/텍스트 데이터 기반 모델링 경험.
5. Vision Transformer(ViT), CNN, VLM 구조에 대한 깊은 이해를 보유하신 분.