박나은 Naeun Park

📧 helloworld970511@naver.com 📧 otlmylife970511@gmail.com 🔗linkedin.com/in/nepark97 💻 github.com/world970511

대용량 데이터 처리와 ML 모델 서빙 최적화, 그리고 이를 뒷받침하는 데이터 인프라 구축에 강점을 가진 소프트웨어 엔지니어입니다.
OCR 기반 서비스 기업에서 40만 건 이상의 이미지 데이터를 다루며, 데이터 수집·정제·검수·배포까지의 전 과정을 하나의 파이프라인으로 설계·운영했습니다. 단순히 데이터를 처리하는 수준을 넘어, 중복 제거·합성 데이터 생성·자동 GT 생성·데이터 QA 체계화 등의 작업을 통해 모델 학습용 데이터 품질을 구조적으로 끌어올렸습니다. 또한 Django/DRF와 Celery, Meilisearch, Docker를 활용해 사내 데이터 관리 플랫폼을 설계·구현하여, 비개발 인력도 안정적으로 대규모 데이터를 업로드/조회/활용할 수 있는 환경을 구축했습니다. 최근에는 RAG, 벡터 검색, 에이전트 등 LLM을 활용한 데이터 인프라에 관심을 두고, 실제 관련 기술을 활용한 토이프로젝트 진행하며 데이터 엔지니어링과 AI 애플리케이션 영역을 확장하고 있습니다.

Software Engineer specializing in large-scale data processing, ML model serving optimization, and the underlying data infrastructure.
At an OCR-based service company, I managed over 400,000 image data entries, designing and operating a unified pipeline that covers the entire process from data collection, cleaning, and verification to distribution. Beyond simple data processing, I structurally improved model training data quality through duplicate removal, synthetic data generation, automated GT creation, and systematized data QA. Additionally, I designed and implemented an in-house data management platform using Django/DRF, Celery, Meilisearch, and Docker, establishing an environment where non-developers could stably upload, query, and utilize large-scale data. Recently, I have been focusing on data infrastructure utilizing LLMs—such as RAG, vector search, and agents—and am expanding my expertise in data engineering and AI applications by conducting toy projects using these technologies.

💼 경력사항 💼 Experience

포지큐브 POSICUBE

2022.08 - 2025.08 2022.08 - 2025.08
Software Engineer (Data Engineering Focus) Software Engineer (Data Engineering Focus)

Vision AI 학습 데이터 파이프라인 고도화 Enhancement of Vision AI Training Data Pipeline

대규모 Vision AI/OCR 데이터셋 구축 및 품질 관리 Large-scale AI Dataset Construction & Quality Assurance

사내 대용량 데이터 관리 플랫폼 개발 Internal Data Management Platform Development

🛠 기술 스택 🛠 Technical Skills

Backend

Python Django/DRF FastAPI Celery

Frontend

React Redux JavaScript HTML/CSS

Data & AI

Pandas/Numpy TensorFlow Keras 데이터 파이프라인

Infrastructure & Tools

Docker Redis Git/GitHub Airflow GCP AWS

🎓 학력 🎓 Education

한국방송통신대학교 Korea National Open University

2025.03 - 2027.02 (예정) 2025.03 - 2027.01 (Expected)
컴퓨터과학과 학사과정 편입, 현재 재학 중 Bachelor of Computer Science

성공회대학교 Sungkonghoe University

2017.03 - 2022.08
글로컬IT 전공, 소프트웨어학과 부전공 학사 졸업 Bachelor in Glocal IT, Minor in Software

👨‍💻 교육 & 활동 👨‍💻 Training & Activities

  • 서울 우먼잇츠 × 구글 스터디잼 - 'Gemini × GCP: 생성형 AI 기반 웹서비스 만들기' 스터디 참여 (2025.08 ~ 2025.10)
    GCP와 Gemini API를 활용한 웹서비스 아키텍처 설계 및 배포 흐름을 학습하며, LLM 기반 서비스 구현 경험을 확장했습니다.
    Seoul Women IT's × Google Study Jams - 'Gemini × GCP: Building Generative AI-based Web Services' Study (2025.08 ~ 2025.10)
    Learned how to design and deploy web service architectures using GCP and Gemini API, extending my hands-on experience with LLM-based applications.
  • 서울 우먼잇츠 × 우아한스터디 - '오픈소스 기여 걸음마 떼기' 스터디 참여, Airflow 관련 스터디 진행 (2024.06 ~ 2024.07)
    Apache Airflow의 기본 개념과 DAG 설계를 학습하고, 간단한 ETL 파이프라인을 직접 구성해 보며 데이터 워크플로우 오케스트레이션에 대한 이해를 높였습니다.
    Seoul Women IT's × Woowahan Study - 'First Steps in Open Source Contribution' Study, Airflow Focus (2024.06 ~ 2024.07)
    Studied Apache Airflow concepts and DAG design, building simple ETL pipelines to deepen understanding of data workflow orchestration.
  • 실리콘밸리에서 날아온 데이터 엔지니어링 스타터 키트 with Python - ETL, SQL 및 Airflow 학습 (2023.01 ~ 2023.02) Data Engineering Starter Kit from Silicon Valley with Python - Learned ETL, SQL, and Airflow (2023.01 ~ 2023.02)
  • 앨리스 AI 트랙 3기 - AI 서비스 기획 및 풀스택 개발(flask, react) 교육 과정 수료 (2021.09 ~ 2022.03) Elice AI Track 3rd - Completed a curriculum on AI service planning and full-stack development (Flask, React) (2021.09 ~ 2022.03)
  • 데이터 청년 캠퍼스 - 빅리더 아카데미 과정 수료, 머신러닝 및 딥러닝 이론 학습, 국립공원공단 협업 프로젝트 진행 (2021.06 ~ 2021.09) Data Youth Campus - Completed Big Leader Academy, studied ML/DL theory, and conducted a collaboration project with Korea National Park Service (2021.06 ~ 2021.09)

🏆 수상 및 자격증 🏆 Awards & Certifications

  • 최우수상 - 창원시, AI와 디지털트윈 기술을 활용한 맞춤형 등산 코스 추천 및 SNS 서비스 (2021.08) Excellence Prize - Hiking Course Recommendation and SNS Service using AI and Digital Twin Technology (Changwon City, 2021.08)
  • 공로상 - 국립공원공단, AI와 디지털트윈 기술을 활용한 맞춤형 등산 코스 추천 및 SNS 서비스 (2021.09) Achievement Award - Hiking Course Recommendation and SNS Service using AI and Digital Twin Technology (Korea National Park Service, 2021.09)
  • 정보처리기사 (2022.06) Engineer Information Processing (HRD Korea, 2022.06)
  • OPIc IM2 (2024.10) - 영문 기술 문서 독해 및 기본적인 업무 소통 가능 OPIc IM2 (2024.10) - Capable of reading technical documents and basic business communication in English