ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 자연어 처리 엔지니어의 역량
    BIG DATA & AI/NLP 2021. 5. 24. 20:19
    반응형

    자연어 처리 전문가가 되려면 어떤 역량이 필요할까? 모집 공고 트렌드를 분석해 보았다.

    [Papago] 파파고 머신러닝(자연어처리) 체험형 인턴 모집

    ■ Machine Learning Scientist : 자연어처리 [체험형 인턴] 

      [역할]

    · Natural Language Processing을 과학적, 심층적으로 연구

    · Multilingual NLP의 최신 연구 재구현 및 개선
    - Machine translation
    - Quality estimation
    - Multilingual sentence representation learning
    - Inspecting and analyzing NLP models(language models, translation models)
    - Solving NLP problems with additional image or speech data
    - Evaluation methods (translation quality, fluency of sentence..)

      [자격요건]

    · Multilingual NLP를 다뤄보신 분

    · 스스로 문제를 정의하고 해결하기 위한 모델링이 가능하신 분

    · 최신 머신러닝 알고리즘과 관련 기술에 대한 이해를 가지신 분

    · 주요 머신러닝 프레임워크에 대한 이해가 깊으신 분(ex. TensorFlow, PyTorch)

    · 영어 논문을 빠르게 읽고 이해하는 데 어려움이 없으신 분

    · 뛰어난 의사소통 능력을 갖추신 분

      [우대사항]

    · Sequence labeling, text segmentation에 대한 경험이 있으신 분

    · Machine translation 또는 sequence generation에 대한 경험이 있으신 분

    · Statistical data analysis / data mining에 대한 경험이 있으신 분

    · Kaggle 등 머신러닝 관련 대회에서 좋은 성과를 거두거나 국제 학술대회에 논문을 게재하신 분

    · 위 연구에 대해 논문화에 관심이 있으신 분

      [채용하고 싶은 사람]

    · 모든 일을 본격적으로 시작하기 전 베이스라인부터 만들고 평가지표부터 세우시는 분

    · 문제를 직접 정의하는 것을 좋아하고 끈질기게 해결하는 분

    · 높은 퀄리티의 delivery에 욕심이 많으신 분

    · 항상 배우는 자세로 동료들과 즐겁게 일하실 수 있는 분

    · 멋진 작업물을 동료들과 공유하는 것을 좋아하시는 분

    Papago Machine Learning Scientist : Natural Language Processing (NLP) 

    • 이런 일을 맡고 있어요
    • 파파고는 2016년부터 기계번역 서비스를 시행한 조직으로, 단순히 연구를 하는데 그치지 않고 우리가 만든 기술을 실제 서비스에 적용해서 사용자의 만족도를 높이는 경험을 할 수 있습니다.
      함께 언어의 장벽을 같이 허물어보고 싶으신 분이 있으면 "지원하기" 버튼을 클릭해주세요!
      파파고의 NLP 머신러닝 과학자들은 파파고 기계번역팀에 속해 자연어처리를 위한 각종 머신러닝 모델을 만듭니다.
      보통 다음과 같은 문제를 해결합니다.
      - 어떤 자연어처리 기법들이 파파고 서비스(기계번역)의 품질 향상에 도움을 줄까?
      - 데이터가 없거나 부족한 경우, 기계번역의 품질을 높이는 방법은 뭘까?
    • 입사하게 되면 담당할 업무입니다
    • 머신러닝 기술을 빠르게 프로토타이핑하고 학습
    • 머신러닝 모델이 서비스 상에서 대용량의 요청을 빠르게 처리할 수 있도록 최적화
    • 자연어를 과학적으로 탐구하고 심층적으로 연구
    • 업무를 수행하기 위해 필요한 자격 요건입니다
    • 스스로 문제를 정의하고 해결하기 위한 모델링이 가능한 분
    • 최신 머신러닝 알고리즘과 관련 기술에 대한 이해를 가진 분
    • 주요 머신러닝 프레임워크에 대한 이해가 깊은 분 (ex: TensorFlow, PyTorch)
    • Python, C++ 등의 프로그래밍 언어를 1개 이상 자유자재로 다루고 Linux/Shell 환경에 익숙하신 분
    • 영문 논문을 빠르게 읽고 이해하는 데 어려움이 없으신 분
    • 뛰어난 의사소통 능력을 가진 분
    • 추가로 보유하고 있다면 좋을 스킬셋이나 경험입니다
    • Multilingual NLP를 다뤄보신 분
    • Quality estimation, sequence labeling, text segmentation에 대한 경험이 있는 분
    • Machine translation 또는 sequence generation에 대한 경험이 있는 분
    • Signal, image, text 등 다양한 modality를 다뤄보신 분
    • Statistical data analysis / data mining에 대한 경험이 있는 분
    • ML/NLP 관련 상용 프로덕트를 개발한 경험을 가진 분
    • On-device ML에 대한 경험이 있는 분
    • Kaggle 등 머신러닝 관련 대회에서 좋은 성과를 거두거나 국제학술대회에 논문을 게재하신 분

     

    Clova Vision/NLP 데이터 관련 Data scientist 

    • 이런 일을 맡고 있어요
    • 네이버 클로바에서 Vision 및 NLP 모델을 생성하기 위한 데이터 처리하는 팀입니다.
      - 네이버 안에 서비스 되고 있는 다양한 데이터를 다룰 수 있으며, 이를 기반으로 인공지능 모델을 만드는데 기여
      - 데이터를 시각화 하고 분석하는 역할 담당
      - 데이터(영상, 텍스트, 비디오)를 다루기 위한 툴 개발
      - 대용량 데이터 필터링 등의 엔지니어링 작업을 수행
    • 입사하게 되면 담당할 업무입니다
    • ML 모델 개발을 위한 데이터를 수집, 가공하는 역할
    • 데이터 수집, 큐레이션, 시각화, 분석 등의 역할을 수행
    • 데이터 관련 툴 및 ML 엔지니어링 기술 개발
    • 업무를 수행하기 위해 필요한 자격 요건입니다
    • 프로그램 설계 디버깅, 자료구조, 알고리즘에 대한 넓은 이해가 가능하신 분
    • 비즈니스나 데이터에 기반한 문제해결에 익숙하신 분
    • Web기반 어플리케이션 개발 경험
    • Python을 사용한 소프트웨어 개발 경험
    • 추가로 보유하고 있다면 좋을 스킬셋이나 경험입니다
    • MLOps 관련 지식 및 관련 OSS (MLflow, BentoML, Kubeflow 등)의 사용 경험
    • Hadoop 및 Hadoop eco-system (Spark, Hive, Zookeeper, Kafka 등) 관련 지식 및 사용 경험
    • 대량의 데이터를 수집, 정제하여 머신 러닝에 활용한 경험

    [빅데이터플랫폼] 데이터 엔지니어

    담당할 업무

    [고객데이터플랫폼]

    · Flink/StreamSets 기반의 실시간 스트리밍 파이프라인 개발

    · 모던 데이터 아키텍처 기반의 이벤트/데이터 모델링

    · 데이터 전처리 및 검증 프로세스 개발

    필수 경험과 역량

    · 자료구조, 알고리즘, OS, 데이터베이스 등 기초 전산 지식이 있는 분

    · SQL, Airflow, Hadoop, Kafka, Flink 등을 사용한 대용량 데이터 처리에 능숙한 분

    · Java, Kotlin, Python 중 하나 이상의 언어에 익숙한 분

    · 총 경력이 3년 이상인 분

    우대사항 

    · Hadoop EcoSystem 기반의 다양한 솔루션 활용 경험이 있는 분

    · 은행 DW 업무 도메인을 잘 이해하고 있고 마트 개발 경험이 있는 분

    · MySql, Oracle 의 CDC 경험이 있는 분

    · 실시간 데이터 스트리밍 처리에 경험이 있고 익숙한 분 

     

    반응형

    댓글

Written by Emily.