-
자연어 처리 엔지니어의 역량BIG DATA & AI/NLP 2021. 5. 24. 20:19반응형
자연어 처리 전문가가 되려면 어떤 역량이 필요할까? 모집 공고 트렌드를 분석해 보았다.
[Papago] 파파고 머신러닝(자연어처리) 체험형 인턴 모집
■ Machine Learning Scientist : 자연어처리 [체험형 인턴]
[역할]
· Natural Language Processing을 과학적, 심층적으로 연구
· Multilingual NLP의 최신 연구 재구현 및 개선
- Machine translation
- Quality estimation
- Multilingual sentence representation learning
- Inspecting and analyzing NLP models(language models, translation models)
- Solving NLP problems with additional image or speech data
- Evaluation methods (translation quality, fluency of sentence..)[자격요건]
· Multilingual NLP를 다뤄보신 분
· 스스로 문제를 정의하고 해결하기 위한 모델링이 가능하신 분
· 최신 머신러닝 알고리즘과 관련 기술에 대한 이해를 가지신 분
· 주요 머신러닝 프레임워크에 대한 이해가 깊으신 분(ex. TensorFlow, PyTorch)
· 영어 논문을 빠르게 읽고 이해하는 데 어려움이 없으신 분
· 뛰어난 의사소통 능력을 갖추신 분
[우대사항]
· Sequence labeling, text segmentation에 대한 경험이 있으신 분
· Machine translation 또는 sequence generation에 대한 경험이 있으신 분
· Statistical data analysis / data mining에 대한 경험이 있으신 분
· Kaggle 등 머신러닝 관련 대회에서 좋은 성과를 거두거나 국제 학술대회에 논문을 게재하신 분
· 위 연구에 대해 논문화에 관심이 있으신 분
[채용하고 싶은 사람]
· 모든 일을 본격적으로 시작하기 전 베이스라인부터 만들고 평가지표부터 세우시는 분
· 문제를 직접 정의하는 것을 좋아하고 끈질기게 해결하는 분
· 높은 퀄리티의 delivery에 욕심이 많으신 분
· 항상 배우는 자세로 동료들과 즐겁게 일하실 수 있는 분
· 멋진 작업물을 동료들과 공유하는 것을 좋아하시는 분
Papago Machine Learning Scientist : Natural Language Processing (NLP) ▼
- 이런 일을 맡고 있어요
- 파파고는 2016년부터 기계번역 서비스를 시행한 조직으로, 단순히 연구를 하는데 그치지 않고 우리가 만든 기술을 실제 서비스에 적용해서 사용자의 만족도를 높이는 경험을 할 수 있습니다.
함께 언어의 장벽을 같이 허물어보고 싶으신 분이 있으면 "지원하기" 버튼을 클릭해주세요!
파파고의 NLP 머신러닝 과학자들은 파파고 기계번역팀에 속해 자연어처리를 위한 각종 머신러닝 모델을 만듭니다.
보통 다음과 같은 문제를 해결합니다.
- 어떤 자연어처리 기법들이 파파고 서비스(기계번역)의 품질 향상에 도움을 줄까?
- 데이터가 없거나 부족한 경우, 기계번역의 품질을 높이는 방법은 뭘까?
- 입사하게 되면 담당할 업무입니다
- 머신러닝 기술을 빠르게 프로토타이핑하고 학습
- 머신러닝 모델이 서비스 상에서 대용량의 요청을 빠르게 처리할 수 있도록 최적화
- 자연어를 과학적으로 탐구하고 심층적으로 연구
- 업무를 수행하기 위해 필요한 자격 요건입니다
- 스스로 문제를 정의하고 해결하기 위한 모델링이 가능한 분
- 최신 머신러닝 알고리즘과 관련 기술에 대한 이해를 가진 분
- 주요 머신러닝 프레임워크에 대한 이해가 깊은 분 (ex: TensorFlow, PyTorch)
- Python, C++ 등의 프로그래밍 언어를 1개 이상 자유자재로 다루고 Linux/Shell 환경에 익숙하신 분
- 영문 논문을 빠르게 읽고 이해하는 데 어려움이 없으신 분
- 뛰어난 의사소통 능력을 가진 분
- 추가로 보유하고 있다면 좋을 스킬셋이나 경험입니다
- Multilingual NLP를 다뤄보신 분
- Quality estimation, sequence labeling, text segmentation에 대한 경험이 있는 분
- Machine translation 또는 sequence generation에 대한 경험이 있는 분
- Signal, image, text 등 다양한 modality를 다뤄보신 분
- Statistical data analysis / data mining에 대한 경험이 있는 분
- ML/NLP 관련 상용 프로덕트를 개발한 경험을 가진 분
- On-device ML에 대한 경험이 있는 분
- Kaggle 등 머신러닝 관련 대회에서 좋은 성과를 거두거나 국제학술대회에 논문을 게재하신 분
Clova Vision/NLP 데이터 관련 Data scientist ▼
- 이런 일을 맡고 있어요
- 네이버 클로바에서 Vision 및 NLP 모델을 생성하기 위한 데이터 처리하는 팀입니다.
- 네이버 안에 서비스 되고 있는 다양한 데이터를 다룰 수 있으며, 이를 기반으로 인공지능 모델을 만드는데 기여
- 데이터를 시각화 하고 분석하는 역할 담당
- 데이터(영상, 텍스트, 비디오)를 다루기 위한 툴 개발
- 대용량 데이터 필터링 등의 엔지니어링 작업을 수행
- 입사하게 되면 담당할 업무입니다
- ML 모델 개발을 위한 데이터를 수집, 가공하는 역할
- 데이터 수집, 큐레이션, 시각화, 분석 등의 역할을 수행
- 데이터 관련 툴 및 ML 엔지니어링 기술 개발
- 업무를 수행하기 위해 필요한 자격 요건입니다
- 프로그램 설계 디버깅, 자료구조, 알고리즘에 대한 넓은 이해가 가능하신 분
- 비즈니스나 데이터에 기반한 문제해결에 익숙하신 분
- Web기반 어플리케이션 개발 경험
- Python을 사용한 소프트웨어 개발 경험
- 추가로 보유하고 있다면 좋을 스킬셋이나 경험입니다
- MLOps 관련 지식 및 관련 OSS (MLflow, BentoML, Kubeflow 등)의 사용 경험
- Hadoop 및 Hadoop eco-system (Spark, Hive, Zookeeper, Kafka 등) 관련 지식 및 사용 경험
- 대량의 데이터를 수집, 정제하여 머신 러닝에 활용한 경험
[빅데이터플랫폼] 데이터 엔지니어
담당할 업무
[고객데이터플랫폼]
· Flink/StreamSets 기반의 실시간 스트리밍 파이프라인 개발
· 모던 데이터 아키텍처 기반의 이벤트/데이터 모델링
· 데이터 전처리 및 검증 프로세스 개발
필수 경험과 역량
· 자료구조, 알고리즘, OS, 데이터베이스 등 기초 전산 지식이 있는 분
· SQL, Airflow, Hadoop, Kafka, Flink 등을 사용한 대용량 데이터 처리에 능숙한 분
· Java, Kotlin, Python 중 하나 이상의 언어에 익숙한 분
· 총 경력이 3년 이상인 분
우대사항
· Hadoop EcoSystem 기반의 다양한 솔루션 활용 경험이 있는 분
· 은행 DW 업무 도메인을 잘 이해하고 있고 마트 개발 경험이 있는 분
· MySql, Oracle 의 CDC 경험이 있는 분
· 실시간 데이터 스트리밍 처리에 경험이 있고 익숙한 분
반응형'BIG DATA & AI > NLP' 카테고리의 다른 글
Stanford CS224N: Youtube Link and Materials (0) 2022.03.08 HCLT 2021 논문집 (0) 2021.11.16 BERTopic 이란? (1) 2021.06.24 NLP 라이브러리 소개 - Document Embedding, Word Embedding / BERT, KoBERT, Word2Vec, Glove, FastText, ELMo (0) 2021.04.14 자연어 처리 개념 (NLP Bible) (0) 2021.04.08