자연어 처리 엔지니어의 역량

BIG DATA & AI/NLP 2021. 5. 24. 20:19

자연어 처리 전문가가 되려면 어떤 역량이 필요할까? 모집 공고 트렌드를 분석해 보았다.

[Papago] 파파고 머신러닝(자연어처리) 체험형 인턴 모집

■ Machine Learning Scientist : 자연어처리 [체험형 인턴]

[역할]

· Natural Language Processing을 과학적, 심층적으로 연구

· Multilingual NLP의 최신 연구 재구현 및 개선
- Machine translation
- Quality estimation
- Multilingual sentence representation learning
- Inspecting and analyzing NLP models(language models, translation models)
- Solving NLP problems with additional image or speech data
- Evaluation methods (translation quality, fluency of sentence..)

[자격요건]

· Multilingual NLP를 다뤄보신 분

· 스스로 문제를 정의하고 해결하기 위한 모델링이 가능하신 분

· 최신 머신러닝 알고리즘과 관련 기술에 대한 이해를 가지신 분

· 주요 머신러닝 프레임워크에 대한 이해가 깊으신 분(ex. TensorFlow, PyTorch)

· 영어 논문을 빠르게 읽고 이해하는 데 어려움이 없으신 분

· 뛰어난 의사소통 능력을 갖추신 분

[우대사항]

· Sequence labeling, text segmentation에 대한 경험이 있으신 분

· Machine translation 또는 sequence generation에 대한 경험이 있으신 분

· Statistical data analysis / data mining에 대한 경험이 있으신 분

· Kaggle 등 머신러닝 관련 대회에서 좋은 성과를 거두거나 국제 학술대회에 논문을 게재하신 분

· 위 연구에 대해 논문화에 관심이 있으신 분

[채용하고 싶은 사람]

· 모든 일을 본격적으로 시작하기 전 베이스라인부터 만들고 평가지표부터 세우시는 분

· 문제를 직접 정의하는 것을 좋아하고 끈질기게 해결하는 분

· 높은 퀄리티의 delivery에 욕심이 많으신 분

· 항상 배우는 자세로 동료들과 즐겁게 일하실 수 있는 분

· 멋진 작업물을 동료들과 공유하는 것을 좋아하시는 분

Papago Machine Learning Scientist : Natural Language Processing (NLP) ▼

이런 일을 맡고 있어요
파파고는 2016년부터 기계번역 서비스를 시행한 조직으로, 단순히 연구를 하는데 그치지 않고 우리가 만든 기술을 실제 서비스에 적용해서 사용자의 만족도를 높이는 경험을 할 수 있습니다.
함께 언어의 장벽을 같이 허물어보고 싶으신 분이 있으면 "지원하기" 버튼을 클릭해주세요!
파파고의 NLP 머신러닝 과학자들은 파파고 기계번역팀에 속해 자연어처리를 위한 각종 머신러닝 모델을 만듭니다.
보통 다음과 같은 문제를 해결합니다.
- 어떤 자연어처리 기법들이 파파고 서비스(기계번역)의 품질 향상에 도움을 줄까?
- 데이터가 없거나 부족한 경우, 기계번역의 품질을 높이는 방법은 뭘까?

입사하게 되면 담당할 업무입니다
머신러닝 기술을 빠르게 프로토타이핑하고 학습
머신러닝 모델이 서비스 상에서 대용량의 요청을 빠르게 처리할 수 있도록 최적화
자연어를 과학적으로 탐구하고 심층적으로 연구

업무를 수행하기 위해 필요한 자격 요건입니다
스스로 문제를 정의하고 해결하기 위한 모델링이 가능한 분
최신 머신러닝 알고리즘과 관련 기술에 대한 이해를 가진 분
주요 머신러닝 프레임워크에 대한 이해가 깊은 분 (ex: TensorFlow, PyTorch)
Python, C++ 등의 프로그래밍 언어를 1개 이상 자유자재로 다루고 Linux/Shell 환경에 익숙하신 분
영문 논문을 빠르게 읽고 이해하는 데 어려움이 없으신 분
뛰어난 의사소통 능력을 가진 분

추가로 보유하고 있다면 좋을 스킬셋이나 경험입니다
Multilingual NLP를 다뤄보신 분
Quality estimation, sequence labeling, text segmentation에 대한 경험이 있는 분
Machine translation 또는 sequence generation에 대한 경험이 있는 분
Signal, image, text 등 다양한 modality를 다뤄보신 분
Statistical data analysis / data mining에 대한 경험이 있는 분
ML/NLP 관련 상용 프로덕트를 개발한 경험을 가진 분
On-device ML에 대한 경험이 있는 분
Kaggle 등 머신러닝 관련 대회에서 좋은 성과를 거두거나 국제학술대회에 논문을 게재하신 분

Clova Vision/NLP 데이터 관련 Data scientist ▼

이런 일을 맡고 있어요
네이버 클로바에서 Vision 및 NLP 모델을 생성하기 위한 데이터 처리하는 팀입니다.
- 네이버 안에 서비스 되고 있는 다양한 데이터를 다룰 수 있으며, 이를 기반으로 인공지능 모델을 만드는데 기여
- 데이터를 시각화 하고 분석하는 역할 담당
- 데이터(영상, 텍스트, 비디오)를 다루기 위한 툴 개발
- 대용량 데이터 필터링 등의 엔지니어링 작업을 수행

입사하게 되면 담당할 업무입니다
ML 모델 개발을 위한 데이터를 수집, 가공하는 역할
데이터 수집, 큐레이션, 시각화, 분석 등의 역할을 수행
데이터 관련 툴 및 ML 엔지니어링 기술 개발

업무를 수행하기 위해 필요한 자격 요건입니다
프로그램 설계 디버깅, 자료구조, 알고리즘에 대한 넓은 이해가 가능하신 분
비즈니스나 데이터에 기반한 문제해결에 익숙하신 분
Web기반 어플리케이션 개발 경험
Python을 사용한 소프트웨어 개발 경험

추가로 보유하고 있다면 좋을 스킬셋이나 경험입니다
MLOps 관련 지식 및 관련 OSS (MLflow, BentoML, Kubeflow 등)의 사용 경험
Hadoop 및 Hadoop eco-system (Spark, Hive, Zookeeper, Kafka 등) 관련 지식 및 사용 경험
대량의 데이터를 수집, 정제하여 머신 러닝에 활용한 경험

[빅데이터플랫폼] 데이터 엔지니어

담당할 업무

[고객데이터플랫폼]

· Flink/StreamSets 기반의 실시간 스트리밍 파이프라인 개발

· 모던 데이터 아키텍처 기반의 이벤트/데이터 모델링

· 데이터 전처리 및 검증 프로세스 개발

필수 경험과 역량

· 자료구조, 알고리즘, OS, 데이터베이스 등 기초 전산 지식이 있는 분

· SQL, Airflow, Hadoop, Kafka, Flink 등을 사용한 대용량 데이터 처리에 능숙한 분

· Java, Kotlin, Python 중 하나 이상의 언어에 익숙한 분

· 총 경력이 3년 이상인 분

우대사항

· Hadoop EcoSystem 기반의 다양한 솔루션 활용 경험이 있는 분

· 은행 DW 업무 도메인을 잘 이해하고 있고 마트 개발 경험이 있는 분

· MySql, Oracle 의 CDC 경험이 있는 분

· 실시간 데이터 스트리밍 처리에 경험이 있고 익숙한 분

저작자표시 비영리 동일조건 (새창열림)

'BIG DATA & AI > NLP' 카테고리의 다른 글

Stanford CS224N: Youtube Link and Materials (1)	2022.03.08
HCLT 2021 논문집 (1)	2021.11.16
BERTopic 이란? (2)	2021.06.24
NLP 라이브러리 소개 - Document Embedding, Word Embedding / BERT, KoBERT, Word2Vec, Glove, FastText, ELMo (0)	2021.04.14
자연어 처리 개념 (NLP Bible) (0)	2021.04.08

ABOUT ME

Emily's Tistory

Papago Machine Learning Scientist : Natural Language Processing (NLP) ▼

Clova Vision/NLP 데이터 관련 Data scientist ▼

'BIG DATA & AI > NLP' 카테고리의 다른 글

티스토리툴바

ABOUT ME

Papago Machine Learning Scientist : Natural Language Processing (NLP) ▼

Clova Vision/NLP 데이터 관련 Data scientist ▼

'BIG DATA & AI > NLP' 카테고리의 다른 글

관련글 관련글 더보기

티스토리툴바