전체 글
-
Stanford CS224N: Youtube Link and MaterialsBIG DATA & AI/NLP 2022. 3. 8. 22:07
교수님에게 미팅을 신청드리고, 논문 관하여 면담 후에 몇몇 피드백을 받았다. 그 중에서 가장 중요하게 언급하셨던 것은 “기초를 닦아라”라는 메세지였다. 그 방법은 두 가지 정도로 나뉘는데.. NLP 관련하여 기초 지식 쌓기 관련 분야의 논문 많이 읽기 사실 둘 다 너무 기본적이면서도 지키기 어려운 중요한 것들인 것 같다. 그 중에서도 NLP 기초 쌓기에 Stanford CS224N 강의를 추천해 주셔서 최근 공부하게 되었다. 공부한거 정리하는 겸사겸사 무료로 듣기에 너무 좋은 내용들이라 website, youtube 링크를 공유하려고 한다. Standford Website Link: Includes materials, related papers https://web.stanford.edu/class/ar..
-
[책 리뷰] 금융 전략을 위한 머신러닝BOOK 2022. 2. 23. 20:29
Data-powered enterprise가 될 수 있는 가능성이 높은 산업군은 어디일까? IT기반 회사, 유통 회사 등 여러 산업군이 있겠지만 나는 그 중에서도 금융권을 주목하고 싶다. 금융업계는 예전부터 data가 전산화 되어 왔고, 시장 예측이나 이상 거래 탐지 등 data를 기반으로 한 task가 필요하며 숫자/통계 없이 커뮤니케이션 할 수 없는 업계이기 때문이다. 이번 달 부터 한빛미디어 서포터즈를 통해서 1달에 1권 씩 책을 제공받아 리뷰를 쓰게 되었는데, 이 책이 그 첫번째가 되었다! 무튼, 그 전부터 나는 여의도, 월스트리트의 도시적이고 바쁜 분위기를 연상케 하는 금융권에 대한 왠지 모를 경외심과 최근 마이데이터 사업 등과 같이 Big Data/AI를 누구보다 요구하며 기술을 활용할 수 있..
-
React가 핫한 이유, 리액트 개념PROGRAMMING/Web Programming 2022. 1. 26. 22:47
웹 개발, Frontend쪽을 해 본 사람이라면 FE framework 3대장인 React, Vue, Angular를 적어도 이름은 들어봤을 것이다. 그 중에서도 React는 가장 많이 쓰이고 있는 프레임워크이며, 그 동안 jQuery라는 친구밖에 몰랐던 javascript의 인간관계는 어느새 많은 변화가 생겼다. 어쩌다 보니 나는 요즘은 웹앱 개발을 많이 하고 있고 오늘 신규 인원들을 위해 React 세미나도 했던 겸사겸사 초심자의 마음으로 돌아가서 React의 기원에 대해 알아보도록 하자. 정말 우연하게도(?) 얼마 전에 방문한 카페 이름이 React였다. 물론 카페의 간판은 Re.act로, 사장님이 개발을 아시기 어려울거니와 가운데에 점을 찍으신 걸로 봐서 가능성은 더더욱 없어 보인다. 하지만 하루..
-
[책 리뷰] 브레이킹 루틴 / 천인우BOOK 2022. 1. 24. 23:51
Breaking Routine 원하는 인생은 늘 안전지대 밖에 있다 천인우, 나는 그를 하트시그널3라는 연애 프로그램에서 접했고 그의 이미지는 실리콘밸리 페이스북에서 온 수재이지만 3일에 한 번씩 자신의 마음을 표현하겠다는 인터뷰를 남긴,, 공부만 하고 연애하는 법은 모르는 공대남, nerd의 모습이 강했다. 그러다가 '어쩌다 출근!' (나는 이 프로그램을 정말 좋아한다. 다양한 직업에 대한 일상을 엿볼 수 있고 시야가 넓어지는 느낌이다) 이라는 프로그램에서 뱅크샐러드의 리더로서 활약하는 모습을 보게 되었고, 데이터팀에서 일하는 업무가 내 관심분야와 비슷해 흥미로워 보였다. 그 후에 뱅크샐러드를 퇴사했다는 소식을 접했고 잠잠하던 차, 유튜브 알고리즘이 나에게 한 영상을 추천해 주었다. 조코딩님의 '실리콘..
-
AI대학원 야간 석사 1기 회고 (한양대학교 인공지능융합대학원)GRADUATE SCHOOL 2022. 1. 3. 21:46
흔히 대학교 동아리와 같이, 어떤 집단에서는 먼저 그 집단에 들어온 사람부터 카운트를 센다. 1기 다음에 2기가 들어오고, 그 다음 차례로 또 3, 4기 … 그런데 대학원에서는 뭔가 대학교에서 알던 개념과는 다른 집단과 명칭들이 있다. 학생회를 원우회라고 칭하며, 1기의 개념은 처음 입학한 사람이 아닌, 첫 번째 학기를 진행하고 있는 사람-을 의미한다고 한다. 회사에서 업무를 마치고 집에 가서는 수업을 듣고, 시험을 준비하는 이런 일상이 조금씩 자리 잡아 갈 때 쯤에야 1기 과정이 끝난 것 같다. 나는 사실 입사하고 지난 3년간은 퇴근 후에는 주중 주말 할 것 없이 노느라 바빴던 사람이기에, 자제력이 부족할 수 밖에 없었고 체력까지 부족했었어서 현타도 많이 오고 (내가 이 과정을 한다고 나에게 얼마나 도..
-
GAN (Generative Adversarial Network)BIG DATA & AI 2021. 12. 9. 22:29
딥러닝 전반을 공부하면서 최근 핫한 딥러닝 분야 중 하나인 GAN을 접하게 되었다. 개념이 바로 와닿지 않아 차근차근 정리하면서 공부해보려고 한다. 😀 Generative Model 우선 GAN을 알기 위해서는 generaive model부터 알아야 한다. 이를 직역하면 '생성 모델'로, 주로 주어진 training data에 대해 같은 distribution을 가진 새로운 sample을 만들어 주는 (generate) 모델이다. Machine learning에서는 아주 많은 dataset이 필요한데, 사실 data를 취득하는 것에는 한계가 있다. 예를 들어 한 장소의 사계절 이미지 데이터가 필요하다고 치면, 실제 데이터를 얻기 위해서는 봄, 여름, 가을 그리고 겨울마다 그 장소에 찾아가서 사진을 찍어야..
-
상관관계 분석 (Correlation Analysis)BIG DATA & AI/Mathematics 2021. 11. 22. 21:09
두 feature의 상관관계를 분석하고 싶을 때 사용되는 기법들을 소개하려고 한다. 가령 gender에 따라 fiction과 non-fiction 장르의 선호도를 알기 위해서는 우선 두 feature가 상관관계가 있나? 있다면 얼마나 있는지? 이런 물음들이 필요하다. Nominal data - labeled, named 즉 discrete하고 multi-value로 이름 붙여진 데이터를 의미한다 - 의 경우 카이제곱 검정 (Chi-Square Test)을 많이 사용한다. 또한 correlation 개념 관해서 중요한 점은 결코 Correlation does not imply causality 이다. 상관관계와 인과관계는 같지 않다는 뜻인데, 예를 들어 hospital의 개수와 car-theft의 사건 수..
-
HCLT 2021 논문집BIG DATA & AI/NLP 2021. 11. 16. 18:11
지인에게 NLP 논문 참고할 학회로 HCLT를 추천받았다. 전세계적으로 AI에 불이 붙었었고 지금도 Computer Vision과 NLP는 나아갈 길이 무궁무진하다. 그 시절 살짝 꼈던 거품이 이제는 메타버스, 블록체인으로 옮겨간 것 같지만 내가 관심을 갖고 있는 분야의 NLP! 한국에서는 특히나 (또는 당연하게도) 한국어 정보처리가 핫하다. 그 중에서도 가장 유명한 학회는 HCLT (한글 및 한국어 정보처리 학술대회). 연도별 논문집이 600페이지 가량에 달해 어마어마한 양을 담고 있지만 트렌드 분석과 NLP 연구 ideation에는 꽤 좋은 것 같다. 논문을 읽는다..라고 하면 해당 논문에 대한 개념을 완벽히 이해하고, 나아가 재구현까지 포함-이라고 나 또한 생각하긴 하지만 아직 NLP 새싹으로써 우..