TOTAL
-
분류 모델에 대한 성능 측정하기 (Model Evaluation)BIG DATA & AI 2022. 3. 27. 19:26
분류 task에 대해서 열심히 분류 모델을 만들었다고 가정하자. 이 분류기-classifier-가 '잘' 만들어졌는지는 어떻게 판단할까? 본 포스팅에서는 confusion matrix를 이용한 model evaluation 방법만 다루고 있습니다. 그 외 auc-roc curve, logisitc loss 등 다양한 방법이 있습니다. Confusion Matrix Confusion matrix (혼동 행렬) 는 분류 모델의 성능을 측정하는 matrix 중 하나로, 가장 기본적인 형태를 띠고 있다. TP (True-Positive) : 진짜 양성, 즉 positive로 예측했고 실제로 positive (True) 인 경우를 의미한다. FN (False-Negative) : 가짜 음성, 즉 negative로..
-
대학원 논문 작성법 - 한양대학교, 학위논문을 중심으로GRADUATE SCHOOL 2022. 3. 14. 20:19
논문, 도대체 어떻게 써야 하지? 모든 석사생들이 그렇겠지만 논문을 처음 읽어보고, 쓰게 된다. 다만 논문들이 이렇게 생겼으니까 나도 이렇게 써야지- 라는 생각으로 무작정 쓰기보다는, 논문이 어떤 구조로 쓰여 있고 어떤 방식으로 써야 하는지, 팁은 있는지 (철저한 MBTI J성향이라고 할 수 있다..ㅎ) 알아보고 싶었는데 마침 한양대 비교과강좌를 들을 수 있는 시스템 (HY-LU) 에 관련 강의가 있어, 수강하고 요약본을 공유해보려고 한다. :) 학위논문의 구조 1. 표지 (표제지) 2. 인준서 1. 국문초록 2. 목차 (표목차, 그림목차) 1. 서론 : 연구 배경 및 필요성, 목적, 논문의 전체 계요 2. 본론 - 이론적 배경 : 연구모형의 변수에 대한 내용 정리 (개념, 구성요소, 선행연구) - 연구..
-
[논문 리뷰] PRIDE: Predicting Relationships in ConversationsBIG DATA & AI/NLP 2022. 3. 9. 22:52
Character Relationship Extraction 분야에 관심이 있어서, 관련 논문을 리뷰하려고 한다. PRIDE라는 독일의 Max Planck Institute for Informatics라는 연구소에서 21년 EMNLP 학회에 게재된 논문이다. Abstract PRIDE는 BERT와 transformer 기반의 neural multi-label classifier이다. Dataset은 기존의 문어체 위주의 dataset 연구와는 다르게 utterence (발화) dataset인 영화 스크립트와 TV쇼를 이용한 논문이다. Introduction 해당 논문은 흥미로운 motivation을 제공하고 있는데, social media conversation에서 user간의 관계를 도출해내는 예제이다..
-
Stanford CS224N: Youtube Link and MaterialsBIG DATA & AI/NLP 2022. 3. 8. 22:07
교수님에게 미팅을 신청드리고, 논문 관하여 면담 후에 몇몇 피드백을 받았다. 그 중에서 가장 중요하게 언급하셨던 것은 “기초를 닦아라”라는 메세지였다. 그 방법은 두 가지 정도로 나뉘는데.. NLP 관련하여 기초 지식 쌓기 관련 분야의 논문 많이 읽기 사실 둘 다 너무 기본적이면서도 지키기 어려운 중요한 것들인 것 같다. 그 중에서도 NLP 기초 쌓기에 Stanford CS224N 강의를 추천해 주셔서 최근 공부하게 되었다. 공부한거 정리하는 겸사겸사 무료로 듣기에 너무 좋은 내용들이라 website, youtube 링크를 공유하려고 한다. Standford Website Link: Includes materials, related papers https://web.stanford.edu/class/ar..
-
[책 리뷰] 금융 전략을 위한 머신러닝BOOK 2022. 2. 23. 20:29
Data-powered enterprise가 될 수 있는 가능성이 높은 산업군은 어디일까? IT기반 회사, 유통 회사 등 여러 산업군이 있겠지만 나는 그 중에서도 금융권을 주목하고 싶다. 금융업계는 예전부터 data가 전산화 되어 왔고, 시장 예측이나 이상 거래 탐지 등 data를 기반으로 한 task가 필요하며 숫자/통계 없이 커뮤니케이션 할 수 없는 업계이기 때문이다. 이번 달 부터 한빛미디어 서포터즈를 통해서 1달에 1권 씩 책을 제공받아 리뷰를 쓰게 되었는데, 이 책이 그 첫번째가 되었다! 무튼, 그 전부터 나는 여의도, 월스트리트의 도시적이고 바쁜 분위기를 연상케 하는 금융권에 대한 왠지 모를 경외심과 최근 마이데이터 사업 등과 같이 Big Data/AI를 누구보다 요구하며 기술을 활용할 수 있..
-
React가 핫한 이유, 리액트 개념PROGRAMMING/Web Programming 2022. 1. 26. 22:47
웹 개발, Frontend쪽을 해 본 사람이라면 FE framework 3대장인 React, Vue, Angular를 적어도 이름은 들어봤을 것이다. 그 중에서도 React는 가장 많이 쓰이고 있는 프레임워크이며, 그 동안 jQuery라는 친구밖에 몰랐던 javascript의 인간관계는 어느새 많은 변화가 생겼다. 어쩌다 보니 나는 요즘은 웹앱 개발을 많이 하고 있고 오늘 신규 인원들을 위해 React 세미나도 했던 겸사겸사 초심자의 마음으로 돌아가서 React의 기원에 대해 알아보도록 하자. 정말 우연하게도(?) 얼마 전에 방문한 카페 이름이 React였다. 물론 카페의 간판은 Re.act로, 사장님이 개발을 아시기 어려울거니와 가운데에 점을 찍으신 걸로 봐서 가능성은 더더욱 없어 보인다. 하지만 하루..
-
[책 리뷰] 브레이킹 루틴 / 천인우BOOK 2022. 1. 24. 23:51
Breaking Routine 원하는 인생은 늘 안전지대 밖에 있다 천인우, 나는 그를 하트시그널3라는 연애 프로그램에서 접했고 그의 이미지는 실리콘밸리 페이스북에서 온 수재이지만 3일에 한 번씩 자신의 마음을 표현하겠다는 인터뷰를 남긴,, 공부만 하고 연애하는 법은 모르는 공대남, nerd의 모습이 강했다. 그러다가 '어쩌다 출근!' (나는 이 프로그램을 정말 좋아한다. 다양한 직업에 대한 일상을 엿볼 수 있고 시야가 넓어지는 느낌이다) 이라는 프로그램에서 뱅크샐러드의 리더로서 활약하는 모습을 보게 되었고, 데이터팀에서 일하는 업무가 내 관심분야와 비슷해 흥미로워 보였다. 그 후에 뱅크샐러드를 퇴사했다는 소식을 접했고 잠잠하던 차, 유튜브 알고리즘이 나에게 한 영상을 추천해 주었다. 조코딩님의 '실리콘..
-
AI대학원 야간 석사 1기 회고 (한양대학교 인공지능융합대학원)GRADUATE SCHOOL 2022. 1. 3. 21:46
흔히 대학교 동아리와 같이, 어떤 집단에서는 먼저 그 집단에 들어온 사람부터 카운트를 센다. 1기 다음에 2기가 들어오고, 그 다음 차례로 또 3, 4기 … 그런데 대학원에서는 뭔가 대학교에서 알던 개념과는 다른 집단과 명칭들이 있다. 학생회를 원우회라고 칭하며, 1기의 개념은 처음 입학한 사람이 아닌, 첫 번째 학기를 진행하고 있는 사람-을 의미한다고 한다. 회사에서 업무를 마치고 집에 가서는 수업을 듣고, 시험을 준비하는 이런 일상이 조금씩 자리 잡아 갈 때 쯤에야 1기 과정이 끝난 것 같다. 나는 사실 입사하고 지난 3년간은 퇴근 후에는 주중 주말 할 것 없이 노느라 바빴던 사람이기에, 자제력이 부족할 수 밖에 없었고 체력까지 부족했었어서 현타도 많이 오고 (내가 이 과정을 한다고 나에게 얼마나 도..