전체 글
-
[논문 리뷰] LLM2LLM: Boosting LLMs with Novel Iterative Data EnhancementBIG DATA & AI/NLP 2024. 4. 10. 23:32
복학을 하고 (추가등록도 하고) 졸업준비를 하면서 최근에 스터디 2개를 열심히 돌리고 있다. 그 중 하나는 한 스타트업이 진행하는 스터디 방식을 차용한 흥미로운 방식으로 진행하고 있는데, 각자 논문을 준비해서 15분~20분간 읽고 15분간 의견을 공유하면서 퀵하게 진행하는 방식이다. 이번주면 3주차인데, 해 본 결과 15분이라는 시간 자체가 논문 하나를 정독하기에는 버겁고 빠르게 skimming해야 해서 집중력이 장난 아니다. 혼자서 1시간동안 흐린 눈으로 붙잡고 읽는 것보다 훨씬 효율이 좋아서 애정하고 있다. 각설하고, 스터디 중 그냥 최근에 나온 LLM 논문을 무심코 읽어봤는데 (무려 arXiv:2403.15042!) 너무 마음에 들었던 논문이 있어서 휴일에 다시 정독하면서 꼭꼭 씹어 먹어본 결과를 ..
-
[책 리뷰] 인사이드 머신러닝 인터뷰BOOK 2024. 4. 9. 17:00
총평 알고리즘 인터뷰 책과 강의는 수도 없이 쏟아지는데, 머신러닝 엔지니어를 위한 인터뷰는 도대체 언제 나올까? → 나왔다. 혼자 준비하기 답답했던 ML 엔지니어들에게 한 줄기 빛 같은 책이다. 본인도 최근 구직을 하면서 각종 구글링과 지인 네트워크를 통해 겨우겨우 정보를 얻어 준비했었고, 앞으로 머신러닝 엔지니어의 공급은 더 많아질 텐데 언제쯤 나올까 했던 책이 드디어 나왔다! 전형을 마무리한 후에 이 책을 보게 된 건 슬프지만, 인터뷰 준비 뿐만 아니라 옆에 두고 ML essential 다지기에도 너무 괜찮은 책이다. 저자의 이름이 재미있게도(?) 최근에 화제가 되는 샤오미 전기차의 이름과 동일한데, 이 분 굉장히 대단한 분이다. Amazon 등 빅테크에서 ML 엔지니어로 활동했으며 중간에 Roxy ..
-
[책 리뷰] GPT-4를 활용한 인공지능 앱 개발BOOK 2024. 2. 20. 16:22
총평 이 책은 LLM(Large Language Model)에 입문하고자 하는 개발자에게 아주 적합한 책이다-심지어 머신러닝, NLP 백그라운드가 없어도!-. OpenAI에서 제공하는 MaaS(Model as a Service) API를 활용한 간단한 프로젝트부터, 프롬프트 엔지니어링, Few-shot, Fine-Tuning, RAG 등 활용에 대한 전반적인 부분을 다루어 아이디어와 방법론들을 많이 얻어갈 수 있다. 서론에서 기존의 NLP 흐름과 transformer를 간략하면서도 핵심 내용만 전달하고 다양한 활용 사례로 시작하는 부분도 좋았다. 책의 분량 자체는 179 페이지 정도로 짧지만 빠르게 입문하기에 좋은 책이다. 개인적인 요즘의 LLM 흐름에 대한 인사이트를 공유하자면, 최근 대규모 언어 모델..
-
[책 리뷰] 파이썬과 엑셀로 시작하는 딥러닝BOOK 2023. 7. 27. 14:10
총평 이 책은 머신러닝 초보자에게는 차근차근 따라갈 수 있는 지침서이며, 추상화에 익숙해져버린 머신러닝 개발자들에게는 충격을 안겨 준다. 딥러닝을 자주 접하는 사람이 이 책을 본다면, "너무 쉬운 주제만 다루는 거 아니야?" 라고 생각할 수 있을 것이다. 딥러닝의 가장 기초인 gradient descent부터 CNN, RNN까지 다루고 있다. 결론부터 말하자면 이 책은 결코 쉽지 않다. 요즈음의 딥러닝은 scikit-learn, tensorflow 그리고 pytorch라는 빛과 소금같은, 어떻게 보면 극히 추상화된 라이브러리로 단 N줄만에 모델을 구성하고, 테스트하는 환경에 익숙해져 있기 때문이다. 하지만 이 추상화 덕분에 머신러닝 개발자들은 오히려 high level로만 모델을 알고 있고, 저 밑에 어..
-
GPT가 로봇으로, 그림 그려주는 AI '스케처 X' | CES 2023 | 판교 현대백화점BIG DATA & AI 2023. 5. 30. 21:22
주말에 비가 와서 자연스럽게 백화점으로 향하게 되었다. 그러다가 'GPT가 탑재된 그림 그려주는 AI'가 있다는 소문(?)을 듣고, AI를 공부하는 사람으로서 그냥 지나칠 수 없어 밥먹고 바-로 10층으로 향했다. 생각보다 로봇을 구경하는 사람들이 많았고, (그냥 백화점에 사람이 많았던 것일수도 있다) 특히 그림 그리는 AI는 웨이팅을 해야 할 정도로 인기 폭발이었다. 웨이팅 주변에는 AI가 그린 초상화가 붙어 있었고, 또 그냥 기본 얼굴형에 자유롭게 그림을 그릴 수 있는 공간이 마련되어 있었다. 왼쪽 사진에서 가운데 붙여진 그림 2점은 분명히 미대생이 그렸으리라. 👍👍 로봇의 생김새는 생각보다 기이했는데, 가운데에 카메라가 놓여져 있고 왼쪽에는 로봇 팔, 오른쪽에는 목에 얼굴만 붙어 있어서 LED로 표..
-
Hugging Face의 따끈따끈한 신기능 Tool, Agent (New Features of Hugging Face: tools and agents)BIG DATA & AI 2023. 5. 13. 15:54
🎈본 포스팅은 Hugging Face의 정말정말 따끈따끈한 신기능인 Tool과 Agent를 담고 있습니다. 무려 일주일도 안 된 23년 5월 10일에 릴리즈했다는 사실! Hugging Face란? 허깅페이스는 자연어 처리(NLP)를 전문으로 하는 회사이며, NLP를 위한 오픈소스 라이브러리와 도구 개발에 많은 기여를 하고 있다. 허깅페이스는 언어 번역, 텍스트 분류, 감성 분석, 질문 답변 등 다양한 NLP 작업에 사용되는 사전 훈련된 모델을 제공하며, 가장 인기 있는 제품은 PyTorch 위에 구축된 Transformers 라이브러리이다. 허깅페이스는 Transformers 라이브러리 외에도 토크나이저, 데이터셋, 파이프라인 등 NLP에 사용되는 다양한 오픈소스 도구를 개발하고 있다. 또한 허깅페이스 ..
-
[책 리뷰] 클린 코드의 기술BOOK 2023. 5. 9. 23:49
회사에서 좋은 기회로 '클린 코드의 기술' 역자가 직접 강연하는 세미나를 듣게 되었다. 그리하여 세미나 4시간 + 나의 리뷰를 섞어서 글을 써 보려고 한다. 사내에서는 생각보다 많은 사람이 신청해서 강의실을 큰 곳으로 옮겼는데, 그 곳마저 만석이더랬다. 또 책을 나눠주는 줄은 몰랐어서 뜻밖의 수완이었다. 더 놀라운 것은 역자가 우리 회사 직원이라는 사실. 나도 나중에 책을 쓰거나 강연을 해 보고 싶은데, 회사를 다니면서도 그 활동을 할 수 있다는 생각을 해보지 못했다. 사실은 알고 있었지만 제대로 인지하지 못했달까? 지금부터라도 집필 활동에 관심을 가진다면 충분히 가능하겠다 - 라는 생각을 했다. 최근에 한빛미디어에서 관련 활동을 시작하기는 했는데 원서를 읽는 활동이라 너무 어려워서 미뤄두고 있다 😂😂 ..
-
핫한 ChatGPT의 API 오픈 소식 및 사용기BIG DATA & AI 2023. 3. 10. 11:03
ChatGPT의 등장 요즈음 인공지능의 발전 속도는 거의 빅뱅의 우주팽창을 보는 것 같다. 갈수록 빠른 시간에 이전보다 훨씬 높은 성능을 보이고 있고, 이제는 기술적인 이슈를 넘어서 사용성, 개인 정보 등의 문제까지 화두가 되고 있고 무엇보다 전공자 뿐만 아니라 비전공자들도 AI에 대한 관심을 많이 가지는 부분에서 대중적인 인식에 대한 확산이 많이 되었다고도 느낀다. GPT-3를 기반으로 한 대규모 언어 모델이 나오면서 꽤 AI 씬에서는 센세이션이 일어났었는데, 최근에 OpenAI에서 ChatGPT라는 초초초대규모 언어 모델이 등장하면서 정말 세상이 뒤집어졌다(?). 그 인기가 어느 정도냐면, ChatGPT는 문서 작성에 능하기 때문에 꽤 많은 동료들이 업무 보조용으로 비서처럼 두고 쓰기도 하는 것부터 ..