딥러닝 관련해서 공부하려고 하는 사람들에게 정보 - v1.2

Ai 언어모델 로컬 채널

알림 알림 중 알림 취소

구독자 3369명 알림수신 166명 @바바리맨

제한없는 언어모델을 위한 채널

스터디 딥러닝 관련해서 공부하려고 하는 사람들에게 정보 - v1.2

hkhk

추천 30 비추천 0 댓글 47 조회수 7271 작성일 2023-04-06 10:39:44 수정일 2023-05-09 08:32:57

https://arca.live/b/alpaca/73467666

생각보다 사람들이 계속 읽는 것 같아서 업데이트 하고 있음.

v1.2 참고 자료 추가 + QnA 항목 추가. 서적 표지 스크린 샷 등 이미지 추가

v1.1 참고 자료 추가

v1.0 초안 작성

Q: 속성으로 배울 방법이 있을까?

A: 속성은 없을거 같음. 왜냐하면 이 분야의 특성상 서로 맞물려있는 지식들이 많음. 그래서 대부분의 자료를 보다보면 다른 분야의 지식에 대해 어느정도 알고 있다고 가정하고 넘어감. 그러니 내용 자체가 그렇게 어렵지 않은 경우에도 어렵게 느껴지는 것임.
맞물려 있는 지식들을 파다보면 하나를 배우려고 하니 모르는거 3개가 추가되는 현상이 발생함.

- 예를 들어 학습을 배우려고 보면 전파, 역전파, 비용함수라는 주제가 나오고, 비용함수라는 주제를 배우려고 보면, 평균제곱값 오차, 교차 엔트로피가 나오고, 교차 엔트로피는 뭐야? 라고 보면 클로드 셰넌의 정보 이론이 나오고, 쿨벡-라이블러 발산값같은 개념이 나오고.. 하는 식임
- 대부분의 사람들은 이 단계에서 '아 이건 내가 파고들 분야가 아니구나' 하고 좌절을 함. 알아보려고 할 수록 모르는게 많아지는데 기겁할 수 밖에 없음.

- 근데 사실 서로 얽힌게 많아서 그렇지 개념 하나 하나는 수학 기호의 벽을 넘고 나면 그렇게까지 어려운 것은 아니고, 상식선에서 이해할 수 있는 것들이 많음. 그리고 저렇게 총 배워야 하는 개념의 수가 다른 학문에 비해 압도적으로 많은가? 하면 그렇지도 않음. 이 부분을 극복하냐 못 극복하냐가 자신감의 차이로 이어짐.

Q: 저정도까지 공부해야 할 필요가 있나?

A: 인공지능은 빠르게 최신기술이 나오고 있는 분야임. 한번 신기술이 나오고 나면 기존 기술은 거의 쓸모없어지거나 그냥 알아두기만 하면 되는 정도로 사장되는 경우도 많음. 그리고 최신 기술을 알기 위해서라면 결국 논문을 봐야 함. 논문을 읽을 수 있는 사람 vs 없는 사람, 깃헙에 올라온 자료를 받아서 자기 컴퓨터 혹은 임대한 인스턴스에서 돌려볼 수 있는 사람 vs 없는 사람으로 정보습득력 수준(literacy)의 격차가 생김.

Q: 그럼 어떻게 공부해야 함?

A: 차례대로 공부할 수 있는 어느정도의 로드맵을 따라가는 것을 권함

- 1. 파이썬은 무조건 알아야 함. 다른 언어는 쓸 일이 그다지 없음. 대신 웹 개발류는 알아두면 응용할 때 좋음.

- 추천강의 : w3schools.com 의 파이썬 튜토리얼 https://www.w3schools.com/python/default.asp

- 이 사이트는 파이썬 말고도 웹 개발 배울때도 도움 많이 받았던 곳임. 공짜로 보기 미안할정도로 정보의 품질이 좋으니 꼭 보자.
- 튜토리얼 목록 보면 AI, Numpy, Pandas 등의 다른 주요 패키지들에 대한 튜토리얼도 있으니 놓치지 말자

영문으로 된 자료가 부담스럽다면 한국어로 되어 있는 양질의 자료도 많으니 참고할 수 있다. 가장 추천할만한 것중 하나로는 생활코딩 시리즈가 있다

생활코딩은 https://www.opentutorials.org/course/3083 에 등록된 텍스트 기반의 강의와 유투브 기반의 영상강의가 함께 제공된다. 저자는 특히 설명을 체계적으로 하는 능력이 뛰어난데, 아래와 같이 전체적인 '지식의 지도' 를 보여주면서 뭘 먼저 알아야 다음 것을 알기 수월한지 힌트를 준다. 먼저 마스터리를 찍어야 언락되는 다른 테크트리 같은 개념으로 만들어놓아서 보기가 좋다. 다만 AI 쪽에 대한 부분은 별로 없고 웹 개발에 주로 치우쳐져 있어서 딥러닝 공부에는 직접 도움은 덜 되지만 파이썬 강의까지는 챙겨보자. 그리고 웹개발도 배우면 결국 도움이 된다. 왜냐? 딥러닝으로 뭔가 신박한 것을 만들었다면 그걸 남에게 보여줄 방법은 결국 웹이 가장 유력하기 때문이다.

- 2. 리눅스를 쓰건 파워쉘을 쓰건 시스템 관리에 대해 어느정도 알아야 한다. pip 나 venv, conda 같은 패키지 매니저들이 돌아가는 원리, 왜 필요한지 등에 대해 알아야 나중에 하다가 문제에 부딛혀도 해결책을 스스로 알아낼 수 있음. 많은 경우 문제들이 너무 기본적인거라서 사람들이 굳이 알려주지 않는 경우들이 많음. 학습을 빡세게 돌리려면 결국 외부 서버를 임대해서 사용하거나, 내 컴퓨터 여러대를 한꺼번에 돌리거나 해야 하는데 그렇게 돌리려면 비싼 윈도우 정품 라이센스에 돈 쓰기보다는 리눅스를 깔아서 돌리는 쪽으로 가기 마련이다. 나도 리눅스 안 쓰다가 머신들 돌려야 해서 오랫만에 리눅스를 공부하려니 어질어질 했는데 아래 책이 꽤 정리가 잘 되어있고 필요한 내용은 거의 다 들어있었다.

- 추천서적 : 리눅스 입문자를 위한 명령어 사전 http://www.yes24.com/Product/Goods/102467714

- 3. numpy, pytorch 에 대해 어느정도 알아야 함

직접 학습을 돌리려면 당연히 알아야 하고, 그렇지 않고 그냥 사용을 하는 경우에도, 남들이 만든 모델이 어떤 구조로 되어 있는지 뜯어볼 수 있어야 깊이 알 수 있음. 파이토치 초보자 입문 같은 책이나 강의 보고, 간단하게 자기 손으로 모델 학습 한번 돌려보는게 1단계 목표임.

프로그래밍을 배울 때 제일 처음 기본적으로 하는 것이 Hello World! 출력하는 프로그램을 짜는 것이라면, 파이토치를 배웠다면 제일 먼저 돌려보는 것이 숫자 손글씨 인식하는 모델 만드는 것임. 파이썬 소스로 20줄 이내고, MNIST 라는 숫자 이미지 데이타셋 다운로드 받는 것부터 자기 컴퓨터에 돌리는 것까지 거의 다 떠먹여주다시피 수준으로 예제코드가 잘 된 것들이 많음.

- 예전에는 딥러닝을 배우려면 텐서플로우? 파이토치? 케라스? 같은 복잡한 선택지에서 헤멜 수 밖에 없었는데, 요즘은 새로 나오는 프로젝트들은 거의 pytorch 로 대동단결했음. 그런데 문제는 교과서라고 할만한 좋은 책들 (예: 오렐리앙 제롱의 핸즈온 머신러닝 2판) 이 예전에 작성되서 텐서플로우로 되어 있다는 점이 문제임.

- 추천서적: 차근차근 실습하며 배우는 파이토치 딥러닝 프로그래밍:파이썬부터 머신러닝 기초 이미지 인식 파인 튜닝까지 http://www.yes24.com/Product/Goods/111704966

- 4. 기계학습과 딥러닝에 대한 개론적인 이해가 필요함

- 기계학습은 AI 의 한 부분이고, 딥러닝은 기계학습의 한 부분이다라는 말을 듣고 무슨 말인지 안 와닿는다면 관련 개론 강의이나 책 찾아볼 것을 권함

- 딥러닝에 관련된 개념들에 대한 이해가 필요함

- 학습은 뭐고, 추론은 뭐고, 웨이트는 뭐고 바이어스는 뭐고, 활성치는 뭐고, ReLU 는 왜 필요한거고, 소프트맥스가 뭐고, 크로스 엔트로피가 뭐고 등등의 개념들. 역시 책이나 강의 찾아볼 것

- 딥러닝의 모델이 무슨 역할을 하고, 학습을 할 때 뭐가 어떤 영향을 주고 같은 부분에 대해 어느정도 감이 필요함. 과적합, 과소적합 같은 문제가 뭐고, 왜 일어나고, 사람들이 어떻게 극복했는지 등에 대해 알아야 함. 그 외 차원의 저주 문제, 그래디언트 소멸과 폭발 문제 등등도 알아야 함.

- 추천서적 : 밑바닥부터 시작하는 딥러닝 https://www.hanbit.co.kr/store/books/look.php?p_code=B8475831198

- 요 책은 특이하게 파이토치나 텐서플로우 같은 프레임워크를 쓰지 않고 그야말로 밑바닥부터 만드는 과정을 보여줌.

- 추천 이유는 일본 저자가 썼기 때문에 영어책 번역한 것보다 한국어 독자가 읽기 편하고, 정말 밑바닥부터 만드는 것이기 때문에 사전지식을 요하는 부분이 적다는 것. 3권의 시리즈로 구성되어 있고 마지막 3권에서는 자기가 파이토치와 유사한 구조의 딥러닝 프레임워크를 만드는 것까지 따라하게 해줌.

아래 추천 유튜브 채널란에도 나오는 스탯퀘스트의 영상강의를 책으로 만들어 놓은 것임. 머신러닝 공부하면서 도움을 많이 받아서 이미 알고 있는 내용들이지만 팬심으로 구매한 책인데, 초보자에게 권할만 함. 딥러닝 이전의 머신러닝에 관련된 확률과 통계의 개념부터 머신러닝 기법까지를 주로 다루는데, 다른 딥러닝 관련 책을 보다가 확률 통계의 너무 기본적인 부분에서 막힌다 싶으면 이거만큼 친절하게 알려주는 참고서가 없을 것임.

- 5. 수학에 관련된 부분 이해가 필요함

- 벡터와 행렬등을 다루는 선형대수학, 미적분, 확률과 통계가 주로 관련되어 있음. 복잡한 내용까지는 안 가더라도 각종 기호들이 뭘 말하는건지 풀어서 볼 수 있는 정도가 되면 좋음

- 수학이 필요한 이유는 논문 내용을 이해하기 위해서임. 논문을 자기 능력으로 해독할 수 있는 사람과 아닌 사람은 정보 습득 능력에서 차이가 날 수 밖에 없음

- 수학의 분야는 매우 넓지만 딥 러닝 관련 논문들 이해하는데에는 위에 말한 3 가지 (미적분, 선형대수학, 확률통계) 정도면 됨.

- 수학 공부한다고 해서 연습 문제풀고 그런거 할 필요는 없고, 제일 중요한 것은 각종 기호 읽는 방법임. 시그마같은 기호는 몇개만 나열되도 무슨 대학원 공학처럼 보이지만, 사실 파이썬 코드로 치면 for loop 문 돌려서 변수를 쭉 더하는 것에 불과함. 이 울렁증을 극복하느냐 못하느냐가 관건임. 편미분 기호나 적분 기호 같은 경우도 사실 파이썬 코드로 보면 별거 아님.

- 수학 공식으로 써놓으면 뭐가 어려워 보이는 이유중 하나가 단어 2-3 개정도는 써야 나타나는 개념을 그냥 영문자 한개로 써버려서 그런 것임. 근데 이런 것들은 이쪽 분야 연구하던 사람들은 동시에 쓰는 개념이 열가지가 넘지 않으니 그냥 간단한 문자로 써버리는 것임. 역시 용어와 익숙해짐의 문제이고, 본질적인 난이도는 아님. 아카라이브나 인터넷 커뮤니티에 대해 문외한이던 사람이 이런 곳에와서 '주딱' '핑프' '돚거' 같은 단어를 보고 기겁할 필요가 없는 것과 유사함

- 머신 러닝 관련 수학책들 추천받음. 나는 수학은 어느정도 기초가 되어 있어서 크게 신경 안쓰고 바로 넘어갔는데 다른 사람은 안 그럴테니 괜찮은 서적 있으면 댓글로 달아주면 여기 적어놓겠음

- 6. 깃헙 다루는 법을 어느정도 알아야 함

- 이쪽 바닥이 재밌는 이유가, 논문으로 복잡하게 되어있는 내용도 결국 내 컴퓨터로 다운받아서 실제로 돌려보고 뜯어보고 하면서 결국 이해를 할 수 있다는 것임. 그러려면 기본적으로 남의 저장소 끌어오는 방법, 버전이 뭔가 꼬였다 하면 그 전 시점으로 돌리는 방법, 뭔가 실험을 해보고 싶으면 브랜치를 따서 다른 브랜치로 옮겨서 하다가 필요 없으면 날려버리고 하는 방법 등등에 대해 익숙해야 함.

- 이건 책보다는 직접 실습을 많이 해봐야 하는 쪽이라..

https://backlog.com/git-tutorial/kr/

- 7. 응용 ai 에 대한 개론적인 이해가 필요함

- ai 의 응용 분야는 크게 이미지쪽과 자연어 쪽으로 나뉜다고 할 수 있는데, 이미지쪽으로 가게 되면 합성곱 신경망 (CNN)을 기본으로 해서 그 이후의 응용 분야들이 펼쳐짐. 거기에 강화학습 같은 요소들이 부가적으로 존재함.

- CNN 은 2차원 이미지를 인식하는 데에 효과가 뛰어나다는 것이 증명되고 2012 년 AlexNet 이 뛰어난 성적을 보이며 사람들의 관심이 모이기 시작함.

- 처음에는 이미지를 인식 (classification) 하는 것이 목표였는데, 그 성능을 높이기 위해서 inception, residual network 같은 개념들이 등장하고 그 개념들은 나중에도 계속 활용되게 됨. 그림 한장에 대한 인식 능력이 사람 수준에 도달하게 된 이후에는 연구자들은 이미지를 부분별로 나누는 작업(segmentation)에 관심을 갖게 되고, 그 결과로 u-net 같은 구조들이 등장함. 이건 나중에 스테이블 디퓨전에서 요긴하게 쓰이게 되기도 함. 한편, 이미지를 인식하는 모델을 돌리는 과정에서 latent space 라는 공간의 유용성을 발견하게 되고, 이걸 역으로 돌려서 이미지를 인식하는 것 말고 만들어내는 것에 쓸 수 없을까 연구하게 됨. 그 최초의 결과물이 auto-encoder 라는 것인데 이걸 이용해서 기본적인 이미지를 만들어낼 수 있음. 그런데 해상도가 너무 낮게 되어 있어서 해상도를 높일 방법을 찾으면서 GAN (Generative Adversarial Network) 같은 개념을 도입하고, 결국 디퓨전 개념으로 발전하게 됨. 이 과정에서 VAE, CLIP 같은 다른 모델과 혼합 응용하여 요즘의 스테이블 디퓨전 같은 것이 나옴. 이 분야의 책들 찾아볼 것

- 한편 자연어 분야에서는 RNN 이라는 방식으로 길이가 긴 문장을 다루는 방법을 다루다가 RNN 의 한계를 극복하기 위해 LSTM 같은 방식으로 발전하게 되고 결국 어텐션이라는 메커니즘을 탑재한 트랜스포머 구조로 귀결됨. 트랜스포머는 자연어뿐만 아니라 다른 분야에까지 범용적으로 쓰일 수 있는 구조이기 때문에, 자연어 분야를 공부하지 않더라도 AI 를 공부하게 되면 피해나갈 수가 없는 존재임.

- 추천 서적 : 비전 시스템을 위한 딥러닝 https://product.kyobobook.co.kr/detail/S000001810455

이미지 관련 모델에 대해서 이것저것 기본부터 응용까지 잘 다뤄주고 있다. 스테이블 디퓨전 같은 최신 모델은 다루지 않는 점이 아쉽지만 현 시점에서 디퓨전 관련은 대중들이 볼만한 수준으로 책으로 써서 나온게 한권도 없다. 대신 아래와 같은 책이 5월중에 출시될 예정이라고 하니 참고

https://www.oreilly.com/library/view/generative-deep-learning/9781098134174/

- 추천 서적 : 트랜스포머를 활용한 자연어처리 http://www.yes24.com/Product/Goods/115633781
-> 영어 책을 번역한거라서 번역어체의 껄끄러움의 문제는 있지만, 허깅페이스와 트랜스포머 관련되서 가장 정보량이 많음. 영문판을 읽을 수 있다면 영문판을 권함.

- 8. 마지막으로 영어를 잘 해야 함.

추천 서적들을 소개해주고 싶은데, 일단 기본적으로 꿀팁 하나를 주자면, 공학 기술서적은 미국 유럽 저자들이 쓴 책이면 차라리 원문을 읽는게 낫고, 한글로 된 글을 보고 싶으면 일본 저자가 쓴 베스트 셀러 책을 번역한 쪽이 추천할만함.

- 영어로 된 책을 번역한 책을 보면 대부분 번역가들이 해당 분야의 내용은 잘 알지만, 읽기 쉬운 한국어를 쓰는 능력이 부족함. 별거 아닌 영어 단어도 이게 전문용어인지 그냥 용어인지 구분을 안하고 전문용어처럼 번역을 하기 때문에 읽는 입장에서는 혼동이될 수 밖에 없음.

- 그에 비해 일본어 저자가 쓴 책을 한글로 번역한 경우에는 많은 경우 훨씬 한국사람이 소화하기 쉬운 언어로 써져있기 때문에 이해에 부담이 없음.

- 결국 영어를 못 하면 얻을 수 있는 정보가 크게 제한됨. 그나마 요즘엔 번역기들의 성능이 좋아지긴 했는데, 그래도 전문용어와 일상용어의 구분이라는 벽을 완벽히 넘진 못함

- 영어를 잘 하면 레딧이나 트위터, 영문 유투브의 관련 정보들을 바로 접할 수 있음

Q: 딥러닝을 배우기 전에 머신러닝을 꼭 먼저 배워야 함?

A: 알면 좋지만 필수는 아니다. 생각보다 겹치는 부분이 아주 많지는 않다. 머신 러닝에서 소개되는 각종 기법들은 나중에 필요한 시점에만 찾아 봐도 된다.

[추가] 유용하다고 생각하는 유투브 시리즈 등을 정리해봤다

StatQuest 의 딥러닝 시리즈

https://www.youtube.com/playlist?list=PLblh5JKOoLUIxGDQs4LFFD--41Vzf-ME1

원래 통계, 머신러닝 쪽의 주제에 대해 쉽게 설명하는 것으로 유명한 사람인데, 최근 딥러닝 시리즈도 상당히 좋았다. 최대한 쉽게 설명하는 것을 추구하기 때문에 일부러 몇가지는 빼놓고 지나가기도 하지만 초보자에겐 좋다. 딥러닝 말고 머신러닝이나 통계 개념에 대해서도 볼게 많다

3blue1brown 의 딥러닝 시리즈

https://www.youtube.com/playlist?list=PLZHQObOWTQDNU6R1_67000Dx_ZCJB-3pi

고등수학을 소재로 유투브 5백만 구독자를 넘긴 채널. 딥러닝에 대해서도 4개짜리 시리즈영상이 있다. 워낙 애니메이션을 잘 써서 설명을 하기 때문에 보기가 좋다. 영상이 4편밖에 없는게 너무 아쉽다. 위 4개의 영상은 이해가 될 때까지 10번 이상 정독해서 봐라.

deeplearning.ai 의 코스

인공지능 교육의 선구자인 앤드류 응 교수가 개설해놓은 강의 시리즈. 딥러닝을 다루기는 하는데, 딥러닝 이전에 필요한 기계학습의 기본 개념부터 차근차근 설명해줌.

https://www.deeplearning.ai/courses/

공식 홈페이지를 가보면 유료 강의 코스로 구성되어있긴 한데, 강의록 슬라이드나 영상들도 공개를 해 놓음. 조곤조곤 설명 잘해주니까 능력되는 대로 찬찬히 보면 됨.

https://www.youtube.com/watch?v=CS4cs9xVecg&list=PLkDaE6sCZn6Ec-XTbcX1uRg2_u4xOEky0

댓글 글쓰기

변태Lv1

2023-04-06 10:51:28 답글

양질 정보 ㄸㅋㄸㅋ 컴퓨터 관련해서 제로부터 시작하는 사람이라 뭐부터 해야할지 감도 안왔는데 
국비지원으로 스타트 끊는거 어떻게 생각함?

펼쳐보기▼

hkhk

2023-04-06 10:53:36 답글

나쁘지 않을거 같음. 코스 어떤거 있는지 링크 줘봐. 뭐 다루는지 봐줄께

펼쳐보기▼

변태Lv1

2023-04-06 10:58:08 답글

kukukaka

2023-04-06 10:54:50 답글

다른 공부 하느라 휴학했는데 틈틈이 같이 봐야겠다 압도적 감사..!

펼쳐보기▼

kukukaka

2023-04-06 10:55:45 답글

*수정됨

스탠포드 강의중에 유명한거 있던데 그거 봐도 괜찮음? 그건 컴퓨터비전쪽인거 같던데

펼쳐보기▼

hkhk

2023-04-06 11:00:03 답글

링크를 줘야 알지

펼쳐보기▼

kukukaka

2023-04-06 11:04:03 답글

https://oculus.tistory.com/6
유명한 강의라길래 알줄알았음
컴퓨터 비전 분야던데 llm이랑은 조금 다르지 않음?

TISTORY

[CS231n 1강 정리] 컴퓨터 비전의 역사

CS231n은 최고의 컴퓨터비전 강의. 강의자료는 아래에서 확인하실 수 있습니다. 강의 주소(Stanford Univercity) https://www.youtube.com/watch?v=vT1JzLTH4G4&list=PLC1qU-LWwrF64f4QKQT-Vg5Wr4qEE1Zxk&index=1 한국어 자막 https://github.com/visionNoob/CS231N_17_KOR_SUB 오늘은 1강인 Introduction to Convolutional Neural Networks for Visual Recognition을 정리…

유명한 강의라길래 알줄알았음
컴퓨터 비전 분야던데 llm이랑은 조금 다르지 않음?

펼쳐보기▼

hkhk

2023-04-06 11:07:19 답글

일단 강의 내용은 좋아보임. 딥러닝쪽을 깊게 알려면 결국 이미지/비전쪽이랑 자연어쪽이랑 둘 다 알아야 함. 왜냐하면 각각의 분야에서 최적화를 하면서 나온 개념들이 다른 분야에도 영향을 끼치기 때문임.

예1: 트랜스포머 - 자연어쪽에서 RNN 을 대체하기 위해 나왔는데 범용화되어 비전 분야에도 쓰임
예2: LoRA - 자연어 분야에서 학습을 가속하기 위해 만든 개념인데 이미지 쪽에서 특화 학습해서 젖보똥 이미지를 파인튜닝하는데 쓰임. 물론 본진인 자연어쪽에서도 알파카로 다시 쓰임

펼쳐보기▼

ufxpri

2023-04-06 11:07:59 답글

고맙다. 사실 별 정보 없어 보여도 시작하는 사람들이 아 이때 말 했던 게 이거구나 하는데 엔 큰 도움이 될 것 같아

펼쳐보기▼

노랑노랑

2023-04-06 11:14:44 답글

솔직히 이거 다 할 수 있는 사람이 얼마나 될지 모르겠노 ㅋㅋㅋ
AI옆에 세워두고 하나하나 물어보면서 할수도 없고

펼쳐보기▼

hkhk

2023-04-06 11:16:39 답글

그래도 딱히 다른 할 일도 없는 사람에겐 권해주고 싶다. 코인이나 NFT 같은거 하라고 권하는 것보다는 백만배 나은 것 아니냐?

펼쳐보기▼

노랑노랑

2023-04-06 11:18:34 답글

*수정됨

왜 또 아픈 상처에 소금을 뿌리십니까

펼쳐보기▼

하늘의아리아

2023-04-06 11:34:53 답글

고마워!

펼쳐보기▼

신염짱조음

2023-04-06 11:36:23 답글

오 감사감사~

펼쳐보기▼

ㅇㅇ

2023-04-06 12:46:45 답글

초치는것 같긴한데 이거 할 줄 알면 대학원에 있음

펼쳐보기▼

ㅇㅇ

2023-04-06 13:40:48 답글

고맙다 지우지 말아줘

펼쳐보기▼

asasqwww

2023-04-06 13:47:27 답글

밑바닥 딥러닝 1권 재밌게봤었지

펼쳐보기▼

asasqwww

2023-04-06 13:48:17 답글

*수정됨

프로그래머면 딥러닝도 그렇게 진입장벽 안높으니까 흥미있으면 해볼만함
수학도 뭐 딱 고등학교 문과수준만 돼도 논문쓸거아니고 논문읽기만 할거면 충분하고

펼쳐보기▼

__loving__

2023-04-06 13:50:34 답글

그렇게까지 말하면 해봐야지

펼쳐보기▼

asasqwww

2023-04-06 13:50:54 답글

그리고 서순상 딥러닝+머신러닝 베이스책을 보고 밑바닥딥러닝 보는게 나았음
밑바닥 딥러닝은 바닥까는거라기보단 좀 알고있는거 평탄화 시켜주는느낌이라서

펼쳐보기▼

hkhk

2023-04-06 13:54:14 답글

밑바닥 딥러닝은 코딩에 대해 좀 아는 입장에서 추천할만했음. 파이토치나 기타 라이브러리가 개념을 너무 감싸놔서 이게 뭐 어떻게 돌아가는건지 납득이 안되서 힘든 사람에겐 해독약 역할을 해줌

펼쳐보기▼

asasqwww

2023-04-06 13:55:17 답글

맞긴하지 ㅋㅋ 후반부 좀 날림인거 제외해도 전반부만 가지고도 돈주고 산거 안아까웠다

펼쳐보기▼

그래요

2023-04-07 00:32:18 답글

선생님이 언급한책 일단 다 주문했어요 뭐부터 봐요? 딥러닝시리즈는 1-3권 세트로 샀어요

펼쳐보기▼

산정

2023-04-08 01:43:39 답글

*수정됨

선생님, 너무나 좋은 글입니다. 가려운지도 몰랐던 가려운 곳을 박박 긁어주는 느낌이네요.
혹시 다른 곳에 퍼가도 될런지요? 물론 출처와 작성자님 크레딧은 확실히 남기겠습니다.

펼쳐보기▼

hkhk

2023-04-08 04:09:46 답글

물론 가능합니다. 쓰고나서 보니 계속 업데이트해야 할 곳이 보이는 관계로 이글은 나중에 부계정 깃헙 계정을 만들어서 올려놓던가 하겠습니다

펼쳐보기▼

qufql

2023-04-10 03:32:23 답글

진심 고마워

펼쳐보기▼

크리스퍼

2023-04-10 10:38:23 답글

돈 시간 많은사람 아니면 취미로하기엔 깊구나

펼쳐보기▼

hkhk

2023-04-11 08:12:51 답글

취미로만 하기엔 너무 먹고 살 문제에 영향을 줄 위력이 있는 주제라.. 생업으로 삼기에 이시점에 이거보다 강력한게 있을까?

펼쳐보기▼

탐9생활

2023-04-13 13:55:16 답글

한 권당 학습시간 3~8개월은 잡아야 할텐데 이 시점에 CNN부터 올라오라고 하면 너무 지치지 않겠음?
LLM 관심있어서 이 채널 온 거면 이론과 적용의 중간에 있는 책 같은 게 좋을 거 같아
https://ratsgo.github.io/embedding/

한국어 임베딩

한국어 임베딩

한국어 임베딩 관련 튜토리얼 페이지입니다.

한 권당 학습시간 3~8개월은 잡아야 할텐데 이 시점에 CNN부터 올라오라고 하면 너무 지치지 않겠음?
LLM 관심있어서 이 채널 온 거면 이론과 적용의 중간에 있는 책 같은 게 좋을 거 같아

펼쳐보기▼

hkhk

2023-04-13 14:03:24 답글

응용만 할거면 사실 다 몰라도 돼지. 근데 속살을 모르면 결국 한계가 온단 말이야. 남들이 제공하는 api 말고 내 모델에 학습을 하려면 구조를 알아야 하는데, 그럼 결국 트랜스포머를 알아야 하고, 그럼 트랜스포머가 왜 나왔나 따져들어가면서 줄줄 나오다보면 각 레이어들 중에 1xConvLayer 같은게 나오는데 그건 또 CNN 에서 나온거고, 스킵 연결도 CNN의 응용인 ResNet 에서 나온거고... 내가 몇달~몇년 (관심 가진건 5년 이상 됐었음) 공부하면서 느낀건 결국 다 알 수 밖에 없다는 것이었음. LoRA 같은 것도 언어모델에서 생겼다가 이미지로 가서 응용되다가 다시 언어모델로 와서 응용되잖아. 결국에는 멀티모달로 만날거고..

펼쳐보기▼

불타는장작

2023-04-15 11:11:50 답글

와 요즘 거대기업들 다 Ai 오픈소스로 풀어서 관심 많이 생겼는데 분석용으로 가이드라인 있었넹 최고다

펼쳐보기▼

불타는장작

2023-04-15 11:11:57 답글

al06r

2023-05-07 09:00:38 답글

혹시 직접 구축해보면서 배우고싶다면 (클론코딩같은느낌) 추천할만한 책은 위에서 어떤게 좋을까?
나는 비전공자인데 김성훈 교수님이 모두의딥러닝 유튜브강의 한창 찍으실때 (2018~2019) 여기저기 세미나 가서 예제코드 뜯어보면서 공부해보고 DNN, CNN, RNN ,LSTM 이런정도만 공부하고 그 뒤로 손 놓고 있던 수준이야. 요새 보니까 진짜말도안되게 격변해서 뭐가뭔지 하나도 모르겠더라고..

그런 와중에 이 글과 아래 블로그 후기를 읽게 되었고 그대로 따라해보면서 실력을 키워보면 어떨까 하는 생각을 하게 됐어

Bookathon 이라는 자연어처리 해커톤 대회 1위 수상후기인데 대박이더라고.(내기준)
https://l-yohai.github.io/AI-Bookathon-%EB%8C%80%EC%83%81-%ED%9B%84%EA%B8%B0/

대충 허깅페이스 임포트해서 모델 받고 하는게 머릿속에 그려지긴 하는데.. 아래 구절에서 엄청 큰 인상을 받았거든.
"T4 의 한계는 여전히 남아있었습니다. Batch size 를 1로 하여도 항상 out-of-memory 문제가 발생하였습니다. 때문에 저희는
Model freezing
24개의 Decoder Layer 중 12개의 Decoder Layer 를 Freezing 시키고, Half Precision 을 사용함으로써 겨우 학습을 진행할 수 있었습니다. 또한 batch 크기를 최소한으로 했기 때문에 Accumulation step 을 활용하였습니다."

훈련시킬때 메모리가 부족하면 포기하는게 아니라 레이어 몇개를 프리징시켜서 한다고..? 이런 발상은 듣도보도 못했는데 직접 구현해보면서 하면 이런것도 가능하겠구나 싶은 직관이 생길까 싶어서.

위에 추천해준 책 목록중에선 내 판단으로는 <밑바닥부터 시작하는 딥러닝> 이게 제일 내 목적에 맞아보이는데 torch로 구현하는게 아니라는점이 좀 아쉽더라고. 그래서 혹시 이 글에 언급안된 알고있는 책중에 적당한 책있나싶어서 댓글남겨! 초보자도 알기 쉽게 좋은 인사이트 담긴 글 많이 써줘서 고마워!!

YOHAI

AI Bookathon 대상 후기

2021 SKKU AI x Bookathon 대상 후기대회 및 팀원 소개

*수정됨

그런 와중에 이 글과 아래 블로그 후기를 읽게 되었고 그대로 따라해보면서 실력을 키워보면 어떨까 하는 생각을 하게 됐어

Bookathon 이라는 자연어처리 해커톤 대회 1위 수상후기인데 대박이더라고.(내기준)
https://l-yohai.github.io/AI-Bookathon-%EB%8C%80%EC%83%81-%ED%9B%84%EA%B8%B0/

펼쳐보기▼

hkhk

2023-05-07 10:38:44 답글

그냥 많이하다보면 자연히 느끼게되는 상식의 영역이기도 함. 학습은 추론보다 메모리를 많이 먹는데, 그 이유가 옵티마이저가 소모하는 메모리가 층마다 존재하기 때문임. 층을 얼린다는건 그냥 그 층에 대해 옵티마이저를 비활성화해서 메모리 소모 안하게 하는거임 ㅇㅇ. 물론 어떤 층을 얼리는게 유리할지 같은거까지 판단하려면 더 많은 인사이트가 필요하겠지. 책한권 보고 딥러닝 이해하려는건 어려운 길이라고 생각함. 여러가지 다른 각도에서 설명한 내용을 접하는게 한가지 설명을 반복해서 보는것보다 학습이 더 쉬움.

펼쳐보기▼

al06r

2023-05-07 11:11:45 답글

*수정됨

그런이유구나.. 신기하다. 알려줘서 고마워. 마지막 문장은 진짜 맞는말같아. 자료를 좀 더 왕성하게 접해야겠다. 고마워!

펼쳐보기▼

dodwowlkdl

2023-05-17 02:00:00 답글

선생님 감사합니다.... 대학교 커리큘럼보다 백배 낫다

펼쳐보기▼

나태

2023-06-03 16:47:40 답글

나태

2023-06-03 16:50:18 답글

생활코딩 머신러닝 강좌도 입문용으로 괜찮음  https://www.opentutorials.org/course/4548

머신러닝1

머신러닝1 - 생활코딩

생활코딩 머신러닝 강좌도 입문용으로 괜찮음  https://www.opentutorials.org/course/4548

펼쳐보기▼

곰주

2023-06-16 00:27:01 답글

천재고수가대는길.. 십지가안타

펼쳐보기▼

AISTUDY

2023-08-08 14:31:51 답글

굉장히 훌륭한 가이드 글이라고 생각함. 전공자고 대학원 가고 싶어서 일 때려치고 준비 중이라 이것저것 찾다가 보는데 깊이 있게 잘 작성한 글 같음

펼쳐보기▼

과라무이

2023-09-03 04:36:13 답글

헤메고 있었는데 길잡이가 되는 글이네요. 정말 감사합니다...

펼쳐보기▼

Axium

2023-11-02 08:21:39 답글

신기하네 배워볼만한가

펼쳐보기▼

mewa

2023-11-09 14:03:30 답글

1번 파이썬 사이트 Exercise 다 풀정도는 되는데 리눅스로 바로 넘어가나요? 아니면 생활코딩으로 한번 더 강의 보는게 낫나용

펼쳐보기▼

hkhk

2023-11-09 14:48:48 답글

리눅스에서 콘다 환경 만들어서 파이토치로 MNIST 학습 시켜보는걸 목표로 일단 해보세요.
그 과정에서 모르는게 나오면 제가 위에 써놓은 참고자료들 이용해서 해결하시면 됩니다.

펼쳐보기▼

ㅇㅇ (121.160)

2024-03-01 08:20:34 삭제 수정 답글

멀티모달 쪽 공부방법 알 수 있을까요? 지금 https://cmu-multicomp-lab.github.io/mmml-course/fall2023/ 이 강의 들으면서 공부 중이긴합니다..

cmu-multicomp-lab.github.io

11-777 MMML

11-777 - Multimodal Machine Learning - Carnegie Mellon University - Fall 2020

멀티모달 쪽 공부방법 알 수 있을까요? 지금 https://cmu-multicomp-lab.github.io/mmml-course/fall2023/ 이 강의 들으면서 공부 중이긴합니다..

펼쳐보기▼

hkhk

2024-03-01 09:19:56 답글

멀티모달의 기본은  CLIP 모델이니까 관련 자료 찾아보시고, 클립 모델로 텍스트나 이미지 유사도 체크하는 예제 돌려보세요

펼쳐보기▼

ㅇㅇ (121.160)

2024-03-01 09:59:21 삭제 수정 답글

*수정됨

감사합니다. 며칠전에 CLIP 공부하다보니 InfoNCE, CPC 페이퍼가 나오고, 이걸 공부하자니 word2vec에서 negative sampling을 도입하게 된 배경이 나오네요. 이 글처럼 개념 하나를 배우려고 하니 고구마 줄기처럼 다른게 딸려나옵니다.

펼쳐보기▼

글쓰기

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 질문 정보 학습 자료 자작모델 스터디 공지 운영 공모

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 28372670

공지 Ai 언어모델 로컬 채널 이용규정

바바리맨 2023.04.18 5938

공지 뉴비에게 도움 되는 글 모음

바바리맨 2023.04.18 26698

공지 언어모델 관련 정보취득 /무료체험 가능 사이트

바바리맨 2023.04.18 8754

공지 여러분의 학습에 도움을 줄 수 있는 하드웨어 지원

4206 질문 vllm의 AutoAWQ 관련해서 질문드립니다. (모델 양자화) [14]

Dikko 2024.05.17 237 1

4205 일반 메타에서 gpt-4v와 같은 Mixed-Modal 발표했네요 [8]

그래요 2024.05.17 586 12

4204 일반 A,WS summit 참여했는데 RAG 내용 괜찮았네요 [6]

ㅇㅇ 2024.05.17 308 2

4203 일반 한국 유튜브 transcription 데이터셋 [9]

maywell 2024.05.17 1077 42

4202 일반 gpt-4o에서 음성 입력을 실시간으로 음성으로 반환해주던데 어떤 기술 일까요? [8]

ㅇㅇ (61.100) 2024.05.17 420 0

4201 정보 Augmentoolkit - 생 텍스트를 넣으면 instruct 데이터셋을 만들어주는 툴킷 [3]

hkhk 2024.05.16 454 9

4200 정보 LLaMA-3 8B, 70B 모델의 양자화 단계별 MMLU성능 비교표 [8]

hkhk 2024.05.16 907 16

4199 질문 뉴비,우바우로 채팅으로 설정화 캐릭 AI하고 노는데 추천하는 모델 있을까?? [5]

ZOE 2024.05.16 390 1

4198 일반 SOLAR-10.7B-v1.0 lora-tuning 도움 [1]

asdfnlasdf 2024.05.16 295 0

4197 정보 llama3기반 파라메터 확장 한국어 파인튜닝모델 [4]

hkhk 2024.05.16 681 7

4196 스터디 잔차연결(residual connection or skip connection) 에 대한 발상의 전환 [5]

hkhk 2024.05.16 691 30

4195 질문 vllm vs 엑스라마2 [2]

끼랑까랑 2024.05.16 395 0

4194 일반 정말 단순한 질문인데 여쭤봅니다. [3]

바샤 2024.05.16 400 0

4193 일반 알음알음하다 여기 오게 되었는데 [4]

Qazxwd 2024.05.16 560 5

4192 질문 3090×4에서 wizardlm 8x22b를 배포할 수 있을까요? [6]

모맵 2024.05.15 514 -1

4191 일반 다음세대 곧 나오는데 A100 40Gb 중고를 600만원 주고 사는건 쫌 아니죠? [2]

ㅇㅇ (221.141) 2024.05.15 593 1

4190 일반 Chat vector에서 cp transfer [6]

오래된정원 2024.05.15 412 5

4189 자료 TinyStories-Korean [1]

hkhk 2024.05.15 303 6

4188 일반 gemma2는 27B, paligemma 공개 [6]

HyperBlaze456 2024.05.14 689 8

글쓰기

전체글 개념글

사용하고 계신 브라우저가 시간대 설정을 지원하지 않으므로 GMT 시간대가 적용됩니다.