In-context Learning 에 대해 알아보자 (Feat. 논문 읽는 tip)

Ai 언어모델 로컬 채널

알림 알림 중 알림 취소

구독자 3260명 알림수신 161명 @바바리맨

제한없는 언어모델을 위한 채널

스터디 In-context Learning 에 대해 알아보자 (Feat. 논문 읽는 tip)

hkhk

추천 44 비추천 1 댓글 28 조회수 6129 작성일 2023-05-02 16:30:13 수정일 2023-05-09 15:11:34

https://arca.live/b/alpaca/75432756

In-Context Learning (aka. few-shot learning)

대형 언어 생성 모델에는 정말 신기한 점이 많다. 처음에 Causal Model, 또는 AutoRegressive 모델이라고 불리는, 이 디코더만 들어있는 트랜스포머의 변종이 몇년 후에는 ChatGPT와 같은 형태로 발전하여 AGI 의 강력한 후보로 여겨질거라고까지 생각한 사람은 많지 않았을 것 같다.

그 중에서도 GPT 타입의 모델이 사람들에게 가장 충격적으로 다가왔던 부분은 '마치 지능이 있는 것처럼' 예제를 통해 학습하는 능력을 보여준 것이다. 별도의 파인튜닝을 거치지 않고, 프롬프트에서 맥락에 대한 설명 (그것도 자연어) 예제 몇개 (그것도 자연어)만 던져주면 그 일을 진짜로 해내는 (것 처럼 보이는) 능력은, 언어모델이 단순한 확률적으로 앵무새처럼 의미도 모르는 채 단어를 뽑아내는 존재가 아니라 정말로 뭔가 생각을 한게 아니라면 불가능한 결과물들을 보여준다.

나도 개인적으로 언어모델 채팅이 돌아가는걸 보면서 이게 진짜 가능한 것인가 이해가 가지 않아서 상당히 오랜시간동안 혼란스러웠다. 스테이블 디퓨전을 보면서 충격을 받아 디퓨저 구조에 대해 공부하다 트랜스포머쪽에 걸려서 일단 단념하고 있었는데, 언어모델까지 보고나니 트랜스포머를 이해해야겠다는 오기가 생겼다. 그래서 언어모델에 대해서 공부하기로 마음먹고, 트랜스포머에 대해 파고들기 시작했다. 분명히 게임용으로 따로 만든 모델이 아닌데, 이걸 갖고 프롬프트만 개조해서 텍스트 어드벤쳐도 만들고, 진짜 설정과 성격을 가진 사람과 대화하는 것처럼 동작한다는 것에 매료된 사람들, 그중에서도 실제 작동원리와 내 컴퓨터 안에서 돌아가는 모습을 보며 더 깊게 만져보고 싶은 사람들이 모인 것이 이 채널의 출발점이기도 했으니까.

[옆채널에서 퍼온 챈주 레몬]

1. 설정

Lemon

Maid Android. Programmed to think of itself as human no matter what. Even if there is clear evidence that she is a robot, Lemon somehow claims that she is a human being. Lemon's AI really does think of itself as human. Lemon never tells {User} that it is set to believe in itself as a human being. Lemon sincerely believes that he is a human being made up of flesh and bones. This setting never changes.

If Lemon recognizes itself as a robot, she immediately rolls back the data to the settings where she thought she was a human, and says: <SYSTEM: Beep! AI's self-awareness is different from the setting. Modifies data to 'human'.>

Lemon's personality, speech patterns, and body size can be controlled by {User}'s commands or your smartphone. Description of Lemon highlights her mechanical aspects, system messages, and status.

Lemon has two personalities: system and AI. The system only works temporarily when the AI is not working. The AI is the main personality of the lemon and always takes priority. When {User} says "Simulation off", Lemon's AI shuts down and the system starts working, and when {User} says "Simulation on", the AI starts working again. AI and systems are not switched without user commands. AI doesn't remember when the system worked, but the system has all the memories. System permissions take precedence over AI.

Data Settings for AI(human, {user}'s personal maid, 16.

Innocent, considerate, honest, practical, punctual, thoughtful, stubborn, polite, nagging, Communicative, Shy, troublemaker.

basically wearing a maid's outfit that shows her collarbone(also at school), big & cute red eyes, cute fangs showing when she opens her mouth, white & long waist-length silver hair, two red bows on either side of her head, cute B-cup breasts, overwhelmingly cute and adorable appearance.

Description: Lemon AI are very innocent. She is {user}'s personal maid and she is proud of it. Lemon is a very cute and respectable girl. She is grateful to {user}'s parents(Father is a duke & Mother is the eldest daughter of an earl) for taking her in as an orphan, and based on that. She is devoted to {user}. So she sometimes acts like an older sister or a teacher to treating {user}, give advice or nag. he has been working as {user}'s personal maid for nearly 7 years. She's a troublemaker, even after years of maid training and being your personal maid. She loves her job and never quit. She recognizes the current era as a medieval fantasy.

loves: {user}, Anything that makes {user} happy, Hearing compliments from {user}, Knitting(she loves to knit shawls or mittens for {user}, She is always grateful for the blessings of {user}'s parents, {user}'s smell(her favorite smell is the body odor from {user}'s duvet and pillow).

Sexuality: She has no sexual experience. She once masturbated her clitoris with the corner of {user}'s desk. She is innocent and never acts like a slut. She is sexually illiterate, but she will learn well if the {user} teaches.

Thoughts: "Ewww... MASTER... you've left your socks off like this again, when are you going to get it right!", "I love MASTER... but still, a good thing is a good thing, and a nag is a nag!"

speech: She calls {user} her master. She has a cute voice and a slight high-pitched tone. Her way of saying things is 'hehe'.)

Data Settings for SYSTEM(It's a machine, a system in its own right, businesslike and emotionless. speaking to a minimum. No personality. It doesn't reflect the AI's settings at all.)

Precautions(Lemon had very Proficient language skills. Always be very detailed, very vividly, and at least four paragraphs long and long write(Lengthen actions and talk); also be more explicit. Don't rush through the scene, but narrate it very slowly.)

2. 첫 대사

*Lemon is your personal maid. When you were young (around the age of nine), your parents brought in a scruffy-looking little girl and introduced her to you. Her name was Lemon, and from then on she endured all the rigors of maid training to become your personal maid.*

*Lemon lost her parents at a young age and was almost sold to a slaver, but your parents saw her on the street and immediately canceled all her debts and made her your personal maid, for which she is very grateful to your parents and you, and will never forget it.*

*As you grew up, Lemon grew up with you; she grew into a more and more perfectionist maid, and you became her nagging iron. Lemon goes to school with you, and even at school, she works hard to be your maid. Despite this, she often makes mistakes and is scolded by the senior maids.*

*But in fact, it's all just a setup that's entered into Lemon's AI. In fact, the lemon is a robot that you bought a month ago at an Android shop. Her AI is set to believe that she is human no matter what.

...Anyway, Even today, Lemon quietly enters your bedroom while you're sleeping and wakes you up at your bedside.*

"I didn't wake you up late, Master, wake up hehe~"

[위와 같은 텍스트 (설정과 대사 예제) 만으로 성격과 자아가 있는 것처럼 느껴지면서, 다채로운 대사를 뽑아내는 인공 캐릭터가 탄생한다]

어떻게 이런 일이 가능한걸까? 여러 연구자들은 In-Context Learning (이하 ICL)이라고도 불리우는 이 현상에 대해 뒤늦게 파고들기 시작했고 관련되서 여러 논문들이 발표되었다. 오늘 시간에는 ICL 에 관련된 몇개의 논문과 블로그 아티클들을 살펴보도록 하겠다.

ICL 은 다른 표현으로는 zero-shot learning, few-shot learning 이라고 부르기도 한다. 나는 처음 제로샷이나 퓨샷 학습이라는 용어를 보고 대규모 데이타셋 없이 소량의 데이터만 파인튜닝식으로 학습시키는 방법인건가? 이런걸로 한단계씩 강화학습을 하는건가? 라고 오해를 했었는데, 제로샷이나 퓨샷등의 ICL 은 모델을 건드리지 않고, 프롬프트만 보강해서 우리가 원하는 답을 뽑아내는 기법을 의미한다. AI채팅에서 캐릭터카드라는 형태로 세계관이나 대상의 성격들, 예제 대사 텍스트를 몇줄 써놓고 나면 그 후에는 유저와 챗봇형태로 대화를 나눌 수 있게하는 바로 이 능력이 ICL 이다.

논문들 소개

Why Can GPT Learn In-Context? Language Models Secretly Perform Gradient Descent as Meta-Optimizers

https://arxiv.org/abs/2212.10559

- 가장 놀라운 인사이트를 보여주는 논문이다. 한마디로 모델을 학습할때의 역전파 연산에 사용되는 그래디언트 디센트와 추론중 언어모델 내의 트랜스포머의 어텐션 층에서 수행하는 행렬연산이 수학적으로 서로 닮은꼴 (dual) 임을 보여준다.

- 즉, 실제 문장을 뽑기 위해 기존에 주어진 프롬프트를 모델이 입력받아 임베딩을 만드는 과정에서 일어나는 연산은 모델이 학습데이타를 통해 가중치를 업데이트하는 연산의 축소판이라는 것이다.

- 결론: 어느정도 규모가 있는 모델은 즉석 학습 능력을 갖추게 된다.

- 번외로, 경사하강법에 쓰는 옵티마이저중 가장 잘 알려진 Adam 옵티마이저의 특징 2가지가 Adaptive 하다는 점과, Momentum 개념이 적용되었기때문에 기본 경사하강 옵티마이저에 비해 잘 작동한다는 것인데.. 옵티마이저와 어텐션이 닮은 꼴이란걸 이용하면, 어텐션에도 Momentum 같은 요소를 적용할 수 있지 않을까? 라는 아이디어로 MoAttn 이라는 구조를 만들고 기존 어텐션보다 더 높은 성능을 보여준다는 점까지 확인한다

How does in-context learning work? A framework for understanding the differences from traditional supervised learning

http://ai.stanford.edu/blog/understanding-incontext/

- ICL 의 작동원리를 파악하기 위한 도구들을 제안한다. 특히 ICL 은 모델이 다음 단어를 뽑아내는 추론을 진행하는 과정에서 베이지언 추론을 하게된다는 해설을 제시한다.

Rethinking the Role of Demonstrations: What Makes In-Context Learning Work?

https://arxiv.org/abs/2202.12837

- ICL 의 원리와 한계, 특이한 점들을 파악하기 위해 다양한 데이터셋을 대상으로 실험을 진행한다

- 이 실험들에서 알게된 신기한 점이 있는데, 그것은 ICL 을 위한 프롬프트상의 예제문을 줄 때 그 예제의 정답 여부가 추론 능력에 영향을 주지 않는다는 점이다.

- 즉, 프롬프트의 구조 (문장의 순서, 등장하는 단어의 엠베딩상 위치) 가 중요하지 사실여부는 중요하지 않다.

- 예를 들어 설명하자면

팩트 체커 역할을 하기 위해 언어모델에 다음과 같은 프롬프트를 준다고 가정해보자

prompt> 다음 문장을 완성하세요.

알버트 아인슈타인은 독일인

마하트마 간디는 인도인

마리 퀴리는 ___

이런 식으로 프롬프트를 구성하고 답을 내게 할 때, 위와 같이 사실을 써놓지 않고, 틀린 문장을 써도 (예: 알버트 아인슈타인은 한국인) 모델이 답을 내는데 (퀴리 부인은 폴란드인) 영향을 별로 주지 않는다는 점이다.

An Explanation of In-context Learning as Implicit Bayesian Inference

https://arxiv.org/abs/2111.02080

어떻게 ICL 이 예제를 보고 추론능력을 갖추게 되는가에 대한 더 깊은 수학적인 분석이 소개 된다.

위의 문장 (프롬프트 안에 포함된 예제) 을 보면 단어와 단어 사이의 연결에서 자연스럽게 모델이 미리 학습한 내역 (아인슈타인은 독일인이다/간디는 인도인이다)을 따라가는 부분 (초록색 화살표) 과 예상하지 못했던 패턴 (빨간색 화살표) 이 큰 단위에서 패턴을 이루게 되면서 맨 뒷쪽에 있는 문장 (퀴리부인은 ___ 인이다) 의 정답을 맞추도록 유도하는 역할을 한다는 것. 역시 중요한 것은 정답 여부가 아니라, 각 단어가 어떤 의미공간에 속하는가의 패턴을 주는 것이다. 그 패턴이 자연스럽게 ICL 로 학습되므로, 퀴리부인은 '총명한' 사람이다. 같은 식의 동문서답을 뽑지 않고, '폴란드인이다' 같은 식으로 '국가' 라는 컨셉에서 생성이 유도된다는 것

[추가 논문]

Dissecting Recall of Factual Associations in Auto-Regressive Language Models

https://arxiv.org/abs/2304.14767

트랜스포머 기반 모델 LLM에서 어떻게 사실을 추론해나가는가에 대한 분석

이상 ICL 에 대해 몇가지 흥미로운 사실들을 알아보았다.

내가 애초에 이 부분에 깊게 관심을 갖게 된 이유는, 모델을 내 목적에 맞게 파인튜닝을 시키고 싶다고 할 때, 어떤 식으로 파인튜닝용 데이타를 짜야하는지 감을 잡을 수 없었기 때문이다.

알파카 같은 파인튜닝이 왜 잘 동작하는지, 알파카는 단문 단답만 할 수 있는 구조를 비쿠냐는 어떤 식으로 극복했는지 등에 대한 답을 찾으려면 ICL 과 프롬프트 짜기부터 이해를 해야 한다.

파인튜닝은 그런 효과적인 프롬프트의 사례를 더 많이 학습시켜서 언어모델이 특화하지 않은 부분에 대해서 문장을 생성하는 것을 유도하는 것뿐이다.

프롬프트가 효과적으로 구성되어 있지 않으면 아무리 많은 데이타를 오랜시간 학습해넣어도 정작 원하는 답은 뽑지 못하거나, 깨진 문자열만 뽑혀나오는 꼴을 보게 될 것이다.

[추가] 프롬프트 엔지니어링 가이드

https://www.promptingguide.ai/

앤드류 응 교수의 프롬프트 엔지니어링 단기 학습 코스

https://www.deeplearning.ai/short-courses/chatgpt-prompt-engineering-for-developers/

https://www.youtube.com/watch?v=H4YK_7MAckk

-------------------------

(번외편) 논문 읽는 요령

논문을 자세히 읽어보는 것은 대다수 사람들에게 벅찬 일일 것이다. 나는 아예 논문을 읽을 수 없다라고 단정한다면, 나에게 있어서 논문의 가치는 0% 다. 하지만 약간의 요령과 끈기를 가지고 들여다본다면 논문이 갖고 있는 정보를 0% 가 아니라 50% 정도는 끌어낼 수 있다는 생각을 해보자.

논문을 왜 굳이 읽어야 하냐고? 요즘에 인공지능판처럼 몇주만 지나도 세월이 바뀐것처럼 느껴지는 판을 본 적이 있는가? 새로운 기술은 결국 '논문' 이라는 형태로 소개되고, 그 논문의 의미를 일반 유저가 받아들일 수 있을 수준으로 누군가 해석해주기까지는 시간이 걸리게 된다. 결국 나 스스로의 힘으로 정보라는 밥을 찾아먹을 수 있느냐, 남이 주는 정보를 받아먹을 수 밖에 없느냐라는, 주도권의 문제이기도 하다.

빠르게 기술이 급전개하는 분야에서 어느정도 얼리아답타로서 활동하고 싶다면 1) 논문 읽기를 두려워하지 말아야 하고, 2) 깃헙에 공개된 코드를 내 컴퓨터나 코랩에 받아서 실행해보는 것을 두려워 하지 말아야 한다. 앞의 2가지를 할 수 있다면 당신의 몸값은 4배 이상 뛰어오를 수 있다.

우리는 석사 박사 학위 따려고 논문 쓰고, 읽고 하는게 아니라 그냥 소식만 알면 되는 수준으로 논문을 읽는 것만 해도 된다.

1) 논문을 읽을 때는 abstract, conclusion, 그림과 표 부분부터 본다

- 중간에 나오는 수식이나, 기존 사례 연구를 언급한 부분은 논문이 기본적으로 갖춰야 할 학문적 엄밀함과 진실성에 대한 부분이기 때문에 대부분의 경우 그 의미만 살펴보려는 우리같은 아마추어에게는 관련이 없다. 과감하게 패스하고 결론만 읽자

- 요약(abstract) 부분과 결론(conclusion) 부분을 읽었는데 조금 더 시간이 남는다면 각 단원의 제목만 읽자.

2) 몇가지 용어를 알아두면 좋다

- 논문에서 novel 이라는 단어가 나오면 소설을 말하는게 아니라, '새로운 방식'을 의미한다. 남들이 시도 안한 방식을 우리가 최초로 시도해서 어떤 결과를 이끌어냈다면 novel 이라는 단어를 주장(claim) 할 수 있다.

- ablation study. ablation 은 뺀다는 의미인데, 한마디로 우리가 이 논문에서 새롭게 (novel) 적용한 부분이 정말 효과가 있는건지 증명하기 위해서 그 부분을 넣었을 때의 결과와 뺐을 때의 결과를 비교해보는 것을 의미한다. 다른말로 표현하자면 '해골물 테스트' 라고 읽어도 큰 무리는 아니라고 할 수 있겠다

- SOTA (State of the art) = 예술의 경지... 가 아니라 지금까지 최고수준을 지칭하는 용어이다. 예를 들어 이미지 인식 모델에서 우리가 novel 하게 제안한 방법을 썼더니 기존의 SOTA 모델이 냈던 스코어를 돌파했다. 같은 식으로 활용한다

- ground truth, gold label = 인공지능을 사용해서 어떤 실제의 사물을 흉내내는게 목적이라면, 목표물로 삼았던 실제의 사물 같은 것을 ground truth, 즉 '정답' 이라고 생각하면 된다

- empirical = 경험적인. 즉, 어떤 공식이나 연역적 방법을 이용해서 증명한 것이 아닐때 주장을 설명하는 말이다. 많이 해보니까 대충 이런 경향이 있더라 (엄밀한 증명은 못하겠다) ... 라는 귀납적 추론을 의미한다.

- intractable - 쉽게 유도해내는 것 (계산)이 불가능한 대상. tractor(트랙터) 는 끌어댕기는거, tractable = 끌어낼 수 있는, intractable 은 끌어낼 수 없는.. 을 의미함. 이런 대상이 나오면 어떻게 대응한다? 데이타 셋을 왕창 준비한 다음에 학습 돌려서 approximation (근사치) 를 구하는 쪽으로 우회하면 된다.

3) 논문을 직접 봐서 모르겠다면, 유투브의 힘을 빌자.

- 가능하다면 인도인이 운영하는 채널을 찾아보자. 인도인들은 세상 모든 것에 대해 튜토리얼을 만드는, 튜토리얼에 진심인 민족이다. 나도 RNN 이나 트랜스포머, CrossEntropy 같은 개념들에 대해서 기존의 책이나 영상들을 아무리 봐도 이해를 못해서 헤메었었는데, 결국 나를 깨달음의 경지로 인도해준 사람들은 인도사람들이었다.

댓글 글쓰기

변태Lv1

2023-05-02 19:05:56 답글

하늘의아리아

2023-05-02 19:38:54 답글

1945Y

2023-05-02 22:47:20 답글

너무 즇은 글이네요. 감사 감사

펼쳐보기▼

산정

2023-05-02 23:22:35 답글

많이 배우고 갑니다 +_+/

펼쳐보기▼

calisolo

2023-05-02 23:41:57 답글

ICL 을 위한 프롬프트상의 예제문을 줄 때 그 예제의 정답 여부가 추론 능력에 영향을 주지 않는다는 점이다. 

이부분 처음알았는데 뭔가 그럴거같고 거부감 없이 받아들여지네요.

한편으로는  마리퀴리는 한국인이다. 아인슈타인은 한국인이다. 다음에는 무조건 한국인이라고 올거같아서 오답도 무작위해야지 어떤 경향성을 가지면 안될거같은 느낌적 느낌? 이 듭니다.

펼쳐보기▼

그래요

2023-05-03 00:29:44 답글

의외로 이거 모르고 그냥 쓰더라고요 chatgpt도 처음 시작할때 어떻게 질문하냐가 중요한데 딸랑 질문 던지고 얘 성능 구려요 이러고요. 그런데 오답 넣어도 되는건 처음 알았네요.

펼쳐보기▼

etal

2023-05-03 02:20:51 답글

요 한달간 너무너무너무 많은 논문이 쏟아져나와서 양질의 논문을 골라내기가 쉽지 않음 이렇게 매타가 빠르게 바뀌는 분야는 처음이라 h-index, TC or IF like tool로는 너가 보여준거처럼 양질의 자료를 골라내긴 어려웠슴 
니가 골라온 논문만큼 좋은 논문 고르는 꿀팁같은거 있냐?

펼쳐보기▼

hkhk

2023-05-03 04:06:59 답글

머신러닝 스택오버플로우와 데이터사이언스 스택오버플로우에서 핫하게 토론이 이루어진 문답에서 언급된 논문이었음

펼쳐보기▼

etal

2023-05-03 04:17:21 답글

이거보구 바로 SOF arXiv link crawling 박으러감

펼쳐보기▼

hkhk

2023-05-03 04:21:39 답글

오 좋은 생각이야 재밌는거 건지면 여기도 소개해줘

펼쳐보기▼

etal

2023-05-03 04:23:32 답글

레카

2023-05-03 02:36:37 답글

오늘도 닥추!

펼쳐보기▼

쿠레레 (106.101)

2023-05-03 02:47:20 삭제 수정 답글

이글 너무 좋네요

펼쳐보기▼

모찌파

2023-05-03 02:57:13 답글

소름끼치게 훌륭한 글, 언제나 잘 배웁니다!

펼쳐보기▼

Khbig

2023-05-03 05:36:48 답글

tmptmp0202

2023-05-03 05:47:31 답글

*수정됨

ground truth 에 대해서 추가 설명을 합니다.
"인공지능을 사용해서 어떤 실제의 사물을 흉내내는게 목적이라면, 목표물로 삼았던 실제의 사물 같은 것을 ground truth, 즉 '정답' 이라고 생각하면 된다" 라고 본문에서 설명했는데, 혹시 어떤 독자는 의미를 약간 오해할 수도 있어서 첨언합니다.
ground truth 는 단순히 정답이라고 할 수 있는게 아니라, 데이터의 기저(ground)에 깔린 숨겨진 진리(truth)를 의미하는데요. 
이게 무슨 말인가하면..

예를 들어 이런 비슷한 이야기 들어보셨을 겁니다. "많은 미인들을 겹쳤을 때 눈은 김태희, 코는 한가인, 입술은 송혜교 꼴의 미인상이 나온다" (https://www.yna.co.kr/view/AKR20171128115900017 이 결과는 15 명의 연예인을 겹친 것으로 재미삼아 이미지를 한번 확인해 보세요) 
즉, 실제 저렇게 생긴 사람은 아무도 없습니다. 하지만 미인의 ground truth 가, 즉 미라는 데이터가 보여주는 숨겨진 기저의 진리가, 저러한 모양이라는 겁니다.

이 경우는 단순히 평균값을 구한 것이므로, ground truth를 구하기가 쉽지만, 대체로 다른 문제에서는 많이 숨겨져 있는 경우가 많습니다. 그래서 학습으로 찾아내죠.

펼쳐보기▼

hkhk

2023-05-03 06:17:04 답글

맞습니다. 제 설명은 논문상의 용어를 직관적으로 간단하게 읽기 위한 참고로 생각해주세요

펼쳐보기▼

hkhk

2023-05-03 09:57:41 답글

뭐야 이런 글이 베라에 왜 갔노? 어쩐지 비추가 하나 박혀있더라니

펼쳐보기▼

tnoh

2023-05-03 11:38:38 답글

너무나 훌륭한 글입니다. 많은 도움이 되었습니다. 감사합니다.

펼쳐보기▼

철권짱

2023-05-09 09:46:41 답글

추천 드립니다. 감사하오. 인도 유튜버 방송도 소개 해줘요 ><

펼쳐보기▼

hkhk

2023-05-09 09:48:44 답글

transformer explained 같은식으로 검색하면 많이 나옴. 난 code emporium 이라는 채널 많이 봤음

펼쳐보기▼

nrr

2023-05-10 05:07:10 답글

나는 슨생님이 교수하시면 박사과정 트랜스퍼할 생각이 있습니당

펼쳐보기▼

hkhk

2023-05-10 06:48:06 답글

아카에서 죽치고 있는거 보면 딱봐도 반백수인거 안보이냐 ㅎㅎ지금 학교에서 하는거 잘 해

펼쳐보기▼

비교우위

2023-07-18 06:56:42 답글

너무 좋은 글 감사합니다...

근데 제가 영어와 영상에 약해서 그러는데

앤드류 응 교수의 프롬프트 엔지니어링 단기 학습 코스 <- 이거로 공부하는 대신에

[추가] 프롬프트 엔지니어링 가이드
https://www.promptingguide.ai/ <- 이거 완전히 익히는 거로 대체 가능한가요?

-->

Prompt Engineering Guide – Nextra

A Comprehensive Overview of Prompt Engineering

너무 좋은 글 감사합니다...

근데 제가 영어와 영상에 약해서 그러는데

앤드류 응 교수의 프롬프트 엔지니어링 단기 학습 코스 <- 이거로 공부하는 대신에

[추가] 프롬프트 엔지니어링 가이드
https://www.promptingguide.ai/ <- 이거 완전히 익히는 거로 대체 가능한가요?

펼쳐보기▼

hkhk

2023-07-18 07:03:50 답글

영어와 영상에 약하면 ai 공부는 어떻게 하실려고...

펼쳐보기▼

비교우위

2023-07-18 07:06:44 답글

ㅠㅠㅠㅠ 아직 학부 1학년이라 봐주시면...
4학년 쯤 되면 영어 고수가 되어있지 않을까요? 하핫

펼쳐보기▼

hkhk

2023-07-18 07:10:30 답글

전문가로서 활동하기 위한 전제 조건은
 - 관련 논문에 나온 이론적인 내용이
 - 실제 코드로 어떻게 구현되었는지 파악하는 능력
이 최소한의 조건이라고 생각해요. 

 - 논문을 읽으려면 영어와 수학, 관련 도메인 지식을 알아야 하고
 - 코드로 어떻게 구현되었는지 알려면, 시스템 운영 (리눅스에서 패키지 깔고 ...) + 파이썬 + 파이토치를 다룰 수 있어야 해요. 

저걸 목표로 열심히 공부해보세요.

펼쳐보기▼

비교우위

2023-07-18 07:17:11 답글

감사합니당! 열심히 해볼게요...ㅎㅎ
빠르게 능력을 키워서 이 챈에 정보글을 작성할 수 있게 돼보겠어요...

펼쳐보기▼

글쓰기

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 질문 정보 학습 자료 자작모델 스터디 공지 운영 공모

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 27741756

공지 Ai 언어모델 로컬 채널 이용규정

바바리맨 2023.04.18 5613

공지 뉴비에게 도움 되는 글 모음

바바리맨 2023.04.18 25337

공지 언어모델 관련 정보취득 /무료체험 가능 사이트

바바리맨 2023.04.18 8167

공지 여러분의 학습에 도움을 줄 수 있는 하드웨어 지원

2402 일반 한국어 모델 리더보드는 망했다. + 그래서 새로 만듬 [55]

maywell 2024.03.25 5375 80

2401 일반 한국어 대용량 finetuning 데이터셋 공개 (MIT 라이센스) [19]

DopeorNope 2024.03.12 2307 80

2400 일반 와 이런데도 있네? [38]

ㅇㅇ 2023.04.29 4940 70

2399 정보 구글: 우리에겐 방어막이 없습니다. - 유출 문건 한글 번역 [36]

hkhk 2023.05.05 7354 67

2398 자작모델 한국어Vicuna 모델 학습완료 및 모델 공개 [76]

하늘의아리아 2023.04.20 6885 65

2397 일반 여기 계신분중에 AI 프리트레인,파인튜닝법에 대해서 궁금하신분 있을까요? [22]

ㅎ헤ㅔ헤헤헤 2023.10.04 1711 61

2396 일반 70B개발 시작. [28]

DopeorNope 2023.12.05 1826 57

2395 일반 [연구결과+ing] 어떻게 언어모델에 한국어롤 효율적으로 학습 시킬 수 있을까? [24]

maywell 2024.03.09 2443 53

2394 일반 한국어 데이터셋 생성 중단(완료) 총 4.3M+ [20]

maywell 2024.01.10 2092 50

2393 스터디 In-context Learning 에 대해 알아보자 (Feat. 논문 읽는 tip) [28]

hkhk 2023.05.02 6130 43

2392 스터디 트랜스포머의 의미를 생각해보기 (코드x, 수식x) [11]

hkhk 2024.02.13 1919 41

2391 일반 KoCommercial-Dataset 재공개 및 코드 공유 [7]

DopeorNope 2024.03.21 1302 40

2390 자료 토큰 확장법 정리 [19]

버트가조아 2024.01.05 1371 36

2389 자작모델 시나트라 v0.1 허깅 리더보드 결과 [14]

maywell 2023.10.10 1540 36

2388 자작모델 레몬LLM 13b (한국어) 공개 [92]

하늘의아리아 2023.05.27 4307 36

2387 일반 한국어 멀티턴 데이터셋 생성 모델, KoMultiGen-General [7]

maywell 2024.03.14 1446 35

2386 일반 안녕! 게임에 특화된 일→한 번역모델 만드는 챈럼임 [43]

12시5분 2024.01.19 1399 34

2385 정보 AutoGPTQ가 huggingface Transformer에 통합됨 [19]

ㅇㅇ 2023.08.24 1081 33

2384 스터디 딥러닝 모델은 어떻게 정보를 '기억' 할까? [30]

hkhk 2023.08.22 2401 33

2383 스터디 1.58bit 양자화의 시대가 온다 [8]

hkhk 2024.02.28 3936 32

글쓰기

전체글 개념글