엄청난 괴물을 만들어냈다.. - 코딩 채널

알림 알림 중 알림 취소

구독자 4411명 알림수신 85명 @은월영

프로그래밍 및 코딩 채널

AI·Data 엄청난 괴물을 만들어냈다..

Zeya

추천 0 비추천 0 댓글 5 조회수 322 작성일 2022-12-04 09:44:08 수정일 2022-12-04 09:44:18

https://arca.live/b/programmer/64480903

귀신같이 구멍으로 달려가서 꼬라박음

가중치 설정이 잘못된 것도 아닌데 왜....

q_table[state, action] = 

q_table[state, action] + learning_rate * 

(reward + discount_rate * (q_table[new_state, np.argmax(q_table[new_state,])]) - q_table[state, action])

식이 이게 아닌가?

새로 간 new_state에서의 가장 높은 밸류를 넣어야 하는게 맞는 것 같은데 돌아버리겠네

댓글 [5] 글쓰기

음음믕믕

2022-12-04 11:32:05 답글

np.argmax 부분에서 q[new, ""]인데 두번째 인자 안줘도 되나요?

펼쳐보기▼

Zeya

2022-12-04 11:38:09 답글

리스트로 반환되는거 확인하고 넣었습니다 env.step이 이상한게 action을 취했을때 같은 state에서 같은 action을 취하면 같은 결과가 나와야 하는 거 아닌가요? 반복문에 STATE랑 ACTION에 구체적인 값 넣고 반복 출력했을때 계속 값이 달라져버리는데 ENV.STEP(ACTION)이 취하는 ACTION은 어디서 볼 수 있는 지 몰라서 확인을 못하고 있어요

펼쳐보기▼

음음믕믕

2022-12-04 11:41:09 답글

흠..진짜 뭐가문젤까요 식은 아마 맞을텐데

펼쳐보기▼

KamaPytorq

2022-12-04 16:15:35 답글

인공지능의 현실을 깨달은 AI는 그만 비극적인 선택을

펼쳐보기▼

감자감자

2022-12-04 16:32:08 답글

AI는 탈출을 꿈꾼다..

펼쳐보기▼

댓글 작성

업로드 중

0초

녹음 중지 삭제

글쓰기

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 공지 정보 질문 잡담 유머 C/C++ C# Python Java Front-end Back-end 앱·겜 AI·Data 그 외

번호 제목

작성자 작성일 조회수 추천

그 외 Ping of death 무조건 리눅스 이용해야함??

후후네네 2022.12.05 85 0

AI·Data 정신을 차렸구나 agent야!

Zeya 2022.12.05 190 1

질문 새로 언어 배워보고 싶은데 뭐 배워볼까요? [8]

noobnoob12 2022.12.05 173 0

유머 세뇌조교 [3]

KamaPytorq 2022.12.05 699 11

AI·Data 진짜 미안한데 코드에 이상 없는지만 봐줄 수 있을까 [2]

Zeya 2022.12.05 234 0

AI·Data rl 학습자료 frozen lake질문 있음 [2]

Zeya 2022.12.04 97 0

python에서 time 모듈 관련 질문

어디로가야하고 2022.12.04 80 1

뭐야 코딩하려면 비쥬얼 스튜디오 깔았어야 했음? [20]

만마전차 2022.12.04 251 0

질문 C# 어디서 공부함 좋음? [2]

만마전차 2022.12.04 169 0

질문 파이썬 참 어렵습니다.. [4]

eraserman 2022.12.04 200 1

AI·Data 엄청난 괴물을 만들어냈다.. [5]

Zeya 2022.12.04 322 0

AI·Data 내 agent는 병신이야..... [4]

Zeya 2022.12.04 200 1

질문 유튜브나 네이버 동영상 크롤링 하려고 실행하면 크롬창이 바로 닫히는데 아는 게이 있음? [12]

우르자 2022.12.04 159 0

질문 Python 완전 뉴비 질문 [2]

아조아요 2022.12.04 112 0

질문 Virtual memory 관련 질문 [4]

가다라다 2022.12.04 117 0

Python 백준 28일차 갈무리 + BOJ 5651 [1]

Q9 2022.12.03 124 0

Back-end 패스워드 암호화 할려고 SHA-256 쓸려했는데 [5]

악해병당고가너무좋아준코님 2022.12.03 213 2

질문 R ggplot 색상 삽입에 대한 질문입니다...

잊혀진빛샘 2022.12.03 47 0

질문 멀티 스레드 관련해서 궁금한게 있는데 [15]

가다라다 2022.12.03 210 0

질문 어떤 공부를 해야할지 질문 드립니다 [9]

ㅇㅇ (61.253) 2022.12.03 253 0

글쓰기

전체글 개념글