인텔, 새로운 가우디 3 AI 칩으로 엔비디아를 겨냥하다 - AI 채팅 채널

AI 채팅 채널

채널위키 알림 알림 중 알림 취소

구독자 10412명 알림수신 224명 @몽상봉인

AI와 대화하며 유사 인싸체험 하는 채널

뉴스/팁 인텔, 새로운 가우디 3 AI 칩으로 엔비디아를 겨냥하다

추천 4 비추천 0 댓글 0 조회수 118 작성일 2024-04-09 21:03:05

https://arca.live/b/characterai/103275559

https://the-decoder.com/intel-takes-aim-at-nvidia-with-new-gaudi-3-ai-chip/
https://www.intel.com/content/www/us/en/newsroom/news/vision-2024-enterprise-ai-gaudi-3-open-systems-strategy.html

인텔은 비전 2024에서 새로운 AI 가속기인 가우디 3를 공식적으로 소개했습니다.

인텔에 따르면, 가우디 3는 7B 및 13B 파라미터의 라마2 모델과 175B 파라미터의 GPT-3 모델의 훈련 시간을 엔비디아 H100에 비해 약 50% 단축할 수 있을 것으로 예상됩니다. 또한 Gaudi 3는 추론 처리량 측면에서 모델에 따라 평균 약 50%, 30% 정도 H100 및 H200 GPU를 능가할 것으로 예상됩니다.

표준 가우디 3는 12.8TB/s 대역폭의 96MB 온보드 SRAM 캐시와 3.7TB/s 피크 대역폭의 128GB HBM2e 메모리를 갖추고 있습니다. 인텔에 따르면 이 칩은 이전 제품 대비 2배의 FP8 및 4배의 BF16 처리 능력과 2배의 네트워크 대역폭, 1.5배의 메모리 대역폭을 제공합니다. 또한 5nm AI 가속기는 H100보다 훨씬 저렴하다고 합니다. 하지만 엔비디아는 이미 Blackwell 아키텍처를 적용한 새로운 제품을 보유하고 있습니다.

인텔, AI를 위한 개방형 플랫폼 계획

Gaudi 3를 통해 기업은 단일 노드에서 메가 클러스터에 이르기까지 최대 수만 개의 가속기를 사용하여 AI 시스템을 유연하게 확장할 수 있습니다. 인텔은 개방형 커뮤니티 기반 소프트웨어와 표준화된 이더넷 네트워킹에 의존하고 있습니다. 가우디 3는 2024년 2분기부터 델, HPE, 레노버, 슈퍼마이크로를 비롯한 OEM에 제공될 예정입니다. 에어텔, 보쉬, IBM, 네이버, SAP 등 인텔 가우디 액셀러레이터의 새로운 고객 및 파트너사도 소개되었습니다.

인텔은 또한 SAP, 레드햇, VM웨어 등의 파트너와 함께 엔터프라이즈 AI를 위한 개방형 플랫폼을 구축할 계획입니다. RAG(검색 증강 세대) 접근 방식에 기반한 안전한 GenAI 시스템 도입을 가속화하는 것이 목표입니다. 이를 통해 독점 데이터 소스를 오픈 소스 언어 모델과 결합할 수 있습니다.

댓글 [0]

본 게시물에 댓글을 작성하실 권한이 없습니다. 로그인 하신 후 댓글을 다실 수 있습니다. 아카라이브 로그인

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 질문 뉴스/팁 AI대화 공지 운영 뉴스(공사중)

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 28533245

공지 안 읽으면 죽어버리는 AI 채팅 채널 이용규정 [23.09.18]

몽상봉인 2023.05.22 48722

공지 AI 채팅 채널에 왔으면 이것부터 : 필수정보 및 FAQ

몽상봉인 2023.05.22 100587

공지 신문고 MK.IX (해줘. 할때 쓰는 곳)

몽상봉인 2024.03.19 8346

공지 ㅡㅡ [ AI 게임 / 기획 / 리뷰 대회 ' J.O.A.T ' 개최 ] ㅡㅡ

골든햄스터 2024.03.31 4544

공지 ---[천박 대회2 마감]---

hyeoyoms 2024.05.22 415

공지 [DOL 봇 대회 수상자 발표]

WH_ 2024.04.27 1719

공지 AI 채팅 채널 프록시 게이트

몽상봉인 2023.07.12 22388

숨겨진 공지 펼치기(3개)

3770 뉴스/팁 MS, 경량모델 Phi 3 발표 [10]

돕아킨 2024.04.23 630 15

3769 뉴스/팁 NAI를 활용해 쿰질하는 챗붕이들을 위한 토막팁... [6]

겸허견실 2024.04.22 631 6

3768 뉴스/팁 런포드 서버리스에 vLLM 추가됨 [3]

IlIlIllIlIIllIl 2024.04.22 229 6

3767 뉴스/팁 [뉴비팁] 실리태번에서 투게더AI 위자드 Chat Completion으로 먹는 법 [7]

pork 2024.04.22 496 6

3766 뉴스/팁 작노/글노는 아무 의미가 없다 [23]

토트 2024.04.22 1157 35

3765 뉴스/팁 VLLM 이제 logit_bias 지원함 [17]

이하비스 2024.04.22 388 5

3764 뉴스/팁 메타의 CEO 마크 저커버그가 100억 달러 규모의 AI 모델을 기꺼이 내놓은 이유 [6]

지코원샷 2024.04.21 317 7

3763 뉴스/팁 프롬프트에 수백 개의 예제를 넣으면 LLM 성능을 크게 향상시킬 수 있다는 연구 결과가 나왔습니다. [9]

지코원샷 2024.04.21 422 5

3762 뉴스/팁 연구진이 자체적으로 사회 실험을 설계하고 실행하는 LLM 기반 시스템 공개

지코원샷 2024.04.21 216 6

3761 뉴스/팁 리스 1.97.2 오픈라우터 업데이트 [12]

모올루 2024.04.21 1172 29

3760 뉴스/팁 위자드LM 2의 가격 변동은 프로바이더 우선순위 변경 때문입니다. [21]

하나악 2024.04.21 1017 19

3759 뉴스/팁 더타임즈) 영국이 AI 규제에 골몰하는 동안 미국 혼자 혁신 중 [9]

조선닌자핫토리 2024.04.21 409 7

3758 뉴스/팁 DeepMind가 제너레이티브 모델을 주도하면서 구글의 AI 통합은 계속되고 있습니다.

지코원샷 2024.04.21 122 0

3757 뉴스/팁 CAI로 실제인물인 것처럼 인터뷰했다가 해임된 사례가 있네 [14]

890 2024.04.20 1199 25

3756 뉴스/팁 OpenAI, 엘론 머스크에 반격, 소송 청구에 대해 '수정주의 역사'라고 주장하며 기각 요청 [2]

지코원샷 2024.04.20 243 8

3755 뉴스/팁 곧 반영 될 리스 1.97 업뎃 미리보기 (부제: 로컬 편의성 씹떡상) [16]

모올루 2024.04.20 1112 39

3754 뉴스/팁 포브스) 엔비디아가 AI 채팅이 들어간 추리 게임 데모를 선보임 [10]

조선닌자핫토리 2024.04.20 394 7

3753 뉴스/팁 메타 AI는 웹 검색에 Google 및 Bing 알고리즘을 사용합니다.

지코원샷 2024.04.20 123 0

3752 뉴스/팁 Groq, 초고속 라마3 8B/70B 무료 제공 [7]

도지도지 2024.04.20 565 7

3751 뉴스/팁 오픈라우터 min_p 관련 문제점 [13]

몽상봉인 2024.04.19 877 13

3750 뉴스/팁 독일의 지식 근로자들은 AI가 사무실에 침투함에 따라 주저하고 있다는 Microsoft 연구 결과

지코원샷 2024.04.19 218 4

3749 뉴스/팁 선택적 언어 모델링: 새로운 방법으로 더 적은 데이터로 더 나은 모델링 가능 [1]

지코원샷 2024.04.19 163 4

3748 뉴스/팁 미국 저작권청은 ChatGPT의 도움으로 작성된 책에 대해 부분적인 저작권을 부여합니다.

지코원샷 2024.04.19 195 3

3747 뉴스/팁 프롬프팅을 해보고 싶은데 어려워 보여서 고민이라면. [14]

하나악 2024.04.19 689 34

3746 뉴스/팁 min p가 도입된 배경 설명 [22]

몽상봉인 2024.04.19 1000 38

3745 뉴스/팁 오픈라우터 위자드 유저들은 지금당장 리스AI를 찬양하십시오. (해골물 판정) [44]

하나악 2024.04.19 1779 26

3744 뉴스/팁 오늘 새벽에 추가된 리스 Incomplete 기능 2개 설명 [22]

모올루 2024.04.19 834 31

3743 뉴스/팁 AIN 신모델 떡밥

하이퍼토린사마 2024.04.18 224 6

3742 뉴스/팁 곧 NAI 퍼리 모델이 나온다 [14]

조선닌자핫토리 2024.04.18 704 13

3741 뉴스/팁 라마3 400b 벤치마크 + 클로드 비교 [7]

가능친구 2024.04.18 555 7

3740 뉴스/팁 라마 3 8B/70B 출시 [3]

하나악 2024.04.18 429 5

3739 뉴스/팁 라마3 8b, 70b 벤치마크 [9]

가능친구 2024.04.18 665 12

3738 뉴스/팁 자바스크립트로 가중치 랜덤 관리하기 [3]

야미나베 2024.04.18 162 8

3737 뉴스/팁 라마3 8B에서 70B [1]

K아논 2024.04.18 406 8

3736 뉴스/팁 잼있는기사) ChatGPT가 선호하는 용어에 대한 단상 [21]

ecf70e1c 2024.04.18 935 26

3735 뉴스/팁 투게더에 mixtral 8x22b instruct나옴 [4]

ㅇㅇ 2024.04.18 380 1

3734 뉴스/팁 블룸버그) JP모건은 AI 기술을 적극 도입할 것

조선닌자핫토리 2024.04.18 104 0

3733 뉴스/팁 파일 검색, 벡터 저장 등이 개선된 OpenAI의 어시스턴트 API가 대대적으로 업데이트되었습니다. [1]

지코원샷 2024.04.17 226 6

3732 뉴스/팁 오픈 소스 LLM의 새로운 기록을 세운 미스트랄의 Mixtral 8x22B [2]

지코원샷 2024.04.17 339 6

3731 뉴스/팁 API를 통해 Stable Diffusion 3 사용 가능, 오픈 웨이트 출시 예정 [6]

지코원샷 2024.04.17 307 7

3730 뉴스/팁 전 OpenAI 이사회 멤버, 최고 AI 기업에 대한 감사 요청

K아논 2024.04.17 152 5

3729 뉴스/팁 미스트랄, Mixtral-8x22B-v0.1 출시 [22]

야코이 2024.04.17 839 25

3728 뉴스/팁 뉴비팁) 오픈라우터를 통해 리스AI에서 위자드 LM 2 8x22B 사용하기 [53]

하나악 2024.04.17 3541 44

3727 뉴스/팁 포브스) 엔비디아, 간호사보다 뛰어난 간호사 모델 발표

조선닌자핫토리 2024.04.17 126 2

3726 뉴스/팁 블룸버그) 깃헙 코파일럿은 편리하지만 완벽하지 않음 [2]

조선닌자핫토리 2024.04.17 141 2

전체글 개념글