AMD CEO Lisa Su는 오늘 Accelerated Data Center 이벤트에서 3D V-Cache라는 3D 스택 L3 캐시와 함께 제공되는 회사의 EPYC Milan-X 프로세서에 대한 첫 번째 세부 정보를 공개했습니다. AMD는 새로워진 밀란 엑스 “Milan-X 칩”을 만들기 위해 기존 Zen 3 기반 EPYC Milan 모델에 추가할 새로운 캐시 스택 기술이 칩당 최대 768MB의 L3 캐시를 제공할 예정입니다.
곧 시스템에 1.5GB의 L3 캐시가 탑재된 듀얼 소켓 서버가 등장할 것임을 의미합니다. AMD는 또한 이점을 얻을 수 있는 워크로드의 몇 가지 예와 60% 성능 향상을 보여주는 인상적인 벤치마크 결과를 공유했습니다. 칩은 2022년 1분기에 출시되지만 현재 Azure에서 미리 보기 인스턴스로 사용할 수 있습니다.
AMD EPYC Milan-X 브이캐시 기술
AMD 는 CES 2021에서 3D V-Cache 기술 을 소개 하여 추가 L3 캐시가 장착된 3세대 Ryzen 프로토타입을 선보였습니다 . 3D V-Cache는 Ryzen 컴퓨팅 칩렛 위에 수직으로 적층된 추가 64MB 7nm SRAM 캐시를 융합하여 Ryzen 칩당 L3 캐시의 양을 3배로 늘리는 새로운 하이브리드 본딩 기술을 사용합니다. AMD는 일부 게임에서 최대 15%의 성능 향상을 가져 온다고 주장합니다. 이는 해당 칩이 내년 초 시장에 출시될 때 최고의 게임용 CPU 라는 타이틀을 놓고 경쟁할 것임을 의미하며 Hot Chips에서 패키징 기술에 대한 심층 정보를 포함하여 해당 칩에 대해 더 많은 세부 정보를 배웠습니다.
올해 초 발표. AMD MI250X GPU 공개
AMD는 오랫동안 소문이 난 Milan-X 데이터 센터 프로세서에 이 동일한 기술을 적용하고 있지만 아직 새 칩의 세부 사양을 공유하지 않았습니다. 그러나 브리핑과 미주를 통해 칩이 이전에 유출된 제품 스택 목록 과 함께 최소 16, 32 및 64코어 변형으로 제공될 것임을 확인했으며 실제로 B2B 소매점에서 판매 목록에 올려진 것을 보았으며 다음은 현재까지알려진 AMD M125X 그래픽카드의 사양입니다.
소비자 변형과 마찬가지로 AMD는 각 CCD(컴퓨팅 칩렛)에 이미 있는 L3 캐시 바로 위에 단일 6x6mm L3 캐시 레이어를 쌓습니다.
각 CCD에는 수정 전 32MB의 L3 캐시 가운데 수직으로 쌓인 L3 캐시 슬라이스를 추가하면 64MB의 캐시가 추가되어 CCD당 총 96MB가 됩니다. Milan-X 칩은 8개의 CCD가 있는 최대 64코어 모델까지 확장되며 칩당 총 768MB의 L3 캐시를 제공합니다. AMD는 자사 칩이 더 높은 L3 스택을 지원한다는 것을 확인했으며, HardwareLuxx 는 기존 AMD EPYC Milan 서버에서 칩당 최대 4개의 캐시 스택을 활성화하는 서버 BIOS 설정도 찾았습니다.
스택형 L3 캐시는 전체 대기 시간에 약 10%를 추가하며, 이는 단순히 표준 온-다이 기술로 용량을 추가할 때 표준 대기 시간에 미치는 영향과 비슷합니다. 이는 부분적으로 추가 L3 캐시 슬라이스가 다소 ‘멍청’하기 때문입니다. 모든 제어 회로가 기존 CCD에 상주하여 대기 시간 오버헤드를 줄이는 데 도움이 됩니다. 또한 더 큰 캐시는 더 높은 L3 캐시 적중률로 인해 주 메모리로의 이동을 줄이므로 추가 용량은 주 메모리에 대한 대역폭 압력을 완화하여 대기 시간을 줄임으로써 다중 축에서 애플리케이션 성능을 향상시킵니다.
AMD는 평소와 동일한 Zen 3 코어를 사용합니다. 3D V-Cache용 제어 회로는 초기 설계 단계에서 미래 지향적인 설계 선택으로 추가되었습니다. AMD는 기존 EPYC Milan 칩을 빌딩 블록으로 사용하므로 칩은 EPYC 서버의 SP3 소켓에 떨어집니다(BIOS 업데이트 필요). 이를 통해 검증 시간이 단축되고 출시 시간이 단축됩니다.
AMD는 2D 칩셋에 비해 200배 인터커넥트 밀도 증가, 마이크로 범프 3D 패키징에 비해 15배 밀도 증가 및 3배 에너지 효율 향상과 같이 3D V-캐시를 가능하게 하는 무납땜 하이브리드 본딩 기술의 많은 이점을 반복했습니다. AMD는 하이브리드 본딩이 다른 3D 접근 방식보다 열, 트랜지스터 밀도 및 인터커넥트 피치를 향상시켜 가장 유연한 액티브-온-액티브 실리콘 적층 기술이 된다고 말합니다.
또한 AMD는 인증된 소프트웨어 패키지를 만들기 위해 여러 파트너와 협력하고 있지만 증가된 캐시 용량을 활용하기 위해 소프트웨어를 수정할 필요가 없이 해당 패키지를 성능최적화를 볼 수 있습니다.
AMD는 Milan-X가 다양한 제품 개발 소프트웨어로 주로 구성된 특정 ‘목표 워크로드’에서 최대 50% 향상을 제공할 것이라고 말합니다. 여기에는 전산 유체 역학(CFD), 유한 요소 분석(FEA), 구조 분석 및 전자 설계 자동화(EDA)가 포함되며 후자는 칩 설계와 관련됩니다.
AMD는 3개의 워크로드에서 기존 AMD EPYC Milan 모델의 성능을 선전했으며, 3개의 워크로드에서 2개의 EPYC 75F3이 2개의 Intel Xeon 8362를 능가하는 것으로 나타났지만 해당 벤치마크에는 Milan-X가 포함되지 않았습니다.
AMD는 EDA(칩 설계) RTL 검증에서 표준 16코어 EPYC 칩에 비해 16코어 Milan-X로 66%의 성능 향상을 보여주는 Milan-X로 Intel의 칩과의 일대일 비교를 피했으며 Synopsys VCS로 기사 하단에 테스트 미주를 포함했습니다.
AMD는 밀란 엑스가 위의 앨범에서 찾을 수 있는 광범위한 워크로드 선택에도 도움이 될 것이라고 말합니다. 이 회사는 또한 Altair, Cadence, Synopsys 등과 같이 이미 인증된 소프트웨어 패키지에서 작업하고 있는 여러 ISV를 나열했으며 현재 출시와 함께 준비될것으로 보여집니다.