지포스 RTX 2080 TI 2070 출시 성능 및 가격정보

GTX2080 GTX2070 스펙 및 앙페르 GTC 뉴스

지포스 RTX 2080 TI 시리즈 9월20일 발표 RTX 2070 10월 발표

NVIDIA의 Gamescom 2018  무사히 끝난 가운데 지난 달 발표 엔비디아의 차세대 GeForce 하드웨어를 출시 준비를하고 는 가운데 RTX 2080 / RTX 2080 TI 가 발표되었습니다. 

기존의 지포스 GTX 10 시리즈를 성공을 뒤로한채 이번 2018년 9월을 기점으로 NVIDIA의 지포스 RTX 2080 2070 시리즈가 출시됩니다.

NVIDIA의 새로운 Turing GPU 아키텍처의 TSMC의 12nm “FFN”프로세스를 기반으로 구축 된 NVIDIA는 게임 렌더링 방식과 PC 비디오 카드 평가 방식의 전체 패러다임 전환을 목표로하는 높은 목표를 가지고 있습니다.

엔비디아의 CEO 젠슨 황 (Jensen Huang)은 2006 년 테슬라 GPU 아키텍처 (G80 GPU) 이후 튜링 엔비디아의 가장 중요한 GPU 아키텍처를 소개했으며 해당 기능면에서 볼 때 매우 기대가 됩니다.

지금까지 NVIDIA의 첫 번째 그래픽카드는 고급형으로 출시되었으며  GeForce RTX 2080 Ti, RTX 2080 및 RTX 2070은 모두 한달 간격으로 출시 예정입니다.

 NVIDIA의 제품 스팩은 그대로 유지되면서 RTX 2080 Ti의 주력 그래픽카드 인 반면 RTX 2080은 최고급 그래픽카드로서 RTX 2070은 가격을 조금 다운시켜 많은 사람들이 즐길 수 있도록 제작된 그래픽 카드입니다.

  • 3장의 그래픽카드 모두 다음 9월 10월동안 출시 될 예정입이며  RTX 2080 년 9월 20일 부터 판매를 시작합니다.
  • Ti 및 RTX 2080, / RTX 2080 Ti는 파트너사의 경우 999 달러부터 시작하며, RTX 2080은 699 달러부터 시작합니다.
  • 한편 RTX 2070은 10 월에 출시 될 예정이며 파트너사는 499 달러부터 시작합니다. 

이는 기존의 그래픽카드 가격 대비 모두 120 달러에서 300 달러 사이의 가격정도 비싼 금액이며 NVIDIA의 자체 참조 용 Founders Edition 카드는 다시 돌아가며 기본 가격보다 100 ~ 200 달러의 프리미엄을 받게됩니다.

그리고 아쉽게도 NVIDIA는 이미 사전 주문을하고 있으므로 지금 제품을 구매할려는 사람들은 해당 해택을 받기가 어렵습니다.

지포스 RTX 2080 / 2070 / GTX 1080 사양 비교

NVIDIA GeForce 사양 비교

RTX 2080 Ti RTX 2080 RTX 2070 GTX 1080
쿠다 코어 4352 2944 2304 2560
코어 클럭 1350MHz 1515MHz 1410MHz 1607MHz
부스트 클럭 1545MHz 1710MHz 1620MHz 1733MHz
메모리 클럭 14Gbps GDDR6 14Gbps GDDR6 14Gbps GDDR6 10Gbps GDDR5X
메모리 버스 너비 352 비트 256 비트 256 비트 256 비트
VRAM 11GB 8GB 8GB 8GB
단일 정밀도. 13.4 TFLOPs 10.1 TFLOPs 7.5 TFLOPs 8.9 TFLOPs
Tensor Perf. 440T OP 
(INT4)
N / A
레이 퍼프. 10 그레이 / 초 8 그레이 / 초 6 그레이 / 초 N / A
RTX-OPS 78T 60T 45T N / A
TDP 250W 215W 175W 180W
GPU 빅 튜링 이름없는 튜링 이름없는 튜링 GP104
트랜지스터 수 18.6B 7.2B
아키텍쳐 튜링 부활절
제조 공정 TSMC 12nm “FFN” TSMC 12nm “FFN” TSMC 12nm “FFN” TSMC 16nm
출시일 09/20/2018 09/20/2018 10/2018 05/27/2016
출시 가격 999 달러 699 달러  499 달러  599 달러 

NVIDIA의 Turing 아키텍처 : RT & Tensor 코어

Turing 보드 전체의   레이 트레이싱과 래스터 화를 결합하여 두 기술의 장점을 활용하는 하이브리드 렌더링을 지원합니다.

그리고 이번 발표는 올해 초부터 NVIDIA의 RTX 발표가 본질적으로 지속 되었기 때문에 발표가 약간 희박하다고 생각한다면 나머지 부분은 여기에 있습니다.

이번 제품의 가장 큰 변화는 더 빠르고 효율적인 하드웨어 성능인 레이트레이싱 가속화를 제공하기 위해 튜링과 함께 더 많은 레이트레이싱 하드웨어를 포함하게 될 것이라는 점입니다. 

Turing 아키텍처의 새로운 점은 NVIDIA가 RT 코어라고 부르는 것으로서이 코어는 현재로서는 완벽하게 알려지지 않았지만 전용 레이트레이싱 프로세서로 사용됩니다. 이 프로세서 블록은 광선 – 삼각형 교차 검사와 경계 체적 계층 구조 (BVH) 조작을 가속화합니다. 후자는 광선 추적을 위해 객체를 저장하기위한 매우 보편적 인 데이터 구조입니다.

NVIDIA는 초고속 GeForce RTX 부품이 초당 100 억 (기가) 광선을 전송할 수 있으며  가속되지 않은 파스칼은 광선 추적 성능이 25 배 향상되었습니다.

Turing 아키텍처는 또한 Volta의 텐서 코어 전달 하며 실제로 Volta보다 향상되었습니다. 

텐서 코어는 여러 NVIDIA 이니셔티브의 중요한 측면입니다. Turing 가방 속의 NVIDIA의 다른 툴은 AI denoising을 사용하여 텐서 코어가 탁월한 이미지를 정리함으로써 장면에서 필요한 광선의 양을 줄이는 것입니다. 

물론 이것이 텐서 코어가 유일한 특징은 아니며 NVIDIA의 전체 AI / 신경 네트워킹 제국은 모두 내장되어 있습니다.

따라서 Gamescom 군의 주요 관심사는 아니지만 NVIDIA의 가장 강력한 신경 네트워킹 하드웨어가 출시 될 것이라는 사실도 확인되었습니다.

더 넓은 범위의 GPU로 하이브리드 렌더링을 살펴보면 흥미로운 점은 이러한 개별적인 속도 향상에도 불구하고 NVIDIA의 전반적인 성능 약속은 극단적이지 않다는 점입니다.

이 회사는 파스칼에 비해 6배의 성능 향상을 약속했으며  RT 코어를 사용하더라도 광선 추적은 일반적으로 여전히 상당한 리소스입니다.

특히 게이밍 문제의 경우 하이브리드 렌더링의 이점은 잠재적으로 중요하지만 개발자를 사용하는 방법에 크게 의존 할 것입니다. 

퍼포먼스 관점에서 볼 때 레이트레이싱과 하이브리드 렌더링은 렌더링품질을 향상시키고 현재의 알고리즘의 성능을 향상시키는 기능이 아니며 오늘날의 GPU성능에서 레이트레이싱을 시도했다면 성능은 매우 느릴것입니다.

이러한 품질이점은 일반적으로 그래픽성능의 조명및 그림자 및 주위 빛 반사에 집중되며 세 가지 모든 기능은 본질적으로 빛의 속성에 기반을두고 있습니다.

단순한 용어로는 빛으로 움직이며, 지금까지는 다양한 알고리즘이 관련된 작업이나 “미리 베이킹 (pre-baking)”장면을 카피해 왔으며  현재의 알고리즘은 꽤 좋은 편에 속하지만 그렇다고 정확하지는 않습니다. 

전반적으로 하이브리드 렌더링은 GeForce RTX 20 시리즈의 lynchpin 기능입니다. 




Gamescom과 SIGGRAPH 프리젠 테이션을 통해 NVIDIA가이 분야에 많은 투자를 해왔고 앞으로도이 기술에 대한 GeForce 브랜드의 성공을 확신 할 수 있습니다. 

RT 코어 및 텐서 코어는 반 고정 기능 하드웨어로서 래스터 화에는 사용할 수 없으며 할당 된 트랜지스터는 그렇지 않은 경우 더 많은 래스터화 하드웨어 전용 트랜지스터 일 수 있습니다.

따라서 NVIDIA는 더 큰 파스칼을 구축하기보다는 하이브리드 렌더링 경로로 이동하여 기회 비용 측면에서 엄청난 의미심장 한 움직임을 보이고 있습니다.

결과적으로, NVIDIA는 2001 년과 2002 년에 픽셀 및 버텍스 쉐이더 (다이렉트엑스8 및 다이렉트엑스9 시대 기술)를 도입하면서 이전에 실제로 보았던 소비자 렌더링에서 패러다임의 변화를 시도하고 있습니다.

Microsoft의 DirectX Raytracing (DXR) 이니셔티브는 NVIDIA의 다른 개발자 및 소비자 이니셔티브만큼 중요하며 NVIDIA는보다 나은 이미지 품질을 제공하기 위해 래스터화와 레이트레이싱을 혼합하는 기술에 대해 일반인과 개발자 모두에게 판매하며 또한 무어의 법칙은 계속 느려지고 고정 된 기능 하드웨어가 효율성을 높이는 수단이되어 더욱 전문화되고 고정 된 기능 단위로 작업하는 아이디어를 개발자가 쉽게 이해할 수 있어야합니다.

Turing SM : 전용 INT 코어, 통합 캐시, 가변 비율 음영

전용 RT 및 텐서 코어와 함께 Turing 아키텍처의 Streaming Multiprocessor (SM) 자체도 새로운 트릭을 배우고 있습니다. 

특히 Volta의 새로운 변화 중 하나를 계승했는데 Integer 코어가 부동 소수점 CUDA 코어의 패싯이되는 것과는 대조적으로 자체 블록으로 분리 된 되었습니다.

여기에있는 장점은 적어도 Volta에서 보았던 것 만큼이면 주소 생성과 Fused Multiply Add (Fused Multiply Add) 성능이 향상된다는 것으로 Turing의 여러 측면에서 볼 수 있듯이 더 많은 이점이 있습니다 

Turing SM에는 NVIDIA가 “통일 된 캐시 아키텍처”라고 부르는 것이 포함되어 있습니다. NVIDIA의 공식 SM 다이어그램을 아직 기다리고 있기 때문에 이것이 Volta에서 보았던 것과 동일한 종류의 통일인지는 확실하지 않습니다

L1 캐시가 병합 된 곳 공유 메모리 – 또는 NVIDIA가 한 걸음 더 나아간 경우. 여하튼 NVIDIA는 NVIDIA가 파스칼 또는 볼타 (후자가 더 가능성이있는)를 의미하는지 명확하지 않은 “이전 세대”의 두 배 대역폭을 제공한다고 말합니다.

마지막으로, SIGGRAPH Turing 보도 자료에 숨어있는 것도 가변 비율 음영에 대한 지원입니다. 비교적 젊고 곧 출시 될 그래픽 렌더링 기술로서, 특히 NVIDIA가 얼마나 정확하게 구현하고 있는지에 대한 정보는 제한적입니다. 그러나 매우 높은 수준에서 NVIDIA의 멀티 레스 쉐이딩 기술인 차세대 사운드처럼 들리는데, 개발자가 다양한 효과적인 해상도로 화면의 다른 영역을 렌더링하여 품질 (및 렌더링 시간)을 그것은 가장 유익합니다.

GDDR6 지원

GPU가 사용하는 메모리는 외부 회사에서 개발 한 것이므로 큰 비밀은 없습니다.

JEDEC과 삼성전자, SK 하이닉스, 마이크론은 모두 GDDR5와 GDDR5X의 후속주자로 GDDR6 메모리를 개발했으며 NVIDIA는 Turing 지원하기로 했습니다.

 제조업체에 따라 1 세대 GDDR6은 일반적으로 NVIDIA의 후반 세대 GDDR5 카드의 2 배, NVIDIA의 최신 GDDR5X 카드보다 40 % 빠른 메모리 대역폭의 핀 당 최대 16Gbps를 제공합니다.

GP 엔비디아 지포스 RTX

엔비디아
지포스 RXT 2080 Ti
(GDDR6)
엔비디아
지포스 RTX 2080 
(GDDR6)
엔비디아
타이탄 V 
(HBM2)
엔비디아
타이탄 XP
 
엔비디아
GTX 1080 Ti
엔비디아
GeForce GTX 1080
총 용량 11GB 8GB 12GB 12GB 11GB 8GB
핀당 흑백 14Gb / s 1.7Gb / s 11.4 Gbps 11Gbps
칩 용량 1GB (8Gb) 4GB (32GB) 1GB (8Gb)
번호 칩 / KGSD 11 8 12 11 8
칩당 스택
스택
56GB / 초 217.6GB / 초 45.6GB / 초 44GB / 초
버스 너비 352 비트 256 비트 3092 비트 384 비트 352 비트 256 비트
버스 너비 616GB / 초 448GB / 초 652.8GB / 초 547.7GB / 초 484GB / 초 352GB / 초
DRAM 전압 1.35V 1.2 V (Ω) 1.35V

GDDR5X에 비해, GDDR6은 GDDR6의 혁신이 이미 GDDR5X에 구워 졌기 때문에 과거의 메모리 세대만큼 발전하지 못했습니다. 매우 하이 엔드 유스 케이스의 경우 HBM2와 함께 GPU 산업의 백본 메모리가 될 것으로 예상됩니다.

원리 변경은 더 낮은 작동 전압 (1.35v)을 포함하며, 내부적으로 메모리는 이제 칩 당 2 개의 메모리 채널로 분할됩니다. 

표준 32 비트 와이드 칩의 경우 이것은 한 쌍의 16 비트 메모리 채널을 의미하며 256 비트 카드에 총 16 개의 채널이 있습니다. 이는 곧 많은 수의 채널이 있음을 의미하지만 GPU는 대량 병렬 장치이기 때문에 활용하기에 유리합니다.

NVIDIA는 첫 번째 GeForce RTX 카드가 Big3 멤버 모두가 제공하는 가장 빠른 속도 등급 인 14Gbps에서 GDDR6을 실행할 것이라고 확인했습니다. 우리는 NVIDIA가 Quadro RTX 카드 용으로 삼성의 GDDR6을 독점적으로 사용하고 있다는 것을 알고 있습니다. 아마도 밀도가 필요하기 때문일 수 있습니다.

그러나 GeForce RTX 카드의 경우 모든 메모리 제조업체에게 필드를 개방해야합니다. 장기적으로 이것은 두 개의 통로를 더 높은 용량의 카드에 열어 두지 만 16Gb 밀도 칩으로 이동하거나 현재 사용중인 8Gb 칩으로 클램 쉘을 사용합니다.




NVLink SLI, VirtualLink 및 8K HEVC

  • NVIDIA의 Gamescom 발표자료에는언급되지 않았지만 NVIDIA의 GeForce 20 시리즈는 웹 사이트를 통해 GeForce RTX 그래픽카드에서 SLI가 가능하다는 정보가 있습니다.
  • 특히, RTX 2080 Ti와 RTX 2080은 모두 SLI를 지원하며 RTX 2070은 SLI를 지원하지 않습니다.
  • 그러고 더 중요한 부분은 NVIDIA의 독점적인 캐시 GPU 인터커넥트 인 NVLink가 소비자 판매용으로 출시될 것입니다.
  • GeForce GTX 카드는 NVLInk를 통해 SLI를 구현하며 각 카드 사이에 2개의 NVLink 채널이 실행됩니다. 
  • 그리고 결합 된 50GB / 초의 대역폭 (각 방향에서 사용할 수있는 50GB의 대역폭을 의미) NVIDIA의 이전 HB-SLI 링크보다 더 개선된 성능을 보입니다.
  • 이제는 큰 문제는 이것이 SLI의 지속적인 하락을 뒤집을 것인지, 그리고 지금은 다소 비관적 인 접근법을 취하고 있는지 여부이지만, NVIDIA에서 더 많은 것을 듣고 자합니다. 50GB / 초는 HB-SLI보다 큰 발전이지만, GPU에서 사용할 수있는 로컬 메모리 대역폭의 448GB / 초 (또는 그 이상)의 일부에 불과합니다. 
  • 따라서 AFR 동기화 또는 효과적인 작업 부하 분할을 통해 다중 GPU 렌더링 문제를 해결하지는 않습니다.
  • 그 점에서 NVIDIA가 RTX 2070에서 NVLink SLI를 지원하지 않는다고 말하는 것 같습니다.

한편 게이머는 VirtualLink 지원 기능을 추가하여 VR을 기대할 수있는 새로운 기능을 제공합니다. USB Type-C 대체 모드는 지난 달 발표되었으며 단일 케이블로 15W 이상의 전력, 10Gbps의 USB 3.1 Gen 2 데이터 및 4 레인의 DisplayPort HBR3 비디오를 모두 지원합니다. 다시 말해 비디오 카드가 VR 헤드셋을 직접 구동 할 수 있도록하기 위해 추가 데이터 및 전원이있는 DisplayPort 1.4 연결입니다. 이 표준은 NVIDIA, AMD, Oculus, Valve 및 Microsoft에 의해 뒷받침되므로 GeForce RTX 카드가 궁극적으로 표준을 지원하는 수많은 제품이 될 것으로 예상되는 제품 중 첫 번째 제품이 될 것입니다.

USB Type-C 대체 모드

가상 링크 DisplayPort 
(4 레인)
DisplayPort 
(2 레인)
기본 USB-C
비디오 대역폭 (원시) 32.4Gbps 32.4Gbps 16.2Gbps N / A
USB 3.x 데이터 대역폭 10Gbps N / A 10Gbps 10Gbps + 10Gbps
고속 차선 쌍 6 4
최대 전력 필수 : 15W 
옵션 : 27W
옵션 : 최대 100W

마지막으로, NVIDIA는 주제에 대해서만 간단히 언급했지만 NVIDIA의 비디오 엔코더 블록 인 NVENC는 Turing 용으로 업데이트되었습니다. NVENC의 최신 반복은 특히 8K HEVC 인코딩에 대한 지원을 추가합니다. 

한편 NVIDIA는 인코더의 품질을 더욱 향상시켜 비디오 비트율을 25 % 낮추어 이전과 비슷한 수준의 품질을 구현할 수있게되었습니다.

2 thoughts on “지포스 RTX 2080 TI 2070 출시 성능 및 가격정보”

Leave a Comment