중세 유럽 시대에는 귀족 제도가 있었다. 귀족 작위에 따라 공작, 후작, 백작, 자작, 남작 등으로 계급이 나뉘었고 신분에 따라서는 농노와 같은 노예 계급도 있었다. 조선에도 신분제도가 있으나 그중 서얼은 ‘서자’라 칭하며 같은 아버지여도 첩의 자식을 의미해 매우 애매한 위치에 처한 계급이 있다. 첩의 아들로 태어난 서자는 중세 유럽과 조선을 비롯해 제대로 된 권력 승계와 존중 등을 받지 못했다.

그래서 우리나라 고전소설 홍길동전에는 유명한 말이 있다. ‘아버지를 아버지라 부르지 못하고 형을 형이라 부르지 못한다’고 말이다. 이 딱한 처지가 그래픽카드에 적용될 줄 누가 알았겠는가?

엔비디아(이하 NVIDIA)는 지포스 RTX 40 시리즈를 공식 발표했다. RTX 4090은 기존 RTX 3090 대비 최대 7~80% 높은 성능 향상은 물론 약간의 전력 제한을 겸한다면 전성비도 훌륭하다는 평가를 받고 있지만, 전반적인 RTX 40 시리즈의 MSRP 책정은 다소 아쉽다는 평가를 받고 있다.

▲ 출시 당시 RTX 4080 12GB는 899$로 한화 기준 140만 원에 등록됐었다(사진 = NVIDIA)
▲ 출시 당시 RTX 4080 12GB는 899$로 한화 기준 140만 원에 등록됐었다(사진 = NVIDIA)

국내 시장은 어느 정도 안정화된 시장 가격을 형성해 가고 있지만 출시 자체 MSRP 가격은 환영받지 못했다. 이것은 비단 RTX 4090, RTX 4080 16GB 모델에 국한된 것이 아니라 RTX 4080 12GB 이자 현재 RTX 4070 Ti로 출시된 모델에 대한 이야기다. 당시 발표된 금액은 MSRP 기준 899$.

하지만 출시 예정이라는 발표와 함께 GPU 스펙이 일부 공개되자 소비자들의 강력한 반발로 당초 출시를 발표한 NVIDIA는 돌연 론칭을 취소한다. 향후 RTX 4080 12GB 모델은 4070 Ti로 바뀌는 것이 아니냐는 추측이 나왔는데 정황상 GPU 스펙이 그대로인 것으로 보아 맞는 것으로 판단된다.

왜 이런 해석이 나온 것일까? 본격적인 RTX 4070 Ti에 대한 스펙적인 요소를 분해해본 후 RTX 40 시리즈가 지원하는 신기술과 성능 벤치마크 등을 살펴볼까 한다.

 

RTX 4070 Ti 192Bit, 태생이 다른 AD104 칩

 
▲ NVIDIA 지포스 RTX 4070 Ti 공식 스펙 차트
▲ NVIDIA 지포스 RTX 4070 Ti 공식 스펙 차트

RTX 4070 Ti 아니 전 네이밍 RTX 4080 12GB은 왜 그렇게 비난을 받았을까? 단순 가격이 대폭 올라서? 성능이 생각보다 낮아서? 모두 맞는 해석이지만 정확히는 NVIDIA의 체급 올려치기가 + 가격 인상이 가장 큰 문제로 지적된다.

성능 대비 가격이 약간 인상되는 것은 소비자들도 납득한다. R&D와 최신 공정의 적용은 기존 공정 대비 추가적인 금액이 들어가는 것은 사실이니까. 하지만 기존 공정과 별개로 등급 올려치기와 납득하기 힘든 수준의 가격 인상 정책은? 아니다. 정보의 바다라 불리는 21세기서 터무니없는 정책을 적용한 것이 NVIDIA다.

RTX 4070 Ti를 자세히 살펴보면 NVIDIA의 아쉬운 정책을 엿볼 수 있다.

RTX 4070 Ti는 공식적으로 7,680 쿠다코어 80ROPS, 12GB GDDR6X 스펙을 가지고 있다. 여기까지만 보면 큰 문제가 없을 수 있지만 메모리 대역폭이 192bit다. 이는 RTX 3060 Ti와 같은 메모리 대역폭이다.

▲ AD104 풀칩 Die 모습
▲ AD104 풀칩 Die 모습

그뿐만 아니라 RTX 4070 Ti에 적용된 GPU 칩은 AD104로 Die Size는 295mm2로 확인됐다.(출처 TechPower UP) 이는 RTX 3060 Ti가 392mm2인 점을 감안해 봐도 더 적은 면적을 사용했다. 물론 TSMC 4nm 공정을 적용함에 따른 가격 인상은 일부 반영하더라도 말이다. 정리해 보면 GPU칩 체급상 RTX 3060 Ti와 비슷한 ‘RTX 4060 Ti’로 나왔어야 한다는 분석이다. 거기에 메모리 대역폭도 192-Bit로 대폭 낮았으니···.

상황이 이런데 NVIDIA는 초기 제품 발표를 RTX 4080 12GB로 했고, 가격은 899$로 기존 RTX 3080와 동급 가격 책정을 한다. 이에 따라 RTX 4080 16GB는 1,199$로 가격이 인상되니 소비자 입장에서는 황당할 수밖에 없다.

좋은 가격에 좋은 성능을 만들어 달라고 했더니 기업에서는 ‘우리가 이렇게 좋게 만들었어, 그런데 가격은 큰 차이가 없으니 많이 사줘!’가 아니라 ‘이만큼 성능 나오니까 이만큼 더 줘’ 하는 형국이다. 그런데 기존 GPU 칩과 비교하면 상당히 ‘낮은 체급’ 제품을 ‘웃돈’ 주고 사라고 하는데 이를 반길이가 누가 있을까?

▲ 벤치마크에 사용된 ASUS RTX 4070 Ti TUF GPU-Z 스펙
▲ 벤치마크에 사용된 ASUS RTX 4070 Ti TUF GPU-Z 스펙

결과적으로 RTX 4070 Ti는 출시 당시 RTX 4080 12GB로 발표될 예정이었으나 RTX 4070 Ti 이름을 달고 출시됐다. 주요 스펙으로는 7,680개 쿠다코어, GDDR6X 21Gbps 기반 12GB VRAM, 192-bit 메모리 버스다. AD104칩 기준으로는 풀칩에 해당되지만 앞서 언급했듯 주제를 모르고 감히 RTX 4080(AD103) 자리를 넘보려 했던 모델이다.

리뷰에서 살펴본 ASUS RTX 4070 Ti은 베이스 클럭 2,310MHz 부스트 클럭 2,730MHz(↑120MHz)로 NVIDIA가 제공하는 FE 스펙 보다 소폭 높은 O.C가 적용됐다.

▲ 벤치마크에 사용된 ASUS RTX 4070 Ti TUF GPU-Z
▲ 벤치마크에 사용된 ASUS RTX 4070 Ti TUF GPU-Z

이외로 기본 TDP 전력은 285W로 확인됐으며 추가적인 전력제한을 통한 오버클럭 세팅은 10%가량 더 풀어 최대 313W 내외로 설정할 수 있다.

#참고로 RTX 4070 Ti FE 모델은 별도로 출시하지 않으며, 전부 비레퍼 모델로 출시될 예정이다.

 

개선된 3세대 RT코어와 신규 기술

RTX 40 시리즈의 개선점은 앞서 언급한 쿠다코어, 부스트 클럭, 전성비 말고도 또 있다. 바로 RT 코어의 성능 향상과 새로운 기술의 적용이다.

3세대 RT 코어는 음영과 노이즈 제거 기능과 레이 트레이싱을 동시에 실행할 수 있으며, 이전 세대 대비 최대 2배 더 많은 데이터 처리가 가능하다. 4세대 텐서 코어 역시 FP8 데이터 포맷 지원 확대로 이전 세대보다 최대 2배 빠른 AI 훈련 성능이 가능하다고 NVIDIA는 밝혔다.

이외로도 에이다러브레이스 아키텍처 즉, RTX 4090에는 SER(Shader Execution Reordering)와 DISPLACED Micro Meshes, Micro Masks, DLSS 3등이 새롭게 적용됐다.

그중 SER은 GPU 리소스 부담을 줄여 효율적인 작업을 할 수 있게끔 해주는 기술이다.

쉽게 설명하면 스레드 그룹을 유사한 작업끼리 묶어 그룹화해 GPU가 처리하게 해준다. 이를 통해 기존 대비 개선된 오버헤드(어떤 일을 처리하는데 필요한 처리 시간, 메모리 등)로 더 향상된 레이 트레이싱·SM 및 메모리 최적화가 적용됐다고 NVIDIA는 밝혔다.

더불어 DISPLACED Micro Meshes는 실시간 레이 트레이싱을 위한 그래픽 프리미티브 기술이라고 NVIDIA는 설명한다.

실시간 광선 추적하는 ‘레이 트레이싱’은 지오메트리(왜곡)가 발생하면 복잡한 연산과 GPU 자원을 사용한다. 이를 최소화하는 기술이다. 매우 작은 마이크로 삼각형으로 구조화한 렌더링을 메시(Micfro Mesh)로 묶어 효율적인 렌더링을 한다.

이를 통해 GPU 자원을 많이 사용하는 레이트레이싱 효율을 상승시켰다. 더불어 Opacity Micro-Map 기술 적용을 통해 나무와 나뭇잎과 같은 상세한 장면 요소에도 광선 추적이 가능하게 됐으며, 적은 비용으로 현실감 있는 그래픽 렌더링이 가능하다고 덧붙였다.

 

 

3팬 쿨링 솔루션 적용한 ‘ASUS RTX 4070 Ti’

ASUS RX 4070 Ti TUF 모델은 정면 3팬 쿨링 솔루션을 적용했으며, 후면에는 백플레이트가 기본 장착되어 PCB 휨 및 손상 등을 방지했다. 장착되는 면 기준으로 뒷면 우측에는 GPU의 열이 빠져나갈 수 있는 쿨링 솔루션을 적용했다.

디스플레이 포트 구성은 2개의 HDMI 포트와 3개의 DP 포트로 구성되어 최대 5개의 멀티 디스플레이 환경 구성이 가능하다.

전력공급의 경우 PCIe 8Pin 커넥터 2개를 요구하는 12VHPWR 케이블로 구성됐다. 아무래도 RTX 4090 및 4080대비 낮은 전력을 반영한 것으로 판단된다.

 

 

벤치마크에 사용된 시스템

▲ 인텍앤컴퍼니가 유통하는 인텔 코어 i7-13세대 13700K CPU, 16코어 24스레드에 최대 5.4GHz 부스트 클럭을 가졌다
▲ 인텍앤컴퍼니가 유통하는 인텔 코어 i7-13세대 13700K CPU, 16코어 24스레드에 최대 5.4GHz 부스트 클럭을 가졌다
▲ MSI MPG Z790 카본 Wi-Fi는 최대 7600MHz 메모리 오버클럭, 19+1+1전원부 페이즈 구성이 특징이다
▲ MSI MPG Z790 카본 Wi-Fi는 최대 7600MHz 메모리 오버클럭, 19+1+1전원부 페이즈 구성이 특징이다
▲ 서린씨앤아이가 유통하는G.SKILL DDR5-7200 CL34 TRIDENT Z5 RGB J 16Gx2 실버는 7,200MHz 높은 클럭에 CL34로 낮은 메모리 타이밍을 가진 고사양 XMP다 (본 기사에서는 4,800MHz JEDEC로 세팅)
▲ 서린씨앤아이가 유통하는G.SKILL DDR5-7200 CL34 TRIDENT Z5 RGB J 16Gx2 실버는 7,200MHz 높은 클럭에 CL34로 낮은 메모리 타이밍을 가진 고사양 XMP다 (본 기사에서는 4,800MHz JEDEC로 세팅)
▲ MSI MEG 코어리퀴드 S360는 3열 수랭으로 13세대 인텔 코어에 대응하며 작은 소음이 특징이다
▲ MSI MEG 코어리퀴드 S360는 3열 수랭으로 13세대 인텔 코어에 대응하며 작은 소음이 특징이다
▲ MSI MPG A1000G 80+ GOLD는 정격 1000W에 무상 10년을 보증하는 고용량 파워로 최근 PCIe5 지원 모델도 출시됐다
▲ MSI MPG A1000G 80+ GOLD는 정격 1000W에 무상 10년을 보증하는 고용량 파워로 최근 PCIe5 지원 모델도 출시됐다

벤치마킹 시스템에 있어서는 별도의 오버클럭, BIOS 세팅 없이 순정(디폴트)로 진행했으며, 윈도우상 전원 관리 옵션 중 ‘고성능’을 적용했다.

 

RTX 4070 Ti 본격 벤치마크

미우나 고우나 그래픽카드의 꽃은 성능이다. 그래서 실제 RTX 4070 Ti의 성능은 대체 어느 정도 급일까? 그래픽카드 벤치마크의 기본이 되는 대표 벤치마크 툴 3DMARK를 기준으로 진행했다.

가장 먼저는 3DMARK FireStrike로 55,720점을 기록했다. 계속해서 FireStrike EX는 27,345점을 Firestrike UL는 27,34점으로 확인됐다.

그리고 DX12에서 진행되는 TimeSpy와 TimeSpy Ex는 각각 22,949와 11,035점으로 점수상 RTX 3090 Ti와 거의 대동소이한 성능으로 확인됐다.

 

4K, 게이밍 벤치마크? 살짝 아쉬운 수준

진행된 모든 게임 벤치 마크는 프리셋 기준 가장 높은 옵션을 기준으로 적용해 진행했다.

3D MARK를 통해 살펴본 대략적인 그래픽카드 성능이 실제 게이밍에선 어떤 모습을 보일까? 전반적인 4K 게이밍 성능은 RTX 3090~90 Ti급 성능을 보인 만큼 살짝 아쉬운 모습을 보인다.

사이버펑크2077와 같이 고사양 AAA급 게임에서는 평균 60FPS 미만을 보였으며, AMD FSR을 ‘균형’으로 활성화할 경우 57.1로 거의 60FPS에 근접하는 성능을 기록했다.

그외의 배틀그라운드를 비롯해 오버워치, 섀도우 오브 더 툼레이더, 파이널 판타지14 엔드워커 등 게임에 따라 평균 100FPS 이상의 성능을 기록했다. 그리고 국민 온라인 게임인 리그 오브 레전드의 경우에는 평균 279.6FPS로 매우 우수한 성능을 보였다.

 

4K + RT ON 활성화 벤치마크

4K와 레이트레이싱(RT)는 기존 게임 벤치마크 중 일부 지원하는 게임에 한 해 진행했다.

벤치마크 결과 역시 RT가 활성화되면 GPU 부하가 많아 살짝 아쉬운 모습을 보이지만, RT 성능 옵션을 일부 타협한다면 상당히 준수한 FPS를 노려볼 수 있어 쾌적한 게임이 가능했다.

사이버펑크는 RT On AMD FSR 균형 기준 71.4FPS지만 FSR 고성능으로 둘 경우 133FPS를 DLS 고성능은 101.22FPS를 기록했고 파크라이 6와 섀도우 오브 더 툼레이더는 각각 76FPS, 66FPS를 기록, 섀도우 오브 더 툼레이더의 경우 DLSS 울트라 퍼포먼스를 활성화 시 95FPS로 더욱 높은 프레임을 노려볼 수 있었다.

대체로 RT를 적용해도 평균 60FPS를 넘겨 준수한 게이밍을 기대해 볼 수 있다.

 

QHD, 게이밍 성능 완전정복

4K 성능이 아쉽다고 QHD 성능까지 아쉬운 것은 아니다. 4K도 옵션 타협을 겸한다면 대체로 144FPS에 준하는 성능을 노려볼 수 있고. QHD는 사실상 144FPS+ 성능을 기록했다.

고사양인 사이버펑크 2077 울트라 성능 옵션에서 120FPS 내외를 기록했고 그 외의 모든 게임에서도 144FPS+이상을 일부는 240FPS+를 기록해 최근 240Hz 고주사율 모니터 환경에 있어서도 충분히 만족스러운 성능을 기대해 볼 수 있다.

 

RTX 4070 Ti 살펴본, 작지만 소중한 '블렌더'

블렌더(Blender) 벤치마크 프리셋 중 많이 사용되는 클래스룸을 기준으로 진행했다.

Core i7-13700K 시스템에서 CPU만 사용했을 때 3분 17초(197s)걸린 반면 이번 NVIDIA RTX 4070 Ti를 이용한 CPU + GPU 렌더링에서는 14.8초로 매우 빠른 렌더링 속도를 기록했다.

마지막으로 온도 체크를 위한 3D MARK TimeSpy Stress를 진행했다. 테스트에 사용된 GPU는 ASUS RTX 4070 Ti TUF 모델이다. 최대 피크 온도는 65.44°C를 기록했는데 3FAN에 정숙한 소음을 감안하면 준수한 편이다. 평균 온도는 61~2도 내외를 기록했는데, 아무래도 285W TDP인 만큼 안정적인 온도 유지를 기록한 것으로 판단된다.

타임 스파이 스트레스 기준 실제 GPU 동작 부스트 클럭은 2,850MHz로 안정적인 클럭 유지율을 보였다.

 

4080 12GB 아니 4070 Ti 아니야, 4060 Ti였다면···

RTX 4070 Ti 자체 성능으로만 보면 좋다. RTX 3090급의 성능을 보인 만큼, 전반적인 벤치마크가 정확히 그 수준의 성능을 보여준다. 소비전력에 있어서도 285W로 낮아져 오히려 전성비면에 있어서는 엄청난 업그레이드다.

하지만 문제는 가격과 NVIDIA의 등급 올려치기는 옳은 판단 이었을까? RTX 3060 Ti와 동급에 있어야 할 GPU가 RTX 4080 12GB로 출시되려 했다. 결과적으로 소비자들의 반발이 심해 출시를 앞둔 상태서 돌연 론칭 취소 후 RTX 4070 Ti로 내놓았지만 결과적으로 참 아쉬운 상황이다.

아니나 다를까 AMD RX 7900XRX가 발표되니 RTX 4080 가격 인하라는 루머가 돌고 있었으나, 실제 출시되자 가격 인하 카드를 꺼내지 않은 NVIDIA인 만큼 합리적인 가격을 크게 기대하긴 힘드리라 생각된다.

결과적으로 NVIDIA의 공식 가격은 799$로 확정됐다. RTX 4080 12GB가 899$였다는 점을 감안해 보면 초기 RTX 3070 Ti와 같은 가격은 기대하기 힘드리라 생각된다. 그나마 위안이라 함은 3080가격에 RTX 3090 Ti 급 성능을 노려볼 수 있다는 점이 아닐까 생각된다.

관련기사

저작권자 © 맨즈랩 무단전재 및 재배포 금지