▲ RTX 4090 공식 출시 전 조텍 최상위 라인업인 AMP 익스트림 에어로는 1,699$로 발표됐다
▲ RTX 4090 공식 출시 전 조텍 최상위 라인업인 AMP 익스트림 에어로는 1,699$로 발표됐다

앞서 보도한 '조텍 RTX 4090 시리즈 가격 발표···생각보다 싼데?'(10월 6일자) 기사에서 조텍 RTX 4090의 초기 등록가가 싸다고 언급한 바 있다.

해당 기사의 댓글에는 “확실히 싸네 기자 뇌수도 같이 싼듯”, “그래픽 카드 가격이 저게 정상이라고 생각하냐” 등 다양한 지적이 있었다. 하지만 실제 발표된 그래픽카드 가격은 어떨까? FE 기준 MSRP 1599$인 4090FE는 263만 원에 등록됐다.

RTX 4090 출시 초 학위 비레퍼는 263만 원 이상에 등록됐고 상위 라인업 제품은 320만 원 내외에 구매할 수 있었다. RTX 4090 가격 자체가 너무 비싼 것은 맞다. 하지만 공식적인 MSRP와 현재 환율 상황 그리고 향상된 성능과 전성비를 감안해 보면 예상보다 싼 것도 맞다.

정확히 짚어보면 RTX 3090 시리즈에서 확 오른 가격은 RTX 4090 성능 향상대비 합리적인 가격에 자리 잡았다고 보는 것이 옳다.

과거 GTX 1080Ti는 699$였고 모델에 따라 80~100만 원 내외에 구매할 수 있었다. 하지만 RTX 2080Ti로 오면서 NVIDIA는 999$(한화 약 120만 원 내외) 가격을책정해 대폭 인상했고, RTX 3090은 FE 기준 1,499$로 한국 기준 229만 원에 공식 출시했다. 최근 NVIDIA는 성능 향상이 적용된 만큼 가격을 올렸다.

하지만 RTX 4090은 RTX 3090 대비 60~80%가량 성능이 향상된 점을 감안해 보면 충분히 비싸질 수 있었다는 예측이다.

현재까지 알려진 RTX 4090 성능은 여기 까지다. 하지만 RTX 4090을 살짝만 다른 관점에서 살펴보면 전성비가 대폭 향상됐다. 이는 NVIDIA 공식 발표 그리고 전력 제한 기능 활용에 대한 이야기다.

관련되어 외신을 비롯해 국내 커뮤니티에서도 언급되고 있다. 하지만 보통 일반 소비자들은 전력을 제한한다는 사실 그 자체로서 부정적인 이미지를 가진다. 기존 그래픽카드들은 전력을 제한한 만큼 성능이 어느 정도 비례해서 떨어졌으니 당연한 이야기다.

그렇지만 RTX 4090은 조금 다르다. 전력 제한을 통해 얻는 게 더 많다면? RTX 4090 아키텍처로 바뀌면서 추가된 신기술, 성능 개선 등을 살펴본 후 직접적인 성능을 비교해 보자.

 

아키텍처 ‘에이다 러브 레이스’, RTX 4090 뭐가 달라졌어?

▲ AD 102풀칩은 GA102 대비 훨씬 더 많은 연산 유닛을 가진다
▲ AD 102풀칩은 GA102 대비 훨씬 더 많은 연산 유닛을 가진다

RTX 4090은 일단 크기가 커졌다. 단순히 제품 크기가 커졌다는 이야기가 아니다. GPU 자체 그리고 그 안을 구성하고 있는 CUDA 코어를 비롯한 전반적인 GPU 유닛 자체가 RTX 3090 대비 커졌다는 의미다.

NVIDIA가 RTX 3090에 이어 RTX 4090도 짐승 같은 그래픽카드라 표현했다. 이를 뒷받침하듯 기존 RTX 3090의 스펙은 귀여울 정도로 RTX 4090에 적용된 AD102는 매우 무지막지하게 커졌다.

먼저 RTX 4090에 적용된 ‘AD102 풀칩’은 최대 18,432개의 쿠다코어에 SM 유닛 144을 갖는다. 이를 통해 3세대 RT 코어는 144개, 4세대 텐서코어와 텍스처 유닛은 576개로 구성된다. 암페어 GA102 풀칩과 비교해봐도 최대 80% 많은 코어 유닛 개수와 더 빠른 클럭이 특징이다.

RTX 4090에 적용된 AD102는 컷 칩으로 정확한 명칭은 AD102-300-A1이다.

그래서 공식 스펙상 RTX 3090 대비 60% 증가한 16,384 쿠다코어 동일한 GDDR6X 21Gbps에 384 메모리 버스를 갖춘 24GB VRAM, 클럭은 베이스 2.23GHz에 부스트 클럭 2,52GHz로 동작한다. 기존 RTX 3090대비 더 빠른 공식 부스트 클럭이 특징이다.

실제 GPU 온도와 부하에 따라 추가 부스트 클럭이 동작하는 것을 감안해 보면 사실상 더 높은 클럭을 가진다. 그뿐만 아니라 L2 캐시가 RTX 3090대비 12배 증가한 72MB L2 캐시가 적용됐다.

 

전기 많이 먹기 위해 커졌다고?, 오히려 고효율이야

상기 스펙 변화를 통해 NVIDIA RTX 4090은 덩치가 커졌다. 덩치만 커진 것이 아니라 그 안을 알차게 메웠다. 그리고 높아진 부스트 클럭을 기반으로 공식 TGP(Total Graphic Power)는 450W를 가져 RTX 3090 대비 100W 높아졌다.

공식 TGP가 올라감에 따라 소비자들은 전성비 개선은 없는 것이 아니냐는 의문을 품는다. 하지만 NVIDIA 공식 발표에 따르면 기존 암페어 아키텍처 대비 에이다 러브레이스는 350W기준 동일 전력에서 100% 성능 향상을 이뤘다고 밝혔다.

물론 RTX 4090은 350W TGP가 아닌 450W로 나와 약간 다른 케이스다. 그래도 성능 향상은 70% 내외면서 TGP는 약 30%가량 올라간 점은 분명한 전성비 개선이 됐기에 가능한 내용이다.

전성비와 관련되어 정확한 내용을 NVIDIA는 밝히지 않았다. 다만 여러 외신과 다양한 분석에 따르면 기존 삼성 8nm 공정에서 TSMC 4nm 커스텀 공정을 적용한 만큼 개선된 공정에 따른 차이가 아니냐는 분석이 있다.

 

개선된 3세대 RT코어와 신규 기술

RTX 4090의 개선점은 앞서 언급한 쿠다코어, 부스트 클럭, 전성비 말고도 또 있다. 바로 RT 코어의 성능 향상과 새로운 기술의 적용이다.

3세대 RT 코어는 음영과 노이즈 제거 기능과 레이 트레이싱을 동시에 실행할 수 있으며, 이전 세대 대비 최대 2배 더 많은 데이터 처리가 가능하다. 4세대 텐서 코어 역시 FP8 데이터 포맷 지원 확대로 이전 세대보다 최대 2배 빠른 AI 훈련 성능이 가능하다고 NVIDIA는 밝혔다.

이외로도 에이다러브레이스 아키텍처 즉, RTX 4090에는 SER(Shader Execution Reordering)와 DISPLACED Micro Meshes, Micro Masks, DLSS 3등이 새롭게 적용됐다.

그중 SER은 GPU 리소스 부담을 줄여 효율적인 작업을 할 수 있게끔 해주는 기술이다.

쉽게 설명하면 스레드 그룹을 유사한 작업끼리 묶어 그룹화해 GPU가 처리하게 해준다. 이를 통해 기존 대비 개선된 오버헤드(어떤 일을 처리하는데 필요한 처리 시간, 메모리 등)로 더 향상된 레이 트레이싱·SM 및 메모리 최적화가 적용됐다고 NVIDIA는 밝혔다.

더불어 DISPLACED Micro Meshes는 실시간 레이 트레이싱을 위한 그래픽 프리미티브 기술이라고 NVIDIA는 설명한다.

실시간 광선 추적하는 ‘레이 트레이싱’은 지오메트리(왜곡)가 발생하면 복잡한 연산과 GPU 자원을 사용한다. 이를 최소화하는 기술이다. 매우 작은 마이크로 삼각형으로 구조화한 렌더링을 메시(Micfro Mesh)로 묶어 효율적인 렌더링을 한다.

이를 통해 GPU 자원을 많이 사용하는 레이트레이싱 효율을 상승시켰다. 더불어 Opacity Micro-Map 기술 적용을 통해 나무와 나뭇잎과 같은 상세한 장면 요소에도 광선 추적이 가능하게 됐으며, 적은 비용으로 현실감 있는 그래픽 렌더링이 가능하다고 덧붙였다.

 

커진 RTX 4090FE, 새로운 12VHPWR 케이블 적용

 

RTX 4090FE는 전작보다 더 커진(폭) 사이즈가 특징이다. 공식 제원상 가로 304mm x 폭 137mm 크기에 3슬롯(61mm)의 크기를 가졌다. 무게는 전작 RTX 3090Ti FE와 동일한 2.2kg다.

디스플레이 포트 구성은 최대 4개의 멀티 디스플레이 구성을 할 수 있다. 1개의 2.1 HDMI와 3개의 1.4DP포트로 구성됐다.

전원 공급은 새로운 12VHPWR 케이블이 담당한다. 기존 RTX 3090와는 다릴 수직으로 장착하는 형태이며 8Pin x 4 to 12VHPWR 케이블이 기본 제공된다.

 

테스트에 사용된 PC, Core i9 13900K···

▲ 인텍앤컴퍼니가 유통하는 인텔 코어 i9-13세대 13900K CPU, 24코어 32스레드에 최대 5.8GHz 부스트 클럭을 가졌다
▲ 인텍앤컴퍼니가 유통하는 13세대 인텔 코어 i9-13세대 13900K, 24코어 32스레드에 최대 5.8GHz 부스트 클럭을 가졌다

 

▲ MSI MPG Z790 카본 Wi-Fi는 최대 7600MHz 메모리 오버클럭, 19+1+1전원부 페이즈 구성이 특징이다
▲ MSI MPG Z790 카본 Wi-Fi는 최대 7600MHz 메모리 오버클럭, 19+1+1전원부 페이즈 구성이 특징이다
▲ G.SKILL DDR5-7200 CL34 TRIDENT Z5 RGB J 16Gx2 실버는 7,200MHz 높은 클럭에 CL34로 낮은 메모리 타이밍을 가진 고사양 XMP다
▲ 서린씨앤아이가 유통하는 G.SKILL DDR5-7200 CL34 TRIDENT Z5 RGB J 16Gx2 실버는 7,200MHz 높은 클럭에 CL34로 낮은 메모리 타이밍을 가진 고사양 XMP다
▲ MSI MEG 코어리퀴드 S360는 3열 수랭으로 13세대 인텔 코어에 대응하며 작은 소음이 특징이다
▲ MSI MEG 코어리퀴드 S360는 3열 수랭으로 13세대 인텔 코어에 대응하며 작은 소음이 특징이다
▲ MSI MPG A1000G 80+ GOLD는 정격 1000W에 무상 10년을 보증하는 고용량 파워로 최근 PCIe5 지원 모델도 출시됐다
▲ MSI MPG A1000G 80+ GOLD는 정격 1000W에 무상 10년을 보증하는 고용량 파워로 최근 PCIe5 지원 모델도 출시됐다

기본적인 PC 설정은 별도의 오버클럭, BIOS 세팅 없이 순정(디폴트)로 진행했으며, 윈도우상 전원 관리 옵션 중 ‘고성능’을 적용했다.

 

RTX 4090FE 순정 성능, 전력 제한 세팅 차이는?

GPU 성능 테스트의 기본인 3D MARK를 GPU 스코어로 정리했다.

FHD 해상도로 벤치마크 진행되는 FireStrike는 66,368점으로 RTX 3090대비 약 30% 앞선 성능을 QHD 해상도인 TimeSpy는 36,755점으로 RTX 3090대비 약 80%가량 더 빠른 성능을 보였다. 이외에도 4K 벤치마크인 TimeSpy Extreme는 19,452점으로 RTX 3090이 약 11,000 내외인 점을 감안해 보면 약 80%가량 높은 성능 향상을 보였다.

여기서 도입부에서 언급한 전력 제한을 적용하면 어떤 모습을 보일까? 과거 RTX 3090는 오버클럭 개념의 언더볼팅 혹은 약간의 전력 제한이 추천됐지만, 이번 RTX 4090은 단순 전력 제한만으로도 상당히 매력적이다.

FHD 해상도 FireStrike는 순정(100%) 66,638점을 기록했지만, 전력 제한 70%(315W)를 적용할 경우 65,009점을 60%(270W)로 제한할 경우 65,366으로 2~3% 내외의 성능 하락밖에 없었다.

QHD 해상도와 4K 해상도인 TimeSpy와 TimeSpy Extreme에서는 차이가 조금 벌어지지만 그래도 뛰어난 전성비를 보인다.

TimeSpy기준 100%일 때 36,755점을 기록했다. 70%세팅에서는 35,263점을 60% 세팅은 33,535점으로 각각 3%와 10% 내외의 성능 차이를 보였다. 아무래도 그래픽카드의 부하를 FHD 대비 많이 요구하는 환경인 만큼 그 차이가 조금 더 벌어진 것으로 판단된다.

정리해 보면 전력 제한 70% 적용 시 순정 450W 소비가 315W로 급감하는데 성능 차이는 고작 5~6% 내외인 셈이다.

 

RTX 4090의 진모, 4K 144FPS 정복 가능성 확인

RTX 4090 게임 성능을 체크하기 위해 본격적인 벤치마크를 진행했다. 온라인 게임을 대표하는 리그 오브 레전드, 오버워치2, 배틀그라운드를 비롯해 파이널판타지14(FF14)와 고사양 유명 비디오 패키지 게임 싸이버펑크 2077, 파크라이 6, 섀도우 오브 더 툼레이더로 구성했다. 게임 옵션은 프리셋 기준 최고 높음 옵션을 적용했다.

벤치마크 결과 파크라이6와 싸이버펑크 2077에서만 4K 프리셋 기준 130FPS 내외의 성능을 보였으며, 그 외의 모든 게임은 4K 해상도에서 144FPS+ 매우 높은 성능을 보였다. 온라인게임 오버워치 2는 평균 FPS가 480+였으며 배틀그라운드 또한 220+로 사실상 약간의 옵션 타협을 적용하면 240+ 정복도 가능한 성능이다.

 

게이밍 RTX 4090 + 70% 전력 제한 조합, 매력적이지 않을까?

앞선 3D MARK를 통한 GPU 벤치마크를 통해 RTX 4090의 70% 전력 제한과 60%를 적용한 결괏값을 살펴봤다. 실제 게이밍에서는 어느 정도의 차이가 있을까? 70% 전력 제한을 적용해 게임 벤치마크 3종을 진행했다. 결괏값은 놀라웠다.

사이버펑크 2077의 경우 평균 3FPS가 떨어졌고 새도우 오브 더 툼레이더는 8FPS(약 5% 내외)를 FF14 엔드워커는 3% 내외 하락인 184.1FPS를 기록했다.

이는 RTX 4090FE TGP가 450W인 점을 감안했을 때 30% 적은 315W 전력을 소비하면서 성능은 3~5%가량 밖에 손실이 없었다. 물론 더 좋은 퍼포먼스를 원한다면 순정 상태로 별도의 전력 제한을 적용하지 않아도 된다.

하지만, 합리적인 소비전력과 함께 약간의 성능 타협을 생각한다면 약간의 전력 제한을 통한 RTX 4090 활용은 굉장히 매력적인 선택지다.

 

QHD 게이밍 성능, 240FPS 현실화해준 RTX 4090

QHD 게이밍에선 어떨까? 사실 기존 RTX 3090을 가지고도 QHD 해상도 풀옵션은 넉넉했다. 정확히는 게임에 따라 144FPS 정복이 안되는 게임도 있지만 대부분 가능했다.

하지만 게이머의 요구와 보다 빠른 장면전환을 원하는 소비자가 등장함에 따라 최근 QHD 240Hz를 가진 게이밍 모니터도 등장하고 있다. RTX 4090은 거기에 제격이다.

사이버펑크 2077, 파크라이 6같은 고사양 게임에서는 RTX 4090도 240Hz를 정복할 수 없었지만, 배틀그라운드, 오버워치, FF14 엔드워커 등 일반적으로 즐기는 게이밍 환경에서는 240FPS+이 가능한 만큼 QHD 고프레임을 원하는 게이머들에게 있어 RTX 4090은 만족스러운 성능을 기대해볼 수 있다.

 

RTX 4090 + RTX On, 최신 고사양 게임 144FPS 정복 아쉬운 수준

사이버펑크 2077은 프리셋 레이트레이싱(RT) 옵션 중 최고 높음 옵션인 레이트레이싱 울트라와 섀도우 오브 더 툼레이더도 RT 울트라 그리고 파크라이는 DXR On적용 후 진행했다.

벤치마크 결과 섀도우 오브 더 툼레이더는 RT를 On해도 167FPS로 안정적인 144FPS+이상의 성능을 보여줬다. 이어서 파크라이 6는 111FPS를 싸이버펑크 2077는 평균 45FPS로 아쉬운 모습을 보였다.

하지만 4K해상도에서 RT + DLSS(업스케일링)를 활성화할 경우 다른 양상을 보인다.

싸이버펑크 2077의 경우 최대 3배가량의 성능 향상이 되어 평균 136.1FPS를 기록했다. 섀도우 오브 더 툼레이더도 50%가량 성능 향상된 평균 243FPS로 매우 높은 성능향상을 기록했다.

참고로 파크라이 6의 경우 DLSS를 지원하지 않아 제외했다.

 

안정적인 온도, 450W 대응한 훌륭한 쿨링 솔루션

RTX 4090FE 온도 체크를 위해 TimeSpy Stress Test를 진행했다.

450W 순정 기준 최대 65도로를 기록했으며 평균 62~3도로 안정적인 온도를 유지했다. 만약 전력 제한을 활용한다면 조금 더 낮은 평균 온도도 가능할 것으로 판단된다.

 

강력해진 GPU 성능 RTX 4090, TGP를 조금 낮췄어도 되지 않았을까?

RTX 4090을 한마디로 정리하면 비싸지만 비싼 값을 하는 놈이다. 물론 가격 자체가 너무 비싼 것도 맞다.

그래도 기존 RTX 3090FE의 MSRP가 1,499$였고 RTX 4090FE의 MSRP가 1,599$인 점과 성능 향상을 감안해 보면 가격 인상분(+100$)은 살짝 선녀 같은 느낌도 있다. 물론 현실적인 환율과 국내에서 구매할 수 있는 소비자 가격이 아쉬운 것도 맞다.

그래도 순수 성능에 있어서는 RTX 3090대비 7~80%가량 향상됐다. 더불어 전력 제한을 활용해 본다면 낮아지는 성능 대비 매우 매력적인 전성비도 제공한다. 이렇게 보면 450W라는 높은 TGP말고 320W로 살짝 낮췄다면 상당히 매력적인 TGP에 높은 향상을 모두 만족할 수 있는 그래픽카드가 되지 않았을까?

더불어 안정된 환율 시장 속에서의 출시였거나 NVIDIA가 공식 가격 인하 혹은 동결이라는 카드를 들고 왔다면 더 좋은 평가를 받지 않았을까 하는 아쉬움도 있다.

관련기사

저작권자 © 맨즈랩 무단전재 및 재배포 금지