샌디브릿지(SandyBidge)에 들어서
보통 말하는 '내장그래픽'의 고정관념이 많이
바뀌게 되었습니다.
샌디브릿지이전의 내장그래픽이라고 칭하던 제품들은 메인보드의 칩셋에 내장되어서 시스템 메모리를
공유하는 IGP(Integrated Graphics Processor)형태나, 클락데일이나 모바일용 프로세서인 애런데일처럼 멀티칩패키징 방식인 MCM(multi-chip module) 방식이었습니다.

이러던 것이 샌디브릿지(SandyBidge)에서는 
CPU와 GPU가 완전히 통합된 형태를 갖추게 됩니다. 
(AMD가 출시 예고는 먼저 발표했으나, Intel이 한발 먼저 출시했습니다.)

잠깐 최근 5년간의 CPU의 흐름을 보면
단일 코어시장은 펜티엄 4를 끝으로 종지부를 찍었고, 듀얼, 쿼드, 헥사 코어 CPU가 등장하는  멀티 코어의 시대이지만 늘어난 코어의 숫자만큼 성능의 차이를 느끼지 못하게 됩니다. 그러면서 출시된것인 사회 코드와 맞는 퓨전인데... 바로GPU와 CPU가 통합된 APU(accelerate processor unit)입니다.
바로 '짬짜면(짜장면 + 짬뽕)'의 등장이죠 ^^

     샌디 브릿지 노트북용 모바일 프로세서의 성능은 아래의 링크를 참고하세요.
링크 ☞  샌디브릿지 노트북 CPU (1부 : Core i3 & Core i5)
링크 ☞  샌디브릿지 노트북 CPU (2부 : Core i7)
링크 ☞  샌디브릿지 노트북 CPU (3부 : 내장 그래픽코어 HD Graphics 3000)


샌디브릿지

샌디브릿지 프로세서의 구조

데스트탑용 클락데일과 모바일용 애런데일에 내장된 GMA HD 는 컴퓨터를 사용함에 있어서 일반적으로 사용하는  대부분의 기능을 갖추었다고 한다면... 샌디브릿지(SandyBidge)에서는 프로세서에 내장된 그래픽 코어의 기능과 성능을 더욱 개량 시켰고, 프로세서에만 적용되던 전력관리 기술을 그래픽 코어에도  보다 적극적으로 사용할수 있게  되었습니다.

먼저 프로세서와 통합되면서 얻게되는 위치적인 이점을 생각할수 있는데...
바로 '링버스(Ring Bus)'입니다.

샌디 브릿지는 각 내부 모듈들의 연결에 공유 링버스 구조를 사용하게 됩니다.
링버스 위에서 이론적으로는 모든 모듈들이 자원을 공유할 수 있게 되며, 특히 ‘공유 캐시[각주:1]’ 의 비중이 커지게 되는데... 내장 그래픽 코어가 시스템 메모리뿐 아니라 프로세서 안의 공유 캐시를 함께
사용할 수 있게 됩니다.
이것은 캐시에서 바로 데이터를 사용함으로 인해 '느린' 시스템 메모리까지 접근하게 되는 횟수를
줄일수 있고, 지금까지 내장그래픽코어의 성능향상에 발목을 잡던  ‘메모리 대역폭’ 문제를  어느정도
해결할수 있게 됩니다.

위의 이미지에서 System Agent 부분의 파워 컨트롤 유닛(Power Control Unit)
링버스를 통해서 CPU 코어 만이 아닌 그래픽코어의 전력까지 관리하게 되고
이는 터보부스트2.0(Turbost Boost2.0)의 적용 범위를 GPU 까지 확장 시킬수 있게 됩니다.




스프트웨어의 하드웨어화


인텔의 가상화 기술에 관한 내용에서 언급한것처럼 인코딩과 디코딩이라는 소프트웨어적인 개념을 하드웨어와 시켜서 성능을 향상 시켰습니다.
MFX
(Multi-Format Codec)은 그래픽 코어 안에서 분리된 고정 유닛 형태로 존재하며,
MPEG2, VC1, AVC 규격에 대한 완전한 하드웨어 디코딩 기능을 제공하는데, 이 디코딩 엔진의
개선점은 전체 디코딩 과정을 독립 유닛으로 처리 가능하게 되었습니다. 기존까지는 모션 보정(MC:Motion Compensation)과 디블록킹 필터(LF:In-loop deblocking filter)를 실행 유닛이 담당했던 데 비해, 샌디 브릿지의 비디오 디코딩 유닛은 모든 과정을 디코딩 유닛이 처리하게 된다는 차이점을 가지고 있습니다.

퀵싱크 Quick Sync

퀵싱크 (Quick Sync)


위의 이미지에서 볼수 있듯이 
이전 세대의 클락데일이나 애런데일은 프로세서의
내장 그래픽은 동영상 디코딩 과정 중에 하드웨어 가속을 사용하지만 인코딩 과정은 전부 CPU에 넘겨서
처리합니다.

그러나 샌디 브릿지에 포함된 내장 그래픽은 동영상의
디코딩과 인코딩 모두 전부 하드웨어 가속 기능을
도입하여 동영상 코딩에 걸리는 시간을 절약할 수 있게
되었습니다.

그러나 '퀵싱크'를 통한 결과물은 높은 퀄리티를 유지하는 것이 아닌 많은 데이터의 손실을 가지고
있습니다. 즉 화질이 떨어뜨려서 빠른 결과물을 얻게되기 때문에... 고화질의 동영상 감상보다는
실시간 인코딩과 전송이 필요한 화상회의등에 보다 알맞을 것입니다. 또는 상대적으로 화면이 작은
모바일용 기기에서 사용하기에 적합할수도 있을것입니다.


그래픽 코어 모델( HD2000 / HD3000 )

데스크탑용 제품별 그래픽코어의 종류와 클럭

데스크탑용 저전력 모델에서 그래픽코어의 종류와 클럭

이전세대의 GMA HD에서 발전한 샌디브릿지 내장 그래픽 코어는 크게 두가지 모델이 있습니다.

     일반 데스크톱용 프로세서 라인업에 사용되는
                            HD 그래픽스 2000 모델(HD Graphics 2000 or HD 2000)과,
     데스크톱용 K 모델모바일 프로세서 라인업에 사용되는 
                            HD 그래픽스 3000 모델(HD Graphics 3000 or HD 3000) 있으며 
     두 모델간의 성능차이는 있으나, 기능적인 차이는 없습니다.
     그리고 같은 HD 2000 / HD 3000 이라도 프로세서에 따라서
     최고 클럭의 차이를 
가지고 있습니다.

 
     샌디브릿지 내장그래픽 HD 2000 / HD 3000 의 성능은 아래의 링크를 참고하세요.
링크 ☞ 샌디브릿지 CPU 비교 3부 : 성능 비교 (SandyBridge Processor BenchMark)

그래픽 코어 모델( HD2000 / HD3000 )

그래픽 코어 모델( HD2000 / HD3000 )

HD 그래픽스 2000과 3000의 결정적인 차이는 ‘실행 유닛 (EU : Execution Unit)’의  갯수입니다.
2000의 경우 6개의 실행 유닛을 탑재하고 있지만 3000은 12개의 실행 유닛을 탑재하고 있어
두 배 가까운 성능 차이를 보여 줍니다.

이전 모바일용 샌디브릿지 프로세서에 관한 내용을 작성할때도 언급한적이 있지만...
위에서 나열한 것들로 인해 샌디브릿지의 내장그래픽은 많은 발전을 이루었지만... 
아직 중급 이상의 그래픽카드와 비교하기에는 무리가 있습니다.
동영상(풀-HD포함)감상이나 웹서핑 또는 간단한 게임정도는 가능하지만
온라인 3D게임을
원활하게 진행한다던가 그래픽툴을 많이 사용하는 사용자에게는 부족한 성능입니다.

따라서 자연스럽게
"오버클럭 라인업인 K버젼에 왜 HD 3000의 그래픽코어를
 넣었을까?"
,
"오버클럭을 위해 배수락이 해제된 k버젼의 고성능 프로세서를 선택한 사용자가 과연 내장 그래픽의 성능에 만족하고
그것을 사용할까?"
 
"차라리 Core i3 모델에 넣는 것이 더 좋지 않았을까?" 
 라는  의문이 생기는 것은 당연할것입니다.

이전에는 의문이 든 상태로 남겨뒀는데...  
아무리 생각해도 이유를 알수 없어서 열심히 구글링해본 결과... 약간의 상징성이라는 의견이 많습니다.
일종의 프리미엄제품군이라는 이미지 인데...
오버클럭 라인업인 K 제품군에 HD3000이 탑재된것은
K 제품군의 실리콘 수준에서의 품질은 일반제품군에 비해 더 잘 관리되고 있다. 
오버클럭 능력에 관계되는 수율 관리에 있어 K제품군이 조금 더 우위에 있다는 의미로
많이들 해석하고 있습니다.


해당 제품별 성능의 벤치마크는 다음 포스트에 올리도록 하겠습니다. ^^



  1. 지금까지 프로세서와 메모리 계층 체계에만 포함되어 있던 보통 L3 캐쉬라고 불려지던 것이, 프로세서안에서의 공유 캐쉬라는 성격을 가지고 있기 때문에 'LLC(Last Level Cache)'로 불려집니다. [본문으로]

Posted by Rapter
,