잡담 이 이후 중국 ap업체의 행보가 궁금하네요 ... (gpu부분...)
2013.06.14 04:24
밑에... Pinkkit님 글을 보면.... 아시겠지만서도 지금의 Cortex A9 x4 + mali400mp4 정도로 9.7인치 4:3 비율에서 레티나 라고 불리는
2048×1536의 해상도는 버겁습니다. 이는 정규 지원 이상의 해상도인 것도 있지만, 성능 자체가 떨어지니... 이는 amlogic의 새로운 칩이 Mali450으로 나온다고 해도 별반 달라질 거 같지는 않습니다...
(제가 대충 아는 기본 지식으로 밑의 글을 썼습니다. 틀릴 가능성이 농후합니다.....;;;;)
-----------------------
이것이 가장 많이 보이는 Mali400 입니다. mp 즉 1~4 코어 까지 늘릴 수 있습니다.. 다만, 이는 독립 쉐이더 구조로... 여기서도 구형 GPU로 까이는 원인이죠. 그래픽은 크게 2가지 요소로 폴리곤과 픽셀로 이루어져 있습니다. 폴리곤은 아시다싶이 뭉텅뭉텅의 물체라고 불리는 그 자체이고, 픽셀은 그 물체의 겉면을 체우는 문양 이라고 보면 버택스는 이 폴리곤을 만드는 성능이고 텍셀은 이 픽셀을 체우는 성능 입니다..
독립 쉐이더에는 이 텍셀과 버택스를 담당하는 코어가 각각 따로 있습니다. 위의그림에서 fragment core 라고 불리는 것이 픽셀담당의 코어고 위의 보이는 vertex코어가 이름대로 버텍스를 담당합니다.. Mali400 mp에서 코어를 늘린다고 한다면 저 fragment core를 늘린다는 것을 의미합니다. 언제나 버택스 코어는 1개라는 것이며 ,mp1이던 mp4던 폴리곤을 만드는 버택스 성능은 일정합니다.
http://www.arm.com/products/multimedia/mali-graphics-hardware/mali-400-mp.php
이는 ARM이 제공하는 정보에서도 알 수 있습니다. mp1이던 mp4이던 같은 클럭에서의 버택스 성능은 같습니다만, 픽셀 성능은 코어가 늘어난 만큼 4배가 되었습니다. 이는 어디까지나 이론상의 성능으로 실제로는 한참 못 미친 성능이 나오지만, 비교의 대상으로 삼을수는 있습니다.

Mali450의 다이를 보면 Mali400과 거의 같은 모습을 보실 수 있습니다. 왜냐? Mali450은 Mali400을 두개 붙여놓은것에 불과합니다. 실질적으로 저 버택스 코어는 mali400에서의 2개를 붙여놓은 것이며, 픽셀을 담당하는 fragment코어도 동일합니다. 그러니 mp4가 최대인 mali400에 비해서 450은 최대 mp8즉 8개의 코어를 가질 수 있습니다.
http://www.arm.com/products/multimedia/mali-graphics-hardware/mali-450-mp.php
450은 400에 비해 이론 성능도 클럭 상승분을 고려한다면 거진 2배의 성능을 보여줍니다. 그럼 2배가 된다고 좋은것이 아니냐? 이제 한번 실질적인 성능을 GL 벤치툴을 이용해서 비교해 보겠습니다.
http://gfxbench.com/result.jsp
---------- 먼저 텍셀 성능 입니다. (점수 뒤쪽 수식구는 뺐습니다 Mpix/s)
galaxy s2 - 464 -Mali400 mp4 266Mhz
galaxy s3 - 735 -Mali400 mp4 440Mhz
galaxy note2 - 891 -Mali400 mp4 530Mhz
nexus10 -1574 -Mali T604mp4 533Mhz
galaxy s4(Octa) -2076 -SGX 544mp3 ???mhz
galaxy s4(snapdragon s4) - 891 -adreno 320 ???mhz
nexus4 - 863 -adreno 320 ???mhz
one x - 266 -adreno 225 ???mhz
one - 975 -adreno 320 ???mhz
GalaxyNexus - 304 -sgx 540 308mhz
일단 결론부터 말씀 드리면 Mali400의 픽셀 성능은 훌륭하다고 말씀 드릴 수 있습니다. 위에서 재공된 이론상 성능의 거의 1/3 토막이 났지만 다른 GPU와 비교시에도 나쁘지 않습니다. 다 같은 안드니까요. (ios는 좀 더 효율이 높게 나옵니다. 이론성능 대비 실 벤치 성능이) 전기 퍼먹는 괴물인 T604랑 SGX544mp3 보다는 낮지만.... 이건 예들이 월등히 높은 결과고, 대부분의 제조사에서 많이 사용하는 스냅드레곤 S4 pro와 600에 들어가는 아드레노320 대비 비등비등한 결과를 보여줍니다.
---------- 이번에는 텍셀 성능 입니다. (역시 뒤쪽 수식구는 뺐습니다. Mtriangle/s)
galaxy s2 - 8 -Mali400 mp4 266Mhz
galaxy s3 -11 -Mali400 mp4 440Mhz
galaxy note2 -11 -Mali400 mp4 530Mhz
nexus10 -65 -Mali T604mp4 533Mhz
galaxy s4(Octa) -41 -SGX 544mp3 ???mhz
galaxy s4(snapdragon s4) -64 -adreno 320 ???mhz
nexus4 -54 -adreno 320 ???mhz
one x -38 -adreno 225 ???mhz
htc one -60 -adreno 320 ???mhz
Galaxy nexus - 9 -sgx 540 308mhz
결과? 보시다싶이 매우 떨어집니다...... 이미 옛날 옛날 고인 취급 받는 SGX540과 같은 성능입니다. 이는 위에서 설명한 것과 같이 버택스를 처리하는 코어는 언제나 1개 이기에.... 매우 떨어지는 성능이 나올 수 밖에 없는 것입니다. 주로 비교되는 adreno나, 같은 Mali시리즈라도 T604는 통합 쉐이더 구조 입니다. 하나의 코어에서 텍셀과 버택스를 같이 처리합니다. 이 경우 한쪽의 성능만 심각하게 떨어질 일은 없고, 병목 현상도 적죠. 단순 벤치 점수가 꼭 실 성능을 의미한다 라고 할 수는 없지만 특성을 보여주기에 충분하다고 봅니다.
---------- 이제 Mali450 mp8을 비교해 봅시다.
단순 동클럭에서 2배의 성능을 낸다고 가정해도 큰 무리는 없다고 봅니다. (단순히 2개의 패키지를 붙이 수준이니요) 클럭은 Rk3188의 현재 유통되고 있는클럭인 533은 mp4의 구조이니 좀 더 다운시켜서 Mali400의 발표시의 팩토리 클럭이며 Mali450의 권장 클럭인 500과 210의 중간 정도인 400mhz 정도로 잡았을때의 예상 점수는 텍셀 - 1400 Mpix/s, 버택스 - 22 Mtriangle/s 내외가 나올것으로 보입니다.
여기서 첫 레티나 라고 불리는 해상도를 가진 뉴 아이패드에 들어간 A5X의 SGX543mp4의 성능을 보자면
SGX543MP4
-통합쉐이더 아키텍쳐
-OpenGL ES2.0, OpenVG1.1 지원
-버텍스 성능: 133 Mpolys/s
-텍셀 성능: 4.0 Gpix/s
의 이론성능 입니다.
대충 하던데로 실성능이 1/3토막이라면 텍셀 - 1333 Mpix/s, 버택스 - 44 Mtriangle/s 정도의 실 성능이 나온다고 할 수 있겠습니다. 텍셀은 충분합니다. 원래도 텍셀은 다른 GPU대비 뒤떨어지지 않았으니까요. 다만 아직도 버택스 성능이 부족합니다. 애플은 위의 스펙에서도 충분한 성능이 나오지 않는다고 판단해서 아이패드4세대에서는 SGX554mp4로 한단계 더 GPU성능을 올렸습니다.
-----------------------
대안-1
일단 allwinner a31 처럼 sgx544mp2가 있습니다. 다만 SGX54X 시리즈는 생각보다 마음대로 코어를 늘리지 못합니다. (544의 정보는 너무 빈약해서 543의 정보를 가지고 왔습니다. 543과 544는 거의 비슷한 gpu입니다. ) 일단 SGX543 mp2가 들어간 apple의 A5입니다.
cortex a9 x2 + sgx543mp2
A9 1,2위의 저 CPU코어보다 더 거대한 것이 SGX543 mp2 입니다. 543mp4가 들어간 A5X는 더하죠 ....
cortex a9 x2 + sgx543mp4
보이시나요 .... AP다이 크기의 절반을 차지하는 GPU입니다. 이렇게 되면 AP의 다이가 너무 거대해 지고 이에다라 양산에도 문제가 생길 수 밖에 없습니다. Allwinner a31이 쿼드코어지만 Cortex a7을 탑제할 수 밖에 없는 이유가 여기있습니다. 이미 GPU쪽에서 전력이던 다이크기던 거의 다 먹어 버렸거든요. (이건 미디어텍 쪽도 마찬가지입니다.)
대안-2
Mali T604가 있습니다. 이는 Exynos 5250에 들어갔으며, 통합 쉐이더 구조로 위에서 이미 충분한 실 성능을 보여주며 엄청난 해상도를 자랑하는 NEXUS 10 에 이미 들어간 바 있습니다. 다만 문제는 전력 !!! (http://www.anandtech.com/show/6536/arm-vs-x86-the-real-showdown/12 여기 원문의자료입니다. 들어가시면 더 자세한 정보를 보실 수 있습니다.)
이쪽으로 유명한 사이트인 Anadtech에서 위의 Exynos 5250을 분석하면서 겸사겸사 한 GPU의 전력소모 그래프 입니다. 대충 비교를 해보자면 Dell xps 10에는 저 위의 성능비에서도 알 수 있는 Adreno225가 들어있습니다. 딱 봐도 감이 잡히시겠지만.... 엄청나게 먹습니다.... 배터리를 그대로 들이마신다는 표현이 어울릴 정도로 ....
-----------------------
-결론-
이 문제는 AP 제조사라면 모두 가지고 있는 문제 입니다. 아직 전력 문제 없는 컴퓨터에서도 대중화 되지 않은 초 고해상도를 여러가지 제약이 많은 모바일 기기에서 해결해야 한다는....
그래서 여러가지 대안을찾은 회사들이 있죠
일단 삼성, 여기는 공정 미세화에 겁니다..... ARM의 지원을 크게 받기도 하고 SGX의 이메지네이션 그래픽사 와도 친분이 깊습니다. 대부분의 중국이나 기타 제조사의 AP가 대만의 TSMC팹의 SiON 28n에서 나올 때 같은 28n 지만 HKMG(High-K Metal Gate 또는 high metal-k 라고도 합니다. 신소재지요.) 공정에서 뽑고 20n대의 양산을 준비하고 있습니다.
애플도 삼성따라 갑니다.... 삼성에서 칩을 생산하기 때문에 같은 공정 미세화의 덕을 볼 수 있습니다. TSMC로 넘어간다 넘어간다 하는데... 아직 증권가 씨라시로도 차세대 아이폰 AP는 삼성에서 생산할 거라는 의견이 대부분 입니다.(A7 이라고 불리는 그것)
퀄컴, 스냅드레곤 시리즈로 모바일폰 시장을 많이 먹고 있습니다. 자사의 GPU인 Adreno는 AMD에 통합된 구 ATi의 모바일 솔루션인 Imageon 사업부를 인수한 것 입니다. 라데온 모바일의 원천 기술을 가지고 있으니 개량할 여지는 충분합니다.
엔비디아, 넥서스7에 들어가서 재미좀 봤습니다만.... 지금까지는 순수 GPU성능으로 제일 떨어지는 엔비디아 였습니다. 지금까지 최적화로 때웠죠. 이번 테그라4도 현 벤치에서는 가장 높은 성능을 보여주지만 아직도 독립 쉐이더 구조 입니다. 그래도 PC그래픽의 강자이며 지포스 라는 그래픽 솔루션을 가지고 있습니다.
이렇게 AP계의 Big 4라고 불리는 제조사들은 나름의 활로를찾고 있습니다..
이 이후의 어려운..... 상황에서 중국 AP업계의 GPU쪽의 활로가 매우 기대되며 나름의 방법을 잘 찾아서 나갔으면 합니다.
코멘트 14
-
ForGoTTen
06.14 04:45
-
purity
06.14 07:24
본문을 수정해드렸습니다. 내용은 전혀 손보지 않았으며 레이아웃 깨진 것들과 단락 구분들 만을 편집 수준에서 손 보았으며, 애초 의도하신 것이 이미지 본문 삽입이라 판단하여 삽입해드렸습니다.
레이아웃이 깨졌던 원인으로는 문건을 복사하면서 발생한 것으로 보입니다. div, table 등의 html 코드에 width, height 값 들이 잘못(=크게) 지정된 경우 사이트 메뉴 등 다른 컴포넌트를 가리기 때문입니다. 아시겠지만 웹은 근본적으로 평면이므로 발생하는 부득한 문제입니다. 이미지 등의 외부 링크에 있어서도 html 코드를 직접 확인하시고 원문 출처를 명기하는 것이 적절하며, 이것이 어려울 경우 외부 이미지를 다운로드하신 후 본문의 파일박스를 이용해 업로드 및 본문삽입하시는 방법이 적절합니다.
좋은 글 남겨주셔서 다시금 감사드립니다.
*매우 특별한 경우가 아니면 어드민 계정을 사용하지 않기 때문에 이 조치는 관리권한이 지정된 개인 계정으로 처리하였습니다. 혹여 제 정체가 궁금하시다면... 운영진이라는...;;;
-
ForGoTTen
06.14 14:44
정말정말 감사드립니다....ㅎㅎ 글을 쓰다보니 너무 길어지게 되고 어디서부터 손을 댈지 모르겠었는데... 이렇게 깔끔히 정리해 주시다니 감사할 따름입니다. ;;;;
-
오 좋은글 잘 보았습니다.
이해가 잘 되네요...
PC의 환경도 그렇고 모바일도 그렇고 GPU가 갑인 상황이 되어 버리네요
-
잘보았습니다.
다이사이즈, 전력소모량 문제도 있겠지만, 중국ap들은 단가맞추기에 좀더 무게를 두는듯 싶습니다. 차세대 ap로 공개되는것이 대부분 듀얼코어에 철지난 gpu 구성으로 나오더군요. Amlogic 쿼드코어도 본문에 언급된 mali450탑제 예정이니 확실히 gpu파워는 그리 개선될거 같지는 않구요. gc1000+, gc2000, mali400mp1, sgx540 @600 등... 중간사양 이상의 게임을 구동하기에는 버겁거나 호환성이 부족한 gpu들이 채택되더군요.
성능을 많이 희생하더라도 저전력+저가 를 목표로 ap설계가 되는듯 싶습니디. -
ForGoTTen
06.14 14:54
그 점이 매우매우 아쉽습니다.... 저해상도(그래도 HD급)에는 충분하지만, 레티나급 되는 물건을 대기업에서 이렇게 입맛 맞추어 저렴히 뽑아줄리는 만무하고. 다른걸 쓰자고 해도 딱히 대안이 없으니까요.
-
Pinkkit
06.14 10:40
좋은 글 잘 보았습니다. ^^
실제로 사용해보면 의아한 부분이 속도감 있는 레이싱 게임조차도 어느 정도 Mali400 으로 2048x1536이 커버가 됩니다. (물론 풀프레임은 안나옵니다만 플레이에 지장 없을 정도로..) 간혹 텍스처 로딩이 한타임씩 늦어 플리킹이 발생하긴 하지만 거의 대부분 문안하게 렌더링을 해내죠; 2D 게임도 미리 스프라이트 개체들을 캐시하기 때문인지 느리다는 느낌은 없습니다. 그저 주사율 자체가 50hz라 최대로 확보할수 있는 프레임 자체를 50hz로 제한되어 있죠.
이런 점을 보면 참.. 여러가지 의미로 대단하다는 생각은 듭니다; 정말 최소한 될것만 되게 그리고 싸게 만들어 팔자라는 느낌이랄까요;
-
ForGoTTen
06.14 15:00
원래 아직은 대부분의 모바일 게임이 픽셀 위주의 렌더링으로 3D를 그려냅니다.
아직은 적은 오브젝트에 겉만 화려하게 칠해져 있으면 "와~! 그래픽 좋은 게임이다" 라고 인식하는 것이지요.
하지만 점점 폴리곤의 사용 비율이 올라가는 추세인데... 그렇게 된다면 이 이후의 성능 하락이 두드러질것으로 생각됩니다.
이미 이는 레이싱 게임에서 코너등에 많은 차량이 몰릴 때 "그려내야 하는 차량수 증가" = "오브젝트 증가" = "버택스 필요량 증가" 로 인해서 많이 버벅이는 경우가 많죠..
솔직히 제가 보기에는 레티나 해상도 정도의 UI만이라면, 커널 단계의 최적화를 통해 충분히 부드러울 수 있을거 같은데... 많이 아쉽습니다. 물건은 잘 뽑은듯 하나...이런 후속 지원이 잘 이뤄지지 않는것에 대해서요
-
달나라왕자
06.14 11:11
GPU 정리를 일목요연하게 해주셔서 보기가 참 좋은 글입니다.^^
덕분에 좋은 글 잘 읽었습니다.
-
피버란
06.14 11:11
Mali T604 탑재한 넥서스10의 경우 게임벤치마크에서 엄청난 발열과 배터리 소모를 자랑한 적이 있었죠...
구글보다 자금력 부족한 저가의 태블릿 생산회사들이 감당하기엔 여러모로 버거운 GPU같아요.
단가나 기술력 모든 면을 따졌을 때 저가의 중국 태블릿들이 감당할 수 있는 GPU의 한계는 SGX544MP2로 보이네요.
-
ShadowPlan
06.14 11:53
좋은 글 잘 읽었습니다.
-
오늘 노트북에서 글썼다가 다시 날라가서 쓰지만 억지로나마 레티나 디스플레이를 장착하는건 마켓팅적 요소, 중국에 자존심 그리고 생산되는 레티나급 디스플레이에 대한 소화가 맞물려져서 나타난 복합적인 이유라고 보시면 될겁니다.
중국 AP업체도 레티나 디스플레이가 그들에 개발한 AP에 적절치 못하다는건 이미 알고 있습니다만 채용할려는 이유는 다운스케일링이라는 꼼수를 써서라도 가능할수 있기에 이런일은 하는것이죠.
또한 중국내에서도 현재 나오는 쿼드급의 AP가 가장 적절한 해상도는 9.7인치급의 1024X768과 10.1인치의 1200X800정도라는 걸 이미 알고 있고 한계로 뽑아져 나올수 있는 최적화된 해상도는 10.1인치급에서 1920X1200 (중국에서는 이걸 레티나급이라고 하는경우도 있지만) 입니다.
현재 중국에서 바라보는 관점에서의 쿼드 AP는 이렇습니다. 사실 눈에 선명하게 보일정도면서 웬만큼 쓸수 있으면서 앞으로 안드로이드 OS업글해도 듀얼급이상이면 크게 문제는 없습니다. 이정도면 레티나급은 아니겠지만 9.7인치에 1024X768 IPS정도도 충분히 돌아가며 게임역시 최상위급까지 안드로이드급에서는 충분히 소화시킬수 있습니다.
즉 아무리 성능이 나쁘다라고 해도 Mali400 MP4급이면 고성능을 요구하는 3D게임도 40FPS정도가 나옵니다.
여기서 다시 돌아와서 왜 레티나급을 택하냐에 대한 답변을 재언급하자면 바로 아이패드 3와4에서 나오는 B급 및 C급패널의 물량을 소화시킬만한 곳으로 매력적인게 바로 이 중국계 쿼드 AP이기 때문이고 중국자체가 스크린 사이즈에 대한 표준을 정하기엔 아직까지 모자라다는데도 있습니다.
실예로 아이패드 3의 루머가 나오기 시작할 무렵부터 아이패드나 아이패드 2급의 IPS B급 혹은 C급패널들이 중국의 싱글코어 9.7인치급에 투여되기 시작하였고 최적화에 대한 시간이 조금 걸리긴 했으나 중국 타블렛 9.7인치급의 표준이 되었고 갤럭시 10.1의 1280X800 해상도가 어느정도 퍼지고 시장성이 먹히기 시작하지 중국업체들도 10.1인치 1280X800의 패널을 공급했습니다. 이와같이 레티나급의 공급도 비슷한 경우로 보시면 될겁니다.
GPU능력에 대해서도 한가지 이야기 하겠습니다. 요즘 들어서 과거 벤치에 대한 수치를 현재 적용하는게 맞지 않는다라는 것이 기기가 나오면 나올수록 휠씬 더 적나라하게 느끼고 있습니다. 위에 나온 수치를 기본으로 할때 PowerVR SGX540의 성능은 때려죽여도 Mali400 MP4에 미치지 못하는걸로 나와있습니다. 근데 말이죠. SGX540이 들어간 한기기를 테스트 한결과 (램영향도 받는다는 가정하에서 이기기는 램이 512메가밖에 안됩니다.) Mali 400 MP4를 가진 기기(이건 램이 1기가)와 GPU밴치마크에서 별다른 차이가 없을정도의 능력을 보여 주었고 실사용에서도 램용량부족때문에 튕겨나가는 일은 있어도 GPU자체 성능을 가지고 돌리는데는 거의 대등한 성능을 나타냈습니다. 앞으로의 공정의 변화가 중국 AP에 또 있을지는 모르나 공정의 변화및 소프트웨어의 능력 향상 혹은 눈속임으로 3-4개월정도면 어느정도 레티나급이라도 구동은 가능하리라 보고 있고 초저가 7인치급보다 마진이 엄청나게 많이 남는 대형 크기의 특성상 그쪽으로 계속 AP업체나 제작사가 계속 푸쉬를 할 가능성이 높고 실제로도 그러고 있습니다.
문제는 이렇게 될경우 중국에서 생산하는 양질의 AP가 사장될 가능성이 매우 높은 상황이며 이런 문제때문에 명칩이 될 가능성이 있는 물건들이 사라져 버린예도 있습니다.
정리하자면 중국 AP의 방향은 저비용 고효율이며 고해상도는 마켓팅 포인트로 잡는다라고 보시면 속이 편하며 실제 중국의 기술력을 보여줄수 있는 한계 사이즈 및 해상도는 10.1인치 1280X800정도로 보시면 되고 이쪽에서 최적화가 예쁘게 될겁니다.
-
ForGoTTen
06.14 16:53
확실히 비효율적이고 거의 마켓팅 하나만 보고 파는 레티나급 이라지만.... 좀 아쉽더라구요.
개인적으로 IOS는 영..... 별로 안맞아서... 이만한 액정으로 대기업에서 뽑아줄 가능성도 낮고...
다만 A10,A13,rk3066 기기를 나름 몇 대 써봤는데.. 확실히 점점 좋아지고 있는거 같기는 합니다.
특히 N70s는 배터리 타임도 그동안의 기기에 비해서 만족스럽고 가격대비 나름 훌륭했습니다.
-
녹슨동전
06.15 05:32
이번에는 텍셀 성능입니다->이번에는 버텍스 성능입니다로 바꾸면 완벽할것 같습니다. 좋은 글 감사합니다. 이해가 잘되는 글입니다.
뭔가 글의길이가 길어지면 형식이깨져 버리네요.
깨져버린 쪽의 링크. 크롬에서는 안 눌려지고
익스플로어에서는 눌려지네요...
다만 수정 버튼은 둘 다 없어저 버렸다는게 ...;;;;