잡담 넥7 기대이하네요...
2012.09.28 13:04
넥서스7에 들어간 cpu가 테그라3라는 사실은 다 아실테지만
테그라3에도 몇가지 라인업이 존재하네요~
기본적으로 t30/ t30l /t33 으로 나뉘는데 그중 가장 하위스펙인 t30l이 넥7에 탑재되었죠~
그래도 나름 쿼드코어인데 몇몇 벤치마크를 보면 듀얼코어인 엑시노스4210이나
랍칩 rk3066보다 떨어진다고 하네요~
그래서 이 t30l에 대해서 좀 알아봤는데
t30l 은 싱글에서 1.3기가가 최대클럭이고 쿼드에선 1.2기가가 최대클럭이며
gpu클럭이 520 -> 412로 다운되었다고 합니다.
이정도는 어느정도 이해가 갑니다만 가장 중요한건 l2캐쉬가 아예 없다는것입니다.
cpu에서 l2캐쉬가 꽤 비싼걸로 아는데 이게 빠져버렸으니 당현이 저렴할수밖에 없는거죠~
저는 그냥 이번 넥7은 pass하고 킨들hd나 노려봐야겠습니다~
ps. l2캐쉬란???
Cache memory란, 기본적으로 main memory보다 access 속도가 월등히 빠른 memory로 구성합니다.
일반적인 프로그램은 수행의 국부성으로 말미암아
한 어드레스에서 명령어나 데이터를 읽어 들이면,
다음 동작에서 그 다음 어드레스에서 명령어나 데이터를 읽어 들일 개연성이 매우 높습니다.
그래서 당장 필요하지도 않은 메모리 내용을 미리
main memory로부터 cache memory로 가져다 놓는 것이죠.
기대했던 대로 다음 동작에서 그 명령이나 데이터를 사용하게 되면,
월등히 빠른 속도가 실제로 진가를 발휘하게 되는 것입니다.
이제 level이라는 것에 대해서...
예전에는 level 1이라 하면, CPU에 같은 die로 구현한 조그마한 cache memory를 의미했습니다.
Cache memory는 엄청난 die 면적을 요구하는데, 따라서 L1 cache는 많은 양을 구현하지는 못했습니다.
보통 instruction/data 분리해서 각각 32KB 정도였죠.
이렇게 용량이 작으면, main memory와 용량 차이가 너무 많이 나죠.
용량 차이는 곧, 같은 cache 공간을 공유하는 main memory 영역들이 많다는 것이고,
이 영역들이 공교롭게 교차 실행된다면, 서로 그 자리를 차지하려고 하겠죠.
이것을 replacement라고 하는데, main memory의 A 영역과 B 영역이 같은 cache memory 영역을 공유한다면,
A가 그 영역을 사용하다가 B가 그 영역을 사용하려면,
A는 없애 버리거나, 변경된 값이 있는 경우 main memory에 다시 copy back을 해 주어야 하는 것이죠.
이것들이 cache memory의 overhead가 됩니다.
즉, cache memory의 원래 목적, 즉 속도 향상에 저해된다는 말입니다.
이렇게 cache memory에서 내가 필요한 data가 있는 비율을 hit ratio라고 합니다.
Hit ratio는 당연히 cache 용량이 클수록 높아집니다.
그래서 L2 cache라는 것이 등장합니다.
코멘트 10
-
Azraile
09.28 13:25
-
다운클럭이나 L2캐쉬문제는 배터리의 지속시간을 늘리기 위해 그렇게 설정한게 아닐까라는 생각이 듭니다.
-
diha
09.28 14:21
넵 성야무인님 말씀대로 다운클럭은 배터리와 발열때문에 그렇다고 하지만 l2캐쉬를 아예 없애버린건 원가절감밖에는 생각할수가 없네요 하긴 그래서 저 가격대에 나올수 있었겠지만요..
-
녹슨동전
09.28 14:37
T30L L2캐시가 1MB나있는데 없다니요. 잘못알고 계시네요.(http://en.wikipedia.org/wiki/Tegra) 락칩 3066은 듀얼이라 L2캐시가 오히려 테그라3의 절반인 512KB입니다. t30과 t30l 차이는 gpu클럭이 100mhz 차이가 나지만 gpu성능차는 5프로 이내입니다. 이럴 경우 낮은클럭의 T30L이 배터리 지속성은 높고 발열이 적어서 실사용에 유리하죠. rk3066은 말리400mp4라 gpu성능이 테그라T30L보다 5프로쯤 높을겁니다. 부동소수점 연산같은 cpu성능은 멀티스레드 테스트의 경우 테그라3의 절반수준이죠. 싱글스레드야 a9기반이니 고만고만 하겠지만요.
넥서스7 안투투 돌리면 만점은 가뿐히 넘어주고 오버클럭 100Mhz해줘도 12000점을 넘습니다. 벤치마크 성능은 갤3도 넘어서는데 락칩3066 달린 기기와는 차이가 꽤 많이 납니다.
-
diha
09.28 15:00
헛... 그럼 제가 잘못알고 잇었나보네요 네x버에 넥서스7 관련글을 검색해보다가 분해기라는 게시글이 있길래 봤는데 거기선 l2캐쉬가 없다고 나오더라구요~
-
녹슨동전
09.28 15:09
AP에 내장된 L2캐시가 넥서스7 분해한다고 보여지는것도 아닌데...참...난감한 분해기였을거 같습니다. 스냅드래곤 1세대가 l2캐시가 없어서 욕먹은 적은 있습니다.이후에 l2캐시 없다는 ap류는 arm11 초저가 제품외에는 들어본적이 없구요. 테그라는 테그라2에서 NEON이 없어서 동영상 고자란 소릴 듣기는 했지만 테그라3에서는 내장해서 동영상 고자란 소린 사라졌지요.
-
diha
09.28 15:30
아하~~ 잘못된점 지적해주셔서 감사합니다~~ 그렇다면 t30보다 크게 뒤떨어지진 않는군요~ 오버커널도 있나요?
-
녹슨동전
09.28 15:50
franco커널과 순정커널빼고 나머지 커널들 모틀리, 트리니티, faux123, elite 커널들은 모두 오버클럭을 지원합니다. 최대 1.7Ghz gpu는 600mhz까지 오버할 수 있습니다.
-
이미 녹슨동전님께서 정리해주셨군요~ ^^;
예전에 기사를 봤는데, 테그라 t30l은 기기성능은 최대한 그대로 유지하면서, 원가절감을 위한 여러 꼼수를 많이 썼다고 하더군요.
무슨 내용이였는지는 기억이 가물가물한데, 클럭다운 이외의 기기성능은 건들이지 않았던 것으로 기억합니다.
공급업체의 단계를 줄이는 식으로 가격을 낮췄다고 했던것 같네요...
RK 3066은 최적화 잘된 펌웨어에서 안투투 8천점대 후반이 나오고,
테그라3는 안투투 1만점은 기본으로 찍고 들어가죠...
사실 별의미가 없는, 순수 "점수놀이"에 불과한 수치이긴 하지만요... ^^;
-
에스비
09.28 22:46
벤치마킹 점수는 믿을게 못됩니다.
점수차이가 "10배"정도 난다면 확실히 성능상 차이가 난다고 볼 수 있지만,
그 이하의 차이라면 직접 만져보기 전에는 알 수 없습니다.
애초에 NP-Complete문제를 Polynomial로 Approximation 시킨게 벤치마킹이라
점수 맹신하면 망합니다. (특히 "자칭 전문가"집단 파코즈, 쿨앤조이 등..)
CPU연산성능만 놓고 보면 좋거나 비슷한 상태인데 발목현상의 결정적인 요인이 있군요.
차라리 듀얼에 캐시가 붙는게 나을수도 있는 상황이라니...