잡담 왜 하필이면 NEC Renesas란 말입니까? T_T~~
2014.04.24 15:09
이번에 다수의 아이들 교구관련 타블렛을
입수중인데요. (당연히 한국껀 아닙니다.)
그중에서 업그레이드 된 모델은 Tegra3라서 꽤 많은 커펌이라던지
최적화라던지 그리고 킷켓까지도 올라갈수 있는 모델인데요.
구모델의 경우는 재앙에 가까운 Cortex A9의 듀얼코어
(클럭수가 533MHz밖에 안되는 T_T~~)
NEC Renesas였습니다.
대체 뭐냐구요.
이러면 자료가 적어서 할수 있는 것도 역시 적습니다.
(차라리 RK2918이었다면)
그나마 OS는 듀얼인 주제에 Froyo인데다가
AP자체의 코어가 대부분이 Core하나에 DSP하나를 붙이는데
이건 Core두개에 DSP를 하나 붙인 상당히 요상한 구조니까요.
그래서 듀얼이면서도 싱글의 2배성능이 나오는게 아니라 싱글의 약 20%정도 효율이 좋긴 헌데
그나마도 OS가 올라가지 못하면서 효율에 대한 이야기가 뒤로 들어가버린
(이때문에 RK2918의 허니콤모드에도 발려버린)
물건입니다.
코멘트 8
-
RuBisCO
04.24 18:03
-
星夜舞人
04.24 23:04
아 그렇군요. 현재까지 코어당 SIMD를 하나씩 페어링 시켜야지 효율적으로 알고 있었는데 그게 아닌가 보군요. 흠
테그라의 경우 Data Sheet를 어디엔가 쳐박아 둔게 있으니 나중에 올려놓겠습니다.
-
RuBisCO
04.25 00:03
DSP가 아니라 SIMD 유닛은 아예 별개의 물건입니다. SIMD 유닛은 코어의 구성 요소라 그렇게 비대칭으로 하진 않고 르네사스의 EMMA 역시 각 코어별로 자신의 NEON 유닛을 갖고 있습니다. 변태적인 구성이라면 테구라2가 대표적인 SIMD 유닛이 없는 변태죠. 데스크탑에서는 AMD의 스팀롤러가 2개 코어가 SIMD 유닛과 FPU를 공유하는 변태적인 구성을 하고 있구요. 서버로 가면 나이아가라 같은 물건들이 그런 구성을 취하구요.
-
星夜舞人
04.25 00:16
네 저도 그런 알고 있으나 실질적인 역할에 관해서는 큰 차이를 보이지 않아서 일부러 썼습니다. (물론 따져보면 많이 다르지만) 근데 르네사스가 코어별로 NEON유닛을 가지고 있었나요??? 하나밖에 없는걸로 알고 있었는데요???
Tegra2의 경우야 이부분의 문제때문에 전부 소프트웨어 코덱으로 돌리지 않는 이상에야 제대로된 (엄밀히 이야기하면 커널소스에 임프렌팅된) 동영상 재생이 힘드니까요.
-
RuBisCO
04.25 00:23
보시다시피 각각 자기 NEON 유닛을 갖춘 물건입니다. 사실 AMD 같이 변태적인 아키텍쳐라던가 나이아가라처럼 특수 목적 프로세서가 아닌 이상 그런 구성요소가 짝이 안맞진 않습니다. 덤으로 사실 테그라2의 영상재생 문제는 NEON 유닛이 없어서라기 보다(애시당초 A9 의 성능으로는 소프트웨어 디코딩을 해낼 능력이 안됩니다.) 내장된 디코더 유닛이 H.264 BP까지 밖에 온전한 지원이 안되는(HP도 되긴 하지만 WP 가속 불능) 허접한 물건이어서 그렇습니다.
-
星夜舞人
04.25 00:37
오호 그렇네요. 제가 지금까지 착각하고 있었던 거구요.
흠 그리고 테그라2의 영상재생문제에 관해서는 약간 다른 생각을 가지고 있어서요. 제가 알기로는 Allwinner의 AP빼고는 H.264조차 제대로 지원을 못하는 걸로 알고 있습니다만 그 부분에 대해서는 다른 이야기고 디코딩 능력이라는 게 어차피 저해상도에서라도 특정포멧을 디코딩 할수 있다면 소프트웨어 디코딩방식이 어떻게 되었던 일단 디코딩이 된다라고 보는 입장입니다.
-
RuBisCO
04.25 03:16
영상을 디코딩하는데 있어서 같은 H.264라도 프로파일이 갈립니다. 문제가 되는 부분이 뭐냐면 같은 H.264라도 베이스라인과 메인,하이 프로파일은 완전히 격이 다릅니다. 테구라2를 포함해 옛날 AP에 내장된 디코더들은 메인, 하이 프로필에서 요구하는 CABAC이나 WP 또는 양쪽 모두 처리가 불가능 하므로 순수하게 CPU 연산 능력으로 디코딩해야 하는데, A9의 퍼포먼스란게 절대적으로 보자면 코어 두개를 합쳐야 간신히 동클럭대의 아톰 싱글코어를 감당하는 급이므로 480P급 정도야 어찌저찌 CPU 자체로 커버하지만(그나마도 부하가 심해지는 부분에선 프레임 안정화 불능) 720P급이 되면 당연히 버벅거리면서 원활한 재생이 불가능해집니다. 반대로 CPU 코어가 더 부실하다고 해도 디코더만 받쳐주면 재생이 가능합니다. 허밍버드나 A4가 그렇게 재생이 가능했죠.
-
星夜舞人
04.25 03:37
그부분에 대해서는 동의하고 실제로 720p를 재생하는데 Cortex A9급에서 Native로 재생못하는 정도는 충분히 알고 있습니다만 대부분의 타블렛 혹은 스마트폰이 가지고 있는 원해상도 자체가 480p급이라서 실제 디코딩을 하는데 있어 (예를 들어 CUDA와 같은) 480p급이상이라 하더라도 실상은 안드로이드 기기 LCD의 해상도를 맞춰서 하기에 디코딩 된다라고 봐야겠죠. 물론 Native 해상도 자체를 재생할수 있는 LCD를 가지고 있을경우에 (1280X800 이상) 테그라2급의 경우 720p정도의 동영상 자체를 디코딩에 대한 실현 가능여부를 물어본다면 저 역시 RuBisCO님과 동일한 의견을 제시했겠지만 테그라 2가 나온 시점에서 720p이상 즉 1080p정도를 sync해서 구현할수 있는 기기는 없는걸로 알고 있습니다. 또한 다운스케일링이라는 기법을 통해 실제 Pixel당 720p라는 동영상을 재상한다하더라도 화면자체를 뭉그러뜨리거나 초당 몇 Frame을 뺀뒤에 맞추는 경우도 있긴 합니다. 계속 언급하지만 스펙상으로의 720p라는 부분에 대한 디코딩 부분을 제외하고 제가 이야기 드리는건 그냥 재생이라는 측면입니다. 만약에 저라도 실성능이 미치지 않는다면 예를 든 몇가지 꼼수를 써가면서 소프트웨어적으로 디코딩 셋팅후 시장에 내놓고 800X480의 기기를 가지고 1080p도 디코딩이 가능합니다라고 할겁니다. 단 Tegra2의 경우는 이런 상황에도 불구하고 720p에서 1080p를 재생하는 꼼수를 발휘하는데도 시간이 걸리긴 했습니다. 정리하자면 꼼수를 포함하고 Native하게 못뽑는다 하더라도 디코딩이 가능하다면 가능쪽에 무게를 두고 싶습니다.
아 정정합니다. 일단 꼭 1:1 대응은 아닙니다. 퀄컴 등에서는 조성이 다릅니다. 퀄컴의 경우는 모뎀과 멀티미디어 처리에 각각 2개와 1개씩 할당됩니다. TI도 멀티코어 세대 들어와서는 빅리틀이나 컴패니언코어 비슷한 개념으로 M4 코어를 덧붙이긴 했지만 DSP는 하나죠. 테그라는 문서화 되있는게 없어서 알 수가 없군요.