GPU dla gracza i nie tylko

Nie zależnie od tego czy jesteśmy zapalonymi graczami czy po prostu od czasu do czasu lubimy w coś pograć nasz telefon musi być na tyle wydajny by pozwolił nam na uruchomienie danej gry. W świecie mobilnym możemy spotkać dosyć sporo układów SoC z różnymi GPU od których wydajności zależy jak bardzo skomplikowany tytuł zadziała na naszym smartfonie.

GPU dla gracza i nie tylko
Źródło zdjęć: © phonearena.com
Paweł Kosno

16.01.2014 | aktual.: 18.01.2014 12:25

Smartfony z roku na rok staja się coraz potężniejsze pozwalając nam korzystać z coraz większej liczby funkcji. Niegdyś przeglądanie internetu oraz odtworzenie prostego filmiku potrafiło wystarczyć w zupełności. Z biegiem czasu oczekiwania konsumentów zaczęły rosnąć, głównie dzięki producentom tych urządzeń, którzy oferowali coraz to lepsze podzespoły w swoich topowych modelach. Aktualnie smartfony zaczynają spełniać funkcje przenośnych konsol do gier. Nie ma się co dziwić – grafika jaką można spotkać w mobilnych grach robi wrażenia raczej na każdym. Wystarczy spojrzeć jak bardzo zaawansowane gry są wstanie działać na smartfonach, by dojść do wniosku, że urządzenia te mają w sobie spory potencjał. Niestety przenośne konsole maja pewną przewagę nad smartfonami – są nimi dedykowane klawisze do sterowania. Nie ma co się oszukiwać – sterowanie przy pomocy przycisków wyświetlanych na wyświetlaczu często pozostawia pewien niedosyt. Producenci jednak szybko znaleźli sposób na rozwiązanie tej niedogodności oferując specjalne pady dla smartfonów. Od tej chwili każdy zapalony gracz nie powinien narzekać na jakość sterowania, tym bardziej, że coraz więcej gier współpracuje z tego typu padami. Sam chociaż nie jestem strasznie zapalonym graczem lubię od czasu do czasu zagrać w coś na swoim telefonie.

Nie zależnie od tego czy jesteśmy zapalonymi graczami czy po prostu od czasu do czasu lubimy w coś pograć nasz telefon musi być na tyle wydajny by pozwolił nam na uruchomienie danej gry. W świecie mobilnym możemy spotkać dosyć sporo układów SoC z różnymi GPU od których wydajności zależy jak bardzo skomplikowany tytuł ruszy na naszym smartfonie, oraz jaką jakością grafiki będziemy się cieszyć.

W tym artykule postaram się przedstawić najpopularniejsze na naszym rynku układy stosowane w smartfonach oraz powiedzieć kilka słów na ich temat. Oczywiście w tym celu posłużę się również przykładami, po to by mieć ogólne pojęcie jaka moc w nich drzemie. Czemu ogólne pojęcie? Niestety sucha wydajność oraz moc obliczeniowa układów często nie ma odzwierciedlenia w praktyce. W rzeczywistości okazuje się bowiem, że układ który teoretycznie posiada olbrzymia moc radzi sobie gorzej niż inny, teoretycznie słabszy układ generując mniejszą ilość klatek na sekundę. Winna temu jest optymalizacja gier pod dany tytuł, szczegóły jakie dany układ obsługuje w danej aplikacji oraz rozdzielczość z jaka musi walczyć.

Taka grafika wymaga mocy obliczeniowej
Taka grafika wymaga mocy obliczeniowej© pocketgamer.co.uk

Jakie GPU powinniśmy brać pod uwagę?

Zaczniemy w takim razie od prezentacji najpopularniejszych układów z jakimi możemy się spotkać na rynku.

Adreno

GPU Adreno znajdziemy w układach SoC Qualcomma. Układ został początkowo opracowany pod nazwą Imageon przez ATI Technologies, która jak zapewne wiemy została w roku 2006 przejęta przez AMD. Po roku 2008, kiedy to Qualcomm wykupił od AMD udziały przemianował produkty Imageon na dobrze znane nam teraz Adreno. GPU tego producenta reprezentować będą: Adreno 225, 305, 320 oraz 330. Uwaga – jako że Adreno 320 można spotkać w różnych modelach SoC tego producenta i zależnie od danego modelu różni się taktowaniem oraz ogólna wydajnością reprezentowane będzie przez 3 smartfony.

Mali

Układy GPU Mali są opracowywane przez ARM Holdings. GPU to możemy spotkać w różnych SoC ze względu na to że ARM udziela licencji na opracowywane przez nie technologie. Skutkuje to tym, że GPU to możemy spotkać w różnych SoC (Exynos, Mediatek, Allwinner). Prawdziwi gracze mają do wyboru następujące modele GPU: Mali – 400 MP4, Mali – 450 MP4, Mali-T604 MP2 oraz Mali-T628 MP6. W niedalekiej przyszłości ma się pojawić kilka bardzo dobrze zapowiadających się układów GPU tego producenta, jednak na chwile obecną są niedostępne dlatego też nie znalazły się w tym zestawieniu.

Imagination PowerVR – PowerVR jest pododdziałem Imagination Technologies, które opracowuje sprzęt i oprogramowanie przeznaczone do wyświetlania grafiki 2D i3D. Początkowo firma skupiała się na rynku PC, jednak silna konkurencja na tym polu nie pozwoliła przebić się firmie. PowerVR po pewnym czasie zajął się opracowywaniem układów pobierających małą ilość prądu. Tak rozwinęły się układy tego producenta, które można było stosować w SoC. Akceleratory PowerVR podobnie jak akceleratory ARM nie są przez nich produkowane, lecz ich projekty obwodów i patenty są licencjonowane innym firmom jak np.: Texas Instruments, Intel, Samsung, Apple. Gracze powinni być zainteresowani smartfonami z następującymi układami GPU: SGX 544 MP2,3, SGX 554 MP4 oraz G6430. Model SGX 544 stosowany głównie w SoC Mediatek co prawda prawdziwego gracza nie zadowoli w pełni, jednak ze względu na jego dobrą wydajność znalazł się w porównaniu.

Nvidia Geforce ULP –Taki akcelerator możemy spotkać wyłącznie w SoC produkowanym przez Nvidia – zwanym potocznie Tegra. Tegra powstała w głównej mierze z myślą o smartfonach. Układy te charakteryzują się niskim poborem energii oraz dużą wydajnością. Układ GPU zawarty w SoC składa się kilku do kilkudziesięciu rdzeni wykonujących obliczenia związane z wyświetlaniem obrazu. Gracze w chwili obecnej powinni rozglądać się za układami z Tegra 3 oraz Tegra 4. Na horyzoncie pojawiła się Tegra K1 oferująca podobno olbrzymia wydajność, jednak na chwilą obecną smartfona z tym SoC nie spotkamy.

Telefony wybrane do porównania

Wybór telefonów nie był sprawą prostą. Qualcomm wraz ze swoim Adreno jak i Nvidia ze swoją Tegrą nie były wielkim wyzwaniem. Urządzenia z tymi podzespołami mają zbliżoną wydajność, ponieważ zarówno procesor jak i GPU znajdują się w tym samym SoC. Jednak Mali jak i PowerVR znajdują się w różnych SoC, a co za tym idzie sparowane są z różnymi procesorami. W tym wypadku wybrałem dla danego GPU SoC najbardziej popularny, ale za razem na tyle wydajny by nie ograniczał za bardzo akceleratora.

Porównanie układów jest porównaniem orientacyjnym. Nie ma możliwości sparować danego GPU z jednym procesorem, ponieważ jest to a- wykonalne. Pomimo wszystko pozwala rozeznać się w tym, jaki akcelerator będzie dla nas wystarczający. Programy jakich użyłem to …. W miarę możliwości starałem się wybierać ustawienia offscren, dla wyrównania szans. Trzeba bowiem pamiętać, że rozdzielczość ma wpływ na ilość generowanych FPS-ów a co za tym idzie płynność rozgrywki., jednak o tym trochę później.

Urządzenia które zostały wybrane do testów przedstawia tabelka, w której oprócz nazwy układu GPU znajdziecie podstawowe informacje jak rozdzielczość ekranu, taktowanie oraz ilość rdzeni procesora czy taktowanie układu graficznego.

Kilka podstawowych informacji
Kilka podstawowych informacji

Skoro już mamy reprezentantów należy teraz poznać jaka wydajność drzemie w poszczególnych akceleratorach. W tym celu skupmy się w tym momencie na fillrate. Termin fillrate odnosi się zazwyczaj do liczby pikseli jaką akcelerator graficzny może przetworzyć i zapisać do pamięci w ciągu jednej sekundy. Wyniki podawane są w MTexels/s.

Porównanie fillrate na poszczególnych GPU
Porównanie fillrate na poszczególnych GPU

Różnice łatwiej będzie wychwycić przy pomocy wykresów.

Fillrate offscreen (FHD)
Fillrate offscreen (FHD)

W wypadku fillrate offscreen każde urządzenie pracuje z tą sama rozdzielczością, czyli popularnym ostatnio Full HD.

Fillrate onscreen
Fillrate onscreen

Po przeanalizowaniu wykresów można zauważyć kilka ciekawych informacji. Okazuje się bowiem, że pod względem Fillrate najlepiej radzi sobie akcelerator GPU znajdujący się iPhone 5S. Trzeba pamiętać o tym, że akcelerator tam się znajdujący nie pracuje ze swoim normalnym taktowaniem. Zostało one obniżone z 450 MHz do 200 MHz. Ciekawe jak ten układ poradzi sobie w pozostałych testach. Zdecydowanie najgorzej wypadło Adreno 225 – tłumaczy to czemu gry pod ten układ mają tak często obcięte efekty graficzne.

Zobaczmy teraz jak poszczególne układy poradzą sobie z traingle texture test. Wyniki podawane są w MTriangel/s. Na początek tabelka, w której widać ile MTriangles/s osiągnęło poszczególne urządzenie a tym samym GPU w nich się znajdujące.

Obraz

Dla lepszego zobrazowania poszczególnych wyników te same dane w postaci wykresów. Pierwszy wykres przedstawia triangle texture test offscreen.

Triangle texture test offscreen
Triangle texture test offscreen

Tak prezentują się wyniki na poszczególnych urządzeniach przy rozdzielczości FHD. Dla osób ciekawych jak ten sam test wygląda w natywnych rozdzielczościach przedstawiam wyniki w onscreen.

Triangle texture test onscreen
Triangle texture test onscreen

Po raz kolejny okazuje się, że sprzęt Appla wyposażony jest w bardzo wydajne układy graficzne. Najlepiej w tym teście poradził sobie tym razem czterordzeniowy SGX 544. Jednak po raz kolejny pozytywnie zaskakuje układ zastosowany w iPhone 5S, pokazując że w tym akceleratorze tkwi bardzo duży potencjał. Teksturowanie w wypadku Mali 400 (znajdujące się w Samsungu Galaxy S3) nie wychodzi najlepiej temu układowi. Jednak spoglądając na wyniki pozostałych akceleratorów od ARM można stwierdzić że inżynierowie poprawili w sposób znaczący wydajność układu pod tym względem.

Ogólny pomiar mocy obliczeniowej można określić przy pomocy jednostki SI zwanej FLOPS. Jest to nic innego jak liczba operacji zmiennoprzecinkowych na sekundę i określa moc obliczeniową danego układu. Biorąc pod uwagę, że ludzki mózg wyciąga około 10 PFLOPS, możemy spać spokojnie ze świadomością że nasze smartfony jeszcze nie przejmią nad nami kontroli. Kończąc te futurystyczne żarty skupmy się jaka moc drzemie w poszczególnych akceleratorach.

Moc obliczeniowa poszczególnych GPU
Moc obliczeniowa poszczególnych GPU

Pod względem mocy obliczeniowej niepodzielnie rządzi Adreno 330. Nie na darmo układ ten nosi obecnie miano najwydajniejszego akceleratora w mobilnych GPU. Qualcomm pewnie czuje oddech swoich rywali na plecach ponieważ ich nowsze akceleratory nie odstają bardzo od lidera. W przypadku PowerVR G6430 obecnego w SoC Apple zmniejszono taktowanie rdzenia do 200MHz co odbiło się na zmniejszonej wydajności tego GPU. W dalszych testach jednak okaże się że pomimo tego zabiegu wydajność stoi na bardzo dobrym poziomie i nie dziwne że Apple postanowiło wydłużyć czas pracy baterii kosztem obniżenia taktowania.

Wydajność każdego telefonu z androidem na pokładzie jest namiętnie badana przy pomocy Antutu. Program ten chodź ma już trochę wiosen na karku jest cały czas w użyciu o czym pewnie wiecie czytając o przeciekach na temat najnowszych urządzeń które zostały nim " przebadane". Jako że w tym artykule skupiam się na GPU nie będę podawał całkowitej liczby punktów jakie zdobyły urządzenia a podam liczbę punktów zdobytych w testach graficznych. Wydajność układu została policzona zarówno w grafice 2D jak i 3D.

Antutu 2D
Antutu 2D

Jak akceleratory poradziły sobie w grafice 2D każdy widzi. Większość układów pokonała barierę 1500 punktów. Na tych układach żadna gra 2D nie powinna być nam straszna. Najlepsze układy pobiły granicę 1600 punktów, jednak jest to prawdopodobnie maksymalna wartość tego programu. Zastanawiający jest słaby wynik Adreno 305 - tym bardziej, że rozdzielczość na jakiej przyszło mu pracować nie jest wcale tak duża. Mam w tym momencie prośbę do użytkowników Samsunga Galaxy Mega 6,3 , by sprawdzili czy na swoich urządzeniach Adreno 305 również tak blado wypada. Być może jest to tylko wina oprogramowania. Tak czy inaczej programy jak i gry 2D graczom nie wystarczą. Rządni mocnych wrażeń i wodotrysków użytkownicy skupią się raczej na grafice 3D. Oto jak poradziły sobie akceleratory w tym teście.

Antutu 3D
Antutu 3D

Niestety wpływ na liczbę zdobytych punktów ma rozdzielczość dla tego test ten należy traktować typowo poglądowo. Spójrzmy jednak jak wygląda sytuacja w tym teście. Mali 400 MP4 walczy zażarcie z Adreno 225 oraz Geforcem z Tegry 2. Minimalnie z tej trojki wybił się SGX544, jednak czas tych GPU się kończy i bardziej należy skupić się na nowszych rozwiązaniach. Najlepszy wynik osiągnął akcelerator Mali-T628 MP6, jednak Adreno 330 jak i GeForce z Tegra 4 są tuż tuż przy nim osiągając również bardzo dobre wyniki.

Koniec tych suchych faktów. Czas najwyższy na wyniki podawane pod postacią FPS. Tak...to jest to co tygryski lubią najbardziej.

Zaczniemy klasycznie od programu który bardziej jest kojarzony z rynkiem PC niż rynkiem urządzeń mobilnych. Mowa tu oczywiście o 3DMark. Program ten bada moc obliczeniową głównie GPU dla tego na jego podstawie można obliczyć które GPU najlepiej radzi sobie w tego typu środowisku - czyli tam gdzie potrzebna jest największa wydajność. Test jest podzielony na try etapy. Każdy z etapów obciąża SoC badając w ten sposób jego wydajność. Pierwsze dwa testy badają wydajność GPU (pixel oraz vertex shader) natomiast test trzeci bardziej skupia się na wydajności samego procesora. Uzupełnieniem testu jest dodanie profilu extreme, który jak sama nazwa wskazuje jest tym czym Crysis na ultra dla PC.

Test 1
Test 1
Test 2
Test 2
Test 3
Test 3

Wnioski po pierwszym teście jakie się nasuwają raczej nie są niczym nowym. Każdy układ który osiągnął powyżej 25 FPS zasługuje na pochwałę ponieważ obraz jaki renderują robi wrażenie. Podpierając się wynikami testu gracze powinni zacząć unikać smartfonów z wysłużonym już Mali 400 MP4, dziadkowatym Adreno 225 oraz ULP GeForce z Tegra 3. PowerVR 544 z Mediateka ewidentnie cierpi na samotność, ponieważ w pojedynkę jest mu ciężko osiągnąć przyzwoite wyniki. Adreno 305 po raz kolejny może zasmucić słaba wydajność, nawet w teście podstawowym. Jest to wynik na granicy płynności i aż strach pomyśleć co by było przy wyższej rozdzielczości wyświetlacza. 25 FPS na podstawowych ustawieniach robi dobre wrażenie, jednak 25 FPS w ustawieniach ekstremalnych pozwala na prawdę optymistycznie patrzeć na przyszłość. Akcelerator GPU który osiągnął w tym profilu płynny obraz miał nie lada wyzwanie, a grafika jaką przyszło podziwiać nie stanie się standardem zbyt szybko. Test fizyki szczególnie ładnie pokazuje jak ładnie rozwijały się SoC Qualcomma oraz Nvidii na przestrzeni czasu. Pokazuje również że 64 bity w nowym iPhonie nie spowodowały trzęsienia ziemi i na chwilę obecną nie ma potrzeby spoglądać z zazdrością na 64 bitowe układy. Ich czas jeszcze nie nastał.

Tym oto sposobem przebrnęliśmy przez 3DMarkt i pozostał nam już właściwie ostatni sprawdzian. Jest nim GFXBench 2.7 T-Rex HD oraz GFXBench 2.5 Egypt HD. Benchmark ten pozwala na multiplatformowe testy urządzeń pozwalając na ich porównanie. Dodatkowym plusem aplikacji jest możliwość przeprowadzania testów w rozdzielczości natywnej jak i dla wyrównania szans w rozdzielczości FHD, czyli tzw. offscreen.

Na pierwszy ogień pójdzie GFXBench 2.7 T-Rex HD. Wyniki podawane oczywiście w FPS.

Obraz

Już pierwszy rzut oka na długość słupków pozwala stwierdzić, że jest to wymagający benchmark. Nieliczne tylko układy przekroczyły barierę 25 FPS zapewniając tym, samym płynny obraz. Sztuka ta udała się w zasadzie trzem bohaterom: Adreno 330, PoverVR G6430 oraz ULP GeForce z Tegra 4. Należy jednak zwrócić uwagę w jakiej rozdzielczości osiągnęły one takie wyniki. Żadne z nich nie pracowało w FHD…no prawie żadne bo jako jedyny w rozdzielczości FHD poradził akcelerator GPU iPhona 5S osiągając imponujące 27 FPS. Jest to świetny wynik tego GPU, tym bardziej, że to nie jest wszystko na co stać go stać. Dla Adreno 330 niestety rozdzielczość FHD to za dużo, jednak jednego możemy być pewni – nadchodzące Adreno 420 nie będzie miało problemu z pokonaniem bariery 30 FPS w tym teście. Czas na nieco bardziej łaskawy benchmark dla GPU jakim jest GFXBench 2.5 Egypt HD.

Obraz

Tym razem sytuacja jest zgoła odmienna niż poprzednim razem. Tylko nieliczne układy nie zdołały osiągnąć progu płynności jakim są 25 FPS.

Jakie GPU zatem wybrać?

Testy chociaż nie są pełnym odzwierciedleniem tego co się dzieje w rzeczywistości pomagają nam mniej więcej oszacować, który układ najlepiej sprawdzi się w grach. Bez wątpienia PowerVR G6430 na chwilę obecną wydaje się najbardziej kompletnym GPU. Poza wydajnością w benchmarkach świetnie radzi sobie w prawdziwych grach. Niestety na chwilę obecną możemy znaleźć go jedynie w produktach Apple. Należy pamiętać, że aplikacje pisane pod urządzenia Apple charakteryzują się bardzo dobrą optymalizacją, dla tego nie powinno dziwić, że nawet SGX543 MP3 w grach radzi sobie znakomicie chodź na podstawie wykresów szału nie ma. Pomimo wszystko PowerVR G6430 wystarczy na długi czas, a w momencie premiery na androidzie powinien być równie wydajny i dobrze współpracować z aplikacjami. Adreno 330 jest bez wątpienia najwydajniejszym układem jaki znajduje się w szeregach zielonego robocika. Niestety za wydajnością nie podąża jeszcze odpowiednia optymalizacja czego wynikiem jest chociażby GTA San Andreas, które jak na takie parametry powinno działać na maksymalnych detalach. Na pewno nie spotkamy gry która na tym GPU nie będzie działać - to jest pewne, jednak lekki niedosyt jest gdy oczekujemy topowej wydajności, a obraz na wyświetlaczu gubi klatki. Mali wydaje się pod tym względem najbardziej zbalansowane. Duża wydajność oraz dobra optymalizacja gier pod te układy skutkuje bardzo dobrymi wynikami FPS gier. Co prawda nie powinno się szukać modeli z Mali 400 nawet w 4 rdzeniowej wersji, ponieważ układ ten z nowymi grami będzie miał problemy., jednak wszystko powyżej powinno gwarantować jakość zabawy na bardzo wysokim poziomi. PS - GPU Mali należy szukać w wersjach przynajmniej MP2.

Dwa rdzenie czy cztery?

Przy okazji tego artykułu można w pewnym stopniu udzielić odpowiedź na to pytanie. Porównując chociażby Xperie SP z Nexus 4 można zauważyć że poza oczywistymi różnicami jakimi jest wygląd smartfony te sa bardzo do siebie podobne. Ta sama rozdzielczość ekranu, to samo GPU i prawie ten sam procesor. Jedyną różnicą jest liczba rdzeni - 2 vs 4. 4 rdzenie przydają się do pracy w systemie, przeglądania internetu oraz szybszego uruchamiania gier bądź aplikacji, jednak w kwestii gier sytuacja wygląda już nieco inaczej. W tym celu dla lepszego zobrazowania różnic posłużę się wynikami z testów.

Obraz
Obraz

Jak widać pewne różnice są, jednak nie są tak duże jakich można było się spodziewać po dwóch rdzeniach ekstra. Oczywiście praca na urządzeniu czterordzeniowym jest pracą bardziej komfortową - aplikacje oraz gry uruchamiają się szybciej przeglądanie internetu jest znacznie szybsze , jednak liczba wyświetlanych FPS w grach nie zwiększa się tak diametralnie. W przyszłości kiedy producenci gier w pełni nauczą wykorzystywać cztery rdzenie sytuacja pewnie ulegnie zmianie, jednak na chwile obecną do gier wystarczy dwurdzeniowa jednostka.

Źródło artykułu:WP Komórkomania
Wybrane dla Ciebie
Komentarze (0)