Apple M1 vs x86

1

@Anna Lisik: x86 należy wymienić ponieważ konieczność sprzętowego tłumaczenia go na wewnętrzny kod procesora zajmuj czas i opóźnia rozwój. Takich procesorów zwyczajnie nie robi się od lat, ale ze względu na kompatybilność wsteczną powstały wspomniane sprzętowe tłumacze Aczkolwiek Apple robi to z trochę innych powodów, a mianowicie przy x86 musiał czekać ze swoimi premierami aż intel będzie gotowy, do ARM sam robi czipy więc może wprowadzać na rynek nowe kompy kiedy uzna że już czas,

0

win10&intel to zawsze bedzie mercedes ale mozna probowac jezdzic fiatem ARM/Linux

zwlaszcza ze roczna licencja AutoCAD to 10 tys zl na tego mercedesa

to ze pod linux jest juz office open/libre a nawet corel czyli inkscape to juz duzo :) czekamy na dobrego CAD pod Linux

0

You can install macOS Big Sur on any of these Mac models
https://support.apple.com/en-us/HT211238

Wszystko w rękach Apple, sprzęt 100% apple, system 100% Apple, lista przetestowanych przez Apple kompatybilnych urządzeń znana od dość dawna.

Efekt? System przygotowany pod obsługę nowego procesora ucegla niektóre starsze macbooki. Te z listy przetestowanych i kompatybilnych.

Komu ucegliło, może oddać maka do autoryzowanego serwisu.
Apple z czasem zapewne problem rozwiąże albo zmniejszy listę kompatybilnych maków.

Szybkie wnioski? Takiej wtopy nie ustrzegł się Apple, to inni producenci softu też będą mieli mniejsze lub większe problemy.

BTW, jak wygląda testowanie sztandarowego produktu w firmie o kapitalizacji ponad 1000 miliardów dolarów, kiedy nie da się systemu nawet zainstalować a po nieudanej instalacji laptop może iść tylko do serwisu? :-o

4

Zamierzam naklepać dużego posta za jakiś czas, ale na razie zarzucę linkami:

AnandTech wysmarował już dwa artykuły ostatnio o chipach Apple'a.

Pierwszy artykuł o Apple A14, czyli czipie smartfonowym: https://www.anandtech.com/sho[...]pple-silicon-m1-a14-deep-dive A14 jest zbudowany w stylu big.LITTLE, tzn ma 2 mocne rdzenie i 4 słabe. Słaby rdzeń jest średnio prawie 4x wolniejszy od dużego, więc klaster 4 małych rdzeni jest tak samo mocny jak jeden duży rdzeń (zakładając idealnie liniowe skalowanie, co rzadko się zdarza). Na stronie https://www.anandtech.com/sho[...]le-silicon-m1-a14-deep-dive/3 widać porównanie Apple A13 wykonanego w drugiej generacji procesu TSMC 7nm (tzn N7P) z Apple A14 wykonanego w TSMC 5nm (prawdopodobnie N5, a nie N5P). Apple A14 jest 20% - 30% wydajniejszy i pobiera ok 20% mniej prądu. Na pewno nie tłumaczy to gigantycznej przepaści w wydajności na watt z najnowszymi procesorami x86. Dużo wskazuje na to, że Apple M1 oparty jest o te same rdzenie co Apple A14, a różnice sprowadzają się do tego, że np Apple M1 ma 2x więcej dużych rdzeni, nieco wyższe taktowanie turbo (3.2 GHz vs 3 GHz), dużo lepsze chłodzenie (bo smartfony są bardzo słabo chłodzone ogólnie), prawdopodobnie więcej pamięci podręcznej ostatniego poziomu, inny podsystem pamięci (DRAM jest zintegrowany z procesorem w jednym opakowaniu zamiast być wlutowanym w płytę główną), itd.

Drugi artykuł o Mac Mini z chipem Apple M1 i systemem operacyjnym macOS Big Sur: https://www.anandtech.com/show/16252/mac-mini-apple-m1-tested Widać, że wydajność pojedynczego wątku jest kosmiczna jak na takie taktowanie (max turbo = 3.2 GHz), a wydajność wielowątkowa też jest bardzo dobra. Oczywiście na skalowanie ponad 5x względem pojedynczego wątku nie ma co liczyć, bo Apple M1 ma 4 duże rdzenie i 4 małe. Jak już wspomniałem wcześniej te 4 małe rdzenie dodają tyle wydajności do 1 duży, więc w praktyce to nawet sporo mniej niż daje HyperThreading w najnowszych procesorach Intela. Z drugiej strony mały rdzeń pobiera 10x mniej mocy niż duży. Artykuł jest napakowany informacjami. Na https://www.anandtech.com/show/16252/mac-mini-apple-m1-tested/3 widać, że na układzie Apple M1 (bez samodzielnej karty graficznej, tylko integra jest używana) gra Rise of the Tomb Raider (w trybie emulacji / translacji x86) działa 3x szybciej od Intel Ice Lake przy podobnym kontrolerze pamięci! Szkoda, że nie dali Tiger Lake'a czy APU AMD do porównania, ale pewnie i tak Apple M1 by wygrywał w wydajności. Na stronach https://www.anandtech.com/show/16252/mac-mini-apple-m1-tested/4 i https://www.anandtech.com/show/16252/mac-mini-apple-m1-tested/5 mamy wyniki wydajności jednowątkowej i wielowątkowej w benchmarku SPEC. Dla ludzi, którzy twierdzą, że czipy Apple'a mają magiczne akceleratory - w benchmarkach SPEC jest dla przykładu test prędkości kompilacji kodu źródłowego: https://www.spec.org/cpu2017/Docs/benchmarks/502.gcc_r.html Nawet w tym teście czip Apple M1 wygrywa i to z takimi procesorami jak Ryzen 9 5950X (w trybie jednowątkowym) czy Ryzen 9 4900HS (w trybie wielowątkowym). Na końcu są wykresy pokazujące wpływ emulacji / translacji x86 na ARM: https://www.anandtech.com/show/16252/mac-mini-apple-m1-tested/6 Widać, że wskutek tego traci się między 5% a 50% wydajności, więc historie o translacji x86 -> ARM zwiększającej wydajność można włożyć między bajki.

Aktualizacja:
Dodatkowe testy kompilacji kodu: https://wccftech.com/apple-m1[...]results-as-fast-2019-mac-pro/

0


Porównanie do najmocniejszego MBP 13" z intelem oraz DELL XPS z intelem 11'th gen.
Najciekawsze jak dla mnie 7:25. Czegoś takiego właśnie oczekiwałem. Wysokiej kultury pracy. Dla niewtajemniczonych model z intelem ma dwa fany, a z ARM tylko jeden. Mimo to przewaga i tak jest po stronie ARM.

0

4:50 i trochę dalej
Przeglądarki
Natywne Apple Safari wymiata na nowym procesorze
Stary, niezmieniony Chrome jest znacznie szybszy na intelu.

Będzie powszechne przystosowanie softu do nowego procesora, to R.I.P. intel.
Nie będzie, to para pójdzie w gwizdek.

0
Wibowit napisał(a):

Apple M1 wygrywa i to z takimi procesorami jak [...] Ryzen 9 4900HS (w trybie wielowątkowym).

Widać tam, że też Ryzen 7 4800U (inna sprawa, że ciężko chyba kupić coś z tym dokładnie procesorem) też za mocno od M1 nie odbiega. Tylko zgaduję, że te procesory Ryzen U i HS (a nie ten desktopowy) miały wzięte wyniki z laptopów, a M1 z Maca Mini. Mac Mini to klocek o grubości 3,6 cm, czyli 1,5 do 2,5 raza grubszy od typowego współczesnego laptopa, w którym na grubość składają się też ekran i w sporej części klawiatura, więc to trochę nierówna walka pod względem chłodzenia.
W wynikach Cinebench R23 Macbooków M1 (czyli laptopów, z wiatraczkiem i bez) już tak różowo wydajność wielowątkowa nie wygląda.

1

W wynikach Cinebench R23 Macbooków M1 (czyli laptopów, z wiatraczkiem i bez) już tak różowo wydajność wielowątkowa nie wygląda.

Apple M1 to procesor w układzie a'la big.LITTLE. Ma 4 mocne rdzenie i 4 słabe rdzenie - w sumie 8 wątków, bo nie ma SMT. Ryzen 7 4800U ma 8 mocnych rdzeni, z których każdy ma włączone SMT (czyli wykonywanie dwóch wątków naraz). Patrz tutaj https://www.anandtech.com/show/16252/mac-mini-apple-m1-tested/5
119365.png
Apple M1 z obciążonymi 4 wątkami jest szybsze (w podanym benchmarku) od Tiger Lake z obciążonymi wszystkimi 8 wątkami. 4 słabe rdzenie (spośród wszystkich ośmiu) z Apple M1 niewiele wpływają na wydajność całego układu.

PS (podałem też wcześniej, ale pewnie niewielu zauważyło):
Dodatkowe testy kompilacji kodu: https://wccftech.com/apple-m1[...]results-as-fast-2019-mac-pro/

PPS:
Intel planuje własną wersję big.LITTLE: https://www.anandtech.com/sho[...]n-cove-and-gracemont-for-2021 8 dużych rdzeni (z SMT) + 8 małych rdzeni (chyba bez SMT). Będziecie to porównywać do 16-rdzeniowców z samymi dużymi rdzeniami?

0

Ciekawe czy skończy się to z czasem upychaniem w te Applowe ARMy coraz więcej rejestrów i cache oraz dodawaniem rozszerzeń do wszelkiej maści obliczeń wektorowych i innych wynalazków. Czyli będzie to ARM nie tak bardzo już RISC (w sumie i tak już średnio jest z Thumbami, NEON itd) i nie tak już bardzo energooszczędny.

1
Satanistyczny Awatar napisał(a):

Czyli będzie to ARM nie tak bardzo już RISC (w sumie i tak już średnio jest z Thumbami, NEON itd

Ale duża ilość rejestrów to jedna z głównych cech RISC… A SIMD mam wrażenie to również nie przeczy idei RISC, już bardziej AES-NI, ale jakby się uprzeć, to też da się to uzasadnić. RISC jak na moje nie oznacza, że jest mniej instrukcji (wbrew nazwie) a że instrukcje robią mniej i trzeba złożyć ich więcej by uzyskać efekt jaki chcemy.

Dodatkowo trzeba pamiętać, że ARM ma wiele aliasów, przykładowo add w ARM to instrukcja z 4 operandami - add with shift:

ADD <target>, <a>, <b>, <shift>

I ten operand jest aliasowany jako MOV (odpowiednik ADD <target>, <a>, 0, 0), SHL ze stałym argumentem (odpowiednik ADD <target>, <a>, 0, <shift>), etc. Więc w ARMach często jedna instrukcja może być używana przez kilka różnych operacji.

1 użytkowników online, w tym zalogowanych: 0, gości: 1, botów: 0