Pierwszy układ AI od Meta

Czas czytania: 4 min.

Jedną z dziedzin informatyki, która w ostatnich latach rozwija się w coraz szybszym tempie jest sztuczna inteligencja, czyli tak zwane AI (ang. Artificial Intelligence). Temat ten w opinii publicznej budzi skrajne emocje, jedni uważają AI za zagrożenie, które w przyszłości może pozbawić pracy wiele osób, poprzez automatyzację zadań obecnie wykonywanych przez ludzi. Dla drugiej grupy sztuczna inteligencja jest szansą, która pozwoli w przyszłości lepiej reagować na potencjalne kryzysy, czy też usprawni proces opracowywania nowych leków. Jednak niezależnie od opinii zgodzić się trzeba z faktem, że do dalszego rozwoju AI potrzebna jest moc obliczeniowa.  

AI od Meta

Z faktu tego doskonale zdają sobie sprawę zarządy największych firm technologicznych. Od lat możemy obserwować kolejne próby zrewolucjonizowania rynku sztucznej inteligencji, kolejne przedsiębiorstwa opracowują własne układy AI. Zdecydowanym liderem jest tutaj NVIDIA, której układy GPU oparte na architekturze CUDA radzą sobie całkiem dobrze z uczeniem maszynowym i równoległym przetwarzaniem danych. Poza tym na rynku pojawiły się też chipy TPU (Tensor Processing Unit) od Google przystosowane do przetwarzania tensorowego oraz procesory Apple Sillicon, wykorzystujące AI do zwiększenia wydajności i efektywności energetycznej. Kolejną firmą, która postanowiła wsiąść do pociągu AI jest Meta, będąca właścicielem serwisów takich jak Facebook i Instagram.

Czym są układy AI?

Procesory montowane obecnie w komputerach i smartfonach oferują nieporównywalnie większą moc, w porównaniu do chipów, stosowanych jeszcze kilka lat temu. Ktoś mógłby zapytać, dlaczego układów tych nie wykorzystuje się do obliczeń związanych z AI? Odpowiedź jest dość prosta – zwyczajne CPU nie radzą sobie ze sztuczną inteligencją przez swoją uniwersalność. Tradycyjne układy, przeznaczone są do bardzo szerokiego zakresu zadań, pozwalają one uruchomić programy oparte na AI, ale ich wydajność w porównaniu do dedykowanych układów AI jest znacznie niższa. Właśnie dlatego coraz więcej firm produkuje własne chipy, zwane też akceleratorami AI.

Układy AI to zazwyczaj pojedyncze chipy SoC, w którego wnętrzu znajdziemy niezbędne do działania elementy, projektowane są z myślą o obliczeniach związanych ze sztuczną inteligencją. Bazują one na unikalnych architekturach zoptymalizowanych pod uczenie maszynowe, przetwarzanie języka naturalnego czy też rozpoznawanie obrazów. We wnętrzach chipów AI znaleźć możemy komponenty, takie jak jednostki przetwarzania tensorowego (ang. tensor processing units, TPU), jednostki uczenia głębokiego (ang. deep learning units, DLU), jednostki neuronowe (ang. neural units) czy dedykowane bloki przetwarzania danych.

MTIA, czyli układ AI Meta

Meta Training and Inference Accelerator, w skrócie MTIA to pierwszy zaprezentowany przez firmę Meta niestandardowy chip AI przeznaczony do obliczeń związanych ze sztuczną inteligencją. Algorytmy wykorzystywane przez platformy społecznościowe tej amerykańskiej firmy, już od pewnego czasu korzystają z dobrodziejstw AI. Generowanie spersonalizowanych reklam, jak i feedu, czyli treści wyświetlanych użytkownikowi wspierane jest przez sztuczną inteligencję. Układ MTIA powstał właśnie w celu wsparcia tych procesów.

Dotychczas w centrach obliczeniowych Meta korzystano głównie z procesorów graficznych GPU, jednak układy te nie były optymalnym rozwiązaniem do obliczeń rekomendacji, czyli wspomnianych wcześniej treści wyświetlanych użytkownikowi. Projektanci Meta zdawali sobie z tego sprawę, dlatego zaprojektowali w pełni funkcjonalny chip ASCI AI, będący częścią rozwiązania full-stack, czyli podejścia, w którym oprogramowanie, jak i krzemowy układ są projektowane wspólnie, tak aby uzyskać jak największą wydajność. Projektowanie sprzętu w ten sposób znane jest z firmy Apple, gdzie hardware i software opracowywany jest do pracy w zamkniętym systemie, tak aby wydajność całego systemu była jak najlepsza.

Źródło: https://www.youtube.com/watch?v=kO4a75fKDF4

Układ MTIA produkowany jest w 7nm (nanometrowym) procesie technologicznym przez Tajwańską firmę TSMC i działa z częstotliwością 800 MHz, może wydawać się to niewiele, ale mimo tego oferuje on wydajność na poziomie 102,4 TFLOPS przy obliczeniach na liczbach stałych (INT8) oraz 51,2 TFLOPS przy operacjach zmiennoprzecinkowych (FP16). Zapotrzebowanie na moc tej konstrukcji wynosi zaledwie 25 W. 

Źródło: https://www.youtube.com/watch?v=kO4a75fKDF4

W swojej budowie MTIA bazuje na sprawdzonych rozwiązaniach, chip podobnie jak konstrukcje innych producentów oparto na siatce złożonej z sześćdziesięciu czterech rdzeni w strukturze osiem na osiem. Tworzą one macierz, w której dane mogą być przesyłane bezpośrednio między pojedynczymi elementami, dzięki temu chip charakteryzuje się bardzo dobrą wydajnością.

Wokół struktury macierzowej znalazło się szesnaście kontrolerów LPDDR5 dedykowanych do obsługi zewnętrznej pamięci, której pojemność może wynieść maksymalnie 64GB. Poza tym układ wyposażono w 128MB pamięci SRAM, do której dostęp jest znacznie szybszy. Jej zadaniem jest przechowywać dane potrzebne do aktualnie wykonywanego procesu. MTIA posiada także dedykowany kontroler, komunikujący się z pozostałymi elementami systemu.

Źródło: https://www.youtube.com/watch?v=kO4a75fKDF4

Podstawowym elementem układu MTIA jest struktura o nazwie PE (ang. Processing Element). Oparto ją o dwa rdzenie RISC-V, komunikujące się po wspólnej magistrali danych. Nie są to jednak zwyczajne, znane z innych procesorów rdzenie RISC-V, Meta dostosowała je pod konkretne zadania, takie jak mnożenie macierzy, obliczenia funkcji nieliniowych oraz przesyłanie danych. Struktury te wspierane są przez 128KB bardzo szybkiej lokalnej pamięci.

Źródło: https://www.youtube.com/watch?v=kO4a75fKDF4

W porównaniu do innych akceleratorów AI MTIA jest dość nietypowym rozwiązaniem, ponieważ przystosowano ją do dwóch faz przetwarzania danych – training i inference. Training to etap, w którym algorytm karmiony jest coraz większą ilością danych, dopóki nie zadziała zgodnie z oczekiwaniami. Rzeczywistym wykorzystaniem sieci neuronowych jest faza inference, w której chip odpowiada na żądania użytkownika. Zazwyczaj układy sztucznej inteligencji optymalizowane są tylko pod jeden etap przetwarzania informacji.

Układ AI od Meta charakteryzuje się bardzo dobrą wydajnością przy obliczeniach zmiennoprzecinkowych. Jednak, przy bardziej złożonych operacjach na sieciach neuronowych chip pozostaje w tyle względem procesorów graficznych. Producent zapewnia, że w kolejnych wersjach układu, wydajność w tym obszarze zostanie zwiększona.

Nie tylko AI

Poza chipem MTIA przedsiębiorstwo Meta zaprezentowało w ostatnim czasie niestandardowy układ dedykowany do przetwarzania wideo. Jak informuje producent, większość użytkowników platform społecznościowych czas swój wolny spędza właśnie na oglądaniu filmów. Chcąc sprostać ciągle rosnącym wymaganiom jakości, firma musi ulepszać swoje centra danych. Meta Scalable Video Processor to chip zaprojektowany do wydajniejszej kompresji i dekompresji wideo publikowanego w mediach społecznościowych.

Podsumowanie

Wyścig AI trwa, a Meta jest kolejną firmą, która do niego dołącza. Można bez wątpienia powiedzieć, że wydanie układu scalonego AI o nazwie MTIA to dopiero początek. Firma już teraz zapowiada pojawienie się w przyszłości kolejnych akceleratorów sztucznej inteligencji, których wydajność znacznie przewyższy możliwości Meta Training and Inference Accelerator.

Źródła:

https://www.zdnet.com/article/meta-unveils-first-custom-artificial-intelligence-chip/

https://ai.facebook.com/blog/meta-training-inference-accelerator-AI-MTIA/

https://encord.com/blog/meta-ai-chip-mtia-explained/

https://www.nvidia.com/en-us/data-center/a100/

Jak oceniasz ten wpis blogowy?

Kliknij gwiazdkę, aby go ocenić!

Średnia ocena: 5 / 5. Liczba głosów: 24

Jak dotąd brak głosów! Bądź pierwszą osobą, która oceni ten wpis.

Podziel się:

Picture of Rafał Bartoszak

Rafał Bartoszak

Współpracujący z Botlandem elektronik, który dzieli się swoją wiedzą w  internecie. Entuzjasta systemów cyfrowych, układów programowalnych i mikroelektroniki. Pasjonat historii, ze szczególnym naciskiem na wiek XX.

Zobacz więcej:

Patryk Mądry

Drukarka 3D Bambu Lab P1P – najważniejsze informacje

Nie da się ukryć, że firma Bambu Lab w ostatnim czasie wprowadziła dużo świeżości na rynku drukarek 3D. Ich niesamowita prędkość druku i łatwość obsługi sprawiła, że w krótkim czasie firma ta zyskała dużą ilość fanów. Dziś przyjrzymy się najtańszemu modelowi z rodziny P1 a dokładnie modelowi P1P.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

Ze względów bezpieczeństwa wymagane jest korzystanie z usługi Google reCAPTCHA, która podlega Polityce Prywatności oraz Warunkom użytkowania.