消費(fèi)電子設(shè)備將徹底擁抱AI。
6月13-14日,Arm在北京舉辦了2024技術(shù)媒體分享日,介紹了近期推出的面向消費(fèi)電子設(shè)備的全新計(jì)算子系統(tǒng)——Arm終端計(jì)算子系統(tǒng)(CSS),該平臺(tái)囊括最新的Armv9.2 CPU集群、Arm Immortails、Arm Mail GPU,以及最新的CoreLink互聯(lián)系統(tǒng)IP和系統(tǒng)內(nèi)存管理單元 (SMMU),并首次在終端領(lǐng)域提供基于三納米工藝生產(chǎn)就緒的CPU和GPU物理實(shí)現(xiàn)。
作為移動(dòng)處理器市場(chǎng)最主流的架構(gòu),Arm的每一次更新都會(huì)引領(lǐng)整個(gè)移動(dòng)市場(chǎng)的革新,此次推出終端CSS,又會(huì)帶來(lái)哪些改變?
Arm終端CSS:AI消費(fèi)電子的最新解
我們先來(lái)看看Arm終端CSS涵蓋了些什么,首先是Armv9.2 CPU集群,Arm為我們帶來(lái)了新的Cortex-X925、Cortex-A725和更新的Cortex-A520 CPU核心,其中Cortex-X925是新一代的超高性能核心,主頻可達(dá)3.6GHz以上,單線程性能較上一代提高了36%,并且?guī)?lái)了46%的AI性能提升。
所謂的Armv9.2是Arm在2021年推出的最新一代Armv9架構(gòu)的最新版本,Armv9架構(gòu)本身就是專為性能和AI而設(shè)計(jì)。在過(guò)去幾年的架構(gòu)演進(jìn)中,Arm為其增添了矢量加速、機(jī)器學(xué)習(xí) (ML) 等領(lǐng)域的計(jì)算能力,同時(shí)增強(qiáng)了系統(tǒng)的安全性和穩(wěn)健性,而采用Armv9.2 CPU集群的Arm終端CSS的表現(xiàn)更是令人期待!
眾所周知,AI已經(jīng)成為目前的核心需求之一,在關(guān)鍵的AI推理性能上,Cortex-X925的提升達(dá)到59%,在采用雙顆Cortex-X925核心設(shè)計(jì)的情況下,終端CSS的CPU集群在推理性能上最高可以得到170%的性能提升。
而作為效率核心的Cortex-A725表現(xiàn)突出,與上一代對(duì)比在性能效率上也提升了35%,能效提升25%,借助更好的預(yù)取器和更大的L2緩存,L3流量減少了20%,使其能夠?yàn)橹懈叨嗽O(shè)備提供高效能比的AI運(yùn)算支持。
得益于顯著的AI性能提升,Arm終端CSS能夠?yàn)樾乱淮M(fèi)電子設(shè)備提供足夠的AI算力支持,使得合作伙伴可以在更多的消費(fèi)電子產(chǎn)品上實(shí)現(xiàn)AI功能的部署與應(yīng)用。
相較于以往的解決方案,Arm終端 CSS 專為高端終端設(shè)備細(xì)分市場(chǎng)設(shè)計(jì),在性能、效率和可擴(kuò)展性方面帶來(lái)了突破性變化。
以最新的Armv9.2 CPU集群為例,可以提供從旗艦Cortex-X925到高效的Cortex-A725,以及更新的Cortex-A520,合作伙伴可根據(jù)自己的需求進(jìn)行選擇和配置。Arm的計(jì)算平臺(tái)賦予合作伙伴很強(qiáng)大的靈活性,比如去年11月份MediaTek發(fā)布的天璣9300就采用了全大核的 Armv9 CPU 集群,包括四個(gè)Cortex-X4(Cortex-X925前代)和四個(gè)Cortex-A720(Cortex-A725前代),而沒(méi)有使用“小核”Cortex-A520。
此次推出的GPU系列產(chǎn)品也具備很強(qiáng)的可拓展性,可為各類不同級(jí)別的設(shè)備帶來(lái)出色的游戲體驗(yàn)。其中,Immortails-G925支持從10核到24核心的性能配置,使得Immortails-G925的適配范圍可以橫跨手機(jī)和PC多個(gè)領(lǐng)域,滿足不同層級(jí)的GPU性能需求。 性能上,Immortails-G925對(duì)比上一代提升達(dá)37%,在提供相同的游戲性能時(shí),功耗較上一代降低了30%。這也意味著,在游戲體驗(yàn)不變的情況下,采用Immortails-G925的芯片在整體能耗上會(huì)明顯低于上一代,在手機(jī)等小型移動(dòng)設(shè)備上使用時(shí)可以顯著提升游戲續(xù)航時(shí)間。
Immortails-G925帶給我們的驚喜除了性能和能效上的提升之外,還引入了新的“片段預(yù)處理”機(jī)制。利用這項(xiàng)新的技術(shù),應(yīng)用無(wú)需進(jìn)行任何對(duì)象或原語(yǔ)排序。片段預(yù)處理還可以更高效地減少過(guò)度繪制,進(jìn)而提高性能和能效,同時(shí)減少應(yīng)用的 CPU 負(fù)載。在Arm內(nèi)部工作負(fù)載中,觀察到渲染線程周期縮短了高達(dá) 43%。
此外,Immortails-G925針對(duì)光線追蹤功能也做了顯著的升級(jí),對(duì)復(fù)雜對(duì)象的光線追蹤性能提高了52%,并且降低了57%的內(nèi)存流量,進(jìn)而能夠大幅降低功耗,并使其可以應(yīng)用到各種場(chǎng)景中。
而Arm Mail系列則新推出了兩款GPU,分別是Mail-G725和Mail-G625,分別針對(duì)中高端手機(jī)和入門(mén)級(jí)移動(dòng)設(shè)備,Mail-G725支持在6-9個(gè)核心之間擴(kuò)展,而Mail-G625則支持在1-5個(gè)核心之間擴(kuò)展,為移動(dòng)設(shè)備的處理器設(shè)計(jì)提供了更多的選擇。
實(shí)際上,如今越來(lái)越多設(shè)備都需要在運(yùn)行中使用到高性能的GPU核心,但是GPU核心的高能耗也困擾著部分小型、入門(mén)級(jí)設(shè)備,Arm通過(guò)提供更靈活的GPU選擇,使得入門(mén)級(jí)設(shè)備也能享受到新一代GPU核心的高能效性能。
賦能AI,共創(chuàng)Arm智能生態(tài)
Arm無(wú)疑是目前移動(dòng)市場(chǎng)中最主流、廣泛的芯片架構(gòu),想要在移動(dòng)端市場(chǎng)普及AI,Arm架構(gòu)的解決方案可以說(shuō)是最好的選擇。在此次分享會(huì)中Arm的多位演講者也屢屢提到AI,除了在硬件層面為AI提供算力支持外,Arm更是在一直著力于打造更開(kāi)放、全面、易用的開(kāi)發(fā)環(huán)境。
為了支持開(kāi)發(fā)者充分利用最新硬件的性能,Arm推出了全新的Kleidi軟件,包含KleidiAI和KleidiCV庫(kù),專為優(yōu)化端側(cè)AI和計(jì)算機(jī)視覺(jué)工作負(fù)載設(shè)計(jì),通過(guò)這些工具,開(kāi)發(fā)者可以更輕松地進(jìn)行高效能軟件開(kāi)發(fā),加速產(chǎn)品的上市進(jìn)程。
其中KleidiAI是一套面向AI框架開(kāi)發(fā)者的計(jì)算內(nèi)核,使他們能夠在各種設(shè)備上輕松獲得 Arm CPU 上的最佳性能,并支持Neon、SVE2和SME2 等關(guān)鍵Arm架構(gòu)功能。KleidiAI與PyTorch、Tensorflow、MediaPipe等熱門(mén) AI 框架集成,旨在加速 Meta Llama 3、Phi-3等關(guān)鍵模型的性能,并且還可前后兼容,以確保 Arm 在引入更多技術(shù)時(shí)依然能適用未來(lái)市場(chǎng)的需求。
而對(duì)于需要用到計(jì)算機(jī)視覺(jué)解決方案的開(kāi)發(fā)者來(lái)說(shuō),KleidiCV的引入能帶來(lái)巨大的性能提升。計(jì)算機(jī)視覺(jué)現(xiàn)在與 AI 緊密相連,但這些攝像頭管線可不僅僅運(yùn)行神經(jīng)網(wǎng)絡(luò),還有很多傳統(tǒng)的計(jì)算機(jī)視覺(jué)算法,其性能對(duì)于攝像頭或社交媒體應(yīng)用的順暢運(yùn)行至關(guān)重要。
這正是Arm構(gòu)建KleidiCV的原因。今年,Arm還與OpenCV.ai 合作,力求讓安卓開(kāi)發(fā)者可以更輕松地將OpenCV納入到他們的項(xiàng)目中,并從KleidiCV帶來(lái)的改進(jìn)中受益。
KleidiAI和KleidiCV的結(jié)合,使得Arm生態(tài)的開(kāi)發(fā)者在智能終端上輕松部署AI應(yīng)用與功能,為AI生態(tài)的搭建提供有力支持。
今年,Arm在性能分析工具領(lǐng)域也有一些新的變化。首先大家熟悉的Arm Mobile Studio正式更名為Arm Performance Studio,其針對(duì)移動(dòng)平臺(tái)的功能沒(méi)有任何變化,但現(xiàn)在通過(guò)增加對(duì)Arm Linux 的支持,基礎(chǔ)設(shè)施市場(chǎng)中的開(kāi)發(fā)者可以使用 Streamline CPU分析能力。
與此同時(shí),適用于安卓系統(tǒng)的 CSS 參考軟件棧搭配固定虛擬平臺(tái) (Fixed Virtual Platform, FVP),可助力合作伙伴加速流片前的軟件開(kāi)發(fā)。
此外,Arm與多個(gè)行業(yè)領(lǐng)導(dǎo)者合作,推出了一系列開(kāi)發(fā)者支持計(jì)劃和社區(qū)資源。這些計(jì)劃包括在線培訓(xùn)課程、開(kāi)發(fā)者論壇和技術(shù)支持服務(wù),旨在幫助開(kāi)發(fā)者更好地理解和使用Arm的技術(shù)。授人以魚(yú)不如授人以漁,Arm顯然也深刻地明白這個(gè)道理,而且一個(gè)健康可持續(xù)的軟件生態(tài)也需要更多的建設(shè)者。
在Arm提供的這些資源幫助下,開(kāi)發(fā)者不僅可以提高自己的技能,還可以與全球的開(kāi)發(fā)者交流經(jīng)驗(yàn)和分享創(chuàng)意。同時(shí),Arm還通過(guò)與硬件制造商和軟件開(kāi)發(fā)公司合作,不斷優(yōu)化其工具和平臺(tái)。
比如,Arm與知名的IDEs(集成開(kāi)發(fā)環(huán)境)如Visual Studio Code和Eclipse進(jìn)行了深度集成,使得開(kāi)發(fā)者能夠在熟悉的環(huán)境中進(jìn)行高效地開(kāi)發(fā)工作。通過(guò)這種深度合作,Arm確保其開(kāi)發(fā)工具能夠無(wú)縫融入開(kāi)發(fā)者的日常工作流程,提高生產(chǎn)力和開(kāi)發(fā)質(zhì)量。
從電腦到手機(jī),從智能冰箱到智能手表,Arm的解決方案無(wú)處不在,豐富的生態(tài)產(chǎn)品使得Arm可以為開(kāi)發(fā)者提供充足的開(kāi)發(fā)空間,并且支持開(kāi)發(fā)者探索不同的領(lǐng)域。
ALL FOR AI
毫無(wú)疑問(wèn),AI的需求使得智能終端生態(tài)在過(guò)去的一年里迎來(lái)了新的爆發(fā)式增長(zhǎng),人們正在不停地嘗試、開(kāi)拓新的應(yīng)用范例、探索新的硬件形態(tài),尋找著能夠?yàn)橄M(fèi)者帶來(lái)更好體驗(yàn)的產(chǎn)品,不管是軟件還是硬件的。
而Arm終端CSS及Kleidi軟件,將會(huì)是開(kāi)發(fā)者探索新世界的最佳方式之一,得益于全新的半導(dǎo)體工藝與芯片架構(gòu),我們?nèi)缃褚呀?jīng)能夠在小巧的手機(jī)上,獲得不亞于PC的算力與性能支持。Arm終端CSS所帶來(lái)的Armv9.2的能效優(yōu)勢(shì),憑借物理實(shí)現(xiàn)和持續(xù)的軟件優(yōu)化,它將徹底革新開(kāi)發(fā)者和消費(fèi)者的體驗(yàn)。
隨著未來(lái)的AI生態(tài)繼續(xù)發(fā)展,我們無(wú)疑將會(huì)看到更多基于Arm解決方案打造的新一代智能終端產(chǎn)品,而AI生態(tài)的需求也將繼續(xù)驅(qū)動(dòng)Arm開(kāi)發(fā)更高性能、更具效率的新產(chǎn)品。
未來(lái),Arm將繼續(xù)以其先進(jìn)的技術(shù)、豐富的軟硬件和強(qiáng)大的生態(tài)系統(tǒng)支持,不斷賦能開(kāi)發(fā)者,推動(dòng)計(jì)算技術(shù)向前發(fā)展。無(wú)論是在高性能計(jì)算、人工智能還是計(jì)算機(jī)視覺(jué)領(lǐng)域,Arm都展示了其作為行業(yè)領(lǐng)導(dǎo)者的實(shí)力,通過(guò)持續(xù)創(chuàng)新和深耕開(kāi)發(fā)者生態(tài)系統(tǒng),Arm正引領(lǐng)著未來(lái)計(jì)算的方向,為行業(yè)注入新的活力。