人工智能(AI)技術,特別是生成式大語言模型,正快速滲透到人們日常生活中。然而,一項最新研究提醒我們,生成式AI的電子廢棄物問題不容忽視。據《自然·計算科學》發表的研究論文,2020年至2030年間,生成式AI帶來的電子廢棄物可能激增近1000倍,產生最高達500萬噸的電子垃圾,這與約250億部iPhone 16 Pro的重量相當。這些廢棄物含有的有害材料,可能對環境造成嚴重影響。
隱憂浮出水面
在關注生成式AI帶來的能耗和碳排放的同時,人們往往忽視了算力設施及硬件報廢產生的電子廢棄物問題。最近,中外科學家合作開展的一項最新研究讓這一隱憂浮出水面。
生成式AI的底層是一個材料密集型行業,它依賴于數據中心等數字基建設施。而且,隨著算力需求及技術發展,相關數據中心的電子芯片及硬件架構越發復雜,重量也不斷增加,并在快速更新迭代。業內專家稱,兩年前,GPU(圖形處理器)重0.0318噸,有35000個零件;現在GPU有60萬個零件,重1.36噸。而且數據中心和服務器群中包含的多種高性能計算硬件比如GPU、內存模塊、存儲設備等,普遍壽命在3年左右,當其壽命結束后,必然會產生大量電子廢棄物。
AI技術正快速滲透到人們日常生活中
就生成式AI而言,一方面,其迅猛發展帶來了大規模計算需求,對計算硬件和基礎設施的需求持續增長;另一方面,芯片制程工藝的進步帶來芯片性能的快速提升,單個芯片性能越高,同樣算力需求下所需的芯片數量越少。未來生成式AI的應用會如何發展?又會產生多少算力需求?具體到硬件層,需要多少芯片和服務器?為關聯、量化生成式AI硬件需求,以及產生的電子廢棄物數量,須對這些問題做出回應。
為獲得更貼近實際的數據,中外科學家聯合研究團隊既考慮了未來算力需求的多樣性,又兼顧了對芯片性能的考量。在預測未來大語言模型的算力需求時,他們廣泛參考了產業界的各類預測及行業研究報告,精心預設了三種截然不同的發展情景:一種是廣泛應用的“激進發展情景”,一種是有限應用的“中等發展情景”,還有一種則是少數特定應用的“保守發展情景”。通過全面評估大語言模型的參數規模、訓練數據量、全球大語言模型數量,以及每日活躍用戶數等關鍵因素,他們推導出不同發展情景下算力需求的復合年增長率,分別為136%、115%和85%。
對芯片性能的考量中,聯合研究團隊基于摩爾定律,結合2020年至2022年服務器增長數量的實際數據,推算出了2023年至2030年服務器算力水平的變化趨勢。同時,他們還充分考慮了地緣上的復雜因素,對中國、美國及歐洲等國家和地區的芯片性能及發展水平進行了細致調整。此外,鑒于目前僅有少數企業具備生產先進GPU芯片的能力,他們還基于這些企業過往兩年的產能及出貨量情況,合理設置了未來GPU產能擴展率的限制條件,從而構建了一個更為貼近現實的產能約束發展情景。
基于較全面的分析和考量,聯合研究團隊創新性地開發了“算力物質流”模型。這一模型對人工智能的“需求—算法—算力—芯片”進行了清晰的分層解構及參數化建模,有效串聯了人工智能終端服務需求與底層物理世界的緊密關聯。
模型計算推演結果顯示,如果不采取任何循環經濟措施,在2023年到2030年期間,在激進、中等和保守三種發展情景下,產生的電子廢棄物總量分別達到了500萬噸、300萬噸和180萬噸。