Meta發布兩款最新開源大模型

當前報章為第13949號

2025年04月07日

星期一

本版新聞

MORE+

中方第三批緊急人道主義救災物資運抵緬甸

清明假期全國安全形勢平穩

4月中國零售業景氣指數維持在擴張區間

伊朗不反對與美間接談判

Meta發布兩款最新開源大模型

惡劣天氣襲擊美國16人死

清明小長假興短途遊「灣區快線」成最熱門區間

業界憂台半導體「泛美化」

格羅方德被曝與聯電合併

香港會展帶旺旅遊去年過夜客達142萬

香港調查揭護老或致抑鬱

關稅衝擊台股當局要民眾準備「面對震撼」

限量版小攤經濟：香港城市化下的煙火氣

台軍啟動「史上最長」「漢光」電腦兵推

Meta發布兩款最新開源大模型

2025-04-07

【香港中通社4月6日電】4月5日，臉書母公司meta推出最新兩款大型語言模型Llama 4 Scout和Llama 4 Maverick。meta稱，它們是公司“迄今最先進的模型”，且是“同類中最佳的多模態模型”。

meta表示，Llama 4是其首個採用混合專家（MoE）架構的模型系列，這種架構在訓練和回答查詢時計算效率更高。混合專家架構基本上是將數據處理任務分解為子任務，然後將它們委派給更小的、專門的“專家”模型。

例如，Maverick總共有4000億個參數，但在128個“專家”模型中只有170億個活躍參數（參數數量大致與模型的問題解決能力相對應）。Scout有170億個活躍參數、16個“專家”模型以及總計1090億個參數。

在中國大語言模型DeepSeek引領開源浪潮以前，meta一直是開源模型的行業領先者。Llama系列模型由meta在2022年推出。Llama是一種多模態人工智能（AI）系統，能够處理和整合多種類型的數據，包括文本、視頻、圖像和音頻，且可以轉換成不同格式。

美國OpenAI的大語言模型ChatGPT橫空出世7個多月後，2023年，meta就率先宣布開源Llama 2，並且可免費商用。這也成為大模型發展的分水嶺。

本月5日meta最新發布的是Llama第四代模型的兩個版本，它們也將開源。meta還稱，另一款模型Llama 4 Behemoth還在“訓練”中，並稱之為“世界上最聰明的大型語言模型之一”。