Google 推出為移動裝置打造的 AI 模型 Gemma 3n,作為去年發布 Gemma 系列以來的全新版本,並為邊緣設備帶來了強大的多模式功能。
多模式設計: Gemma 3n 原生支援圖像、音訊、視訊和文字輸入和文字輸出。
專為設備端優化: Gemma 3n 型號以效率為設計重點,提供兩種基於有效參數的尺寸:E2B 和 E4B。雖然它們的原始參數數量分別為 5B 和 8B,但架構創新使其運行內存佔用與傳統的 2B 和 4B 型號相當,僅需 2GB (E2B) 和 3GB (E4B) 內存即可運行。
突破性的架構: Gemma 3n 的核心是新穎的組件,例如用於提高運算靈活性的 MatFormer 架構、用於提高記憶體效率的每層嵌入 (PLE)、用於提高架構效率的 LAuReL 和 AltUp,以及針對設備用例優化的新型音訊和基於 MobileNet-v5 的視覺編碼器。
品質提升: Gemma 3n 在多語言(支援 140 種文字語言和 35 種語言的多模態理解)、數學、編碼和推理方面均實現了品質提升。 E4B 版本的 LMArena 得分超過 1300,使其成為首個達到此基準的 100 億參數以下模型。
Gemma 3n 專為助力 Gemma 發展的開發者社群而設計。它支援您常用的工具,包括 Hugging Face Transformers、llama.cpp、Google AI Edge、Ollama、MLX 等,讓您能夠輕鬆地針對特定的裝置端應用進行微調和部署。
https://developers.googleblog.com/en/introducing-gemma-3n-developer-guide/

留言
張貼留言