聯發科技今(9)日舉行生成式AI論壇,正式推出生成式AI服務平台「MediaTek DaVinci」,也稱「聯發科技達哥」,並由聯發創新基地發表平台上最新的強大繁體中文大型語言模型MediaTek Research BreeXe(以下簡稱MR BreeXe)。此外,現場也邀請到已加入MediaTek DaVinci平台測試開發各類生成式AI服務應用的企業夥伴以及高科技、金融等產業的企業先進,齊聚一堂交流與分享。
MediaTek Davinci支援各類大語言模型,包含聯發創新基地最新釋出的繁體中文大語言模型「MR BreeXe」。MR BreeXe以Mixtral 8x7B模型為基礎開發,繼承Mixtral多專家模型特有的節省運算資源、提升速度優勢,再加上聯發創新基地的預訓練(pre-training)之後,不但在繁體中文測試項目(TMMLU+、MT Bench TW)超越GPT-3.5,並對台灣常見之地端應用特別進行優化,提升產業界使用生成式AI 與檢索增強生成(RAG)的體驗。
MR BreeXe於輝達(NVIDIA)的Taipei -1 GPU超級電腦DGX GH200上進行訓練,透過MediaTek Davinci,支援全地端與部分地端的布設場景,並可依需求進行多樣本學習(few-shot learning)甚至微調(fine-tuning)的客製化。
聯發科技推出生成式AI服務平台MediaTek DaVinci及最新繁中大模型MediaTek Research BreeXe。聯發科提供。 聯發科技人工智慧暨數據工程處協理葉家順表示:「MediaTek DaVinci解決許多企業在採用生成式AI的痛點,讓各行各業在確保資訊安全的環境下,可善用已有強大基礎的平台開發專屬的生成式AI應用。隨著更多企業與開發者加入MediaTek Davinci生態系,我們相信MediaTek DaVinci的能力將會持續爆發性成長,成為企業的得力助手。」
未完待续,请点击「下一页」继续阅读
{nextpage}聯發創新基地負責人許大山博士表示:「MediaTek Research BreeXe繁體中文大型語言模型是聯發創新基地在大模型發展上最新的里程碑,提供優異語文理解能力和雲、地兩端的彈性,為現今繁體中文能力最強的語言模型, 加上與MediaTek Davinci的搭配,相信能更貼近在地需求,激發更多在地的生成式AI應用。」