12月11日大模型日報合輯

資訊1年前 (2023)发布 AIWindVane

553 0 0

【12月11日大模型日報合輯】誇張！ EMNLP投稿近5000篇，獎項出爐：北大、騰訊摘最佳長論文；英偉達CEO黃仁勳訪問越南計劃在該國建晶片生產中心；零一萬物Yi-34B-Chat微調模型上線，登陸多個權威榜單

誇張！ EMNLP投稿近5000篇，獎項出爐：北大、騰訊摘最佳長論文

連結：https://news.miracleplus.com/share_link/12884

EMNLP 是自然語言處理領域的頂級會議之一，EMNLP 2023 於 12 月 6 日 – 10 日在新加坡舉行。因為今年 ChatGPT 的爆火帶動大模型、NLP 概念，EMNLP 2023 的投稿論文數量也達到近 5,000 篇，甚至略高於 ACL 2023。在接收率方面，長論文接收率為 23.3%，短論文接收率為 14%，整體接收率為 21.3%。此數據相較 EMNLP 2022 的 20% 略有提升。 EMNLP 2023 頒發了最佳長論文、最佳短論文、最佳主題論文、最佳 Demo 論文和最佳行業論文各一篇，以及多篇不同賽道的傑出論文。

丟掉注意力的擴散模型：Mamba帶火的SSM被蘋果、康乃爾盯上了

連結：https://news.miracleplus.com/share_link/12885

由於上週「Mamba」的發布，狀態空間模型 SSM 正受到越來越多的關注。 Mamba 的核心在於引入了一種新的架構 ——「選擇性狀態空間模型（ selective state space model）」，這使得 Mamba 在語言建模方面可以媲美甚至擊敗 Transformer。當時，論文作者 Albert Gu 表示，Mamba 的成功讓他對 SSM 的未來充滿了信心。如今，康乃爾大學和蘋果的這篇論文似乎又為 SSM 的應用前景增加了新的例證。

像調雞尾酒一樣調製多技能大模型，智源等機構發布LM-Cocktail模型治理策略

連結：https://news.miracleplus.com/share_link/12886

近日，智源研究院資訊檢索與知識計算組發布LM-Cocktail 模型治理策略，旨在為大模型開發者提供一個低成本持續提升模型性能的方式：透過少量樣例計算融合權重，借助模型融合技術融合微調模型與原模型的優勢，實現「模型資源」的高效利用。

OpenAI COO Brad Lightcap 表示 AI 商業化被高估，我們仍然處於非常早期階段，最重要的部分還未被創造

連結：https://news.miracleplus.com/share_link/12887

Brad Lightcap 在 OpenAI 「政變」事件發生後在 CNBC 的參訪。根據 Lightcap 的回憶，OpenAI 擁有有限的 GPU 和處理能力，並且主要將自己視為為開發者和企業建立工具的公司。他回憶說，公司 CEO Sam Altman 是「嘗試發布」的主要支持者，他表示，與模型的基於文字的互動有著重要和個人的意義。

英偉達CEO黃仁勳訪問越南計畫在該國建造晶片生產中心

連結：https://news.miracleplus.com/share_link/12888

越南政府總理範明政當地時間10日與到訪的英偉達CEO黃仁勳會面。黃仁勳稱，英偉達已在越南投資約2.5億美元，將該國視為重要市場。

理想汽車：OTA 5.0 理想同學引入 Mind GPT，支持指令自由說

連結：https://news.miracleplus.com/share_link/12889

在現今理想汽車智慧軟體發表會上，理想汽車介紹了 OTA 5.0 的各項升級，可分為三個面向：智慧駕駛、智慧空間、智慧增程。在智慧空間方面，理想汽車表示，理想同學最大的變化，就是引進了 Mind GPT 的能力。

零一萬物Yi-34B-Chat微調模型上線，登陸多個權威榜單

連結：https://news.miracleplus.com/share_link/12891

最近，業界眾多大模型基準又迎來了一輪「實力值」更新。繼11 月初零一萬物發布Yi-34B 基座模型後，Yi-34B-Chat 微調模型在11 月24 日開源上線，短時間登陸了全球多個英文、中文大模型權威榜單，再度獲得了全球開發者的關注。其中，在史丹佛大學提出的大語言模型評測基準AlpacaEval 上，Yi-34B-Chat 以94.08% 的勝率，超越LLaMA2 Chat 70B、Claude 2、ChatGPT，在Alpaca 經認證的模型類別中，成為業界僅次於 GPT-4 英語能力的大語言模型，並且是經由Alpaca 官方認證為數不多的開源模型。