12月11日大模型日報合輯

【12月11日大模型日報合輯】誇張! EMNLP投稿近5000篇,獎項出爐:北大、騰訊摘最佳長論文;英偉達CEO黃仁勳訪問越南計劃在該國建晶片生產中心;零一萬物Yi-34B-Chat微調模型上線,登陸多個權威榜 單
誇張! EMNLP投稿近5000篇,獎項出爐:北大、騰訊摘最佳長論文
連結:https://news.miracleplus.com/share_link/12884
EMNLP 是自然語言處理領域的頂級會議之一,EMNLP 2023 於 12 月 6 日 – 10 日在新加坡舉行。 因為今年 ChatGPT 的爆火帶動大模型、NLP 概念,EMNLP 2023 的投稿論文數量也達到近 5,000 篇,甚至略高於 ACL 2023。 在接收率方面,長論文接收率為 23.3%,短論文接收率為 14%,整體接收率為 21.3%。 此數據相較 EMNLP 2022 的 20% 略有提升。 EMNLP 2023 頒發了最佳長論文、最佳短論文、最佳主題論文、最佳 Demo 論文和最佳行業論文各一篇,以及多篇不同賽道的傑出論文。

丟掉注意力的擴散模型:Mamba帶火的SSM被蘋果、康乃爾盯上了
連結:https://news.miracleplus.com/share_link/12885
由於上週「Mamba」的發布,狀態空間模型 SSM 正受到越來越多的關注。 Mamba 的核心在於引入了一種新的架構 ——「選擇性狀態空間模型( selective state space model)」,這使得 Mamba 在語言建模方面可以媲美甚至擊敗 Transformer。 當時,論文作者 Albert Gu 表示,Mamba 的成功讓他對 SSM 的未來充滿了信心。 如今,康乃爾大學和蘋果的這篇論文似乎又為 SSM 的應用前景增加了新的例證。
像調雞尾酒一樣調製多技能大模型,智源等機構發布LM-Cocktail模型治理策略
連結:https://news.miracleplus.com/share_link/12886
近日,智源研究院資訊檢索與知識計算組發布LM-Cocktail 模型治理策略,旨在為大模型開發者提供一個低成本持續提升模型性能的方式:透過少量樣例計算融合權重,借助模型融合技術 融合微調模型與原模型的優勢,實現「模型資源」的高效利用。

OpenAI COO Brad Lightcap 表示 AI 商業化被高估,我們仍然處於非常早期階段,最重要的部分還未被創造
連結:https://news.miracleplus.com/share_link/12887
Brad Lightcap 在 OpenAI 「政變」事件發生後在 CNBC 的參訪。 根據 Lightcap 的回憶,OpenAI 擁有有限的 GPU 和處理能力,並且主要將自己視為為開發者和企業建立工具的公司。 他回憶說,公司 CEO Sam Altman 是「嘗試發布」的主要支持者,他表示,與模型的基於文字的互動有著重要和個人的意義。
英偉達CEO黃仁勳訪問越南 計畫在該國建造晶片生產中心
連結:https://news.miracleplus.com/share_link/12888
越南政府總理範明政當地時間10日與到訪的英偉達CEO黃仁勳會面。 黃仁勳稱,英偉達已在越南投資約2.5億美元,將該國視為重要市場。

理想汽車:OTA 5.0 理想同學引入 Mind GPT,支持指令自由說
連結:https://news.miracleplus.com/share_link/12889
在現今理想汽車智慧軟體發表會上,理想汽車介紹了 OTA 5.0 的各項升級,可分為三個面向:智慧駕駛、智慧空間、智慧增程。 在智慧空間方面,理想汽車表示,理想同學最大的變化,就是引進了 Mind GPT 的能力。

零一萬物Yi-34B-Chat微調模型上線,登陸多個權威榜單
連結:https://news.miracleplus.com/share_link/12891
最近,業界眾多大模型基準又迎來了一輪 「實力值」 更新。 繼11 月初零一萬物發布Yi-34B 基座模型後,Yi-34B-Chat 微調模型在11 月24 日開源上線,短時間登陸了全球多個英文、中文大模型權威榜單,再度獲得了 全球開發者的關注。 其中,在史丹佛大學提出的大語言模型評測基準AlpacaEval 上,Yi-34B-Chat 以94.08% 的勝率,超越LLaMA2 Chat 70B、Claude 2、ChatGPT,在Alpaca 經認證的模型類別中,成為業界僅次於 GPT-4 英語能力的大語言模型,並且是經由Alpaca 官方認證為數不多的開源模型。

智譜AI發布文本品質評價模型CritiqueLLM
連結:https://news.miracleplus.com/share_link/12890
智譜AI近期提出了一個可解釋、可擴展的文本質量評價模型CritiqueLLM,該模型可以針對各類指令遵循任務上大模型的生成結果提供高質量的評價分數和評價解釋,以解決如何能夠在研發 過程中,快速、有效、公平且低成本地對模型效能進行評測的問題。

日本樂天集團擬未來兩個月內推出自己的大型語言模型
連結:https://news.miracleplus.com/share_link/12892
日本樂天集團CEO三木谷浩史 (Hiroshi Mikitani)在周一的訪談中表示,該公司計劃在未來兩個月內推出自己的人工智慧語言模式。 目前,這家金融科技和電子商務巨頭正尋求加入其他科技公司的行列,開發這項快速成長的技術。
