11月22日大模型日報

資訊1年前 (2023)发布 AIWindVane
618 0
11月22日大模型日報

【11月22日大模型日報】資訊 Anthropic帶來Claude 2.1


Anthropic帶來Claude 2.1

https://news.miracleplus.com/share_link/11905

Anthropic:「我們的最新模型,Claude 2.1,現在可以在我們的控制台透過API使用,並為我們的Claude提供動力。AI聊天體驗。Claude 2.1為企業提供了關鍵功能的改進,包括業界領先的200K 令牌上下文視窗、模型幻覺率的顯著降低、系統提示和我們的新測試版功能:工具使用。我們也在更新我們的定價,以提高客戶在各個型號上的成本效率。”


Stable Video Diffusion來了,程式碼權重已上線

https://news.miracleplus.com/share_link/11906

AI 畫圖的著名公司 Stability AI,終於入局 AI 生成影片了。 本週二,基於 Stable Diffusion 的視頻生成模型 Stable Video Diffusion 來了,AI 社區馬上開始了熱議。 現在,你可以基於原有的靜止影像來產生一段幾秒鐘的影片。

基於 Stability AI 原有的 Stable Diffusion 文生圖模型,Stable Video Diffusion 成為了開源或已商業行列中為數不多的視訊生成模型之一。


訂閱(月費 16 美元)用戶新權益,X(推特)已邀請其嚐鮮 Grok AI 體驗

https://news.miracleplus.com/share_link/11907

消息來源 @nima_owji 透露,X(推特)目前已經邀請部分用戶,在其 X 應用程式中體驗全新的 Grok AI 聊天體驗。 受邀用戶可以從 X 應用程式的左側入口點擊進入,從曝光的截圖來看,Grok AI 聊天介面非常簡潔。 如果受邀用戶並未購買 Premium + 訂閱,會跳出「Get Grok with Premium+」的提示,推薦用戶購買 Premium + 訂閱,價格為每月 16 美元。


微軟將在12月1日為中國企業和教育用戶推出Windows Copilot

https://news.miracleplus.com/share_link/11908

根據微軟發布的消息,微軟將在 2023 年 12 月 1 日針對中國大陸的企業和教育機構推出 Web AI 聊天功能 Copilot,也就是先前的 Bing Chat Enterprise。 企業和教育機構可以使用 Windows Copilot、Bing Chat Enterprise 以及在 Microsoft Edge 中使用 Copilot,AI 模型是支援聯網取得資料的。


拼多多殺入大模型產業

https://news.miracleplus.com/share_link/11909

拼多多已經成立了一個數十人的大模型團隊,團隊位於上海。 大模型團隊將探討大模型在拼多多客服、對話等場景下的應用,並會拓展至其旗下跨境電商平台TEMU智慧客服、搜尋、推薦等業務場景。 目前,整個進程仍處於研發階段。 產業分析家認為,拼多多的大模型將為其電商體系進行服務,包括在AI導購、商品圖片智慧生成等方面的應用。


英偉達與羅氏製藥合作開設AI平台

https://news.miracleplus.com/share_link/11910

英偉達宣布與羅氏製藥旗下的Genentech合作,將進行一項AI平台研究,以加速藥物發現和開發。 兩者將在NVIDIA DGX Cloud上建構AI模型。


PyTorch團隊重寫「分割一切」模型,比原始實現快8倍

https://news.miracleplus.com/share_link/11911

從年初到現在,生成式 AI 發展迅速。 但很多時候,我們又必須面對一個難題:如何加速生成式 AI 的訓練、推理等,尤其是在使用 PyTorch 的情況下。 本文 PyTorch 團隊的研究者為我們提供了一個解決方案。 文章重點介紹如何使用純原生 PyTorch 加速生成式 AI 模型,此外,文章還介紹了 PyTorch 新功能,以及如何組合這些功能的實際範例。 結果如何呢? PyTorch 團隊表示,他們重寫了 Meta 的「分割一切」 (SAM) 模型,從而使程式碼比原始實現快 8 倍,並且沒有損失準確率,所有這些都是使用原生 PyTorch 進行優化的。


以深度催眠誘導LLM「越獄」,香港浸信會大學初探可信大語言模型

https://news.miracleplus.com/share_link/11912

儘管大語言模型 LLM (Large Language Model) 在各種應用中取得了巨大成功,但它也容易受到一些 Prompt 的誘導,從而越過模型內置的安全防護提供一些危險 / 違法內容,即 Jailbreak。 深入理解這類 Jailbreak 的原理,加強相關研究,可反向促進人們對大模型安全性防護的重視,完善大模型的防衛機制。 有別於以往採用搜尋優化或計算成本較高的推斷方法來產生可Jailbreak 的Prompt,本文受米爾格倫實驗(Milgram experiment)啟發,從心理學視角提出了一種輕量級Jailbreak 方法:DeepInception,透過 深度催眠LLM 使其成為越獄者,並令其自行規避內建的安全防護。


涵蓋500多項研究、50多個模型,程式碼大模型綜述來了

https://news.miracleplus.com/share_link/11913

隨著 BERT 和 GPT 等預訓練 Transformer 的出現,語言建模近年來取得了顯著進展。 隨著大型語言模式(LLM)的規模擴展至數以千萬計的參數數量,LLM 開始展現出通用人工智慧的跡象,它們的應用也已經不限於文字處理。 Codex 首次展現了 LLM 在程式碼處理方面的出色能力,之後更是出現了像 GitHub Copilot 這樣的商業產品以及 StarCoder 和 Code LLaMA 等開源程式碼模型。 但是,預訓練 Transformer 在程式碼處理方面的應用可以追溯到僅解碼器(decoder-only)自回歸模型成為主流技術之前的時期,而這一領域還尚沒有一篇完整的綜述。 上海交通大學和螞蟻集團的研究團隊填補了這一空白。 他們對用於程式碼的語言模型進行了全景式的總結,涵蓋了 50 多個模型、30 多個下游任務和 500 多個相關研究成果。 他們對程式碼語言模型進行了分類,從在一般領域上訓練的巨型模型到專門針對程式碼理解或產生任務訓練的微型模型。

© 版权声明

相關文章

暫無評論

暫無評論...