1月15-16日大模型日報合集

514 0 0

【1月15-16日大模型日報合集】微軟TaskWeaver開源框架：攜手資料分析與行業定制，打造頂級Agent解決方案；微軟Copilot大會員來了：每月20刀，人人都能用；智譜發佈GLM-4全家桶：性能提升60%，多模態、128K長文字，全能All Tools及GPTs商店；開源模型新紀錄：超越Mixtral 8x7B Instruct的模型來了

微軟TaskWeaver開源框架：攜手資料分析與行業定制，打造頂級Agent解決方案

鏈接 https://news.miracleplus.com/share_link/15912

資料分析一直是現代社會中的重要工具，它幫助我們洞察本質、發現規律並指導決策。然而，資料分析過程往往複雜且費時，囙此我們期望存在一個智能助手助力用戶直接“與數據對話“。得益於大語言模型（LLM）的發展，虛擬助手和Copilot等智慧Agent紛紛湧現，它們在自然語言理解和生成方面的表現令人歎為觀止。但遺憾的是，在處理複雜資料結構（如DataFrame，ndarray等）和引入領域知識方面，現有的Agent框架仍然舉步維艱，而這恰恰是資料分析和專業領域中的覈心需求。為了突破這一瓶頸，微軟推出了TaskWeaver——一款程式碼優先的Agent框架。TaskWeaver能够將用戶的自然語言請求巧妙地轉化為可執行程式碼，並支持豐富的資料結構、動態挿件選擇以及專業領域適應的規劃過程。

在24項場景中優於人類醫生，Google團隊開發基於自博弈的診斷對話大模型

鏈接 https://news.miracleplus.com/share_link/15915

醫學的覈心在於醫患對話，熟練的病史採集為準確的診斷、有效的管理和持久的信任鋪平了道路。能够進行診斷對話的人工智慧（AI）系統可以提高護理的可及性、一致性和質量。然而，學習臨床醫生的專業知識是一個巨大的挑戰。 Google Research和Google DeepMind的AI團隊開發了AMIE（Articulate Medical Intelligence Explorer），這是一種基於大型語言模型（LLM）的人工智慧系統，針對診斷對話進行了優化。 AMIE使用一種新穎的基於自博弈（self-play）的類比環境，具有自動迴響機制，可在不同的疾病狀況、專業和背景下擴展學習。「據我們所知，這是第一次針對診斷對話和獲取臨床病史進行最佳設計的對話式人工智慧系統。」Google Health的臨床研究科學家、論文的合著者Alan Karthikesalingam說道。

上海人工智慧實驗室團隊開發具有多核光纖單元旋轉功能的AI驅動投影斷層掃描

鏈接 https://news.miracleplus.com/share_link/15916

光學斷層掃描已成為一種非侵入性成像方法，可提供對亞細胞結構的三維洞察，從而能够更深入地瞭解細胞功能、相互作用和過程。傳統的光學斷層掃描方法受到有限的照明掃描範圍的限制，導致分辯率各向異性和細胞結構的不完整成像。為了克服這個問題，上海人工智慧實驗室、德國德勒斯登工業大學（Technische Universität Dresden）以及馬克斯·普朗克學會（Max Planck Society）的研究人員採用了緊湊的多核光纖細胞旋轉器系統，該系統有助於對微流控晶片內的細胞進行精確的光學操縱，從而實現具有各向同性分辯率的全角度投影斷層掃描。此外，研究人員展示了人工智慧驅動的斷層掃描重建工作流程，它可以是從通常需要手動處理的傳統計算方法到完全自主過程的範式轉變。所提出的細胞旋轉斷層掃描方法的效能通過細胞模型和HL60人類癌細胞的三維重建得到驗證。

微軟Copilot大會員來了：每月20刀，人人都能用

鏈接 https://news.miracleplus.com/share_link/15917

去年9月，微軟宣佈了大模型Copilot能力加入Office和Windows 11的新計畫。今天，該能力終於覆蓋到了全體用戶。 1月15日，微軟正式發佈Copilot Pro，其每月訂閱費用為20美元，可解鎖訪問Word、Excel和PowerPoint等Office常用辦公軟體中的大模型能力，同時優先訪問最新的OpenAI模型。在其之上，你也可以基於需求構建起屬於自己的Copilot GPT。

智譜發佈GLM-4全家桶：性能提升60%，多模態、128K長文字，全能All Tools及GPTs商店

鏈接 https://news.miracleplus.com/share_link/15918

國產大模型玩家智譜AI，交出最新成績單——發佈全自研第四代基座大模型GLM-4，且所有更新反覆運算的能力全量上線。作為國內唯一一個產品線全對標OpenAI的大模型公司，智譜年前攢了波大的：按官方說法，GLM-4效能相比GLM-3提升60%，逼近GPT-4。而同時推出的GLM-4-All Tools，能够完成用戶意圖理解-複雜指令規劃-自由調用GLM生態的多種模型能力。值得一提的是，智譜發佈了GLMs，為所有開發者提供AI智慧體定制能力，簡單prompt指令就能創建個性化GLM智慧體。

MiniMax國內首個MoE大語言模型全量上線啦

鏈接 https://news.miracleplus.com/share_link/15919

今天，經過了半個月的部分客戶的內測和迴響，MiniMax全量發佈大語言模型abab6，為國內首個MoE大語言模型。在MoE結構下，abab6擁有大參數帶來的處理複雜任務的能力，同時模型在組織時間內能够訓練足够多的數據，計算效率也可以得到大幅提升。改進了abab5.5在處理更複雜、對模型輸出有更精細要求場景中出現的問題。

開源模型新紀錄：超越Mixtral 8x7B Instruct的模型來了

鏈接 https://news.miracleplus.com/share_link/15920

從Llama、Llama 2到Mixtral 8x7B，開源模型的效能記錄一直在被重繪。由於Mistral 8x7B在大多數基準測試中都優於Llama 2 70B和GPT-3.5，囙此它也被認為是一種「非常接近GPT-4」的開源選項。在前段時間的一篇論文中，該模型背後的公司Mistral AI公佈了Mixtral 8x7B的一些科技細節，並推出了Mixtral 8x7B–Instruct聊天模型。該模型效能在人類評估基準上明顯超過了GPT-3.5 Turbo、Claude-2.1、Gemini Pro和Llama 2 70B聊天模型。在BBQ和BOLD等基準中，Mixtral – Instruct也顯示出更少的偏見。但最近，Mixtral Instruct也被超越了。一家名叫Nous Research的公司宣佈，他們基於Mixtral 8x7B訓練的新模型——Nous-Hermes-2 Mixtral 8x7B在很多基準上都超過了Mixtral Instruct，達到了SOTA效能。