12月20日大模型日報合輯

資訊1年前 (2024)发布 AIWindVane

560 0 0

【12月20日大模型日報合輯】黴黴演唱《稻香》，國內團隊的Amphion音頻生成火了；摸底谷歌Gemini：CMU全面測評，Gemini Pro不敵GPT 3.5 Turbo；大模型+搜尋構建完整技術棧，百川智能用搜尋增強為企業客製化下了一劑「猛藥」；影片生成可以無限長？ GoogleVideoPoet大模型上線，網友：革命性技術；微軟Copilot新增重磅功能！文字直接生成超逼真音樂；英特爾 Gaudi2C AI 加速卡片現身 Linux 驅動，消息稱是中國特供版

黴黴演唱《稻香》，國內團隊的Amphion音頻生成火了

連結：https://news.miracleplus.com/share_link/13831

香港中文大學（深圳）資料科學學院武執政副教授團隊聯合上海人工智慧實驗室 OpenMMLab 團隊開源了綜合音訊生成專案 Amphion（安菲翁）。該系統旨在打造一個集語音合成轉換、歌聲合成轉換、音效音樂生成等多功能為一體的開源平台。截至目前，Amphion 已經多次進入 GitHub Trending Repositories 榜單。

摸底GoogleGemini：CMU全面評評，Gemini Pro不敵GPT 3.5 Turbo

連結：https://news.miracleplus.com/share_link/13832

前段時間，Google發布了對標 OpenAI GPT 模型的競爭 ——Gemini。這個大模型共有三個版本 ——Ultra（能力最強）、Pro 和 Nano。研究團隊公佈的測試結果顯示，Ultra 版本在許多任務中優於 GPT4，而 Pro 版本與 GPT-3.5 不相上下。儘管這些對比結果對大型語言模型研究具有重要意義，但由於確切的評估細節和模型預測尚未公開，這限制了對測試結果的複現、檢測，難以進一步分析其隱含的細節。為了了解 Gemini 的真正實力，來自卡內基美隆大學、BerriAI 的研究者對該模型的語言理解和生成能力進行了深入探索。

NeurIPS 2023 Spotlight | 騰訊AI Lab絕悟新突破：在星際2靈活策略應對職業選手

連結：https://news.miracleplus.com/share_link/13833

近日，騰訊AI Lab 的遊戲AI 團隊宣布了其決策智能AI “絕悟” 在《星海爭霸2》中的最新研究進展，提出一種創新的訓練方法顯著提升了AI 的局內策略應變能力，使其在考慮了APM 公平的對戰環境中，與3 位國內頂尖的神族職業選手各進行多達20 局神族vs 神族的對戰，穩定地保持50% 及以上的勝率。此成果已獲 NeurIPS 2023 Spotlight 論文收錄。

大模型+搜尋建構完整技術棧，百川智能用搜尋增強給企業客製化下了一劑「猛藥」

連結：https://news.miracleplus.com/share_link/13834

百川智慧正式開放了基於搜尋增強的 Baichuan2-Turbo 系列 API ，包含 Baichuan2-Turbo-192K 和 Baichuan2-Turbo 。該系列 API 不僅支援 192K 的超長上下文窗口，還增加了搜尋增強知識庫的能力，所有用戶均可上傳特定文本資料構建自身專屬知識庫，根據自身業務需求構建更完整、高效的智能解決方案。同時，百川智能也升級了官網模型體驗，正式支援 PDF 文字上傳以及 URL 網址輸入，普通用戶均可透過官網入口體驗長上下文視窗和搜尋增強加持後的通用智能等級的飛升。

影片生成可以無限長？谷歌VideoPoet大模型上線，網友：革命性技術

連結：https://news.miracleplus.com/share_link/13835

2023 年底，科技公司都在衝擊生成式 AI 的最後一個關卡 —— 視訊生成。本週二，Google提出的影片產生大模型上線，立刻獲得了人們的關注。這款名為 VideoPoet 的大語言模型，被人們認為是革命性的 zero-shot 視訊生成工具。 VideoPoet 既可以文生視頻、圖像生視頻，又能風格遷移，視頻轉語音。從效果來看，它可以建立多樣化且流暢的運動。

卷生成式AI的旗艦手機，2024年會引發互動革命

連結：https://news.miracleplus.com/share_link/13836

最近，各家手機廠商都在不約而同地做一件事：把生成式 AI 搬上手機。先是在 10 月的驍龍峰會上，小米放出訊息，能在手機端側運行的 60 億參數大模型。他們提出的 AI 模型搭載在新一代手機系統中，可以回答人們提出的各種複雜問題，幫你產生文章、表格，或幫你寫程式碼。榮耀提前展示了下一代旗艦機 Magic 6 的生成式 AI 能力，在手機上透過自然語言發出指令，你就能讓 AI 去找你拍攝的素材，尋找合適的部分整合成一段影片。隨後在 11 月份，vivo、OPPO 等廠商發布了新一代旗艦機的生成式 AI 能力，他們的手機系統也將與 AI 實現深度整合。兩週前，號稱超越 GPT-4 的Google Gemini 也為這股趨勢添了把火。

微軟Copilot新增重磅功能！文字直接生成超逼真音樂

連結：https://news.miracleplus.com/share_link/13837

12月20日，微軟在官網宣布與文生音樂領導者Suno合作，將其功能整合在copilot中，用戶透過文字就能產生搖滾、流行、古典、龐克、民謠等多種類型音樂。 Suno平台生成的音樂沒有濃重的機器人味兒，效果比Google的Lyria、Meta的MusicGen更好，與真人演唱幾乎一模一樣。無論你是否懂樂器、能製作樂譜，現在只需要把你的想法，用文字輸入到微軟copilot中便能快速生成。

文字生成精準圖像字幕，Google等開源PixelLLM

連結：https://news.miracleplus.com/share_link/13838

傳統的大語言模型可以描述、回答與圖像相關的問題，甚至進行複雜的圖像推理。但使用大型語言模型進行文字定位，或用圖像指準確座標卻不太行。為了進行該技術的探索，Google和加州大學聖地牙哥分校的研究人員開發了像素對齊大語言模型—PixelLLM。 PixelLLM可以將影像位置資訊作為輸入或輸出。當位置作為輸入時，模型可以根據位置產生與指定物件或區域相關的描述文字。當生成位置作為輸出時，模型可以為每個輸出詞語產生像素座標，實現密集的詞語定位。

百度靈境矩陣升級為智能體平台，人人可開發智能體時代到來

連結：https://news.miracleplus.com/share_link/13839

百度「靈境矩陣」平台全新升級為「文心大模型智能體平台」。靈境矩陣基於文心大模型，為開發者提供多樣化的開發方式，支援廣大開發者根據自身產業領域、應用場景，選取多樣化的開發方式，打造大模型時代的原生應用。靈境矩陣還擁有國內最完整的智能體生態，不僅背靠強大的文心大模型，且已有超過3萬開發者申請入駐，並能依托百度全局場景，獲得更多的流量分發路徑和商業機會。目前，已有法律智慧助理、TreeMind樹圖、職場密碼AI智慧履歷等眾多智能體透過靈境矩陣跑通從開發到分發再到變現的路徑。

百度智慧雲端千帆AppBuilder開放服務，人人都能開發原生應用

連結：https://news.miracleplus.com/share_link/13840

百度智慧雲端宣布，AI原生應用程式開發工作台－千帆AppBuilder全面開放服務，真正實現人人都能開發自己的AI原生應用程式。

英特爾 Gaudi2C AI 加速卡片現身 Linux 驅動，消息稱是中國特供版

連結：https://news.miracleplus.com/share_link/13841

今年 7 月，英特爾為中國市場推出了一款 Gaudi2 處理器，主要應用於加速 AI 訓練及推理。根據 Phoronix 報導，還有一個新的加速卡版本將至，英特爾已在其 Linux 驅動程式中添加了對 Gaudi2C 的支援。目前尚不清楚 Gaudi2C 和 Gaudi2 之間的區別，報告稱可能是「有限」變體，仍然是中國市場特供產品。外媒 tomshardware 也表示可能是 Gaudi2 的精簡版。

# 資訊 # 相关文章

文章版权归作者所有，未经允许请勿转载。

7月29日大模型日報

AIWindVane

318 0

11月2日大模型日報合輯

AIWindVane

566 0

12月22日大模型日報合輯

AIWindVane

478 0

10月31日大模型日報

AIWindVane

527 0

11月16日大模型日報合輯

AIWindVane

551 0

11月21日大模型日報合集

AIWindVane

558 0

暫無評論

暫無評論...

12月20日大模型日報合輯

黴黴演唱《稻香》，國內團隊的Amphion音頻生成火了

摸底GoogleGemini：CMU全面評評，Gemini Pro不敵GPT 3.5 Turbo

NeurIPS 2023 Spotlight | 騰訊AI Lab絕悟新突破：在星際2靈活策略應對職業選手

大模型+搜尋建構完整技術棧，百川智能用搜尋增強給企業客製化下了一劑「猛藥」

影片生成可以無限長？谷歌VideoPoet大模型上線，網友：革命性技術

卷生成式AI的旗艦手機，2024年會引發互動革命

微軟Copilot新增重磅功能！文字直接生成超逼真音樂

文字生成精準圖像字幕，Google等開源PixelLLM

百度靈境矩陣升級為智能體平台，人人可開發智能體時代到來

百度智慧雲端千帆AppBuilder開放服務，人人都能開發原生應用

英特爾 Gaudi2C AI 加速卡片現身 Linux 驅動，消息稱是中國特供版

12月19日大模型日報

12月21日大模型日報

相關文章

暫無評論

12月20日大模型日報合輯

黴黴演唱《稻香》，國內團隊的Amphion音頻生成火了

摸底GoogleGemini：CMU全面評評，Gemini Pro不敵GPT 3.5 Turbo

NeurIPS 2023 Spotlight | 騰訊AI Lab絕悟新突破：在星際2靈活策略應對職業選手

大模型+搜尋建構完整技術棧，百川智能用搜尋增強給企業客製化下了一劑「猛藥」

影片生成可以無限長？ 谷歌VideoPoet大模型上線，網友：革命性技術

卷生成式AI的旗艦手機，2024年會引發互動革命

微軟Copilot新增重磅功能！ 文字直接生成超逼真音樂

文字生成精準圖像字幕，Google等開源PixelLLM

百度靈境矩陣升級為智能體平台，人人可開發智能體時代到來

百度智慧雲端千帆AppBuilder開放服務，人人都能開發原生應用

英特爾 Gaudi2C AI 加速卡片現身 Linux 驅動，消息稱是中國特供版

12月19日大模型日報

12月21日大模型日報

相關文章

暫無評論

影片生成可以無限長？谷歌VideoPoet大模型上線，網友：革命性技術

微軟Copilot新增重磅功能！文字直接生成超逼真音樂