11月11-12日大模型日報

資訊1年前 (2023)发布 AIWindVane
541 0
11月11-12日大模型日報

【11月11-12日大模型日報】OpenAI救了Stable Diffusion! 開源DallE3同款解碼器,來自Ilya宋颮等;GoogleDeepMind給AGI劃等級,猜猜ChatGPT在哪個位置;英偉達特供版晶片將上市:性能最高不到H100的20%;谷歌大模型研究 陷重大爭議:訓練資料之外完全無法泛化? 網友:AGI奇點延後了


OpenAI救了Stable Diffusion! 開源DallE3同款解碼器,來自Ilya宋颮等

 

連結:https://news.miracleplus.com/share_link/11637

沒想到,OpenAI撈了「競對」Stable Diffusion一把。 在熱火的「AI春晚」上,OpenAI一口氣開源兩項工作,其中之一一致性解碼器,專門針對SD的VAE模型。 它能讓影像生成品質更高、更穩定,例如多人臉、文字影像以及線條控制方面。 大V部落客分析這個解碼器應該是Dall·E 3同款,在GitHub專案頁上OpenAI也提供了Dall·E 3論文。 而且這個一致性解碼器頗有淵源。 它來自OpenAI聯創及首席科學家Ilya、OpenAI華人新星宋颮等人提出的一致性模型(Consistency Models)。 上半年這個模式開源時引發業界震動,被評為能「終結擴散模式」。 就在前不久,宋颮等人也對模型訓練方法做了優化,能進一步提升影像生成品質。


谷歌DeepMind給AGI劃等級,猜猜ChatGPT在哪個位置

 

連結:https://news.miracleplus.com/share_link/11638

AGI 該如何劃分,Google DeepMind 給出了標準。 為了發展這個框架,DeepMind 對 AGI 的現有定義進行了分析,並提煉出了六個原則:1. 專注於模型能力,而不是過程。 2. 註註通用性和性能。 3. 關注認知和後設認知任務。 4. 專注於潛能,而不是部署。 5. 關註生態的有效性。 6. 專注於 AGI 發展道路,而不是只關心終點。 在這些原則的基礎之上,DeepMind 從性能和通用性兩個維度提出了「AGI 等級(Levels of AGI)」。 Level 0:無AI(No AI),如Amazon Mechanical Turk;Level 1: 湧現(Emerging),與不熟練的人類相當或比之更好, 如ChatGPT、Bard、Llama 2 ;Level 2: 有能力(Competent ),達到50% 的人類水平,廣泛任務上還沒實現;Level 3: 專家(Expert),到達90% 的人類水平,廣泛任務上還沒實現, Imagen、Dall-E 2 在特定任務上已經實現 ;Level 4: 大師(Virtuoso) ,達到99% 的人類水平,在廣泛任務上還沒實現,Deep Blue 、AlphaGo 在特定任務上已經實現;Level 5: 超人(Superhuman),勝過100% 人類,廣泛 任務上還沒實現,在一些任務範圍內,AlphaFold 、AlphaZero 、 StockFish 已經實現。


Lex Fridman 對話馬斯克|宇宙可能只是一個巨大的電腦模擬;GPU 群集與人腦相比還有 6 個數量級的差距….

 

連結:https://news.miracleplus.com/share_link/11639

週五,MIT 科學家Lex Fridman 與馬斯克展開了第4 次對談,這最新的節目中他們討論了人類、哲學、遊戲競技、經濟、戰爭、社交媒體、AI、機器人以及短期2~3 年的 趨勢等多個領域的話題。 對於AI 以及機器人,馬斯克表示我們的大腦非常計算高效,非常節能,僅有不到10 瓦的高級大腦功能,不包括用於控制身體的東西,我們大腦的思考部分少於10 瓦,這10 瓦的能量仍然可以產生比10 兆瓦的GPU 集群更好的小說,所以這裡有6 個數量級的差距。 馬斯克認為,到目前為止 AI 之所以取得了今天的成就,主要是透過強大的計算和大量的能量投入,但這並不是它的終點。 通常情況下,對於任何給定的技術,首先要使其工作,然後再進行優化,所以我認為隨著時間的推移,這些模型會變得更小,能夠在更少的計算和能量消耗下產生 合理的輸出….


谷歌大模型研究陷重大爭議:訓練資料之外完全無法泛化? 網友:AGI奇點延後了

 

連結:https://news.miracleplus.com/share_link/11640

谷歌Transformer是今天大模型背後的基礎架構,我們所熟悉的GPT裡的「T」指的就是它。 一系列大模型表現出強大的上下文學習能力,可以快速學習範例並完成新的任務。 但現在,同樣來自Google的研究人員似乎指出了它的致命缺陷──超越訓練資料也就是人類已有知識之外,全都無能為力。 一時間,不少從業者認為AGI再次變得遙不可及。


百度CTO王海峰:文心一言用戶規模已達7,000萬

 

連結:https://news.miracleplus.com/share_link/11641

今年是烏鎮高峰會舉辦的第十年,百度技術長、深度學習技術及應用國家工程研究中心主任王海峰出席前沿數位科技創新與安全論壇與人工智慧賦能產業發展論壇,解讀文心大模型4.0最新 技術,闡述大模型產業模式。 王海峰揭露,文心一言用戶規模現已達到7000萬,場景4300萬。


英偉達特供版晶片將上市:性能最高不到H100的20%

 

連結:https://news.miracleplus.com/share_link/11642

10 月 17 日,美國商務部放出最嚴對華出口管制規定,H800 等 AI 加速器成為制裁的焦點。 因為制裁涉及顯示卡功率和算力的限制,繼 H100 之後,英偉達專為符合要求設計的客製化晶片也因此受限。 新的禁令已在 10 月 23 日生效。 有經銷商表示,在 A800 和 H800 GPU 無法進口後,英偉達為國內市場專門開發了一款新伺服器晶片和兩款新 GPU,英偉達將在未來幾天內向國內製造商交付三款新晶片。 繼 A800 和 H800 GPU 之後,英偉達開發了 HGX H20 以及 GPU L20 和 L2,它們分別對應人工智慧的訓練、推理和端側應用場景,將於今年底發布並量產。 其中,HGX L20 是基於 Hopper 架構的 HGX 形式加速卡。 此型號提供高規格 HBM3 內存,容量為 96 GB,頻寬達到 4Tb/s。 在計算效能方面,此型號的 INT8 算力為 296 TFLOPS,透過 Tensor Core 在 BF16 中可達到 148 TFLOPS,在 FP32 中為 44 TFLOPS,在 FP64 中為 1 TFLOP。 最後,它具有 PCIe 5.0 介面以及 900 GB/s NVLINK 連結。


通用異常檢測新曙光:華科大等揭秘GPT-4V的全方位異常檢測表現

 

連結:https://news.miracleplus.com/share_link/11643

最近,大型多模態模型(LMM)迅速發展,其中OpenAI 最近推出的GPT-4V (ision) 表現最為出色,具有強大的多模態感知能力,在場景理解,圖片生成等多個任務中都取得 了良好表現。 我們認為,LMM 的出現為通用異常檢測的研究提供了新的範式和新的機會。 為了評估GPT-4V 在通用異常檢測中的性能,來自華中科技大學、密西根大學和多倫多大學的研究者聯合進行了一項研究,在涉及4 個數據模態,9 個異常檢測任務的15 個異常 在檢測資料集上對GPT-4V 進行了全面的測試。 具體而言,測試的資料集包括影像、點雲、視訊、時序等模態,並涵蓋了工業影像異常檢測/ 定位,醫療影像異常檢測/ 定位,點雲異常檢測,邏輯異常檢測,行人異常檢測 ,交通異常檢測,時序異常檢測等9 個異常檢測任務。


GPT-4比你更會問問題:讓大模型自主複述,打破與人類對話的障礙

 

連結:https://news.miracleplus.com/share_link/11644

在最新的人工智慧領域動態中,人工產生的提示(prompt)品質對大語言模型(LLM)的反應精度有著決定性影響。 OpenAI 提出的建議指出,精確、詳細且具體的問題對於這些大語言模型的表現至關重要。 然而,普通用戶是否能夠確保他們的問題對於 LLM 來說足夠清晰明了? 值得注意的是,人類在某些情境下的自然理解能力與機器的解讀有明顯差異。 例如,「偶數月」 這個概念,在人類看來很明顯指的是二月,四月等月份,而 GPT-4 卻可能將其誤解為天數為偶數的月份。 這不僅揭示了人工智慧在理解日常脈絡上的局限性,也促使我們反思如何更有效地與這些大語言模型溝通。 隨著人工智慧技術的不斷進步,如何橋接人類與機器在語言理解上的鴻溝,是未來研究的重要議題。 對此,加州大學洛杉磯分校(UCLA)顧全全教授領導的通用人工智慧實驗室發布了一份研究報告,針對大語言模型(如GPT-4)在問題理解上的歧義問題提出了一種創新的 解決方案。 這項研究由博士生鄧依荷,張蔚桐,陳子翔完成。


多倫多大學團隊使用AlphaFold來獲得蛋白質結構的新見解

 

連結:https://news.miracleplus.com/share_link/11645

AlphaFold 蛋白質結構資料庫包含數百萬種蛋白質的預測結構。 對於大多數含有本質無序區域 (IDR) 的人類蛋白質,這些區域不採用穩定的結構,通常認為這些區域具有較低的 AlphaFold2 置信度分數,反映了低置信度的結構預測。 多倫多大學(University of Toronto)的研究團隊表明 AlphaFold2 為近 15% 的人類 IDR 分配了可信結構。 透過與已知條件折疊(即在結合或其他特定條件下)的 IDR 子集的實驗 NMR 數據進行比較,研究人員發現 AlphaFold2 通常可以預測條件折疊狀態的結構。 基於已知條件折疊的 IDR 資料庫,團隊估計 AlphaFold2 可以在 10% 的誤報率下以高達 88% 的精度識別條件折疊 IDR。 同時,研究人員發現人類疾病突變中條件折疊的 IDR 比一般 IDR 豐富了近五倍,並且預計原核生物中高達 80% 的 IDR 會條件折疊,而真核生物 IDR 的比例不到 20%。


圖片、影片直接生成3D高斯分佈! 免費體驗,已正式商用

 

連結:https://news.miracleplus.com/share_link/11646

知名3D掃描應用企業Polycam在官網宣布,結束對3D GAUSSIAN SPLATS(以下簡稱「3DGS」)的測試,正式投入商業使用。 3DGS是一款透過圖片或視頻,就能直接生成3D高斯分佈的生成式AI產品。 透過外掛程式還能將生成的產品導入Unity、 Unreal等遊戲開發引擎中使用、二次編輯,這對於3D設計師、房地產經紀、博物館展示、醫療研究、電商展示等幫助龐大。 目前,3DGS處於免費線上體驗狀態,不鎖區直接存取。 如果你想使用更高級的功能,例如,一次性上傳1000張圖片、15分鐘超長影片就需要付費。 對一般人來說,免費功能就足夠了。 此外,產生的內容在商用方面也沒有版權風險,因為上傳的素材都是你自己的。


Runway新功能「運動筆刷」再次驚艷AI圈:隨手一塗,圖片就動起來了

 

連結:https://news.miracleplus.com/share_link/11647

一段五十秒的預告視頻,再次讓 AI 圈沸騰了。 昨天 Runway 宣布,即將在影片產生工具 Gen-2 中上線「Motion Brush」(運動筆刷)功能,一種可控制產生內容移動的新方法。

© 版权声明

相關文章

暫無評論

暫無評論...