1月12日大模型日報

【1月12日大模型日報】為大模型惡補數學,上交開源MathPile語料庫,95億tokens,還可商用;Nat.Commun.|山東大學團隊基於圖transformer開發了一種稀有細胞群組學 分析方法;位元組讓達文西和蒙娜麗莎“隔空吵架”,只需一張圖、一段音頻、一個情感片段;羅永浩暫緩AR業務轉做大模型,細紅線公司軟硬體、演算法團隊 半數裁員
為大模型惡補數學,交開源MathPile語料庫,95億tokens,還可商用
https://news.miracleplus.com/share_link/15640
在當前智慧對話模型的發展中,強大的底層模型起著至關重要的作用。 這些先進模型的預訓練往往依賴高品質且多樣化的語料庫,而如何建立這樣的語料庫,已成為業界的一大挑戰。 在備受矚目的 AI for Math 領域,由於高品質的數學語料相對稀缺,這限制了生成式人工智慧在數學應用方面的潛力。 為了因應這項挑戰,上海交通大學生成式人工智慧實驗室推出了「MathPile」。 這是一套專門針對數學領域的高品質、多樣化預訓練語料庫,其中包含約 95 億 tokens,旨在提升大型模型在數學推理方面的能力。 此外,實驗室也推出了 MathPile 的商業版 ——「MathPile_Commercial」,進一步拓寬其應用範圍和商業潛力。
Nat.Commun.|山東大學團隊基於圖transformer開發了一種稀有細胞群組學分析方法
https://news.miracleplus.com/share_link/15641
稀有細胞群是腫瘤進展和治療反應的關鍵,提供了潛在的干預目標。 然而,它們的計算識別和分析通常落後於主要細胞類型。 為了填補這一空白,山東大學的研究團隊引入了 MarsGT:使用單細胞圖 transformer 進行稀有群體推斷的多組學分析。 它使用基於機率的異質圖 transformer 對單細胞多組學數據識別稀有細胞群。 MarsGT 在識別 550 個模擬資料集和 4 個真實人類資料集中的稀有細胞方面優於現有工具。
描述液體和軟物質的AI方法,開啟密度泛函理論新篇章
https://news.miracleplus.com/share_link/15642
拜羅伊特大學(Universität Bayreuth)的科學家開發了一種利用人工智慧研究液體和軟物質的新方法,開啟了密度泛函理論的新篇章。 我們生活在一個高度技術化的世界,在這個密集而複雜的相互關聯的網絡中,基礎研究是創新發展的引擎。 這裡的新方法,可以對廣泛的模擬技術產生巨大影響,從而可以在電腦上更快、更精確、更深入地研究複雜物質。 將來,這可能會對產品和製程設計產生影響。 新制定的神經數學關係可以很好地表示液體的結構,這一事實是一項重大突破,為獲得深入的物理見解開闢了一系列可能性。 「在這項研究中,我們展示瞭如何使用人工智慧來進行基礎理論物理學,以解決流體和其他複雜軟物質系統的行為。」拜羅伊特大學理論物理II 系主任Matthias Schmidt 教授說,「 我們開發了一種先進的科學方法來研究原子和(宏觀)分子層面上的物質,結合機器學習和數學方法來計算複雜的物理特性。」
字節讓達文西和蒙娜麗莎“隔空吵架”,只需一張圖、一段音頻、一個情感片段
https://news.miracleplus.com/share_link/15643
AIGC在影片生成領域展現出非凡的潛力。 近期, 位元組跳動智慧創作團隊和德州大學達拉斯分校又提出了一個名為DREAM-Talk的基於擴散模型框架:接收一段驅動的音訊序列、一張給定的人像圖片和一個情緒風格的例子( 一段有情感的講話面部視頻)作為輸入,就能生成一段逼真的、嘴唇同步的講話面部視頻,其中包含高質量的情感表達,連畫像也能繪聲繪色地進行表演,還支持多個語種。
爆款圖像工具Magnific背後:兩個人的新創公司
https://news.miracleplus.com/share_link/15644
最近,一個名為 Magnific 的圖片超分 & 增強工具火了。 Magnific 能夠提高影像的清晰度和銳利度,並且能夠透過你的提示將畫面中的細節補充完整,甚至在一些細微之處能夠透過 AI 幫助你完成想像。 這不僅在為影像升頻,更是完成了對影像的再創造。
羅永浩暫緩AR業務轉做大模型,細紅線公司軟硬體、演算法團隊半數裁員
https://news.miracleplus.com/share_link/15645
羅永浩的細紅線AR業務軟硬體研發放緩、AR相關業務裁員,或將轉向大模型產業。 有業界主管向搜狐科技透露,羅永浩不再做AR硬件,可能打算去做大模型。
AI推理效能提升7倍 阿里雲第八代企業級實例g8i來了!
https://news.miracleplus.com/share_link/15646
今天,阿里雲正式發表第八代企業級通用運算實例ECS g8i,基於阿里雲自研「飛天+CIPU」架構體系和第五代英特爾至強可擴充處理器,g8i實例的整機效能最高提升85 %,AI推理表現最高提升7倍,可支撐高達72B參數的大語言模型,幫助中小規模模型起建成本降低50%。 同時新款實例也提供了端到端安全防護,為企業建置可信任AI應用提供強而有力的隱私增強算力支撐。
OpenAl的 ChatGPT Enterprise 版本在推出後4 個月內便獲得了 260 個企業客戶
https://news.miracleplus.com/share_link/15647
根據彭博社報道,OpenAI 營運長 Brad Lightcap 在接受採訪時表示,目前使用 ChatGPT Enterprise 的260 家企業客戶總共有超過 15 萬名員工註冊使用該產品。 ChatGPT Enterprise 於8 月推出,提供增強的功能和隱私保護,以滿足企業的特定需求。 其中包括資料加密以及保證客戶資訊不會被用於開發 OpenAl 的技術。 ChatGPT Enterprise 的定價比較靈活,可以根據每家公司的要求進行客製化。