11月24日大模型日報

【11月24日大模型日報】資訊 影片產生新突破:PixelDance,輕鬆呈現複雜動作與酷炫特效
影片生成新突破:PixelDance,輕鬆呈現複雜動作與酷炫特效
https://news.miracleplus.com/share_link/11963
PixelDance 邁出了關鍵性的一步,其生成結果的動態性顯著優於目前現有的其它模型,引起了業界的關注。 在官網(https://makepixelsdance.github.io)中,PixelDance 給了兩種不同的影片產生模式。 第一種是基礎模式(Basic Mode),使用者只需要提供一張指導圖片+文字描述,PixelDance 就可以產生有高度一致性且有豐富動態性的視頻,其中指導圖片可以是真實圖片,也可以利用 現有的文生圖模型生成。 第二種是進階魔法模式(Magic Mode),給了使用者更多發揮想像和創造力的空間。 在這種模式下,用戶需要提供兩張指導圖片+文字描述,可以更好地產生更有難度的影片內容。 網站中展示了用魔法模式做出的各種酷炫特效鏡頭。
Meta對Transformer架構下手了:新註意力機制更懂推理
https://news.miracleplus.com/share_link/11964
近日 Meta 研究者在論文《System 2 Attention (is something you might need too)》中認為,根本問題在於 Transformer 本身固有的建構方式。 因此,研究者提出了一種完全不同的注意力機制方法,即透過將 LLM 用作自然語言推理器來執行注意力。 具體來講,他們利用 LLM 遵循指令的能力,提示它們產生應該注意的上下文,從而使它們只包含不會扭曲自身推理的相關資料。 研究者將此過程稱為 System 2 Attention(S2A),將底層 transformer 及其註意力機制視為類似人類 System 1 推理的自動操作。
https://arxiv.org/pdf/2311.11829.pdf
AIGC新創公司還沒獲利,微軟Adobe已賺得盆滿缽滿
https://news.miracleplus.com/share_link/11965
年初至今,Adobe美股市值漲了1000+億美元,已經不知不覺創造了90.58%的漲幅;而OpenAI最大股東、發布一系列AI Copilot產品的微軟,漲幅同樣達到令人矚目的55.93%。 這類非AI原生的老牌玩家,看似主營產品還是十分傳統,但AIGC產品卻悄悄佔據了主流。
真場景煉大模型,夸克借 AI 再次「提速」
https://news.miracleplus.com/share_link/11966
11 月 14 日,阿里巴巴智慧資訊事業群發布了千億級參數的自研夸克大模型,一經發布,就登頂 C-Eval 和 CMMLU 兩大權威評測榜單。 乘借 AI 重構應用的風潮,夸克大模型將對旗下產品矩陣與服務進行全面升級。
隨意轉換聲音,ElevenLabs發布“語音轉語音”
https://news.miracleplus.com/share_link/11967
語音生成式AI平台Elevenlabs在官網發布了「語音轉語音」(STS)功能,可幫助用戶將語音自動轉換成別的語音,例如,上傳了一段男聲語音,可以自動轉換成女聲、老年或兒童的 聲音。 體驗網址:https://elevenlabs.io/voice-changer
英偉達被指控竊取商業機密! 開視訊會議暴露證據,涉事員工已認罪
https://news.miracleplus.com/share_link/11968
汽車零件龍頭老大法雷奧(Valeo)起訴英偉達,原因是竊取商業機密。 法雷奧員工在視訊會議中發現,英偉達員工的共享螢幕上,出現了法雷奧的源代碼文件,然後他們馬上截圖取證。 今年9月,這名員工被認定非法取得、使用、揭露法雷奧商業機密,罰款1.44萬歐元(折合人民幣近12萬元)。 法雷奧最近正式向加州聖荷西聯邦法院提起訴訟。 英偉達目前暫無回應。