1月20-21日大模型日報

資訊11個月前发布 AIWindVane
530 0
1月20-21日大模型日報

【1月20-21日大模型日報】研究清華、小米、華為、 vivo、理想等多機構聯合綜述,首提個人LLM智能體、劃分5級智能水平產業大模型自我獎勵:Meta讓Llama2自己給 自己微調,效能超越了GPT-4


清華、小米、華為、 vivo、理想等多機構聯合綜述,首提個人LLM智能體、劃分5級智能水平

https://news.miracleplus.com/share_link/16400

想必這些喚醒詞中至少有一個曾被你的嘴發出並成功呼喚出了一個能給你導航、講笑話、添加日程、設置鬧鐘、撥打電話的智能個人助理(IPA)。 可以說 IPA 已經成了現代智慧型手機不可或缺的標配,近期的一篇綜述論文更是認為「個人 LLM 智能體會成為 AI 時代個人運算的主要軟體範式」。 這篇個人 LLM 智能體綜述論文來自國內多所大學和企業研究所,包括清華大學、小米、華為、歡太、vivo、雲米、理想汽車、北京郵電大學、蘇州大學。 文中不僅整理了個人 LLM 智能體所需的能力、效率和安全問題,還收集並整理了領域專家的見解,另外還開創性地提出了個人 LLM 智能體的 5 級智能水平分級法。 團隊也在 GitHub 上創建了一個文獻庫,發布了相關文獻,同時也可供 IPA 社群共同維護,更新最新研發進度。


Pika、Gen-2、ModelScope、SEINE……AI影片產生哪家強? 這個框架一測便知

https://news.miracleplus.com/share_link/16401

AI 影片生成,是最近最熱門的領域之一。 各大學實驗室、網路巨頭 AI Lab、新創公司紛紛加入了 AI 影片生成的賽道。 Pika、Gen-2、Show-1、VideoCrafter、ModelScope、SEINE、LaVie、VideoLDM 等影片產生模型的發布,更是讓人眼睛一亮。 為此NTU聯合上海AI Lab,CUHK以及南京大學推出了 VBench,一個全面的“視頻生成模型的評測框架”,來告訴你:視頻模型哪家強,各家模型強在哪。


英偉達新對話QA模型準確度超GPT-4,卻遭吐槽:無權重程式碼意義不大

https://news.miracleplus.com/share_link/16402

一年多來,ChatGPT 及後續產品引發了生產和研究社群中建構問答(QA)模型的典範轉移。 尤其是在實際應用中,QA 模型在以下情況成為首選。 近日,在英偉達的一篇論文中,研究者提出了一個具有 GPT-4 級別準確度的白箱對話 QA 模型 ChatQA 70B。 他們採用了兩階段指令調優方法以及用於對話 QA 的 RAG 增強檢索器、嚴格的資料管理流程。


羅氏製藥和GRCEH團隊開發可解釋機器學習方法,分析治療性抗體的免疫突觸和功能表徵

https://news.miracleplus.com/share_link/16403

治療性抗體廣泛用於治療嚴重疾病。 它們中的大多數會改變免疫細胞並在免疫突觸內發揮作用。 指導體液免疫反應的重要細胞間交互作用。 儘管產生並評估了許多抗體設計,但缺乏用於系統抗體表徵和功能預測的高通量工具。 德國環境健康研究中心(German Research Center for Environmental Health)和羅氏製藥(Roche)的研究團隊,開發了一個全面的開源框架scifAI(單細胞成像流式細胞儀AI),用於對成像流式細胞術 (IFC) 資料進行預處理、特徵工程和可解釋的預測機器學習。


一張照片,為深度學習巨頭們客製化人像圖片


主題驅動的文字到圖像生成,通常需要在多張包含該主題(如人物、風格)的資料集上進行訓練,這類方法中的代表性工作包括DreamBooth、Textual Inversion、LoRAs 等,但這類方案因為 需要更新整個網路或較長時間的客製化訓練,往往無法有效地相容於社群已有的模型,並無法在真實場景中快速且低成本應用。 而目前基於單張圖片特徵進行嵌入的方法(FaceStudio、PhotoMaker、IP-Adapter),要么需要對文生圖模型的全參數訓練或PEFT 微調,影響原本模型的泛化性能,缺乏與社區預訓練模型的 相容性,要么無法保持高保真度。 為了解決這些問題,來自InstantX 團隊的研究人員提出了InstantID,該模型不訓練文生圖模型的UNet 部分,僅訓練可插拔模組,在推理過程中無需test-time tuning,在幾乎不影響文本控制能力 的情況下,實現高保真ID 保持。


AI看影片自動找「高能時刻」|位元組&中科院自動化所@AAAI 2024

https://news.miracleplus.com/share_link/16405

位元組跳動聯合中科院自動化研究所提出新方法,用AI快速檢測出視頻中的高光片段,對輸入視頻的長度以及期望提取的高光長度都具有極高的靈活性,相關論文已被AAAI 2024收錄。


大模型自我獎勵:Meta讓Llama2自己給自己微調,表現超越了GPT-4

https://news.miracleplus.com/share_link/16406

在大模型領域中,微調是改善模型效能的重要一步。 隨著開源大模型逐漸變多,人們總結出了許多微調方式,其中一些取得了很好的結果。 最近,來自 Meta、紐約大學的研究者用「自我獎勵方法」,讓大模型自己產生自己的微調數據,給人帶來了一點新的震撼。 在新方法中,作者對 Llama 2 70B 進行了三個迭代的微調,生成的模型在 AlpacaEval 2.0 排行榜上優於一眾現有重要大模型,包括 Claude 2、Gemini Pro 和 GPT-4。


奧特曼籌數十億美元建造全球晶圓廠網絡,自造AI晶片

https://news.miracleplus.com/share_link/16407

根據彭博社消息,OpenAI CEO 薩姆・奧特曼(Sam Altman)最近再次為一家人工智慧晶片企業籌集了數十億美元的資金,希望建立一個範圍覆蓋全球的晶圓廠「企業網路(network of factories )」,並計劃與未具名的頂級晶片製造商合作。


Stability AI殺回來了:影片產生新Demo效果驚人,網友:一致性超群

https://news.miracleplus.com/share_link/16408

Stable Diffusion要王者回來了? Stability AI CEO Emad Mostaque最新推文,四段影片引人無數遐想。 不少網友懷疑,這是Stable Video Diffusion新版的示範Demo。 因為從效果來看,不管是畫面清晰度、一致性或流暢度都十分驚人。


兩位 DeepMind 員工離職創立 AI 模型首輪或融 2 億美金,Flexport 又拿了2.6億美金

https://news.miracleplus.com/share_link/16409

Flexport CEO Ryan Petersen 在 X 上宣稱,已經從 Shopify 那裡融了 2.6 億美金的新一輪融資。 比較有趣的是,此次融資是一個 uncapped convertible note,也就是一種無估值上限的可轉換債券,一般用於早期創業項目的投資,是對新創公司非常有利的一種融資方式。 這次在Flexport 這麼後期的公司裡採用這種方式,估計是對Flexport 過去一年面臨的各種問題的一個支持,在過去一年,因為疫情其業務量出現大幅下降,導致公司面臨一系列的 問題,最後Flexport 經歷了兩次20% 的裁員。

© 版权声明

相關文章

暫無評論

暫無評論...