元旦總結（12月30日-1月1日）大模型日報合輯

資訊1年前 (2024)发布 AIWindVane

678 0 0

【元旦總結（12月30日-1月1日）大模型日報合輯】AI繪圖模型不會寫字的難題，被阿里破解了；基礎模型+機器人：現在已經走到哪一步了；測試大語言模型的生物推理能力，GPT-4、PaLM2等均在測試之列

這是GPT-4變笨的新解釋

自發布以來，曾被認為是世界上最強大的 GPT-4 也經歷了多場「信任危機」。如果說今年早些時候那次「間歇式降智」與OpenAI 重新設計GPT-4 架構有關，前段時間的「變懶」傳聞就更搞笑了，有人測出只要告訴GPT-4「現在是寒假」，它就會變得懶懶散散，彷彿進入了一種冬眠狀態。大模型變懶、變笨，具體是指模型在新任務上的零樣本表現變差。儘管上述原因聽起來很有趣，但問題到底要怎麼解決呢？在最近的一篇論文中，加州大學聖克魯斯分校研究者的新發現或可解釋 GPT-4 表現下降的深層原因。

Mamba可以取代Transformer，但它們也能組合起來使用

連結：https://news.miracleplus.com/share_link/14737

Transformer 很厲害，但並不完美，尤其是在處理長序列方面。而狀態空間模型（SSM）則在長序列上的表現相當不俗。早在去年就有研究者提出可使用 SSM 取代 Transformer。但實際上，SSM 和 Transformer 並不是非此即彼的兩種架構，它們完全可以組合起來。近日公佈的一篇NeurIPS 2023 論文《Block-State Transformers》就採用了這種做法，其不僅能輕鬆支援65k token 長度的超長輸入，而且計算效率還非常高，速度相比使用循環單元的Transformer 足可提升十倍之多！這篇論文也得到了 Mamba 作者 Tri Dao 的點贊，他表示：「SSM 和Transformer 似乎可以互補。」

AI繪圖模型不會寫字的難題，被阿里破解了

連結：https://news.miracleplus.com/share_link/14738

能準確寫漢字的AI繪圖工具，終於登場了！包括中文在內一共支援四種語言，還能文字的位置還能任意指定。從此，人們終於可以和AI繪圖模型的「鬼畫符」說再見了。這款名為AnyText的繪圖工具來自阿里巴巴，可以依照指定位置精準地向圖中加入文字。先前的繪圖模型普遍無法準確地在圖中添加文字，即便有也很難支持像中文這樣結構複雜的文字。而目前Anytext支援中英日韓四種語言，不僅字形準確，風格也可以與圖片完美融合。

你沒看過的全新版本，Transformer數學原理揭秘

連結：https://news.miracleplus.com/share_link/14739

2017 年，Vaswani 等人發表的《Attention is all you need》成為神經網路架構發展的一個重要里程碑。這篇論文的核心貢獻是自註意機制，這是 Transformers 區別於傳統架構的創新之處，在其卓越的實用性能中發揮了重要作用。事實上，這項創新已成為電腦視覺和自然語言處理等領域人工智慧進步的關鍵催化劑，同時在大語言模型的出現中也扮演了關鍵角色。因此，了解 Transformers，尤其是自註意處理資料的機制，是一個至關重要但在很大程度上尚未充分研究的領域。

AI研究也能藉鏡印象派？這些栩栩如生的人竟然是3D模型

連結：https://news.miracleplus.com/share_link/14740

創建逼真的動態虛擬角色，要么在訓練期間需要準確的 3D 配準，要么在測試期間需要密集的輸入圖像，有時則兩者都需要，也許 D3GA 是一個不錯的選擇。

基礎模型+機器人：現在已經走到哪一步了

連結：https://news.miracleplus.com/share_link/14741

機器人是一種擁有無盡可能性的技術，尤其是當搭配了智慧技術時。近段時間創造了許多變革性應用的大模型有望成為機器人的智慧大腦，幫助機器人感知和理解這個世界並制定決策和規劃。近日，CMU 的 Yonatan Bisk 和 Google DeepMind 的夏斐（Fei Xia）領導的一個聯合團隊發布了一篇綜述報告，介紹了基礎模型在機器人領域的應用和發展。

測試大語言模型的生物推理能力，GPT-4、PaLM2等均在測試中

連結：https://news.miracleplus.com/share_link/14742

大型語言模型（LLM）的最新進展，為將通用人工智慧 (AGI) 整合到生物研究和教育中提供了新機會。在最新的研究中，喬治亞大學和梅奧診所的研究人員評估了幾個領先的 LLM（包括 GPT-4、GPT-3.5、PaLM2、Claude2 和 SenseNova）回答概念生物學問題的能力。這些模型在包含 108 個問題的多項選擇考試中進行了測試，涵蓋分子生物學、生物技術、代謝工程和合成生物學等生物學主題。在這些模型中，GPT-4 獲得了 90 分的最高平均分數，並且在不同提示的測驗中表現出最大的一致性。結果表明，GPT-4 具有邏輯推理能力，並且具有透過數據分析、假設生成和知識整合等功能來幫助生物學研究的潛力。但在 LLM 加速生物發現方面，仍需要進一步的開發和驗證。