1月29日大模型日報合輯

資訊11個月前发布 AIWindVane
527 0
1月29日大模型日報合輯

【1月29日大模型日報合輯】百川智能上新超千億大模型Baichuan 3,衝榜成績:若干中文任務超車GPT-4;500行程式碼建構對話搜尋引擎,賈揚清被內涵的Lepton Search真開源 了;從零手搓MoE大模型,大神級教程來了


登Science,速度和準確性均超越人類化學家,且具獨創性,AI自主化學合成機器人加速化學發現

 

連結:https://news.miracleplus.com/share_link/17024

最近,在光化學和光催化方面的研究出現了驚人的爆發,部分原因在於光作為反應源對環境無害。 然而,許多研究展示的是小規模反應,而擴大規模依賴不同技術的拼湊,可能需要大量的試驗和錯誤來優化。 針對複雜光催化反應條件高效優化的需求,荷蘭阿姆斯特丹大學(UvA) 范特霍夫(Van ‘t Hoff)分子科學研究所的Timothy Noël 教授團隊,開發了一種集成人工智慧驅動機器學習單元的自主 化學合成機器人。 這款桌上型設備被稱為“RoboChem”,在速度和準確性方面都超過了人類化學家,同時也表現出高水準的獨創性。

1月29日大模型日報合輯

基於量子輔助深度學習的逆向分子設計

 

連結:https://news.miracleplus.com/share_link/17025

康乃爾大學Fengqi You教授團隊,透過結合量子運算(QC)與生成式AI的優勢,提出了一個新穎的逆向分子設計架構。 該框架利用QC輔助的深度學習模型來學習和模擬化學空間,從而預測並產生具有特定化學性質的分子結構。 生成式AI在這個過程中起著核心作用,它能夠從大量的分子數據中學習潛在的結構-性質關係,並產生新的分子候選物,這些分子不僅符合預設的性質,還考慮到合成的 可行性。 量子運算的加入則為此過程提供了高效的運算能力和最佳化演算法,克服了傳統電腦在處理大規模化學系統時的效能瓶頸。 透過這種量子-經典混合計算框架,研究人員能夠在複雜的化學空間中進行高效、有效的分子設計,為新分子的發現和材料科學的進步開闢了新途徑。

1月29日大模型日報合輯

百川智能上新超千億大模型Baichuan 3,衝榜成績:若干中文任務超車GPT-4

 

連結:https://news.miracleplus.com/share_link/17026

走月更路線的百川智能,在年前猛地加速,變成了半月更:發布了超千億參數的最新版本大模型Baichuan 3,是百川智能基礎模型第三代——就在20天前 ,這家由王小川創辦的大模型公司,剛發布過角色大模型Baichuan-NPC。 更具標誌性的是,百川智能這次模型更新,重點介紹了模型在醫療場景的能力。

1月29日大模型日報合輯

500行程式碼建構對話搜尋引擎,賈揚清被內涵的Lepton Search真開源了

 

連結:https://news.miracleplus.com/share_link/17027

來了,賈揚清承諾的 Lepton Search 開源程式碼來了。 前天,賈揚清在 Twitter 上公佈了 Lepton Search 的開源專案鏈接,並表示任何人、任何公司都可以自由使用開源程式碼。 也就是說,你也可以用不到 500 行 Python 程式碼建立自己的對話搜尋引擎了。 今天,Lepton Search 又登上了 GitHub trending 榜單。 另外已經有人將這個開源專案用來建立自己的 Web 應用程式了,並表示品質非常高,與 AI 驅動的搜尋引擎 Perplexity 不相上下。

1月29日大模型日報合輯

Meta官方的Prompt工程指南:Llama 2這樣用更有效率

 

連結:https://news.miracleplus.com/share_link/17028

隨著大型語言模型(LLM)技術日漸成熟,提示工程(Prompt Engineering)變得越來越重要。 一些研究機構發布了 LLM 提示工程指南,包括微軟、OpenAI 等等。 最近,Llama 系列開源模型的提出者 Meta 也針對 Llama 2 發布了一份互動式提示工程指南,涵蓋了 Llama 2 的快速工程和最佳實踐。

1月29日大模型日報合輯

AI也造代碼屎山! 研究發現GitHub Copilot程式碼可維護性差,偏好「無腦重寫」而非重構復用已有程式碼

 

連結:https://news.miracleplus.com/share_link/17029

AI幫忙寫程式碼程式設計師用了都說好,但程式碼品質真的可靠嗎? 結果或許令你大吃一驚。 一家名為GitClear的公司分析了近四年超過1.5億行程式碼後發現,隨著GitHub Copilot工具的加入,程式碼流失率(即程式碼寫入後不久又被返工修改、刪除的情況)出現了顯著上升 :2023年為7.1%,而2020年時僅3.3%,翻了一番。

1月29日大模型日報合輯

OpenAI 董事會主席 Bret Taylor 的 AI 公司估值為 10 億美元! 紅杉美國領投,專注企業解決方案

 

連結:https://news.miracleplus.com/share_link/17030

Bret Taylor,前 Salesforce 聯合 CEO,他曾創立了一家開發了基於雲端的文字處理器和電子表格應用 Quip 的軟體公司,2016 年以約 7.5億 美元的價格出售給了 Salesforce。 去年,Taylor 加入了 OpenAI 董事會,擔任董事長,並在與 ChatGPT 製造商前董事會的一項協議中,幫助重新任命了被罷免的 CEO Sam Altman。 外媒預計 Taylor 的角色是臨時性的,以便他能夠回到自己的公司。 這家公司名為 Sierra 的 AI 新創公司,由 Bret Taylor 和前Google高管,曾領導Google AR/VR 工作的 Clay Bavor 共同創立,正進行一輪新的融資活動。


從零手搓MoE大模型,大神級教學來了

 

連結:https://news.miracleplus.com/share_link/17031

https://huggingface.co/blog/AviSoori1x/makemoe-from-scratch

傳說中GPT-4的「致勝法寶」-MoE(混合專家)架構,自己也能手搓了! Hugging Face上有一位機器學習大神,分享如何從頭開始建立一套完整的MoE系統。 這個專案被作者叫做MakeMoE,詳細講述了從注意力建構到形成完整MoE模型的過程。 作者介紹,MakeMoE是受到OpenAI創始成員Andrej Karpathy的makemore啟發並以此為基礎編寫的。 makemore是一個針對自然語言處理和機器學習的教學項目,意在幫助學習者理解並實現一些基本模型。 同樣,MakeMoE也是在一步步的建構過程中,幫助學習者更深刻地理解混合專家模式。

1月29日大模型日報合輯

開源PixArt-δ影像產生器:半秒內輸出高解析度AI影像

 

連結:https://news.miracleplus.com/share_link/17010

文章介紹了PixArt-δ,這是由華為諾亞方舟實驗室、大連理工大學、清華大學和Hugging Face的研究人員共同開發的一個先進的文本到圖像合成框架。 PixArt-δ整合了潛在一致性模型(LCM)和ControlNet,顯著提高了推理速度,能在僅0.5秒內產生1024 x 1024像素的高品質影像,速度是其前身PixArt-α的七倍。 此外,PixArt-δ的ControlNet模組特別為基於Transformer的模型設計,使得在文字到影像的擴散模型中可以更精確地控制,同時保持高品質影像生成。 研究者已在Hugging Face上發布了ControlNet版本的PixArt-δ的權重。

© 版权声明

相關文章

暫無評論

暫無評論...