11月3日大模型日報

資訊1年前 (2023)发布 AIWindVane
573 0
11月3日大模型日報

【11月3日大模型日報】Gen-2顛覆AI生成影片! 一句話秒出4K高清大片,網友:徹底改變遊戲規則;Midjourney大更新:開放自訂風格新功能;馬斯克𝕏AI首批產品曝光! 「提示詞工作站」來了,本人現身評論區;6 億打工人一夜換裝備! 釘釘 AI 全面開放測驗


Gen-2顛覆AI生成影片! 一句話秒出4K高清大片,網友:徹底改變遊戲規則

https://news.miracleplus.com/share_link/11404

這,絕對稱得上是生成式AI進程中的里程碑。 就在深夜,Runway家標誌性的AI視頻生成工具Gen-2,迎來了“iPhone時刻”般的史詩般更新——依舊是簡單一句話輸入,不過這一次,視頻效果一口氣拉到了4K超 逼真的高度! 不難看出,這次AI生成影片的效果已經克服了以往「一眼AI」的缺點,即不連貫、閃爍變形以及低清等等。 而這也正是Gen-2這次史詩級更新的內容重點:在文生影片和圖生影片中,為結果的保真度和一致性帶來了重大改進。


Midjourney大更新:開放自訂風格新功能!

https://news.miracleplus.com/share_link/11405

Midjourney大更新,被評價為再次「改變遊戲規則」——新增Style tuner功能,用戶可以定製圖像風格了。 客製化的風格被壓縮成一行程式碼,只要在prompt最後貼上這行程式碼,就能讓產生的圖保持客製化風格。 另外,自訂的風格程式碼還可以共享,網友認為以後風格共享都能取代提示共享了。


馬斯克𝕏AI首批產品曝光! 「提示詞工作站」來了,本人現身評論區

https://news.miracleplus.com/share_link/11406

馬斯克𝕏AI團隊的首批產品資訊曝光:Grok,與AI資訊檢索相關;PromptIDE,字面理解是「提示詞工作站/整合開發環境」。 爆料來自推特部落客@Asuna Gilfoyle – e/acc,他發現𝕏AI已提交這兩個商標申請。 可信度或許不低,因為馬斯克在留言區冒泡了,沒有否認。 關於這倆產品的更多資訊還無從知曉,我們目前只能從爆料資訊中的商標描述「揣摩」。 Grok和PromptIDE用的是同一個商標號,因此具體描述寫的也都一樣。 它們將用於:

– 提供不可下載的線上軟體,用於手動製作資訊、處理/產生/理解和分析資訊;

– AI領域的研發服務;

– 電腦程式和軟體的研究、設計和開發;

– 提供一個以AI領域資訊為特色的網站;

– 利用全球電腦網路擷取和檢索資訊和進行資料探勘;

– 以及創建與全球電腦網路相關的資訊索引


6 億打工人一夜換裝備! 釘釘 AI 全面開放測試

https://news.miracleplus.com/share_link/11407

釘釘魔法棒邀測以來,已經有超過 50 萬家企業啟用,運用 AI 輔助工作。 今天,釘釘 AI 魔法棒正式上線了,釘釘聊天、文件、知識庫、腦圖、閃記、Teambition 等 17 項產品、60+ 場景全面開放測試。 所有使用者打開釘釘,就可以在首頁右上角的「魔法棒」入口內,或是點擊各產品頁面的魔法棒按鈕使用釘釘 AI。


LeCun、吳恩達等370多人簽聯名信:嚴格控制AI是危險的,開放才是解藥

https://news.miracleplus.com/share_link/11408

近幾日,關於如何監督 AI 的討論越來越熱烈,各位大佬們意見非常不統一。 例如圖靈獎三巨頭 Geoffrey Hinton、Yoshua Bengio、Yann LeCun 就出現了兩種觀點。 Hinton、Bengio 為一隊,他們強烈呼籲加強對 AI 的監管,否則可能引發「AI 滅絕人類」的風險。 LeCun 與他們的觀點並不相同,他認為 AI 強監管必將帶來巨頭壟斷,結果是只有少數公司控制 AI 的研發。 為了表達自己的想法,許多人以簽署聯名信的方式來傳達觀點,就拿剛剛過去的幾天來說,Bengio、Hinton 等再發聯名信《在快速發展的時代管理人工智慧風險》,呼籲在 在開發AI 系統之前,研究者應該採取緊急治理措施。 與此同時,近日一封名為《人工智慧安全和開放的聯合聲明》的公開信正在社群媒體發酵。


程式碼能力超越GPT-4,這個模型登頂Big Code排行榜,YC創辦人按讚

https://news.miracleplus.com/share_link/11409

一款號稱程式碼能力超越GPT-4的模型,引發了不少網友的注意。 準確率比GPT-4高出超過10%,速度卻接近GPT-3.5,而且視窗長度也更長。 據開發者描述,他們的模型取得了74.7%的Pass@1通過率,超過了原始GPT-4的67%,登上了Big Code榜首。 這個模型名叫Phind,和以其為基礎的開發者導向的AI搜尋工具同名。 它是由開發團隊在CodeLlama-34B的基礎之上微調得到的。 Phind利用TensorRT-LLM在H100上可以跑出每秒100個token的速度,是GPT-4的5倍。 此外,Phind的上下文長度達到了16k,其中12k可供使用者輸入,另外4k保留給檢索結果中的文字。


北大團隊搞定ChatGPT都頭痛的演算法優化,一般筆電就能跑

https://news.miracleplus.com/share_link/11410

連ChatGPT看了都直搖頭的演算法優化,被北大團隊搞定了。 測試表明,新研究能解驗證集中90%的題目,包括NOIP、Codeforce、Leetcode等競賽中的分治和動態規劃題目——這些題目,許多大模型也難以解決。 而且自家的普通筆電就能跑! 畢竟演算法優化這塊,是大模型乃至整個AI的能力盲點。 即使是Nature刊發過的DeepMind AlphaTensor,為程式合成領域帶來一些震撼不假,但實際作用對業內專業人士來說,「還是不夠」。 所以,AI無法橫掃到的這個領域,演算法優化該咋提速提效? 北大一支團隊,採取程式演算和程式枚舉結合的辦法,做出了兩套演算法最佳化軟體。 一套可以搞定分治、平行化、增量計算、線段樹等演算法的最佳化,另一套則支援動態規劃演算法的最佳化。


剛剛,披頭四發布“最後一首”新歌,背後是AI製作

https://news.miracleplus.com/share_link/11411

熟悉音樂的朋友們,肯定不會對披頭四(The Beatles)感到陌生,他們被廣泛認為是史上最偉大、最有影響力的搖滾樂隊,也是現代搖滾樂的開端。 披頭四成立於 1960 年,四位成員分別是約翰・列儂、林哥・斯塔爾、保羅・麥卡尼和喬治・哈里森。 1963 年,樂團發行首張音樂專輯《Please Please Me》,1969 年的《Abbey Road》被認為是他們最好的作品。 1970 年,樂團宣布解散。 如我們所知,樂團兩位成員約翰・列儂、喬治・哈里森已經先後於 1980 年、2001 年去世。 如今,《Now and Then》終於與全球喜愛披頭四音樂的樂迷見面。 在這首歌曲的製作過程中,AI 發揮了重要作用。 林哥・斯塔爾和保羅・麥卡尼利用機器學習以及其他 AI 技術將約翰・列儂的原始保真錄音拼湊起來並有了最終的成品曲目。


讓LLM從「錯題」學習,推理能力顯著提升

https://news.miracleplus.com/share_link/11412

這段時間,大語言模型在各種 NLP 任務中取得了重大進展,尤其是在需要複雜的思維鏈(CoT)推理的數學問題方面。 例如在 GSM8K、MATH 這樣的高難度數學任務的資料集中,包括 GPT-4 和 PaLM-2 在內的專有模型已取得顯著成果。 在這方面,開源大模型還有相當的提升空間。 為了進一步提高開源大模型處理數學任務的CoT 推理能力,一個常見的方法是使用註釋/ 生成的問題- 推理數據對( CoT 數據)對這些模型進行微調,這些數據對會直接教導模型如何在這些 任務中執行CoT 推理。 在最近的一篇論文,來自西安交大、微軟、北大的研究者嘗試探討了另一種提升思路:是否可以透過逆向學習過程(即從 LLM 犯過的錯誤中學習)進一步提高其推理能力? 就像是剛開始學習數學的學生,首先會從書本上的知識點和例題中學習,但也會進行練習。 解題失敗後,他便知道自己犯了什麼錯誤、如何改正,形成一個「錯題本」。 正是透過從錯誤中學習,推理能力得到了進一步提高。 受這個過程的啟發,這項工作探討了 LLM 的推理能力如何從理解和糾正錯誤中受益。


中國等28個國家發布《布萊切利宣言》,鼓勵AI以安全方式發展

https://news.miracleplus.com/share_link/11413

英國時間11月1日,中國、美國、英國、法國、德國等28個國家和歐盟,在英國的布萊切利莊園簽署了,首個全球人工智慧(AI)聲明-《布萊切 利宣言》。 該宣言明確指出了AI對人類社會的巨大機遇,但AI需要以人為本、可信賴、負責任的方式設計和使用造福全人類。 特別指出了「前沿」AI可能帶來的風險,例如,ChatGPT、Bard、Midjourney等大語言模型以及其他「超」能力的狹義AI。 這類系統的能力難以預測,可能被誤用或失控。 所以,呼籲國際社會通力合作,在現有的國際論壇下制定政策和法規來提升透明度、問責制,並加強對這類前沿AI的科學研究與風險評估,以安全、健康、可靠的方式發展 和應用AI。


大模型上手機,拉開 AI 改變世界的大幕

https://news.miracleplus.com/share_link/11414

打開相機介面,示範人員拍攝了一張眼前風景的圖片。 在相簿中,找到這張圖片,選擇「擴充」功能,結果原本照片沒有拍到的外圍部分,被神奇地「擴充」到了外圍。 另一邊,一台手機彷彿是用來給參觀者自拍的,進入到它的前置鏡頭區域,你會發現,畫面中人物影像的背景被即時替換了,即便自拍者不斷動作,虛擬背景也沒有 穿幫,幾乎感受不到延遲。 而如果稍微仔細一些,你會發現這些用來展示的手機全部開啟了飛航模式——也就是說,上述這些複雜功能,全部跑在手機本地晶片上。 這是2023 高通驍龍峰會的Demo 體驗館,而上述手機演示的AI 功能,全部仰仗於機器內部、剛剛在會上曝光的驍龍8 Gen 3(第三代驍龍8)處理器晶片的算 力。 在AI 大模型火爆的當下,高通在今年的發布會上發布的兩款新品,驍龍X Elite 和驍龍8 Gen 3 晶片,分別在PC 和智慧型手機代表的行動裝置上,實現了百億參數 大模型的本地運行,讓生成式AI 的神奇能力,成為行動裝置的「內建功能」。 在「雲端 AI」之外,借助晶片的高速發展,「終端 AI」已經實現,而二者協同的「混合 AI」的時代,可能已經到來。

© 版权声明

相關文章

暫無評論

暫無評論...