7月29日大模型日報

資訊6個月前发布 AIWindVane
318 0
7月29日大模型日報

【7月29日大模型日報】資訊 奧運8分鐘AI影片出圈 巴赫主席:感謝中國黑科技


奧運8分鐘AI影片出圈 巴赫主席:感謝中國黑科技

https://news.miracleplus.com/share_link/34949

奧運期間,一支由阿里巴巴和國際奧委會聯合製作的 AI 技術增強短片《永不失色的她》引起了廣泛關注。該短片利用 AI 技術如影像超解析度、上色和基於生成技術的補幀,展現了女性在奧運歷史中的重要角色和成就。文章透過蘇珊・朗格倫、張山和凱瑟琳・斯威策等女性運動員的故事,展示了她們如何在奧運賽場上突破和​​拼搏,推動了女性運動的發展。阿里雲的 AI 技術團隊在修復歷史影像方面的工作,使得這些珍貴的歷史時刻得以以更清晰、生動的形式呈現給現代觀眾。


Llama3.1訓練平均3小時故障一次,氣溫波動會影響H100萬卡集群吞吐量

 

https://news.miracleplus.com/share_link/34950

Llama 3.1 模型訓練期間,每 3 小時發生一次故障,大多數故障源自於 H100 GPU 叢集的硬體問題,特別是 GPU 和 HBM3 記憶體故障。為了提高有效訓練時間,團隊減少了任務啟動和 checkpointing 時間,並利用 PyTorch 的 NCCL flight recorder 等工具進行快速診斷和問題解決。儘管有硬體故障和環境因素如溫度變化影響吞吐量的問題,Llama 3.1 團隊仍維持了超過 90% 的有效訓練時間。 Meta 正面對大規模 AI 集群的技術挑戰,包括電力、網路設計、並行和可靠性等。


英偉達Llama 3.1合成資料技術與RAG系統微調實務指南

 

https://news.miracleplus.com/share_link/34951

NVIDIA 的技術部落格文章介紹了使用 Llama 3.1 405B 大型語言模型來產生合成數據,以提高不同行業的人工智慧模型效能。合成資料不是創造新訊息,而是透過轉換現有資訊來創建不同的資料變體,這個過程可以幫助模型在準確性上獲得提升。文章詳細說明了使用 LLM 進行知識蒸餾和自我改進的方法,以及如何透過預訓練、微調和對齊步驟來應用合成資料。此外,介紹如何利用 LLM 產生的合成資料來改進其他模型,例如 RAG 管道,並透過一個案例研究展示了評估 RAG 管道性能的具體方法。

原始連結:https://developer.nvidia.com/blog/creating-synthetic-data-using-llama-3-1-405b/?ncid=so-twit-933996&linkId=100000275486093


下一代AI資料庫:Infinity 0.2版引領混合搜尋與排序新紀元

 

https://news.miracleplus.com/share_link/34952

Infinity 資料庫 0.2 版本推出了稀疏向量和張量資料類型,實現了全文搜尋、向量搜尋和張量搜尋的多路召回和混合搜尋功能,大幅提升了 RAG 系統的檢索品質。文章強調了單純向量搜尋在精確語義表達上的局限性,並介紹瞭如何透過混合搜尋(全文搜尋與稀疏向量搜尋結合)來優化搜尋結果。此外,文章還探討了 ColBERT 排序模型的特點,以及如何在 Infinity 中實現端到端的 ColBERT 應用,包括 Tensor 資料類型的支援和對超長文字的處理方案。透過對 MLDR 資料集的評測,Infinity 展現了其在效能和排序品質上的優異表現,特別是在與 Elasticsearch 的對比中,Infinity 表現出卓越的全文搜尋效能。


TDCon2024:探索時序大數據的無限可能

 

https://news.miracleplus.com/share_link/34953

時序資料在 AI 時代的重要性日益凸顯,隨著資料量的激增和對即時分析的需求,傳統處理工具已難以應對。濤思數據創辦人陶建輝先生基於多年技術研發經驗,創辦了濤思數據,並開發了 TDengine,專門針對時序大數據處理問題。自 2019 年開源以來,TDengine 迅速獲得全球開發者的關注,廣泛應用於多個產業。在 TDCon2024 大會上,業界專家和菁英聚集北京,探討時序資料在推動企業數位轉型中所扮演的角色。

相關連結:https://www.zhihu.com/people/jefftao


以色列的晶片新革命

https://news.miracleplus.com/share_link/34954

以色列晶片產業以其高科技產業為經濟支柱,在全球半導體領域佔據了重要地位。儘管地理和人口條件有限,以色列卻擁有全球最高的人均工程師數量和單位面積最多的高新技術企業。以色列不僅有著深厚的半導體產業歷史,還有完整的產業生態鏈,吸引了包括英特爾、英偉達在內的全球科技巨頭在本土建立研發中心。

在 AI、量子運算和光子運算等尖端技術領域,以色列誕生了多家創新的新創公司,如 Hailo Technologies、Quantum Transistors 等,這些公司在推動晶片產業新革命方面發揮了關鍵作用。以色列政府透過教育政策和資本扶持為半導體產業培養了大量高素質人才,並透過法律保護、稅收優惠等政策支持新創企業的發展,促進了以色列在半導體產業中的獨特競爭力。這些措施確保了以色列在全球半導體產業的領先地位,並推動了該國技術創新和經濟成長。


AI完敗於人類醫生!研究發現:大模型臨床決策草率且不安全,最低正確率僅13%

 

https://news.miracleplus.com/share_link/34955

大型語言模型(LLM)如 Llama 2、Clinical Camel 和 Meditron 等,儘管在醫學許可考試中表現優異,但在實際診斷中的準確率遠低於人類醫生。研究基於 MIMIC-IV 資料庫,涉及 4 種常見腹部疾病的 2400 個真實病例,評估了 LLM 在臨床診斷、遵循診斷和治療指南、解釋實驗室結果以及對資訊變化的穩健性等方面的表現。結果顯示,LLM 的診斷準確率為 73%,而醫師的準確率為 89%,在膽囊炎診斷中 LLM 的準確率更是低至 13%。此外,隨著病例資訊的增多,LLM 的診斷準確性反而下降,並且可能會建議對患者健康構成風險的檢查。研究還發現,LLM 在遵循診斷指南和安排必要檢查方面表現不佳,且在沒有充分了解病例的情況下可能會做出草率的診斷。因此,研究認為目前的 LLM 需要大量的醫生臨床監督,並建議 AI 專家與臨床醫生合作,以進一步開發和優化適用於臨床實踐的模型。

© 版权声明

相關文章

暫無評論

暫無評論...