Big Model Daily、7 月 29 日

[Big Model Daily、7 月 29 日] ニュース: オリンピックの 8 分間の AI ビデオが話題に: バッハ会長: 中国のブラック テクノロジーのおかげ。
オリンピックの8分間のAIビデオは圏外 バッハ会長「中国のブラックテクノロジーのおかげだ」
https://news.miracleplus.com/share_link/34949
オリンピック期間中、アリババと国際オリンピック委員会が共同制作した、AI技術を活用した短編映画「She Never Fades」が広く注目を集めた。この短編フィルムは、画像の超解像度、カラー化、生成ベースのフレーム充填などの AI テクノロジーを利用して、オリンピックの歴史における女性の重要な役割と功績を紹介しています。記事は、スーザン・レンレン、チャン・シャン、キャサリン・スイスなどの女性アスリートの物語を通して、彼女たちがオリンピックでどのように躍進し、奮闘し、女性スポーツの発展を促進したかを示している。 Alibaba Cloud の AI テクノロジー チームによる歴史的画像の復元作業により、これらの貴重な歴史的瞬間をより鮮明で鮮明な形で現代の視聴者に伝えることが可能になりました。
Llama3.1 トレーニングは平均 3 時間に 1 回失敗し、温度変動は 100 万枚のカード クラスターのスループットに影響します
https://news.miracleplus.com/share_link/34950
Llama 3.1 モデルのトレーニング中、3 時間ごとに障害が発生しました。そのほとんどの障害は、H100 GPU クラスターのハードウェアの問題、特に GPU と HBM3 のメモリ障害に起因していました。効果的なトレーニング時間を改善するために、チームはタスクの起動時間とチェックポイント設定時間を短縮し、PyTorch の NCCL フライト レコーダーなどのツールを使用して迅速な診断と問題解決を実現しました。ハードウェア障害やスループットに影響を与える温度変化などの環境要因の問題にもかかわらず、Llama 3.1 チームは 90% 以上の有効トレーニング時間を維持しました。 Meta は、電力、ネットワーク設計、並列性、信頼性など、大規模 AI クラスターの技術的な課題に直面しています。
NVIDIA Llama 3.1 合成データ テクノロジと RAG システム微調整実践ガイド
https://news.miracleplus.com/share_link/34951
NVIDIA の技術ブログ投稿では、Llama 3.1 405B 大規模言語モデルを使用して合成データを生成し、さまざまな業界にわたって AI モデルのパフォーマンスを向上させる方法について説明しています。合成データは、新しい情報を作成するのではなく、既存の情報を変換することによってさまざまなデータ バリアントを作成します。これは、モデルの精度を向上させるのに役立つプロセスです。この記事では、LLM を使用した知識の蒸留と自己改善の方法、および事前トレーニング、微調整、調整のステップを通じて合成データを適用する方法について詳しく説明します。さらに、LLM によって生成された合成データを RAG パイプラインなどの他のモデルを改善するためにどのように活用できるかについて説明し、ケース スタディでは RAG パイプラインのパフォーマンスを評価するための具体的な方法を示します。
元のリンク: https://developer.nvidia.com/blog/creating-synthetic-data-using-llama-3-1-405b/?ncid=so-twit-933996&linkId=100000275486093
次世代 AI データベース: Infinity バージョン 0.2 がハイブリッド検索とソートの新時代をリード
https://news.miracleplus.com/share_link/34952
Infinity データベース バージョン 0.2 では、スパース ベクトル データ型とテンソル データ型が導入され、マルチウェイ リコールと全文検索、ベクトル検索、テンソル検索のハイブリッド検索機能が実現され、RAG システムの検索品質が大幅に向上しました。この記事では、正確な意味表現の観点から純粋なベクトル検索の限界を強調し、ハイブリッド検索 (全文検索とスパース ベクトル検索の組み合わせ) を通じて検索結果を最適化する方法を紹介します。さらに、この記事では、ColBERT ソート モデルの特性と、Tensor データ型のサポートや非常に長いテキストの処理ソリューションなど、Infinity でエンドツーエンドの ColBERT アプリケーションを実装する方法についても説明します。 MLDR データセットの評価を通じて、Infinity は、特に Elasticsearch と比較して優れたパフォーマンスとソート品質を示しました。
TDCon2024: 時系列ビッグデータの無限の可能性を探る
https://news.miracleplus.com/share_link/34953
AI 時代において時系列データの重要性がますます高まっており、データ量の急増とリアルタイム分析の需要により、従来の処理ツールでは対応できなくなりました。 Taosi Data の創設者である Tao Jianhui 氏は、Taosi Data を設立し、長年の技術研究開発の経験に基づいて、特に時系列ビッグデータ処理の問題をターゲットとした TDengine を開発しました。 2019 年にオープンソース化されて以来、TDengine はすぐに世界中の開発者の注目を集め、複数の業界で広く使用されています。 TDCon2024 カンファレンスでは、業界の専門家やエリートが北京に集まり、企業のデジタル変革を促進する際の時系列データの役割について議論しました。
関連リンク: https://www.zhihu.com/people/jefftao
イスラエルの新たなチップ革命
https://news.miracleplus.com/share_link/34954
イスラエルのチップ産業は、ハイテク産業を経済の柱としており、世界の半導体分野で重要な位置を占めている。地理的および人口統計上の制約にもかかわらず、イスラエルは一人当たりのエンジニア数が世界で最も多く、単位面積当たりのハイテク企業の数が最も多い。イスラエルには半導体産業において深い歴史があるだけでなく、完全な産業生態系チェーンがあり、インテルやNVIDIAなどの世界的なテクノロジー大手が現地に研究開発センターを設立するよう誘致しています。
AI、量子コンピューティング、フォトニックコンピューティングなどの最先端技術の分野で、イスラエルはHailo Technologies、Quantum Transistorsなどの多くの革新的なスタートアップ企業を誕生させ、世界において重要な役割を果たしてきました。チップ業界の新たな革命を促進します。イスラエル政府は教育政策や資本支援を通じて半導体産業に質の高い人材を多数育成し、法的保護や税制優遇などの政策を通じて新興企業の発展を支援し、イスラエル独自の半導体競争力を促進している。業界。これらの措置は、世界の半導体産業におけるイスラエルの主導的地位を確保し、国の技術革新と経済成長を促進するものです。
AIが人間の医師を完全に倒す!この研究では、大規模モデルでの臨床意思決定は性急で安全ではなく、最も低い精度率はわずか 13% であることが判明しました。
https://news.miracleplus.com/share_link/34955
Llama 2、Clinical Camel、Meditron などの大規模言語モデル (LLM) は、医師免許試験では優れたパフォーマンスを発揮しますが、実際の診断では人間の医師よりも精度がはるかに劣ります。この研究では、4 つの一般的な腹部疾患の実際の症例 2,400 件を対象とした MIMIC-IV データベースに基づいて、臨床診断における LLM のパフォーマンス、診断および治療ガイドラインに従うこと、検査結果の解釈、情報の変化に対する堅牢性を評価しました。その結果、LLMの診断精度は73%であるのに対し、医師の精度は89%で、胆嚢炎の診断におけるLLMの精度は13%と低かったことが示されました。さらに、症例にさらに多くの情報が追加されると、LLM の診断精度が低下し、患者の健康にリスクをもたらす検査が推奨される場合があります。この研究では、LLMは診断ガイドラインに従ったり、必要な検査を指示したりする能力が低く、症例を十分に理解せずに性急に診断を下す可能性が高いことも判明した。したがって、この研究では、現在のLLMには広範な医師の臨床監督が必要であると結論付けており、AI専門家が臨床医と協力して臨床実践に適したモデルをさらに開発および最適化することを推奨しています。