12月29日大模型日報

情報1数年前 (2024)发布 AIWindVane
56 0
12月29日大模型日報

【12月29日大模型日報】NeRF監修に拡散モデルを使用、清華ヴィンセント3D新方式が新SOTAとなる


ディープネットワークデータエンコーディングの新たなブレークスルー、上海交通大学SPARKがトップコンピュータアーキテクチャカンファレンスに出席

 

リンク: https://news.miracleplus.com/share_link/14595

ディープ ニューラル ネットワーク (DNN) モデルのサイズと複雑さが急速に増大するにつれ、従来のニューラル ネットワーク処理方法は深刻な課題に直面しています。 既存のニューラル ネットワーク圧縮テクノロジは、パラメーターのスケールが大きく、精度の要件が高いニューラル ネットワーク モデルを処理する場合には非効率であり、既存のアプリケーションのニーズを満たすことができません。 数値量子化は、ニューラル ネットワーク モデルを圧縮する効果的な手段です。 モデル推論プロセス中に、低幅 (ビット) データにアクセスして計算することで、ストレージ スペース、メモリ アクセス帯域幅、およびコンピューティング負荷を大幅に節約でき、それによって推論のレイテンシとエネルギー消費が削減されます。 現在、ほとんどの量子化技術のビット幅は 8 ビットです。 より根本的な量子化アルゴリズムでは、実際の推論で理論上の利点に近い利益を得るために、ハードウェアの動作粒度とデータ フロー特性を変更する必要があります。 混合精度量子化、アクティベーションデータ量子化、その他のソリューションなど。 一方で、これらのソリューションでは、ストレージの記録管理のオーバーヘッドとハードウェア ロジックが明らかに増加し、実際の利点が減少します [1、2、3]。 一方、一部のソリューションでは、分散特性を使用して量子化範囲と粒度を制限し、上記のハードウェア オーバーヘッドを削減します [4、5]。 ただし、精度の低下はさまざまなモデルやパラメータ分布の影響を受けるため、既存のアプリケーションのニーズを満たすことができません。 この目的を達成するために、この記事の研究者らは、スケーラブルな細粒度混合精度コーディングのためのソフトウェアとハ​​ードウェアの共同設計である SPARK テクノロジーを提案しました。

12月29日大模型日報

NeRFを監視するために拡散モデルを使用、清華ヴィンセント3D新方式が新SOTAとなる

 

リンク: https://news.miracleplus.com/share_link/14596

テキストを使用して3Dグラフィックを合成するAIモデルに新しいSOTAが登場! 最近、清華大学のLiu Yongjin教授の研究グループは、拡散モデルに基づいて3D画像を作成する新しい方法を提案しました。 異なる視野角間の一貫性とプロンプトワードとの一致性の両方が、以前に比べて大幅に向上しました。 Vincent 3D は 3D AIGC の注目の研究コンテンツであり、学界や産業界から幅広い注目を集めています。 Liu Yongjin 教授の研究グループによって提案された新しいモデルは TICD (Text-Image Conditioned Diffusion) と呼ばれ、T3Bench データセットの SOTA レベルに達しています。 現在、関連する論文が公開されており、コードは間もなくオープンソースになる予定です。

12月29日大模型日報

上海交通大学と中山大学のチームは、ESMFold、事前トレーニング済み言語モデル、Graph Transformer を使用してタンパク質結合部位を予測しました。

 

リンク: https://news.miracleplus.com/share_link/14597

タンパク質、ペプチド、その他の生物学的成分の結合部位など、タンパク質上の機能部位を特定することは、関連する生物学的プロセスや医薬品設計を理解するために重要です。 ただし、既存の配列ベースの方法では、配列に隣接する文脈上の特徴のみが考慮され、構造情報が欠如しているため、予測精度が限られています。 上海交通大学と中山大学の研究者は、タンパク質の構造と配列情報を使用してタンパク質結合部位を特定する DeepProSite を提案しました。 DeepProSite は、まず ESMFold からタンパク質構造を生成し、事前トレーニングされた言語モデルから配列表現を生成します。 次に、Graph Transformer を使用して、結合部位の予測をグラフ ノードの分類に定式化します。 DeepProSite は、タンパク質間タンパク質/ペプチド結合部位を予測する場合、ほとんどの指標において現在の配列ベースおよび構造ベースの方法よりも優れた性能を発揮します。 さらに、DeepProSite は、構造ベースの予測方法と比較して、非結合構造を予測するときに高いパフォーマンスを維持します。 DeepProSite は、核酸やその他のリガンドの結合部位の予測にも拡張でき、その一般化機能を検証します。

12月29日大模型日報
© 版权声明

関連記事

コメントなし

コメントはありません…