1月18-19日大型モデルデイリーコレクション

51 0 0

【1月18-19日大型モデルデイリーコレクション】 Visual Mamba 登場: 速度は 2.8 倍、メモリは 87% 節約可能、ワンクリックでリアルシーンをアニメーションに変換、清華を拠点とするスタートアップ企業の世界初の 4D スケルトンアニメーションフレームワーク、パーソナライズされたキャラクターを生成可能; Tencent が、光と影の効果を大幅に改善するビデオ生成モデル VideoCrafter2 をリリース

Visual Mamba が登場: 速度が 2.8 倍向上、メモリが 87% 節約可能

リンク: https://news.miracleplus.com/share_link/16215

「総合周囲変圧器」として知られる Mamba は、発売から 2 か月も経たないうちに高性能のビジュアルバージョンをリリースしました。木曜日、華中科技大学、Horizon、知源人工知能研究所などの研究者らがVision Mamba（Vim）を提案した。効果は何ですか? ImageNet 分類タスク、COCO オブジェクト検出タスク、および ADE20k セマンティックセグメンテーションタスクにおいて、Vim は DeiT などの成熟したビジュアル Transformer よりも高いパフォーマンスを達成すると同時に、計算効率とメモリ効率も大幅に向上します。たとえば、解像度 1248×1248 の画像から特徴を抽出するバッチ推論を実行する場合、Vim は DeiT より 2.8 倍高速で、GPU メモリの 86.8% を節約します。結果は、Vim が高解像度画像の Transformer スタイルの理解を実行する際の計算量とメモリの制限を克服でき、ビジョンベースのモデルの次世代のバックボーンとなる大きな可能性を秘めていることを示しています。

ワンクリックでライブシーンをアニメーション化できる、清華を拠点とする新興企業の世界初の 4D スケルトンアニメーションフレームワークで、パーソナライズされたキャラクターも生成できます

リンク: https://news.miracleplus.com/share_link/16216

数日前、Apple は、同社初の仮想ヘッドマウントディスプレイデバイスである Vision Pro が 2 月 2 日に正式にリリースされると発表しました。XR デバイスは、次世代端末として急速な発展が期待されています。今後、仮想表示デバイスの普及に伴い、デジタルインタラクションは2次元から3次元へと移行し、3次元モデルや3次元アニメーションがコンテンツの主流となるでしょう。バーチャルとリアルの融合もトレンドになるでしょう。この最先端の分野に直面して、清華大学の起業家チーム Shengshu Technology は一連の研究と製品開発を実施し、最近、清華大学同済大学と共同で「スケルトンアニメーション」に基づく世界初の 4D アニメーション生成フレームワーク「AnimatableDreamer」を立ち上げました。大学やその他の大学では、ワンクリックで 2D ビデオ素材をダイナミックな 3D モデル (つまり 4D アニメーション) に直接変換でき、骨格の動きの自動抽出、アニメーション効果のワンクリック変換、およびテキスト入力によるパーソナライズされたキャラクター生成をサポートしています。

革新的なタンパク質構造ツールを創薬に活用するにはどうすればよいでしょうか? AlphaFold は数千の幻覚剤の可能性を発見

リンク: https://news.miracleplus.com/share_link/16217

AlphaFold2 (AF2) と RosettaFold は、構造ベースのリガンド発見に利用できる構造の数を大幅に拡大しましたが、この目標におけるそれらの直接の役割には疑問があります。カリフォルニア大学バークレー校の研究チームは、タンパク質構造予測ツールAlphaFoldを使用して、新しい抗うつ薬の開発に役立つ可能性のある数十万の新しいサイケデリック（サイケデリック）分子を特定した。この研究は、ボタンを押すだけで実行できる AlphaFold 予測が、決定するまでに数か月、場合によっては数年もかかる実験的に得られたタンパク質構造と同じくらい創薬に役立つことを示した最初の研究です。

ザッカーバーグ氏、AGIに宣戦布告：ラマ3の訓練中、彼は今年35万H100を買い占め、100億米ドル近くを費やす予定

リンク: https://news.miracleplus.com/share_link/16218

汎用人工知能 (AGI) という野心的な目標を達成するために、ザッカーバーグ氏はメタ社の AI 研究部門の大規模な再編を行っています。木曜日、Meta CEOのマーク・ザッカーバーグ氏は、同社が「汎用知能」と「責任あるオープンソース」の人工知能アシスタントの構築に取り組んでいることを発表した。Metaは、この目標を達成するために、2つの主要な研究グループ(FAIRとGenAI)を統合していると発表した。第三者投資機関の調査によると、メタ向けの Nvidia の H100 出荷台数は 2023 年に 150,000 台に達すると推定されています。この数字は Microsoft への出荷台数と同じであり、他社の出荷台数の少なくとも 3 倍です。ザッカーバーグ氏は、Nvidia A100や他の人工知能チップを含めれば、MetaのGPUコンピューティング能力は2024年末までに約60万台のH100に相当すると述べた。

スループットが5倍に向上バックエンドシステムとフロントエンド言語を共同設計するためのLLMインターフェースが登場。

リンク: https://news.miracleplus.com/share_link/16219

大規模言語モデル (LLM) は、複数のチェーンされたビルド呼び出し、高度なプロンプト技術、制御フロー、および外部環境との対話を必要とする複雑なタスクにますます使用されています。しかし、これらのアプリケーションをプログラミングして実行するための既存の効率的なシステムには、重大な欠点があります。現在、オープンソースコミュニティの研究者は、LLM 用の構造化生成言語 (SGLang) を提案しています。 SGLang は、バックエンドランタイムシステムとフロントエンド言語を共同設計することで、LLM との対話を強化し、LLM をより高速かつ制御しやすくします。機械学習の分野で著名な学者であり、CMU 助教授である Chen Tianqi 氏も、この研究を推進しました。

ByteDance や Tencent などの大手メーカーとの競争を心配する必要はありません Insilicon の CEO、Alex Zhavoronkov 氏が AI 創薬について語る

リンク: https://news.miracleplus.com/share_link/16220

人工知能はバイオ医薬品でますます使用されており、発見デバイスを超えた用途に使用されています。これは、2024年1月8日から11日までサンフランシスコで開催される第42回JPモルガン・ヘルスケア・カンファレンスで話題となる。イーライリリーとノバルティスは、カンファレンスの開始と同時に、アルファベットのIsomorphic Labsとの数百万ドル規模の発見契約を発表した。人工知能の熱狂のさなか、海外メディアはインシリコ・メディシン社CEOのアレックス・ザボロンコフ氏との対談を行った。昨年の夏、同社は生成人工知能を使用して開発された治療法の第 II 相臨床試験に初めて参加した。ザボロンコフ氏は、業界におけるAIの役割と、インシリコがいつ製品を市場に投入するかについて語った。この夏、米国と中国で肺疾患の特発性肺線維症の治療法を試験する第II相試験に加え、インシリコは今月、新たな医薬品の商業化に向けてメナリニ・グループとライセンス契約を結んだばかりだ。

Tencent、光と影の効果を大幅に改善するビデオ生成モデル VideoCrafter2 をリリース

リンク: https://news.miracleplus.com/share_link/16221

Tencent は、ビデオ生成モデル VideoCrafter のアップグレード版である VideoCrafter 2 の発売を発表しました。これは、光と影の効果などの面で大幅な改善が施されています。 VideoCrafter 2 は、ユーザーが指定したテキストに基づいて数秒間の高品質ビデオを生成できます。新しいバージョンは、以前のバージョンと比較して、画質、キャラクターの動きなどの点で大幅に向上し、生成されるビデオコンテンツはよりリアルになりました。