1 月 26 日の Big Model Daily のコレクション

[1 月 26 日の Big Model Daily のコレクション] 何開銘と謝彩寧の解剖学的拡散モデル、新作がリリースされたばかり; マスク氏の人工知能スタートアップ xAI は、OpenAI への挑戦に資金を提供するために世界の投資家から 60 億米ドルを調達しようとしている; OpenAI の公式終了 GPT-4 の修復は面倒になり、複数の新しいモデルがリリースされ、価格は大幅に引き下げられました; マルチモーダルな大型モデル、Ali Tongyi Qianwen は GPT-4V と競合できます; Oracle が生成 AI の流行を開始: 包括的な統合とイノベーションのトレンド
大型モデル×テキスト透かし:清華大学、香港華人、香港科技、UIC、北京郵電大学が共同で大型モデル時代のテキスト透かしの初レビューを発表
リンク: https://news.miracleplus.com/share_link/16853
この記事では、清華大学、香港華人、香港科技、UIC、北京郵電大学が共同でリリースしたビッグモデル時代のテキスト透かしの最初のレビューを紹介し、アルゴリズムのカテゴリーと内容を包括的に説明しています。ビッグモデル時代のテキスト透かし技術の設計、評価角度、指標などの実用化シナリオを検討するとともに、関連研究が直面する現在の課題と将来の開発の方向性について深く議論し、テキスト透かし分野の最先端のトレンドを探ります。
何開明と謝彩寧の解剖学的拡散モデル、新作がリリースされました
リンク: https://news.miracleplus.com/share_link/16854
CV マスターの He Kaiming 氏も拡散モデルに取り組むようになり、最新の論文「拡散モデルの分解と高度に単純化された新しいアーキテクチャ l-DAE (小文字の L) の提案」が arXiv に投稿されました。 そして、それを視覚的自己教師あり学習の分野における何開明の代表作 MAE (Masked Autoencoder) と比較することで、拡散モデルの内部動作原理をよりよく理解することができます。
David Baker が Science に記事を掲載しました: AI 主導のタンパク質設計はバイオセーフティーに準拠する必要があります
リンク: https://news.miracleplus.com/share_link/16855
ワシントン大学のデビッド・ベイカー教授とハーバード大学医学部のジョージ・チャーチ教授は、サイエンス誌最新号に「タンパク質設計とバイオセキュリティの融合」と題した解説を発表した。 この記事では、計算タンパク質設計における人工知能 (AI) の使用と、この技術が引き起こす可能性のあるリスクについて説明します。 著者らは、タンパク質の設計能力と精度の向上における AI の重要性と、設計されたタンパク質の実現における DNA 合成の重要な役割を強調しています。 同時に著者らは、タンパク質設計の安全性を確保するために、すべての合成遺伝子配列と合成データを収集して保存するセキュリティ戦略も提案した。 この記事では、AI によって加速されるタンパク質設計が、地球規模の病原体、神経変性疾患、生態系の劣化などの問題の解決に役立つ可能性があるとも述べています。 そして著者らは、関連するすべてのコミュニティに対し、緊急の社会問題に対処するために急速に進化するこの分野の安全性と最大限の進歩を確保するために、必要なインフラストラクチャに関与し、支援し、人的、組織的、およびガバナンスの要件を定義するよう呼びかけています。
シドニー大学とD24H香港の研究者が、細胞内空間におけるトランスクリプトームデータのセグメンテーションのための自己教師あり学習手法を開発
リンク: https://news.miracleplus.com/share_link/16856
細胞内イメージング トランスクリプトミクス プラットフォームの最近の進歩により、遺伝子発現の高解像度空間マップが得られるようになりましたが、その一方で、細胞を正確に特定して転写産物を割り当てる際に大きな分析上の課題も生じています。 既存の方法では細胞のセグメンテーションを行うのが困難です。 シドニー大学と香港ヘルスケアビッグデータ分析研究所(D24H)の研究者らは、遺伝子発現と細胞形態の関係を空間解析して学習できる、生物学的情報損失関数を備えた自己教師あり深層学習フレームワークであるBIDCellを提案した。 BIDCell は、公的リポジトリからの単一細胞トランスクリプトーム データや細胞形態情報などの細胞型データを統合します。
マスク氏の人工知能スタートアップxAIは、OpenAIへの挑戦に資金として世界中の投資家から60億ドルを求めている
リンク: https://news.miracleplus.com/share_link/16857
マスク氏はxAIに対し、提案されている評価額200億ドルで最大60億ドルを調達したいと考えているが、中東の政府系ファンドにも注目しており、すでに日本と韓国の投資家に連絡を取っていると関係者らは語った。 関係者の1人によると、モルガン・スタンレーは現在、資金調達を調整中だという。
OpenAI が GPT-4 を正式に修正し、怠惰になり、複数の新モデルを発売し、価格を引き下げる
リンク: https://news.miracleplus.com/share_link/16858
昨年末に GPT-4 が「怠惰」になり始めたという事実をまだ覚えているでしょうか。 たとえば、ピーク時間帯に GPT-4 または ChatGPT API を使用すると、応答が非常に遅くておざなりになり、場合によってはユーザーの質問への回答を拒否したり、一方的に会話を中断したりすることがあります。 この状況はプログラマーにとってさらによく知られたものです。「ChatGPT にコードの拡張を依頼したら、実際には自分で書くように求められた。」と不満を言う人もいます。私はもともとコードを書くのに ChatGPT を使いたかったのですが、今ではその方が良くなりました。突然、あなたのために拒否されました。
マルチモーダル大型モデル、Alibaba Tongyi Qianwen は GPT-4V と競合できる
リンク: https://news.miracleplus.com/share_link/16859
2024年には大型モデルの分野で何が展開されるのでしょうか? よくわからない場合は、大手メーカーがどのような方向に賭けているのかを調べてみるとよいでしょう。 最近、OpenAI は GPT-4V を初めてリリースしました。これにより、大規模なモデルに前例のない画像意味理解機能を持たせることができます。 Google もこれに続き、テキスト、コード、オーディオ、画像、ビデオなどのさまざまな種類の情報を一般化してシームレスに理解し、操作し、組み合わせることができる業界初のネイティブ マルチモーダル大規模モデルである Gemini をリリースしました。 GPT-4VとGeminiだけでなく、可能性に満ちたこの方向では、国内の技術力も注目に値する:最近の重要なリリースがアリババから来ており、新しくアップグレードされたTongyi Qianwenビジュアル言語の大型モデルQwen-VL-Maxが先週正式にリリースされた、複数の評価ベンチマークで良好な結果を達成し、強力な画像理解機能を実現しました。
大規模モデルの推論コストランキングはこちら: Jia Yangqing の会社が効率性でリード
リンク: https://news.miracleplus.com/share_link/16860
大規模言語モデル テクノロジーが徐々に実用化されるにつれて、開発者が使用できる大規模モデル API を提案するテクノロジー企業が増えています。 しかし、OpenAI は以前に「1 日あたり 70 万ドルを消費」しており、大規模なモデルに基づくビジネスが維持できるかどうかを疑う理由があります。 最近、AI 企業 Martin がさまざまなモデルの推論コストを注意深く計算してくれました。LeptonAI は、短い入力プロンプトと長い出力プロンプトによる小さなサービス負荷で最高のスループットを提供できます。 130 tks/s の P50 は、どのベンダーのすべてのモデルでも観察された最速のスループットです。
なぜマンバの論文は ICLR に受理されなかったのでしょうか? AIコミュニティが盛り上がっている
リンク: https://news.miracleplus.com/share_link/16861
2023 年、AI 大型モデルの分野における Transformer の優位性は揺るがされるでしょう。 この挑戦を開始した新しいアーキテクチャは「Mamba」と呼ばれ、言語モデリングにおいて Transformer に匹敵する、あるいはそれを上回る選択的状態空間モデルです。 さらに、コンテキストの長さが増加するにつれて線形スケーリングを実現でき、そのパフォーマンスは実際のデータの数百万のトークン長シーケンスまで向上し、推論スループットの 5 倍の増加を達成できます。 リリースから 1 か月以上経ち、Mamba は徐々にその影響力を発揮し、MoE-Mamba、Vision Mamba、VMamba、U-Mamba、MambaByte などの多くのプロジェクトを生み出し、Transformer の欠点を克服する優れたパフォーマンスを示しました。 。 しかし、そのような新進気鋭の「スター」は、2024年のICLR会議でウォータールーに遭遇しました。 最新の公開結果によると、マンバの論文はまだ会議に受理されておらず、「決定保留中」列でのみ確認できます (決定が遅れているか、拒否されている可能性があります)。
オラクルが生成型 AI の流行を開始: 包括的な統合とイノベーションのダイナミクス
リンク: https://news.miracleplus.com/share_link/16862
オラクルは、生成 AI 機能を自社のクラウド インフラストラクチャ (OCI) テクノロジー スタックに統合し、生成 AI サービスとエージェント、およびデータ サイエンス AI クイック アクションを開始しています。 この統合は、生成 AI をクラウド データ センターと顧客データが存在するオンプレミス環境に適用するように設計されています。 OCIは、Llama 2とCohereの組み込みモデルを新たに追加し、柔軟な微調整オプションを提供します。 オラクルは、検索拡張生成エージェントを OpenSearch に導入し、ユーザーが自然言語を使用してエンタープライズ データ セットにアクセスできるようにします。 オラクルは、新しい AI エージェントを発売し、より広範囲のデータ検索および集計ツールをサポートし、OCI Data Science AI Quick Actions を通じて AI モデルのカスタマイズを簡素化する予定です。