11 月 22 日の Big Model Daily

[11 月 22 日の Big Model Daily] ニュース Anthropic が Claude 2.1 を導入
Anthropic が Claude 2.1 をもたらす
https://news.miracleplus.com/share_link/11905
Anthropic: 「当社の最新モデルである Claude 2.1 は、コンソールの API 経由で利用できるようになり、Claude AI チャット エクスペリエンスを強化します。Claude 2.1 は、業界をリードする 200K トークン コンテキスト ウィンドウ、モデルの幻覚の大幅な減少など、企業向けに重要な機能の改善を提供します。料金、システム プロンプト、および新しいベータ機能: ツールの使用状況です。また、モデル全体でお客様のコスト効率を向上させるために、価格も更新しています。」
安定したビデオ拡散が登場、コードウェイトはオンラインに
https://news.miracleplus.com/share_link/11906
AI描画で有名なStability AIが、ついにAI生成動画業界に参入した。 今週の火曜日に、Stable Diffusion に基づくビデオ生成モデルである Stable Video Diffusion が発表され、AI コミュニティはすぐにそれについて議論し始めました。 オリジナルの静止画をもとに数秒の動画を生成できるようになりました。
Stability AI の独自の Stable Diffusion グラフ モデルに基づいた Stable Video Diffusion は、オープンソースまたは商用ランクの数少ないビデオ生成モデルの 1 つになりました。
購読ユーザー向けの新しい特典 (月額料金: 16 ドル)、X (Twitter) が Grok AI エクスペリエンスを試すよう招待しました。
https://news.miracleplus.com/share_link/11907
情報源 @nima_owji が明らかにしたところによると、X (Twitter) は現在、X アプリケーションで新しい Grok AI チャット エクスペリエンスを体験するよう一部のユーザーを招待しています。 招待されたユーザーは、X アプリケーションの左側の入り口をクリックして入ることができます。公開されたスクリーンショットから判断すると、Grok AI チャット インターフェイスは非常にシンプルです。 招待されたユーザーが Premium + サブスクリプションを購入していない場合は、「Get Grok with Premium+」というプロンプトがポップアップ表示され、ユーザーに月額 16 ドルの Premium + サブスクリプションを購入するよう推奨されます。
Microsoftは12月1日に中国の企業および教育ユーザー向けにWindows Copilotを発売する
https://news.miracleplus.com/share_link/11908
Microsoftが発表したニュースによると、Microsoftは2023年12月1日に中国本土の企業や教育機関向けにWeb AIチャット機能Copilot(旧Bing Chat Enterprise)を開始する予定だ。 企業および教育機関は、Windows Copilot、Bing Chat Enterprise、および Microsoft Edge の Copilot を使用でき、AI モデルはインターネットからのデータ取得をサポートします。
Pinduoduo が大型模型業界に参入
https://news.miracleplus.com/share_link/11909
Pinduoduo は上海に数十人からなる大規模なモデル チームを設立しました。 大規模モデル チームは、Pinduoduo の顧客サービス、対話、その他のシナリオにおける大規模モデルの適用を検討し、越境電子商取引プラットフォーム TEMU インテリジェントな顧客サービス、検索、推奨、その他のビジネス シナリオに拡張します。 現在、プロセス全体はまだ研究開発段階にあります。 業界アナリストは、Pinduoduo の大規模モデルは、AI ショッピング ガイドや製品画像のインテリジェントな生成などの電子商取引システムに役立つと考えています。
Nvidia が Roche Pharmaceuticals と提携して AI プラットフォームを開発
https://news.miracleplus.com/share_link/11910
NVIDIA は、Roche Pharmaceuticals の子会社である Genentech と協力して、創薬と開発を加速するための AI プラットフォームの研究を実施すると発表しました。 どちらも NVIDIA DGX Cloud 上に AI モデルを構築します。
PyTorch チームは「すべてを分割」モデルを書き直しました。これは元の実装より 8 倍高速です
https://news.miracleplus.com/share_link/11911
生成 AI は年初から急速に発展しました。 しかし、多くの場合、特に PyTorch を使用する場合、生成 AI のトレーニングや推論などをどのように高速化するかという難しい問題に直面しなければなりません。 この記事では、PyTorch チームの研究者が解決策を提供します。 この記事では、純粋なネイティブ PyTorch を使用して生成 AI モデルを高速化する方法に焦点を当てており、PyTorch の新しい機能とそれらを組み合わせる方法の実践例も紹介しています。 結果はどうなりましたか? PyTorch チームは、Meta の「Split Everything」(SAM) モデルを書き直した結果、精度を損なうことなく元の実装よりも 8 倍高速なコードが得られ、すべてネイティブ PyTorch を使用して最適化されたと述べました。
香港バプテスト大学は深い催眠術を使って LLM の「脱獄」を誘導し、信頼できる大規模言語モデルを最初に探索
https://news.miracleplus.com/share_link/11912
LLM (Large Language Model) はさまざまなアプリケーションで大きな成功を収めていますが、一部のプロンプトの誘導にも影響を受けやすく、そのためモデルに組み込まれている安全保護を克服して、危険または違法なコンテンツ、つまりジェイルブレイクを提供します。 このタイプのジェイルブレイクの原理を深く理解し、関連する研究を強化することで、逆に大規模モデルのセキュリティ保護に対する人々の関心を促進し、大規模モデルの防御メカニズムを改善することができます。 脱獄可能なプロンプトを生成するための検索最適化や計算コストのかかる推論方法のこれまでの使用とは異なり、この記事はミルグラム実験に触発されており、心理学の観点から軽量な脱獄方法である DeepInception を提案しています。Deep Hypnosis LLM は脱獄可能にし、それを可能にします。組み込みのセキュリティ保護を単独で回避します。
500 以上のスタディと 50 以上のモデルをカバーする、大規模なコード モデルのレビューはここにあります。
https://news.miracleplus.com/share_link/11913
言語モデリングは、BERT や GPT などの事前トレーニング済みトランスフォーマーの出現により、近年大幅に進歩しました。 大規模言語モデル (LLM) が数千万のパラメータにスケールアップするにつれて、LLM は一般的な人工知能の兆候を示し始めており、そのアプリケーションはもはやテキスト処理に限定されません。 Codex は、コード処理における LLM の優れた機能を初めて実証し、その後、GitHub Copilot などの商用製品や、StarCoder や Code LLaMA などのオープン ソース コード モデルが登場しました。 ただし、コード処理に事前トレーニング済み Transformer を使用することは、デコーダのみの自己回帰モデルが主流になる前に遡り、この分野ではまだ完全なレビューはありません。 上海交通大学とアント・グループの研究チームがこのギャップを埋めた。 これらは、50 を超えるモデル、30 を超える下流タスク、および 500 を超える関連研究結果をカバーする、コードの言語モデルの概要を提供します。 彼らは、コード言語モデルを、一般的なドメインでトレーニングされた巨大なモデルから、コード理解または生成タスク専用にトレーニングされた小さなモデルまで分類します。