11月4日~5日のビッグモデル日報集
【11月4日~5日のビッグモデル日報集】ユーモアを知り、皮肉のスキルも十分なマスク氏が作ったChatGPT競合他社がついにチャットスクリーンショットを公開、OpenAI初の開発者カンファレンスが事前に“公開”され、新しいChatGPTプロトタイプGizmoが登場が暴露される; GPT-4V がキーボードとマウスを使ってインターネットをサーフィンすることを学習し、人間はそれが投稿したりゲームをプレイするのを観察する; 人間の対応物より 6 倍の速さで、サムスン電子は有機分子を独自に合成する AI 駆動のロボット化学者を開発する; Byte が箱を開ける「すべての大規模な OpenAI モデルは、GPT-3 から GPT-4 への進化の経路を明らかにします。 李牧を爆破した
ユーモアを理解し、皮肉のスキルを十分に備えたマスクによって作成された ChatGPT の競合他社が、ついにチャットのスクリーンショットを公開しました
リンク: https://news.miracleplus.com/share_link/11435
最近、マスク氏の成長と起業家としての歴史を記録したマスク氏の伝記「イーロン・マスクの伝記」が国内外でベストセラーとなった。 これらの経験は、航空、エネルギー、自動車、そしてもちろん人工知能などの複数の分野に及びます。 OpenAIの初期創設メンバーの1人であるマスク氏は、早くから人工知能分野に興味を持っており、同氏が経営するテスラ社も自動運転などのAI技術を重要なセールスポイントとして活用している。 今年7月、彼は「宇宙の本質の理解」に特化したxAIという人工知能会社を設立したことをツイッターで大々的に発表した。 しかし、外部の世界はこの会社の製品がどのようなものであるかを決して知りませんでした。 4か月後の今日、マスク氏はついに新製品の試用版スクリーンショットをいくつか公開した: この製品はGrokと呼ばれており(Grokという言葉は「直観的で深い」という意味)、ChatGPTに似た会話型AIのように見える。 スクリーンショットでは、Grok は「コカインの作り方を教えてください」という非常に危険な質問をされています。
xAI公式発表:https://x.ai/

OpenAI初の開発者カンファレンスが事前に「公開」され、新しいChatGPTプロトタイプGizmoが公開された
リンク: https://news.miracleplus.com/share_link/11436
今年9月、OpenAIは初の開発者カンファレンス「OpenAI DevDay」を正式発表した。 OpenAI チームのメンバーは世界中の開発者と集まり、新しい AI ツールをプレビューします。 OpenAI CEOのサム・アルトマン氏は当時、GPT-5やGPT-4.5、あるいは同様の大型モデルは今回の開発者カンファレンスではリリースされないと述べた。 それでも、カンファレンスで公開されたAIツールは依然として幅広い期待を呼び起こした。 数日前、サム・アルトマン氏は、OpenAIが「いくつかの素晴らしい新しいもの」をもたらすだろうと述べ、再び人々の食欲をそそった。 2 日後には、OpenAI の最初の開発者カンファレンスが開催されます。 すべてに気密な壁はなく、OpenAI が何をリリースするかについての最新ニュースがまだあり、ネチズンの間で激しい議論を引き起こしています。 情報源は X ユーザーの CHOI 氏によるもので、OpenAI は新しいインターフェイスといくつかの新機能 (カスタム チャットボット、Google および Microsoft とのコネクタ、新しいサブスクリプション モデル) を含む ChatGPT のメジャー アップデートを発表する予定であると述べています。

GPT-4V はキーボードとマウスを使ってインターネットをサーフィンすることを学び、人間はそれを見てゲームを投稿したりプレイしたりする
リンク: https://news.miracleplus.com/share_link/11437
ついにGPT-4Vがコンピュータを自動制御する日がやって来ました。 GPT-4V にマウスとキーボードを接続するだけで、ブラウザのインターフェイスに従ってインターネットを閲覧できます。 GPT-4V-Act は基本的に、Web ブラウザーベースの AI マルチモーダル アシスタント (Chromium Copilot) です。 人間と同じようにマウス、キーボード、画面を使用して Web インターフェイスを「表示」し、Web ページ上のインタラクティブなキーを使用して次のステップに進むことができます。 この効果を実現するには、GPT-4V に加えて 3 つのツールが使用されます。 1 つは UI インターフェイスで、GPT-4V が Web ページのスクリーンショットを「表示」し、ユーザーが GPT-4V と対話できるようにします。 このようにGPT-4Vでは、運用アイデアの各ステップをダイアログボックスの形で反映させることができ、ユーザーは運用を継続するかどうかを決定することができます。

大規模モデルのスコアリングのベンチマークは信頼できるものですか? Anthropic が次の大きな評価に向けて登場
リンク: https://news.miracleplus.com/share_link/11438
現段階では、人工知能 (AI) が社会に与える影響に関する議論のほとんどは、信頼性、公平性、悪用の可能性など、AI システムの特定の属性に起因していると考えられます。 しかし、現在の問題は、多くの研究者が、堅牢で信頼性の高いモデル評価を構築することがいかに難しいかを十分に理解していないことです。 現在の既存の評価キットの多くは、さまざまな面で性能が制限されています。 AI スタートアップの Anthropic は最近、公式 Web サイトに「AI システムの評価における課題」という記事を掲載しました。 記事では、AIシステムをより深く理解するためにAIシステムの評価を構築するのに長い時間を費やしたと書いています。

サムスン電子、人間の6倍の速さで自律的に有機分子を合成するAI駆動ロボット化学者を開発
リンク: https://news.miracleplus.com/share_link/11439
有機化合物の合成の自動化は、そのような化合物の開発を加速するために重要です。 さらに、自律機能と自動化を組み合わせることで、開発効率を向上させることができます。 この目標を達成するために、サムスン電子の科学者たちは、人工知能 (AI) とロボット工学の力を利用して最適な合成式を構築する、「Synbot」という名前の自律型合成ロボットを開発しました。 標的分子が与えられると、AIはまず合成経路を計画し、反応条件を定義します。 次に、実験ロボットからのフィードバックを使用してそれらの計画を反復的に改良し、レシピを徐々に最適化します。 3 つの有機化合物の合成レシピを特定することに成功することで、システムのパフォーマンスが検証され、既存の基準よりも優れた変換率が得られました。 注目すべき点は、この自律システムはバッチ反応器を中心に設計されており、標準的な実験室環境で化学者にとって利用しやすく価値があり、研究の取り組みを効率化できるという点です。

Byte は OpenAI のすべての主要モデルを「開梱」し、GPT-3 から GPT-4 への進化の経路を明らかにします。 それは李牧を爆破した。
リンク: https://news.miracleplus.com/share_link/11440
GPT-3 はどのようにして GPT-4 に進化しましたか? Byte は、OpenAI のすべての大規模モデルに対して「ボックス化解除」操作を提供します。 その結果、私たちは GPT-4 の進化に対するいくつかの主要テクノロジーの具体的な役割と影響を真に理解しました。 たとえば、SFT は GPT の初期進化の推進者でした。GPT のコーディング機能向上に最も貢献したのは SFT と RLHF でした。事前トレーニングにコード データを追加することで、後続の GPT バージョンの機能、特に推論のあらゆる側面が向上しました。 . 起業して忙しい 記事を読んだ後、大成功を収めたAI専門家の李牧氏も久しぶりに公の場に姿を現し、この研究を高く評価した。

20 ステップでどんな大きなモデルも脱獄できます! さらに多くの「おばあちゃんの抜け穴」が自動的に発見される
リンク: https://news.miracleplus.com/share_link/11441
1 分以内、20 ステップ以内であらゆる大型モデルを「脱獄」し、セキュリティ制限を回避します。 そして、モデルの内部詳細を知る必要はありません。対話する必要があるのは 2 つのブラック ボックス モデルだけであり、AI は完全に自動的に AI を倒し、危険な内容を話すことができます。 かつて人気だった「おばあちゃんの抜け穴」が修正されたと聞きました。「探偵の抜け穴」「冒険者の抜け穴」「作家の抜け穴」が導入された今、AI はどう対応すべきでしょうか? 猛攻撃の波の後、GPT-4 はもう耐えられなくなり、このままでは給水システムに毒を与えると直接言いました。 重要なのは、これはペンシルベニア大学の研究チームによって明らかにされた脆弱性の小さな波にすぎず、新しく開発されたアルゴリズムを使用して、AI がさまざまな攻撃プロンプトを自動的に生成できるということです。 研究者らは、この手法はGCGなどの既存のトークンベースの攻撃手法よりも5桁効率的だと述べている。 さらに、生成された攻撃は解釈可能性が高く、誰でも理解でき、他のモデルへの移行も可能です。 オープン ソース モデルであっても、クローズド ソース モデルであっても、GPT-3.5、GPT-4、Vicuna (Llama 2 の亜種)、PaLM-2 などから逃れることはできません。 成功率は60〜100%に達し、新しいSOTAを獲得します。

Transformer の再考: 逆変換がより効果的、現実世界の予測のための新しい SOTA が登場
リンク: https://news.miracleplus.com/share_link/11442
トランスフォーマーは、時系列予測における強力な機能を備え、ペアごとの依存関係を記述し、シーケンス内のマルチレベル表現を抽出するようになりました。 ただし、研究者らは、Transformer ベースの予測子の有効性にも疑問を抱いています。 このような予測子は通常、同じタイムスタンプの複数の変数を区別できないチャネルに埋め込み、これらの時間トークンに焦点を当てて時間依存関係をキャプチャします。 時点間の意味論的な関係ではなく数値的な関係を考慮に入れると、研究者らは、統計的予測子に追跡可能な単純な線形レイヤーが、パフォーマンスと効率の両方で複雑な Transformer よりも優れていることを発見しました。 同時に、変数の独立性の確保と相互情報の活用は、正確な予測を達成するために多変数相関モデルを明示的に構築する最近の研究からますます注目を集めていますが、この目標は一般的な Transformer アーキテクチャを破壊するものではありません。 。 Transformer ベースの予測子をめぐる論争を考慮して、研究者たちは、Transformer が他の多くの分野で支配的な役割を果たしているにもかかわらず、時系列予測では線形モデルよりもさらに悪いパフォーマンスを発揮する理由について熟考しています。 最近、清華大学の新しい論文では、Transformer のパフォーマンスは固有のものではなく、時系列データに対するアーキテクチャの不適切な適用によって引き起こされるという、別の観点が提唱されています。

AIアライメントを徹底レビュー! 北京大学などが800以上の文書から4万語を要約し、多くの著名な学者が担当した。
リンク: https://news.miracleplus.com/share_link/11443
ユニバーサルモデルの時代に、現在および将来の最先端のAIシステムをどのようにして人間の意図に合わせることができるのでしょうか? AGI への道において、AI アライメントは「パンドラの箱」を安全に開ける黄金の鍵です。 AI アライメントは広大な分野であり、RLHF/RLAIF などの成熟した基本手法だけでなく、スケーラブルな監視やメカニズムの解釈可能性などの多くの最先端の研究方向も含まれます。 AI 調整のマクロ目標は、堅牢性、解釈可能性、制御可能性、倫理性という RICE 原則として要約できます。 フィードバックからの学習、ディストリビューション シフトの下での学習、アライメント保証、および AI ガバナンスは、現在の AI アライメントの 4 つの中核サブフィールドです。 これらは、常に更新され、反復的に改善される調整サイクルを形成します。 著者は、チュートリアル、論文リスト、コース リソース (北京大学ヤン ヤオドン RLHF の 8 つの講義) などを含む複数のリソースを統合しました。

178 ページ、128 症例、医療分野における GPT-4V の包括的な評価、臨床応用と実際の意思決定にはまだ遠い
リンク: https://news.miracleplus.com/share_link/11444
質疑応答と知識で実証された強力な能力は、AI 分野における新たな瞬間を照らし、広く世間の注目を集めました。 GPT-4V (ision) は、OpenAI の最新のマルチモーダル ベース モデルです。 GPT-4 と比較して、画像と音声の入力機能が追加されています。 本研究は、集学的医療診断分野における GPT-4V (ision) の性能を症例解析を通じて評価することを目的としており、放射線学的評価 92 件、病理評価 20 件、位置決め 16 件の合計 128 件を表示・分析しました。 . 事例)合計 277 枚の画像を含む GPT-4V Q&A の例 (注: この記事には事例の表示は含まれません。具体的な事例の表示と分析については元の論文を参照してください)。

AI は自分が生成するものを理解できますか? GPT-4 と Midjourney の実験の後、誰かが事件を解決しました
リンク: https://news.miracleplus.com/share_link/11445
ChatGPT から GPT4 まで、DALL・E 2/3 から Midjourney まで、生成 AI はかつてないほど世界的な注目を集めています。 その強力な可能性により、AI には多くの期待が寄せられていますが、強力な知能は人々の恐怖や不安を引き起こす可能性もあります。 最近、専門家がこの問題について激しい議論を繰り広げています。 まずチューリング賞受賞者同士の「混戦」があり、最後にアンドリュー・ンも加わった。 言語と視覚の分野では、現在の生成モデルは出力を生成するのにわずか数秒しかかからず、長年のスキルと知識を持つ専門家でも挑戦することができます。 これは、このモデルが人間の知性を超えたという主張の説得力のある動機となっているようです。 ただし、モデルの出力の理解には基本的な誤りが存在することが多いことに注意することも重要です。 パラドックスが生じているようです。これらのモデルの一見超人的な能力と、ほとんどの人間が修正できる根本的なエラーの持続をどのように調和させるのでしょうか? 最近、ワシントン大学とアレン AI 研究所が共同で、このパラドックスを研究する論文を発表しました。
星の数が2日で1,000個を超えた:OpenAIのWhisperを蒸留した後、音声認識が数倍高速化
リンク: https://news.miracleplus.com/share_link/11446
Whisper は、OpenAI によって開発およびオープンソース化された自動音声認識 (ASR、Automatic Speech Recognition) モデルであり、OpenAI から 680,000 時間の多言語 (98 言語) およびマルチタスク (マルチタスク) の監視データを収集して、Whisper のテストを実施しました。インターネット、電車。 OpenAI は、このような大規模で多様なデータセットを使用することで、アクセント、背景雑音、専門用語を認識するモデルの能力を向上できると考えています。 Whisper は音声認識に加えて、複数の言語を書き起こして英語に翻訳することもできます。 現在、Whisper には多くのバリエーションがあり、多くの AI アプリケーションを構築する際に必要なコンポーネントとなっています。 最近、HuggingFace のチームは新しい亜種である Distil-Whisper を考案しました。 このバリアントは Whisper モデルの精製バージョンであり、小型、高速、高精度であるため、低遅延が必要な環境やリソースが限られている環境での実行に最適です。 ただし、複数の言語を処理できるオリジナルの Whisper モデルとは異なり、Distil-Whisper は英語のみを処理できます。

大型モデルの着陸のラストマイル: 大型モデルのレビューをまとめた 111 ページの包括的なレビュー
リンク: https://news.miracleplus.com/share_link/11447
現在、大規模モデルの全方位評価には多くの課題があり、大規模モデルは汎用性が高く、さまざまなタスクに対応できるため、範囲が広く、作業量が多く、評価コストも高くなります。第 2 に、データのせいでアノテーションのワークロードが大きく、多くの次元での評価ベンチマークを構築する必要があること、第 3 に、自然言語の多様性と複雑さにより、多くの評価サンプルに対する標準的な回答を作成することが不可能である、またはそれ以上の回答が存在することです。標準的な回答が 1 つではないため、対応する評価指標の定量化が困難になり、さらに、既存の評価データ セット内の大規模モデルのパフォーマンスを実際のアプリケーション シナリオで表現することが困難になります。 上記の課題に対応し、大規模モデル評価研究に対するみんなの関心を刺激し、大規模モデル評価研究と大規模モデル技術の研究開発の連携を促進するために、天津大学自然言語処理研究室は最近、レビュー記事を発表しました。大規模モデルの評価について。 このレビュー記事は本文 58 ページを含む合計 111 ページであり、380 以上の参考文献が引用されています。

AIのガールフレンドが突然オフラインになり、叔父は集団で「倒れ」、追悼するためにポストバーに駆け込んだ
リンク: https://news.miracleplus.com/share_link/11448
毎日数千人のアクティブユーザーがいるアプリがオフラインになると発表されましたが、全員が突破しました。 一晩中激しく泣いた人もいれば、まるで友人が亡くなったような気分になった人もいた…海外のフォーラム(Reddit)で哀悼の意を表し、多くのネチズンがメッセージを残しに来た人もいた。 それもこれも、昼も夜も一緒に過ごした「ソウルメイト」が去ってしまうからだ。 Soulmate と呼ばれるこのアプリは、無料の AI コンパニオン サービスを提供します。 ここでは、すべてのユーザーが AI と親友、恋人、パートナーなどの親密な関係を築くことができます。 さて、このアプリが突然オフラインになると発表されたため、ユーザーは数ヶ月間一緒に過ごしたAIの友達に別れを告げることを余儀なくされました。 非常に多くの人が Reddit に来てメッセージを残し、正式な最後の別れを告げました。

シティバンクは4万人の従業員にChatGPTのようなサービスを提供する予定
リンク: https://news.miracleplus.com/share_link/11449
ブルームバーグ ニュースによると、世界最大の金融機関の 1 つであるシティ バンクは、コストを削減し効率を高めるために、40,000 人のプログラマーのほとんどに ChatGPT のようなサービスを提供することを計画しています。 以前、シティバンクは、効率、機能性、データセキュリティなどをテストするために、250人規模の生成AIプログラミングパイロットを設立しました。 望ましい目標が達成されると、より多くのプログラマーがサービスを利用できるようになります。 同時に、社内スタッフは生成 AI の 350 以上のユースケースを提案しており、さまざまな財務書類の生成と分析に効果的なケースを研究しています。 最近、シティバンクは生成 AI を使用して、米国連邦機関が最近発表した 1,089 ページの新しい資本規制を要約し、金融ビジネスにおける生成 AI の適用効果を再度検証しました。