10月27日の大規模モデル日報集

【10月27日の大規模モデル日報集】Zhipu AI、第3世代の大規模基本モデルを発表; OpenAI、核の脅威を含む「壊滅的な」人工知能リスクを研究するチームを結成; DeepMind: 畳み込みネットワークがViTより劣ると誰が言った? ; ボストン ダイナミクスのロボット犬は ChatGPT の脳を備えており、古いロンドンのアクセントで話し、ツアー ガイドとして機能します。
Zhipu AI、第 3 世代のベースモデルを発売
リンク: https://news.miracleplus.com/share_link/11223
2023 年 10 月 27 日、Zhipu AI は、2023 年中国コンピュータ会議 (CNCC) で完全自社開発の第 3 世代ベースモデル ChatGLM3 および関連製品シリーズを発表しました。
OpenAI、核の脅威を含む「壊滅的な」AI リスクを研究するチームを結成
リンク: https://news.miracleplus.com/share_link/11224
OpenAIは本日、いわゆる「壊滅的リスク」から保護するための人工知能モデルを評価、評価、探索するための新しいチームを結成したと発表した。 Preparednessと呼ばれるこのチームは、MITの展開可能な機械学習センターの所長であるAleksander Madry氏が率いることになる。 (LinkedIn によると、マドリード氏は 5 月に「Preparedness ディレクター」として OpenAI に加わりました。) Preparedness の主な責任は、将来の AI システムが人間を説得し、欺く能力からその危険性を追跡、予測し、防御することです。 (フィッシング攻撃など) 悪意のあるコード生成機能。
DeepMind: 畳み込みネットワークが ViT より劣ると誰が言いましたか?
リンク: https://news.miracleplus.com/share_link/11225
深層学習の初期の成功は、畳み込みニューラル ネットワーク (ConvNet) の開発に起因すると考えられます。 ConvNet は、10 年近くにわたってコンピューター ビジョンのベンチマークを支配してきました。 しかし、近年ではViT(ビジョントランスフォーマー)に置き換わるケースが増えています。 多くの人は、ConvNet は小規模または中規模のデータ セットでは優れたパフォーマンスを発揮しますが、より大規模なネットワーク サイズのデータ セットでは ViT と競合できないと考えています。 同時に、CV コミュニティは、ImageNet などの特定のデータセットでランダムに初期化されたネットワークのパフォーマンスを評価することから、ネットワークから収集された大規模な一般データセットで事前トレーニングされたネットワークのパフォーマンスを評価することに移行しました。 これにより、重要な疑問が生じます。ビジョン トランスフォーマーは、同様の計算予算の下で、事前トレーニングされた ConvNets アーキテクチャよりも優れたパフォーマンスを発揮しますか? この記事では、Google DeepMind の研究者が、さまざまなスケールの JFT-4B データ セット (基本モデルのトレーニングに使用される大規模なラベル付き画像データ セット) で複数の NFNet モデルを事前トレーニングすることで、この問題を調査しました。 ImageNet の ViT。
ボストン・ダイナミクスのロボット犬はChatGPT脳を搭載し、古いロンドンなまりで話すツアーガイドとして機能する
リンク: https://news.miracleplus.com/share_link/11226
新たに公開されたビデオの中で、ボストン ダイナミクスはロボット犬と LLM を統合した結果を示しています。「ミスター スポット」はシルクハットをかぶり、口ひげを生やし、大きな目とイギリス訛りで、会社の施設を人々に案内しています。 Spot が「話せる」ようにするために、Boston Dynamics は OpenAI の ChatGPT API といくつかのオープンソース LLM をトレーニングに使用し、ロボットにスピーカーを装備し、テキストから音声への変換機能を追加しました。 したがって、音を発している間、Spot は「口」を開け続け、本当に話しているように見えることがわかります。 LLM のいわゆる「緊急動作」により、意図されたトレーニング以外のタスクを実行できます。 このため、さまざまな用途に適応できます。 ボストン ダイナミクス チームのこれに関する探求は、この夏、ロボット工学アプリケーションで LLM を使用するいくつかの概念実証デモンストレーションから始まり、そのアイデアは社内ハッカソン中に拡張されました。 特に、彼らは LLM を自律ツールとして使用する Spot のデモンストレーションに興味を持っていました。チームは、LLM のロールプレイング、文化とニュアンスの複製、計画の形成、長期にわたる一貫性の維持という明らかな能力、そして最近リリースされた VQA に触発されました。モデル (これらのモデルは画像にキャプションを追加し、画像に関する簡単な質問に答えることができます)。
マイクロソフトは 40 年以上テクノロジーに賭けてきましたが、今度は AI の番です。
リンク: https://news.miracleplus.com/share_link/11227
マシュー・ボール氏はアマゾン・プライム・ビデオの元戦略責任者で、現在はマッキンゼーとKKRのシニアコンサルタントを務めている。シリコンバレーの大手テクノロジー企業が今週財務報告を発表する中、マシュー氏は「並行賭け、マイクロソフト、AI」と題した論文を発表した。戦略」の中でマシュー氏は、PC、モバイル、AI の 3 つの異なる時代におけるソフトウェアとハードウェア間の競争を詳細にレビューし、マイクロソフトの観点から今日の AI 市場構造と戦略的レイアウトについて詳しく説明しました。
RLHF と AlphaGo コア テクノロジーの強力な組み合わせである UW/Meta は、テキスト生成機能を新たなレベルに引き上げます。
リンク: https://news.miracleplus.com/share_link/11228
最新の研究で、UW と Meta の研究者は、AlphaGo で使用されるモンテカルロ ツリー検索 (MCTS) アルゴリズムを、最適化された近接戦略 (近接ポリシー最適化、PPO) で訓練された RLHF 言語モデルに適用する新しいデコード アルゴリズムを提案しました。モデルによって生成されたテキストの品質。
国連は国際社会のガバナンス強化を支援するAI諮問機関を設立
リンク: https://news.miracleplus.com/share_link/11229
IT Houseは10月27日、アントニオ・グテーレス国連事務総長が現地時間10月26日、AIのガバナンス強化に向けた国際社会の支援を目的とした新たな人工知能(AI)諮問機関の設立を発表したと報じた。 グテーレス事務総長は、現在のAIには把握が難しい変革の可能性があり、AIが悪意を持って利用された場合、さまざまな機関に対する人々の信頼の破壊や社会的結束の弱体化につながる可能性があると述べた。 「これらの理由から、私は人類(全人類)に対する人工知能の利益を最大化し、リスクを封じ込め、軽減するために、人工知能のガバナンスについて複数の利害関係者、多分野にわたる世界的な対話を呼びかけます。」
Luminar Neo はアマチュア写真家に生成 AI ツールを提供します
リンク: https://news.miracleplus.com/share_link/11230
アドビは、プロの写真家やデザイナーが利用できる生成 AI モデルを提供しており、別の会社は、愛好家を含む幅広い写真家に使いやすい生成 AI ツールを提供することに取り組んでいます。 本日より、Skylum (旧 Macphun) の写真編集ソフトウェアである Luminar Neo は、一連の生成人工知能機能を Mac および Windows デスクトップ アプリに展開し、ユーザーが画像から不要なオブジェクトを削除したり、キャンバスを拡張したり、置き換えたり追加したりできるようにします。写真に特定の要素を追加します。
4 億枚の写真の選別を支援した後、GoodOnes は社名を Ollie に変更しました
リンク: https://news.miracleplus.com/share_link/11231
人工知能による写真分類アプリケーションの GoodOnes は、今年初めにシード資金として 360 万米ドルを受け取り、今年 4 月に Apple App Store でリリースされました。 半年かけて4億枚の写真を整理した後、「Ollie」と名前を変えて再スタートする。