Big Model Daily、12 月 14 日

[Big Model Daily、12 月 14 日] Google DeepMind の最も先進的な Imagen 2 がリリースされました: これらの AI 画像を識別できますか? ; 写真やテキストから無限の 3D 世界が生成されます。 スタンフォード大学の呉嘉軍チームの新しい研究はネチズンに「信じられない」と言わせました; 大規模モデルの推論効率が損失なく 3 倍向上し、ウォータールー大学、北京大学などの機関が EAGLE をリリースしました; まだ存在します「ニュースの女王」を争うAIが24時間365日ニュースを放送
Google DeepMind の最も先進的な Imagen 2 がリリースされました: これらの AI 画像を識別できますか?
https://news.miracleplus.com/share_link/13244
Google は最近、本当に良いニュースを伝えています。 まず、数日前にリリースされた大物キラー Gemini ですが、記者会見での一連のデモ展示は眩しかったです。 わずか 1 週間で、Google はいくつかの良いニュースを発表しました: Gemini Pro の最初のバージョンが Gemini API を通じてアクセス可能になったこと、Imagen 2 のリリース、そして医療業界向けに微調整された一連のモデルである MedLM の発売です。
写真やテキストから無限の3D世界が生成されます! スタンフォード大学呉嘉軍チームの新作はネチズンに「信じられない」と評された
https://news.miracleplus.com/share_link/13245
スタンフォード大学の呉嘉軍氏のチームが傑作「不思議の国のアリス」のAI版を制作! 画像またはテキストだけを使用して、カメラの軌跡に沿って無限に一貫した 3D シーンを生成できます。 この作品は「WonderJourney」と呼ばれ、スタンフォード大学の呉嘉軍氏のチームと Google Research が共同で作成しました。
大規模モデルの推論効率をロスなく3倍向上、ウォータールー大学や北京大学などがEAGLEをリリース
https://news.miracleplus.com/share_link/13246
大規模言語モデル (LLM) は、さまざまな分野でますます使用されています。 ただし、テキスト生成プロセスは高価で時間がかかります。 この非効率性は、自己回帰デコードのアルゴリズムに起因します。各単語 (トークン) の生成には前方パスが必要であり、数十億から数千億のパラメータを持つ LLM へのアクセスが必要です。 その結果、従来の自己回帰デコードが遅くなります。 最近、ウォータールー大学、カナダベクトル研究所、北京大学、その他の機関が共同で EAGLE をリリースしました。これは、モデル出力テキストの一貫した配布を確保しながら、大規模な言語モデルの推論速度を向上させることを目的としています。 この方法では、LLM の 2 番目のトップレベルの特徴ベクトルが外挿され、生成効率が大幅に向上します。
ChatGPTが自然界の今年のトップ10に選ばれ、人間以外の初の存在となる
https://news.miracleplus.com/share_link/13247
2023 年も終わりに近づき、今年の重要な科学の進歩を振り返る時期が来ました。 有名科学誌「ネイチャー」は12月13日、科学分野に重要な貢献をし、重要な問題で注目を集めた人物を選出する2023年のトップ10人(ネイチャーズ10)を発表したばかり。 これまでと違うのは、今年のNature’s 10に大規模言語モデル(LLM)のChatGPTが含まれており、初めて「コンピュータプログラム」が選ばれたことだ。 「ネイチャー」は、このアプローチは、科学の発展と進歩において人間の言語を模倣する人工知能システムが果たす役割を認識することを目的としていると述べた。
なぜ「ニュースの女王」を目指して戦うのか? AI が 24 時間 365 日ニュースを放送します
https://news.miracleplus.com/share_link/13248
「私は週7日、ゴールデンタイムのニュースになるつもりです」は、最近の人気テレビシリーズ「ニュースの女王」のセリフです。 この劇は、テレビ局内で公然と秘密裏に戦う数人のアンカーの物語を語ります。 一年を通して7日連続のゴールデンタイム放送を目指して、みんなで頑張っています。 聴衆は、本当に仕事に行くのが大好きだとため息をつかずにはいられませんでした。 しかし、人間として、どんなに仕事が好きでも、アンカーはいつかは休まなければなりません。 この時点で、AI アンカーの利点は明白で、アメリカのメディア新興企業 Channel 1 が公開したこのデモのように、24 時間 365 日ニュースを放送できます。 このデモの公開は、デモに登場したアンカーが実在の人物ではなかったため、アメリカの報道機関で激しい議論を巻き起こしました。 彼らの画像は本物のようで、声は滑らかで、唇の動きも完璧に一致しています。 さらに、言語を 1 秒で切り替えて、さまざまな言語でニュースを放送することもできますが、これはほとんどの人間のアンカーには不可能です。
エラッド・ギルは、セコイア・アメリカとオープンAIとともに、評価額7億ドルのハーベイの新たな資金調達ラウンドを主導する
https://news.miracleplus.com/share_link/13249
Harvey は、元メタ AI 研究者のゲイブ・ペレイラ氏と元オメルベニー・アンド・マイヤーズの弁護士ウィンストン・ワインバーグ氏によって 2022 年に設立された、AI を活用した法律ソフトウェアのスタートアップで、弁護士を調査とデューデリジェンスの膨大な作業負荷から解放することを目的としています。 インフォメーションの報道によると、ハーベイは資金調達交渉を行っており、評価額は7億ドルとなり、4月に発表された評価額の4倍以上となり、7,000万~8,000万ドルを調達する予定だという。資金調達はベンチャーキャピタルで、Kleiner Perkins と Elad Gil が出資し、その他の投資家には Sequoia Capital と OpenAI Startup Fund が含まれます。
トレーニング効率40倍アップ! オープンソース画像が 3D モデルを生成、安定版 Zero123 が登場
https://news.miracleplus.com/share_link/13250
12 月 14 日、有名な生成 AI オープンソース プラットフォーム Stability.ai が公式 Web サイトでオープンソース化されました 写真から高品質の 3D モデルが生成される – Stable Zero123。 Stable Zero123 は、今年 3 月にトヨタ研究所とコロンビア大学が共同でオープンソース化した Zero123 モデルに基づいて開発されています。 モデルは主にレンダリング データ セットと分別蒸留の変更により大幅に最適化されており、生成された 3D モデルのパフォーマンスが Zero123 よりも優れているだけでなく、トレーニング効率も 40 倍向上しています。 Stable Zero123 は、3D モデル拡張プラグインに相当する、Stability.ai の最新のオープンソース高精度画像モデル SDXL と組み合わせて使用できることは注目に値します。
OpenAI: Converge 2 アクセラレーター プログラムを開始、参加者はベンチャー キャピタルとして 100 万ドルを受け取る
https://news.miracleplus.com/share_link/13251
OpenAIはマイクロソフトやその他の投資家と協力して、医療、教育、文化、その他の業界における数十のAIスタートアップの持続可能な発展を促進することを目的として、1億米ドル規模のOpenAIスタートアップファンドを設立した。 2022 年 12 月に、OpenAI はさらに「Accelerator」(Converge) プログラムを開始します。 本日、OpenAI 創設者サム アルトマン氏は、OpenAI Venture Fund が Converge 2 アクセラレータ プログラムを開始したと発表しました。
Mozilla が Solo を開始: AI を使用してユーザーがプログラミングなしで Web サイトを作成できるように支援
https://news.miracleplus.com/share_link/13252
Mozilla は最近、プログラミング経験のないユーザーを対象とした新しいプロジェクト「Solo」を立ち上げ、AI 機能を組み込むことで、プロの開発者による開発効果に匹敵する Web サイトを作成できます。
Lightning AI が AI 開発およびデプロイメント プラットフォーム Lightning AI Studio を開始
https://news.miracleplus.com/share_link/13253
Lightning AI が AI 開発およびデプロイメント プラットフォーム Lightning AI Studio を開始
Google、開発者向けプログラミング支援ツール Duet Al を発売、将来的には Gemini モデルも搭載予定
https://news.miracleplus.com/share_link/13254
Duet Al for Developersは、今年初めに発表されたコード補完と生成のためのGoogleのAI支援ツールスイートで、本日一般公開され、今後数週間のうちにGoogleのより強力なGeminiモデルの使用を開始する予定だ。
Gemini は開発者が Google Al Studio 経由で無料でアクセスできるようになりました
https://news.miracleplus.com/share_link/13255
Gemini Pro と Gemini Pro Vision は、Google Al Studio (旧 MakerSuite) を通じて無料で入手できるようになりました。 これは、個々の開発者およびチームを対象とした Web ベースのツールで、開発者がテストを開発し、モデルを使用するためのプロンプトを作成し、アプリケーションまたは他の開発環境にエクスポートできるアプリケーション プログラミング インターフェイス キーを提供します。