Big Model Daily、12 月 9 ~ 10 日
[Big Model Daily、12 月 9 ~ 10 日] 研究は髪と同じくらい現実的で、光は調整可能です. Meta がリアルタイム 3D アバター合成手法を開始. 磁気リンクが AI 界を席巻. 87GB シードは直接オープンソース化されています8x7B MoE モデル
髪までリアルに、光を調整可能、Meta がリアルタイム 3D アバター合成手法を開始
https://news.miracleplus.com/share_link/12818
Facebookは2021年に「メタバース」を同社の主力事業と位置付け、社名をMetaに変更する。 しかし、今年、ChatGPTの登場により、生成AIは新たな研究トレンドとなり、多くのテクノロジー企業が生成AIを企業の重要な研究開発事業とみなしている。 しかし、Meta は VR/AR の研究を決してやめませんでした。 最近、Meta の Codec Avatars Lab は、高忠実度で光を調整できる仮想アバター合成方法である Relightable Gaussian Codec Avatars を提案しました。
Huawei Noah & Tsinghua: CoSeR、認知に基づく万物の大規模超解像度モデル
https://news.miracleplus.com/share_link/12819
最近、清華大学、ファーウェイのノアの方舟研究所、香港科技大学などの機関が提案した研究では、画像の外観と言語理解を組み合わせて認知機能を生成することにより、認知超解像度フレームワークを実装し、SRモデルが低解像度を理解できるようにしました。画像。 この記事では、実際のシーンに効果的に適用できる大規模な画質モデルには、システム 2 と同様の複数ステップの修復機能が必要であると考えています。つまり、画像コンテンツの認識に基づいて、事前知識と組み合わせて画像の超高速化を実現します。解像度 (コグニティブ超解像度、CoSeR)。
HumanGaussian オープンソース: 高品質 3D 人体生成のための新しいフレームワーク、ガウス スプラッティングに基づく
https://news.miracleplus.com/share_link/12820
最近、3D ガウス スプラッティング (3DGS) [2] の明示的なニューラル表現により、リアルタイム シーンの再構築に新しい視点が提供されました。 多粒度およびマルチスケール モデリングをサポートしており、3D 人体の生成タスクに非常に適しています。 最近の研究では、香港中文大学、テンセント AI ラボ、北京大学、香港大学、南洋理工大学のチームが、明示的な人体構造ガイダンスと勾配正規化を導入した最新の効果的で高速な 3D 人体生成モデル HumanGaussian を発表しました。 . 3D ガウス最適化プロセスを支援し、多様でリアルな高品質 3D 人体モデルを生成できます。 現在、コードとモデルは両方ともオープンソースです。
AIが証明写真マスターになって星間旅行がわかる! Jia Jiayaチームの新作、マルチモーダル大型モデル挑戦の超長い3時間ビデオ
https://news.miracleplus.com/share_link/12821
Jia Jiaya チームの最新の研究結果により、大規模モデルが非常に長いビデオの処理を直接学習できるようになりました。 SF 大作映画「インターステラー」(長さ 2 時間 49 分)を与えると、映画を「視聴」した後、映画のあらすじや登場人物に基づいて簡単に映画についてコメントできるだけでなく、質問にも正確に答えることができます。劇中の詳細に関係します。
マグネット リンクが AI サークルを席巻し、87GB シードが 8x7B MoE モデルを直接オープンソース化
https://news.miracleplus.com/share_link/12822
「ハイエンド」オープンソースでは、最も単純なリリース方法が採用されることがよくあります。 昨日、Mistral AI は X プラットフォーム上でマグネット リンクを開始し、新しいオープンソース アクションを発表しました。 長い公式ブログも意図的に加速したデモも存在しない、現在の大型モデル分野における「新風」とも言える企業である。 それを開いてみると、87 GB近くのtorrentが見つかりました。
GoogleはOpenAIの内紛を利用してAIチームを再編し、シリコンバレーの中国人トップのビル・ジア氏を引き抜いた
https://news.miracleplus.com/share_link/12823
Gemini の予期せぬリリースを密かに準備していることに加えて、Google は何をしているのでしょうか? また、社内でAIチームを再編し、社外から上級幹部を引き抜き、敵がミスをした場合に競争力を再構築するために懸命に取り組んでいる。 上記は、Qubit が学んだばかりの事実です。 GoogleはまずAIに関連するすべての部門をひっそりと閉鎖し、その後「Core AI」というコードネームで呼ばれる新しい部門を再編したと言われている。 さらに重要なことは、GoogleがCore AIの担当者、現在シリコンバレーの大手企業の中で最高位にある中国人、Bill Jia氏を外部から採用したことだ。 そう、メタのビル・ジアです。 Meta のエンジニアリング担当上級副社長で、AI/ML インフラストラクチャ、データ インフラストラクチャ、パフォーマンスおよびキャパシティ エンジニアリング、ハードウェア エンジニアリングを監督しています。 テクノロジー界でよりよく知られている成果は、現在最も人気のある AI フレームワークの 1 つである PyTorch です。
OpenAI、GPT-4 が遅延していることを認める:当面は修正できない
https://news.miracleplus.com/share_link/12824
OpenAI は、GPT-4 の遅延というますます深刻化する問題に正式に対応しました。 まだ ChatGPT アカウントを使用しています。 OpenAI: フィードバックを受け取りました! このモデルは 11 月 11 日以降更新されていないため、これは明らかに意図的なものではありません。 モデルの動作は予測できない可能性があるため、修正するために調査中です。
携帯電話とラップトップ専用、Stability.ai のオープンソース ChatGPT 遺伝子の大規模モデル
https://news.miracleplus.com/share_link/12825
12 月 8 日、有名なオープンソースの生成 AI プラットフォーム testing.ai は、30 億のパラメーターを持つ大規模な言語モデルである StableLM Zephyr 3B を公式 Web サイトでオープンソース化しました。 Zephyr 3B は、携帯電話、ラップトップ、その他のモバイル デバイス向けに設計されており、パラメーターが小さく、パフォーマンスが高く、コンピューティング消費電力が低いのが特徴で、テキストの自動生成、要約と要約などが可能で、70 億および 13 のモデルに匹敵します。億のパラメータ。 このモデルのコア アーキテクチャは Zephyr 7B から来ており、微調整されていることは言及する価値があります。 Zephyr 7Bは、数日前に35億元という巨額の資金調達を受けたばかりのMistral AIのMistral-7Bモデルをベースに微調整されている。 同時に、学習データセットの生成には GPT-3.5 が使用され、人工知能のフィードバックには GPT-4 が使用されたため、Zephyr 3B は多くの大手メーカーのモデル遺伝子を備えたスーパーシームモンスターです。
Inflection AI のチャットボット Pi が Android 版をリリース
https://news.miracleplus.com/share_link/12826
DeepMind の共同創設者である Mustafa Suleyman と LinkedIn の共同創設者 Reid Hoffman によって設立された人工知能スタートアップ Inflection AI は、同社の AI チャットボット Pi が Android アプリとして利用可能になったと発表しました。
Google、Notebook LM AI メモアプリをアップデートし、最新の Gemini Pro モデルを追加
https://news.miracleplus.com/share_link/12827
Googleが今年5月のI/O 2023カンファレンスで発表した「Notebook LM」は、ユーザーのメモの要約などを生成できるAIメモアプリで、利用には登録が必要。 Googleは現在、このAIメモ作成アプリケーションをアップデートし、主に最新のGemini Proモデルを追加するとともに、アプリケーションの使用範囲を拡大すると主張しています。