12月5日ビッグモデルデイリーコレクション

情報1数年前 (2023)发布 AIWindVane
50 0
12月5日ビッグモデルデイリーコレクション

【12月5日ビッグモデルデイリーコレクション】 5倍のスループット、トランスフォーマーを完全に取り囲むパフォーマンス:新アーキテクチャMambaがAI界を爆発させる、「5年間の大学受験と3年間のシミュレーション」のビッグモデル版が登場! 6141 の数学の問題、依然としてマルチモーダル | Microsoft、UCLA、UW が共同制作; 3D 編集を PS と同じくらい簡単にし、新しいアルゴリズム GaussianEditor は 3D シーンの追加、削除、変更を数分で完了できます。 「化合物」は90年前に存在した? ユニバーシティ・カレッジ・ロンドンの教授は、DeepMind が参加した「A-Lab」に疑問を呈しました; このスタートアップの価値は 180 日で 20 億米ドルに上りました! OpenAI のヨーロッパ版の人気が爆発的に高まり、Llama の作成者が独自のビジネスを設立し、NVIDIA が株主になりました


5 倍のスループット、パフォーマンスが Transformer を完全に取り囲む: 新しいアーキテクチャ Mamba が AI サークルを爆発させる

 

リンク: https://news.miracleplus.com/share_link/12440

他の分野では、何かが非常に重要であることを説明したい場合、それを「ある分野の半分をサポートしている」と表現することがあります。 しかし、大規模な AI モデルの分野では、Transformer アーキテクチャはほぼ「国全体」をサポートしているため、このように説明することはできません。 Transformer は 2017 年に提案されて以来、大規模 AI モデルのアーキテクチャの主流となってきましたが、モデルの規模が拡大し、処理するシーケンスが増大するにつれて、Transformer の限界が徐々に明らかになってきました。 明らかな欠陥は、Transformer モデルにおけるセルフ アテンション メカニズムの計算量は、コンテキストの長さが増加するにつれて二乗的に増加することです。たとえば、コンテキストが 32 倍に増加すると、計算量は 1000 倍に増加する可能性があり、計算は効率が非常に低いです。 これらの欠点を克服するために、研究者は注意メカニズムの多くの効率的な変形を開発しましたが、これは多くの場合、その有効性を犠牲にします。 これまでのところ、これらの亜種はいずれも、さまざまな分野で有効であることが証明されていません。 最近、「Mamba」と呼ばれる研究がこの状況を打破しそうです。

12月5日ビッグモデルデイリーコレクション

最近ではアニメーションビデオの生成が流行しており、新しいフレームワークにより画像が動きます。

 

リンク: https://news.miracleplus.com/share_link/12441

数日前、アリババの研究チームは、人物の写真を必要とするだけで、骨格アニメーションに導かれて自然なアニメーションビデオを生成する「AnimateEveryone」と呼ばれるメソッドを構築した。 ただし、この研究のソースコードはまだ公開されていません。 実際、AnimateEveryone の論文が arXiv に掲載される前日、シンガポール国立大学 Show Lab と Byte が共同で同様の研究を実施しました。 彼らは、時間的一貫性を高め、参照画像を忠実に保存し、アニメーションの忠実度を向上させるように設計された拡散ベースのフレームワークである MagicAnimate を提案しました。 さらに、MagicAnimate プロジェクトはオープンソースであり、推論コードと grdio オンライン デモが公開されています。


3D 編集を PS と同じくらい簡単に、新しいアルゴリズム GaussianEditor により 3D シーンの追加、削除、変更を数分で完了できます

 

リンク: https://news.miracleplus.com/share_link/12442

3D編集はゲームやVRなどの分野で重要な役割を果たしていますが、これまでの3D編集は長時間かかる、操作性が悪いなどの問題があり、実際のシーンへの適用が困難でした。 最近、南洋理工大学、清華大学、SenseTime が新しい 3D 編集アルゴリズムである GaussianEditor を提案しました。これは、これまでの 3D 編集作業を完全に超え、2 ~ 7 分で 3D シーンの制御可能で多様な編集を初めて実現しました。


「大学受験5年分+3年分シミュレーション」の大型モデル版が登場! 6141 の数学の問題、依然としてマルチモーダル | Microsoft、UCLA、UW が共同作成

 

リンク: https://news.miracleplus.com/share_link/12443

大型モデル「大学受験5年分+3年分シミュレーション」の数学問題集が強化版となって登場! Microsoft、カリフォルニア大学ロサンゼルス校 (UCLA)、およびワシントン大学 (UW) は共同で、新しいマルチモーダル数理推論ベンチマーク データ セットを作成しました。 「MathVista」といいます。 28 の既存のマルチモーダル データ セットと 3 つの新たに注釈が付けられたデータ セットから派生した、さまざまな質問タイプの合計 6141 の質問をカバーしています。


「新化合物」は90年前に存在していた? ユニバーシティ・カレッジ・ロンドン教授、ディープマインドの「A-Lab」への参加に疑問

 

リンク: https://news.miracleplus.com/share_link/12444

先週、Google DeepMind とカリフォルニア大学バークレー校の研究者チームは、AI とロボット工学を利用するように設計された「自律実験室」-A-Lab を提案する待望の論文を Nature 誌に発表しました。材料。 「自動運転研究所」と呼ばれる A-Lab は、計算モデリング、機械学習、自動化、自然言語処理の最新テクノロジーを備えれば、人工知能主導のシステムを科学研究に使用できるという野心的なビジョンを示しています。研究で達成されています。 しかし、発表から数日以内に、論文で述べられた主要な主張と結果のいくつかについて疑問が生じ始めました。 ロバート・パルグレイブは、ユニバーシティ・カレッジ・ロンドン (UCL) の無機化学および材料科学の教授です。 彼は X 線結晶構造解析において数十年の経験があります。 Palgrave 氏は、A-Lab の想定される成功の証拠であるデータと分析の不一致に気づき、X (旧 Twitter として知られていた) に対して一連の技術的懸念を提起しました。

© 版权声明

関連記事

コメントなし

コメントはありません…