Big Model Daily、11 月 24 日

情報1数年前 (2023)发布 AIWindVane

59 0 0

[Big Model Daily、11 月 24 日] ニュースビデオ生成における新たな進歩: PixelDance、複雑な動きとクールな特殊効果を簡単に表現

ビデオ生成における新たなブレークスルー: PixelDance、複雑な動きとクールな特殊効果を簡単に表現

https://news.miracleplus.com/share_link/11963

PixelDance は重要な一歩を踏み出し、生成された結果のダイナミクスは他の既存のモデルよりも大幅に向上しており、業界の注目を集めています。公式 Web サイト (https://makepixelsdance.github.io) では、PixelDance は 2 つの異なるビデオ生成モードを提供します。 1 つ目は基本モードです。ユーザーはガイダンス画像 + テキスト説明を提供するだけで、PixelDance は一貫性の高いダイナミックなビデオを生成できます。ガイダンス画像は実際の画像または既存の Vincent ダイアグラムモデル生成を使用できます。 2 つ目は高度なマジックモードで、ユーザーに想像力と創造性を発揮する余地を与えます。このモードでは、ユーザーは 2 つのガイダンス画像とテキストの説明を提供する必要があり、より難しいビデオコンテンツをより適切に生成できます。ウェブサイトでは、マジックモードで作成されたさまざまなクールな特殊効果ショットが公開されています。

Meta は Transformer アーキテクチャ上でアクションを実行します。新しいアテンションメカニズムは推論をよりよく理解します。

https://news.miracleplus.com/share_link/11964

最近、Meta の研究者たちは、「System 2 の注意 (あなたにも必要かもしれない)」という論文で、根本的な問題は Transformer 自体の固有の構築方法にあると考えています。したがって、研究者らは、注意を実行するための自然言語推論器として LLM を使用することにより、注意メカニズムに対するまったく異なるアプローチを提案しました。具体的には、LLM が指示に従う能力を利用して、注意を払うべきコンテキストを生成するよう促し、推論を歪めない関連資料のみを含めるようにしました。研究者らはこのプロセスをシステム 2 アテンション (S2A) と呼び、基礎となるトランスフォーマーとそのアテンションメカニズムを人間のシステム 1 推論と同様の自動操作であると見なしています。

https://arxiv.org/pdf/2311.11829.pdf

AIGC スタートアップはまだ利益を上げていないが、Microsoft と Adobe はすでに多額の利益を上げている

https://news.miracleplus.com/share_link/11965

今年の初め以来、Adobe の米国株式市場価値は 1,000 億ドル以上増加し、知らず知らずのうちに 90.58% の増加をもたらしました。また、OpenAI の筆頭株主であり、一連の AI Copilot 製品をリリースした Microsoft もまた、1,000 億ドル以上増加しました。目を引くのは 55.93% です。このタイプの非 AI ネイティブのベテランプレーヤーは、非常に伝統的な主力製品を持っているように見えますが、AIGC 製品が静かに主流を占めています。

実際のシーンで大規模なモデルを洗練し、Quark は AI を使用して再び「高速化」します

https://news.miracleplus.com/share_link/11966

11 月 14 日、Alibaba Intelligent Information Business Group は、数千億のパラメーターを備えた自社開発の Quark モデルをリリースし、リリース後、C-Eval と CMMLU という 2 つの権威ある評価リストでトップになりました。 AI再構成アプリケーションのトレンドを活用して、Quark Modelは製品マトリックスとサービスを包括的にアップグレードします。

あなたの声を自由に変換、イレブンラボが「Voice to Speech」をリリース

https://news.miracleplus.com/share_link/11967

音声生成 AI プラットフォームであるイレブンラブスは、ユーザーが音声を他の音声に自動的に変換できる「スピーチツースピーチ」(STS) 機能を公式 Web サイトでリリースしました。たとえば、男性の声がアップロードされた場合、女性、お年寄り、子供の声などに自動変換できます。体験アドレス：https://elevenlabs.io/voice-changer

Nvidiaが企業秘密を盗んだ疑いで告発! 証拠を明らかにするためにビデオ会議が開かれ、関与した従業員は有罪を認めた。

https://news.miracleplus.com/share_link/11968

自動車部品大手のヴァレオは、企業秘密を盗んだとしてエヌビディアを訴えた。ヴァレオの従業員はビデオ会議中に、ヴァレオのソースコードファイルが Nvidia 従業員の共有画面に表示されていることを発見し、証拠を収集するためにすぐにスクリーンショットを撮りました。今年9月、この従業員はヴァレオの企業秘密を違法に入手、使用、漏洩したことが判明し、1万4400ユーロ（約12万元に相当）の罰金を科せられた。ヴァレオは最近、カリフォルニア州サンノゼの連邦裁判所に正式に訴訟を起こした。 Nvidiaはまだ返答していない。