6 月 6 日のビッグ モデル デイリー コレクション

[6 月 6 日のビッグ モデル デイリー コレクション] ニュース: Byte は、人間と同等の音声を生成できる Seed-TTS テキスト読み上げモデルを開始しました。Asana は、チームの手配と計画を支援する「Al Teammates」機能を開始しました。タスク。
Byte、人間と同等の音声を生成できる Seed-TTS テキスト読み上げモデルを発表
リンク: https://news.miracleplus.com/share_link/29185
ByteDance のチームは最近、Seed-TTS と呼ばれるテクノロジーを提案しました。これは、人間の音声とほとんど区別できない音声を生成できる一連の大規模な自己回帰テキスト読み上げ (TTS) モデルです。 Seed-TTS は、音声コンテキスト学習に優れた音声生成の基礎モデルであり、客観的評価と主観的評価の両方において、話者の類似性と自然さにおいて実際の人間の音声と一致します。

コラボレーション プラットフォーム Asana が、チームのタスクの割り当てと計画を支援する「Al Teammates」機能を開始
リンク: https://news.miracleplus.com/share_link/29186
オフィス コラボレーション プラットフォームである Asana は、その人工知能モデルが、保存されたチームの過去の関係と過去のプロジェクト情報を使用して、ブランド スタイルを理解しているデザイナーをタグ付けしてクリエイティブなプロジェクトに取り組むなど、最適なスキルを持つ人材に仕事を割り当てることができるとプレスリリースで述べています。 「Al Teammates」と呼ばれる機能は、チームがタスクを割り当て、各人の責任を特定し、提案や計画を立てるのに役立ちます。

Kuaishou バージョンの Sora「Ke Ling」がテスト用に公開されています。120 秒以上のビデオを生成し、物理学をより深く理解し、複雑な動きを正確にモデル化できます。
リンク: https://news.miracleplus.com/share_link/29187
最近、「Keling」と呼ばれる新しい大規模な国産ビデオ生成モデルがリリースされました。 Sora と同様の技術的ルートを採用し、多くの自社開発の技術革新を組み合わせて生成されたビデオは、大きくて合理的な動きを持っているだけでなく、物理世界の特性をシミュレートし、強力な概念的な組み合わせ能力と想像力を備えています。データによると、Keling は最大 1080p の解像度で 30fps で最大 2 分の超長時間ビデオの生成をサポートし、複数のアスペクト比をサポートします。 Keling は、研究所がリリースしたデモやビデオ結果のデモンストレーションではなく、ショートビデオ分野のリーダーである Kuaishou が立ち上げた製品レベルのアプリケーションです。さらに、実用的であることに重点を置き、白紙小切手を書かず、Keling モデルはリリースされるとすぐに Kuaiying APP で正式にベータテストが開始されました。

Stable Diffusion のボスが新たなピットを開くために逃亡し、残った SD3 オープンソースはめちゃくちゃになった
リンク: https://news.miracleplus.com/share_link/29188
Stability AIの前CEOの新会社がついに浮上した。彼が辞任して逃亡した際に述べたように、Shelling AIは「分散型人工知能システム」に取り組んでいる。このニュースは、エマド・モスタク氏自身が最新の公の場で生中継で発表した。公式 Web サイトのドメイン名 schelling.ai は現在、公式 𝕏 にジャンプしますが、公式 𝕏 はまだ空です。現時点で唯一のニュースは、新事業が大規模言語モデルに関連しており、事業の方向性は政府業務、医療、教育、つまりtoBに注力するということだけだ。
