1月11日のビッグモデル日報集

52 0 0

【1月11日のビッグモデル日報集】ChatGPTアプリケーションストアがついにオンライン化、ネットワーク全体で300万GPT以上、OpenAIでお金をシェアする時代が到来、上海AI研究所などオープンソース、オーディオおよび音楽統合開発ツールキット Amphion、自動車業界向けの世界初のフルスタック自社開発フルシナリオ AI モデル! 吉利興瑞AI大型モデル正式発売

人間の計画立案者 8 人を倒す: 清華大学チームが強化学習都市空間計画モデルを提案

リンク: https://news.miracleplus.com/share_link/15530

近年、より住みよい空間を実現するために、基本的なサービス施設まで徒歩または自転車で15分以内にアクセスできる「15分都市」という概念が注目を集めており、効率的な空間を求める人々の要望が反映されています。都市コミュニティ、レイアウトへの期待。しかし、都市の地理的空間が多様であるため、都市の土地配置と道路計画は非常に複雑で困難な作業であり、常に専門の計画立案者の経験に大きく依存してきました。これに応えて、清華大学電子学部都市科学コンピューティング研究センターと建築学部は分野を超えて協力し、深層強化学習に基づく都市コミュニティ空間計画手法を革新的に提案しました。大量のデータに基づいて計画を立て、スペース効率を継続的に最適化し、最終的には人間の専門家を超える計画レベルを達成します。

GauHuman オープンソース: 高品質の 3D 人体迅速再構成およびリアルタイムレンダリングフレームワークであるガウススプラッティングに基づく

リンク: https://news.miracleplus.com/share_link/15531

南洋理工大学とセンスタイム共同研究センターのS-Labチームは、ガウシアン・スプラッティングに基づく高品質3D人体迅速再構成(1～2分)とリアルタイム・レンダリング(毎秒最大189フレーム)フレームワークであるGauHumanを提案した。 GauHuman は、ユーザーが入力した単眼人体ビデオと、対応するカメラおよび体動体形状 (SMPL) パラメーターに基づいて 3D 人体を迅速に再構築し、リアルタイムで 3D 人体をレンダリングできます。

ChatGPT アプリケーションストアがついにオンラインになりました。ネットワーク全体の GPT の数は 300 万を超えました。OpenAI でお金を共有する時代が到来しました。

リンク: https://news.miracleplus.com/share_link/15532

ChatGPTはWeChatやDingTalkのようなフル機能のアプリになるのでしょうか? 1 月 10 日、OpenAI のアプリケーションストア GPT ストアが正式に開始され、カテゴリ、トレンド、毎週のセレクション、その他のコラムが追加されました。ほとんどのアプリストアと同様、GPT ストアには人気ダウンロードのコミュニティランキングが含まれており、ユーザーは執筆、ライフスタイル、教育などのカテゴリ別に検索できます。 OpenAI Greg Brockman 氏は、これが独自の ChatGPT を構築するための最初のステップであると述べました。この製品はまだ試行段階にあるが、今後数週間のうちにさらに広く展開されることが期待されている。

国内の多くの大学が共同でオープンソースコミュニティ LAMM を構築しており、マルチモーダル言語モデルファミリーに参加する時期が来ています。

リンク: https://news.miracleplus.com/share_link/15533

北航大学、復旦大学、シドニー大学、香港中文大学 (深セン)、上海人工知能研究所の学者らが共同で、マルチモーダル言語モデルのための最も初期のオープンソースコミュニティの 1 つである LAMM (Language-Assisted Multi-modal Model) を立ち上げました。）。私たちは、MLLM のトレーニングと評価、MLLM 主導のエージェント、その他の方向の研究をサポートするために、成長するコミュニティエコシステムに LAMM を構築することを目指しています。マルチモーダル大規模言語モデルの分野における最も初期のオープンソースプロジェクトの 1 つである LAMM の目標は、オープンな研究コミュニティエコシステムを確立し、すべての研究者と開発者がこれに基づいて研究を実施し、共同でオープンソースコミュニティを構築できるようにすることです。

上海AI研究所、オーディオ・音楽統合開発ツールキットAmphionなどのオープンソース

リンク: https://news.miracleplus.com/share_link/15534

上海 AI 研究所、香港中文大学データサイエンス学部、深センビッグデータ研究所は共同で、Amphion と呼ばれるオーディオ、音楽、音声生成ツールキットをオープンソース化しました。 Amphion は、開発者がテキスト生成オーディオ、音楽、その他のオーディオ関連分野を研究するのに役立ち、ブラックボックス生成モデル、散在するコードベース、評価指標の欠如などの問題を解決するフレームワーク内で完了できます。 Amphion には、データ処理、一般的なモジュール、最適化アルゴリズム、その他のインフラストラクチャが含まれています。同時に、テキスト読み上げ、歌声変換、テキスト音声生成などのタスクのための特定のフレームワーク、モデル、開発手順が提供され、さまざまなニューラル音声コーデックと評価指標も組み込まれています。特に生成 AI 開発の初心者にとって、Amphion は非常に使いやすいです。