1月20-21日のビッグモデルデイリー
[1月20-21日のビッグモデルデイリー]パーソナルLLMインテリジェントエージェントを最初に導入した清華、Xiaomi、Huawei、vivo、Idealなどの機関の共同レビューに関する研究であり、業界の大型モデルを5つのインテリジェンスレベルに分けています。 – 報酬: Meta が Llama2 自身に与えます 自分で微調整すると GPT-4 を超えるパフォーマンスが得られます
清華大学、Xiaomi、Huawei、Vivo、Idealなどの機関による共同レビューでは、まず個人のLLMインテリジェンスについて言及し、それを5つのインテリジェンスレベルに分けています
https://news.miracleplus.com/share_link/16400
おそらく、これらのウェイク ワードの少なくとも 1 つがあなたの口から発声され、ナビゲートしたり、ジョークを言ったり、スケジュールを追加したり、アラームを設定したり、電話をかけたりするのに役立つインテリジェント パーソナル アシスタント (IPA) を呼び出すことに成功したと考えられます。 IPAは現代のスマートフォンには欠かせない規格となっていると言え、最近の論文では「パーソナルLLMエージェントはAI時代のパーソナルコンピューティングの主要なソフトウェアパラダイムになるだろう」と考えられています。 この LLM エージェントの個人レビュー論文は、清華大学、Xiaomi、Huawei、Huantai、vivo、Yunmi、Li Auto、北京郵電大学、蘇州大学を含む多くの国内の大学や企業研究機関から提供されたものです。 この記事は、パーソナル LLM エージェントに必要な機能、効率性、セキュリティの問題を整理するだけでなく、ドメイン専門家の知見を収集して整理し、さらにパーソナル LLM エージェントの 5 段階のインテリジェンス レベル分類方法を先駆的に提案しています。 また、チームは GitHub 上に文献ライブラリを作成し、関連する文献を公開しました。これらの文献は、IPA コミュニティによって共同で維持され、最新の研究開発の進捗状況で更新されることもあります。
Pika、Gen-2、ModelScope、SEINE…AI ビデオ生成ではどれが優れていますか? このフレームワークはテストするとわかります
https://news.miracleplus.com/share_link/16401
AI動画生成は最近最も注目されている分野の一つです。 さまざまな大学の研究室、インターネット大手の AI Labs、新興企業が AI ビデオ生成トラックに参加しています。 Pika、Gen-2、Show-1、VideoCrafter、ModelScope、SEINE、LaVie、VideoLDM などのビデオ生成モデルのリリースはさらに目を引きます。 この目的を達成するために、NTU は上海 AI ラボ、CUHK、南京大学と協力して、どのビデオ モデルが強いのか、各モデルがどこが強いのかを伝えるための包括的な「ビデオ生成モデルの評価フレームワーク」である VBench を立ち上げました。
NVIDIA の新しい対話 QA モデルは GPT-4 よりも正確ですが、批判されました: 重み付けされていないコードはほとんど意味がありません
https://news.miracleplus.com/share_link/16402
1 年以上にわたり、ChatGPT とその後継は、生産コミュニティおよび研究コミュニティでの質問応答 (QA) モデルの構築におけるパラダイム シフトを引き起こしてきました。 特に実際のアプリケーションでは、次のような状況では QA モデルが第一の選択肢になります。 最近、NVIDIA の論文で研究者らは、GPT-4 レベルの精度を備えたホワイトボックス会話 QA モデル ChatQA 70B を提案しました。 これらは、厳格なデータ管理プロセスである会話型 QA 用に、RAG 拡張リトリーバーとともに 2 段階の命令チューニング アプローチを採用しています。
ロシュとGRCEHのチームは、免疫シナプスと治療用抗体の機能特性を分析するための解釈可能な機械学習手法を開発
https://news.miracleplus.com/share_link/16403
治療用抗体は重篤な疾患の治療に広く使用されています。 それらのほとんどは免疫細胞を変化させ、免疫シナプス内で作用します。 体液性免疫応答を導く重要な細胞間相互作用。 多くの抗体設計が生成され評価されていますが、全身的な抗体の特性評価と機能予測のためのハイスループットのツールが不足しています。 ドイツ環境健康研究センターとロシュの研究チームは、前処理、特徴エンジニアリング、および解釈可能な予測機械学習のためのフローサイトメトリー (IFC) データをイメージングするための包括的なオープンソース フレームワーク scifAI (Single Cell Imaging Cytometry AI) を開発しました。
写真、深層学習の巨人向けにカスタマイズされたポートレート写真
https://news.miracleplus.com/share_link/16404
トピック駆動型のテキストから画像への生成には、通常、トピック (文字、スタイルなど) を含む複数のデータセットでのトレーニングが必要です。このタイプの方法の代表的な研究には、DreamBooth、Textual Inversion、LoRA などが含まれますが、このタイプのスキームはネットワーク全体を更新する必要がある、または長期にわたるカスタマイズされたトレーニングが必要なため、多くの場合、コミュニティ内の既存のモデルとあまり効果的に互換性がなく、実際のシナリオに迅速かつコスト効率よく適用することができません。 ただし、単一画像の特徴に基づく現在の埋め込み方法 (FaceStudio、PhotoMaker、IP アダプター) では、フルパラメーターのトレーニングか、ビンセント グラフ モデルの PEFT 微調整が必要です。これは、元のモデルの汎化パフォーマンスに影響を与え、元のモデルとの統合が不足しています。コミュニティの事前トレーニング済みモデル、互換性、または高い忠実度を維持できないこと。 これらの問題を解決するために、InstantX チームの研究者は InstantID を提案しました。このモデルは、Vincent グラフ モデルの UNet 部分をトレーニングせず、プラグイン可能なモジュールのみをトレーニングします。推論プロセス中にテスト時の調整を行う必要はありません。テキスト コントロールの機能にはほとんど影響を与えず、この場合、高忠実度の ID 保持が実現されます。
AI がビデオ視聴時に「高エネルギーの瞬間」を自動的に検出 | 中国科学院バイト&オートメーション研究所 @AAAI 2024
https://news.miracleplus.com/share_link/16405
ByteDance と中国科学院自動化研究所は、AI を使用してビデオ内のハイライト セグメントを迅速に検出する新しい方法を提案しました。この方法は、入力ビデオの長さと抽出されると予想されるハイライトの長さに非常に柔軟です。関連論文は AAAI 2024 に掲載されています。
大規模モデルは自分自身にご褒美を与えます: Meta により Llama2 自体が微調整され、そのパフォーマンスは GPT-4 を超えます
https://news.miracleplus.com/share_link/16406
大規模モデルの分野では、微調整はモデルのパフォーマンスを向上させるための重要なステップです。 オープンソースの大規模モデルの数が徐々に増加するにつれて、多くの微調整方法がまとめられ、その中には良い結果をもたらしたものもあります。 最近、メタ大学とニューヨーク大学の研究者は、「自己報酬法」を使用して大規模モデルが独自の微調整データを生成できるようにし、人々に新たな衝撃を与えました。 新しい手法では、著者は Llama 2 70B を 3 回の反復で微調整し、その結果得られたモデルは、AlpacaEval 2.0 ランキングで Claude 2、Gemini Pro、GPT-4 などの多くの既存の重要な大規模モデルを上回りました。
ウルトラマン、世界規模のファブネットワークを構築し独自のAIチップを製造するために数十億ドルを調達
https://news.miracleplus.com/share_link/16407
ブルームバーグによると、OpenAI CEOのサム・アルトマン氏は最近、ウェーハ工場の世界的なネットワークを確立したいと考え、人工知能チップ会社に数十億ドルの資金を調達したという。)」と述べ、無名トップチップメーカーと協力する計画だという。
安定性 AI が帰ってきた: ビデオ生成の新しいデモ効果は素晴らしい、ネチズン: 一貫性は抜群です
https://news.miracleplus.com/share_link/16408
安定した拡散が戻ってくる? Stability AI の CEO、エマド・モスタク氏の最新のツイートと 4 本のビデオは、数え切れないほどの想像力を呼び起こしました。 多くのネチズンは、これが Stable Video Diffusion の新しいバージョンのデモではないかと疑っています。 エフェクトの観点から見ると、画像の鮮明さ、一貫性、滑らかさはすべて驚くべきものだからです。
DeepMind の従業員 2 人は、第 1 ラウンドで 2 億米ドルを調達できる可能性のある AI モデルを作成するために辞任し、Flexport はさらに 2 億 6,000 万米ドルを受け取りました。
https://news.miracleplus.com/share_link/16409
Flexport CEOのRyan Petersen氏は、Shopifyから新たな資金調達ラウンドで2億6000万ドルを調達したことをX上で発表した。 さらに興味深いのは、この資金調達が評価上限のない転換社債であるアンキャップド・コンバーティブル・ノートであり、一般的に初期段階の起業プロジェクトへの投資に利用されており、起業家企業にとって非常に有益な資金調達手段であるということです。 Flexport のような後期段階の企業でこのアプローチを採用することは、おそらく Flexport が過去 1 年間に直面したさまざまな問題をサポートするものであると考えられます。問題は、Flexport が最終的に 2 回の 20% の人員削減を経験したことです。