10月23日ビッグモデル日報
【10月23日ビッグモデル日報】エヌビディアとメタが同日、ロボットの主要成果を発表、視覚的プロンプトに「マーカー」を追加、マイクロソフトなどがGPT-4Vをより正確かつ詳細に、AIが就活のやり方を変えるオーストラリアでは、AI 採用ツールの人気が高まっています。
Microsoft などは、視覚的な手がかりに「マーカー」を追加することで、GPT-4V をより正確かつ詳細にしています。
リンク: https://news.miracleplus.com/share_link/11105
最近、大規模言語モデル (LLM) の大幅な進歩を目の当たりにしました。 特に、Generative Pretrained Transformer (GPT) のリリースは、産業界と学術界にいくつかのブレークスルーをもたらしました。 GPT-4 のリリース以来、大規模マルチモーダル モデル (LMM) に対する研究コミュニティの関心が高まっており、マルチモーダル GPT-4 の構築に多くの研究が注がれてきました。 最近、GPT-4V (ision) は、その優れたマルチモーダル認識能力と推論能力により特別な注目を集めています。 ただし、GPT-4V は前例のない視覚言語理解能力を備えていますが、そのきめ細かい視覚的基礎能力 (入力は画像と対応するオブジェクトの説明、出力はオブジェクトを説明するボックス) が比較的弱いか、まだ確立されていません。発展した。 たとえば、下の写真でユーザーが「右側のラップトップの左側に置かれている物体は何ですか?」と尋ねたところ、GPT-4V はマグカップという誤った答えを返しました。 次にユーザーが「窓側の席が欲しいのですが、どこに座れますか?」と尋ねたところ、GPT-4Vも不正解でした。 上記の問題を認識した後、マイクロソフト、香港科技大学、その他の機関の研究者は、きめの細かい視覚タスクにおける GPT-4V の問題を解決するための新しい視覚プロンプト手法 Set-of-Mark (SoM) を提案しました。

あなたの GPU は Llama 2 などの大規模なモデルを実行できますか? このオープンソース プロジェクトで試してみる
リンク: https://news.miracleplus.com/share_link/11106
コンピューティング能力が重要な時代において、GPU は大規模モデル (LLM) をスムーズに実行できますか? 多くの人は、この質問に正確に答えるのに苦労しており、GPU メモリの計算方法がわかりません。 GPU がどの LLM を処理できるかを確認するのはモデル サイズを見るほど簡単ではないため、モデルは推論中に大量のメモリ (KV キャッシュ) を占有する可能性があります。たとえば、llama-2-7b のシーケンス長は 1000 で、1GB のメモリが必要です。追加のメモリ。 それだけでなく、モデルのトレーニング中、KV キャッシュ、アクティブ化、量子化により多くのメモリが占有されます。 上記のメモリ使用量を事前に知ることができるかどうか疑問に思わずにはいられません。 最近、LLM のトレーニングまたは推論中に必要な GPU メモリの量を計算するのに役立つ新しいプロジェクトが GitHub に登場しました。それだけでなく、このプロジェクトの助けを借りて、詳細なメモリの配分と評価も知ることができます。量子化方法、処理されるコンテキストの最大長など、ユーザーが自分に合った GPU 構成を選択できるようにするための方法。

高解像度の商用大作を数秒で生成し、電子商取引を直接効率化 Pro Max | ArcSoft Technology が PhotoStudio® AI を発表
リンク: https://news.miracleplus.com/share_link/11107
「手続きが煩雑、サイクルが長い、効果が限定的、コストが高い」など、従来の電子商取引が長年抱えていた困難な問題の多くが一気に解決されました。 ArcSoft Technology は本日、電子商取引向けの新しい革新的な製品である PhotoStudio(®) AI インテリジェント商業写真クラウド スタジオ (ベータ) を発表しました。 公式サイトによると、ArcSoft PhotoStudio(®) AI インテリジェント商業写真クラウド スタジオは、衣服版(PhotoStudio(®) AI CL)と製品版(PhotoStudio(®) AI MC)の 2 つのバージョンのサービスを初めてオープンしました。

ChatGPT で 20,000 以上の結合を分析! LTX が BondGPT+ を開始
リンク: https://news.miracleplus.com/share_link/11108
世界的な金融テクノロジーのリーダーであるブロードリッジ (NYSE: BR) の完全子会社である LTX は、20,000 以上の債券を分析する「BondGPT+」を開始したと公式ウェブサイトで発表しました。 LTX は今年 6 月 6 日に BondGPT を開始し、多くの金融顧客グループから賞賛と肯定的なフィードバックを受けた後、これに基づいて BondGPT+ の開発を続けました。 BondGPT+ は OpenAI の GPT-4 モデルに基づいており、独自の大量の高品質財務データを使用して微調整されています。 前世代と比較して、BondGPT+ は企業またはサードパーティのデータ統合、コンテンツ生成設定、高度な債券検索、エンタープライズ レベルのセキュリティと管理、その他の新機能をサポートしています。

AIGC時代のビデオ普及モデル、Fudanらチームが現場初レビューを公開
リンク: https://news.miracleplus.com/share_link/11109
AI によって生成されたコンテンツは、現在の人工知能分野で最も注目されているトピックの 1 つであり、この分野の最先端テクノロジーを表しています。 近年、Stable Diffusion、DALL-E3、ControlNetなどの新技術のリリースにより、AI画像の生成・編集分野は驚異的な視覚効果を実現し、学界と産業界の両方で幅広い注目と議論を集めています。 これらの手法のほとんどは拡散モデルに基づいており、これが強力な制御可能な生成、フォトリアリスティックな生成、多様性を実現する能力の鍵となります。 ただし、ビデオには単純な静止画像よりも豊富な意味情報と動的な変化があります。 調査データによると、2022 年以降、ビデオ タスクの普及モデルに関する研究作業が爆発的な増加を示しています。 この傾向は、学界や産業界におけるビデオ普及モデルの人気を反映しているだけでなく、この分野の研究者がビデオ生成技術の画期的な進歩と革新を続けることが緊急に必要であることも浮き彫りにしています。 最近、復旦大学のビジョンと学習研究室は、マイクロソフトやファーウェイなどの学術機関と協力して、ビデオタスクにおける拡散モデルの最初のレビューを発表し、ビデオ生成、ビデオ編集における拡散モデルの学術的最先端の結果を体系的に整理しました。 、ビデオ理解です。

AI はオーストラリア人の仕事への応募方法を変えており、AI 採用ツールの人気が高まっています
リンク: https://news.miracleplus.com/share_link/11110
オーストラリアの採用部門では人工知能がますます一般的になってきており、履歴書の審査や事前面接の実施に使用されており、求職者に重大な影響を与えています。 AIは採用効率の向上にメリットをもたらしますが、公平性や差別の問題も引き起こしており、AIによる応募者のスクリーニングが女性や文化的少数派に対する偏見を強化する可能性があることが研究で示されています。 求職者は、採用プロセスで自分がどのように評価されるかについての透明性の欠如に直面しており、オーストラリアの法律は求職者に AI 審査の詳細を知らせることを明確に義務付けていません。
