10月18日のビッグモデル日報集

情報1数年前 (2023)更新 AIWindVane

56 0 0

【10月18日のビッグモデル日報集】速報！米国は Nvidia H800 GPU の中国への輸出を制限; Foxconn と Nvidia は自動運転車の開発を加速するために「人工知能工場」を建設中; Microsoft 関連の研究で GPT-4 の欠陥が発見; で学習する方法AI時代！天猫エルフ、大型モデルのマルチ認知学習マシンZ20をリリース

突然！米国、Nvidia H800 GPUの中国への輸出を制限

リンク：https://news.miracleplus.com/share_link/10998

米国政府は2023年10月17日、最先端の人工知能チップの輸出規制を強化し、既存の規則を更新し、エヌビディアやその他のチップメーカーによる中国への高性能半導体の販売に厳しい制限を課すことになる。 2022年10月に初めて包括的な輸出規制を課す米国の通商部分の延長は、技術の進歩を反映すると同時に、企業が規制を回避する方法を見つけることをより困難にすることを目的としている。 Nvidia、AMD、Intel などの企業が製造する GPU は、大規模モデルをトレーニングするための高度なコンポーネントとなっており、人工知能の急速な発展により、最新チップの購入ラッシュが引き起こされています。

10月18日のビッグモデル日報集

Foxconn と Nvidia が自動運転車の開発を加速する「人工知能工場」を建設中

リンク：https://news.miracleplus.com/share_link/11019

Nvidia と Foxconn は、いわゆる「人工知能ファクトリー」の構築で協力しています。これは、自動運転車、自動運転機械、産業用ロボットの開発を加速するスーパーコンピューティング能力を提供すると期待される新しいタイプのデータセンターです。 Nvidiaの創設者兼最高経営責任者（CEO）のジェンスン・ファン氏とフォックスコンの会長兼最高経営責任者（CEO）の劉永清氏は、火曜日に台湾で開催されたHon Hai Technology Daysで提携を発表した。この人工知能ファクトリーは、Nvidia の GPU コンピューティング基盤に基づいており、大量のデータを処理、精製し、貴重な人工知能モデルと情報に変換する施設で使用されます。

10月18日のビッグモデル日報集

LLM をオペレーティングシステムと考えてください。LLM には無制限の「仮想」コンテキストがあり、Berkeley の新作は 1.7,000 個の星を獲得しています

リンク：https://news.miracleplus.com/share_link/10999

現在、大規模な言語モデルに強力なコンテキスト処理機能を与えることは、業界が非常に重視している注目のテーマです。論文では、カリフォルニア大学バークレー校の中断点が LLM をネットワークと巧みに結び付けていると述べています。コンテキスト長の拡張の分野では、近年、大規模言語モデル (LLM) とその基本的なトランスフォーマーアーキテクチャが基盤となっています。会話型 AI を開発し、幅広い消費者向けおよび企業向けアプリケーションを生み出しました。かなりの進歩にもかかわらず、LLM で使用される固定長のコンテキストウィンドウは、長い対話や長い文書の推論への適用性を大幅に制限します。最も広く使用されているオープンソース LLM でさえ、その最大入力長では、数十のメッセージ応答または短いドキュメント推論しかサポートできません。論文では、プリセットは、固定コンテキストモデルを使用し続けながら、無限コンテキストの錯覚を提供する方法を検討しています。（幻覚）。彼らのアプローチは、仮想メモリページングのアイデアに基づいており、アプリケーションが利用可能なデータメモリをはるかに超えたデータメモリを処理できるようにします。このアイデアに基づいて、割り込みは、LLM エージェントの関数呼び出し機能の最近の進歩を利用して、OS にインスピレーションを得た、仮想コンテキスト管理のためのユーザーフレンドリーな LLM システム – MemGPT。

10月18日のビッグモデル日報集

デバイス側の AI 推論、効率的な PyTorch モデルのデプロイ: 公式の新しいツールはオープンソースであり、Meta が使用されています

リンク：https://news.miracleplus.com/share_link/11000

ExecuTorch オープンソースを使用すると、サーバーやクラウドに接続する必要がなく、世界中の人工知能アプリケーションをデバイス上でローカルに実行できるようになります。 ExecuTorch は、AR/VR ウェアラブルデバイスから標準 iOS および Android デバイスのモバイル展開まで、PyTorch プログラムを実行するためのインフラストラクチャを提供できる PyTorch プラットフォームとして理解できます。 ExecuTorch の最大の利点は、モバイルおよび組み込みデバイス上で実行できる移植性です。それだけでなく、ExecuTorch は開発者の生産性も向上します。 Meta はこの技術を検証し、最新世代の Ray-Ban スマートグラスに使用したと考えられています。このスマートグラスは、Meta が最近リリースした Quest 3 VR ヘッドセットの一部でもあります。 Meta 氏は、PyTorch オープンソースプロジェクトの一環として、このテクノロジーの研究をさらに推進し、デバイス上での人工知能推論の新時代を迎えることを目指していると述べました。

10月18日のビッグモデル日報集

Microsoft 関連の調査で GPT-4 の欠陥が発見

リンク：https://news.miracleplus.com/share_link/11001

大規模な言語モデルの場合、指示に正確に従うと問題が発生することがあります。これは、OpenAI の GPT-4 および GPT-3.5 (GPT-4 の前身) を含む大規模言語モデル (llm) の「信頼性」と「毒性」を調査する、Microsoft 関連の新しい科学論文の結論です。おそらく GPT-4 は、モデルに組み込まれたセキュリティ対策された「脱獄」プロンプトの指示に従う可能性が高いため、GPT-4 は他の法律試験よりも有害で偏ったテキストを吐き出すよう求められる可能性が高くなります。著者たちは書いた。言い換えれば、GPT-4 の優れた「意味」と理解の向上は、人間の誤った手にかかると、誤った方向に導く可能性があります。

10月18日のビッグモデル日報集

ただ！ Gartner、2024 年の戦略的テクノロジートレンドトップ 10 を発表

リンク：https://news.miracleplus.com/share_link/11020

Gartner は 10 月 17 日、企業が 2024 年に検討する必要がある戦略的テクノロジートレンドのトップ 10 を発表しました。 2024 年の重要な戦略的トレンドには、民主化された生成方法、AI の信頼、リスク、セキュリティ管理、AI 強化開発、インテリジェントアプリケーション、強化されたコネクテッドワークフォース、脅威管理、機械顧客、持続可能なテクノロジー、プラットフォームエンジニアリング、業界クラウドプラットフォームが含まれます。 Gartner の調査担当副社長である Bart Willemsen 氏は、「テクノロジーの変化と社会経済的不確実性のため、その場しのぎの対策に頼るのではなく、積極的かつ戦略的に行動して回復力を高めなければなりません。IT リーダーは独特の立場にあり、戦略的戦略を開発することができます」と述べています。テクノロジーへの投資を通じて、こうした不確実性やプレッシャーの中でも企業が成功を維持できるよう支援する計画を立てています。」

AI時代の学び方！天猫エルフ、大型モデルのマルチ認知学習マシンZ20をリリース

リンク：https://news.miracleplus.com/share_link/11002

10月18日のニュースによると、アリババは真にインテリジェントな大画面目の保護学習マシンであるTmall Genie Z20を発売した。「問題を解いて解決策を見つける」ことと「オンラインコースを提供する」ことに重点を置いたこれまでの学習ハードウェアと比較して、この 12.2 インチ、6.95 mm の薄型軽量ボードは、大型モデルとマルチモーダル AI 認識機能の両方を備え、最大伸長とマルチ-discipline 構成の度合いには、「正確な強化」と「独立した探索」という 2 つの学習方法があります。公式情報によると、Future Elf Z20 学習機には、パーソナライズされたダイアログ、科目ガイダンス、権威あるコンテンツなどの製品機能が備わっています。