12 月 12 日の Big Model Daily

[12 月 12 日の Big Model Daily] 10 年前の研究では、word2vec の古典的な論文が今日の NeurIPS Time Test Award に予定されていました 2024 年の業界 AI トレンド この写真を見てください、LeCun: オープンソースの大規模モデルはクローズド ソースを超えるはずです
10 年前、word2vec の古典的な論文が今日の NeurIPS Time Test Award に予定されていました
https://news.miracleplus.com/share_link/12987
NeurIPS は世界で最も権威のある AI 学会の 1 つで、正式名称は Neural Information Processing Systems で、通常は NeurIPS Foundation が主催し、毎年 12 月に開催されます。 カンファレンスで議論される内容には、ディープラーニング、コンピュータービジョン、大規模機械学習、学習理論、最適化、スパース理論、その他多くの下位分野が含まれます。 12 月 10 日、NeurIPS 2023 が米国ルイジアナ州ニューオーリンズで開幕しました。 公式ウェブサイトのブログで公開されたデータによると、今年の会議で受け取った論文投稿数は13,321件に達し、新記録を樹立し、1,100人のフィールドチェア、100人のシニアフィールドチェア、396人の倫理審査員によって審査され、そのうち3,584件の論文が審査されました。受け入れられました。 先ほど、NeurIPS が 2023 年の受賞論文を正式に発表しました, タイムテスト賞、2 つの優れた論文、2 つの優れた論文次点、優れたデータセット、優れたベンチマークを含む. 論文のほとんどは大規模言語モデル (LLM) に関するものです。 10 年前に発行された word2vec 関連の論文が Time Test Award を受賞したことは注目に値します。これは当然のことです。
ChatGPT はますます怠惰になり、代わりに人間を PUA することを学習しました。
https://news.miracleplus.com/share_link/12988
ユーザーは、最近 GPT-4 または ChatGPT API を使用すると、ピーク時間帯に応答が非常に遅くなり、おざなりになると主張しています。 返答を拒否する場合もあれば、一連の質問をすると会話が中断される場合もあります。 報告によると、上記の問題は、ユーザーが GPT-4 にコードの作成を要求した場合に発生します。 いくつかの情報を提供するだけで、ユーザーが残りを入力するようにガイドする場合もあります。 場合によっては、GPT-4 は人々に「これは自分で行うことができます」と伝えます。
GPT-4V がロボットの頭脳として機能する場合、AI を使用して計画を立てる方法さえわからないかもしれません。
https://news.miracleplus.com/share_link/12989
GPT-4V はすでに Web サイトのコードの設計やブラウザの制御に役立ち、これらのアプリケーションは仮想デジタル世界に集中しています。 GPT-4Vを現実世界に導入し、ロボットを制御する頭脳として使用したら、どんな興味深い結果が生まれるでしょうか? 最近、清華大学学際情報研究所の研究者は、GPT-4V が物理世界に入り、ロボットが日常の物体を操作するためのタスク計画を提供できるようにする「ViLa」アルゴリズムを提案しました。
生きた人間の脳細胞を使って AI システムを構築しましょう! 音声認識に成功し教師なし学習が可能|Natureサブジャーナル
https://news.miracleplus.com/share_link/12990
本物の人間の脳細胞と微小電極から構築された「ミニ脳」で構成される AI システムは、数百のサウンド クリップから特定の人の声を正確に識別する音声認識を実行できるようになりました。 この特定の AI システムは、教師なし学習も可能でした。研究者らは、システムが正しいか間違っているかをシステムに伝えるためのフィードバックを一切提供せず、オーディオ クリップを繰り返し再生するだけでした。 最終的に、2 日間のトレーニング後、システムの精度は最初の 51% から 78% まで直接増加しました。
アリの最新研究:一言で顔が踊れ、衣装や背景も自在に変更可能!
https://news.miracleplus.com/share_link/12991
AnimateAnyone に続いて、アリはもう 1 つの人気のある研究論文を発表しました。今回は、顔の写真と 1 文の説明だけで、どこでも踊らせることができます。 あなたがする必要があるのは、ポートレートとプロンプトを「フィード」することだけです。プロンプトが変化すると、キャラクターの背景と服装も変化します。 これは Ali の最新の研究である DreaMoving であり、いつでもどこでも誰もが踊れるようにすることに焦点を当てています。
大型モデルにドローンを制御させる、北杭チームが身体化されたインテリジェンスの新しいアーキテクチャを提案
https://news.miracleplus.com/share_link/12992
マルチモーダル時代に突入、大型機種でもドローンの操縦が可能に! ビジョンモジュールが開始条件を捉えている限り、大型モデルの「頭脳」が動作指示を生成し、ドローンはそれを迅速かつ正確に実行できます。 北京大学インテリジェント UAV チームの周耀明教授のチームなどの研究者は、マルチモーダル大規模モデルに基づいた具体化されたインテリジェンス アーキテクチャを提案しました。 現在、このアーキテクチャはドローンの制御に適用されています。
2024 年の AI トレンドを示すこの図を見て、LeCun は次のように述べています: オープンソースの大規模モデルはクローズドソースを超えなければなりません
https://news.miracleplus.com/share_link/12993
2023年ももうすぐ終わります。 この1年で様々な大型モデルがリリースされました。 OpenAI や Google などのテクノロジー大手が競争する一方で、オープンソースという別の「力」が静かに台頭しつつあります。 オープンソース モデルには常に疑問が投げかけられてきました。 独自のモデルと同じくらい優れていますか? 独自モデルの性能に匹敵するでしょうか? これまでのところ、ある程度近づいていると言えます。 それでも、オープンソースモデルは常に経験的なパフォーマンスをもたらしてくれるので、私たちは感心してしまいます。 オープンソース モデルの台頭により、状況が変わりつつあります。 たとえば、Meta の LLaMA シリーズは、その迅速な反復、カスタマイズ可能性、およびプライバシーで人気を集めています。 これらのモデルはコミュニティによって急速に開発されており、独自のモデルに対する強力な挑戦を生み出し、大手テクノロジー企業の競争環境を変える可能性があります。 しかし、かつては人々のアイデアのほとんどは「感情」からのみ生まれていました。 今朝、Meta の主任 AI サイエンティストでチューリング賞受賞者のヤン・ルカン氏は突然、こう嘆いた。「オープンソースの人工知能モデルは、プロプライエタリなモデルを超えようとしている。
メタオープンソース最新モデル – Llama Guard-7b
https://news.miracleplus.com/share_link/12994
世界的なソーシャルおよびテクノロジーの巨人である Meta は、公式 Web サイトで新しいモデル Llama Guard をオープンソース化しました。 Llama Guard は、Llama 2-7b に基づく入出力保護モデルであり、人間と機械の会話中の質問と応答を分類して、リスクがあるかどうかを判断できると報告されています。 Llama 2などの機種にも使用でき、安全性が大幅に向上します。 Llama Guard は、Meta が立ち上げた「Purple Llama」セキュリティ評価プロジェクトにおける入出力保護リンクの重要な部分でもあり、入出力保護においてユーザーと AI のリスクを区別する最初のモデルでもあります。