1 月 29 日のビッグモデルデイリーコレクション

[1 月 29 日のビッグモデルデイリーコレクション] Baichuan Intelligent が 1,000 億を超える新しい大型モデル Baichuan 3 を発表、ランキング リストの結果: いくつかの中国のタスクで GPT-4 を追い越す、会話型検索エンジンを構築するための 500 行のコード、Jia Yangqing は真にオープンでしたソース by Connotation の Lepton Search 大きな MoE モデルを最初から作成する時が来ました、マスターレベルのチュートリアルはここにあります
Science にログインすると、人間の化学者を超えるスピードと正確さ、より独創的 AI 自律化学合成ロボットが化学発見を加速します
リンク: https://news.miracleplus.com/share_link/17024
最近、反応源としての光の環境に優しい性質によって、光化学と光触媒の研究が驚くほど急増しています。 ただし、多くの研究では小規模な応答が実証されており、スケールアップはさまざまな手法のパッチワークに依存しており、最適化するには多くの試行錯誤が必要になる可能性があります。 複雑な光触媒反応条件の効率的な最適化のニーズに応えて、オランダのアムステルダム大学ヴァントホフ分子科学研究所 (UvA) のティモシー ノエル教授のチームは、人工知能主導のシステムを統合する自律システムを開発しました。機械学習ユニット、化学合成ロボット。 「RoboChem」と名付けられたこのデスクトップ デバイスは、スピードと正確さにおいて人間の化学者を上回っていると同時に、高いレベルの創意工夫を示しています。

量子支援深層学習に基づく逆分子設計
リンク: https://news.miracleplus.com/share_link/17025
コーネル大学の Fengqi You 教授のチームは、量子コンピューティング (QC) と生成 AI の利点を組み合わせた、新しい逆分子設計フレームワークを提案しました。 このフレームワークは、QC 支援深層学習モデルを活用して化学空間を学習およびシミュレーションし、特定の化学特性を持つ分子構造を予測および生成します。 生成 AI はこのプロセスで中心的な役割を果たし、大量の分子データから根底にある構造と特性の関係を学習し、事前に設定された特性と一致するだけでなく、合成の実現可能性も考慮した新しい分子候補を生成できます。 量子コンピューティングの追加により、このプロセスに効率的な計算能力と最適化アルゴリズムが提供され、大規模な化学システムの処理における従来のコンピューターのパフォーマンスのボトルネックが克服されます。 この量子古典ハイブリッド コンピューティング フレームワークを通じて、研究者は複雑な化学空間で効率的かつ効果的な分子設計を実行でき、新しい分子の発見と材料科学の進歩に新たな道を切り開くことができます。

Baichuan Intelligent が 1,000 億人民元を超える大規模モデル Baichuan 3 を発売、中国のいくつかのタスクで GPT-4 を上回り 1 位にランクイン
リンク: https://news.miracleplus.com/share_link/17026
Baichuan Intelligent は毎月更新の路線をたどっていますが、1 年前に急激に加速し、半月ごとの更新になりました。1,000 億を超えるパラメータを備えた大型モデル Baichuan 3 の最新バージョンがリリースされました。これは Baichuan Intelligent の基本モデルの第 3 世代です。 – ちょうど 20 日前、Wang Xiaochuan によって設立されたこの大手模型会社は、大型キャラクター モデル Baichuan-NPC をリリースしたばかりです。 さらに象徴的なのは、Baichuan Intelligence のモデルの更新が、医療シナリオにおけるモデルの機能を実証することに重点を置いているということです。

Jia Yangqing は、Lepton Search オープンソースからインスピレーションを得て、会話型検索エンジンを構築するための 500 行のコードを作成しました。
リンク: https://news.miracleplus.com/share_link/17027
Jia Yangqing が約束した Lepton Search のオープンソース コードが登場しました。 一昨日、Jia Yangqing 氏は Twitter で Lepton Search オープンソース プロジェクトのリンクを発表し、誰でもどの企業でもこのオープンソース コードを自由に使用できると述べました。 つまり、500 行未満の Python コードで独自の会話型検索エンジンを構築できます。 今日、Lepton Search が再び GitHub トレンド リストに登場しました。 さらに、このオープンソース プロジェクトを利用して独自の Web アプリケーションを構築した人もおり、その品質は AI 駆動の検索エンジン Perplexity と同等で非常に高いと述べています。

Meta の公式 Prompt プロジェクト ガイド: Llama 2 はこのように使用するとより効率的になります
リンク: https://news.miracleplus.com/share_link/17028
大規模言語モデル (LLM) テクノロジーが成熟するにつれて、迅速なエンジニアリングがますます重要になります。 Microsoft、OpenAI など、いくつかの研究組織が LLM プロンプト エンジニアリング ガイドラインを発行しています。 最近、オープンソース モデルの Llama シリーズの作成者である Meta も、Llama 2 のクイック エンジニアリングとベスト プラクティスをカバーする、Llama 2 用のインタラクティブなプロンプト エンジニアリング ガイドをリリースしました。

AI はコードの山も作成します。 調査によると、GitHub Copilot コードは保守性が低く、既存のコードをリファクタリングして再利用するよりも「頭を使わない書き換え」を好むことがわかりました。
リンク: https://news.miracleplus.com/share_link/17029
プログラマーは AI を使ってコードを書くのを手助けし、それが良いと言っていますが、コードの品質は本当に信頼できるのでしょうか? 結果はあなたを驚かせるかもしれません。 GitClear という会社は、過去 4 年間で 1 億 5,000 万行以上のコードを分析し、GitHub Copilot ツールを追加すると、コードのチャーン レート (つまり、コードが書かれた直後に手直し、変更、または削除されたコード) が低下したことを発見しました。 : 2020 年にはわずか 3.3% でしたが、2023 年には 7.1% となり、2 倍になります。

OpenAI 会長ブレット・テイラー氏の AI 会社の価値は 10 億ドル! Sequoia America がエンタープライズ ソリューションに重点を置いて投資を主導
リンク: https://news.miracleplus.com/share_link/17030
Salesforce の元共同 CEO であるブレット・テイラーは、クラウドベースのワードプロセッサおよび表計算アプリケーションである Quip を開発するソフトウェア会社を設立し、2016 年に約 7 億 5,000 万ドルで Salesforce に売却されました。 昨年、テイラー氏はOpenAIの取締役会に会長として加わり、ChatGPTメーカーの前取締役会との契約で追放されたCEOサム・アルトマン氏の再任に貢献した。 海外メディアはテイラー氏の役割は会社に戻るための一時的なものだと予想している。 ブレット・テイラー氏と元グーグル幹部でグーグルのAR/VR取り組みを率いたクレイ・ベイバー氏が共同設立したAIスタートアップのシエラが新たな資金調達を行っている。
大規模な MoE モデルを最初から作成する、マスターレベルのチュートリアルがここにあります
リンク: https://news.miracleplus.com/share_link/17031
https://huggingface.co/blog/AviSoori1x/makemoe-from-scratch
GPT-4 の伝説的な「魔法の武器」、MoE (Mixed Experts) アーキテクチャを自分で使用できるようになりました。 Hugging Face の機械学習の第一人者が、完全な MoE システムをゼロから構築する方法を共有しました。 このプロジェクトは著者によって MakeMoE と呼ばれており、アテンションの構築から完全な MoE モデルの形成までのプロセスを詳しく説明します。 著者によると、MakeMoE は OpenAI 創設メンバーの Andrej Karpathy の Makemore に触発され、それに基づいています。 makemore は自然言語処理と機械学習の教育プロジェクトであり、学習者がいくつかの基本モデルを理解し実装できるようにすることを目的としています。 同様に、MakeMoE は、段階的な構築プロセスを通じて学習者がハイブリッド エキスパート モデルをより深く理解できるように支援します。

オープンソースの PixArt デルタ画像ジェネレーター: 高解像度 AI 画像を 0.5 秒で出力
リンク: https://news.miracleplus.com/share_link/17010
この記事では、ファーウェイのノアの方舟研究所、大連理工大学、清華大学、Hugging Faceの研究者が共同開発した高度なテキストから画像への合成フレームワークであるPixArt-δを紹介している。 PixArt-δ は、潜在整合性モデル (LCM) と ControlNet を統合することで推論速度を大幅に向上させ、わずか 0.5 秒で 1024 x 1024 ピクセルの高画質画像を生成できます。これは、前世代の PixArt-α よりも 7 倍高速です。 さらに、PixArt-δ の ControlNet モジュールは、Transformer ベースのモデル用に特別に設計されており、高品質の画像生成を維持しながら、テキストから画像への拡散モデルでより正確な制御が可能になります。 研究者らは、Hugging Face における PixArt-δ の ControlNet バージョンの重みを公開しました。