12/11ビッグモデルデイリーコレクション

情報1数年前 (2023)发布 AIWindVane
54 0
12/11ビッグモデルデイリーコレクション

【12/11ビッグモデルデイリーコレクション】大げさ! EMNLP には 5,000 件近くの論文が投稿され、賞が発表されました: 北京大学とテンセントが最優秀長文論文を受賞; NVIDIA CEO のジェンスン・ファンがベトナムを訪問し、ベトナムにチップ生産センターを建設する計画; Zero-One Thousand Things Yi-34B-チャット微調整モデルが開始され、複数の信頼できるリストに登録されました。


誇張してください! EMNLP は約 5,000 件の論文を提出し、賞が発表されました。北京大学とテンセントが最優秀長編論文を受賞しました

 

リンク: https://news.miracleplus.com/share_link/12884

EMNLP は自然言語処理分野のトップカンファレンスの 1 つで、EMNLP 2023 は 12 月 6 日から 10 日までシンガポールで開催されます。 今年の ChatGPT の人気が大規模モデルと NLP の概念を推進したため、EMNLP 2023 の投稿論文数は 5,000 近くに達し、ACL 2023 よりもわずかに多くなりました。 採択率は、長文論文の採択率が23.3%、短論文の採択率が14%、全体の採択率が21.3%でした。 この数字は、EMNLP 2022 の 20% からわずかに改善しています。 EMNLP 2023 では、最優秀長編論文、最優秀短編論文、最優秀テーマ論文、最優秀デモ論文、最優秀産業論文にそれぞれ 1 件の賞が授与されました。また、さまざまなトラックから複数の優れた論文が授与されました。

12/11ビッグモデルデイリーコレクション

注目を失う普及モデル: Mamba の人気 SSM が Apple と Cornell の標的に

 

リンク: https://news.miracleplus.com/share_link/12885

先週の「Mamba」のリリースのおかげで、状態空間モデル SSM はますます注目を集めています。 Mamba の中核は、新しいアーキテクチャである「選択的状態空間モデル」の導入であり、これにより、Mamba は言語モデリングにおいて Transformer に匹敵するか、それを上回ることさえあります。 当時、論文著者の Albert Gu 氏は、Mamba の成功により SSM の将来に自信が持てるようになったと述べました。 さて、コーネル大学と Apple のこの論文には、SSM の応用可能性の新たな例が追加されているようです。


カクテルのようなマルチスキルの大型モデルの混合、Zhiyuanおよび他の機関がLM-Cocktailモデル管理戦略を発表

 

リンク: https://news.miracleplus.com/share_link/12886

最近、知的財産研究所の情報検索およびナレッジ コンピューティング グループは、LM-Cocktail モデル ガバナンス戦略を発表しました。この戦略は、大規模なモデル開発者にモデルのパフォーマンスを継続的に向上させるための低コストの方法を提供することを目的としています。モデル融合技術により、ファインチューニングモデルとオリジナルモデルの利点を統合し、「モデルリソース」の効率的な活用を実現します。

12/11ビッグモデルデイリーコレクション

OpenAI COO のブラッド・ライトキャップ氏は、AI の商業化は過大評価されており、私たちはまだ非常に初期段階にあり、最も重要な部分はまだ作成されていないと述べました。

 

リンク: https://news.miracleplus.com/share_link/12887

OpenAI「クーデター」事件後のCNBCでブラッド・ライトキャップが語った。 Lightcap 氏が回想するように、OpenAI は GPU と処理能力が限られており、自らを開発者や企業向けのツールを構築する会社と主に考えていました。 彼は、同社 CEO のサム アルトマンが Try Release の主要な支持者であったことを思い出し、モデルとのテキストベースのインタラクションには重要かつ個人的な意味があると述べました。


Nvidia CEOのジェンスン・ファン氏がベトナムを訪問、国内にチップ生産センターを建設する計画

 

リンク: https://news.miracleplus.com/share_link/12888

ベトナムのファム・ミン・ジェン首相は現地時間10日、訪問中のエヌビディアCEOジェンセン・フアン氏と会談した。 Huang Renxun 氏は、NVIDIA はベトナムに約 2 億 5,000 万米ドルを投資しており、同国を重要な市場とみなしていると述べた。

12/11ビッグモデルデイリーコレクション

Li Auto: OTA 5.0 Li Auto は、自由な指揮をサポートするために Mind GPT を導入します

 

リンク: https://news.miracleplus.com/share_link/12889

本日のLi Autoインテリジェントソフトウェア発表カンファレンスで、Li AutoはOTA 5.0のさまざまなアップグレードを紹介しました。これは、インテリジェントな運転、インテリジェントな空間、インテリジェントな航続距離の拡張の3つの側面に分類できます。 スマートスペースに関して、Li Auto の最大の変化は Mind GPT 機能の導入であると Li Auto は述べました。

12/11ビッグモデルデイリーコレクション

01Wanyi Yi-34B-Chat の微調整されたモデルはオンラインであり、複数の信頼できるリストに掲載されています

 

リンク: https://news.miracleplus.com/share_link/12891

最近、業界の多くの大規模モデル ベンチマークで、新たな「強度値」の更新が行われました。 11 月初旬に Zero One Thing による Yi-34B 基本モデルのリリースに続き、Yi-34B-Chat 微調整モデルがオープンソース化され、11 月 24 日に発売されました。短期間で、このモデルは英語の多くの信頼できるリストに掲載されました。中国の大型モデルが世界中で販売され、再び世界の開発者の注目を集めました。 中でも、スタンフォード大学が提案した大規模言語モデル評価ベンチマークであるAlpacaEvalにおいて、Yi-34B-Chatは、LLaMA2 Chat 70B、Claude 2、ChatGPTを上回り、勝率94.08%を記録し、業界2位の成績を収めました。 Alpaca 認定モデル カテゴリ GPT-4 は、英語能力を備えた大規模な言語モデルであり、Alpaca によって正式に認定された数少ないオープンソース モデルの 1 つです。

12/11ビッグモデルデイリーコレクション

Zhipu AI、テキスト品質評価モデル CritiqueLLM をリリース

 

リンク: https://news.miracleplus.com/share_link/12890

Zhipu AIは最近、解釈可能でスケーラブルなテキスト品質評価モデルCritiqueLLMを提案しました.このモデルは、研究をどのように実行するかという問題を解決するためのタスクに続くさまざまな命令について、大規模なモデルの生成結果に対して高品質の評価スコアと評価説明を提供できますその過程での課題は、モデルの性能を迅速、効果的、公平かつ低コストで評価することです。

12/11ビッグモデルデイリーコレクション

日本の楽天グループは今後2か月以内に独自の大規模言語モデルを立ち上げる予定

 

リンク: https://news.miracleplus.com/share_link/12892

日本の楽天グループは、今後2か月以内に独自の人工知能言語モデルを立ち上げる予定だと、最高経営責任者(CEO)の三木谷浩史氏が月曜日のインタビューで語った。 現在、フィンテックと電子商取引の巨人は、他のテクノロジー企業と協力して、この急成長するテクノロジーの開発に参加しようとしている。

12/11ビッグモデルデイリーコレクション
© 版权声明

関連記事

コメントなし

コメントはありません…