10月18日大模型日報合集

資訊1年前 (2023)更新 AIWindVane

560 0 0

【10月18日大模型日報合集】突发！美国限制向中国出口Nvidia H800 GPU；富士康和英伟达正在建造“人工智慧工厂”，以加速自动驾驶汽车的发展；微软下属的研究发现了GPT-4的缺陷；AI时代学习之道！天猫精灵发布大模型多认知学习机Z20

突发！美国限制向中国出口Nvidia H800 GPU

连结：https://news.miracleplus.com/share_link/10998

2023年10月17日，美国政府将收紧对尖端人工智慧晶片的出口管制，要求是对现有规则的更新，对英伟达和其他晶片制造商向中国销售高性能半导体进行严格限制。美国商务部分延期于2022年10月首次实施全面出口管制，旨在反映技术进步，同时也让企业更难以找到规避限制的方法。英伟达、AMD和英特尔等企业生产的GPU已成为训练大模型高级的组件，人工智慧的快速发展引发了最新晶片的抢购热潮。

10月18日大模型日報合集

富士康与英伟达正在建造“人工智慧工厂”，加速自动驾驶汽车的发展

连结：https://news.miracleplus.com/share_link/11019

英伟达和富士康正在合作建造所谓的“人工智慧工厂”，这是一种新型的数据中心，预计将提供超级运算能力，从而加速自动驾驶汽车、自动机器和工业机器人的发展。周二，英伟达创始人兼首席执行官黄仁勋和富士康董事长兼首席执行官刘永青在台湾鸿海科技日上宣布了此次合作。这家人工智慧工厂基于英伟达的GPU运算基础，将用于设施处理、提炼大量数据，并将其转化为有价值的人工智慧模型和资讯。

10月18日大模型日報合集

把LLM视为作业系统，它就拥有了无限的「虚拟」上下文，柏克莱新作已揽1.7k星

连结：https://news.miracleplus.com/share_link/10999

目前，让大语言模型拥有更强的上下文处理能力是业界非常重视的热点主题。论文中，加州大学柏克莱分校的中断点将LLM与网路巧妙联系在了一起，在扩展上下文长度领域近年来，大语言模型（LLM）及其基础的变压器架构已经成为对话式AI的基石，并催生了广泛的消费级和企业应用程式。尽管有了长足的进步，但LLM使用的固定长度的上下文视窗极大地限制了对长对话或长文档推理的适用性。即使是使用最广泛的开源LLM，它们的最大输入长度只允许支持几十条讯息回复或短文档推理在论文中，预设探讨了如何在继续使用固定上下文模型的同时，提供无限上下文的幻觉（幻觉）。他们的方法汲取了虚拟记忆体分页的思路，使得应用程式能够处理远远超出可用的资料记忆体的资料记忆体基于该思路，中断利用LLM智能体函数呼叫能力的最新进展，设计出一个受OS启发、用于虚拟上下文管理的LLM系统——MemGPT。

10月18日大模型日報合集

端侧AI推理，部署高效PyTorch模型：官方新工具开源，Meta已经用上

连结：https://news.miracleplus.com/share_link/11000

随着ExecuTorch 的开源，世界人工智慧应用程式在装置上本地运行、而需要连接到伺服器或云端成为可能。我们可以将ExecuTorch 理解成PyTorch 平台，其能够提供基础设施来运行PyTorch 程序，从AR/ VR 穿戴式装置到标准的iOS 和Android 装置的行动部署。ExecuTorch 最大的优势是可移植性，能够在行动和嵌入式装置上运作。不仅如此，ExecuTorch 还可以提高开发人员的工作效率。据了解，Meta已经验证了这项技术，将其用于最新一代的雷朋智慧眼镜，而这款眼镜也是最近Meta 发布的Quest 3 VR 头戴装置的部分。Meta 表示，作为PyTorch 开源计画的一部分，他们旨在进一步推动该技术的研究，从而迈入在设备上实现人工智慧推理的新时代。

10月18日大模型日報合集

微软下属的研究发现了GPT-4的缺陷

连结：https://news.miracleplus.com/share_link/11001

有时，过于精确的遵循指示可能会让你陷入困境——如果你是一个大型语言模型的话。这是微软附属的一篇新的科学论文下面的结论，该论文研究了大型语言模型(llm) ）的“可信度”和“毒性”，包括OpenAI的GPT-4和GPT-3.5（GPT- 4的前身）。合著者写道，可能是因为GPT-4更可能遵循模型内建安全性测量的「越狱」提示的指示，GPT-4比其他法学考试更容易被提示吐出有毒的、有偏见的文本。换句话说，GPT-4的良好「意义」和提高的理解能力——在错误中人的手——可能会引入歧途。

10月18日大模型日報合集

刚刚！Gartner发布2024年十大策略技术趋势

连结：https://news.miracleplus.com/share_link/11020

10月17日，Gartner于今日发布2024年企业机构需要探索的十大策略技术趋势。2024年重要策略趋势包括：全民化的生成方式；AI信任、风险与安全管理；AI增强开发；智慧应用；增强型互联员工团队；威胁管理；机器客户；永续技术；平台工程；产业云平台。Gartner研究副总裁Bart Willemsen表示：「由于技术变革以及社会经济方面的不确定性，我们必须积极采取行动行动并从策略上提高弹性，而不是采取临时措施。IT领导者的处境特殊，他们可以制定透过技术投资帮助企业在这些不确定性和压力下保持成功的策略规划。”

AI时代学习之道！天猫精灵发布大模型多认知学习机Z20

连结：https://news.miracleplus.com/share_link/11002

10月18日消息，阿里推出天猫精灵推出真智能大屏护眼学习机Z20。相较过去重在「拍题找解法」、「送网路课程」的学习硬件，这款12.2寸仅6.95毫米的轻薄板兼具大模型和多模态AI认知能力，最大拉长和多学科配置度，承载「精准强化」与「自主探索」两种学习之道。官方资讯显示，未来精灵Z20学习机具有个人化对话、学科指导、权威内容等产品特性。