Nvidia 已经悄悄推出了 Llama-3.1-Nemotron-70B-Instruct AI 模型,其表现优于 OpenAI 和 Anthropic 等行业巨头。该型号可在 Hugging Face 上使用,因其令人印象深刻的基准测试分数而受到关注,包括 Arena Hard 测试的 85.0 分和 AlpacaEval 57.6 LC 的 2 分。 通过使用先进的训练技术增强 Meta 的开源 Llama 3.1 模型,Nvidia 旨在为企业提供一种有效且具有成本效益的语言处理任务替代方案。该模型以其强大的对齐能力而著称,可提供精确、上下文相关的响应,从而提高客户满意度。 Nvidia 通过其平台提供免费的托管推理,并提供与 OpenAI 兼容的 API,从而扩大了对高级 AI 解决方案的访问。但是,企业必须谨慎行事,因为该模型并未针对要求高精度的专业领域进行优化。
分类: 科技时讯
OpenAI 推出了“Swarm”,这是一个实验性框架,旨在在 Github 上编排 AI 代理网络,在 AI 社区中引发了轰动。虽然不是官方产品,但 Swarm 为开发人员制定了构建自主协作的 AI 代理网络的蓝图,将多代理系统从理论转变为更易于访问的东西。 虽然 Swarm 不会很快投入生产,但其潜在的业务用例(想想自动市场分析或客户服务)很难被忽视。但除了兴奋之外,还有担忧。安全专家警告说,在没有强大保护措施的情况下释放自主代理可能会有风险,而伦理学家则担心偏见会在不被注意的情况下悄悄潜入。然后是迫在眉睫的失业问题——自动化是房间里最喜欢的大象。 尽管如此,Swarm 还是提供了前瞻性的 AI 协作,推动开发人员和企业提前思考,即使它还没有完全准备好。
包括 Samy Bengio 在内的 Apple 研究人员在 Mehrdad Farajtabar 的领导下开发了 GSM-Symbolic 和 GSM-NoOp,以评估 OpenAI 的 GPT-4o 和 o1 等大型语言模型 (LLMs。这些工具基于 GSM8K 数据集构建,引入了符号模板和不相关的信息,以更严格地测试模型。 研究发现,虽然模型在标准基准上表现良好,但当面对细微的变化(例如不相关的细节)时,它们的推理会减弱。即使是领先的模型,包括 OpenAI 的模型,似乎也依赖于模式识别,而不是真正的逻辑推理。 研究人员认为,扩展模型并不能解决这个问题,并需要进一步研究真正的推理,挑战 OpenAI 关于 o1 等模型的说法。
OpenAI 筹集了 66 亿美元的新资金,将其估值提高到 1570 亿美元。Thrive Capital 领投,Microsoft、Nvidia 和 SoftBank 参与,表明对这家 AI 领导者充满信心。这笔资金是继之前的 800 亿美元估值之后的,将支持前沿人工智能研究并增强计算能力。 这笔资金的一个重要方面是 40 亿美元的循环信贷额度,为 OpenAI 在追求增长时提供了财务灵活性。尽管今年报告的亏损超过 50 亿美元,但预测表明,到 2025 年,收入可能会上升到 116 亿美元,这反映了投资者的强烈信心。
OpenAI 最新的“画布”界面为 ChatGPT 增加了一个新的维度,专为动手编写和编码任务而设计。此功能会在通常的聊天窗口旁边弹出一个专用工作区,让用户无需重新提示即可生成和调整内容。 它首先向 Plus 和 Teams 用户推出,这是对 Anthropic’s Artifacts 等竞争对手的明确回应,后者已经接受了可编辑的 AI 工作区。在“画布”中,用户可以使用简单的命令来优化电子邮件、调整文本长度或切换语言。对于编码人员来说,它更加无缝 — 内联注释、解释和代码审查使调试变得不那么麻烦。 OpenAI 将“画布”定位为一种实用工具,用于逐步处理大型项目,而不是强制所有内容都通过一个提示。测试版后,免费用户也将体验到,这突显了 OpenAI 的目标是在增强创意工作流程的同时与竞争对手保持同步。
在量子物理实验中发现“负时间”的证据
Physicists showed that photons can seem to exit a material before entering it, revealing observational evidence of negative time 物理学家表明,光子似乎可以在进入材料之前离开材料,揭示了负时间的观测证据 Evidence of ‘Negative Time’ Found in Quantum Physics Experiment 这篇文章介绍了量子物理学实验中的“负时间”现象。负时间意味着事件似乎按相反的顺序发生,挑战了我们传统的因果关系观念。在实验中,粒子看起来会影响早先的时刻,仿佛时间在倒流。这一发现增加了量子力学的复杂性,并可能促使人们对时间及其在物理学中的作用进行新的解释。更多内容可以通过访问Scientific American的原文了解。
OpenAI 的 DevDay 2024:4 大更新
在 DevDay 2024 上,OpenAI 更注重内容而不是奇观,推出了四项更新,让开发人员更容易获得和负担得起 AI。 Here’s what’s new: 以下是新功能: 实时 API:新推出的实时 API 允许开发人员访问六种 AI 语音,这些语音旨在无缝集成到应用程序中。与 ChatGPT 中的语音不同,这些语音可以在各种情况下进行逼真的对话,包括旅行计划和基于电话的订购系统,价格约为 18 美元/小时。该 API 支持实时响应,增强了各种应用程序中的用户体验,尽管开发人员负责披露 AI 生成语音的使用情况。 视觉微调 API:Vision Fine-Tuning API 允许开发人员通过将图像数据与文本相结合来支持 GPT-4o,从而显着提高模型的视觉理解能力。此功能支持高级视觉搜索、自动驾驶汽车的对象检测和精确的医学图像分析,所有这些都可以通过 100 张图像实现。OpenAI 通过授予开发人员对数据所有权和使用的完全控制权来保持透明度,并辅以自动安全评估以确保合规性。 API 中的提示缓存:提示缓存功能使开发人员能够通过重用先前提示中的输入令牌来节省成本并减少延迟。此功能对于代码编辑和多轮次对话特别有用,可节省高达 50% 的处理时间。该功能会自动应用于最新的 GPT-4o 和 GPT-4o 迷你版本,在确保满足隐私承诺的同时,激活超过 1,024 个令牌的提示。 API 中的模型蒸馏:OpenAI 的模型蒸馏允许开发人员使用 GPT-4o 和 o1-preview 等高级模型的输出来优化具有成本效益的模型。这种集成过程简化了高性能模型的创建,例如 GPT-4o mini,而无需多个工具。主要功能包括用于自动生成数据集的 Stored Completions 和用于性能评估的 Evals。模型蒸馏现已推出,每天为 GPT-4o mini 提供 200 万个免费训练代币,为 GPT-4o 提供 100 万个免费训练代币,直到 10 月 31 日,之后将适用标准微调定价。 另外,一个新的提示生成器? OpenAI has a leaked prompt for generating system prompts on the playground, aimed at improving clarity and effectiveness. 此外,Ope
Runway 推出了“百部电影基金” ,拨款 500 万美元现金和额外服务积分,支持最多 100 部利用其生成式 AI 视频技术的电影。该计划旨在通过为各种格式(包括故事片、短片、纪录片和音乐视频)提供资助来刺激新兴的人工智能电影生态系统,电影制作人有资格获得财务支持和高达 200 万美元的服务积分,从而可能将总资金增加到 1000 万美元。 Runway 的创意主管 Jamie Umpherson 强调,每个项目都将根据其具体的制作需求进行评估。值得注意的是,《天桥》不会声称拥有这些电影的所有权,但需要每两周更新一次制作内容。 有鉴于此,行业资深人士迈克尔·布莱克指出,广撒网、资助众多项目可能是明智之举。他将这种方法描述为“喷涂和祈祷”,并建议在这 100 部影片中,至少有一两部可以有效地展示人工智能生成视频的潜力。
Meta 推出了“Imagine Yourself”,这是一种 AI 模型,能够从一张参考照片生成各种个性化图像,而无需额外的训练。该模型可以通过处理参考图像以及随附的文本说明来创建不同姿势、样式和设置的多个个人图像。 与需要对每个人进行再训练的传统模型不同,“Imagine Yourself”使用合成训练对来增强学习,并由先进的架构提供支持,该架构具有三个并行文本处理模块和一个可训练的图像处理模块。 虽然该模型在执行复杂指令方面表现出卓越的性能,但与一些竞争模型相比,它在保持身份方面仍然面临挑战。
在一篇罕见的博客文章中,OpenAI 首席执行官 Sam Altman 阐述了他对即将到来的“智能时代”的愿景,他断言深度学习的能力能够解决复杂的全球挑战,例如气候变化和太空殖民。他预测超级智能将在“几千天内”出现,这比大多数专家预期的要早得多。 Altman 断言,AI 的进步将依赖于增强的计算能力和数据可用性,为个人 AI 团队和每个人的虚拟导师铺平道路。虽然他承认潜在的工作岗位流失和资源差距,但他相信人工智能的整体影响将产生深远的好处。 Altman的帖子被定位为个人观点,而不是 OpenAI 的官方声明,与该公司的筹款工作相吻合,目标是估值 1500 亿美元。他警告说,如果没有足够的基础设施,人工智能可能会成为主要为富人提供的资源。