在性价比推理模型o3-mini发布后不久ღღ✿◈,OpenAI创始人Sam Altman曾透露团队还准备了一个惊喜ღღ✿◈,网友好奇ღღ✿◈:到底什么是惊喜?
今天ღღ✿◈,第一个惊喜就抛出来了ღღ✿◈,OpenAI重磅发布了全新的ChatGPT代理功能ღღ✿◈:Deep Research(深度研究)ღღ✿◈。
官方介绍ღღ✿◈,你给它一个提示ღღ✿◈,它就会自动查找ღღ✿◈、分析和综合数百个在线资源ღღ✿◈,以研究分析师的水平创建一份综合报告ღღ✿◈,仅需数十分钟就能完成人类需要数小时才能完成的工作ღღ✿◈。
此外ღღ✿◈,深度研究由即将面世的OpenAI o3模型的一个版本驱动ღღ✿◈,借助推理功能ღღ✿◈,能够智能且广泛地浏览互联网上的文本ღღ✿◈、图像和PDF文件ღღ✿◈,并可根据遇到的信息做出必要调整ღღ✿◈。
Sam Altman将Deep Research称之为“一个疯狂的里程碑”ღღ✿◈、“一种超能力“ღღ✿◈,并表示这还不是o3-mini发布后提到的那个“one-more-thing”ღღ✿◈,惊喜还在后面ღღ✿◈。一夜之间ღღ✿◈,人类就要大步迈进AGI时代了么?
综合知识的能力是创造新知识的先决条件ღღ✿◈。OpenAI官方介绍说开心麻花之搞基三国ღღ✿◈,深度研究是为从事金融ღღ✿◈、科学ღღ✿◈、政策和工程等领域密集知识工作并需要全面开心麻花之搞基三国金宝搏官网ღღ✿◈、精确和可靠研究的人员而打造的ღღ✿◈。
此外ღღ✿◈,它对于寻找高度个性化推荐的挑剔购物者同样有用ღღ✿◈,这些推荐通常需要仔细研究才能购买ღღ✿◈,例如汽车ღღ✿◈、家电和家具ღღ✿◈。
从即日起ღღ✿◈,ChatGPT Pro用户就可使用 “深度研究” 功能ღღ✿◈,每月限100次查询ღღ✿◈。随后Plus和Team用户也将获得该功能支持ღღ✿◈,企业用户会在之后跟进ღღ✿◈。并且ღღ✿◈,此次功能推出按地域进行ღღ✿◈,OpenAI尚未公布针对英国ღღ✿◈、瑞士及欧洲经济区ChatGPT用户的发布时间安排ღღ✿◈。
“Humanitys Last Exam” (人类的终极测试)是由Scale AI和人工智能安全中心(CAIS)联合推出的针对AI的多模态基准测试ღღ✿◈,该评估在专家级问题上对广泛学科的人工智能进行了测试ღღ✿◈,包括各个学术领域的3000多个专家级问题ღღ✿◈,深度研究以26.6%的准确性创下了行业新高ღღ✿◈。
GAIA是一个针对现实世界问题评估AI的公共基准ღღ✿◈,深度研究达到了目前最先进水平 (SOTA)跃升榜首金宝搏官网ღღ✿◈,该测试基准涵盖三个难度级别的问题ღღ✿◈,需要AI具备推理ღღ✿◈、多模式流畅性ღღ✿◈、网页浏览和工具使用熟练等能力ღღ✿◈。
OpenAI展示了好多个实用场景ღღ✿◈,比如制作商业报告表格ღღ✿◈,大海捞针(根据片段场景描述找到影视剧出处)ღღ✿◈,医学研究分析ღღ✿◈,用户体验设计开心麻花之搞基三国ღღ✿◈,个性化需求购物推荐和常识的解读参考等等ღღ✿◈。
在对各个领域的专家级任务进行的内部评估中ღღ✿◈,人类专家们认为“深度研究”可以自动化完成数小时的艰难手动调查ღღ✿◈,但需要给AI更多的时间ღღ✿◈,此外ღღ✿◈,AI模型浏览的内容越多ღღ✿◈,对所浏览内容思考得越深入ღღ✿◈,其表现就越好ღღ✿◈。
另一个有趣的发现是ღღ✿◈,任务的经济价值与通过率的相关性比与人类花费的小时数的相关性更高ღღ✿◈。也就是说ღღ✿◈,模型觉得困难的事情ღღ✿◈,和人类觉得耗时的事情并不完全相同ღღ✿◈。
OpenAI官方表示ღღ✿◈,深度研究现已在ChatGPT网页上推出ღღ✿◈,并将在本月内推广到移动和桌面应用ღღ✿◈,目前ღღ✿◈,深度研究可以访问开放网络和任何上传的文件ღღ✿◈,未来ღღ✿◈,则能够连接到更专业的数据源上(扩大其对基于订阅或内部资源的访问)ღღ✿◈,从而使其输出更加可靠和个性化ღღ✿◈。
由于深度研究处于早期阶段ღღ✿◈,它也存在局限性ღღ✿◈。根据内部评估ღღ✿◈,它有时会在响应中产生幻觉或做出错误推断ღღ✿◈,但发生率低于现有的ChatGPT模型ღღ✿◈。
展望未来ღღ✿◈,OpenAI表示AI代理体验将融入ChatGPT用于异步ღღ✿◈、现实世界的研究和执行ღღ✿◈。深度研究(可执行异步在线调查)与Operator(可采取现实世界的行动)相结合金宝搏官网ღღ✿◈,使ChatGPT能够执行越来越复杂的任务ღღ✿◈。
Sam Altman表示ღღ✿◈,深度研究功能计算密集且速度慢ღღ✿◈,可能需要5到30分钟才能完成一项任务ღღ✿◈,但它是第一个能够完成多种复杂ღღ✿◈、有价值任务的AI系统ღღ✿◈。
杰克逊实验室教授ღღ✿◈、生物医学科学家Derya Unutmaz试用深度研究后表示ღღ✿◈:“从我的测试来看ღღ✿◈,它绝对改变了科学研究ღღ✿◈、出版ღღ✿◈、法律文件ღღ✿◈、医学ღღ✿◈、教育等领域的游戏规则ღღ✿◈。”
Derya Unutmaz介绍了自己抢先体验的一些用例ღღ✿◈,发现一些实在好处ღღ✿◈:AI比人类更有耐心ღღ✿◈,不会像人类那样经常抱怨ღღ✿◈;“深度研究”就像一个24/7全天候的助手ღღ✿◈,而且可以立即成为任何主题的专家ღღ✿◈,专业度甚至超越人类教授ღღ✿◈;他请“深度研究”协助处理两例癌症病例ღღ✿◈,生成的两份报告几乎无可挑剔ღღ✿◈,就像只有专科医生才能写出来的东西ღღ✿◈。
值得关注的是ღღ✿◈,谷歌在去年12月份推出Gemini 2.0 Flash模型的时候也介绍过一个名为“Deep Research”的类似AI代理功能ღღ✿◈,不过经网友对比发现OpenAI做到了更进一步ღღ✿◈。
谷歌的类似功能像是对众多信息源的汇总ღღ✿◈,而OpenAI的这个功能更像是让一位见解独到且能紧跟思路的研究员(近乎博士水平)来操作工作ღღ✿◈。
此外ღღ✿◈,谷歌的方法搜索性强(检查了更多的来源)金宝搏官网ღღ✿◈,但探索性较差ღღ✿◈,如果你想要一个概述ღღ✿◈,谷歌的版本可能还不错金宝搏官网ღღ✿◈。但如果你想让AI深入细节研究ღღ✿◈,但又非常有主见开心麻花之搞基三国ღღ✿◈,那你就可能需要OpenAI的Deep Research了金宝搏官网ღღ✿◈。不过目前ღღ✿◈,他们都无法访问太多付费研究和出版物ღღ✿◈。
有人用OpenAI的深度研究功能去写专业级论文ღღ✿◈,效果也令人惊叹ღღ✿◈。多伦多大学罗特曼管理学院战略管理学副教授Kevin A. Bryan展示了一个案例ღღ✿◈,通过一次性提示ღღ✿◈,在无反复修改的情况下ღღ✿◈,“深度研究”经过10分钟创作完成一篇论文ღღ✿◈。
他感慨ღღ✿◈,鉴于技术的进步ღღ✿◈,AI已经不再是“抄袭引擎”ღღ✿◈,未来如何进行教育改革或是首要任务ღღ✿◈,因为人类与AI协作进行知识工作已成必然趋势ღღ✿◈。
OpenAI研究人员Jason Wei认为ღღ✿◈,深度研究不仅是一个令人惊叹的智能体ღღ✿◈,还可以被视为互联网的全新交互界面ღღ✿◈。我们正步入这样一个时代ღღ✿◈:原本人类需要花费数小时整理的任何信息ღღ✿◈,人工智能几分钟就能为你综合整理分析出谋划策ღღ✿◈。
无需再翻阅数百条评论来挑选酒店ღღ✿◈、餐厅或产品ღღ✿◈,AI会为我们评估所有维度相关信息ღღ✿◈;旅行时ღღ✿◈,我们能从网络的各个角落ღღ✿◈,甚至是小众论坛中获取最佳攻略ღღ✿◈。
这基本上就像是为用户想了解的内容量身定制的互联网金宝搏官网ღღ✿◈,这种模式的商业潜力可能无比强大开心麻花之搞基三国ღღ✿◈,以至于在未来ღღ✿◈,通过浏览器手动搜索整理资料会像用手进行算术而不使用计算器一样ღღ✿◈,成为 “老派” 做法ღღ✿◈。
除了AI模型和功能的更新ღღ✿◈,OpenAI今天也被媒体爆料出可能会进行人工智能专用硬件和芯片的开发ღღ✿◈,或许将是自2007年推出iPhone以来对技术硬件的又一轮颠覆ღღ✿◈。
Sam Altman在采访中回应称ღღ✿◈:“可能与苹果前首席设计官乔尼·艾维合作”ღღ✿◈、“人工智能对我们与计算机交互方式的改变非常大ღღ✿◈,应该有一种新的硬件”ღღ✿◈。
在半导体方面ღღ✿◈,当被问及OpenAI是否会开发自己的半导体时ღღ✿◈,Altman表示团队正在开发定制芯片ღღ✿◈,以提供更快ღღ✿◈、更高效的人工智能ღღ✿◈,但AI原型机或将需要“几年”时间才能面世ღღ✿◈,其中语音交互应该是一个关键功能ღღ✿◈。
类似于iPhone通过触摸屏彻底改变用户界面设计的方式ღღ✿◈,具备高智商的“专家级AI代理”相关硬件开发或将迎来一波历史性发展机会ღღ✿◈。金宝搏188下载appღღ✿◈,金宝搏188BETღღ✿◈,金宝搏188BET下载ღღ✿◈,机器人法则ღღ✿◈。188BET金宝搏亚洲真人体育ღღ✿◈,