Sam Altman发布2025年技术愿景,你想OpenAI怎么做?
上赛季,火箭队的主教练乌度卡不仅在战术体系上大胆革新,更在球员角色定位上展现出了更多的创造力,其中最引人注目的莫过于他对阿门·汤普森的改造,那时候申京受伤缺阵,火箭队让史密斯出任首发中锋,阿门汤普森....
声明:本文来自于微信公众号AIGC开放社区,授权 转载发布。
发布了新的一年,并在社交 上征求网友的意见,希望发布哪些技术同时优化哪些功能。
用户对这个 感兴趣,评论已经超过8300,浏览量破270万,算是Sam今年最高的推文之一了,比前几天的连续12天直播热闹很多。
对于用户的反馈,Sam回复也 积极,并且还肯定了一些意见 不错,基本上已经安排上很快就会实现。
下面「AIGC开放社区」就挑选一些Sam基本确定的技术路线,以及比较好的意见。
更强的GPT-4o替换品,GPT/o系列模型/文生图模型Sora可以无缝集成到 Ch GPT中(也就是说要求Ch GPT更强的多模态能力)
50/70美元的计划,中间价位?(最近200美元的Pro太贵了)更长的上下文窗口。当然,终极愿望还是AGI,相信你们会实现的。
Sam 喜欢这个建议,明年会完善的。
希望可以添加家庭账户。这样可以为我的孩子增加带保护功能的账号,这样可以放心的让他们发挥自己的想象,但又在设定的合理范围之内,同时也能根据他们对Ch GPT的使用,来了解孩子的想法。
棒的建议。
更好的语音聊天轮流检测。现在比较烦人的是,我还没安静地思考5秒呢,就会被AI打断。(就是认为语音模式下AI回复太快了,应该更人性化一点停顿时间长一些。)
Sam认为这是一个 好的建议,未来OpenAI会修复这个问题。
当我使用高级语音模式时,我希望它能更好地记住我之前的对话,即便只是一个 RAG 系统。我喜欢在通勤时进行对话和头脑风暴,但我发现不得不详细重复之前的内容!
这位老哥的问题给Sam干懵圈了,没搞懂他的需求。其实,他的意思是就想让语音模式的Ch GPT能像文本那样,记住他们之前的对话。估计现在语音模式还不具备记忆的能力。这个应该以后也会修复。
可拖放式用户界面,能将多个 的聊天/模型串联在一起,生成和优化输出。(这简直就是大锅炖,不敢想真实现了能有多香。)
Sam认为,这个想法 有趣,我们还没认真考虑过呢。
说实话,现在的非思考模式的 GPT-4o有点不行了,甚至mini也不太好。
这个问题确实存在。
发布GPT-4o的图像生成功能。
希望会实现的。
高级语音模式的本地存储功能。我经常遇到这样的情况:我在手机上说了3分钟,然后连接失败,我的整个输入就消失了。
其实他的这个需求和上面那个人差不多,基本都是要求Ch GPT的高级语音模式新增“记忆”功能。
能够在使用语音模式时同时看到文本。有时候阅读回复更快,但仍希望能够以语音方式回应。
看来OpenAI的高级语音模式优化空间相当大,明年肯定会再更新一波吧。
更好的AI Gent功能用于研究城市中的本地事,例如,公共交通、活动、电影时间、景点、门票等。这些通常涉及多步骤的工作流程,以进行研究并获得 。希望可以一键完成。
我希望能够将 ail 和 Google 日历等API 与Ch GPT相结合,这样它就能随时了解我的日程安排和工作内容。(其实谷歌的Gemini模型已经实现了)
新的用户界面类型,例如,思想连接可视化的空间界面、AI和人类共同构建的协作Canvas、根据上下文变化的流动工作空间,以及在应用之间自然传递的AI Agent功能。
关于AI Agent用户关心的也比较多,明年OpenAI肯定会上线一款的,前不久已经公布在研发了。
目前,网友的积极性 高,估计这周末评论轻松破1万。看来大家对OpenAI还是相当期待的,而这次Sam搞的大会也相当成功,2025年OpenAI的主要动力之一便是完善用户的需求。