kaiyun·开云(中国)官方网站 入口它常常会一次性找到措置决议-kaiyun·开云(中国)官方网站 入口
苹果 &SpaceX 前工程师共享 o1 使精心得kaiyun·开云(中国)官方网站 入口,奥特曼、Brockman 齐转发了。
划重心:
o1 如故不是聊天模子了,需要全新的使用神色。
奥特曼还跑去挖坟作家Ben Hylak数天前的"自我打脸"驳斥,称"不雅察 o1 的口碑变化、以及东谈主们学习怎么使用它很趣味"。
Ben Hylak 曾任 SpaceX 软件工程师、苹果 VisionOS 东谈主机交互蓄意师,目下在创业为 AI 产物提供分析干事。
具体来说,Ben 在 o1 pro 推出满血 $200/ 月版块的第一天就交钱了,整整测试了一天后得出论断:它果真很倒霉!
每次发问齐要恭候 5 分钟
会输出鬻矛誉盾的建议
莫得条件但老是会回话架构图 + 上风 / 瑕疵列表
Ben 把倒霉的体验发在网上后,许多东谈主默示同感。但趣味的是,也有东谈主是非反对。
他启动与捏不同不雅点的盘问,然后坚强到正本是我方的神色齐全错了。
我还在把 o1 当聊天模子来用,但 o1 如故不是聊天模子了。
目下,Ben 如故从悔过 o1,转造成了每天齐在用它措置最发愤的问题。
像对待新职工相同对待 o1
要是说 o1 不是聊天模子了,那它目下是什么?
Ben 合计它就像一个"讲述生成器"。要是你给它富足的坎坷文,并告诉它你想要输出什么,它常常会一次性找到措置决议。
OpenAI 官方其实给了一个通俗的 o1 使用建议,但并不完善。
Ben 的建议包括:
提供海量布景信息
岂论你目下是奈何领略"海量"的,再乘以 10 倍。
当使用 GPT-4o 或 Claude 3.5 等聊天模子时,常常会从一个通俗的问题和一些布景信息启动。要是模子需要更多布景信息,它常常会条件你延续提供。
这即是聊天模子的骨子,从一来一趟的交互中不停完善输出。
但 o1 只会从名义上回答你提倡的问题,不会试图从你那边赢得布景信息。是以需要反过来将尽可能多的坎坷文主动发给它。
即使仅仅问一个通俗的代码工程问题,应该提供:
阐发系数你尝试过但不起作用的决议
一份无缺的数据库 schemas
阐发一下你的公司是作念什么的,领域多大,界说里面术语
一言以蔽之,就像对待新职工相同对待 o1。
描述你想要什么,而不是引导它怎么作念
关于大大量聊天模子,咱们齐会告诉模子但愿他怎么回话方式,比如"演出一位软件工程众人,请仔细念念考"。
但在 o1 上有用的神色正相背,告诉它你需要什么,而不是引导它怎么去作念。
Ben 把 o1 的指示词模板分红 4 部分:
指标放在最前边
详备指定输出神色
不错附加需要查验的精通事项
海量关系的布景信息
终末,o1 的输出有一种学术 / 营业讲述的作风。Ben 合计太多的推理 token 让它很难懂脱这种作风
他曾试图让 o1 来完成这篇著作,但经由屡次尝试,只可得到相等等闲的学生功课。
One More Thing
在奥特曼的转发推文中,有东谈主套出了最新讯息:
o3 暂时还不会向用户通达,o3-mini 会先推出,况兼技巧不远了。
o3-mini 会先提供给 Plus 订阅用户使用,API 的订价 OpenAI 里面还没细则,但不会很贵。
参考承接:
[ 1 ] https://www.latent.space/p/o1-skill-issue
[ 2 ] https://x.com/sama/status/1877814065088663763
[ 3 ] https://x.com/gdb/status/1878489681702310392kaiyun·开云(中国)官方网站 入口