AI 真能替代人类吗

xdm，我今天突然乐观了。

前两天一哥们私聊我，问要不要加入他的初创团队，做兼职。哥们对自己的项目非常的自信。大意是他做产品，负责调研市场，出方案，我干其中一部分活，做完项目之后挂平台卖，按成交量分成。画了一张非常大的饼：现在有完善的方案，我们只需要每天3-5小时，大概5天就做成一个项目，卖出一单后分成至少1w。

算日薪很高，对不对？

在我看到他的方案之前一切都正常。方案是邮件发给我的，字数还挺多，分工和步骤都挺明确的——好了，这就是全部的优点了。

他熬夜写出来的这个方案的可行性几乎为0。他想要训练一个模型，但市面上根本没数据，他的星期项目团队也当然是没有实验室来获取数据；他想验证模型鲁棒性，但他的假设和领域的常识是相悖的；他预期5天做完，但里面光是现有工具的集成和调试都要花上一两天......诸如此类，他的方案我也没看完，我一开始以为是我才疏学浅，找了其中我非常迷惑的部分，问了三个博士同学，他们也都表示看不懂，不像中文。

说实话我挺佩服他的行动力和想法，他想借助AI工具，探索自己不太了解的领域，寻求市场需求做一些项目，并招揽人才，而且据我所知，他自己一个人在管5个不同方向的项目组，熬夜写方案......也是挺拼的。但是哥们，你好歹用好点的模型吧。现在这个方案直接丢给gemini pro，他一下子就能说出至少5个漏洞，你就用这种方案一直跑一直跑，你熬再多的夜，又有什么意义呢？

我并非想讽刺试图用AI做项目调研的人，也并非不看好“一人公司”之类的，但目前看来，鉴于大模型仍然存在大量的幻觉，我们需要有能力评估他的回复。这也是前几天到的Anthropic网课中的4D框架里提到的内容。

关于“4D”，指的是Delegation, Description, Discernment, Diligence, 分别对应授权，描述，辨别和严肃认真（最后这个词不知道咋翻译好）。

授权：深思熟虑地决定哪些工作由人工智能完成，哪些工作由自己完成。
描述：与人工智能系统进行清晰的沟通
辨别力：以批判的眼光评估人工智能的输出和行为
严肃认真：确保以负责任的方式与人工智能互动（主要是一些伦理问题，例如声明某些部分由AI生成，之类的）

这里面其实每个环节都关键（抛开最后一个不谈），但我们往往直接感受到的、能产生最快反馈的，是“描述”。所以一部分人意识到要做提示词工程，详细描述出自己的想法，AI才能给出想要的答案。很好，但远远不够。“授权”和“辨别”这两个维度的能力，如果不具备，会有很严重的后果。你和大模型说“给我做个这个”，然后对着一个看上去完备的方案跑了很久，才发现里面的某一个环节根本就不对，但这个时候钱和时间都花了，啥也没得到，只知道了AI也不能全信——我们早该知道这个的。

关于“授权”，我觉得真得想想怎么用AI，不只是对于个人，也是对于企业和整个市场来说。我们也许可以用AI基于已有的信息去做归纳，去进行推理，去修改语气，精简或者是扩写；结合网络搜索技能，可以用它去获取信息。但是我们不能把一个比较复杂的，尤其是专业领域很强的项目，直接扔给AI去做，他大概率会自己循环半天，然后说这个做不了。

由此引出市场和企业未来一段时间可能需要什么——就是如何保证AI的回复是可靠的，这是个难点，有的时候需要领域专家去评判，有的时候也许可以通过一些技巧，比如说自反思，或者是集成投票来一定程度上的缓解（但是归根结底这些方法都只是基于模型的能力，如果没有在这方面的专业数据上训练过，效果可能不会太理想）。

辨别能力也是一个难点，某些时候我们可以通过AI提供的引用内容，去推理得出他的方案是是否可行（嗯，这里要求我们具有一定的推理能力），但是这只解决一些逻辑上的问题，面对垂直领域的gap，我们可能没办法明确应该用什么信息来判断方案是否有漏洞。嗯......看来领域专家暂时还是有他的存在的价值。但是普通人怎么成为专家呢？现在初级、中级的活都让AI干的差不多了...

别说啥码奸不码奸的，这种提效工具，大家不可能放在那里不去做。A公司用了B公司没用，产出可能就差了一段；甲国研究乙国不研究，那更是以后都得靠着别人的技术吃饭......无论是被迫的还是主动的，我们迟早得拥抱AI。只希望到时候不要太狼狈吧。

#AI求职实录#